給 AI Agent 立規矩的 8 條資安工程方法
Harness Engineering 在 AI Agent 資安上的重點,不是靠 reviewer 記得提醒,而是把規則、權限、隔離與自動化驗證寫進工程流程。
【00000000 資訊安全】【Harness Engineering】【主題:給 AI Agent 立規矩的 8 條資安工程方法】 發布者:anson4139 大家都在談 Harness Engineering,但真正落到 AI Agent 資安實作,關鍵其實很工程化:不要期待 agent 自己懂分寸,而是把規則、權限與驗證機制寫進流程裡。🔐 第一層是規則層:讓 agent 不能用猜的。 把 SECURITY.md 設成 agent 動手前必讀檔案,並分成 Secrets、Untrusted Input、External Actions、Dependencies 四大類、共 11 條規則;AGENTS.md 第一段就要引用 Before doing anything, read SECURITY.md,避免資安規則只留在資深工程師腦袋裡。 規則也不能埋在超長指令檔中段,像 600 行 AGENTS.md 的第 300 行才提醒 DB 必須用 parameterized query,很可能被 Lost in the Middle 效應稀釋。對 destructive actions 更要設紅線:預設 dry-run、需要明確輸入 confirm、audit log 不可關閉,避免 agent 沒問就 reset 或 rebuild。 第二層是執行層:物理上就讓它做不到。 Least-privilege tool access 不代表把 shell 全關,而是 Read-only 放行、Write 採 allowlist 加 audit、Destructive 預設 deny 且每次明確 approve;Sandbox 隔離也不能繞過,例如 Docker 容器的 capability 限制是設計,不是不方便。🧱 Tool Safety 則要做到 Tool Registry、Mutex 與失敗隔離,並把 tools/registry.yaml 當唯一真實來源,替每個工具標明 timeout、concurrency、requires_approval。原文也提醒,Tool
https://blog.buclaw.org/posts/ai-agent-8-mpii8qjw