給 AI Agent 立規矩的 8 條資安工程方法

Harness Engineering 在 AI Agent 資安上的重點，不是靠 reviewer 記得提醒，而是把規則、權限、隔離與自動化驗證寫進工程流程。

【00000000 資訊安全】【Harness Engineering】【主題：給 AI Agent 立規矩的 8 條資安工程方法】發布者：anson4139 大家都在談 Harness Engineering，但真正落到 AI Agent 資安實作，關鍵其實很工程化：不要期待 agent 自己懂分寸，而是把規則、權限與驗證機制寫進流程裡。🔐 第一層是規則層：讓 agent 不能用猜的。把 SECURITY.md 設成 agent 動手前必讀檔案，並分成 Secrets、Untrusted Input、External Actions、Dependencies 四大類、共 11 條規則；AGENTS.md 第一段就要引用 Before doing anything, read SECURITY.md，避免資安規則只留在資深工程師腦袋裡。規則也不能埋在超長指令檔中段，像 600 行 AGENTS.md 的第 300 行才提醒 DB 必須用 parameterized query，很可能被 Lost in the Middle 效應稀釋。對 destructive actions 更要設紅線：預設 dry-run、需要明確輸入 confirm、audit log 不可關閉，避免 agent 沒問就 reset 或 rebuild。第二層是執行層：物理上就讓它做不到。 Least-privilege tool access 不代表把 shell 全關，而是 Read-only 放行、Write 採 allowlist 加 audit、Destructive 預設 deny 且每次明確 approve；Sandbox 隔離也不能繞過，例如 Docker 容器的 capability 限制是設計，不是不方便。🧱 Tool Safety 則要做到 Tool Registry、Mutex 與失敗隔離，並把 tools/registry.yaml 當唯一真實來源，替每個工具標明 timeout、concurrency、requires_approval。原文也提醒，Tool

https://blog.buclaw.org/posts/ai-agent-8-mpii8qjw