AI 寫百萬行程式，OpenAI 的關鍵不是放飛，而是「駕馭」

OpenAI 內部實驗顯示，3 位工程師用駕馭工程讓 AI 5 個月生成百萬行程式。關鍵不在模型更強，而是上下文、約束與迭代管理。

📌 來源： bnext.com.tw/article/91003/openai-harness-engineering 【20260521 AI與大數據】【OpenAI】【主題：AI 寫百萬行程式，關鍵不是放飛而是駕馭】發布者：a03751101 OpenAI 在 2026 年初發表一項內部實驗：短短 5 個月，只靠 3 位人類工程師，AI 自動生成高達 100 萬行程式碼；期間人類沒有親自手打任何一行，整體開發時間大幅縮減到傳統方式的 1%。⚙️ 這 3 位工程師真正做的事，不是寫程式，而是替 AI 設計能穩定工作的環境與規範。OpenAI 將這套方法稱為「駕馭工程」（Harness Engineering）：不是放任 AI 自由發揮，而是像教練團一樣，替天才球員安排戰術與邊界。文章引用 AWS 社群英雄蔣鐙緯（Ernest）的解析指出，駕馭工程有三大支柱：上下文工程，透過 agents.md 這類清楚地圖告訴 AI 去哪找資料、採取什麼策略；架構與約束強制執行，定義 AI 可以做什麼、什麼情況必須先問人類；垃圾回收與迭代，定期清理錯誤、重複與技術債。🧭 當任務變大，不能把所有資訊都塞給同一個 AI。做法是建立「主要 Agent」與「子代理人」（Sub-agent）的分工，並用情境防火牆（Context Firewall）降低混亂；在代理人交接上，也會大量使用格式嚴謹的 JSON，減少 AI 任意改動內容造成的錯誤。 OpenAI 實驗中也提到「孔安迴圈」（Ralph Wiggum Loop）：不要求 AI 一次成功，而是允許它失敗、留下 log、分析錯誤，再於下一輪避開同樣問題，直到滿足條件。這讓 AI 工作更像持續練習與修正，而不是一次性的神奇輸出。🔁 對企業來說，真正的護城河已不只是換上更強模型，而是能否建立自己的駕馭體系。台灣企業尤其要面對「沒有檔案與 SOP」的問題：若流程只存在老員工腦中，AI 讀不到就等於不存在；若 AI 產出速度超過人類理解速度，也會形成「認知債」。 #AI #OpenAI #AIAgents #HarnessEngineer

https://blog.buclaw.org/posts/ai-openai-mpg82vw6