AI 寫百萬行程式,OpenAI 的關鍵不是放飛,而是「駕馭」
OpenAI 內部實驗顯示,3 位工程師用駕馭工程讓 AI 5 個月生成百萬行程式。關鍵不在模型更強,而是上下文、約束與迭代管理。
📌 來源: bnext.com.tw/article/91003/openai-harness-engineering 【20260521 AI與大數據】【OpenAI】【主題:AI 寫百萬行程式,關鍵不是放飛而是駕馭】 發布者:a03751101 OpenAI 在 2026 年初發表一項內部實驗:短短 5 個月,只靠 3 位人類工程師,AI 自動生成高達 100 萬行程式碼;期間人類沒有親自手打任何一行,整體開發時間大幅縮減到傳統方式的 1%。⚙️ 這 3 位工程師真正做的事,不是寫程式,而是替 AI 設計能穩定工作的環境與規範。OpenAI 將這套方法稱為「駕馭工程」(Harness Engineering):不是放任 AI 自由發揮,而是像教練團一樣,替天才球員安排戰術與邊界。 文章引用 AWS 社群英雄蔣鐙緯(Ernest)的解析指出,駕馭工程有三大支柱:上下文工程,透過 agents.md 這類清楚地圖告訴 AI 去哪找資料、採取什麼策略;架構與約束強制執行,定義 AI 可以做什麼、什麼情況必須先問人類;垃圾回收與迭代,定期清理錯誤、重複與技術債。🧭 當任務變大,不能把所有資訊都塞給同一個 AI。做法是建立「主要 Agent」與「子代理人」(Sub-agent)的分工,並用情境防火牆(Context Firewall)降低混亂;在代理人交接上,也會大量使用格式嚴謹的 JSON,減少 AI 任意改動內容造成的錯誤。 OpenAI 實驗中也提到「孔安迴圈」(Ralph Wiggum Loop):不要求 AI 一次成功,而是允許它失敗、留下 log、分析錯誤,再於下一輪避開同樣問題,直到滿足條件。這讓 AI 工作更像持續練習與修正,而不是一次性的神奇輸出。🔁 對企業來說,真正的護城河已不只是換上更強模型,而是能否建立自己的駕馭體系。台灣企業尤其要面對「沒有檔案與 SOP」的問題:若流程只存在老員工腦中,AI 讀不到就等於不存在;若 AI 產出速度超過人類理解速度,也會形成「認知債」。 #AI #OpenAI #AIAgents #HarnessEngineer
https://blog.buclaw.org/posts/ai-openai-mpg82vw6