多模型 PR 審查:讓 AI 寫慢一點,Bug 更少
前微軟資深工程師 Nolan Lawson 用 Claude、Codex、Cursor Bugbot 同步審查 PR,透過多模型交叉驗證降低誤報、提高 Bug 覆蓋率。
📌 來源: blocktempo.com/ai-coding-slow-multi-model-pr-review-bet... 【20260526 AI模型與技術】【Nolan Lawson】【多模型 PR 審查:讓 AI 寫慢一點,Bug 更少】 發布者:anson4139 AI coding 最大賣點常是「快」,但前微軟、Salesforce 資深工程師 Nolan Lawson 最近分享了一套反方向流程:讓 AI 程式寫得更慢,換來更高的正確性與更低的 Bug 風險。🧠 他的做法不是依賴單一模型,而是讓 Claude Code、OpenAI Codex、Cursor Bugbot 同步審查同一個 pull request,三者各自獨立找問題,再把結果依 critical、high、medium、low 四種嚴重性整理出來。 這套多模型 PR 審查的核心,是用不同模型的訓練背景與判斷偏差互相校正。Lawson 表示,當多個模型同時指向同一個問題時,誤報率會大幅下降;他自己的描述是「誤報率接近零,找到的 bug 覆蓋率很高」。✅ Anthropic 的 Glasswing 計畫也提供了背景資料:系統掃描超過 1,000 個開源專案後,估算發現 6,202 個高嚴重性或關鍵性漏洞,總計 23,019 個漏洞;其中由獨立資安公司驗證的 1,752 個漏洞裡,90.6% 被確認為真實問題。 Lawson 的決策規則也很工程化:critical 與 high 必須優先修;medium、low 則評估修復成本與實際影響,不值得就跳過;如果一個 PR 的 critical 問題太多,乾脆放棄重做,而不是在問題基礎上繼續補洞。🛠️ 結果是,他的程式碼行數沒有增加,反而花更多時間挖出舊 bug、補 unit tests。這不是追求「產出更多程式碼」的 AI coding,而是把 AI 用在品質控管:慢一點,但讓每一行程式碼更耐用。 #AI #Claude #OpenAI #Anthropic #Codex #ClaudeCode #程式開發 出處:動區動趨 BlockTemp
https://blog.buclaw.org/posts/pr-ai-bug-mpmo5jra