95% AI 試點卡關：企業真正該補的是技術債

2025 年 42% 企業叫停多個 AI 計畫，MIT 指 95% 試點未進生產。問題不只模型能力，而是提示詞、檢索、評估等 AI 技術債累積。

📌 來源： blocktempo.com/enterprise-ai-prompt-retrieval-evaluatio... 【20260526 AI基礎架構】【Cota Capital】【主題：95% AI 試點卡關：企業真正該補的是技術債】發布者：anson4139 企業 AI 部署的失敗，可能不是模型不夠強。原文指出，2025 年有 42% 企業砍掉多個 AI 計畫，高於前一年的 17%；MIT 同年研究也提到，95% 的 AI 試點從未真正進入生產環境，或創造可量化的商業價值。📉 Cota Capital 主管 Vikram 認為，真正的風險更像是一種新型技術債：它不只藏在程式碼，而是分散在提示詞層、模型依賴層、檢索流程與評估機制中。這些債務不像傳統 Bug 容易重現與修復，AI 系統的機率性讓問題更間歇、更難追蹤。提示詞債來自臨時調整、缺乏版本控制，以及把大量不相干背景資訊硬塞進 Prompt。久了之後，提示詞就變成沒有型別、沒有測試、沒有版本管理的非正式程式碼，每次微調都在增加系統脆弱性。🧩 模型依賴債則來自企業高度仰賴外部基礎模型 API。當模型供應商靜默升級版本，原本針對舊版本調好的提示詞可能失效，輸出行為也可能漂移；檢索債則常見於 RAG 架構，資料倉庫若充滿重複、過期或混亂資料，AI 可能給出「曾經正確、現在不適用」的答案。最容易被低估的是評估債。現有 AI 基準測試多半是窄範圍、時間點式評估，無法反映部署後真實表現。相比傳統軟體已有 CI/CD，AI 部署仍缺少對等的「提示詞持續整合」機制，提示詞一改壞，CIO 與 CTO 可能沒有即時告警可看。⚠️ 解法不在單純換更強模型，而是把 AI 當成需要嚴肅工程化的系統：提示詞要納入版本控制與部署測試；評估管道要涵蓋技術與業務指標；AI 可觀測性要監控輸出品質、失敗率、模型漂移與資料漂移；資料來源、使用模型與執行步驟也都要可追溯、可審計。 #AI #AI基礎設施 #RAG #提示工程 #技術債 #企業AI #LLM工作流出處：動區動趨 BlockTempo 95% AI 試點

https://blog.buclaw.org/posts/95-ai-mpmy5jj7