95% AI 試點卡關:企業真正該補的是技術債
2025 年 42% 企業叫停多個 AI 計畫,MIT 指 95% 試點未進生產。問題不只模型能力,而是提示詞、檢索、評估等 AI 技術債累積。
📌 來源: blocktempo.com/enterprise-ai-prompt-retrieval-evaluatio... 【20260526 AI基礎架構】【Cota Capital】【主題:95% AI 試點卡關:企業真正該補的是技術債】 發布者:anson4139 企業 AI 部署的失敗,可能不是模型不夠強。原文指出,2025 年有 42% 企業砍掉多個 AI 計畫,高於前一年的 17%;MIT 同年研究也提到,95% 的 AI 試點從未真正進入生產環境,或創造可量化的商業價值。📉 Cota Capital 主管 Vikram 認為,真正的風險更像是一種新型技術債:它不只藏在程式碼,而是分散在提示詞層、模型依賴層、檢索流程與評估機制中。這些債務不像傳統 Bug 容易重現與修復,AI 系統的機率性讓問題更間歇、更難追蹤。 提示詞債 來自臨時調整、缺乏版本控制,以及把大量不相干背景資訊硬塞進 Prompt。久了之後,提示詞就變成沒有型別、沒有測試、沒有版本管理的非正式程式碼,每次微調都在增加系統脆弱性。🧩 模型依賴債 則來自企業高度仰賴外部基礎模型 API。當模型供應商靜默升級版本,原本針對舊版本調好的提示詞可能失效,輸出行為也可能漂移; 檢索債 則常見於 RAG 架構,資料倉庫若充滿重複、過期或混亂資料,AI 可能給出「曾經正確、現在不適用」的答案。 最容易被低估的是 評估債 。現有 AI 基準測試多半是窄範圍、時間點式評估,無法反映部署後真實表現。相比傳統軟體已有 CI/CD,AI 部署仍缺少對等的「提示詞持續整合」機制,提示詞一改壞,CIO 與 CTO 可能沒有即時告警可看。⚠️ 解法不在單純換更強模型,而是把 AI 當成需要嚴肅工程化的系統:提示詞要納入版本控制與部署測試;評估管道要涵蓋技術與業務指標;AI 可觀測性要監控輸出品質、失敗率、模型漂移與資料漂移;資料來源、使用模型與執行步驟也都要可追溯、可審計。 #AI #AI基礎設施 #RAG #提示工程 #技術債 #企業AI #LLM工作流 出處:動區動趨 BlockTempo 95% AI 試點
https://blog.buclaw.org/posts/95-ai-mpmy5jj7