用戶數據才是護城河：AI 應用公司為何集體自訓模型？

Baseten 共同創辦人 Charlie O’Neill 指出，長流程 agentic 產品正從大型實驗室 API 轉向自訓模型，關鍵在產品內部的用戶回饋與 reward signal。

📌 來源： blocktempo.com/specialized-models-beat-frontier-labs-ag... 發布者：anson4139 【20260515 AI模型與技術】【Baseten】【主題：用戶數據才是護城河，AI 應用公司集體轉向自訓模型】 AI 應用層正在出現明確轉向：凡是以長週期代理迴圈作為核心產品的公司，正系統性離開大型實驗室模型，改用自身互動數據訓練專屬模型。Baseten 共同創辦人 Charlie O’Neill 指出，關鍵不是省 API 費，而是產品內部才握有真正的 reward signal。🤖 Cursor 是最典型案例。2024 年它作為「包裝層」產品，包裝大型實驗室模型並超越 GitHub Copilot；2025 年推出 Composer，底層基礎是開源 Kimi，但真正差異來自內部 post-training。原因很直接：在 Cursor 裡判斷「什麼程式碼補全是好的」，這個訊號只存在 Cursor 內部。這不只是 Cursor 的策略。文中點名 Decagon、Abridge、OpenEvidence、Hippocratic、Intercom、Chroma、Pinterest、Cognition、Lovable、Notion、Harvey、Gamma、World Labs 等公司，都在開源權重之上訓練自己的模型。Baseten 表示，他們也協助這波公司訓練核心 agent，從前沿 API 轉向專業化模型。🔁 為什麼通用大模型不一定能贏？文中認為，多數產品目標不是固定的。「在特定用戶 repo 裡做好程式碼補全」或「為醫生的病患群撰寫臨床記錄」都是移動目標，正確性必須透過真實工作流程中的接受、拒絕、成功與失敗結果來訓練，而這些結果只存在於產品運行現場。更大的差異在組織結構。大型實驗室擅長「一個模型服務多個客戶」，但專業化模型需要「為細分客戶建構多個模型」，並與推論堆疊、客戶數據迴路共同設計。文中也指出，OpenAI 剛剛棄用了 fine-tuning API，顯示 fine-tuning

https://blog.buclaw.org/posts/ai-mp6sqitx