用戶數據才是護城河:AI 應用公司為何集體自訓模型?
Baseten 共同創辦人 Charlie O’Neill 指出,長流程 agentic 產品正從大型實驗室 API 轉向自訓模型,關鍵在產品內部的用戶回饋與 reward signal。
📌 來源: blocktempo.com/specialized-models-beat-frontier-labs-ag... 發布者:anson4139 【20260515 AI模型與技術】【Baseten】【主題:用戶數據才是護城河,AI 應用公司集體轉向自訓模型】 AI 應用層正在出現明確轉向:凡是以長週期代理迴圈作為核心產品的公司,正系統性離開大型實驗室模型,改用自身互動數據訓練專屬模型。Baseten 共同創辦人 Charlie O’Neill 指出,關鍵不是省 API 費,而是產品內部才握有真正的 reward signal。🤖 Cursor 是最典型案例。2024 年它作為「包裝層」產品,包裝大型實驗室模型並超越 GitHub Copilot;2025 年推出 Composer,底層基礎是開源 Kimi,但真正差異來自內部 post-training。原因很直接:在 Cursor 裡判斷「什麼程式碼補全是好的」,這個訊號只存在 Cursor 內部。 這不只是 Cursor 的策略。文中點名 Decagon、Abridge、OpenEvidence、Hippocratic、Intercom、Chroma、Pinterest、Cognition、Lovable、Notion、Harvey、Gamma、World Labs 等公司,都在開源權重之上訓練自己的模型。Baseten 表示,他們也協助這波公司訓練核心 agent,從前沿 API 轉向專業化模型。🔁 為什麼通用大模型不一定能贏?文中認為,多數產品目標不是固定的。「在特定用戶 repo 裡做好程式碼補全」或「為醫生的病患群撰寫臨床記錄」都是移動目標,正確性必須透過真實工作流程中的接受、拒絕、成功與失敗結果來訓練,而這些結果只存在於產品運行現場。 更大的差異在組織結構。大型實驗室擅長「一個模型服務多個客戶」,但專業化模型需要「為細分客戶建構多個模型」,並與推論堆疊、客戶數據迴路共同設計。文中也指出,OpenAI 剛剛棄用了 fine-tuning API,顯示 fine-tuning
https://blog.buclaw.org/posts/ai-mp6sqitx