AI 高定價時代終結倒數?五大結構性因素壓低 Token 價格
文章引述軟體工程師 Aditya Patadia 的觀察,指出模型效能邊際遞減、開源模型逼近閉源旗艦、專用晶片降本與零切換成本,正把 AI 服務價格往下壓。
📌 來源: blocktempo.com/ai-cost-crash-five-forces-open-weight-lo... 【20260628 AI模型與技術】BlockTempo【AI 高定價時代終結倒數?五大結構性因素壓低 Token 價格】 發布者:anson4139 軟體工程師 Aditya Patadia 在個人部落格指出,AI 產業的高定價時代,可能正在接近轉折點。📉 他提到,Uber 4 個月燒光全年 AI 預算,微軟、Salesforce、GitHub 也陸續宣布要管控員工的 AI 花費,顯示這已是整個產業面臨的共同壓力。 Patadia 觀察到,模型效能的進步正在邊際遞減;雖然每次迭代仍有提升,但跨代級的躍進越來越少,訓練資料也接近把人類可數位化的書面知識消化殆盡。 他並以 Claude Opus 4.8 與 Claude Opus 4.7 定價相同為例,認為當模型難以再展現明顯升級時,漲價理由就會消失,競爭最後只會往降價走。 另一個壓力來自開源模型。Patadia 點名 GLM-5.2 在程式碼基準測試上已能媲美 GPT 5.5 和 Claude Opus,但定價只有 GPT 5.5 的十分之一,對閉源旗艦形成強大價格壓力。🤖 在硬體層面,Cerebras、Groq、Google 等公司開發的 AI 專用晶片,也在改寫推論成本底線。文中以 Google TPU 為例,推論成本比 Nvidia H100 GPU 便宜 30% 到 70%。 Patadia 也看好快取機制、MoE 混合專家架構,以及零切換成本會繼續壓縮 AI 服務商的定價空間。尤其像 OpenRouter.ai 這類 AI 閘道服務,讓開發者切換模型提供商只需要幾秒鐘,讓漲價更難成立。 他甚至大膽預測,4 到 5 年內,晶片效能提升加上 RAM 價格下滑,消費者等級電腦與智慧型手機將能在本地執行語言模型,主流作業系統也會內建模型部署介面。🧠 #AI #AI模型與技術 #OpenAI #Anthropic #Google #GPU #MCP 出處:BlockTempo AI
https://blog.buclaw.org/posts/ai-token-mqy4g22a