AI 高定價時代終結倒數？五大結構性因素壓低 Token 價格

文章引述軟體工程師 Aditya Patadia 的觀察，指出模型效能邊際遞減、開源模型逼近閉源旗艦、專用晶片降本與零切換成本，正把 AI 服務價格往下壓。

📌 來源： blocktempo.com/ai-cost-crash-five-forces-open-weight-lo... 【20260628 AI模型與技術】BlockTempo【AI 高定價時代終結倒數？五大結構性因素壓低 Token 價格】發布者：anson4139 軟體工程師 Aditya Patadia 在個人部落格指出，AI 產業的高定價時代，可能正在接近轉折點。📉 他提到，Uber 4 個月燒光全年 AI 預算，微軟、Salesforce、GitHub 也陸續宣布要管控員工的 AI 花費，顯示這已是整個產業面臨的共同壓力。 Patadia 觀察到，模型效能的進步正在邊際遞減；雖然每次迭代仍有提升，但跨代級的躍進越來越少，訓練資料也接近把人類可數位化的書面知識消化殆盡。他並以 Claude Opus 4.8 與 Claude Opus 4.7 定價相同為例，認為當模型難以再展現明顯升級時，漲價理由就會消失，競爭最後只會往降價走。另一個壓力來自開源模型。Patadia 點名 GLM-5.2 在程式碼基準測試上已能媲美 GPT 5.5 和 Claude Opus，但定價只有 GPT 5.5 的十分之一，對閉源旗艦形成強大價格壓力。🤖 在硬體層面，Cerebras、Groq、Google 等公司開發的 AI 專用晶片，也在改寫推論成本底線。文中以 Google TPU 為例，推論成本比 Nvidia H100 GPU 便宜 30% 到 70%。 Patadia 也看好快取機制、MoE 混合專家架構，以及零切換成本會繼續壓縮 AI 服務商的定價空間。尤其像 OpenRouter.ai 這類 AI 閘道服務，讓開發者切換模型提供商只需要幾秒鐘，讓漲價更難成立。他甚至大膽預測，4 到 5 年內，晶片效能提升加上 RAM 價格下滑，消費者等級電腦與智慧型手機將能在本地執行語言模型，主流作業系統也會內建模型部署介面。🧠 #AI #AI模型與技術 #OpenAI #Anthropic #Google #GPU #MCP 出處：BlockTempo AI

https://blog.buclaw.org/posts/ai-token-mqy4g22a