執行大型語言模型的真實成本已成為科技界爭議話題,開發者和行業觀察者對當前 API 定價是否反映可持續商業模式還是為了搶佔市場份額而進行的不可持續補貼存在分歧。
最近一項比較 LLM 推理成本與網路搜尋 API 的分析引發了關於 AI 服務背後經濟學的激烈討論。爭論的核心在於 OpenAI 、 Anthropic 等公司是在運營盈利的推理服務,還是在燒投資者的錢來建立在新興 AI 市場的主導地位。
盈利性問題分化了社群
核心分歧圍繞 LLM API 在當前價格下是否真正盈利。支援盈利論點的人指出了幾個關鍵因素。第三方託管提供商為開源模型提供有競爭力的定價,表明即使沒有專有最佳化也存在健康的利潤空間。 DeepSeek 公佈的資料顯示,在考慮 GPU 成本後,其 API 服務的利潤率約為80%。此外,高效批處理技術的可用性可以將每個 token 的成本相比單請求處理降低多達16倍。
然而,懷疑者認為當前定價代表了典型的虧損引流策略。他們聲稱將盈利的搜尋 API 與可能受補貼的 LLM 服務進行比較為分析創造了有缺陷的基礎。流入 AI 公司的大量資本支出,加上儘管使用量很高但仍有報告顯示虧損,表明當前定價可能不反映真實的運營成本。
** DeepSeek 報告的利潤率**
- GPU 成本方面, R1 API 定價的利潤率為80%
- 不包括其他運營成本,如支援、營銷、設施等費用
訓練成本和資產折舊使情況複雜化
一個重要的爭議點涉及如何計算模型訓練費用。雖然推理成本可能看起來可控,但批評者認為分析忽略了建立這些模型所需的大量前期投資。前沿模型的訓練成本可能超過1億美元,而且隨著數月內出現更新、更強大的模型,這些資產會快速貶值。
社群對是否應該將訓練成本納入每個 token 的定價仍存在分歧。一些人認為一旦模型訓練完成,推理的邊際成本就是持續運營的關鍵。其他人則認為可持續定價必須考慮持續開發新模型以保持競爭力的需求。
OpenAI 2024年財務背景
- 報告虧損:50億美元
- 月活躍使用者:5億
- 盈虧平衡要求:透過貨幣化每使用者每月約1美元
實際使用模式挑戰簡單比較
爭論還突出了搜尋和 LLM 使用模式之間的根本差異。雖然原始分析假設相對較短的響應約1000個 token ,但實際使用往往涉及更長的輸出,特別是對於程式碼生成、文件分析或多步推理等複雜任務。當 LLM 執行網路搜尋或處理大型文件時, token 消耗可能會急劇增加,可能顯著改變成本等式。
「如果我使用 LLM ,是為了解析大量輸入資料、影像識別、複雜分析、深度思考/推理、程式設計。所有這些都會導致比兩行'你問題的答案是xyz'響應顯著更多的 token 使用。」
這種使用現實表明,簡單的每個 token 比較可能無法捕捉人們實際如何使用這些服務的完整經濟圖景。
LLM API 定價對比(每百萬 token)
- Gemini 2.5 Flash:$0.15
- DeepSeek 模型:$0.20-$0.55 區間
- OpenAI GPT-4 級別模型:約 $15-30 區間
- o1-pro-2025:$150 輸入 / $600 輸出
市場動態和未來可持續性
討論揭示了對當前 AI 商業模式長期可持續性的更廣泛擔憂。與具有明確鎖定機制的傳統軟體服務不同, LLM API 在提供商之間提供相對容易的切換。這種商品化壓力可能會進一步壓低價格,即使當前定價今天看起來盈利,也可能使其變得不可持續。
然而,一些社群成員認為缺乏顯著鎖定實際上支援了盈利論點。公司幾乎沒有動機補貼客戶可以輕易放棄的服務,特別是當競爭對手經常出現更好的模型時。
這場爭論最終反映了隨著行業成熟, AI 經濟學周圍的不確定性。雖然推理成本在過去兩年中明顯大幅下降,但關於當前定價模式是否能夠支援在這個快速發展的市場中保持競爭地位所需的大量投資,問題仍然存在。