DeepSeek R1 釋出：效能媲美 OpenAI o1，提供 MIT 許可的開源模型

BigGo Editorial Team

DeepSeek R1 釋出：效能媲美 OpenAI o1，提供 MIT 許可的開源模型

在人工智慧行業的一項重大進展中，DeepSeek 正式釋出了其 R1 模型，這標誌著開源人工智慧開發的一個重要成就。此次釋出代表著一項戰略性舉措，將高效能能力與開源方式相結合，有望重塑人工智慧模型的可訪問性和開發格局。

革命性的訓練方法

DeepSeek R1 引入了一種突破性的訓練方法，主要依賴強化學習（RL），這與傳統的監督式微調（SFT）方法有所不同。R1-Zero 變體展示了純 RL 訓練的有效性，在沒有傳統 SFT 資料的情況下實現了顯著的效能提升。這種創新方法取得了顯著成果，僅透過 RL 訓練，模型在 AIME 2024 上的表現從15.6%提升到71.0%。

效能基準

該模型在各種基準測試中展現出卓越的能力，特別是在數學、程式設計和推理任務方面。DeepSeek R1 在 AIME 2024 上取得了79.8%的成績，在 MATH-500 上達到了令人印象深刻的97.3%，與 OpenAI 的 o1 效能相當或略有超越。在程式設計競賽中，該模型在 Codeforces 上達到了2029的 Elo 評分，超過了96.3%的人類參與者。

基準效能測試：

AIME 2024：79.8%（超過 OpenAI o1）
MATH-500：97.3%（與 OpenAI o1 相當）
Codeforces：2029 等級分（超過96.3%的人類參與者）


Jim Fan 討論人工智慧的競爭格局，強調 DeepSeek-R1 的效能改進

具有競爭力的定價策略

DeepSeek 為其 API 服務制定了極具競爭力的價格。模型的 API 費率為快取命中每百萬詞元0.14美元，快取未命中的輸入為每百萬詞元0.55美元，輸出價格為每百萬詞元2.19美元。與 OpenAI 的產品相比，這種定價結構具有顯著的成本優勢，使開發者和企業更容易獲得先進的人工智慧能力。

API 價格對比：

DeepSeek R1：
- 輸入（快取命中）：0.14美元/百萬詞元
- 輸入（快取未命中）：0.55美元/百萬詞元
- 輸出：2.19美元/百萬詞元
OpenAI o1：
- 輸入：15美元/百萬詞元
- 輸出：60美元/百萬詞元

開源承諾

此次釋出不僅包括模型本身，還包括全面的技術文件和六個蒸餾後的小型模型。根據 MIT 許可證，使用者可以自由使用、修改和商業化該模型，包括其權重和輸出。這種方法與許多商業人工智慧模型有很大不同，促進了人工智慧社群的透明度和協作創新。

蒸餾和生態系統發展

DeepSeek 成功地將 R1 的能力蒸餾到更小、更實用的模型中，使用了像 Qwen 和 Llama 這樣的流行架構。32B 和 70B 的蒸餾版本達到了與 OpenAI 的 o1-mini 相當的效能水平，展示了將知識從大型模型轉移到小型模型的有效性，同時保持了高效能標準。

未來影響

這次釋出代表著民主化先進人工智慧能力的重要一步。透過將最先進的效能與開源可訪問性和具有競爭力的定價相結合，DeepSeek R1 可能會加速人工智慧領域的創新，同時使強大的人工智慧工具更容易被更廣泛的開發者和組織使用。