DeepSeek R1 釋出:效能媲美 OpenAI o1,提供 MIT 許可的開源模型

BigGo Editorial Team
DeepSeek R1 釋出:效能媲美 OpenAI o1,提供 MIT 許可的開源模型

在人工智慧行業的一項重大進展中,DeepSeek 正式釋出了其 R1 模型,這標誌著開源人工智慧開發的一個重要成就。此次釋出代表著一項戰略性舉措,將高效能能力與開源方式相結合,有望重塑人工智慧模型的可訪問性和開發格局。

革命性的訓練方法

DeepSeek R1 引入了一種突破性的訓練方法,主要依賴強化學習(RL),這與傳統的監督式微調(SFT)方法有所不同。R1-Zero 變體展示了純 RL 訓練的有效性,在沒有傳統 SFT 資料的情況下實現了顯著的效能提升。這種創新方法取得了顯著成果,僅透過 RL 訓練,模型在 AIME 2024 上的表現從15.6%提升到71.0%。

效能基準

該模型在各種基準測試中展現出卓越的能力,特別是在數學、程式設計和推理任務方面。DeepSeek R1 在 AIME 2024 上取得了79.8%的成績,在 MATH-500 上達到了令人印象深刻的97.3%,與 OpenAI 的 o1 效能相當或略有超越。在程式設計競賽中,該模型在 Codeforces 上達到了2029的 Elo 評分,超過了96.3%的人類參與者。

基準效能測試:

  • AIME 2024:79.8%(超過 OpenAI o1)
  • MATH-500:97.3%(與 OpenAI o1 相當)
  • Codeforces:2029 等級分(超過96.3%的人類參與者)
Jim Fan 討論人工智慧的競爭格局,強調 DeepSeek-R1 的效能改進
Jim Fan 討論人工智慧的競爭格局,強調 DeepSeek-R1 的效能改進

具有競爭力的定價策略

DeepSeek 為其 API 服務制定了極具競爭力的價格。模型的 API 費率為快取命中每百萬詞元0.14美元,快取未命中的輸入為每百萬詞元0.55美元,輸出價格為每百萬詞元2.19美元。與 OpenAI 的產品相比,這種定價結構具有顯著的成本優勢,使開發者和企業更容易獲得先進的人工智慧能力。

API 價格對比:

  • DeepSeek R1:

    • 輸入(快取命中):0.14美元/百萬詞元
    • 輸入(快取未命中):0.55美元/百萬詞元
    • 輸出:2.19美元/百萬詞元
  • OpenAI o1:

    • 輸入:15美元/百萬詞元
    • 輸出:60美元/百萬詞元

開源承諾

此次釋出不僅包括模型本身,還包括全面的技術文件和六個蒸餾後的小型模型。根據 MIT 許可證,使用者可以自由使用、修改和商業化該模型,包括其權重和輸出。這種方法與許多商業人工智慧模型有很大不同,促進了人工智慧社群的透明度和協作創新。

蒸餾和生態系統發展

DeepSeek 成功地將 R1 的能力蒸餾到更小、更實用的模型中,使用了像 Qwen 和 Llama 這樣的流行架構。32B 和 70B 的蒸餾版本達到了與 OpenAI 的 o1-mini 相當的效能水平,展示了將知識從大型模型轉移到小型模型的有效性,同時保持了高效能標準。

未來影響

這次釋出代表著民主化先進人工智慧能力的重要一步。透過將最先進的效能與開源可訪問性和具有競爭力的定價相結合,DeepSeek R1 可能會加速人工智慧領域的創新,同時使強大的人工智慧工具更容易被更廣泛的開發者和組織使用。