在人工智慧領域出現了一項重要進展:DeepSeek 的開源人工智慧模型已證實可以在中國製造的摩爾線程 GPU 上執行,這可能會減少人工智慧推理任務對傳統 NVIDIA 硬體的依賴。
技術突破
摩爾線程已成功在其 MTT S80 客戶端顯示卡和 MTT S4000 資料中心級顯示卡上部署了 DeepSeek-R1-Distill-Qwen-7B 模型。該實現採用了 Ollama 框架(一個專為在各種作業系統上本地執行大型語言模型而設計的輕量級解決方案),並結合了摩爾線程專有的推理引擎最佳化。
- DeepSeek API 定價:每百萬輸出詞元 2.2 美元
- OpenAI API 定價:每百萬輸出詞元 60 美元
- 支援硬體:MTT S80(客戶端 GPU)、MTT S4000(資料中心 GPU)
- 框架支援:Ollama(支援 MacOS、Linux、Windows)
- 相容模型:DeepSeek-R1-Distill-Qwen-7B
市場影響
這一進展恰逢 DeepSeek 在全球人工智慧領域引起廣泛關注之際。該公司採取了極具競爭力的定價策略,其 API 服務每百萬輸出令牌收費 2.2 美元,遠低於 OpenAI 每百萬令牌 60 美元的收費標準。包括阿里巴巴、字節跳動、百度和京東雲在內的中國主要科技公司已將 DeepSeek 的模型整合到其雲服務中。
效能與整合
儘管具體效能指標尚未公佈,但摩爾線程聲稱透過其定製的計算最佳化和改進的記憶體管理取得了出色的結果。該公司的 GPU 已展示出 CUDA 相容性,這對中文應用程式特別有利。這一整合代表著中國國產人工智慧硬體能力的重要進步。
未來影響
DeepSeek 模型在摩爾線程 GPU 上的成功部署預示著人工智慧硬體領域可能發生轉變。這一發展可能帶來更經濟、更容易獲取的人工智慧實施方案,特別是在中國市場。然而,需要注意的是,目前的演示僅限於蒸餾模型,與 AMD、Apple 或 NVIDIA 解決方案的全面性能對比尚未建立。