DeepSeek 的 R1 模型顛覆全球人工智慧格局，彰顯中國人工智慧創新實力

BigGo Editorial Team

在一項引發全球人工智慧行業震動的重大發展中，成立不到兩年的杭州初創公司 DeepSeek 已成為人工智慧領域的一個強勁挑戰者。該公司最新推出的 R1 模型不僅在應用商店排行榜上名列前茅，還獲得了矽谷資深人士和華爾街分析師的空前關注。

成就：在美國和中國 App Store 免費榜上同時登頂

DeepSeek 的迅速崛起標誌著全球人工智慧格局的重大轉變。該公司實現了許多人認為不可能的事情——僅用600萬美元的訓練成本（約為 GPT-3 開發預算的1%）就開發出了一個具有競爭力的人工智慧模型。這種高性價比的創新引起了全球關注，英偉達的高階科學家稱讚 R1 是一項傑出的人工智慧進步。

開發成本：DeepSeek R1 - 600萬美元（僅為 GPT-3 成本的1%）

DeepSeek R1 模型的成功源於其創新的人工智慧開發方法。該公司採用了混合專家系統（MoE）、多頭潛在注意力機制（MLA）和多令牌預測（MTP）等先進技術，同時結合思維鏈推理。這種技術組合使 DeepSeek 在保持較低運營成本的同時實現了高效率。

關鍵技術：MoE 、MLA 、MTP 、鏈式思維推理

DeepSeek 的崛起對全球市場產生了實質性影響，導致英偉達股價下跌17%，併成為華爾街財報電話會議上的討論焦點。微軟和 Meta 等科技巨頭已將 DeepSeek 視為重要競爭對手，微軟執行長薩提亞·納德拉在財報電話會議上特別提到了該公司的創新。

市場影響：導致 Nvidia 股票價值下跌17%

DeepSeek 致力於開源開發的承諾，標誌著與主要人工智慧企業封閉生態系統的重大分歧。這種方法使先進人工智慧能力的獲取更加民主化，讓全球開發者能夠在此基礎上構建和改進技術。人工智慧先驅 Yann LeCun 強調這是一個關鍵因素，指出真正的故事不是關於國家競爭，而是開源模型超越專有模型。

DeepSeek 的成功預示著全球人工智慧格局的更廣泛轉變。這表明人工智慧創新並不完全依賴於龐大的計算資源，而是可以透過巧妙的工程設計和高效的資源利用來實現。這可能導致全球人工智慧開發更加多樣化和分散化，挑戰大型科技公司的傳統主導地位。

全球科技界對此反響強烈。Andreessen Horowitz 的創始人將 DeepSeek 的崛起比作斯普特尼克時刻，而行業分析師們正在重新評估他們對全球人工智慧競爭的看法。這開啟了關於人工智慧發展未來的新敘事，暗示著一個更加多極化的格局，創新可能來自意想不到的源頭。


Jim Cramer 強調了 DeepSeek 崛起對人工智慧行業的影響，這可能預示著創新的新階段。