在一項引發全球人工智慧行業震動的重大發展中,成立不到兩年的杭州初創公司 DeepSeek 已成為人工智慧領域的一個強勁挑戰者。該公司最新推出的 R1 模型不僅在應用商店排行榜上名列前茅,還獲得了矽谷資深人士和華爾街分析師的空前關注。
成就:在美國和中國 App Store 免費榜上同時登頂
DeepSeek 的崛起
DeepSeek 的迅速崛起標誌著全球人工智慧格局的重大轉變。該公司實現了許多人認為不可能的事情——僅用600萬美元的訓練成本(約為 GPT-3 開發預算的1%)就開發出了一個具有競爭力的人工智慧模型。這種高性價比的創新引起了全球關注,英偉達的高階科學家稱讚 R1 是一項傑出的人工智慧進步。
開發成本:DeepSeek R1 - 600萬美元(僅為 GPT-3 成本的1%)
技術創新與效率
DeepSeek R1 模型的成功源於其創新的人工智慧開發方法。該公司採用了混合專家系統(MoE)、多頭潛在注意力機制(MLA)和多令牌預測(MTP)等先進技術,同時結合思維鏈推理。這種技術組合使 DeepSeek 在保持較低運營成本的同時實現了高效率。
關鍵技術:MoE 、MLA 、MTP 、鏈式思維推理
對全球市場的影響
DeepSeek 的崛起對全球市場產生了實質性影響,導致英偉達股價下跌17%,併成為華爾街財報電話會議上的討論焦點。微軟和 Meta 等科技巨頭已將 DeepSeek 視為重要競爭對手,微軟執行長薩提亞·納德拉在財報電話會議上特別提到了該公司的創新。
市場影響:導致 Nvidia 股票價值下跌17%
開源戰略
DeepSeek 致力於開源開發的承諾,標誌著與主要人工智慧企業封閉生態系統的重大分歧。這種方法使先進人工智慧能力的獲取更加民主化,讓全球開發者能夠在此基礎上構建和改進技術。人工智慧先驅 Yann LeCun 強調這是一個關鍵因素,指出真正的故事不是關於國家競爭,而是開源模型超越專有模型。
未來影響
DeepSeek 的成功預示著全球人工智慧格局的更廣泛轉變。這表明人工智慧創新並不完全依賴於龐大的計算資源,而是可以透過巧妙的工程設計和高效的資源利用來實現。這可能導致全球人工智慧開發更加多樣化和分散化,挑戰大型科技公司的傳統主導地位。
行業反響
全球科技界對此反響強烈。Andreessen Horowitz 的創始人將 DeepSeek 的崛起比作斯普特尼克時刻,而行業分析師們正在重新評估他們對全球人工智慧競爭的看法。這開啟了關於人工智慧發展未來的新敘事,暗示著一個更加多極化的格局,創新可能來自意想不到的源頭。
![]() |
---|
Jim Cramer 強調了 DeepSeek 崛起對人工智慧行業的影響,這可能預示著創新的新階段。 |