在一個引發了興趣和爭議的大膽舉措中,xAI 推出了其最新的人工智慧模型 Grok 3,並聲稱這是世界上最智慧的人工智慧。然而,這次釋出獲得了褒貶不一的反響,特別是關於其大幅提價和與現有人工智慧解決方案相比的實際效能。
技術飛躍
Grok 3 代表著重大的計算能力進步,使用了200,000個 Nvidia H100 GPU 進行訓練,是其前代產品計算能力的十倍。訓練過程分為兩個階段:最初使用100,000個GPU訓練了144天,隨後使用全部200,000個GPU陣列訓練了92天。這項巨大的基礎設施投資帶來了處理速度和能力的顯著提升。
訓練基礎設施:
- 第一階段:10萬個 GPU 執行144天
- 第二階段:20萬個 GPU 執行92天
- 總 GPU 使用量:是 Grok 2 的10倍
效能現實檢驗
雖然 xAI 的基準測試表明 Grok 3 的效能超過了大多數競爭對手(除了 OpenAI 即將推出的 o3 模型),但實際測試結果卻展現出一個更微妙的情況。該模型在日常任務中表現出色,但在處理更復雜的挑戰時仍有困難。包括前 Tesla 人工智慧總監 Andrej Karpathy 在內的知名人工智慧專家認為,Grok 3 的能力介於 DeepSeek R1 和 OpenAI 的 o1-pro 之間——穩固但並非革命性的突破。
定價爭議
此次釋出特別具有爭議性,主要是因為其定價策略。訪問 Grok 3 需要支付每月40美元的 X Premium+ 訂閱費(從22美元上調),或每月30美元的 SuperGrok 訂閱費。這個價格幾乎是行業標準的兩倍,而 Gemini Advanced、ChatGPT Plus 和 Perplexity Pro 等競爭對手的訂閱費僅為每月20美元。
價格對比:
- X Premium+ 搭配 Grok 3:每月40美元
- SuperGrok:每月30美元
- 行業標準產品( ChatGPT Plus 、 Gemini Advanced 、 Perplexity Pro ):每月20美元
功能集和侷限性
Grok 3 引入了新功能,包括 DeepSearch 功能和推理模型。然而,它缺少了一些成熟人工智慧平臺常見的功能,比如語音模式。Think 功能雖然前景可期,但通常需要約2分鐘才能生成響應——這對使用者來說是相當長的等待時間。此外,更快速的 Grok 3 mini 版本和API訪問仍在等待發布。
主要特點:
- DeepSearch 搜尋能力
- 推理模型
- "思考"功能(2分鐘響應時間)
- 缺失功能:語音模式、API 介面、迷你版本
![]() |
---|
展示 Grok 3 的 DeepSearch 功能執行實況的截圖 |
市場影響
出人意料的是,xAI 宣佈在伺服器崩潰前暫時免費開放 Grok 3 訪問許可權,這讓剛剛支付了更高訂閱費的 Premium+ 使用者感到不滿。這一舉措雖然可能是為了與 DeepSeek 最近的成功競爭,但也引發了人們對 xAI 長期定價策略和對付費訂閱者承諾的質疑。
Grok 背後的團隊
開發團隊值得注意的是擁有重要的中國人才,包括95後的 Yuhuai Wu 和 Jimmy Ba 作為核心技術負責人。這種國際合作突顯了人工智慧發展的全球性特徵,即使在地緣政治緊張影響技術領域的情況下依然如此。