在人工智慧領域的一項重大發展中,Google 宣佈推出 Gemini 2.0,標誌著人工智慧能力的重大進步,為下一代人工智慧助手奠定基礎。在 OpenAI 持續創新引發關注之際,這次釋出代表著 Google 在快速發展的人工智慧領域保持競爭優勢的戰略舉措。
革命性的多模態能力
Gemini 2.0 作為首個提供原生多模態輸入和輸出處理的人工智慧模型脫穎而出。該系統可以無縫處理文字、影像、影片和音訊,其處理速度是前代 Gemini 1.5 Pro 的兩倍。這一進步使其能夠在保持成本和效能效率的同時實現複雜資料流的即時處理。
三大智慧代理:Astra、Mariner 和 Jules
Google 基於 Gemini 2.0 框架推出了三個專業化的人工智慧代理。Project Astra 作為通用人工智慧助手,具有增強的對話能力和10分鐘的對話記憶功能。Project Mariner 透過理解和操作網頁元素革新了瀏覽器互動,在實際任務中取得了83.5%的成功率。而作為程式碼助手的 Jules 則直接整合到 GitHub 工作流程中,以簡化軟體開發過程。
關鍵效能指標:
- 處理速度:比 Gemini 1.5 Pro 快2倍
- 上下文長度:200萬個令牌(相當於數小時的影片)
- Project Mariner 成功率:在 WebVoyager 基準測試中達到83.5%
- 記憶體容量:Project Astra 可保持10分鐘的對話保留
TPU Trillium 改進:
- 訓練效能:提升4倍
- 推理吞吐量:提升3倍
- 單晶片峰值計算效能:提升4.7倍
- 成本效率:每美元訓練效能提升2.5倍
- 基礎設施:Jupiter 網路中包含100,000個 TPU
硬體創新驅動效能提升
Gemini 2.0 的強大效能源自 Google 第六代 TPU——Trillium。這款定製硬體實現了顯著的改進,包括4倍的訓練效能提升、3倍的推理吞吐量提升,以及67%的效率提升。其基礎設施包括容納100,000個 TPU 的 Jupiter 網路,每美元可實現2.5倍的訓練效能提升。
可訪問性和未來推廣計劃
開發者目前可以透過 Google AI Studio 和 Vertex AI 訪問 Gemini 2.0 Flash。該平臺將在2025年初擴充套件,增加更多模型規模和多模態版本。Google 對負責任的人工智慧的承諾體現在其實施的 SynthID 水印技術上,用於標記生成內容。
智慧代理時代的黎明
Google 的願景超越了傳統的人工智慧能力,將 Gemini 2.0 定位為預計在2025年全面到來的人工智慧代理時代的基礎。在 Sundar Pichai 的領導下,Google 正在其產品生態系統中整合這些人工智慧能力,其人工智慧概覽已服務超過十億使用者。這一戰略舉措展示了 Google 在確保使用者安全和控制的同時,致力於使人工智慧更加實用和易於訪問的承諾。