Google 繼續增強其 AI 助手功能,為 Gemini Live 帶來新的多語言功能和視覺互動工具。這些更新代表了使 AI 助手在日常場景中更加多功能和實用的重要進步,基於 Google 建立更自然和情境化數字互動的願景。
Gemini Live 即將支援多語言
Google 正準備在 Gemini Live 中推出第二語言支援,允許使用者在同一會話中使用多種語言與 AI 助手交流。這項功能已在 Android 版 Google 應用測試版 16.9.39.sa.arm64 中被發現,將支援像 Spanglish(西班牙語和英語混合)、Hinglish(印地語和英語混合)等語言組合的對話。根據 Google 更新的支援頁面,Gemini Live 現在支援超過 45 種語言,不過使用者最初將僅限於新增一種輔助語言。一旦實施,該功能將在 Gemini 覆蓋層、應用程式內部以及 Gemini Live 對話期間工作,使助手對多語言使用者更加易於使用。
支援的語言:
- 總共超過45種語言
- 混合語言支援示例: Spanglish、 Hinglish、義大利語、法語
- 目前每位使用者僅限使用一種輔助語言
新的視覺互動能力
除了語言增強外,Gemini Live 還獲得了由 DeepMind 的 Project Astra 技術支援的強大新視覺功能。使用者很快就能將智慧手機攝像頭對準物體並與助手即時討論它們。例如,該系統可以透過攝像頭分析陶瓷花瓶的顏色樣本,同時保持關於選項的自然對話,從而幫助使用者做出設計決策。此外,Gemini Live 還添加了螢幕共享功能,允許助手識別並討論使用者螢幕上顯示的內容,實現關於所檢視內容的情境對話。
Gemini Live 新功能:
- 支援第二語言(目前處於測試階段)
- 透過智慧手機攝像頭進行即時影片分析
- 具有情境對話的螢幕共享功能
- 由 DeepMind 的 Project Astra 技術提供支援
AI 助手的未來
這些發展暗示了 Google 對 AI 助手的更廣泛願景。Google 的 Android 負責人 Sameer Samat 表示,這些智慧手機功能僅僅是開始,預示著未來智慧眼鏡可能實現的功能。將 Project Astra 的功能整合到 Gemini 中,代表著向 Google 設想的通用 AI 助手邁出的重要一步,該助手可以同時處理語音、視覺和環境上下文。這種擴充套件的上下文視窗允許 Gemini 在稍後幫助使用者解決問題時,引用之前看到的資訊,如教科書中的圖表。
平衡創新與使用者信任
隨著 Google 推進 AI 整合,公司意識到需要平衡創新與消費者信任。Samat 強調關注技術帶來的好處而非技術本身,指出 Google 旨在以大膽但負責任的方式前進。從 Google Glass 時代吸取的教訓中,公司優先考慮這些新功能如何工作的透明度,特別是關於隱私問題。這種謹慎的方法有時可能意味著即使擁有現成的技術,Google 也不會首先推出某些功能。
AI 代理與應用程式的共存
儘管有人擔憂 AI 代理最終可能取代傳統應用程式,但 Samat 對它們的共存持樂觀態度。他將 AI 代理更多地視為個人助手,幫助使用者更好地利用現有服務,而非替代它們。這一觀點表明,Google 認為移動計算的未來是 AI 代理和第三方應用程式的合作關係,雙方在使用者體驗中扮演互補角色。
展望未來
Google 顯然將 AI 視為與移動和個人計算轉變同等重要的變革性技術。該公司的戰略似乎專注於向用戶展示切實的好處,而不是強調 AI 技術本身。正如 Samat 所指出的,消費者只想知道這些東西是否真的能幫助他們完成任務。最終目標似乎是創造無縫整合的 AI 功能,使使用者在不一定意識到底層技術的情況下從中受益。