Gemini Live 擴充套件功能：新增第二語言支援和螢幕共享

BigGo Editorial Team

Google 繼續增強其 AI 助手功能，為 Gemini Live 帶來新的多語言功能和視覺互動工具。這些更新代表了使 AI 助手在日常場景中更加多功能和實用的重要進步，基於 Google 建立更自然和情境化數字互動的願景。

Gemini Live 即將支援多語言

Google 正準備在 Gemini Live 中推出第二語言支援，允許使用者在同一會話中使用多種語言與 AI 助手交流。這項功能已在 Android 版 Google 應用測試版 16.9.39.sa.arm64 中被發現，將支援像 Spanglish（西班牙語和英語混合）、Hinglish（印地語和英語混合）等語言組合的對話。根據 Google 更新的支援頁面，Gemini Live 現在支援超過 45 種語言，不過使用者最初將僅限於新增一種輔助語言。一旦實施，該功能將在 Gemini 覆蓋層、應用程式內部以及 Gemini Live 對話期間工作，使助手對多語言使用者更加易於使用。

支援的語言：

總共超過45種語言
混合語言支援示例： Spanglish、 Hinglish、義大利語、法語
目前每位使用者僅限使用一種輔助語言

新的視覺互動能力

除了語言增強外，Gemini Live 還獲得了由 DeepMind 的 Project Astra 技術支援的強大新視覺功能。使用者很快就能將智慧手機攝像頭對準物體並與助手即時討論它們。例如，該系統可以透過攝像頭分析陶瓷花瓶的顏色樣本，同時保持關於選項的自然對話，從而幫助使用者做出設計決策。此外，Gemini Live 還添加了螢幕共享功能，允許助手識別並討論使用者螢幕上顯示的內容，實現關於所檢視內容的情境對話。

Gemini Live 新功能：

支援第二語言（目前處於測試階段）
透過智慧手機攝像頭進行即時影片分析
具有情境對話的螢幕共享功能
由 DeepMind 的 Project Astra 技術提供支援

AI 助手的未來

這些發展暗示了 Google 對 AI 助手的更廣泛願景。Google 的 Android 負責人 Sameer Samat 表示，這些智慧手機功能僅僅是開始，預示著未來智慧眼鏡可能實現的功能。將 Project Astra 的功能整合到 Gemini 中，代表著向 Google 設想的通用 AI 助手邁出的重要一步，該助手可以同時處理語音、視覺和環境上下文。這種擴充套件的上下文視窗允許 Gemini 在稍後幫助使用者解決問題時，引用之前看到的資訊，如教科書中的圖表。

平衡創新與使用者信任

隨著 Google 推進 AI 整合，公司意識到需要平衡創新與消費者信任。Samat 強調關注技術帶來的好處而非技術本身，指出 Google 旨在以大膽但負責任的方式前進。從 Google Glass 時代吸取的教訓中，公司優先考慮這些新功能如何工作的透明度，特別是關於隱私問題。這種謹慎的方法有時可能意味著即使擁有現成的技術，Google 也不會首先推出某些功能。

AI 代理與應用程式的共存

儘管有人擔憂 AI 代理最終可能取代傳統應用程式，但 Samat 對它們的共存持樂觀態度。他將 AI 代理更多地視為個人助手，幫助使用者更好地利用現有服務，而非替代它們。這一觀點表明，Google 認為移動計算的未來是 AI 代理和第三方應用程式的合作關係，雙方在使用者體驗中扮演互補角色。

展望未來

Google 顯然將 AI 視為與移動和個人計算轉變同等重要的變革性技術。該公司的戰略似乎專注於向用戶展示切實的好處，而不是強調 AI 技術本身。正如 Samat 所指出的，消費者只想知道這些東西是否真的能幫助他們完成任務。最終目標似乎是創造無縫整合的 AI 功能，使使用者在不一定意識到底層技術的情況下從中受益。