Google 最近的 I/O 2024 活動展示了 Gemini AI 平臺的眾多進步,承諾在影像編輯、影片生成等方面具有革命性的能力。隨著這些功能開始向用戶推出,許多人都在思考 Gemini Pro 付費訂閱是否能實現這些雄心勃勃的承諾,還是未能達到預期。
免費試用體驗
在考慮升級到 Gemini Pro 時,一些使用者發現他們可以透過禮貌地詢問來體驗某些高階功能。一位科技記者發現,透過表明他們正在考慮升級並請求先試用功能,Gemini 允許有限訪問 Pro 級別的功能。這種非官方試用讓使用者得以一窺付費使用者可能獲得的體驗,儘管有限制,比如每種功能型別只有三次嘗試機會。
影像編輯能力
Gemini 最受吹捧的功能之一是其編輯和處理影像的能力。在實踐中,結果卻參差不齊。當被要求執行看似簡單的任務,如在影像中開啟一個關閉的盒子或從場景中移除物體時,Gemini 往往會生成全新的影像,而不是編輯原始影像。這些新創作經常遺漏源材料中的關鍵細節,表明它對使用者實際需求的理解存在根本性問題。
![]() |
---|
Gemini 的人工智慧驅動的機器人技術展示了在影像處理方面的潛在應用 |
風格複製的挑戰
嘗試讓 Gemini 複製特定藝術風格時會發現其明顯的侷限性。當提供知名藝術家如 Mike Mignola(《地獄男爵》的創作者)的參考影像,並要求生成類似的藝術作品時,結果只捕捉到了表面層次的元素,而錯過了定義藝術家作品的更深層次的美學品質。這凸顯了AI系統的一個持續問題:它們可以模仿表面特徵,但難以理解藝術風格的本質。
高畫質影像增強
另一個廣告宣傳的功能允許使用者將低解析度影像轉換為高畫質桌布。測試表明,雖然 Gemini 可以生成受原始影像啟發的高解析度影像,但它經常放棄實際內容,轉而建立一個全新的、僅共享情緒或主題的影像。對於希望增強珍貴照片的使用者來說,這種方法遠遠不能滿足期望。
主要侷限性:
- 經常生成新影像而非編輯現有影像
- 只能捕捉藝術風格的表面元素
- 無法正確匯出到 Google Docs 或 Sheets
- 功能可用性因地區而異
- 在機器人應用中沒有記憶能力
實用功能表現良好
儘管存在這些缺點,Gemini 在幾個實用領域表現出色。在幫助使用者頭腦風暴、提供寫作反饋或解釋複雜技術過程時,AI表現出色。這些更直接、基於資訊的任務發揮了AI的優勢,而不需要創造性任務所要求的更深層次的理解。
令人興奮的演示應用
在 Google I/O 上,幾個令人印象深刻的演示展示了 Gemini 在基本文字和影像生成之外的潛力。與會者體驗了可以操作物體的語音控制機器人、能夠在使用者身體上逼真呈現服裝的虛擬試衣技術,以及能夠響應即時調整的AI驅動音樂生成。這些應用暗示了未來AI將協助處理實際的日常任務,而不是試圖取代人類創造力。
測試的 Gemini Pro 功能:
- 影像編輯(物件移除、修改)
- 從參考影像複製風格
- 高畫質影像增強
- 寫作輔助和反饋
- 技術解釋能力
展示的 Gemini 有前景的應用:
- 語音控制機器人技術
- AI 虛擬服裝試穿
- 使用 Lyria 2 即時自適應音樂生成
- 自定義 Android Bot 建立
- 使用 Flow 和 Veo 的 AI 影片生成
![]() |
---|
展示在 Google I/O 2024 上展示的虛擬試穿功能 |
區域可用性限制
潛在訂閱者應注意,並非所有宣傳的 Gemini Pro 功能在每個地區都可用。AI本身承認這一限制,解釋說在 Google I/O 等活動上宣佈的功能通常是逐步推出的,最初可能僅限於某些市場或處於實驗階段。
整合不足
對注重生產力的使用者來說,一個重大缺點是 Gemini 與其他 Google 服務的整合有限。儘管是 Google 生態系統的一部分,Gemini 無法將結果正確匯出到 Google Docs 或 Sheets——這是一個無論訂閱等級如何都不可用的基本功能。這一限制大大降低了它在協作工作環境中的實用性。
Gemini 的未來
Google 將 Gemini 定位為通用AI助手,其野心遠超當前能力。Gemini Robotics 和 Flow(用於AI影片建立)等專案展示了公司對能夠理解並與物理世界互動的AI的長期願景。隨著這些技術的成熟,它們可能會解決當前阻礙AI真正理解使用者意圖而非僅字面執行指令的理解差距。
值得升級嗎?
目前,升級到 Gemini Pro 的決定在很大程度上取決於具體用例。那些尋求影像處理或風格複製創意工具的使用者可能會發現當前的產品令人失望。然而,需要幫助研究、寫作或學習複雜主題的使用者可能會發現足夠的價值來證明訂閱的合理性。隨著 Google 繼續完善這些功能並推出新功能,對更廣泛的受眾來說,其價值主張可能會變得更具吸引力。