Google Gemini 擴展人工智能功能:新增圖像編輯和PDF分析

BigGo Editorial Team
Google Gemini 擴展人工智能功能:新增圖像編輯和PDF分析

Google 正在提升其 Gemini 人工智慧的能力,推出兩項重大更新,旨在增強視覺內容創作和檔案分析功能。

這個介面展示了Google Gemini人工智慧的創新功能,透過語音命令增強使用者互動
這個介面展示了Google Gemini人工智慧的創新功能,透過語音命令增強使用者互動

Gemini 即將推出人工智慧影像編輯功能

Google 即將為 Gemini 的人工智慧影像生成工具引入微調功能,允許使用者在建立後對人工智慧生成的影像進行詳細編輯。這項功能旨在解決人工智慧生成影像中常見的問題,如解剖錯誤或不可能的建築設計。

即將推出的更新將提供兩種編輯方法:

  1. 基於文字的調整:使用者可以提交提示來修改現有人工智慧生成影像的特定方面。
  2. 互動式編輯:使用者可以選擇影像的區域並描述所需的更改,Gemini 只會對選定區域進行修改。

這些工具對於圖形設計、營銷和社交媒體等領域的專業人士來說可能特別有價值,因為在這些領域中,視覺準確性和快速周轉時間至關重要。

雖然 Google 並非首家實施此類功能的公司——類似功能已存在於 OpenAI 的 DALL-E 和 Adobe Firefly 等工具中——但這次更新代表了 Gemini 在技術上的重大進步,Google 繼續在生成式人工智慧領域競爭。

這個介面展示了 Gemini 如何透過其在 Google 生態系統中的先進影像編輯功能來提高生產力
這個介面展示了 Gemini 如何透過其在 Google 生態系統中的先進影像編輯功能來提高生產力

Gemini 與 Google Drive PDF 檢視器整合

在另一項發展中,Google 正在將 Gemini 功能直接整合到 Google Drive PDF 檢視器中。這項整合將 Gemini 1.5 Pro 的強大功能應用於 PDF 分析和內容建立任務。

Gemini PDF 整合的主要功能包括:

  • 對長篇複雜的 PDF 進行摘要
  • 基於檔案內容的問答功能
  • 使用 PDF 資訊的內容建立工具(如學習指南、電子郵件草稿)
  • 能夠結合多個 Google Drive 檔案的資訊

該功能支援各種型別的 PDF,包括掃描文件、文字密集型檔案以及包含複雜表格的檔案。

這項 Gemini 整合正在向 Google One AI Premium 訂閱使用者以及擁有 Gemini 商業版、企業版和教育版附加功能的使用者推出。

這兩項更新凸顯了 Google 致力於在其生態系統中擴充套件 Gemini 的能力,使人工智慧驅動的工具更易於使用,並融入日常生產力工作流程。

更新:8月1日星期四 22:48

Google 正進一步擴充套件 Gemini 的功能,為熱門服務推出新的擴充套件。即將推出的整合包括用於記筆記的 Google Keep、用於任務管理的 Google Tasks 以及用於日程安排的 Google Calendar。這些擴充套件將允許使用者透過語音命令與這些服務互動,提高 Google 生態系統內的生產力。此外,Spotify 擴充套件正在開發中,這將是 Gemini 的首個第三方整合。這將使使用者能夠控制音樂和播客播放,而無需啟動 Spotify 應用程式。其他正在開發的潛在擴充套件包括 Google Home 整合和手機應用功能,表明 Google 有意將 Gemini 定位為使用者跨各種服務和平臺的數字生活中心。

Gemini與Google Drive的整合提升了PDF分析和內容創作能力,簡化了使用者的工作流程
Gemini與Google Drive的整合提升了PDF分析和內容創作能力,簡化了使用者的工作流程