Google Gemini 擴展人工智能功能：新增圖像編輯和PDF分析

BigGo Editorial Team

Google 正在提升其 Gemini 人工智慧的能力，推出兩項重大更新，旨在增強視覺內容創作和檔案分析功能。


這個介面展示了Google Gemini人工智慧的創新功能，透過語音命令增強使用者互動

Gemini 即將推出人工智慧影像編輯功能

Google 即將為 Gemini 的人工智慧影像生成工具引入微調功能，允許使用者在建立後對人工智慧生成的影像進行詳細編輯。這項功能旨在解決人工智慧生成影像中常見的問題，如解剖錯誤或不可能的建築設計。

即將推出的更新將提供兩種編輯方法：

基於文字的調整：使用者可以提交提示來修改現有人工智慧生成影像的特定方面。
互動式編輯：使用者可以選擇影像的區域並描述所需的更改，Gemini 只會對選定區域進行修改。

這些工具對於圖形設計、營銷和社交媒體等領域的專業人士來說可能特別有價值，因為在這些領域中，視覺準確性和快速周轉時間至關重要。

雖然 Google 並非首家實施此類功能的公司——類似功能已存在於 OpenAI 的 DALL-E 和 Adobe Firefly 等工具中——但這次更新代表了 Gemini 在技術上的重大進步，Google 繼續在生成式人工智慧領域競爭。


這個介面展示了 Gemini 如何透過其在 Google 生態系統中的先進影像編輯功能來提高生產力

Gemini 與 Google Drive PDF 檢視器整合

在另一項發展中，Google 正在將 Gemini 功能直接整合到 Google Drive PDF 檢視器中。這項整合將 Gemini 1.5 Pro 的強大功能應用於 PDF 分析和內容建立任務。

Gemini PDF 整合的主要功能包括：

對長篇複雜的 PDF 進行摘要
基於檔案內容的問答功能
使用 PDF 資訊的內容建立工具（如學習指南、電子郵件草稿）
能夠結合多個 Google Drive 檔案的資訊

該功能支援各種型別的 PDF，包括掃描文件、文字密集型檔案以及包含複雜表格的檔案。

這項 Gemini 整合正在向 Google One AI Premium 訂閱使用者以及擁有 Gemini 商業版、企業版和教育版附加功能的使用者推出。

這兩項更新凸顯了 Google 致力於在其生態系統中擴充套件 Gemini 的能力，使人工智慧驅動的工具更易於使用，並融入日常生產力工作流程。

更新：8月1日星期四 22:48

Google 正進一步擴充套件 Gemini 的功能，為熱門服務推出新的擴充套件。即將推出的整合包括用於記筆記的 Google Keep、用於任務管理的 Google Tasks 以及用於日程安排的 Google Calendar。這些擴充套件將允許使用者透過語音命令與這些服務互動，提高 Google 生態系統內的生產力。此外，Spotify 擴充套件正在開發中，這將是 Gemini 的首個第三方整合。這將使使用者能夠控制音樂和播客播放，而無需啟動 Spotify 應用程式。其他正在開發的潛在擴充套件包括 Google Home 整合和手機應用功能，表明 Google 有意將 Gemini 定位為使用者跨各種服務和平臺的數字生活中心。


Gemini與Google Drive的整合提升了PDF分析和內容創作能力，簡化了使用者的工作流程