OpenAI 顯著擴大了其強大的 AI 研究助手的訪問範圍,使更廣泛的訂閱使用者能夠使用先進的資訊收集功能。這項功能最初僅限於最高級別的訂閱使用者使用,此次擴充套件代表了一項戰略舉措,旨在向更多使用者提供複雜的 AI 研究工具,同時保持分層訪問許可權。
擴大付費使用者訪問許可權
OpenAI 已正式將其深度研究功能擴充套件至所有付費 ChatGPT 訂閱使用者,包括 Plus、Team、Edu 和 Enterprise 使用者。該功能本月初首次推出時僅限於每月支付 200 美元的 Pro 級別訂閱使用者使用,現在已向更經濟實惠的訂閱計劃使用者開放。雖然 Pro 訂閱使用者保持最高使用配額,每月 120 次查詢(從最初的 100 次增加),但其他付費使用者將獲得每月 10 次深度研究查詢的有限配額。這種分層方法在擴大可訪問性的同時保持了高階層的獨特性。
按訂閱等級劃分的深度研究訪問許可權
- ChatGPT Pro:每月120次查詢(200美元/月)
- ChatGPT Plus:每月10次查詢
- ChatGPT Team:每月10次查詢
- ChatGPT Edu:每月10次查詢
- ChatGPT Enterprise:每月10次查詢
強大的研究能力
深度研究功能作為一個自主 AI 研究代理,能夠透過從網路各處收集綜合資訊來進行多步驟研究。該工具由 OpenAI 專門最佳化用於網路瀏覽和資料分析的 o3 模型驅動,可以搜尋和解釋大量線上內容,包括文字和影像,並將發現的內容綜合成全面的報告。該系統一旦收到提示就能獨立工作,有效地充當個人研究分析師,能在幾分鐘內完成通常需要人類數小時才能完成的工作。
增強的功能和效能
隨著訪問許可權的擴大,OpenAI 還為深度研究功能引入了幾項改進。該工具現在在輸出中包含帶有引用的嵌入影像,並展示了更好的理解和引用上傳檔案的能力。每份報告都包含清晰的引用和代理推理過程的摘要,允許使用者獨立驗證資訊。考慮到 OpenAI 承認該系統偶爾會產生幻覺事實或做出錯誤推斷(儘管據報道比現有 ChatGPT 模型的頻率低),這種透明度尤為重要。
令人印象深刻的基準測試結果
深度研究功能在標準化 AI 評估中展示了令人印象深刻的效能。該系統在 Scale AI 和 Center for AI Safety 建立的人類最後一次考試基準測試中,表現優於多個先進的 AI 模型,包括 GPT-4o、Grok-2、Claude 3.5 Sonnet 和 Gemini Thinking。以 26.6% 的準確率,深度研究功能甚至超過了之前保持最高分的 o3-mini high。此外,該工具還在 GAIA 外部排行榜上名列前茅,這是一個評估 AI 在現實世界問題上表現的公共基準。
市場競爭
研究代理領域的競爭日益激烈。Google 透過其 Gemini Advanced 服務提供類似功能(也稱為深度研究),每月收費 20 美元,透過 Google One AI Premium 計劃提供。Elon Musk 的 xAI 推出了 DeepSearch,向 X Premium(每月 8 美元/每年 84 美元)和 Premium+(每月 40 美元/每年 395 美元)訂閱使用者開放。同時,Microsoft 推出了 Think Deeper,該功能利用 OpenAI 的 O1 推理模型,但缺乏網際網路訪問和自主能力。與競爭對手不同,Microsoft 的產品是免費提供的。
競爭性研究代理定價
- OpenAI Deep Research (Pro):每月200美元
- Google Deep Research (Gemini Advanced):每月20美元
- xAI DeepSearch (X Premium):每月8美元或每年84美元
- xAI DeepSearch (X Premium+):每月40美元或每年395美元
- Microsoft Think Deeper:免費
目標使用者和限制
OpenAI 將深度研究功能定位為對從事金融、科學、政策和工程領域密集知識工作的專業人士特別有價值。該工具擅長查詢通常需要多次手動搜尋才能找到的小眾資訊。然而,OpenAI 警告說,該系統可能難以區分權威資訊和謠言,有時可能無法正確傳達不確定性,強調了人類監督和驗證的持續重要性。