在人工智慧研究能力的重大進展中,OpenAI 推出了 Deep Research,這是一款旨在徹底改變專業人士進行線上研究和分析方式的複雜工具。這項新功能標誌著人工智慧在理解、綜合和呈現來自多個來源的複雜資訊方面的重大進步。
先進的研究能力
Deep Research 採用了 OpenAI o3 模型的專門版本,針對網頁瀏覽和 Python 分析進行了最佳化。該系統可以同時處理數百個線上資源,分析文字、影像和 PDF 檔案,生成全面的研究報告。其獨特之處在於能夠保持上下文連貫性並提供詳細的引用來源,確保研究結果的透明度和可驗證性。
實際應用
該工具主要面向金融、科學、政策和工程領域的專業人士,這些領域需要全面可靠的研究。它還可以滿足消費者的實際需求,例如在購買車輛、家電和傢俱等重大消費品時做出明智的決定。使用者可以輸入查詢並上傳文件(包括 PDF 和電子表格),通常在5到30分鐘內即可獲得結果。
主要功能特點:
- 處理時間:每次查詢5-30分鐘
- 每月查詢限制:100次(專業使用者)
- 支援的檔案型別:PDF 文件、電子表格
- 當前輸出形式:基於文字的報告
- 平臺可用性:僅支援網頁版(移動端/桌面端即將推出)
效能和基準測試
Deep Research 在嚴格的測試環境中展現出令人印象深刻的能力。在人類最後考試評估中,它在超過100個學科的專家級問題上達到了26.6%的準確率。該系統還在 GAIA 基準測試中位居榜首,該基準測試主要評估人工智慧在需要推理和多模態流暢性的實際問題上的表現。
效能指標:
- Humanity's Last Exam 準確率:26.6%
- GAIA 基準測試:達到了 SOTA(最先進水平)效能
- 覆蓋範圍:超過100個學術領域
![]() |
---|
Deep Research 在專家級任務中的表現,突顯其在嚴格測試環境中的準確性 |
當前限制和未來更新
儘管功能強大,但 Deep Research 目前仍面臨一些限制。使用者可能會遇到偶爾的事實性錯誤,以及在區分權威來源和錯誤資訊方面的挑戰。OpenAI 承認這些限制,並計劃透過未來更新來解決這些問題。該公司已宣佈計劃引入嵌入式影像、資料視覺化以及與專業資料來源的整合。
可用性和訪問許可權
目前,Deep Research 向 ChatGPT Pro 使用者開放,每月查詢限額為100次。OpenAI 計劃在未來幾周內將訪問許可權擴充套件到 Plus、Team 和 Enterprise 使用者。該功能目前僅支援網頁版,預計本月晚些時候將整合移動端和桌面應用程式,這標誌著讓高階研究能力在不同平臺上更易獲取的重要一步。