人工智慧繼續超越簡單的文字生成,各科技巨頭競相開發能夠自主執行復雜任務的 AI 代理。Microsoft 現在透過對其面向企業的 AI 平臺進行重大升級,進入了這一競爭領域。
Microsoft 為 Copilot Studio 引入電腦使用功能
Microsoft 為 Copilot Studio 推出了一項新的電腦使用功能,使 AI 代理能夠獨立與網站和桌面應用程式進行互動。這一進步使 AI 能夠透過點選按鈕、選擇選單選項和在欄位中輸入內容來導航數字介面——本質上是模仿人類與軟體的互動。公司副總裁 Charles Lamanna 解釋說,即使在沒有直接 API 連線的情況下,這一功能也允許代理處理任務,他簡單地表示:如果一個人可以使用應用程式,代理也可以。
新功能的工作原理
這項新功能代表了 AI 自動化能力的重大飛躍。與需要特定 API 整合的傳統自動化不同,Copilot Studio 的電腦使用功能允許 AI 代理與幾乎任何人類可以使用的介面進行互動。該系統的設計考慮到了適應性,能夠檢測應用程式或網站中的按鈕和螢幕何時發生變化,而不會中斷工作流程。這種彈性確保在處理跨不同數字環境的複雜多步驟流程時,能夠提供更可靠的效能。
Microsoft 在 Copilot Studio 中"計算機使用"功能的主要特點:
- 使 AI 代理能夠與網站和桌面應用程式互動
- 可以點選按鈕、選擇選單選項和在欄位中輸入文字
- 無需 API 連線即可工作
- 能夠適應變化的介面而不破壞工作流程
- 適用於資料錄入、市場研究和發票處理等任務
商業應用和使用案例
企業可以利用這一新功能透過 Copilot Studio 構建專門的 AI 代理,自動化各種任務。這些包括跨多個系統的資料輸入、需要瀏覽各種網站的綜合市場研究,以及可能涉及多個應用程式的發票處理。該功能本質上將 Copilot 從簡單的助手轉變為主動的數字工作者,能夠以最少的人工干預完成端到端的業務流程。
與競爭對手的定位
Microsoft 的這一舉措似乎是對其他 AI 公司類似產品的直接回應。該功能與 OpenAI 的 Operator 和 Anthropic 的 Claude 電腦使用功能非常相似,這兩者都允許 AI 代理與數字介面互動。然而,Microsoft 透過 Copilot Studio 實現的功能似乎專為商業環境量身定製,這可能使其在 Microsoft 已經保持強勢地位的企業採用方面具有優勢。
競爭格局:
- Microsoft Copilot Studio "電腦使用功能" - 面向商業的AI自動化
- OpenAI 的 Operator - 具有類似的自主任務完成功能
- Claude 的 "電腦使用功能" - Anthropic 版本的介面互動能力
- Microsoft Copilot Actions - 面向消費者,有限的合作伙伴整合
擴充套件 Copilot 生態系統
這一發展建立在 Microsoft 早期為面向消費者的 Copilot 引入 Actions 的基礎上。雖然 Actions 允許個人使用者讓 Copilot 執行後臺任務,如預訂餐廳或購買活動門票,但目前僅限於特定的合作伙伴整合。新的 Copilot Studio 功能似乎更加靈活,允許企業使用者建立能夠與更廣泛的網站和應用程式合作的 AI 代理,而無需預先建立合作伙伴關係。
AI 自動化的未來
Microsoft 對 Copilot Studio 的增強代表了向能夠處理複雜工作流程的完全自主 AI 系統邁出的又一步。隨著這些技術的不斷成熟,我們可以預期在尋求自動化常規任務並使人類工作者能夠專注於更具創造性和戰略性活動的各行業中,這些技術的採用將會增加。這一發展也表明 Microsoft 致力於在快速發展的 AI 市場中保持競爭地位,在這個市場中,執行實際、現實世界任務的能力與自然語言處理能力一樣重要。