在人工智慧能力的重大進展中,Anthropic 推出了其最新的人工智慧模型,將快速響應與深度分析能力相結合。此次釋出標誌著人工智慧模型在處理複雜問題解決任務方面的戰略性轉變。
![]() |
---|
一張展示各種人工智慧模型在複雜任務中表現的對比圖,重點突出了新 Claude 模型的進步 |
引入混合推理技術
Claude 3.7 Sonnet 引入了突破性的混合推理方法,使模型能夠在快速響應和詳細分析思維之間自如切換。這種創新設計消除了對獨立推理模型的需求,簡化了使用者的人工智慧使用體驗。該模型保持穩定的價格,輸入每百萬字元收費3美元,輸出每百萬字元收費15美元,使用者可透過 Anthropic 的API、Amazon Bedrock 和 Google Cloud 的 Vertix AI 等多個平臺訪問。
特性 | 規格 |
---|---|
定價 | 輸入:每百萬 token 3美元 |
輸出:每百萬 token 15美元 | |
知識截止日期 | 2024年10月 |
平臺可用性 | - Anthropic API |
- Amazon Bedrock | |
- Google Cloud Vertix AI | |
Token 限制 | 輸出限制為128K tokens |
多領域效能提升
新模型在多個專業領域展現出顯著改進,特別是在主動程式設計、金融和法律任務方面。Anthropic 已將模型的知識截止日期更新至2024年10月,確保資訊更加及時。值得注意的是,開發者可以透過草稿功能控制模型的響應時間和思維過程,實現前所未有的人工智慧行為定製。
主要改進:
- 不必要的請求拒絕率降低45%
- 在智慧代理程式設計、金融和法律任務方面的效能提升
- 戰略決策能力的改進
- 程式碼操作和測試能力的提升
![]() |
---|
展示各種人工智慧模型準確性的效能指標,突顯了 Claude 37 Sonnet 所取得的進步 |
Claude Code:人工智慧程式設計新紀元
隨著主要模型的釋出,Anthropic 同時推出了 Claude Code,這是一款目前處於有限研究預覽階段的sophisticated程式設計工具。該工具代表著人工智慧輔助程式設計的重大進步,能夠處理程式碼庫搜尋、測試管理和 GitHub 介面等複雜任務。早期測試顯示出令人印象深刻的能力,該工具成功完成了通常需要人類45分鐘或更長時間才能完成的程式設計任務。
實際應用與測試
Anthropic 的內部測試揭示了該模型的多功能性,從構建前端網站設計到建立互動式遊戲都表現出色。公司採用了創新的測試方法,使用寶可夢影片遊戲進行測試,其中 Claude 3.7 Sonnet 展示了卓越的戰略思維,比其前代版本取得更大進展,成功擊敗多個道館館主——這比無法透過初始區域的3.5版本有了顯著提升。
![]() |
---|
一張展示 Claude 模型在 Pokémon 遊戲中進步的圖表,展示了與早期版本相比在策略能力方面的提升 |
安全性和可靠性改進
新模型在區分合法和惡意請求方面表現更佳,與前代相比,不必要的請求拒絕率降低了45%。這一改進透過與外部安全專家的合作實現,在保持強大安全措施的同時,顯著提升了使用者體驗。