Meta最近推出了其大型語言模型(LLM)的最新版本Llama 3,展示了相比前代產品的顯著效能提升。然而,Meta的AI負責人Yann LeCun對這項技術的最終潛力抱有保留態度。
Llama 3:一大躍進
Llama 3有兩個版本:
- 80億引數模型
- 700億引數模型
8B版本更適合在標準桌面或膝上型電腦上執行,並展現出顯著的改進:
- 比Llama 2的7B版本好34%
- 比Llama 2的13B版本好14%
- 僅比Llama 2的70B版本落後8%
這個較小的模型使用了130萬小時的GPU時間進行訓練,突顯了AI開發所需的巨大計算資源。
在本地執行Llama 3
對於那些有興趣體驗Llama 3的人來說,有幾種在個人電腦上執行的選擇:
- LM Studio:適用於Windows和Mac(M1、M2、M3處理器),Linux版本處於測試階段。
- Ollama:支援Mac、Windows、Linux,甚至Raspberry Pi。
這些工具允許使用者直接在自己的裝置上與Llama 3互動,為AI實驗和應用開闢了新的可能性。
大型語言模型的侷限性
儘管取得了這些進展,Meta的AI負責人Yann LeCun對Llama 3和ChatGPT等LLM的最終潛力表示懷疑。在最近的一次採訪中,LeCun表示,由於一些根本性的限制,這些模型將無法達到人類的智慧水平:
- 對邏輯的理解有限
- 缺乏永續性記憶
- 不瞭解物理世界
- 無法進行層級規劃
LeCun認為,LLM本質上是不安全的,只有在提供正確的訓練資料時才能準確。
Meta未來的AI方向
Meta的AI研究團隊不僅專注於LLM,還在探索一種稱為世界建模的新方法。這種方法旨在建立能夠像人類一樣理解世界的AI系統,可能會帶來更先進和更強大的AI。
LeCun估計,使用這種方法達到人類水平的AI可能需要10年時間,這表明公司對推動人工智慧發展的長期承諾。
投資者反應和未來展望
Meta在AI方面的大量投資引發了投資者的不同反應。在CEO Mark Zuckerberg宣佈增加AI支出計劃後,公司最近市值蒸發了近2000億美元。然而,Zuckerberg仍然對AI的長期潛力充滿信心,將其比作之前成功的先建設後變現策略,如Reels和Stories。
隨著Meta在AI競賽中繼續前進,科技界密切關注Llama 3和未來的創新將如何塑造人工智慧的格局。