在人工智慧不斷發展的領域中,一項引人入勝的實驗已經出現:使用大語言模型自主玩 Pokemon FireRed。這個被稱為 Fire Red Agent 的專案引發了關於遊戲AI最有效方法的討論,以及對娛樂產業更廣泛的影響。
Fire Red Agent 專案
Fire Red Agent 專案代表了一次雄心勃勃的嘗試,讓大語言模型自主玩 Pokemon FireRed。開發者將大語言模型與遊戲模擬器整合,實現了記憶體讀取、導航、路徑尋找和戰鬥處理系統。儘管在 RetroArch 模擬器的程式化輸入控制方面遇到了技術障礙,該專案仍然展示了大語言模型在沒有專門訓練的情況下理解和導航複雜遊戲環境的潛力。
這個專案特別有趣的地方在於開發者將其視為電視的未來——將AI遊戲定位為娛樂內容而非僅僅是技術演示。這一觀點暗示了一種新形式的互動媒體,其中AI代理成為觀眾可以觀看並可能影響的表演者。
Fire Red Agent 的關鍵元件
- 模擬器整合
- 遊戲記憶體管理
- 導航與尋路
- 遊戲文字解析
- LLM 整合(使用 GPT-4o)
- 戰鬥處理
- 互動與對話處理
AI 寶可夢專案比較
專案 | 技術 | 進展 |
---|---|---|
Fire Red Agent | LLM (GPT-4o) | 由於輸入控制問題暫停開發 |
Claude Plays Pokemon | Claude 3.7 LLM | 擊敗了 Lt. Surge,解決了道館謎題 |
AI Plays Pokemon | CNN 和強化學習 | 經過數月迭代後到達了 Mt. Moon |
大語言模型對比傳統AI方法
社群討論揭示了關於大語言模型是否是此類任務的最佳工具的重要爭論。一些評論者指出,使用路徑尋找器、行為樹和麵向目標的行動規劃(GOAP)的傳統AI方法可以比大語言模型更高效、更有效地玩 Pokemon。
「我想指出,如果你真的想讓AI玩 Pokemon,你可以使用比大語言模型簡單得多且成本更低的AI,它會玩得更好,這使得這主要是一個過度複雜化簡單事物的練習。」
然而,大語言模型方法的支持者強調,價值不在於最佳化而在於泛化。Claude 3.7 可以在沒有專門設計的情況下有效地玩 Pokemon,這展示了AGI(通用人工智慧)中的G。與在一項任務上表現出色但在其他任務上失敗的專用系統不同,大語言模型在各種挑戰中表現出適應性——這是通用智慧的關鍵特徵。
Claude 玩 Pokemon 和技術實現
討論還提到了另一個專案 Claude Plays Pokemon,該專案似乎在遊戲中取得了重大進展。社群猜測集中在這個實現如何處理遊戲資料——是透過直接解析記憶體還是將原始RAM資料提供給大語言模型。Claude 專案據報道已經通過了 Mt. Moon 並擊敗了 Lt. Surge,展示了基於大語言模型方法的令人印象深刻的能力。
與之前使用卷積神經網路和強化學習的AI Pokemon專案相比,這一成就尤為顯著,據報道那些專案花費了數月的迭代和大量計算資源才能到達 Mt. Moon。
娛樂價值主張
這些專案最引人入勝的方面可能是它們的娛樂潛力。Fire Red Agent 開發者設想了一個系統,AI在自動駕駛模式下玩遊戲,同時融入觀眾的建議,創造互動娛樂體驗。一些評論者將這一願景擴充套件到包括AI機器人角鬥士風格的戰鬥,或由人類教練管理的AI團隊之間的競技遊戲。
這一觀點將AI遊戲從純粹的技術挑戰重新定位為一種娛樂製作形式,可能創造出新類別的媒體,其中人工代理成為表演者,而人類成為其行為的導演或影響者。
隨著大語言模型能力的不斷提高,我們可能會看到更多模糊AI研究、遊戲和娛樂之間界限的實驗。觀看機器人玩 Pokemon 是否會成為電視的未來還有待觀察,但這些專案肯定指向了我們在未來幾年中可能如何與人工智慧互動並從中獲得娛樂的有趣可能性。