在一個將復古遊戲和前沿AI技術創新融合的專案中,一位開發者建立了 xPong,這是經典 Pong 遊戲的重新構想版本,它具有即時LLM生成的解說功能。這個實驗性專案展示了大型語言模型如何在不久的將來改變遊戲體驗和體育廣播。
AI解說管道展示了超越簡單遊戲的潛力
xPong 專案實現了一個複雜的基於事件的管道,它收集遊戲事件、生成指標、確定解說主題優先順序,並在近即時的情況下傳遞合成語音。雖然 Pong 的簡單性限制了可能的解說深度,但社群已經認識到該系統在更復雜應用中的潛力。開發者解釋說,收集事件、定期從中生成指標、確定優先順序、生成解說文字、將這些輸出排隊,然後合成語音的方法形成了一個強大的基礎,可以應用於更復雜的遊戲。
許多評論者建議,像國際象棋、德州撲克或電子競技遊戲如 Rocket League 和 League of Legends 這樣狀態空間更豐富的遊戲將從這項技術中獲益匪淺。一位使用者甚至分享說,他們已經在2024年底為 Rocket League 實現了一個互動式解說員,同時這個解說員還是你的雙人搭檔。
遊戲之外的潛在應用
- 電子競技直播解說( League of Legends 、 Rocket League )
- 國際象棋和撲克牌評論
- 工作場所程式設計會話解說
- 教育工具
- 體育模擬遊戲
透過模擬歷史建立真實的體育敘事
xPong 的與眾不同之處在於它建立了豐富的歷史背景。該系統模擬了15年的錦標賽歷史,有64名選手每年參加四場主要錦標賽,所有這些都使用ELO評級進行跟蹤。這種模擬歷史為更具吸引力的解說創造了基礎,可以引用過去的比賽、選手之間的競爭關係和職業生涯軌跡。
「資料本身並不有趣 - 你還需要好的指標來創造有趣的關聯!指標不必完美,畢竟,人類也不完美。關鍵是參與度。」
開發者使用基於KD樹的最近鄰搜尋來高效地找到類似的歷史比賽,使解說能夠在當前遊戲和過去的錦標賽之間建立聯絡。這種方法展示了AI解說如何即使在簡單的遊戲環境中也能創造引人入勝的敘事。
xPong 技術實現
- 使用 OpenAI 的
gpt-4o-mini-tts
進行即時解說生成 - 三層解說系統:開場解說、比賽中的逐球解說和結束解說
- 基於事件的解說生成流程
- 模擬15年的比賽歷史,採用 ELO 評分系統對選手進行排名
- 使用最近鄰搜尋來引用類似的歷史比賽
- 使用 Python 和 Eel(類似 Electron 的庫)構建
技術挑戰和未來應用
使用者識別的主要限制是延遲——遊戲內動作與相應解說之間由於處理開銷而產生的延遲。對於快節奏的遊戲,這可能導致解說落後於實際動作。一些評論者建議解決方案,如使用指標聚合而不是精確數字,並實施流水線技術以將明顯的延遲減少到500毫秒以下。
除了遊戲之外,社群還設想了類似AI解說系統的創意應用,包括以體育解說員或自然紀錄片解說員風格講述編碼會話的工作場所伴侶,以及可以用詳細統計洞察補充人類解說員的增強型電子競技廣播。
隨著AI語音合成和語言模型的不斷改進,xPong 中展示的技術可能很快就會進入主流遊戲和廣播領域。像 Madden NFL 和 NBA 2K 這樣已經具有複雜預錄解說系統的主要體育遊戲特許經營權,最終可能會整合動態AI解說,以創造更具沉浸感且不會重複相同臺詞的體驗。
xPong 實驗雖然執行簡單,但它讓我們一瞥AI生成解說如何不僅改變我們玩遊戲的方式,還可能改變我們在未來體驗所有形式的競爭和娛樂的方式。
參考:xPong