遞迴 LLM 提示的概念可以追溯到至少2023年4月,已經從學術探索發展成為多個商業AI產品背後的基礎技術。正如社群討論所示,我們正在見證理論觀念以驚人的速度轉變為實際應用。
從理論到實踐
最初作為一種使用英語作為程式語言和 LLM 作為執行環境來實現遞迴的實驗方法,現在已成為現代AI系統不可或缺的一部分。這種技術涉及建立能生成略微更新版本的自身的提示,有效地在迭代之間維持狀態,同時朝著解決方案努力。正如一位評論者所說:
「我認為這與推理迴圈是一樣的。這是我在本地專案中快速編寫偽推理迴圈所使用的方法。在另一個討論中有人問我如何讓 LLM 生成整本書,嗯,就是這樣。」
這種實際應用突顯了遞迴提示如何從理論興趣發展成為真正的開發技術。
![]() |
---|
這個介面展示了遞迴提示如何透過結構化推理有效解決數學問題 |
商業採用和代幣經濟學
社群討論揭示了遞迴提示的一個有趣的經濟維度。幾位評論者指出,AI公司有強烈的財務動機來推廣基於代理的方法和利用遞迴提示的工具,因為它們顯著增加了代幣使用量。在一個提示和幾百個代幣就能完成的任務,當實現為遞迴系統時,往往會變成數十個提示和數千個代幣。
這一觀察在當前時機尤為相關,評論者注意到 OpenAI 直到2024年9月才推出了他們的基於代理的系統 o1,儘管這些想法已經被探索多年。概念開發和商業實施之間的差距展示了該領域的快速發展。
遞迴式LLM提示的關鍵概念
- 基本機制:生成自身更新版本的提示
- 狀態管理:在迭代過程中維持變數
- 應用場景:問題解決、內容生成(書籍等)
- 商業案例:如 Cursor 等工具,OpenAI 的 o1(2024年9月推出)
- 歷史背景:最早記錄的實現至少可追溯到2023年4月
- 經濟因素:與單一提示方法相比增加了token使用量
侷限性和替代方案
儘管熱情高漲,社群對使用 LLM 進行某些任務的侷限性仍持務實態度。例如,數學問題和引用工作常被強調為專用軟體可能比基於 LLM 的方法更有效的領域。這種實用的觀點表明,雖然遞迴提示開闢了新的可能性,但它並不總是最佳解決方案。
討論還觸及了更多實驗性概念,如建立 LLM quines(自我複製程式)並證明迭代 LLM 是圖靈完備的,這表明這些技術的理論探索與其商業應用同步進行。
隨著遞迴提示技術從學術好奇發展為商業產品,我們正在見證僅僅兩年前看似純理論的想法的實際實現。這種演變的速度強調了AI能力如何迅速發展並被貨幣化,即使研究人員繼續探索其理論極限和實際應用。
![]() |
---|
這個終端輸出展示了在 LLM 實驗中可能出現的數值結果,突顯了此類模型在數學任務中的實際侷限性 |