像 ChatGPT 這樣的AI工具的快速普及引發了關於其在工作場所變革潛力的爭論。雖然科技傳道者宣告生產力新時代的到來,但最近的研究揭示了一個更為微妙的現實,即AI的影響在不同環境和實施方法中差異顯著。
初創公司中氛圍程式設計的興起
一種被稱為氛圍程式設計(vibe coding)的新現象在初創生態系統中獲得了關注,特別是在 Y Combinator 支援的公司中。這種方法涉及使用像 ChatGPT 這樣的大型語言模型,透過自然語言提示生成程式碼,有效地將意圖轉化為功能性軟體,而幾乎不需要傳統的程式設計知識。根據 Y Combinator 的CEO Garry Tan 的說法,在他們最近一批公司中,約25%的公司使用AI生成95%或更多的程式碼,一些初創公司的增長率達到每週10%。該加速器最新一批的公司嚴重傾向於基於AI的企業,其中約80%的公司押注大型語言模型可以處理他們大部分的開發工作。
Y Combinator AI 採用情況
- 最近一批公司中有25%使用AI生成95%以上的程式碼
- 80%的佇列專注於基於AI的創業專案
- 一些初創公司實現了每週10%的增長率
現實檢驗:基準測試顯示侷限性
儘管熱情高漲,但基準測試對AI的編碼能力講述了一個更為謹慎的故事。像 SWE-Bench 和 SWE-PolyBench 這樣的工具在數百個程式設計任務和錯誤修復場景上測試AI模型。雖然效能有了顯著提高——從2023年透過 SWE-Bench 約5%的挑戰到如今超過60%——但在不同測試框架中結果差異顯著。在 Amazon 的 SWE-PolyBench 上,頂級模型僅解決了22.6%的問題,而在 Artificial Analysis 的編碼指數上,最佳模型得分為63,相比之下其數學指數得分為96。這表明AI在數學公式方面仍然優於功能性程式碼開發。
AI 程式設計基準測試表現
- SWE-Bench:頂級模型現在透過超過60%的挑戰(相比2023年的5%有所提高)
- Amazon 的 SWE-PolyBench:頂級模型僅解決22.6%的問題
- Artificial Analysis 程式設計指數:最佳模型得分為63(相比數學指數的96分)
對工作場所生產力的影響微小
美國國家經濟研究局的一項開創性研究檢查了AI聊天機器人在丹麥7,000個工作場所的使用情況,發現生產力提升令人驚訝地微小。經濟學家 Anders Humlum 和 Emilie Vestergaard 分析了25,000名工作者,涵蓋被認為容易受到AI干擾的職業,包括會計師、軟體開發人員和營銷專業人士。他們的發現顯示,AI使用者平均僅節省了約3%的時間,而這些生產力提升中只有3%-7%轉化為更高的薪酬。該研究得出結論,AI聊天機器人對任何職業的收入或記錄工時都沒有顯著影響。
AI生產力影響(NBER研究)
- 平均節省時間:3%
- 傳遞給工人作為更高薪酬的生產力提升:3-7%
- 工人分配節省的時間:>80%用於其他工作任務,<10%用於休息/休閒
程式設計的民主化
儘管存在這些侷限性,AI編碼工具正在透過使非程式設計師能夠構建功能性應用程式來民主化軟體開發。業餘編碼者現在可以使用 ChatGPT 建立基本遊戲或模擬,AI可以在第一次嘗試時生成工作程式碼並實施所請求的升級。這種可訪問性可能會釋放藝術家、企業家和其他以前缺乏正式程式設計培訓的人群中大量潛在的軟體創作需求。
除錯仍然是關鍵瓶頸
AI生成程式碼的一個重大挑戰是除錯。當AI生成的程式碼出現問題時,解決方案並不總是顯而易見的——即使對AI本身也是如此。Microsoft 正透過 Debug-Gym 解決這個問題,這是一個訓練系統,旨在幫助大型語言模型學習類似於人類開發者的除錯方法,使用多步驟推理而不是模式匹配。雖然早期測試顯示有所改進,但專家認為,強大的除錯仍然需要人類監督。程式碼生成變得更容易也帶來了數量問題,更多的程式碼被生產出來,但沒有經過仔細的文件記錄或審查。
實施比技術更重要
美國國家經濟研究局的研究強調,組織因素顯著影響AI的影響。在僱主積極鼓勵AI使用並培訓工人的工作場所,生產力提升更為顯著。許多員工在沒有管理層明確認可的情況下使用AI工具,這限制了利用提高的生產力進行職業發展或薪酬談判的機會。此外,工人可能會猶豫是否宣傳他們的AI增強生產力,因為擔心僅僅被分配更多的工作而沒有額外的補償。
企業採用由FOMO驅動
IBM 對2,000名CEO的調查顯示,只有25%的AI專案實現了其承諾的投資回報。儘管如此,近三分之二的CEO承認,落後的風險驅使他們在尚未清楚瞭解技術為組織帶來的價值之前就投資於某些技術。這表明,企業AI採用往往更多地由害怕錯過(FOMO)而非已證明的價值驅動。
轉型的漫長道路
諾貝爾獎得主 Daron Acemoglu 估計,AI在未來十年將提升生產力約1.1%至1.6%的GDP——對像美國這樣的發達經濟體來說是顯著的,但遠遠不及一些技術專家預測的GDP翻倍的變革性影響。與之前的技術革命一樣,實現AI的全部潛力將需要組織調整、配套投資以及透過培訓和在職學習提高工人技能。工業革命是在幾十年而非一夜之間改變社會的,AI的影響可能會遵循類似的軌跡。