AI 驅動的程式碼洗白計畫暴露開源軟體漏洞

BigGo 社群部
AI 驅動的程式碼洗白計畫暴露開源軟體漏洞

一個令人擔憂的案例浮出水面,據稱有人利用人工智慧系統性地複製和重新包裝多個開源專案,且未提供適當的歸屬聲明。這起事件涉及一家名為 Inspacs 的公司,據報導該公司使用 AI 從多個專案中提取程式碼,包括 rEFul、refurbish 和 undom-ng,並將它們重新包裝在其 inspatial-kit 品牌下。

原始開發者 ClassicOldSong 發現他們的作品被複製並重新授權在一個名為 Intentional-1.0 的專有授權條款下,該條款限制商業使用——這直接違反了原始的 MIT 和 Apache-2.0 授權條款,這些條款要求歸屬聲明和版權保留。這個案例特別令人擔憂的是,從程式碼複製到生成文件,甚至是製作致謝檔案,整個過程都明顯使用了 AI。

受影響的專案與授權條款違規情況

套件 原始來源 授權條款 複製證據 是否移除授權條款
@inspatial/run rEFul Apache-2.0 逐行複製 signals、HMR、控制流程
@inspatial/view undom-ng MIT DOM 工廠僅重新命名變數
@inspatial/test Deno std: assert MIT 相同的斷言函數
@inspatial/theme chalk/kleur + ansi-regex MIT 相同的 ANSI 代碼模式
@inspatial/type ArkType MIT 大量匯入並重新匯出
@inspatial/cloud-client mime-types/mime-db MIT 相同的 JSON 副檔名對應表

AI 在程式碼竊取中的指紋特徵

證據顯示這不是傳統的人為抄襲,而是 AI 輔助的程式碼洗白。肇事者持續拼錯專案名稱,在文件中大量使用表情符號,並且對複製的程式碼表現出根本性的理解不足。當被要求修復其 AI 生成實作中的基本錯誤時,他們無法解釋問題所在或如何修復,這顯示他們持續依賴 AI 工具而非真正的理解。

GPT-3 的詳細分析揭示了跨多個套件的系統性複製,整個模組被完整匯入,然後被重構以重新命名識別符並移除授權標頭。提交歷史顯示大量的初始提交一次性添加了數千行程式碼,隨後是表面性的更改——這是大量 AI 輔助複製的典型模式。

社群面對新現實的掙扎

開發者社群正在努力應對 AI 驅動程式碼竊取的影響。有些人認為這是不可避免的演進,主張 AI 只是讓世界的程式碼庫變成一個巨大的函式庫。其他人則擔心權力集中在 AI 公司手中,以及開源原則的侵蝕。

「這就是新現實。如果資產在網路上,現在就屬於大型實驗室。網路加上 AI 意味著數位世界中公地悲劇的體現。」

這起事件突顯了一個日益嚴重的擔憂:雖然人類從現有程式碼中學習是被接受的做法,但 AI 的運作規模可以同時處理和複製數千個專案。與經常透過新創新回饋社群的人類開發者不同,AI 輔助的複製可能只是提取價值而不回饋。

事件時間軸

  • 2025年5月28日:首次接觸,表達對 ClassicOldSong 作品的讚賞
  • 2025年6月3-4日:首次對技術理解能力產生懷疑
  • 2025年6月29-30日:提出合作提案並做出雄心勃勃的承諾
  • 2025年7月21日:請求 Deno 模板工作
  • 2025年7月24日:推出「inspatial/run」- 重新包裝的 rEFul 與 AI 生成代碼
  • 2025年7月29日:技術錯誤被突顯,對能力的質疑浮現

法律和倫理影響

這個案例暴露了現有版權法在處理 AI 輔助侵權方面的重大漏洞。系統性移除授權標頭並在限制性條款下重新授權,違反了 Apache-2.0 和 MIT 授權條款的要求。然而,當 AI 被用作複製過程中的中介時,執法變得複雜。

這起事件為開源維護者敲響了警鐘,提醒他們考慮自己的作品可能如何容易受到 AI 輔助盜用的影響。雖然一些開發者歡迎 AI 從他們的程式碼中學習,但缺乏歸屬聲明和專有重新授權跨越了社群仍在定義的倫理界線。

隨著 AI 能力持續擴展,開源生態系統可能需要新的框架來保護創作者,同時保持推動創新的協作精神。在促進 AI 發展和保護智慧財產權之間取得平衡,仍然是一個未解決的挑戰,這可能會塑造軟體開發的未來。

參考資料:Hall of Shame