GPU 市場正在經歷潛在的顛覆,初創公司 Bolt Graphics 帶著其新型基於 RISC-V 的 Zeus GPU 平臺發出了大膽的宣告。在這個由 Nvidia、AMD 和 Intel 三大巨頭主導的行業中,這家來自加利福尼亞的新公司承諾在特定工作負載上提供前所未有的效能,特別是在路徑追蹤渲染方面,它聲稱比 Nvidia 旗艦產品 GeForce RTX 5090 快十倍。
基於 RISC-V 的革命性架構
Bolt Graphics 採用了一種根本不同的 GPU 設計方法。與已建立的廠商使用的專有架構不同,Zeus GPU 是基於開源 RISC-V 指令集架構構建的。它採用了亂序執行的 RVA23 標量核心,結合 FP64 ALU 和 RISC-V 向量擴充套件版本 1.0,支援從 8 位到 64 位的各種資料型別。該公司還實施了專門設計用於加速科學工作負載的專有擴充套件。
Zeus 特別有趣的是其基於晶片組的設計。入門級 Zeus 1c26-032 配備單個處理單元,而更高階的配置如 Zeus 2c26-064/128 和 Zeus 4c26-256 分別整合了兩個和四個處理單元。這種模組化方法允許 Bolt 在保持功率效率的同時顯著提升效能。
專為路徑追蹤和科學計算最佳化
Zeus 似乎是專為路徑追蹤渲染和計算密集型科學應用而設計,而非傳統遊戲。與傳統 GPU 不同,Zeus 不包括傳統的固定功能圖形硬體,如紋理單元(TMU)和光柵操作單元(ROP),而是依靠計算著色器進行紋理取樣和圖形輸出。這種設計選擇為計算元素分配了更多的矽晶面積,優化了 GPU 的目標工作負載。
為了利用其硬體能力,Bolt 開發了自己的路徑追蹤渲染引擎,名為 Glowstick。該公司聲稱這種內部解決方案在單晶片變體上比現有解決方案快 2.5 倍,在多個 GPU 上的效能擴充套件更大。
效能宣告和規格
根據 Bolt Graphics 的說法,即使是入門級的單晶片 Zeus 1c26-32 在 FP64 計算(5 TFLOPS 對比 1.6 TFLOPS)和路徑追蹤(77 Gigarays 對比 32 Gigarays)方面也明顯優於 Nvidia 的 GeForce RTX 5090。Zeus 還具有更大的片上快取(128 MB 對比 120 MB),同時消耗的功率大大降低(120W 對比 575W)。
然而,RTX 5090 在 AI 工作負載方面保持明顯優勢,FP16 TFLOPS 為 105,INT8 TFLOPS 為 1,637,而 Zeus 的 FP16 TFLOPS 為 10,INT8 TFLOPS 為 614。對於以 FP32 效能衡量的傳統渲染任務,Zeus 的 10 TFLOPS 將遠遠落後於 RTX 5090 的 105 TFLOPS。
最強大的 Zeus 配置,四晶片組 4c26-256,是為伺服器實現而設計,而非作為獨立顯示卡。它集成了四個處理單元、四個 I/O 晶片組、256 GB LPDDR5X 記憶體,並支援高達 2 TB 的 DDR5 記憶體。這種變體專門針對電磁場建模、光子學研究和 FFT 計算進行了最佳化。
Zeus GPU 配置
型號 | 處理單元 | 記憶體 | 功耗 |
---|---|---|---|
Zeus 1c26-032 | 1 | 32 GB LPDDR5X + 最高 128 GB DDR5 | 120W |
Zeus 2c26-064/128 | 2 | 64/128 GB LPDDR5X | 未指定 |
Zeus 4c26-256 | 4 | 256 GB LPDDR5X + 最高 2 TB DDR5 | 低於 575W |
效能對比(單晶片 Zeus 與 RTX 5090)
指標 | Zeus 1c26-32 | RTX 5090 |
---|---|---|
路徑追蹤 | 77 Gigarays | 32 Gigarays |
FP64 計算能力 | 5 TFLOPS | 1.6 TFLOPS |
FP32 計算能力 | 10 TFLOPS | 105 TFLOPS |
FP16 計算能力 | 10 TFLOPS | 105 TFLOPS |
INT8 計算能力 | 614 TFLOPS | 1,637 TFLOPS |
片上快取 | 128 MB | 120 MB |
功耗 | 120W | 575W |
記憶體和連線創新
Zeus 採用了非傳統的記憶體架構方法,優先考慮容量而非頻寬,以處理更大的資料集。入門級型號結合了 32 GB LPDDR5X 記憶體(273 GB/s)和透過兩個 SO-DIMM 提供的高達 128 GB DDR5 記憶體(80 GB/s)。這種混合記憶體系統可能為大規模模擬和渲染任務提供顯著優勢。
另一個獨特特點是 Zeus 內建的網路功能。每個 GPU 包括一個 I/O 晶片組,配有支援 400GbE/800GbE 的 QSFP-DD 埠、兩個具有 CXL 3.0 的 PCIe Gen5 x16 插槽(實現多卡之間的高效記憶體共享),以及用於 BMC 的 GbE 埠。這些網路功能明確將 Zeus 定位於需要多個 GPU 高效通訊的資料中心應用。
軟體生態系統挑戰
儘管硬體規格令人印象深刻,但 Bolt Graphics 在軟體支援方面面臨重大挑戰。與 Nvidia 成熟的 CUDA 生態系統或 AMD 的 ROCm 不同,Zeus 缺乏已建立的軟體平臺。雖然其 RISC-V 基礎可能利用現有的開源工具和庫,但廣泛採用將取決於 Bolt 提供強大開發者支援的能力。
目前尚不清楚 Zeus 是否將支援行業標準框架,如 OpenCL、Vulkan 或 CUDA 翻譯層——這些是在專業和科學計算市場獲得牽引力的必要元件。該公司內部的 Glowstick 路徑追蹤引擎顯示出前景,但更廣泛的軟體相容性將是成功的關鍵。
市場定位和可用性
Bolt Graphics 的目標是專業渲染和科學計算市場,而非消費級遊戲市場。該公司計劃在 2025 年底釋出開發者套件,全面生產計劃在 2026 年底。這一時間表給軟體開發者提供了時間來適應新架構。
雖然 Zeus 可能不會在遊戲市場上挑戰 Nvidia,但其專注於路徑追蹤和科學計算的特點可能會開闢一個有價值的利基市場。如果該公司兌現其效能承諾並開發足夠的軟體支援,Zeus 可能成為特定高效能計算應用的有力替代品,特別是那些涉及渲染農場和科學模擬的應用。