AMD 揭開了其下一代圖形架構的面紗,展示了即將推出的 Radeon RX 9000 系列的技術基礎。RDNA 4 架構代表了 AMD GPU 設計理念的重大演進,重新聚焦於遊戲效能,同時大幅提升光線追蹤能力和 AI 處理效能。
以遊戲為先的架構
AMD 的 RDNA 4 是從零開始設計的,將遊戲玩家作為主要受眾。與之前試圖平衡遊戲和專業工作負載的世代不同,RDNA 4 專注於高階遊戲效能。該架構引入了高度最佳化的計算單元,與 RDNA 2 相比,光柵化效能提升了高達 2 倍,而在光線追蹤(2.5 倍)和機器學習(3.5 倍)等專業工作負載方面,每個計算單元的效能提升更為顯著。
RDNA 4 關鍵改進
- 光柵化:每計算單元相比 RDNA 2 提升最高可達2倍
- 光線追蹤:每計算單元相比 RDNA 2 提升最高可達2.5倍
- 機器學習效能:在 FP16 密集矩陣工作負載中,每計算單元相比 RDNA 2 提升最高可達3.5倍
- 光線遍歷:在相同時鐘頻率下,效能是 RDNA 3 的2倍
- BVH 記憶體需求:與 RDNA 3 相比減少至不到60%
全新計算引擎設計
RDNA 4 的核心是重新設計的計算引擎,具有雙 SIMD32 向量單元和增強的矩陣運算能力。這些單元支援多種精度格式,包括 2x-16b 和 4x-8b/4b 密集矩陣速率,以及用於雙倍處理速率的 4:2 結構化稀疏性。一個值得注意的創新是動態暫存器分配系統,它允許著色器根據需要從共享池中請求暫存器,並在工作完成後釋放它們。這種方法顯著改善了記憶體延遲處理,提高了共享核心的整體效率。
第三代光線追蹤
或許最令人印象深刻的改進來自光線追蹤部門,AMD 實現了第三代光線追蹤單元,在相同時鐘速度和頻寬下,光線相交率比 RDNA 3 提高了一倍。新的光線加速器具有改進的 BVH(邊界體層次結構)壓縮,將記憶體需求降低到 RDNA 3 所需的不到 60%,這要歸功於新的 8 寬設計。其他增強功能包括硬體例項變換、改進的 RT 堆疊管理和定向邊界框,可將遍歷成本降低多達 10%。
路徑追蹤能力
AMD 還將 RDNA 4 定位於支援未來的渲染技術——路徑追蹤。光線追蹤會投射單一主光線用於反射、陰影和折射,而路徑追蹤則考慮所有可能的光路,以更高的計算成本建立更加逼真的場景。為了使這一技術實用化,AMD 正在實施專為路徑追蹤工作負載最佳化的神經超取樣和去噪技術,類似於 NVIDIA 在《賽博朋克 2077》和《心靈殺手 II》等遊戲中採用的方法。
FSR 4:AMD 的 AI 驅動升級解決方案
與硬體公告一同釋出的還有 FSR 4,AMD 的下一代升級技術。與之前使用空間或時間演算法的 FSR 版本不同,FSR 4 利用 RDNA 4 中的新 FP8 處理能力,透過機器學習提升效能。在 CES 上的早期演示顯示,與 FSR 3.1 相比有顯著改進,特別是在效能模式下,之前的版本在低渲染解析度下影像質量較差。
![]() |
---|
展示 AMD 的 FSR 4 技術所帶來的改進的升級方法比較 |
FSR 4 實施和效能
在釋出時,FSR 4 將在驅動程式級別整合,自動將支援 FSR 3.1 的任何遊戲升級為使用新的基於 AI 的升級演算法。AMD 聲稱,在七款測試遊戲中,FSR 4 的效能模式比原生 4K 渲染提供了 65% 的效能提升,而像《瑞奇與叮噹:時空裂縫》這樣的遊戲效能甚至翻了一番。該技術將在釋出時支援 30 多款遊戲,包括《天國:拯救 2》、《蜘蛛俠 2》和《使命召喚:黑色行動 6》等主要遊戲。
FSR 4 效能宣告
- 整體:相比原生4K渲染效能提升65%(基於7款遊戲的平均值)
- 《瑞奇與叮噹:時空裂縫》:效能提升100%(2倍提升)
- 《地平線:零之曙光 重製版》:效能提升38%
- 首發支援:超過30款遊戲,包括《天國:拯救2》、《蜘蛛俠2》和《使命召喚:黑色行動6》
硬體規格
RDNA 4 旗艦 GPU(代號 Navi 48)採用 TSMC 4nm 工藝製造,擁有 539 億電晶體,芯片面積為 356.5mm²。該晶片包含四個著色器引擎,每個引擎包含八個雙計算單元(DCUs),總共 64 個計算單元和 4,096 個流處理器。該架構包括分佈在著色器引擎中的 64 個光線加速器引擎和 128 個矩陣加速引擎。記憶體支援包括最高 16GB GDDR6 記憶體,速度高達 20 Gbps,256 位匯流排介面,並配有最高 64MB 的第三代 Infinity Cache。
Navi 48(RX 9070 XT)規格引數
- 製造工藝:TSMC 4nm
- 電晶體數量:539億
- 芯片面積:356.5平方毫米
- 計算單元:64個CU(4,096個流處理器)
- 光線加速器:64個RA
- 矩陣加速引擎:128個MA
- 視訊記憶體:最高16GB GDDR6,頻率20 Gbps
- 視訊記憶體位寬:256位
- Infinity Cache:最高64MB(第三代)
媒體和顯示增強
RDNA 4 還改進了媒體編碼和解碼能力,AVC/H.264 編碼質量提高了 25%,HEVC 編碼質量提高了 11%,AV1 吞吐量翻倍。更新的 Radiance Display Engine 支援 DisplayPort 2.1a 和 HDMI 2.1b 輸出,而增強的 FreeSync 電源最佳化模式在多顯示器配置中提供更低的空閒功耗。AMD 還推出了 Radeon Image Sharpening 2,它透過單個開關在所有 API 中工作,提供更高質量的影像。
未來之路
雖然 AMD 在 RDNA 4 和 FSR 4 方面取得了重大進展,但在與 NVIDIA 已建立的生態系統競爭方面仍面臨挑戰。FSR 4 的質量改進令人期待,但該技術與 NVIDIA 的 DLSS 4 相比仍有差距,後者已支援 70 多款遊戲。要使 FSR 4 長期成功,AMD 需要保持對擴大遊戲支援的堅定承諾,並繼續改進演算法質量。儘管如此,RDNA 4 代表了 AMD 迄今為止最專注於遊戲的架構,在光柵化、光線追蹤和 AI 處理方面有了實質性的改進,這應該使 Radeon RX 9000 系列在高階遊戲市場上具有競爭力。