
一款全新的小程序強(qiáng)DX12 GPU基準(zhǔn)測(cè)試正式發(fā)布,強(qiáng)如RTX 5090這樣的跑幀頂級(jí)顯卡都被“按在地上摩擦”。

Radiance DX12 GPU基準(zhǔn)測(cè)試?yán)霉饩€步進(jìn)(raymarching),完全依賴FP32計(jì)算能力,跑幀旨在展示當(dāng)前及未來(lái)顯卡的小程序強(qiáng)潛力。
Radiance由前Tom’s Hardware與Thresh’s FiringSquad撰稿人AlanDong編寫(xiě)。跑幀該基準(zhǔn)基于DX12 API,小程序強(qiáng)通過(guò)運(yùn)行一個(gè)采用光線步進(jìn)技術(shù)實(shí)現(xiàn)的跑幀《打磚塊》版本,來(lái)分析現(xiàn)代GPU的小程序強(qiáng)FP32計(jì)算性能。

有意思的是,Alan最初只是小程序強(qiáng)把Radiance當(dāng)作一個(gè)周末項(xiàng)目,后來(lái)逐漸將其打磨成一個(gè)完整的跑幀GPU基準(zhǔn)測(cè)試。該測(cè)試完全依賴光線步進(jìn)幾何:沒(méi)有紋理貼圖、小程序強(qiáng)沒(méi)有捷徑、跑幀沒(méi)有預(yù)烘焙光照,小程序強(qiáng)一切都建立在純數(shù)學(xué)計(jì)算之上。
Radiance體積非常小,壓縮后僅80KB,并提供兩個(gè)預(yù)設(shè)。第一個(gè)名為“RTX5090”的預(yù)設(shè)分辨率為720p,包含80個(gè)碎片。Extreme極限預(yù)設(shè)則運(yùn)行在1080p分辨率下,碎片數(shù)量高達(dá)640個(gè)。默認(rèn)預(yù)設(shè)的總大小約為5KB,而Extreme預(yù)設(shè)約為32KB,這意味著即便在最高負(fù)載下,也能輕松完整地放入現(xiàn)代GPU的L1緩存中。

Radiance最出色的一點(diǎn)在于,它測(cè)試的是GPU的計(jì)算吞吐量(FP32)與執(zhí)行效率,而不是顯存帶寬,或光追、AI加速等“花活”。但最關(guān)鍵的還是它所依賴的渲染方式——光線步進(jìn)(raymarching)。
光線步進(jìn)主要用于物理模擬,是光線追蹤的一種替代方案。以下是傳統(tǒng)光柵化與光線步進(jìn)的區(qū)別:
傳統(tǒng)光柵化
頂點(diǎn)著色器變換坐標(biāo)
光柵化階段確定像素覆蓋
像素著色器應(yīng)用紋理與光照
輸出合并到幀緩沖
光線步進(jìn)(本基準(zhǔn)測(cè)試)
計(jì)算著色器為每個(gè)像素派發(fā)1個(gè)線程
每個(gè)線程通過(guò)場(chǎng)景SDF進(jìn)行光線步進(jìn)
命中后追蹤陰影光線并計(jì)算光照
直接寫(xiě)入U(xiǎn)AV紋理
Alan還撰寫(xiě)了一篇更全面、深入的指南,詳細(xì)介紹了Radiance的用途、它如何測(cè)試GPU的計(jì)算資源,以及對(duì)結(jié)果應(yīng)有哪些預(yù)期,感興趣的讀者可以前往查看原文。
接下來(lái),我們從RTX 5090的測(cè)試結(jié)果說(shuō)起。在默認(rèn)的720p預(yù)設(shè)下,RTX 5090取得了2085分,平均幀率為76.2FPS,平均碎片數(shù)量為58.3。

而在Extreme極限預(yù)設(shè)下,雖然分辨率“僅”為1080p,但碎片上限高達(dá)640個(gè),光線步進(jìn)次數(shù)為72步,RTX 5090測(cè)試平臺(tái)只能跑到2–3FPS,平均碎片規(guī)模為123.1。在碎片開(kāi)始大量生成之前,平均FPS約為41.8。

由于該基準(zhǔn)對(duì)GPU計(jì)算能力的壓榨程度極高,開(kāi)發(fā)者特意加入了安全提醒:運(yùn)行該測(cè)試前請(qǐng)確保顯卡具備良好的散熱條件,同時(shí)確認(rèn)12VHPWR等供電線纜的散熱與插接都沒(méi)有問(wèn)題。
關(guān)注微信