在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

手機GPU光追新解:詳談Imagination剛發布的DXT架構

穎脈Imgtec ? 2023-01-29 14:24 ? 次閱讀

最近Imagination Technologies發布新一代IMG DXT架構GPU IP——這次發布的DXT產品主要是面向手機設備的。如果你對Imagination的GPU IP熟的話,應該知道2019年發布IMG A系列架構,屬于這家公司產品和技術層面的一個分水嶺,去年的PowerVR架構30周年回顧文章也談到過。b76e08b6-978f-11ed-ad0d-dac502259ad0.pngAXT(A系列)的基本理念主要是超寬ALU設計,Imagination此前強調它在PPAB(power, performance, area, bandwidth)方面的貢獻;而次年的BXT系列,則更多地開始采用去中心化的多核、模塊化方案,通過彈性縮放達成了我們現在所說的覆蓋從手機到數據中心的GPU設計,并且也開始支持chiplet的設計;CXT系列則帶來了PowerVR Photon架構,也就是光追加速,在移動市場上正式提出硬件級光追加速方案。
D系列的發布基本也是符合預期的。其實2019年Imagination的GPU計劃表上,D系列的發布時間是2022年——選在今年1月發布也差不多趕在了時間線上。最新發布的IMG DXT,除了性能提升外,從大方向來看應該是進一步提升可擴展性、彈性的一代架構,尤其表現在光追方面;而且通過某些特性(如FSR)達成了效率的進一步提升。本文重點談談D系列引入的一些新特性,和部分改進。
新一代DXT概覽:更彈性的設計
有關Imagination GPU架構的常規構成及組成元素,這里不再多做著墨,比如說USC(Unified Shading Cluster)模塊、TPU(Texture Processing Unit)單元、Raster/Geometry模塊這些固定功能單元,和cache、固件處理器(firmware processor)。
總的來說,相比于C系列,這次的DXT一個核心單元內的ALU與TPU性能最多可以提升50%;更重要的是,額外搭配的光追模塊(RAC,Ray Acceleration Cluster)在規模和位置方面有了更大的彈性——這一點后文也會詳細提到。ba793b84-978f-11ed-ad0d-dac502259ad0.png按照彈性擴展方案,Imagination列舉了三種配置示例,如上圖所示。在Imagination的定位中,這三種配置分別面向主流機、高端機、旗艦機。每種配置有不同的FP32算力和紋理填充率,以及可選的光線追蹤加速硬件。(如DXT 8-256,8表示紋理填充率 8 GTexels/s,256表示FP32算力256 GFLOPS)基礎款DXT-8-256據說達成了超過20%的性能密度提升,也就是單位面積性能表現更好。
DXT的彈性擴展能力改進,主要體現在:SPU(Scalable Processing Unit)作為規模化擴展的基本單元,現在可以用上更多的ALU、TPU。所以這代產品能夠用更高密度的SPU設計,如上圖,可包含3個USC/TPU模塊,加上其他共享單元。baa6169a-978f-11ed-ad0d-dac502259ad0.png比如說上一代CXT-48-1536,是三個SPU的設計,那么每個SPU搭配一個RAC(光追加速集群),也就構成了CXTP-48-1536 RT3。而到了這一代,除了三個SPU這樣的設計(三個2x 8-256 SPU),現在還可以搭配兩個SPU——但是每個SPU是3個USC/TPU單元(即兩個3x 8-256 SPU)。則基于每個SPU搭配1個RAC,那么就可以組合為DXT-48-1536 RT2。而且還能用一半的RAC,做成DXT-48-1356-0.5RT2。
也就是說達成此前相同的浮點和紋理性能,現在可以搭配RT1、RT2、RT3不同的配置方案,最大規模單個核心可做RT4(單核最多4個SPU)。另外單個SPU規模做大,實則會比前代達成相同算力所需的面積更小,也就提升了性能密度。與此同時最高性能配置的算力也就提升了。
雖然發布會上,Imagination只提到了DXT-72-2304 RT3,但DXT技術白皮書上說單核能夠從過去的CXT-64-2048,做到這一代的DXT-96-3072,性能也就提升了50%。具體的不同配置方案如下:baaee75c-978f-11ed-ad0d-dac502259ad0.png光線追蹤與FSR
有關PowerVR Photon架構的光追實現,我們此前也寫過不止一篇文章了,包括Imagination定義的光追等級。移動設備要用上光追GPU是手機AP SoC廠商的共識。
Imagination公司技術產品管理高級總監Stephen Barton在采訪中說:“我們把RAC單獨作為一個IP剝離出來,意味著可以不影響GPU本身的性能,光線追蹤可以獨立運行,這對移動端的應用很重要。移動端剛開始做光線追蹤技術,一定會從混合模式開始。剛開始是大量光線運算和少量光照,隨著光線追蹤技術越來越成熟,會走向更完整的光線追蹤。我們的架構特別適合這樣的發展模式,每個階段都可以為客戶提供需要的光線追蹤性能。”
“我們的想法是,DXT可以更好地讓具有硬件級別、開銷真正能夠在移動端被接受的光線追蹤,鋪開到更多的設備。”Imagination公司首席營銷官David Harold說,“只有這樣,那些針對光線追蹤進行內容開發的開發者才會愿意做這方面的開發工作。”babd986a-978f-11ed-ad0d-dac502259ad0.png這說的應該是RAC的靈活性好——我們認為,的確在移動領域都還沒有像樣的光追游戲的情況下,為光追加速耗費的晶體管會成為所謂的dark silicon。這代架構上,Imagination強調“可擴展的光線追蹤”,芯片設計企業可選配的RAC單元規模有了更大的選擇范圍,包括半個RAC(216 MRay/s,8 GBoxTests/s)。David說,“哪怕先用0.5個RAC單元,也可以把更多光追能力盡可能地帶給更多主流機型,增加市場覆蓋率,讓更多開發者加入進來,讓這項技術成為真正意義上的主流技術。”
Imagination在DXT技術白皮書中說,以前架構的配置方案是2個ALU模塊共享RAC,而這一代可以由更多的ALU模塊共享一個RAC;而且RAC可以遷往GPU的不同層級——前文提及SPU模塊的靈活設計,本身就在影響RAC的布局。
另外Stephen還說:“光線追蹤等級L1和L2,是目前市面上大家能夠看到的絕大多數光線追蹤技術達到的等級。而我們提供的L4。”L4等級的光追技術除了兩個重要的硬件加速支持,還需要考慮到移動平臺的功耗敏感性。所以L4是在L3的BVH遍歷的基礎上,將具備相干性的光線做分類和聚集(coherency sorting),比如對某些材質反射的同方向光線進行sorting,達成更高的數據復用,提升并行ALU管線利用率。bacc6aac-978f-11ed-ad0d-dac502259ad0.png有關RAC的內部構成,我們此前也撰文談過了,這里不再細數。其中達成L4的關鍵是其中的PCG(Packet Coherency Gather)(另外“再加上RS、RTS等”),就是將相干光線聚集起來做計算,“用相同的指令完成并行計算,節省了大量的功耗。”Imagination中國區技術總監艾克說。bad83b5c-978f-11ed-ad0d-dac502259ad0.png伴隨這次DXT架構更新而來的另一項重要特性更新是FSR(Fragment Shading Rate)。這個FSR不是AMD FSR,而類似于VRS可變速率著色。關注游戲和圖形技術發展的同學對此應該不會陌生。簡單來說,是對畫面中不重要的區域(比如畫面的背景部分),或者不需要高精度渲染的部分,不做原生分辨率級別的渲染,也就能起到降低功耗和負載的效果。
比如競速游戲,在賽車高速行駛的時候,賽車周圍的對象實際上只需要低畫質繪制即可,因為這些對象后續會被運動效果做模糊處理。
覆蓋兩個或更多像素,來降低shader執行率,也就相當于做了更少的工作、需求更低的帶寬和更少的功耗,帶來幀率提升的同時,對游戲體驗又不會有太大的影響。DXT支持不同比例的多像素shader執行復用。不同比例也就對應了不同的畫質。據說如果以4x4陣列像素的shader執行復用,則達成大約“93%左右的fragment運算能力的節省”。baea1944-978f-11ed-ad0d-dac502259ad0.pngImagination表示,FSR能夠和光追做很好的搭配。感覺和桌面GPU市場參與者說超分和光追做搭配是差不多的意思,大方向都是降低原生畫面的渲染精度,將更多資源應用于光線追蹤,則能有效提升最終呈現的畫面幀率。不過這里還有個關鍵,FSR/VRS在整個流程里所處的位置,還是比DLSS這類超分技術靠前許多的。
bb175f26-978f-11ed-ad0d-dac502259ad0.png應用FSR以后,也就意味著只需要更少的shader調用和光線發射,需要處理的光線也就更少,更大一片區域的像素結果可被復用。換句話說,就是shader處理和光線數減少了,則顯著降低了整體開銷。“沒有開啟FSR的話,可能需要每幀6.9MRays的算力;但如果配上FSR計算,哪些區域運算一次,哪些區域運算兩次,哪些區域需要細節表現的,這樣一幀畫面只需要3.2MRays計算能力。”艾克說,“配合可擴展的RAC,用更小的RAC就能夠實現該場景下的游戲光追效果。”
其他關鍵特性更新
IMG DXT新架構引入同時的其他特性主要還包括下圖這些。bb26310e-978f-11ed-ad0d-dac502259ad0.png2D Dual-Rate Texturing強調的是提升TPU后處理效果的性能表現。Imagination說他們觀察到許多游戲會花比較多的時間去執行后處理(post-processing)算法,包括實現淺景深、bloom、模糊之類的效果。其中很多負載的瓶頸在TPU吞吐上。但暴力增加TPU單元的硬件資源是不合理的。bb572638-978f-11ed-ad0d-dac502259ad0.png基于Imagination發現的后處理負載與圖像處理的一些典型特征,開發團隊實施了一種新的TPU模式,在檢測到這些特征以后達成后處理性能的翻番。具體的細節推薦去看DXT技術白皮書。據說在特定處理類型中,DXT-48-1536能夠達成96-1536的效果,每時鐘周期處理雙倍數量的雙線性過濾紋理采樣,也就達成了雙倍的執行率。實際上,前述DXT架構優化方案(如光追處理更少的光線)也對后處理效果提出了更高的要求,2D Dual-Rate TPU也就顯得自然而然了。bb954d6e-978f-11ed-ad0d-dac502259ad0.pngPipelined Data Masters - 此前解析IMG A系列的文章里就提到過,GPU內有個固件處理器(firmware processor)。這個固件處理器負責高層級調度和負載優先級安排,與Data Master固定功能單元一起實現。GPU內部有各種各樣的Data Master,什么2D Data Master、3D Data Master、Compute Data Master、Geometry Data Master...
這些Data Master負責各類型的低層級工作。Imagination在技術白皮書中說,之前的幾代架構用的都是single-tasking單任務Data Master。也就是說Data Master首先執行某個特定工作,如果要改換工作就需要固件處理器來做設定。那么在固件處理器設定下一項工作、對寄存器編程時,就會有個空閑時間;設定工作本身還需要數據訪問和其他同步任務。
在GPU規模大、SPU數量多的情況下,這帶來的性能影響就會比較大,尤其在固件處理器規模不變的情況下。所以這一代新架構實現了Data Master的流水線化(pipelining)——在GPU的上一個工作還在處理執行的情況下,固件就可以設定下一個工作。從此前固件設定工作與渲染任務的串行化,到現在的并行化,提升了GPU的資源利用率。bb9f30d6-978f-11ed-ad0d-dac502259ad0.png以前firmware processor工作導致性能損失bbc9aa28-978f-11ed-ad0d-dac502259ad0.png現在,這部分工作實現了流水線化
此外這個RISC-V架構的固件處理器本身也有40%的性能提升。白皮書上說,DXT這代轉向了基于RISC-V的固件處理器——似乎此前A系列發布時就有消息提到這部分就是基于RISC-V的。而Imagination現如今異構處理器策略中,做基于RISC-V的CPU IP其實也已經是眾所周知的了。bbeb3c9c-978f-11ed-ad0d-dac502259ad0.png上述PPT中列出最后一項是ASTC HDR支持——實際上Vulkan API之前就強制ASTC(Adaptive Scalable Texture Compression)LDR紋理了,Imagination也持續好幾代架構做出了支持。而ASTC HDR一直是個可選項。Imagination認為,未來幾年HDR會發展起來,則基于ASTC算法來支持HDR輸入壓縮紋理,也是自然而然的。于是DTX實現了這一類型的壓縮紋理。HDR紋理不用多解釋了,也就是畫面暗部和亮部的光比可以做到很大。
至于TBDR、PVRIC圖像壓縮、去中心化的多核架構設計與模塊化擴展等等都屬于Imagination的常規項目了。有興趣的讀者可以去看看我們之前撰寫有關Imagination GPU IP的技術文章。bbfb604a-978f-11ed-ad0d-dac502259ad0.png最后談談生態。生態問題涉及的應該是整個Imagination的IP產品,而不僅限于這次的DXT。DXT架構具體變成芯片的未來計劃,Imagination在發布會上并未提及。不過艾克給出了一些生態方面的成果:“2021年,我們把光線追蹤技術應用到手機領域,同時也推廣到O3DE(Open 3D Engine),讓開源社區開發者感受到光線追蹤技術的演進和發展。”
“我們也和Amazon發布了帶有光線追蹤效果的演示demo,可展示出全天候的光影變化效果,沉浸感很強。”艾克說,“除此之外,我們也和各大游戲開發者介紹新功能,新游戲發布時我們會去參與測試,讓一些功能及時得到應用;產品新特性也介紹給他們,在游戲開發過程里能用起來,建立手機游戲開發生態。”
開發生態工具相關的部分,除了比較基本的對于Vulkan API等提供支持,Stephen提到如光追生態系統建設和儲備方面的工作很早就開始了,“2021年CXT發布時也有發布相關的光線追蹤工具。”包括分析工具,以及SDK開發包等。David則表示:“我們和包括完美世界、網易、騰訊、Unity,以及OPPO、vivo等在內的合作伙伴都有合作。
現階段,Imagination要推廣自家GPU IP,尤其是最新幾代架構的優秀技術,難點仍然在生態擴展上。期待在新的一年其GPU IP在更多類型的設備形態上落地——比如產品之外,DXT架構的應用范圍應該是不僅限于手機的,比如VR也會是其應用方向之一——還有像汽車之上的產品應用,能夠持續帶動Imagination新戰略中四大應用領域:Mobile、Consumer、Automotive、Data Center方向的全面開花結果。
作者:黃燁鋒 資深產業分析師

EET電子工程專輯

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4740

    瀏覽量

    128949
  • imagination
    +關注

    關注

    1

    文章

    573

    瀏覽量

    61332
收藏 人收藏

    評論

    相關推薦

    芯原發布新一代Vitality架構GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構的圖形處理器(GPU)IP系列。這一新一代GPU架構以其卓越的計算性能和廣泛的應用領域,吸引了業界的廣泛關注。 Vitality
    的頭像 發表于 12-24 10:55 ?131次閱讀

    Imagination DXS GPU榮獲ASIL-B官方認證

    全球硅知識產權(IP)領域的佼佼者Imagination Technologies宣布了一項重要成就:其專為汽車領域打造的Imagination DXS GPU IP,已成功通過SGS-TüV Saar的全面審核與評估,正式獲得
    的頭像 發表于 11-14 16:37 ?458次閱讀

    GPU服務器AI網絡架構設計

    眾所周知,在大型模型訓練中,通常采用每臺服務器配備多個GPU的集群架構。在上一篇文章《高性能GPU服務器AI網絡架構(上篇)》中,我們對GPU
    的頭像 發表于 11-05 16:20 ?353次閱讀
    <b class='flag-5'>GPU</b>服務器AI網絡<b class='flag-5'>架構</b>設計

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    本篇閱讀學習第七、八章,了解GPU架構演進及CPGPU存儲體系與線程管理 █從圖形到計算的GPU架構演進 GPU圖像計算發展 ●從三角形開始
    發表于 11-03 12:55

    《科普時報》:探索量子奧秘,跟著院士去“

    《科普時報》:探索量子奧秘,跟著院士去“
    的頭像 發表于 10-12 08:06 ?238次閱讀
    《科普時報》:探索量子奧秘,跟著院士去“<b class='flag-5'>追</b><b class='flag-5'>光</b>”

    開創移動新歷史!天璣9400首發90幀超流暢移動

    3A游戲還是多任務處理,天璣9400都可以輕松應對,功耗還進一步下降。此外,天璣9400還首發90幀超流暢移動,同時配有PC級黑科技。這意味著,在激烈的游戲對決中,你不僅能夠享
    的頭像 發表于 10-10 09:29 ?379次閱讀
    開創移動<b class='flag-5'>光</b><b class='flag-5'>追</b>新歷史!天璣9400首發90幀超流暢移動<b class='flag-5'>光</b><b class='flag-5'>追</b>

    在線研討會 | Imagination產品總監全面解讀最新DXS GPU

    不久前,Imagination重磅推出其最新的、用于車載智能和交互的汽車圖形處理器(GPU)IP產品ImaginationDXSGPU。為了讓更多對GPU感興趣的讀者全面了解DXSGPU,我們邀請
    的頭像 發表于 10-10 08:07 ?206次閱讀
    在線研討會 | <b class='flag-5'>Imagination</b>產品總監全面解讀最新DXS <b class='flag-5'>GPU</b>

    Imagination DXS GPU:重塑汽車智能與交互的未來

    增長。在此背景下,Imagination公司最新推出的DXS GPU IP產品,以其可擴展性、靈活性和強大的計算能力,為車載智能與交互系統注入了新的活力。
    的頭像 發表于 09-23 13:06 ?790次閱讀

    Imagination推出性能最高且具有高等級功能安全性的汽車GPU IP

    Imagination DXS GPU 進一步擴大其在汽車領域的領先地位
    的頭像 發表于 09-14 17:41 ?376次閱讀

    Imagination GPU為邊緣智能提供高效率的加速

    作者:Imagination
    的頭像 發表于 09-11 13:10 ?268次閱讀
    <b class='flag-5'>Imagination</b> <b class='flag-5'>GPU</b>為邊緣智能提供高效率的加速

    手機大突破!天璣9400 GPU性能提升20%

    近日,科技圈傳來新消息,聯發科旗下最新旗艦芯片天璣9400在圖形技術上取得重大突破。據悉,該芯片性能較前代產品提升近20%,并首發一項移動端新光技術,該技術堪比PC頂級
    的頭像 發表于 08-27 13:33 ?375次閱讀
    <b class='flag-5'>手機</b><b class='flag-5'>光</b><b class='flag-5'>追</b>大突破!天璣9400 <b class='flag-5'>GPU</b><b class='flag-5'>光</b><b class='flag-5'>追</b>性能提升20%

    科技發布新一代GDDR7顯存

    在近日舉行的臺北國際電腦展上,美國存儲芯片巨頭美科技正式發布了其新一代GDDR7顯存。這款新型GPU顯卡內存基于美的1βDRAM架構,將
    的頭像 發表于 06-06 09:24 ?444次閱讀

    Arm發布針對旗艦智能手機的新一代CPU和GPU IP

    全球領先的芯片設計公司Arm宣布了針對旗艦智能手機市場的全新CPU和GPU IP設計方案——Cortex-X925 CPU和Immortalis G925 GPU。這兩款產品均基于Armv9
    的頭像 發表于 05-31 09:44 ?597次閱讀

    大模型快速發展,GPU IP有何作用

    。 ? Imagination ? ImaginationGPU IP產品包括IMG A系列、IMG CXT、IMG DXT等多
    的頭像 發表于 05-29 00:05 ?2346次閱讀

    X-Silicon發布RISC-V新架構 實現CPU/GPU一體化

    X-Silicon 的芯片與其他架構不同,其設計將 CPU 和 GPU 的功能整合到單核架構中。這與英特爾和 AMD 的典型設計不同,前者有獨立的 CPU 內核和 GPU 內核。
    發表于 04-08 11:34 ?586次閱讀
    X-Silicon<b class='flag-5'>發布</b>RISC-V新<b class='flag-5'>架構</b> 實現CPU/<b class='flag-5'>GPU</b>一體化
    主站蜘蛛池模板: 日本特级黄色录像| www.夜夜操.com| 一道精品一区二区三区| 五月六月伊人狠狠丁香网| 久久精品男人影院| 免费在线观看的视频| 在线视频影院| 欧美黄区| 色噜噜狠狠色综合欧洲selulu| 丁香婷五月| 日本68xxxxxxxxx59| 四虎永久在线精品国产| 99久在线| 美女操网站| 妇女交性大片| 日韩一级高清| 天天干在线播放| 欧美成人亚洲欧美成人| 免费jyzzjyzz在线播放大全| 免费国产一区二区三区| 日本最黄| 亚洲狠狠97婷婷综合久久久久| 国产精品99r8在线观看| 亚洲精品91大神在线观看| 色中文字幕在线| 午夜免费在线观看| 欧美宗合网| 日本特黄特黄刺激大片免费| 天天操天天看| 一级三级黄色片| ww欧洲ww在线视频看ww| 国产精品美女久久久| 四虎永久在线精品国产| 天天做天天爱夜夜爽| 1区2区3区4区| 2021日本三级理论影院| 男女互插小说| 成人性视屏| 乱h亲女小说| 俺也去第四色| 美女视频黄a全部免费看小说 |