電子發(fā)燒友網報道(文/周凱揚)今年開年以來,相信大家已經接受了一波各種國產GPU新品的消息轟炸了,尤其是GPGPU(通用圖形處理單元),比如天數智芯的天垓、壁仞科技的BR100系列等等,這也意味著在通用計算上,國內GPU的硬件生態(tài)終于走上了快車道。
然而去年9月份,RISC-V向量擴展(RVV)1.0的正式推出讓RISC-V開始在通用計算和AI領域有了更大發(fā)揮空間,比如GCC和LLVM這兩大著名編譯器都已經支持RVV匯編等。RISC-V的GPU也開始因此冒頭,甚至不少都是開源的,比如去年的Vortex等。
清華“承影”GPU
今年的RISC-V中國峰會上,清華大學集成電路學院何虎副教授團隊發(fā)布了采用Chisel語言基于RISC-V 的開源GPGPU實現方案,名為“承影”(Ventus),同時還給出了映射方案、指令集和微架構的實現。
作為開始嶄露頭角的敏捷硬件設計語言,Chisel在RISC-V處理器的設計中變得愈發(fā)常見,另一開源RISC-V處理器,中科院的香山同樣采用了這一語言。這是因為其開發(fā)效率高過傳統(tǒng)的Verilog,承影開發(fā)團隊表示,利用Chisel高效參數化的特點可以生成不同規(guī)模的硬件單元,且應用無需更改代碼仍能運行。
承影選擇了將RISC-V向量擴展與SIMT架構結合的方式,RISC-V向量擴展可以適應不同規(guī)模而硬件,而無需進行重新編譯。而單指令多線程的SIMT作為當下幾乎所有GPU都選擇的架構,在編程靈活性上要更高一些。
承影的微架構 / 清華大學集成電路學院
承影開發(fā)團隊的設想是,讓RVV GPGPU與RISC-V CPU充分結合,完成統(tǒng)一ISA下的SoC系統(tǒng),能讓編譯器在任務劃分和協同上探索更多可能。與此同時,他們也想借助開源RISC-V、開源硬件來打造自主可控的SoC系統(tǒng)。
承影已經在Xilinx VCU128 FPGA上完成了驗證,他們開發(fā)了AXI驅動程序,并用MicroBlaze作為Host進行任務發(fā)射,用PL搭建“承影”GPGPU進行計算,通過DDR共享內存。按照4 warp 8 thread的配置可部署160個核心,核心頻率為100MHz,理論峰值算力為32Gflops,可同時駐留1280個線程。承影開發(fā)團隊預計中芯國際40nm工藝下,頻率至少也能做到350MHz。
承影GPU不僅本身開源,也同樣受益于開源。在承影的Github界面可以看到,其CTA調度器是基于另一大開源GPU項目,MIAOW的超線程調度器,L2緩存設計和香山處理器一樣,參考了SiFive的Block InclusiveCache,乘法器和FPU也參考啟發(fā)自香山的設計。這也就是RISC-V的開源魅力,在設計過程中不僅可以汲取來自其他ISA過去的設計經驗,也能讓整個開源社區(qū)參與到后續(xù)的開發(fā)完善工作中來。
根據承影開發(fā)團隊的介紹,他們的后續(xù)工作包括工具鏈的開發(fā),比如調試和UVM驗證工具、RVV自動向量化工具,至于CUDA支持,他們打算走CUDA-LLVM-RVV這條路線。后續(xù)他們也計劃引入一些架構上的改進,比如借鑒向量處理器的思路,以及現有GPGPU的架構。內存方面會考慮RVWMO與GPGPU的結合。他們也考慮加入圖形功能,Tensor core以及transformer等單元。當然了,以上所說到的工作量都不少,還是需要開源社區(qū)的積極參與才能完成。
對RISC-V GPGPU未來的展望
盡管GPGPU作為通用計算的一種硬件形式,目前已經在AI、HPC中開始普及,但要說GPU的各種角色定位中,效率最高、計算量最大、內存占用最多的應用之一還是圖形渲染。鑒于目前圖形渲染技術壁壘其實更高,RISC-V在這塊還有很長的一段路要走。
天數智芯產品副總裁鄒翾也在會上指出,當下AI與圖形在云端融合已經成為必然的趨勢,非GPU的架構很難響應兩者在云端融合的挑戰(zhàn),而通用GPU不是像英偉達一樣已經具備圖形功能,就是可以追加圖形功能。
具體實現方式也各有不同,就拿佐治亞理工學院的開源RISC-V GPGPU Vortex為例,今年的Hot Chips 34上,他們就展示了如何將GPGPU上的一部分圖形硬件區(qū)塊在軟件上實現,從而節(jié)省處理器面積。雖然他們在各種3D Demo上驗證出的平均幀數只有10fps左右,但對于在Intel Arria 10 FPGA上實現的一個8核128線程的GPGPU來說,已經是不錯的成績了。
至于軟件生態(tài)支持,建立一個像CUDA一樣流行的生態(tài)目前看來明顯不現實,所以相關的移植工作依然被列為重心,比如上面提到的Vortex,就在開展相關的移植工作,將CUDA轉換成OpenCL。除了他們以外,還有不少公司也在開展相關的工作,比如被英特爾收購的Codeplal,就在為RISC-V處理器開發(fā)對OpenCL與SYCL的支持,而他們也在開展CUDA移植SYCL相關開發(fā)工作。
賽昉科技也基于LLVM開發(fā)了RISC-V GPGPU編譯器,實現了CUDA程序到RISC-V GPGPU指令的生成,他們還開發(fā)了相應的runtime庫,實現了設備管理、內核下發(fā)、數據傳輸等一系列功能。賽昉科技算法高級經理夏品正在本屆RISC-V中國峰會上表示,基于這一套編譯器和runtime,一部分CUDA工程已經可以運行在RISC-V GPGPU上,并能通過功能測試。
VisionFive 2單板計算機 / 賽昉科技
RISC-V GPU真正落地到產品上的還是太少了,就拿本屆中國峰會上發(fā)布的賽昉科技VisionFive 2單板計算機來說,相較于上一代昉·星光來說雖然增加了GPU,但依然還是用的Imagination的方案,同樣的還有RIOS Lab的PicoRio、YADRO的EL Construct T等。這樣的異構設計并沒有問題,可RISC-V還在GPU上的投入還是不夠,要想繞過巨頭們積累的GPU專利,離真正打造一個完全基于該架構下的SoC產品還有一定的距離。
然而去年9月份,RISC-V向量擴展(RVV)1.0的正式推出讓RISC-V開始在通用計算和AI領域有了更大發(fā)揮空間,比如GCC和LLVM這兩大著名編譯器都已經支持RVV匯編等。RISC-V的GPU也開始因此冒頭,甚至不少都是開源的,比如去年的Vortex等。
清華“承影”GPU
今年的RISC-V中國峰會上,清華大學集成電路學院何虎副教授團隊發(fā)布了采用Chisel語言基于RISC-V 的開源GPGPU實現方案,名為“承影”(Ventus),同時還給出了映射方案、指令集和微架構的實現。
作為開始嶄露頭角的敏捷硬件設計語言,Chisel在RISC-V處理器的設計中變得愈發(fā)常見,另一開源RISC-V處理器,中科院的香山同樣采用了這一語言。這是因為其開發(fā)效率高過傳統(tǒng)的Verilog,承影開發(fā)團隊表示,利用Chisel高效參數化的特點可以生成不同規(guī)模的硬件單元,且應用無需更改代碼仍能運行。
承影選擇了將RISC-V向量擴展與SIMT架構結合的方式,RISC-V向量擴展可以適應不同規(guī)模而硬件,而無需進行重新編譯。而單指令多線程的SIMT作為當下幾乎所有GPU都選擇的架構,在編程靈活性上要更高一些。
承影的微架構 / 清華大學集成電路學院
承影開發(fā)團隊的設想是,讓RVV GPGPU與RISC-V CPU充分結合,完成統(tǒng)一ISA下的SoC系統(tǒng),能讓編譯器在任務劃分和協同上探索更多可能。與此同時,他們也想借助開源RISC-V、開源硬件來打造自主可控的SoC系統(tǒng)。
承影已經在Xilinx VCU128 FPGA上完成了驗證,他們開發(fā)了AXI驅動程序,并用MicroBlaze作為Host進行任務發(fā)射,用PL搭建“承影”GPGPU進行計算,通過DDR共享內存。按照4 warp 8 thread的配置可部署160個核心,核心頻率為100MHz,理論峰值算力為32Gflops,可同時駐留1280個線程。承影開發(fā)團隊預計中芯國際40nm工藝下,頻率至少也能做到350MHz。
承影GPU不僅本身開源,也同樣受益于開源。在承影的Github界面可以看到,其CTA調度器是基于另一大開源GPU項目,MIAOW的超線程調度器,L2緩存設計和香山處理器一樣,參考了SiFive的Block InclusiveCache,乘法器和FPU也參考啟發(fā)自香山的設計。這也就是RISC-V的開源魅力,在設計過程中不僅可以汲取來自其他ISA過去的設計經驗,也能讓整個開源社區(qū)參與到后續(xù)的開發(fā)完善工作中來。
根據承影開發(fā)團隊的介紹,他們的后續(xù)工作包括工具鏈的開發(fā),比如調試和UVM驗證工具、RVV自動向量化工具,至于CUDA支持,他們打算走CUDA-LLVM-RVV這條路線。后續(xù)他們也計劃引入一些架構上的改進,比如借鑒向量處理器的思路,以及現有GPGPU的架構。內存方面會考慮RVWMO與GPGPU的結合。他們也考慮加入圖形功能,Tensor core以及transformer等單元。當然了,以上所說到的工作量都不少,還是需要開源社區(qū)的積極參與才能完成。
對RISC-V GPGPU未來的展望
盡管GPGPU作為通用計算的一種硬件形式,目前已經在AI、HPC中開始普及,但要說GPU的各種角色定位中,效率最高、計算量最大、內存占用最多的應用之一還是圖形渲染。鑒于目前圖形渲染技術壁壘其實更高,RISC-V在這塊還有很長的一段路要走。
天數智芯產品副總裁鄒翾也在會上指出,當下AI與圖形在云端融合已經成為必然的趨勢,非GPU的架構很難響應兩者在云端融合的挑戰(zhàn),而通用GPU不是像英偉達一樣已經具備圖形功能,就是可以追加圖形功能。
具體實現方式也各有不同,就拿佐治亞理工學院的開源RISC-V GPGPU Vortex為例,今年的Hot Chips 34上,他們就展示了如何將GPGPU上的一部分圖形硬件區(qū)塊在軟件上實現,從而節(jié)省處理器面積。雖然他們在各種3D Demo上驗證出的平均幀數只有10fps左右,但對于在Intel Arria 10 FPGA上實現的一個8核128線程的GPGPU來說,已經是不錯的成績了。
至于軟件生態(tài)支持,建立一個像CUDA一樣流行的生態(tài)目前看來明顯不現實,所以相關的移植工作依然被列為重心,比如上面提到的Vortex,就在開展相關的移植工作,將CUDA轉換成OpenCL。除了他們以外,還有不少公司也在開展相關的工作,比如被英特爾收購的Codeplal,就在為RISC-V處理器開發(fā)對OpenCL與SYCL的支持,而他們也在開展CUDA移植SYCL相關開發(fā)工作。
賽昉科技也基于LLVM開發(fā)了RISC-V GPGPU編譯器,實現了CUDA程序到RISC-V GPGPU指令的生成,他們還開發(fā)了相應的runtime庫,實現了設備管理、內核下發(fā)、數據傳輸等一系列功能。賽昉科技算法高級經理夏品正在本屆RISC-V中國峰會上表示,基于這一套編譯器和runtime,一部分CUDA工程已經可以運行在RISC-V GPGPU上,并能通過功能測試。
VisionFive 2單板計算機 / 賽昉科技
RISC-V GPU真正落地到產品上的還是太少了,就拿本屆中國峰會上發(fā)布的賽昉科技VisionFive 2單板計算機來說,相較于上一代昉·星光來說雖然增加了GPU,但依然還是用的Imagination的方案,同樣的還有RIOS Lab的PicoRio、YADRO的EL Construct T等。這樣的異構設計并沒有問題,可RISC-V還在GPU上的投入還是不夠,要想繞過巨頭們積累的GPU專利,離真正打造一個完全基于該架構下的SoC產品還有一定的距離。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。
舉報投訴
-
gpu
+關注
關注
28文章
4760瀏覽量
129129 -
RISC-V
+關注
關注
45文章
2306瀏覽量
46293
發(fā)布評論請先 登錄
相關推薦
《RISC-V能否復制Linux 的成功?》
的產品,Linux成為開源軟件發(fā)展的基石。
這種成功是否可以復制到開源硬件上呢?RISC-V這樣的指令集架構(ISA)是否也可以像Linux內核作為開源軟件的基礎
發(fā)表于 11-26 20:20
RISC-V,即將進入應用的爆發(fā)期
RISC-V是一種開放標準指令集架構 (ISA),最初由加州大學伯克利分校的研究人員于2010年開發(fā)。業(yè)界稱,這種開源特性為芯片設計者提供了極大的靈活性,可以根據具體需求定制AI加速器。
而AI
發(fā)表于 10-31 16:06
RISC-V近期市場情況調研
RISC-V是一種開源的指令集架構(ISA),近年來在全球范圍內迅速崛起,尤其在中國,RISC-V的發(fā)展勢頭十分強勁。以下是目前RISC-V
RISC-V擁有巨大市場潛力的原因
旬發(fā)布了第三代“香山”開源高性能RISC-V處理器核,其性能水平已進入全球第一梯隊,可廣泛應用于服務器芯片、AI芯片、GPU、DPU等高端芯片領域。
2、技術進步:
發(fā)表于 09-30 14:20
risc-v的發(fā)展歷史
RISC-V的發(fā)展歷史可以追溯到2006年左右,當時David Patterson和其他研究者開始探索創(chuàng)建一個開放和可擴展的指令集架構(ISA)。以下是RISC-V發(fā)展的主要里程碑:
一
發(fā)表于 07-29 17:20
rIsc-v的缺的是什么?
RISC-V作為一種開源的指令集架構(ISA),自其誕生以來就受到廣泛關注和應用,但它也存在一些不足之處。以下是RISC-V架構目前存在的主
發(fā)表于 07-29 17:18
建設進展 | 全球首家 RISC-V 開源創(chuàng)新中心落地深圳
RISC-V開源創(chuàng)新中心/建設進展“芯片設計正走向開放,靈活、開源的RISC-V有望成為改變一切的芯片設計。”
淺析RISC-V領先ARM的優(yōu)勢
RISC-V相對于ARM的優(yōu)勢主要體現在以下幾個方面:
開源與免費:
RISC-V是一個完全開源的指令集架構(ISA),其規(guī)范公開且可以免費
發(fā)表于 06-27 08:45
RISC-V的MCU與ARM對比
RISC-V的MCU與ARM在多個方面存在顯著的區(qū)別,以下是兩者的對比:
開源與專有
RISC-V :RISC-V是一種
發(fā)表于 05-27 15:58
又一款RISC-V筆記本面世!適配AI推理模型
、筆記本、SBC也陸續(xù)推出。然而在安卓這一用戶量最大的移動端OS上,這么多年以來,RISC-V的適配進展都相對有限。 ? 對于任何一個OS而言,完成新架構硬件的移植都不是一件易事。安卓
RISC-V有哪些優(yōu)點和缺點
RISC-V作為一種開源的指令集架構(ISA),具有一系列顯著的優(yōu)點和潛在的缺點。以下是RISC-V的主要優(yōu)點和缺點概述:
優(yōu)點:
發(fā)表于 04-28 09:03
RISC-V有哪些優(yōu)缺點?是堅持ARM方向還是投入risc-V的懷抱?
RISC-V作為一種開源的指令集架構(ISA),具有一系列顯著的優(yōu)點和潛在的缺點。以下是RISC-V的主要優(yōu)點和缺點概述:
優(yōu)點 :
發(fā)表于 04-28 08:51
評論