談到如何設計AI加速器,許多工程師都會給出不同的答案,但歸根結底仍是在一顆先進制程的芯片上排列組合數十億個晶體管。然而當前超大規模的AI推理依然面臨著不少挑戰,比如成本和復雜度高居不下,傳統架構下的性能、功耗和可編程性無法滿足超大規模的要求等。初創公司Esperanto作為去年才開始冒頭的初創企業,卻打算用RISC-V來解決這一問題。
Esperanto創立于2014年,其董事長Dave Ditzel曾在英特爾負責下一代微處理器架構的設計。Esperanto的工作方向是基于RISC-V這一開放架構,開發高性能、高效率的計算方案。為此,他們打造了ET-SoC-1,一個千核的RISC-V處理器,也是他們開發的首個AI加速器。
ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統的SoC,而是面向超大規模數據中心的“片上超級電腦”。它包含了近乎1100個RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個AI推理加速器,并不是訓練加速器。
據CEO Art Swift介紹,該芯片采用了臺積電7nm制程,在特定的工作任務上,能耗效率提高可至100倍。ET-SoC-1在其他關鍵工作任務上,性能提升要遠高于傳統的CPU加GPU方案。比如在模擬測試中,用于推薦網絡時,其性能提升高達50倍,在圖像分類上,性能提升高達30倍。雖然這些暫時只是紙面測試參數,但這樣的性能和功耗無疑可以給AI客戶帶來很大的吸引力。
據了解,這一芯片直至2021年第二季度才正式流片,預計2022年早期才會開始量產。這是因為Esperanto花了很多時間在驗證上,作為一家初創公司,Esperanto采用了架構、硬件和軟件聯合設計的方式,這樣一來雖然節省了時間,卻也讓規格一直在持續變動。因此Esperanto在驗證團隊上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯和除錯時間。
ET-SoC-1芯片架構 / Esperanto
ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個ET-Maxion(超標量亂序核)和1089個ET-Minion(順序多線程核心)。ET-Maxion是一顆可以運行Linux的大核心,核心頻率超過2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機器學習數據處理。
ET-Maxion作為核心頻率超過2GHz的10級流水線RISC-V核心,其實原本是伯克利大學Boom V2開源核心的的分支,但Esperanto對此進行了大刀闊斧的改進。在SPEC2006測試下,其性能已經超過了Cortex-A57,不過還是次于Cortex-A72以及SiFive最近公布的P550。
雖然是一個小核,但ET-Minion也是一個64位RISC-V核心。ET-SoC-1內,32個ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個Shire采用Mesh的方式連接在一起,多出來的一個ET-Minion則用作服務處理器。Esperanto用這一千多個ET-Minion做到了強大的浮點性能,某些傳統加速器僅支持INT8運算,而ET-SoC-1在FP16或FP32上都能展現出不俗的優勢。
搭載6個ET-SoC-1的Glacier Point v2 / Esperanto
Art Swift提到,Facebook推出的開源AI板卡Glacier Point v2可以搭載6個ET-SoC-1芯片,這樣以來就可以直接接入已有的開源計算項目(OCP)設備中。這一張卡上就包含了6558個RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達822GB/s的同時還擁有較低的功耗。據估計,這一設計的板卡峰值性能可達800 TOPS(INT8)以上。
在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見的機器學習框架提供了支持。只需采用Facebook的開源編譯器,就可以在多個ET-SoC-1芯片上運行機器學習模型。
結語
RISC-V雖然在傳統的CPU與GPU市場還未徹底崛起,但在AI加速上,已經以其獨到的優勢迅速攻城略地。這種千核式的設計其實已經應用于Arm等架構,不少數據中心、超算卻依然在嘗試用RISC-V作為加速器。
RISC-V憑借其開放性、擴展性和自主性,并沒有像Arm那樣由低至高地發展市場,而是低端和高端兩頭抓,一旦消費市場也開始普及RISC-V生態,那時的RISC-V就有與Arm全市場爭霸的希望了。
Esperanto創立于2014年,其董事長Dave Ditzel曾在英特爾負責下一代微處理器架構的設計。Esperanto的工作方向是基于RISC-V這一開放架構,開發高性能、高效率的計算方案。為此,他們打造了ET-SoC-1,一個千核的RISC-V處理器,也是他們開發的首個AI加速器。
ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統的SoC,而是面向超大規模數據中心的“片上超級電腦”。它包含了近乎1100個RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個AI推理加速器,并不是訓練加速器。
據CEO Art Swift介紹,該芯片采用了臺積電7nm制程,在特定的工作任務上,能耗效率提高可至100倍。ET-SoC-1在其他關鍵工作任務上,性能提升要遠高于傳統的CPU加GPU方案。比如在模擬測試中,用于推薦網絡時,其性能提升高達50倍,在圖像分類上,性能提升高達30倍。雖然這些暫時只是紙面測試參數,但這樣的性能和功耗無疑可以給AI客戶帶來很大的吸引力。
據了解,這一芯片直至2021年第二季度才正式流片,預計2022年早期才會開始量產。這是因為Esperanto花了很多時間在驗證上,作為一家初創公司,Esperanto采用了架構、硬件和軟件聯合設計的方式,這樣一來雖然節省了時間,卻也讓規格一直在持續變動。因此Esperanto在驗證團隊上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯和除錯時間。
ET-SoC-1芯片架構 / Esperanto
ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個ET-Maxion(超標量亂序核)和1089個ET-Minion(順序多線程核心)。ET-Maxion是一顆可以運行Linux的大核心,核心頻率超過2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機器學習數據處理。
ET-Maxion作為核心頻率超過2GHz的10級流水線RISC-V核心,其實原本是伯克利大學Boom V2開源核心的的分支,但Esperanto對此進行了大刀闊斧的改進。在SPEC2006測試下,其性能已經超過了Cortex-A57,不過還是次于Cortex-A72以及SiFive最近公布的P550。
雖然是一個小核,但ET-Minion也是一個64位RISC-V核心。ET-SoC-1內,32個ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個Shire采用Mesh的方式連接在一起,多出來的一個ET-Minion則用作服務處理器。Esperanto用這一千多個ET-Minion做到了強大的浮點性能,某些傳統加速器僅支持INT8運算,而ET-SoC-1在FP16或FP32上都能展現出不俗的優勢。
搭載6個ET-SoC-1的Glacier Point v2 / Esperanto
Art Swift提到,Facebook推出的開源AI板卡Glacier Point v2可以搭載6個ET-SoC-1芯片,這樣以來就可以直接接入已有的開源計算項目(OCP)設備中。這一張卡上就包含了6558個RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達822GB/s的同時還擁有較低的功耗。據估計,這一設計的板卡峰值性能可達800 TOPS(INT8)以上。
在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見的機器學習框架提供了支持。只需采用Facebook的開源編譯器,就可以在多個ET-SoC-1芯片上運行機器學習模型。
結語
RISC-V雖然在傳統的CPU與GPU市場還未徹底崛起,但在AI加速上,已經以其獨到的優勢迅速攻城略地。這種千核式的設計其實已經應用于Arm等架構,不少數據中心、超算卻依然在嘗試用RISC-V作為加速器。
RISC-V憑借其開放性、擴展性和自主性,并沒有像Arm那樣由低至高地發展市場,而是低端和高端兩頭抓,一旦消費市場也開始普及RISC-V生態,那時的RISC-V就有與Arm全市場爭霸的希望了。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
87文章
31258瀏覽量
269613 -
RISC-V
+關注
關注
45文章
2306瀏覽量
46293
發布評論請先 登錄
相關推薦
Imagination放棄RISC-V處理器內核開發
電子發燒友網報道(文/吳子鵬)根據外媒的最新報道,半導體IP大廠Imagination Technology已經停止了RISC-V處理器內核的開發,轉而更加專注于其核心的GPU和AI產品
Andes晶心科技推出D45-SE RISC-V處理器
Andes晶心科技(TWSE:6533; SIN US03420C2089; ISIN:US03420C1099)是全球高效能、低功耗 32/64 位 RISC-V 處理器的領導廠商,也是
Rivos全新產品采用Andes晶心科技NX45 RISC-V處理器
專注于加速數據分析和生成式AI工作負載的RISC-V主要會員公司Rivos與32/64位RISC-V處理器內核的領先供貨商、RISC-V創始
《RISC-V能否復制Linux 的成功?》
,創建實現自有加速器算法的自定義異構集群。RISC-V作為一種ISA,我們一開始是在處理器內核中采用吸引人的通用構建塊,然后在此基礎上進行構建,同時還利用最好的商業工具增強使用者的信心。所以,IP
發表于 11-26 20:20
RISC-V,即將進入應用的爆發期
計算機由控制整體的CPU(中央處理器)和加速器兩部分構成。在AI計算中,功耗和效率是兩個關鍵因素。RISC-V架構通過其簡潔的設計和定制化的擴展,可以實現高效的能量使用。該架構能夠通過
發表于 10-31 16:06
RISC-V擁有巨大市場潛力的原因
旬發布了第三代“香山”開源高性能RISC-V處理器核,其性能水平已進入全球第一梯隊,可廣泛應用于服務器芯片、AI芯片、GPU、DPU等高端芯
發表于 09-30 14:20
淺談國產異構雙核RISC-V+FPGA處理器AG32VF407的優勢和應用場景
關于國產異構雙核RISC-V+FPGA處理器AG32VF407的具體優勢和應用場景淺談如下:
優勢
異構計算能力 :
異構雙核設計結合了RISC-V
發表于 08-31 08:32
萬物智聯時代,RISC-V與AI的融合之路該如何走?
人工智能與機器學習專委會主席謝濤發表了《萬物智聯時代RISC-V+AI之路》演講,分析了RISC-V與AI技術的結合及其發展路徑探索。他在發言中,盡管國產
RISC-V適合什么樣的應用場景
設計使得開發者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統的各種性能要求。
3. 人工智能(AI)和機器學習(ML)
高性能計算:RISC-V結合AI加速器或協
發表于 07-29 17:16
risc-v多核芯片在AI方面的應用
得RISC-V多核芯片能夠更好地適應AI算法的不同需求,包括深度學習、神經網絡等,從而提高芯片的性能和效率,降低成本,使AI邊緣計算晶片更具競爭力。
再者,RISC-V的多核設計可以進
發表于 04-28 09:20
第三代“香山”RISC-V 開源高性能處理器核性能進入全球第一梯隊
中科院計算技術研究所、北京開源芯片研究院共同創新,成功推出第三代“香山”開源高性能RISC-V處理器核,這也是首個基于開源模式、采用敏捷開發方法、多方協作開發的處理器
芯來科技正式發布基于RISC-V處理器的HSM子系統解決方案
本土RISC-V CPU IP領軍企業——芯來科技正式發布基于RISC-V處理器的HSM子系統解決方案,提供專業有效的信息安全保護以及加解密功能。
芯來科技發布AI專用RISC-V處理器內核NI900系列
在AI技術迅速發展的當下,RISC-V CPU IP領域的領軍企業芯來科技,正式發布了針對人工智能應用的專用處理器產品線——Nuclei Intelligence (NI)系列。作為該系列的首款產品,NI900系列內核,專為
評論