“摩爾定律不可能永遠適用,芯片性能升級遇到了世界性瓶頸,這剛好是我們追趕的最佳機遇。”王東琳說。
目前,5G正處于標準確定的關(guān)鍵階段,今年6月,國際標準組織3GPP即將完成5G第一版本國際標準。同時政策利好也不間斷,4月24日,發(fā)改委、財政部發(fā)布通知,將降低5G公眾移動通信系統(tǒng)頻率占用費標準……
5G技術(shù)不僅能支持包括汽車在內(nèi)的各類機器人順暢地互聯(lián)互通,也將是智能手機、智能家居、人工智能、大數(shù)據(jù)及云計算等多個領(lǐng)域?qū)崿F(xiàn)“質(zhì)”的升級的基礎(chǔ)技術(shù)。
面對這股迎面而來的5G浪潮,中國的芯片行業(yè)準備好了嗎?雖然道阻且長,但以華為海思為代表的中國智造依然讓人期待。目前在基帶領(lǐng)域,華為海思是唯一可與高通相比的中國公司,這是華為30多年來各種要素積累的結(jié)果,也非一蹴而就。
而在創(chuàng)業(yè)公司層面,也有一家公司顯得尤為特別:脫胎于中科院自動化研究所、原國家專用集成電路設(shè)計工程技術(shù)研究中心(1992年組建)的思朗科技,由該中心原主任、原中科院自動化所所長王東琳博士帶隊,已經(jīng)研制出高性能領(lǐng)域微處理器MaPU, MaPU首次實現(xiàn)了代數(shù)算法級全局優(yōu)化且高度可編程,已于2015年流片成功。
MaPU不僅完全可以實現(xiàn)國際巨頭的可編程處理器的性能,而且功耗比可媲美ASIC。基于MaPU,思朗科技進一步研制出了三大領(lǐng)域處理器:面向5G通信領(lǐng)域的UCP、面向多媒體領(lǐng)域的UMP,以及面向超算領(lǐng)域的HPP。同時,還配備了AI領(lǐng)域處理器:深度神經(jīng)網(wǎng)絡(luò)引擎NNE。
近日,在中科院自動化所,投資界采訪到了思朗科技創(chuàng)始人兼首席科學家王東琳。王東琳在國際上最早提出代數(shù)算法級“全局優(yōu)化計算”架構(gòu),基于此架構(gòu)設(shè)計的MaPU在計算能力和性能功耗比方面具有國際領(lǐng)先水平。
思朗科技創(chuàng)始人兼首席科學家王東琳
高性能領(lǐng)域微處理器MaPU
王東琳介紹,MaPU最大的特點是計算能力強,功耗低。
當前,市面常用的處理器有幾類,一類是可編程的處理器,比如英特爾、TI的處理器,因為可編程,適應(yīng)性非常廣。但是當執(zhí)行一個數(shù)學算法的時候,它的運算器的利用率一般在15%左右,高的能到20%。TI的處理器,運算器利用率最高也僅可以到40-50%。就是說這些處理器空有那么高的頻率,空有這么多資源,但它的執(zhí)行效率不高。
還有一種是不用編程的ASIC方案,它用硬件把算法流程和對算法的控制都已經(jīng)寫好了。這種實際上就是算法的加速器,因此執(zhí)行效率會非常高,幾乎可以接近100%。
很明顯,可編程處理器和ASIC之間在功耗上有著巨大的差別。ASIC的問題是,效率高,但是算法不可變,算法只要變化一點,這個芯片就不能用了。
而MaPU既可以做到接近ASIC的效率(計算資源利用率可以達到90%以上),同時也高度可編程,兼具兩者的優(yōu)勢。
以超算芯片為例,MaPU的性能功耗比全球第一
在王東琳看來,當前主流可編程處理器的核心問題在于它是傳統(tǒng)體系結(jié)構(gòu),指令層次低并試圖在運行時刻通過亂序多發(fā)射等技術(shù)盡可能實現(xiàn)局部并行執(zhí)行。這造成了芯片中計算資源利用率不高,數(shù)據(jù)IO量大,動態(tài)功耗大,整體性能功耗比不高,已經(jīng)不適應(yīng)當今社會對微處理器巨大計算能力以及極低功耗的雙重渴求。如果能從應(yīng)用算法整體來考量時間及空間等不同維度并行特性,并利用這些并行特性來進行整體性優(yōu)化整理,其內(nèi)核中的運算器的使用率將獲得大幅提高。于是王東琳和他的團隊經(jīng)過精密的測算和試驗,提出代數(shù)算法級全局優(yōu)化的解決方案。
“一條指令,就可以實現(xiàn)一個代數(shù)算法,所以叫做代數(shù)指令。傳統(tǒng)架構(gòu)的指令集都是算術(shù)運算級的指令。”王東琳介紹說,MaPU將其升級為代數(shù)級算法指令,“MaPU通過代數(shù)指令軟流水線來零延時動態(tài)重構(gòu)(與算法相適應(yīng)的)硬件架構(gòu),達到與ASIC基本相同的算法架構(gòu),實現(xiàn)整個算法的全局優(yōu)化執(zhí)行過程。”
簡而言之,MaPU既能支持應(yīng)用算法級全局優(yōu)化,又能通過高度可重構(gòu)的計算架構(gòu)與存儲體系在軟件層面實現(xiàn)的這點,可靈活適應(yīng)領(lǐng)域(5G通信、多媒體、超算或人工智能)內(nèi)各種算法,可以說MaPU集合了ASIC、FPGA、CPU的優(yōu)勢,是幾乎可以與ASIC的性能功耗比相媲美的“軟ASIC。”
“MaPU-代數(shù)運算微處理器,在并行代數(shù)運算、并行存儲體系指令系統(tǒng)和硬件架構(gòu)方面產(chǎn)生重大原始性創(chuàng)新,將微處理器硬件支撐從標量/超標量運算提升至代數(shù)運算層次,數(shù)量級地提升計算密集型領(lǐng)域微處理器能效比。”王東琳如此總結(jié)。
那么,具體的性能以及功耗比指標如何,王東琳給出了一組直觀的對比數(shù)據(jù):
以極光H1.0超算芯片為例,芯片內(nèi)部集成32個HPP處理核,雙精度浮點處理能力將達到4,659GFLOPS@64,經(jīng)評估功耗僅為40W左右,性能功耗比達到 116GFLOPs@64/W,為全球第一。
因此,MaPU應(yīng)用量產(chǎn)之后,它獨創(chuàng)的架構(gòu)優(yōu)勢將有望使我國在微處理器架構(gòu)上實現(xiàn)重大突破,在同等能耗比下釋放巨大計算能力,引領(lǐng)中國電子行業(yè)的自主創(chuàng)新發(fā)展。
對此,中科院院長白春禮在今年3月曾在媒體表示:“在高科技產(chǎn)品研發(fā)方面,中科院即將發(fā)布一款具有完全自主知識產(chǎn)權(quán)的微處理器——MaPU代數(shù)處理器,達到國際領(lǐng)先水平。相信MaPU系列處理器問世以后,將在世界計算機、通信等領(lǐng)域以及廣大消費電子市場產(chǎn)品中大放異彩。”
“MaPU的三個孩子”
在MaPU的基礎(chǔ)上,思朗科技進一步研制出了三款性能強大的領(lǐng)域處理器:5G通信領(lǐng)域處理器UCP、多媒體領(lǐng)域處理器UMP,以及超算領(lǐng)域處理器HPP。
UCP:全球首次徹底實現(xiàn)軟件定義無線電。
UCP是MaPU針對移動通信增強的通用通信處理器是5G宏基站基站處理器的芯片內(nèi)核,UCP內(nèi)核每秒可以完成5.8G定點復(fù)數(shù)FFT,每秒可以完成55GBPS的LDPC編碼以及2.5GBPS譯碼。根據(jù)初步測算,一顆含有二十個UCP內(nèi)核的基帶處理器就可以滿足64天線5G宏基站全部基帶處理需求。
“如果使用FPGS搭建5G系統(tǒng),則需要多片互聯(lián)才能實現(xiàn)系統(tǒng)解決方案,而基于FPGA的電路系統(tǒng)主頻一般<400-600MHz,片間互聯(lián)總線帶寬受限,運算能力受限,這將成為實現(xiàn)5G系統(tǒng)的瓶頸。”王東琳說。
目前UCP內(nèi)核是國際領(lǐng)先的在可接受代價下實現(xiàn)全軟件定義5G無線傳輸基帶處理系統(tǒng)的處理器內(nèi)核,王東琳將UCP定義為“移動通信領(lǐng)域徹底實現(xiàn)基帶處理的軟件定義無線電。”
除了基站設(shè)備制造商以外,UCP內(nèi)核還可以提供給5G終端制造商。由于5G標準的原因,所有終端都要重新嵌入適應(yīng)5G算法的基帶內(nèi)核(原有的基帶內(nèi)核或者DSP內(nèi)核無法應(yīng)對5G下行接收和上行發(fā)送時的大運算量),這也是UCP內(nèi)核的機會。多合一無線通信設(shè)備、各領(lǐng)域?qū)拵ё越M網(wǎng)終端也都是UCP通過全軟件定義無線電技術(shù)施展能力的空間。
UMP:依靠它智能手機、智能電視都可在線升級視聽體驗,并可為高清攝影、攝像等應(yīng)用提供超級引擎。
UMP是MaPU的第二個“孩子”,面向智能手機、智能電視的多媒體微處理器內(nèi)核。
UMP在MaPU基本架構(gòu)基礎(chǔ)上發(fā)明了更高效的并行處理架構(gòu),使得各類視頻處理運算的性能功耗比與ASIC相媲美,某些方面甚至勝出,同時還保持了高度可編程特性。
“這種特點可以使家用電視隨著電視廠家視音頻處理算法演進在線改善視音頻體驗效果,這是ASIC電視芯片無法比擬的。”王東琳表示,“同時也可以通過算法和軟件改進快速推出新產(chǎn)品。”
4個UMP內(nèi)核+1個ARM內(nèi)核構(gòu)成的超高清電視引擎芯片(功耗不超過8 瓦)可以滿足4K超高清電視的所有視音頻處理以及基于安卓系統(tǒng)電視管理的全部需求,視聽效果可以媲美索尼與三星最高端電視。14個UMP內(nèi)核+1個ARM內(nèi)核構(gòu)成的超級電視引擎芯片可以滿足8K超高清電視所有處理與計算需求。
加上思朗研發(fā)的AI領(lǐng)域深度神經(jīng)網(wǎng)絡(luò)引擎NNE內(nèi)核后,不論是智能電視還是智能手機,都可以在高清視頻、機器視覺、人機交互方面實現(xiàn)性能大躍升,讓國產(chǎn)消費電子產(chǎn)品在較低成本下大幅提高用戶使用體驗。第一款超級電視引擎芯片將于2018年底完成流片,并可以開始面向智能電視制造商進行應(yīng)用推廣。
HPP內(nèi)核超算處理器相較于Intel最新型處理器性能功耗比提高近一個數(shù)量級。
目前,MaPU的第三個“孩子”HPP內(nèi)核已經(jīng)是一項比較成熟的產(chǎn)品。
“MaPU通過架構(gòu)創(chuàng)新獲得的核心能力還是高密集度計算。”因此,王東琳一直希望通過MaPU針對通用計算領(lǐng)域增強型內(nèi)核HPP(高性能處理)構(gòu)成超算型微處理器,滿足高端服務(wù)器領(lǐng)域的需求。
從而開發(fā)了極光H1.0——超級計算類MaPU微處理器(預(yù)計年底完成流片及封測),經(jīng)設(shè)計評估極光H1.0的性能功耗比遠超國際上其它超算類微處理器,可以作為超算系統(tǒng)及超級服務(wù)器的核心處理器。
王東琳給出了一組數(shù)據(jù):
基于HPP內(nèi)核的超算處理器極光H1.0與Intel最新型Xeon Phi性能相當,但可16/32/64/128位靈活重構(gòu),性能功耗比提高近一個數(shù)量級:在提供同等64位浮點運算能力時極光H1.0(2x16個HPP內(nèi)核)功耗是40W,Intel Xeon Phi處理器是300W。
NNE:頂級深度神經(jīng)網(wǎng)處理
思朗的另一款產(chǎn)品:加速神經(jīng)網(wǎng)絡(luò)引擎NNE 繼承并發(fā)展了MaPU的“同心圓存儲體系優(yōu)化模型”,并針對深度神經(jīng)網(wǎng)絡(luò)進行了優(yōu)化,優(yōu)點是針對主流神經(jīng)網(wǎng)絡(luò),整網(wǎng)吞吐率高,訪存需求及功耗低,與英偉達深度神經(jīng)網(wǎng)內(nèi)核性能相當?shù)矢摺K祭实腘NE在存儲體系和配置深度神經(jīng)網(wǎng)絡(luò)時吸收MaPU全局優(yōu)化思想,性能功耗比上優(yōu)勢明顯。
“NNE可以支持深度學習訓練,特別支持智能推理,在視頻圖像識別方面做了專門優(yōu)化,在目標檢測、識別、視頻圖像結(jié)構(gòu)化方面具有較突出的優(yōu)勢。”。王東琳介紹。
一個可期待的應(yīng)用場景就是智能駕駛,在這個場景里,UMP可以高速處理多路攝像頭圖像并提取待識別目標;NNE負責理解判斷處理路況、車況并提供決策及駕駛控制所需要的關(guān)鍵信息;而UCP負責提供極短時延的車聯(lián)網(wǎng)通信能力。
甘坐冷板凳,堅持研發(fā)了近10年的科研團隊
思朗及其前身團隊,從2009年就開始部署新指令集體系結(jié)構(gòu)的研究,到研發(fā)出完全自主創(chuàng)新的微處理器架構(gòu)MaPU已經(jīng)經(jīng)歷了9年艱苦歲月。研發(fā)團隊系原國家專用集成電路設(shè)計工程技術(shù)研究中心的70多位核心科研人員。
2017年二季度開始,團隊開始公司化運作。
王東琳是個有技術(shù)信仰的人,團隊伙伴也是這樣。集成電路領(lǐng)域向來人才不足,人員短缺。因為做芯片等硬件太苦,收益又不高,不少優(yōu)秀學生畢業(yè)后更愿意選擇金融和互聯(lián)網(wǎng)業(yè)。做芯片就需要有工匠精神,需要頂尖的技術(shù)人才愿意沉下心做研發(fā),并能長期承受住研發(fā)成功與否的壓力。思朗科技的研發(fā)團隊做到了。
基于MaPU的幾款增強領(lǐng)域處理器在各自領(lǐng)域各有優(yōu)勢,實際上也可以組合使用,從而落地到各種不同的實際場景中:5G通信、智能手機、智能家居、超算、智能駕駛、智慧城市、機器人和無人機等等。
“摩爾定律不可能永遠適用,芯片性能升級遇到了世界性瓶頸,這剛好是我們追趕的最佳機遇。”王東琳說,“芯片是一個需要耐心的行業(yè),我們已經(jīng)做了9年,基礎(chǔ)已經(jīng)打好,接下來的重點是到實際應(yīng)用中去調(diào)整、去優(yōu)化。”
-
處理器
+關(guān)注
關(guān)注
68文章
19382瀏覽量
230463 -
asic
+關(guān)注
關(guān)注
34文章
1205瀏覽量
120600 -
5G
+關(guān)注
關(guān)注
1355文章
48487瀏覽量
565034
原文標題:從中科院到思朗科技:中國超高性能芯片的誕生之路
文章出處:【微信號:pedaily2012,微信公眾號:投資界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論