8月1日消息,又一支清華芯片團隊取得重大突破!來自清華的“天機”類腦芯片架構登上了頂級學術雜志《自然(Nature)》封面。
28nm的天機芯片由156個FCores組成,面積為3.8×3.8毫米,包含大約40000個神經元和1000萬個突觸,可以同時支持機器學習算法和類腦電路。
據智東西了解,“天機”類腦芯片項目脫胎于清華精密儀器系,是清華精密儀器系教授、腦計算中心主任施路平教授帶隊主導的類腦芯片項目之一。
2018年1月,“天機”團隊注冊成立了北京靈汐科技,董事長兼CEO為祝夭龍。靈汐科技于2018年8月披露了其天使輪融資,投資方來自華控基石基金、優選資本、清華控股。
而本篇Nature論文的第一作者裴京也是靈汐科技的監事,施路平教授則為靈汐科技公司董事。
脫身清華,落地靈汐科技
這篇論文名為《面向通用人工智能的異構融合芯片架構“天機”(Towards artificial general intelligence with hybrid Tianjic chip architecture)》
這篇論文中介紹了清華團隊的“天機”類腦芯片架構,它不僅算力高、功耗低、支持多種不同AI算法、而且采用了存算一體技術,不需要外掛DDR,能夠節省成本功耗和空間。
在論文中,研究團隊描述了這種芯片如何幫助機器響應語音命令,識別周圍世界,避開障礙并保持平衡。
而在附上的視頻中,“天機”團隊還展示了搭載該芯片的自動駕駛自行車
是如何自動控制平衡、并在操場上對目標人物進行識別、跟隨、自動避障。
施路平教授表示,此次發表在《自然》的論文是一個非常初步的研究,人工通用智能是一項非常具有挑戰性的工作,目前還處于起步階段。他和團隊的研究愿景是——“發展類腦計算,支撐人工通用智能,賦能各行各業”。
據他透露,目前,團隊已經啟動了下一代芯片的研究,預期明年年初可以完成研發工作。
“天機”芯片技術拆解
“天機”是一種推進人工通用智能(AGI)發展的異構融合芯片架構,結合了神經科學導向和計算機科學導向方法的優點。
在論文中,作者用一個無人自行車系統驗證了這一異構融合芯片的處理能力。試驗中,僅用一個芯片,無人駕駛自行車系統即可同時處理多種算法和模型,不僅可以識別語音指令、實現自平衡控制,還能完成對前方行人的實時檢測和跟蹤,并完成自動過障、避障和平衡控制等任務。
據論文介紹,發展人工通用智能的方法主要有兩種,一種基于計算機科學導向,另一種基于神經科學導向。
據負責芯片設計和算法細節的論文作者鄧磊介紹,此前,市面上的深度學習加速器通常只支持計算機科學模型,神經形態芯片只支持神經科學模型。
兩類方法依賴不同且不兼容的平臺,在一定程度上延緩了人工通用智能的發展,因此需要一個可以支持通用的基于計算機科學的人工神經網絡以及神經科學啟發的模型和算法的通用平臺。
研究團隊由此提出天機芯片(Tianjic chip),同時支持計算機科學模型和神經網絡模型。
鄧磊表示,天機芯片能做到兩者都支持,同時支持神經科學發現的眾多神經回路網絡和異構網絡的混合建模。因為兩類模型所使用的語言、計算原理、編碼方式和應用場景都不相同,實現這兩種模型深度高效的融合,是天機芯片設計中最大的挑戰。
天機芯片采用多核架構、可重構的構建模塊和采用混合編碼方案的流線型數據流,不僅可以適應基于計算機科學的機器學習算法,還可以輕松實現腦啟動電路和多種編碼方案。
研究團隊的一項重要創新是高度可重構的的統一功能核(FCore),它結合了人工神經網絡和生物網絡的基本構建模塊——軸突、突觸、樹突和體細胞塊。
28nm的天機芯片由156個FCores組成,面積為3.8×3.8毫米,包含大約40000個神經元和1000萬個突觸,可以同時支持機器學習算法和類腦電路。
天機芯片提供超過每秒610千兆字節(GB)的內部存儲器帶寬,以及運行人工神經網絡的1.28 TOPS的峰值性能。
在生物啟發的尖峰神經網絡模式中,天機芯片實現了每瓦約650千兆每秒突觸操作(GSOPS)的峰值性能。該研究團隊還展示了與GPU相比的卓越性能,其中新芯片的吞吐量提高了1.6-100倍,電源效率提高了12-10000倍。
研究團隊設計了一個無人駕駛自行車實驗,來評估芯片整合多模態信息和做出迅速決策的能力。
該自行車配備天機芯片和IMU傳感器、攝像頭、轉向電機、驅動電機、調速電機、電池。自行車可以執行實時物體檢測、跟蹤、語音命令識別、騎行減速帶、避障,平衡控制和決策等任務。
研究小組開發了各種神經網絡(CNN、CANN、SNN和MLP網絡)來完成每項任務。這些模型經過預訓練并編程到天機芯片上,可以并行處理模型,實現不同模型之間的無縫片上通信。
在實驗中,采用天機芯片的無人駕駛自行車順利完成了所有分配的任務,這標志著加速AGI發展的巨大飛躍。
研究小組還指出:“通過隨機將新變量實時引入環境中可以產生高時空復雜性,例如不同的道路條件、噪聲、天氣因素、多種語言、更多人等等。通過探索允許適應這些環境變化的解決方案,可以檢查對AGI至關重要的問題,比如概括、穩健性和自主學習。”
低功耗、低成本、高算力
在去年10月的安博會上,靈汐科技也向智東西展示了其110nm工藝的第一代、28nm的第二代“天機”架構的類腦芯片,主打云端智能市場。
靈汐科技告訴智東西,由于繞過了HBM內存技術對AI芯片性能和成本的限制,靈汐科技的芯片與市場同類產品比起來,具備低功耗、低成本、高計算力的優勢。
“天機”架構采用優化過的眾核架構,由一系列核構成陣列完成神經網絡的計算。在摩爾定律即將失效的今天,在現有的工藝基礎上,從優化架構入手可能是提高芯片性能最重要的手段。
據靈汐科技介紹,“天機”架構已經超越了傳統的馮諾伊曼結構,不像傳統架構的芯片一樣在計算的時候必須與DDR進行大量的數據交互而受存儲帶寬的限制,使整個芯片的性能受到影響。
這也是“天機”架構芯片算力高的一個極其重要的原因。因為不用從外部導入數據,因此它的功耗比較低,也節省了成本和空間。
結語:類腦芯片,AI計算新藍海
類腦芯片其實并不是一個新話題了。早在2014年,IBM就推出了業內首款類腦芯片TrueNorth。目前國內外有許多公司和機構正在類腦芯片研發上投入大量精力。
據靈汐科技介紹,與當前市面上其他AI芯片架構相比,“天機”類腦芯片的主要優勢有:
1、算力高;
2、功耗低;
3、存算一體,不需要外掛DDR,節省成本功耗和空間;
4、算法的支持度靈活,既能高效支持人工神經網絡算法,又能高效支持SNN算法;
5、擴展性好,能得到極大算力的芯片陣列,而且算力效率不會下降;
6、支持多核重組特性,可以實現多任務并行處理。
就在今年7月16日,英特爾也發布了“Pohoiki Beach”芯片系統,該系統主要由Loihi神經擬態芯片構成,可處理深度學習任務,速度比CPU快1000倍,效率高10000倍,耗電量小100倍。
Pohoiki Beach系統由64塊Loihi芯片的800萬個所謂的神經元構成。Loihi芯片是英特爾公司2017年首次推出的AI芯片,是一款模仿人類大腦的神經擬態芯片。
相比于傳統芯片,類腦芯片的確在功耗上具有絕對優勢,完成同一個任務所消耗的能源有時甚至比傳統芯片節省高達1000倍。
同時類腦芯片的集成度也非常高,拿浙大推出的“達爾文”芯片來說,其面積為25平方毫米,也就是說邊長只有0.5厘米,但內部卻能包含500萬個晶體管。
隨著行業對計算力要求越來越高,馮氏瓶頸將越來越明顯,顛覆傳統架構的類腦芯片已為芯片行業開啟了一扇新的大門。
本文來自智東西微信號,本文作為轉載分享。
評論
查看更多