神經網絡計算芯片已經引起了全球各個學院/企業的廣泛關注,“軟件定義芯片”相關研究,適應AI算法不斷變化的重要研究方向。但是芯片的性能跟通用性常常是一個“魚和熊掌不可兼得”的選項,如何讓AI芯片兼備性能和通用性?
在機器學習算法不斷變化、人工智能應用不斷增多的當下,神經網絡計算芯片(AI芯片)的設計者們所思考的一個關鍵問題開始浮出水面——如何在保證AI芯片性能/功耗表現優秀的同時,盡可能的在更多人工智能算法上通用。
目前市面上陸續涌現的AI芯片中,有不少都采用了重新設計芯片底層架構的方式,來平衡AI芯片的性能與AI算法通用性之間“魚與熊掌不可兼得”的矛盾,突出玩家有寒武紀、谷歌TPU項目等等。
產業界如此熱火產天的發展,離不開學術界此前的長久積累。在過去的十幾年里,清華微電子所的可重構計算團隊一直在研究一項核心技術——“軟件定義芯片”,前年,他們推出了一款代號為Thinker 1的AI芯片,這款芯片不僅能夠支持人臉識別、語音識別的AI算法,而且芯片的功耗非常小——只需要7號AA電池就夠讓它運行一整年。
在2018年的春節前夕,記者專門來到清華大學校園里,與GTIC 2018重磅嘉賓之一,清華大學微電子研究所所長、中國半導體行業協會IC設計分會理事長、我國半導體行業“男神”級人物魏少軍教授圍繞著AI芯片的話題展開了獨家對話。魏少軍教授有著數十年半導體行業經驗,對我國半導體產業有著深刻的認識,看法往往一針見血。
他認為,目前芯片架構創新已經引起了全球各個學院/企業的廣泛關注,尤其是“軟件定義芯片”相關研究,更是提升AI芯片的應用范疇、適應AI算法不斷變化的重要研究方向。在今明兩年之內AI芯片將持續火熱,但是到了2020年前后則會行業洗牌,出現第一批出局者。
一、性能 vs 靈活:魚與熊掌不可兼得
芯片的性能跟通用性常常是一個“魚和熊掌不可兼得”的選項,傳統架構下,一個芯片在某些特定領域的性能越強、功耗越低,它往往就越不靈活、越不通用。舉個例子,華為Mate 10里的麒麟970芯片用于手機的性能非常強大,但是它并不適用于安防攝像頭、可穿戴手環等場景;同理,一個CPU能夠靈活地處理眾多不同任務,但是它在某些特定任務上往往性能不夠強大,比如在深度神經網絡訓練上的性能不如GPU。
而ASIC這類專用芯片的位置,則介乎于手機SoC這類標準芯片、與CPU這類通用芯片之間——這是一個非常尷尬的地位,標準芯片雖然單個開發成本高,但是單一品類出貨量非常大,很大程度上降低了芯片的單個價格;而通用芯片則相反,雖然總體出貨量不高,但是單一品類的價格很高,也能夠分攤研發成本。
隨著芯片制造工藝的日益先進(目前已經逼近7nm),芯片制造成本也水漲船高,如今設計制造一顆10nm芯片的成本要幾千萬美元,綜合成本高達上億美元。
因此,如果不能保證某款單一應用場景下能夠大量出貨,專用芯片需要保持一定的通用性與靈活度。
最近兩年間,產業界開始陸續涌現出神經網絡計算專用芯片(AI芯片),寒武紀、深鑒科技、中星微電子等玩家的AI芯片產品采用的都是28nm的芯片工藝,前期從投入到流片的成本超過400萬美元,單一品類出貨量沒有百萬的級別將很難收回成本。
而除了成本之外,AI算法的演進也需要納入考慮。由于目前人工智能算法還在不斷變化、不斷演進的過程中,人工智能經歷了六十多年的發展才迎來了深度學習的大規模爆發,然而現在深度學習算法還有眾多有待優化的方面,比如稀疏化、低功耗、小數據訓練等,算法尚未定型。
此外,目前語音/文字/圖像/視頻等不同應用無法使用統一算法,然而許多實際生活中的AI應用程序(識別圖像中的對象或理解人類語言)需要不同類型的具有不同層數的神經網絡的組合。
因此,在確保AI應用性能的前提下,AI芯片需要盡可能地保持芯片通用性。
目前AI芯片企業們采用的技術方案各不相同,如果將芯片通用性作為評測坐標軸,最左邊、最激進的企業會采用算法固化方案,這一做法成本低、芯片落地時間短、單一算法的性能與功耗比能夠做到極致,但是極大減少了芯片的通用型和靈活性;最右邊的團隊(比如寒武紀、谷歌TPU等)則會設計一款全新的芯片架構,這一做法成本高昂、芯片研發周期長,但是能夠在性能與芯片通用性上達到極好的平衡。
▲清華微電子所所長魏少軍教授
清華微電子所的可重構計算團隊就屬于坐標軸右邊的一類,從2006年開始,清華微電子所所長魏少軍教授就帶領著團隊在持續深入研究這項重要技術——“軟件定義芯片”,又稱“可重構計算技術”。
“軟件定義芯片”顧名思義就是讓芯片根據軟件進行適應與調整,這是一項專用芯片架構設計上的創新,與傳統的馮諾依曼架構有著很大的區別。簡單來說就是將軟件通過不同的管道輸送到硬件中來執行功能,使得芯片能夠實時地根據軟件/產品的需求改變功能,實現更加靈活的芯片設計。
也就是說,沿用這種架構設計出來的專用芯片,可以讓芯片的計算能力按照軟件的需求來調整適應,而不是沿用傳統芯片設計的剛性架構,讓應用適應架構。對于現在尚未定型/統一的各類AI算法而言,可重構計算成了AI芯片設計的一個重要研究方向。
二、Thinker AI芯片:語音圖像雙識別、一節電池用一年
前年(2016年),依照可重構計算芯片的框架,魏少軍教授團隊中的尹首一副教授帶隊設計研發了一款代號為Thinker 1的可重構混合神經網絡計算芯片。
這款芯片不僅可以動態地調整計算和內存需求,使得芯片能夠支持人臉識別和語音識別的神經網絡應用,而且芯片的功耗非常小——只需要八節7號AA電池就夠讓它運行一整年。
Thinker 1不僅在AI性能與算法通用性上取得了突破性的進展,還獲得了學術界的重要認可,在2017 ACM/IEEE ISLPED國際低功耗電子學與設計會議上,Thinker1獲得了設計競賽獎,這是中國大陸單位首次以第一完成單位獲得此獎項。
魏少軍教授告訴記者,Thinker 1是一塊實驗性質的驗證芯片,為了證明“軟件定義芯片”這一架構在AI芯片設計中的可行性——效果出奇的好。隨后,可重構計算團隊又打造了兩款Thinker系列芯片,分別為Thinker 2人臉識別芯片,能夠做到6ms人臉識別(iPhone X為10ms)、準確率超過98%;以及Thinker S語音識別芯片,不僅功耗只有200多微瓦,只需要一節7號AA電池就運行一整年,而且可以進行聲紋識別。
▲清華大學微電子所提供的Thinker芯片的顯微照片
Thinker可以嵌入到很多小型設備中,包括智能手機、手表、家用機器人、或遠程控制的儀器設備等。目前,研究團隊與廠商溝通Thinker芯片的產業化方案,此前也有報道稱最快今年三月我們就能看到第一款搭載Thinker芯片的端智能產品。不過清華微電子所將會將這一技術授權予企業使用,高校本身不會進行產業化。
魏少軍教授說,清華微電子所在可重構計算上已經投入了十多年的研發,此前一直將重心放在在其他芯片的研究上,將這一架構用于AI芯片的設計并且能取得如此好的效果,完全是“意外之喜”。下一步,可重構計算團隊將會加大基礎研究(尤其是編譯器等相關軟件)的研發投入,并且進一步推動產業應用與企業合作的進程。
除了人工智能(AI)外,這項技術在信息安全芯片、可編程邏輯器件、可穿戴計算芯片等領域都獲得了批量應用。魏少軍教授帶領的可重構計算團隊也獲得了國家863計劃兩期支持、2015年國家技術發明二等獎、2014年教育部技術發明一等獎等國家榮譽。
去年12月,清華微電子所、瀾起科技、英特爾還聯合推出了基于此項技術研發的津逮服務器CPU,不僅能夠大幅提升云端服務器的計算能效,還能實時監測、甄別和管控,極大增強CPU芯片的硬件安全性。
三、AI芯片廣泛用于安防監控?“可能走錯路了”
目前AI應用仍處于早期階段,主要還是集中在互聯網應用,需要在云端處理,端智能方面并沒有較多普及。
在這一輪興起的人工智能(AI)浪潮中,最為火熱、最頻繁地被人提起的落地行業莫過于安防了——或者更準確來說,是基于安防監控攝像頭的人臉識別應用。這不僅是眾多AI芯片、AI平臺應用廠商都在瞄準的行業,各家傳統安防巨頭也都躍躍欲試瞄準了AI+安防。
然而在交談中,魏少軍教授向記者提到,現在的AI芯片應用在視頻監控上,很有可能是走錯路了。
由于目前的安防監控智能化還是以人臉識別為主,然而在廣場、車站等遠距離、廣泛監控的場景下,根本沒可能看清人臉,
這些場景的人臉識別項目雖然是個看似純技術角度可行的項目,然而一旦設計光照、遮擋、攝像頭清晰度、以及可承載的芯片算力、網絡帶寬等工程化問題,情況就會變得非常復雜。
▲2008年北京奧運會人臉票證
一位有著傳統芯片廠商與安防廠商雙背景,曾參與過2008年奧運會“刷臉門票”、天安門廣場安防布控等項目的AI芯片初創CEO也曾經告訴我類似的結果,中遠距離內大型廣場內的人臉識別項目——比如天安門廣場人臉識別項目——根據去年天安門分局的調研結果顯示,這項目仍舊有著巨大的實現難度,是個美好的“理論幻想”。
如果我們按照智能攝像頭車牌識別的技術類推,經過了十幾年的技術演進、形態變遷后,目前北京市共有65萬路交通攝像頭,其中能夠進行智能車牌識別的只有公安的3000路、停車場的3萬路,而且是只有在光照、畫面對其等問題都解決了,才能在特定路口、特定場景下實現——而人臉識別遠比車牌識別要復雜得多。
因此,AI安防雖然可以在局部場景(比如中短距離、室內監控、門禁刷臉、車輛識別等)落地,但是離真正的安防廣泛應用還差得很遠。魏少軍教授說,AI只是方法、AI芯片只是手段,但是最重要的還是AI的應用落地。
結語:AI芯片2020年或將進入洗牌期
魏少軍教授認為,我國的芯片工藝技術與發達國家相比,還存在兩三代工藝的差距;我們原來希望在2020年以前,與國際最先進制造工藝水平的差距,不要大于兩代,現在看來實現較為困難。此外,在芯片行業的人才、產能、研發、設計等幾大重要因素上,我們的產業缺口仍就比較明顯。
我國的芯片產業目前在高端芯片的發展上遇到了很多挑戰,如果我們依舊遵循傳統的架構以跟隨的腳步進行發展,將會始終落后于人——因此,從芯片設計底層架構上的創新尤為重要。目前我們在軟件定義芯片、AI芯片等這類傳統芯片業的“破冰者”方面已經取得了不錯的研究成績,值得加大投入力度。
魏少軍教授認為,從產業發展規律來看,在今明兩年之內AI芯片將持續火熱,大家扎堆進入;但是到了2020年前后,則將會出現一批出局者,行業洗牌開始。由于目前AI算法還在不斷演進匯總的過程中,最終的成功與否則將取決于各家技術路徑的選擇和產品落地的速度。
評論
查看更多