在剛剛過去的2019年,國內外產業玩家們共同推動著AI芯片的車輪向前滾動。7nm芯片還未全面鋪開,5nm沖鋒的號角已經吹響,在AI強勢侵入并顛覆各個傳統領域的同時,AI芯片的架構創新持續發酵?!癆I芯片”這個新鮮的概念在過去一年間逐漸走過了普及的階段,越來越被大眾所熟知。在行業走過野蠻生長,開始加速落地、加速整合的過程中,也有更多的AI芯片公司也開始走出屬于自己的差異化路線。
如今,AI芯片正在云計算、手機、安防監控、智能家居、自動駕駛五大場景上演新的群雄爭霸賽,包括華為、阿里、百度等巨頭企業,均拿出自己的“殺手锏”。這些“殺手锏”在不同程度上提振了自己在行業的影響力,也給產業帶來巨大變革,更讓業界看到了中國半導體行業的希望。但是,在經歷了一次次瘋狂打call之后,每次都覺得差了點什么——那種感覺仿佛就是看了一晚上網紅帶貨,但是當主播大喊“買它!”之后,卻無人下單的尷尬。
可以說,盡管去年各大廠商紛紛推出了多款產品,但至今仍然沒有任何一款產品可以稱得上“現象級爆款”。為什么出現了此種叫好不叫買的情況?不由讓筆者深感疑惑。
究其原因不難發現,覆蓋細分領域,偏離主戰場是其中的重要問題。相關調研公司數據顯示,到2022年,整體AI芯片市場規模將會達到596.2億美元,其中云端訓練+云端推斷芯片達到244億美元,占據四成以上的市場規模。毫無疑問,云端服務器市場是AI芯片的主戰場。目前的現狀是具備通用性優勢的GPGPU占據了云端人工智能主導市場,以TPU為代表的ASIC目前只運用在巨頭的閉環生態,FPGA在數據中心業務中還在嘗試階段。目前全球各大公司云計算中心如谷歌、微軟、亞馬遜、阿里巴巴等主流公司均采用GPU進行AI計算。英偉達就是在這里賺的缽滿盆滿。目前,全球主流的硬件平臺都在使用英偉達的 GPU 進行加速,AMD 也在積極參與。亞馬遜網絡服務 AWS EC2、Google Cloud Engine(GCE)、IBM Softlayer、Hetzner、Paperspace 、LeaderGPU、阿里云、平安云等計算平臺都使用了英偉達的 GPU 產品提供深度學習算法訓練服務。
反觀其他專用AI芯片廠商,在各自聚焦的細分領域都表現搶眼,但難以粉飾自身配角的地位。賽迪顧問的預測數據顯示,2019年中國對于AI芯片需求最大的市場依次為安防、零售、醫療、教育、金融、制造、交通、物流等行業。其中最大的安防市場也僅占20%,多家聚焦安防領域的AI芯片廠商在經歷了奮力廝殺后,也難以在出貨量等方面取得好成績。
而深究下去,聚焦單一領域又誘發了另一問題:成本問題。隨著芯片制造工藝的日益先進,芯片制造成本也水漲船高,如今設計制造一顆10nm芯片的成本要幾千萬美元,綜合成本高達上億美元。因此,如果不能保證某款單一應用場景下能夠大量出貨,專用芯片需要保持一定的通用性與靈活度。
最近兩年間,產業界開始陸續涌現出神經網絡計算專用芯片(AI芯片),寒武紀、深鑒科技、中星微電子等玩家的AI芯片產品采用的都是28nm的芯片工藝,前期從投入到流片的成本超過400萬美元,單一品類出貨量沒有百萬的級別將很難收回成本。
而除了成本之外,AI算法的演進也需要納入考慮。由于目前人工智能算法還在不斷變化、不斷演進的過程中,人工智能經歷了六十多年的發展才迎來了深度學習的大規模爆發,然而現在深度學習算法還有眾多有待優化的方面,比如稀疏化、低功耗、小數據訓練等,算法尚未定型。
此外,目前語音/文字/圖像/視頻等不同應用無法使用統一算法,然而許多實際生活中的AI應用程序(識別圖像中的對象或理解人類語言)需要不同類型的具有不同層數的神經網絡的組合。
因此,在確保AI應用性能的前提下,AI芯片需要盡可能地保持芯片通用性。那么問題來了:既然GPGPU如此強大,能夠大小“通吃”,為什么廠商反而顧左右而言他?其實真正的困難在于GPGPU的技術難度。
硬件角度看,最核心的是指令集。指令集的覆蓋面、顆粒度、效率等決定一款芯片能否覆蓋到足夠寬的應用市場領域,并對軟件開發和產品迭代足夠友好。無論是英偉達還是AMD的GPGPU,指令集都在千條量級,而目前國內的AI芯片指令集大多數都在百條以內。類型與數量的差別映射到硬件高效實現的復雜程度,差距是巨大的,在這方面國內的團隊還存在著一定的差距。另一個重要方面就是基于硬件層的任務管理和智能調度,這可以讓芯片從硬件層即提高算力的利用率,也就是大家常說的實際算力。大多數AI芯片的做法是完全依賴于軟件層的調度實現,但這種方式第一增加了軟件開發的復雜度,第二降低了硬件算力的利用率,第三減緩了軟件棧迭代更新的速度,這在AI領域,面向算法模型、開發環境、應用場景加速更新的大背景下無疑大大增加了產品落地與工程化的難度。
在軟件方面,毫無疑問,最重要的必然是開發生態,GPGPU通過英偉達十多年的耕耘,已經建立起了一個超過160萬開發用戶的龐大而成熟的生態-CUDA。AI芯片則需要搭建全新的生態,它會帶來兩個維度顯著的問題,第一個維度是客戶端,客戶需要冗長的適配期,從原有的開發環境切換到新的軟件生態,這不僅帶來了資源投入,推遲了業務部署時間窗口,增加了業務的不確定性,更嚴重的是不利于保護已有的軟件投資,軟件的很多部分都要重新來寫并適配,這對企業級用戶來講恰恰是非常敏感與慎重的事情。另一個維度是產品開發端,從底層芯片與系統軟件,跳過CUDA層去直接支持開發框架,必然帶來巨大的軟件投入,不停得追趕現有框架的新版本,以及生態巨頭的新框架,這在底層軟件人員缺乏的背景下矛盾顯得尤其突出。
本文在一開頭就提出了一個貌似針對產品的問題,而事實上,這還是一個關于市場的問題。能否成為爆款,一方面要看產品,另一方面還需要看市場需求。數據顯示,2018年中國AI芯片市場依然保持增長,整體市場規模達到80.8億元,同比增長50.2%。且目前依然以云端訓練芯片為主。2018年中國云端訓練芯片市場份額達到51.3%。巨大的市場前景,也引來各方諸侯前來搶奪。
除了一騎絕塵的英偉達,其他老牌的芯片巨頭都沒閑著,特別是Intel也在加緊布局通用GPU。英特爾眼饞GPU路人皆知,其背后是一段辛酸史——從開始對GPU的不屑,到基于自家的x86架構開發獨立顯卡,英特爾折騰了十年之久仍然沒做出來一款像樣的GPU。近兩年傳出消息英特爾將在今年推出首款獨立GPU,這恐怕要得益于英特爾的重金挖人——原AMD RTG顯卡部門負責人Raja、Zen架構的功勛領袖Jim Keller、顯卡技術市場總監Damien Triolet這幾位大神都在2018年被英特爾招入麾下。
而在國內,一家名為“天數智芯”的公司也宣布將在今年發布GPGPU芯片。這家公司目前圍繞GPGPU的系統研發已聚集了一支百余人的技術團隊,其中不乏AMD在美國和上海做 GPU的核心團隊成員、行業經驗超20年的世界級技術專家。
從產業發展規律來看,在過去兩年之內AI芯片將持續火熱,大家扎堆進入;但是到了2020年前后,則將會出現一批出局者,行業洗牌開始。由于目前AI算法還在不斷演進匯總的過程中,最終的成功與否則將取決于各家技術路徑的選擇和產品落地的速度。讓我們靜待2020年的第一個“爆款”早日來臨。
-
算法
+關注
關注
23文章
4612瀏覽量
92927 -
AI芯片
+關注
關注
17文章
1887瀏覽量
35038
發布評論請先 登錄
相關推薦
評論