電子發燒友網報道(文/莫婷婷)當下,英偉達、AMD兩大巨頭占據全球超過80%的通用GPU市場。在算力需求激增的情況下,多家國內企業選擇加入通用GPU賽道,例如天數智芯、沐曦、壁仞科技、登臨科技等。就在2021年3月,天數智芯發布全自研云端訓練通用GPU芯片——天垓100芯片,這也是國內第一款全自研、GPU架構下的7nm制程通用GPU訓練芯片。
電子發燒友網記者了解到,天數智芯的7nm 通用GPU訓練芯片已經獲得安防、人工智能、超算中心等多個應用領域的客戶訂單,未來將持續往5nm、3nm等更高級的制程發力。那么,國內通用GPU芯片量產的技術瓶頸在哪里,國內企業如何實現突圍?記者就相關問題與天數智芯副總裁郭為進行了交流。
為什么國產通用GPU芯片量產難度大?
通用GPU即通用圖形處理器,可用于人工智能模型訓練與推理,以及高性能計算。與CPU相比,GPU的平行處理能力、處理速度都優于CPU,這也加強了GPU的通用性,而通用GPU的出現讓GPU更加專注通用性。可以說,通用GPU就是GPU里的另一個快速發展的細分市場。
市場機構的數據顯示,2019年我國通用GPU芯片的市場規模已達86億元,預計到2025年將保持32%的年復合增長率,達458億元。面對如此巨大的市場,國內企業涉足通用GPU市場,面臨哪些挑戰?郭為向記者表示,通用GPU芯片在設計上主要面臨的是兩大挑戰,一是通用架構,二是軟件生態。
在架構方面,通用架構需要適配各種各樣的算法,包括基礎計算;同時考慮到應用場景的特殊性,對芯片功耗也有要求,這就需要對芯片架構的優化和設計,實現低功耗高算力;另一方面,記者了解到國內在人才方面還面臨較大的缺口,培養一位成熟的工程師需要10年的時間。
在軟件生態方面,通用GPU不僅僅是一顆芯片硬件,還涉及到整個軟件棧、編譯器等一系列的軟件生態系統。
為了突破技術瓶頸,天數智芯從2018年開始正式啟動通用GPU芯片設計,歷時三年最終量產國內首款全自研的7nm 通用GPU芯片。據了解,該芯片采用2.5D CoWoS晶圓封裝技術,集成240億晶體管,支持多精度數據類型支持標準/混合訓練。在軟件上,該芯片兼容主流生態系統,采用自主研發的軟件棧,從多方面實現算力升級。
目前,一些國際巨頭在GPU行業中仍處于領先位置,國內廠商需要突破重重挑戰才能實現GPU突圍。郭為也提到,英偉達經過十幾年的發展,不僅有自主完善芯片架構,同樣也有完善的軟件生態,相對于軟件生態,它具有豐富的軟件接口、底層加速庫,通用GPU芯片的入場門檻更高,這些都是國產企業需要追趕的。
正是因為通用GPU行業的高門檻,天數智芯的不易與成功也讓國產企業看到了另一個可能性。
天數智芯推出7nm通用GPU芯片時便得到了業內人士的認可。中國工程院院士倪光南表示,該芯片在性能指標方面并不亞于國外主流產品。電子發燒友網了解到,天數智芯的“天垓100芯片”比業內同類芯片的面積小了一半,卻實現單精FP32性能37TFlops,半精FP16/BF16性能147TFlops。
國產通用GPU芯片落地,深挖應用場景
國產通用GPU芯片在AI領域將打開大規模的應用市場,而這些都需要云端訓練。以安防攝像頭為例,攝像頭在工作過程中,需要進行車輛識別、人臉識別等,這部分更重要的是依賴云端訓練出的模型,進行大量推理。
郭為提到,通用GPU芯片還可以用于安檢機,以及快遞行業,對大量的物品進行識別,不管是安防還是快遞行業,這些行業對模型訓練以及模型推理的速度要求都非常高。在這方面,天數智芯已有客戶帶來了落地應用案例。
通用GPU芯片最典型的應用場景是在人工智能,但隨著技術的成熟,通用GPU芯片在5G、自動駕駛、大數據等領域的應用不斷擴增。
自動駕駛最重要的是安全性,車上有大量的傳感器獲取路面情況,這些數據將被整合,再通過預先訓練的模型預測路況,可以迅速作出決定。郭為指出,在這個過程中,需要大量的算力,同時考慮到汽車空間、電池功耗等問題,將大功耗或者大算力系統放在汽車內部也不太適合,最值得考慮的解決方案是將系統放在邊緣側,同時因為它需要迅速作出決定,要求邊緣側和汽車之間的通訊盡量地做到低時延,5G恰好可以實現這樣的低時延。
在這些處理過程中,都需要用到通用GPU芯片。郭為認為,在達到理想的高算力低功耗的技術下,未來可以把高端的高算力的芯片直接放在汽車上面,應用場景也就更廣了,這也是未來幾年業內的研究方向。
對于未來的發展戰略,天數智芯副總裁郭為提到了三大方面:
一是更強的算力。任何一個AI應用的模型都會越來越復雜,要求提供更高的算力,同時芯片制成提升會帶來邊際效應收窄,這時該如何進一步提升算力,實際上是任何一個通用GPU芯片都會面臨的技術挑戰。另一方面,自動駕駛、智慧醫療等各個行業的算法也在不斷演進,此時,對于訓練芯片來講,更高的算力才能支持相應的算法運行。
二是更高的通用性。由于技術的快速迭代,云端訓練芯片一定要有更高的通用性才能跟上智能駕駛、智慧醫療等高端市場需求。
三是隱私計算。智慧醫療場景涉及到患者,甚至醫院的醫療數據隱私。而任何一個AI模型都需要大量的數據做訓練,這時需要用到隱私計算,通過隱私加解密的方式,讓這些敏感的數據做到可用。
“對于醫療這樣的場景,隱私保護是相當重要的。云端訓練芯片關于隱私保護這部分的解決方案,以及通用計算,也應當是后面的發展趨勢?!惫鶠楸硎荆鞌抵切驹谖磥頃钔陔[私保護的相關應用場景,并且推出解決方案。
小結
如今,國內企業不斷發力通用GPU芯片市場,隨著技術的成熟也將給更多的應用場景帶來多樣化的可能性。當然,國內企業還需正視與國際企業的差距,并且在追趕的過程中,不斷縮小差距,讓國內的通用GPU芯片打開真正的用武之地。
-
AI
+關注
關注
87文章
30979瀏覽量
269249 -
GPU芯片
+關注
關注
1文章
303瀏覽量
5823 -
天數智芯
+關注
關注
0文章
95瀏覽量
5545
發布評論請先 登錄
相關推薦
評論