在評估AI硬件時,規格競賽(能效、性能和對各種算法的支持)絕對是重要的。
但是,當系統公司把在GPU上開發的AI模型移植到其他類型的硬件時發生的精度損失怎么處理呢?這就是DeepX的特色。
上周,AI芯片初創公司DeepX的創始人Lokwon Kim,在加州Santa Clara的展會上推出了一系列AI加速器。Kim聲稱,這些芯片將實現“無處不在的AI,人人可用的AI。”
Kim選擇了嵌入式視覺峰會作為他的首次公開亮相。需明確的是,DeepX是一個剛加入這個擁擠賽道的初創公司。然而,DeepX在韓國卻有著深厚的根基。通過向韓國政府積極地營銷,Kim已經把DeepX在AI領域的研發變成了一個國家項目。
DeepX從政府那里籌集了4000萬美元,還在韓國的風投圈中籌集了2000萬美元。根據Kim的說法,今年晚些時候將計劃進行B輪融資。
DeepX正在推出一系列用于邊緣設備嵌入式視覺產品的AI加速器。它還開發了包括編譯器和運行時在內的軟件開發套件DXNN。DeepX認為DXNN是其皇冠上的明珠。
據報道,DXNN可以簡化深度學習模型部署到DeepX的AI SoC的過程。其編譯器提供了高性能量化、模型優化和NPU推理編譯的工具。其運行時包括NPU設備驅動程序、帶有API的運行時和NPU固件。
最重要的是,該公司聲稱,DXNN支持“以浮點格式訓練的DNN模型的自動量化”。
DeepX并沒有憑空創造出其AI硬件架構。Kim說,自2016年創立公司以來,“我們實際上已經與數百家全球公司坐下來進行了面談。”
Kim觀察到,“可擴展性、AI精度以及功率/性能效率”是邊緣AI系統開發者一直在苦苦掙扎的三個領域。DeepX的目標是在其AI加速器上實現GPU級的AI精度,同時提供高吞吐量和低功耗。
DeepX的源起
在DeepX之前,Kim是Apple的AP的首席設計師,參與開發了A10、A11 Bionic和A12 Bionic。
Kim創辦DeepX的靈感來源于他2010年在IBM的T.J. Watson研究中心做訪問學者的經歷。他當時的工作是開發深度學習MPU,這是DARPA指派給IBM的一個項目。
當時Kim是UCLA的博士生,自那以后,他一直沉迷于在MPU上運行DNN的想法。
即使在加入Apple后,Kim也一直堅持著自己的AI創業夢想。“我實際上已經把我的想法帶給了Apple的高層管理人員。”他們拒絕了,于是Kim結束了在Apple的工作,并返回韓國。
Kim表示,他非常敬仰張忠謀。半導體行業對張忠謀的貢獻有很大的感激之情。張忠謀離開美國,在臺灣創辦了TSMC。這個起初并不被看好的企業最終成為了全球最大的代工巨頭。
Kim說,TSMC對臺灣的重要性(無論是經濟上還是政治上)已不言而喻。通過利用AI的力量,Kim希望在他的祖國取得類似的重要地位。
這是一個大膽的說法。但是Kim的想法反映了這個時代。無論是好是壞,地緣政治已經成為先進半導體發展的內在因素。
戰略
DeepX設計了同屬一系列的四款AI加速器,所有的焦點都集中在視覺應用上。其策略是為多個邊緣視覺AI領域提供可擴展的解決方案。
DX-L1,適用于IP攝像頭、車內監控、機器人攝像頭和無人機等攝像頭應用。
DX-L1包含四核RISC-V、ISP、MIPI和視頻編碼器,提供12 eTOPS的AI性能。Kim指的eTOPS是“相當于GPU的TOPS的性能度量標準”。
DX-L2支持3-4個攝像頭的邊緣AI視覺系統,提供38 eTOPS。
DX-M1,配備了雙核ARM核和ISP,支持10個攝像頭,提供200 eTOPS。
DX-H1,提供1600 eTOPS,將以PCIe卡的形式生產,可以部署在能夠執行大規模AI操作的邊緣服務器中。通過支持10,000個攝像頭,DX-H1可以服務于安裝了大量監控攝像頭的工廠。H1具有與M1類似的雙核ARM核和ISP模塊。
所有四種芯片都由三星代工,其中L1和L2采用28nm制程。M1是14nm,H1則使用5nm工藝。價格范圍從10美元(L1)、20美元(L2)到50美元(M1)和1500美元(H1)不等。
準確性
除了提供低功耗和性能效率外,DeepX還將資源集中在量化工作上,以保證GPU級的準確性。
基于自身經驗,DeepX專注于解決準確性降低的問題上。Kim指出,將原本在浮點格式GPU上訓練的AI模型移植到其它硬件上,都會導致準確性降低。
因此,DeepX的團隊尋找了每個數據路徑中準確性降低的點。結果就是DeepX在其SDK,即DXNN中稱之為“世界頂級的量化器”。
市場細分
過去幾年中,許多AI硬件創業公司被汽車行業所誘惑,夢想著他們的AI芯片將成為下一代車輛平臺的計算機大腦。
相反,Kim得出的結論是,對于一家初創公司來說,向車廠銷售AI芯片是一個糟糕的選擇。因為汽車芯片需要經過漫長的驗證時間,ASIL B和C等認證作業增加了很多困難。即使解決了這些障礙,芯片銷量也微乎其微。
相反,Kim的策略是與車廠合作,為DeepX MPU授權IP,包括軟件。Kim解釋說,DeepX一直被OEM忽視,現在卻開始收到OEM要求評估DeepX芯片的請求。
這可能意味著兩件事。
首先,許多歐洲車廠向Kim暗示,他們對下一代車輛平臺仍未做出決定。
其次,一些領先的車廠已經投入資源使用Nvidia的GPU開發自己的AI模型。但現在,當他們將模型移植到其他硬件上時,準確性降低問題正在出現。這迫使他們重新尋找另一種AI硬件解決方案。
Kim表示,DeepX只會為車廠提供IP授權。對于其他應用領域,其業務模式則是直接銷售芯片。
Kim表示,DeepX的AI芯片的最佳應用場景是機器人,無論是配送機器人還是在工廠內作業的機器人。
Nvidia顯然已經通過GPU贏得了AI市場。然而,AI競賽的下一章或許在于如何將在GPU上訓練的AI模型有效地移植到非GPU硬件上。
審核編輯:劉清
-
加速器
+關注
關注
2文章
799瀏覽量
37874 -
SoC設計
+關注
關注
1文章
148瀏覽量
18774 -
MPU
+關注
關注
0文章
359瀏覽量
48803 -
NPU
+關注
關注
2文章
284瀏覽量
18613 -
ai硬件
+關注
關注
0文章
12瀏覽量
2400
原文標題:DeepX的AI加速器能夠脫穎而出嗎?
文章出處:【微信號:Astroys,微信公眾號:Astroys】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論