近日,以“智算生態(tài)、共創(chuàng)共贏”為主題的ICPA智算聯(lián)盟系列論壇·第一期會議成功舉辦。
上海市經(jīng)濟和信息化委員會人工智能發(fā)展處副處長孫躍,ICPA智算聯(lián)盟理事長、商湯科技聯(lián)合創(chuàng)始人、集團副總裁楊帆發(fā)表致辭。商湯科技聯(lián)合創(chuàng)始人兼大裝置首席科學家林達華,華為昇騰計算業(yè)務CTO周斌,Graphcore大中華區(qū)總裁兼全球首席營收官盧濤,燧原科技創(chuàng)始人兼COO張亞林,上海超算科技有限公司副總經(jīng)理劉波發(fā)表主題演講,探討加速AI算力產(chǎn)業(yè)化落地和算法生態(tài)建設的共贏之道。
林達華教授發(fā)表主題為《算法框架:AI芯片與商業(yè)價值的紐帶》的精彩主題演講,他表示:“AI芯片及其所衍生出來的計算產(chǎn)業(yè)的發(fā)展,并不是任何一家企業(yè)可以單獨去達成的愿景,需要上下游不同角色的機構和廠商共同構建繁榮的生態(tài)。在這樣的體系下,商湯有著非常重要的位置,如何把技術的上下游協(xié)同在一起,也是我們共同面臨的一個課題。”本文為林達華教授演講內(nèi)容梳理。
算法是銜接應用價值和芯片算力的關鍵橋梁
人工智能和智能計算的核心就是人工智能計算芯片。無論是以GPU為代表的通用圖形處理器,還是近幾年不斷涌現(xiàn)的AI專用計算芯片,都構成了整個人工智能算力的核心。
在用戶端,AI技術在自動駕駛、智慧商業(yè)、智慧城市、智慧醫(yī)療等各種垂直領域的應用,將人工智能的價值真正帶到了生產(chǎn)、生活和工作當中。
支撐不同行業(yè)廣泛應用的背后,是一系列人工智能的關鍵算法,例如計算機視覺領域的分類、檢測、分割等等算法。
雖然這些算法會分成若干個小類別,但是在每一類上,其迭代、演進速度非常快,種類也非常多。目前,商湯面向不同行業(yè)應用已生產(chǎn)出來了超過3萬個算法模型。
這些算法模型對硬件的適配帶來了極大挑戰(zhàn),每一個模型的算法適配都需要很大工作量的投入,不同應用也涉及不同的算法。算法是銜接應用價值和芯片計算能力最關鍵的橋梁。
在人工智能領域,算法研究員并不直接在芯片所提供的底層API上寫算法,因為大部分研究員和算法工程師對芯片的體系結構并不了解,也不需要了解,術業(yè)有專攻。
因此,在銜接算法研究員和底層計算的基礎設施中間,就衍生出了深度學習框架的系列基礎軟件體系,例如TensorFlow、PyTorch、MindSpore和商湯自研的SenseParrots。每個訓練框架都在行業(yè)中扮演著不同的角色,走出了各自差異化的發(fā)展道路。
由于算法與芯片之間有多種訓練框架,不同框架又出自不同機構和企業(yè),沒有形成一個固定接口,這導致人工智能訓練芯片不僅要適配不同框架,還要支持多樣化的算法,而算法框架接口多樣化導致AI芯片對算法支持工作量劇增,這就帶來了高昂的適配成本,成為人工智能訓練芯片快速迭代、進入市場的障礙。
開源算法體系,構建高效繁榮的AI生態(tài)
構建一個能夠助力芯片發(fā)展的生態(tài),最關鍵的就是要打破障礙和瓶頸,這樣才能夠促進整個生態(tài)上下游共同發(fā)展和繁榮。如何實現(xiàn)這一目標?算法是直接支撐應用的,從智慧城市領域中的場景分類、車牌識別等算法,到醫(yī)學圖像分析領域中的語義分割、病灶檢測等算法,通常都會經(jīng)過一個基于應用場景的分解過程,最后形成一個大算法家族的族譜。
經(jīng)過多年發(fā)展,商湯在AI算法領域形成了深厚的積累,但只有將這些算法為整個業(yè)界所用,才能引導整個產(chǎn)業(yè)上下游的發(fā)展,最大限度的發(fā)揮價值。基于從應用對算法分解的認知,商湯在2018年啟動了OpenMMLab開源算法體系。
近4年來,OpenMMLab的國際影響力持續(xù)增長,目前在GitHub上獲得了58,000個Stars,超過了業(yè)內(nèi)頂級的深度學習框架PyTorch的數(shù)量。同時,OpenMMLab還支持了上千篇論文的發(fā)表,并協(xié)助幾十項比賽選手在垂直領域獲得了冠軍。此外,在生態(tài)影響力方面也有所建樹。
OpenMMLab在商業(yè)領域的應用也非常廣泛,目前有超過600家企業(yè)和科研機構使用OpenMMLab進行技術研發(fā),其中不乏大型央企、頭部科技企業(yè)和互聯(lián)網(wǎng)企業(yè),已形成了廣泛的影響力。基于開源開放的算法體系,商湯希望實現(xiàn)訓練框架和AI芯片的雙向價值引導,攜手業(yè)界同仁共同構建高效的人工智能上下游生態(tài)。
構建標準化體系,打造算法芯片協(xié)同發(fā)展的技術基礎設施
為了推動訓練框架和AI芯片的協(xié)同發(fā)展,商湯將算法分解成為各種算子,并告知開發(fā)者哪些算子在整個算法層、應用場景層最為重要。通過這樣的引導,可以幫助行業(yè)伙伴將有限的算力資源應用到真正有價值的業(yè)務場景當中。
在技術層面,商湯構建了兩套標準化體系,其一是算法的分級體系,另一個是標準算子接口體系。針對算法分級體系的構建,商湯根據(jù)社區(qū)反饋,從影響力、性能、部署廣度等多重維度,初步將算法分成 P0、P1、P2三個級別:
P0級是任何芯片必須完全支持的算法;
P1級是在業(yè)務場景里使用較多,但并不是完全必需的算法;
P2級是使用和關注度都相對較少的算法。
基于算法的分級,商湯“以業(yè)務應用為導向,以算法為抓手”,形成了一整套面向訓練框架、推理引擎、訓練芯片、集群環(huán)境的適配和評測體系,從而給予下游的軟件和芯片廠商一個非常明確、清晰的優(yōu)化適配指引。針對標準算子接口體系,商湯根據(jù)算法的導引,將標準化之后的算子提取出來。在這之中,商湯已經(jīng)完成了兩項重要工作:
其一是統(tǒng)一算子接口和函數(shù)簽名,包含算子接口和輸入輸出等信息;
其二是一致性測試套件,包括標準化的測試用例以及相關的工具體系,可以校驗算子的正確性,評測在不同環(huán)境、不同配置下的執(zhí)行效率。
這兩項工作為評測不同芯片提供了一個標準化的抓手。這套技術層面的基礎設施,可以促進產(chǎn)業(yè)協(xié)同向前。此外,如今的適配方式與傳統(tǒng)方式相比也有很大優(yōu)勢。傳統(tǒng)芯片與框架一對一適配的方式,其經(jīng)驗很難在跨芯片或跨場景中復用。商湯基于標準算子接口體系的芯片-框架多對多的適配流程,可以將溝通成本、工作難度、適配工作量降到最低。一次性可接入數(shù)百種標準算子接口,通過一致性測試,能夠自動適配到不同的算法和芯片上面,實現(xiàn)更快迭代。
未來,商湯將致力于通過更多人工智能技術上的構建,積極促成產(chǎn)業(yè)上下游的合作協(xié)同,助力更高效從芯片到價值閉環(huán)的打通。
原文標題:干貨分享丨算法框架是AI芯片與商業(yè)價值的紐帶
文章出處:【微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
算法
+關注
關注
23文章
4625瀏覽量
93143 -
人工智能
+關注
關注
1793文章
47539瀏覽量
239392 -
開源
+關注
關注
3文章
3387瀏覽量
42622 -
商湯科技
+關注
關注
8文章
515瀏覽量
36121
原文標題:干貨分享丨算法框架是AI芯片與商業(yè)價值的紐帶
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論