目前比較主流的AI深度學習框架主要由國際巨頭領銜,比如谷歌的TensorFlow和Facebook的PyTorch等。2017年中國的一家初創(chuàng)團隊悄悄成立,他們做的是對標這些主流框架的技術開發(fā)。今年初,這家公司聲名鵲起,并獲得了由高瓴創(chuàng)投領投的5000萬元A輪融資。這家公司叫一流科技,他們的深度學習框架叫做OneFlow,今年7月31日,OneFlow即將迎來自己的開源一周年紀念日。
對框架的超前定位,有力支撐了深度學習領域的創(chuàng)業(yè)
一流科技創(chuàng)始人袁進輝在創(chuàng)辦公司之前,在微軟研究院工作多年,主要從事機器學習、分布式系統(tǒng)的研發(fā)。“當時我們認為隨著AI數(shù)據(jù)和算力需求的不斷增加,現(xiàn)有的深度學習框架在未來會遇到瓶頸,幾年前我多次在公開演講中提到過這個觀點,但當時業(yè)界不以為然。”袁進輝說道。
袁進輝分析,從機器視覺到人機對話,再到認知智能,AI不斷突破能力邊界,同時伴隨著模型參數(shù)的指數(shù)級提升,AI模型加速膨脹導致訓練成本攀升,預計2025年最先進的AI訓練模型成本將達到1億美元。
而單芯片存在算力天花板,單芯片在物理層面存在性能極限,先進制程發(fā)展已難以維持摩爾定律;分布式硬件難以高效協(xié)同運轉,分布式方案芯片間傳輸帶寬低于片上帶寬,多芯片集群難以像“超級芯片”一樣高效工作。
針對內存墻、用戶接口不友好和定制化成本高等AI分布式訓練痛點,OneFlow從底層機制提出Actor機制、一致性視角和自動并行技術加以解決。
袁進輝表示,隨著大規(guī)模參數(shù)模型爆發(fā),OneFlow需求匹配程度愈發(fā)提高,將超過TensorFlow和PyTorch逐漸占據(jù)更多的市場空間。
近兩年,一些國內科技巨頭也紛紛推出深度學習框架,例如百度飛槳PaddlePaddle、華為的MindSpore等。他們大多擁有自己的生態(tài)圈,能夠將硬件和軟件搭配使用。相比之下,一流科技的OneFlow屬于獨立的第三方框架,更具有中立性,可以廣泛地與芯片廠商進行適配。
“GPU芯片巨頭英偉達在美國的軟件棧團隊對我們的深度學習框架表示了密切關注,每兩個星期我們會就框架優(yōu)化與合作問題進行探討。”袁進輝透露。
雖然TensorFlow和PyTorch等深度學習框架為也英偉達的芯片所適配,不過顯然,英偉達注意到OneFlow這個由獨立的軟件公司研發(fā)的框架的好處和價值。
開源與良好的商業(yè)模式并不沖突
去年OneFlow框架開源之后獲得了非常高的關注。OneFlow的開源代碼發(fā)布到了Github,開源讓全球開發(fā)者能夠直觀接觸、下載、使用OneFlow。開源十個月Star數(shù)量超過2500,超過華為Mindspore。
袁進輝直言,“在開源社區(qū)里面,有很多基礎軟件,勝出的不是大公司,而是初創(chuàng)團隊,比如主導Spark的Databricks等。一些互聯(lián)網(wǎng)大公司都在用的軟件,剛開始都是小團隊做的。只要技術上過硬,就有機會。”顯然,一流科技有這個技術實力,在其框架開源之后,獲得了谷歌、Facebook、華為、百度等同行的關注,也受到了資本的青睞。
但是,一個問題是,開源與公司的商業(yè)模式是否沖突呢?公司又如何建立自己的商業(yè)價值?
袁進輝分析,開源的商業(yè)模式主要有兩種,一種是雖然一些有技術能力的互聯(lián)網(wǎng)公司或開發(fā)者自行下載開源軟件,進行項目開發(fā),但是對于沒有開發(fā)能力的用戶,他們需要付費購買開源軟件的商業(yè)版來使用。
另一種是云上托管。如今很多企業(yè)將數(shù)據(jù)計算在云上進行,在用某個軟件處理大數(shù)據(jù)、AI計算的任務時他可以把開源工具下載下來在云上部署,這種方式下公司必須自己雇用工程師對這一流程進行調優(yōu),需要承擔較高的人力成本。但也可以直接從云上使用開源公司部署的軟件,這種做法用戶需要承擔的成本較低,也更方便省事。
目前開源云托管是最好的商業(yè)模式,在美國已經(jīng)運用相對成熟。相信在中國也將有越來越多的用戶接受這一模式。
OneFlow用起來不僅是快,下一步打通易用性
OneFlow選擇自上向下占領市場,占據(jù)技術制高點,從高效性向易用性和完備性延伸。以高效性作為突破口,切入市場打破競爭格局。
目前,用OneFlow訓練比其他框架快的口碑已經(jīng)在業(yè)內傳開。一個數(shù)據(jù)是,OneFlowv0.2.0實現(xiàn)了多達17個性能優(yōu)化,使得CNN和BERT的自動混合精度(AMP)訓練速度大幅提升,不僅遠超其他各個主要框架的官方實現(xiàn),同時也超過了NVIDIA深度優(yōu)化過的版本,成為在主流旗艦顯卡(V100 16G)上訓練ResNet50-v1.5和BERT-base模型最快的框架。OneFlow ResNet50-v1.5 AMP單卡比NVIDIA深度優(yōu)化過的PyTorch快80%,比TensorFlow2.3快35%。
袁進輝表示,我們即將發(fā)布新的版本,將重點提升軟件的易用性體驗,首先在單卡代碼上保證和PyTorch的體驗一致,而同時在多卡場景下推出了全新的接口設計,將給用戶帶來革命性的開發(fā)體驗。相信這個版本的發(fā)布將極大地帶動開發(fā)者群體,擴大OneFlow的使用數(shù)量和應用范圍。
在鋪設高效性和易用性之后,OneFlow還將打造完備性,從而形成自上而下、三位一體的布局。袁進輝有信心,在不久的將來和TensorFlow、PyTorch是三分天下的市場格局。
AI軟件生態(tài),OneFlow需當此重任
在移動端,開源的安卓系統(tǒng)形成強大的生態(tài)而成功。深度學習框架就像AI的操作系統(tǒng)一樣,它是模型算法和硬件資源之間的接口,是AI系統(tǒng)資源的管理者,實現(xiàn)對底層硬件資源的調度,讓開發(fā)者無需關心實現(xiàn)細節(jié)。
袁進輝認為,生態(tài)建設就是0和1的問題,OneFlow必然建設強大的生態(tài)才能實現(xiàn)更多的可能,取得最終的成功。
目前,OneFlow的硬核創(chuàng)新在核心AI開發(fā)圈樹立了口碑,得到全球框架專家的高度認可,國內外深度學習框架產(chǎn)品已在積極跟進OneFlow所開創(chuàng)的設計理念。一流科技已與北京智源人工智能研究院、粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院、之江實驗室、中關村智用人工智能研究院等頂尖AI科研院所開展深度合作。同時,聯(lián)合芯片、云廠商等上下游企業(yè)加強配合,已與寒武紀、燧原科技等推進超大模型訓練方案。下一步將推動與更多芯片廠商和廣大開發(fā)者的合作,打造AI平臺的繁榮生態(tài)。
開源生態(tài)已經(jīng)得到國家層面的重視,“開源”寫進了今年的十四五規(guī)劃,而開源將是中國占領科技高地的機會。例如硬件方面現(xiàn)在大力發(fā)展的RISC-V開源指令集架構,軟件方面OneFlow做為中國的深度學習框架,也將借助開源的力量進一步壯大其AI生態(tài)。
基于深度學習的軟件2.0時代將打開30萬億美元的市場,袁進輝表示,中國擁有大量的基礎軟件人才,積累了豐富的AI應用場景,OneFlow有機會在這個AI時代乘風而行。
本文為電子發(fā)燒友網(wǎng)原創(chuàng)文章,作者黃晶晶,微信號kittyhjj,轉載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
-
AI
+關注
關注
87文章
31070瀏覽量
269410 -
pytorch
+關注
關注
2文章
808瀏覽量
13248 -
OneFlow
+關注
關注
0文章
9瀏覽量
8803
發(fā)布評論請先 登錄
相關推薦
評論