疫情中的深度學習領域又有大動作。
3月25日下午,曠視科技舉辦線上發布會,宣布其自主研發、全員使用的AI生產力套件Brain++的核心深度學習框架——天元(MegEngine)開源。
回溯2017年,AlphaGo與柯潔的圍棋大戰讓人嘆為觀止,也點燃了不少科研人員對AI的研發熱情,其中,支撐AlphaGo運轉的底層技術框架是谷歌的TensorFlow。但其實,早在2014年,曠視就已經著手開始研發其深度學習框架MegEngine,在過去5年內,這套深度學習框架被曠視全員使用,也支撐起了整個曠視的科研及產品化進程。
現在,這套深度學習框架終于開源啦!這也是本月繼清華Jittor之后,又一個開源的國產深度學習框架。
作為曠視絕對招牌之一,MegEngine是什么,有何特點?在曠視的發展歷程中,它做出了哪些貢獻,文摘菌在這里為你一網打盡~
AI時代的三位一體生產力平臺
開源發布會上,曠視聯合創始人、首席技術官唐文斌用廚房來做比喻,解釋曠視的三位一體生產力平臺——Brain++。
唐文斌介紹道,AI系統存在兩大基礎設施,芯片平臺和AI生產力平臺,后者涉及到數據、算法、算力等多方面問題。
什么是AI生產力平臺,它就像是一道美食,需要原材料、一口好鍋和一灶猛火共同烹飪炒出,以Brain++為例,數據、算法、算力分別就代表了材料、鍋和猛火,今天就是這口“鍋”亮相的時候。
天元MegEngine深度學習框架官方網站:
https://megengine.org.cn/
簡單回想一下人工智能發展初期,想要訓練出一個AI模型,至少需要一兩個月,而且開發者要通過手敲代碼完成計算過程,深度學習社區基本上被TensorFlow和PyTorch壟斷。因此為了快速進行算法實驗,落地實際工業場景,我們需要的是一個具有高性能、可復用和能靈活迭代的AI算法平臺,要打造這個平臺,就必須從計算性能,平臺易用性,滿足真實業務場景需求等各個方面進行考量。
曠視Brain++就是這樣的一個系統,天元就是其中核心模塊,唐文斌說,“天元”取圍棋盤上的中心點之意,就是要做到訓練推理一體化、兼容并包、靈活高效。
自2014年研發,2015年正式投入使用,如今曠視所有產品都使用了天元框架,整個過程可謂是來之不易。
今天天元開源代碼共35萬行,包括78%C++,17%CUDA,5%Python。唐文斌大方地承認道,今天發布的是Alpha版本,6月份會發布Beta版本,9月份發布正式版本。
他也很誠懇地表示,“所有程序員都知道,一個代碼自己用和拿出來和別人分享的差距有多大?!币虼讼M懈嗳藢@一發布版本給出批評建議,共建更好的產品。九月份推出正式版本,即日起向企業開發。
發布會上也公布了代碼的托管地址,感興趣的同學不妨一試。
GitHub地址:
https://github.com/MegEngine/MegEngine
訓練和推理一體化,適配不同框架接口
據介紹,天元系統共分為五個層次:計算接口,圖表示、優化與翻譯、運行時管理、計算內核。
可以從圖中看到,天元支持Python和C++接口,支持靜態圖和動態圖表達,也支持自動求導器、圖優化、圖編譯。
傳統的訓練框架和推理框架是分開進行的,也就是說,系統要先經過訓練再接受新的格式,在推理框架上適配不同的場景,但是在兩者轉化過程中會遇到算子無法支持、手工無法優化、大量冗余算子等多種問題。
天元系統的訓練和推理是一體的,因此無需進行模型轉換,同時,系統內部內置有模型優化,可以有效降低手工優化的誤差,精度和速度都能得到保證。
靜態圖和動態圖之爭也就是TensorFlow和PyTotch之爭,但是兩種框架真的不得兼得嗎?天元給出的答案是,可以。動靜合一就是天元的做法,從結果上看,使用靜態圖提速約5%-20%。
在學術界和工業界都會遇到框架接口不同引起的各種適配問題,天元在此也提出了解決方案,那就是兼容并包。天元采用了Pythonic風格API,可以很自然地被用戶接受,函數的命名也尊重了以往的傳統,可以直接導入PyTotch Module,方便模型復現和實驗。
在生產環境上,天元也做到了“靈活高效”,不僅在許多算法上都取得了領先的性能,在與其他框架進行對比時速度也完全不輸,同時,天元還關注到了顯存和片上內存的節省,天元系統在保證不影響速度的前提下實現了20倍以上的內存減少。
三大特點:“訓得好”、“訓得快”、“訓得動”
在發布會上,曠視首席科學家孫劍表示,“天元就像我們的孩子”,他也就其三大特點進行了介紹,包括框架與算法協同、高效訓練系統、大規模能力,用大白話來說就是“訓得好”、“訓得快”、“訓得動”。
孫劍表示,由于當前計算平臺的特性差異比較大,無法用一種網絡滿足所有需求。
天元通過快速的算子算法開發,靈活高效的算子支持,Jit自動算子融合三方面,實現了端上的高性能,在自測和第三方測試中都取得了不錯的成績。目前也已經配備至國產智能手機中,加速手機的智能化。
在介紹第二個優點之前,孫劍提到,在計算機視覺挑戰賽COCO中,曠視已經實現了三連冠,能取得這樣的成績,除了優秀的研究員、對比賽的理解,曠視天元系統功不可沒。
曠視天元系統能夠通過多機訓練提速16倍,加速了創新周期,并且精度更高,而且也是第一次實現了從框架上支持超大mini-Batch訓練,種種優點集中后,研究人員就可以在相同的比賽時間內測試更多的想法。
在Object365之后,孫劍表示,Object365 V2也在今天開放給大家,Object365 V2可以說是世界上最大的物體檢測數據集,配備了365種常見物體,2百萬張圖像,2.8千萬個人工標注,是COCO比賽數據集的16倍大。
面對如此龐大的數據集,孫劍表示,曠視天元完全“訓得動”,高校加速比的多機訓練、底顯存消耗、亞線性顯存節省技術、MegRay通訊框架、高效數據編碼傳輸,這些特點都使得天元系統能夠訓練出一個精度更高速度更快的模型。
除了上述三個特點,孫劍讓大家試想,1400多名研發人員共享高效計算資源是怎樣的場景。
他說,共享時每個研發人員都有一份獨有的交互式訓練模式,能夠讓每個人隨時停下來調試,不僅如此,系統還支持多人同時在線訓練、數據自動預加載,自動閑置資源利用、計算配額管理,這些功能的實現,也都是要得益于曠視Brain++。
對于Brain++,用此前曠視聯合創始人唐文斌的話說就是,Brain++的“目標是讓研發人員獲得從數據到算法產業化的綜合技術能力,不用重復造輪子也可以推進AI快速落地。Brain++還引入了AutoML技術,可以讓算法來訓練算法,讓AI來創造AI”。
發布會上,曠視云服務業務副總裁趙立威就曠視Brain++進行了更深層的介紹。
具體來說,Brain++的架構分為三部分,核心模塊就是最新開源的深度學習算法開發框架天元(MegEngine),其次是提供算力調度支持的深度學習云計算平臺MegCompute,以及用于提供數據服務和管理的數據管理平臺MegData。
他說道,AI加速著各行各業的創新進程,但是在AI具體落地過程中馬太效應還是比較明顯的。其中,以企業為例,企業在應用AI時遇到了不少共性問題,比如對數據的利用、數據隱私、模型效果、難以保證使用方法在生產過程中的精度和性能需求等等。
曠視Brain++也正是基于解決這些問題提出,趙立威介紹道,在框架基礎上,曠視研究院提出“三位一體”概念,融合數據和算力平臺,構建出集“算法、數據和算力”于一體的AI生產力套件Brain++,自動化、規?;?、集約化生產算法,在Brain++的驅動下一一成為現實。
要讓AI真正助力到具體行業種,去賦能傳統行業,達到商業創新的目標,趙立威在最后也向大家分享了三個通過使用曠視Brain++成功的案例,并表示,“你也可以擁有專屬的Brain++平臺”。
在這里,文摘菌也為大家簡單總結一下,Brain++的核心模塊MegEngine,也就是天元系統,是以C++為基礎,和其他框架使用異構架構的框架不同,MegEngine使用了計算圖方式,進行分布式計算更為便捷。同時,MegEngine引入了曠視獨家AutoML技術,訓練一次,就能得到整個模型空間的刻畫,降低了人力成本,也大幅提高開發效率。
天元系統可實現訓練、部署一體化,能夠支撐大規模視覺方向的算法研發,具體又分為計算引擎、運行時管理、編譯和優化以及編程和表示四個方面。
本次發布會上,眾多AI界大咖也紛紛送上祝福,中國工程院院士高文表示,深度學習是目前AI能夠掀起全球科研熱潮的重要原因之一,而另一個則是采取了開源開放的措施,曠視這次的開源是“一件值得祝賀的事”,也是“一件重要的事”。
中國科學院院士姚期智也表示,AI現在的地位就和過去數學和物理的地位很像,如何發展AI,這需要從兩個角度考慮,一個是人才培養,一個是研究創新,其中,前者呼吁具有豐富交叉學科背景的人才,清華也在重點培養,包括開設智班和姚班,以及編纂AI教材,后者則需要產學研的結合,曠視Brain++正是工程化的代表。
國產深度學習框架百花齊放!清華開源首個國內高校自研的深度學習框架Jittor
先于曠視,3月20日,清華大學開發了名為Jittor的深度學習框架,這是首個國內高校自研的深度學習框架,這一框架的開源有望為深度學習社區提供新方案,推動深度學習框架國產化。
根據官網介紹,Jittor是一個用元算子表達神經網絡計算單元,并且完全基于動態編譯的深度學習框架。根據官網的定義,“研究團隊將神經網絡所需的基本算子定義為元算子”,而Jittor的主要特性正是元算子和統一計算圖。
元算子非常底層,通過相互融合可以完成復雜的深度學習計算,體現出了易于使用的特點。研發團隊表示,采用元算子的Jittor目前已經超越了Numpy,可以完成更復雜高效的操作。
在統一計算圖方面,Jittor融合了靜態計算圖和動態計算圖的優點,在易于使用的同時,提供了高性能的優化。基于元算子開發的深度學習模型,可以被Jittor實時自動優化,并且運行在指定如CPU、GPU的硬件上。
Jittor官網:
https://cg.cs.tsinghua.edu.cn/jittor/
GitHub地址:
https://github.com/Jittor/jittor
在設計理念上,Jittor保持著易用、靈活和及時的特點:
易用且可定制:用戶只需要數行代碼,就可定義新的算子和模型,在易用的同時,不喪失任何可定制性;
實現與優化分離:用戶可以通過前端接口專注于實現,而實現自動被后端優化,從而提升前端代碼的可讀性,以及后端優化的魯棒性和可重用性;
所有都是即時的:Jittor的所有代碼都是即時編譯并且運行的,包括Jittor本身。用戶可以隨時對Jittor的所有代碼進行修改,并且動態運行。
具體來說,Jittor的7大新特點值得關注:
最近清華、曠視相繼開源深度學習框架,再加上更早的開源百度PaddlePaddle,而據了解,華為也即將開源自己的深度學習框架,國產深度學習框架正在迎來發展高速期,希望借著這股東風,能夠激發更多的人對AI領域的興趣,參與到國產AI的建設中。
-
算法
+關注
關注
23文章
4625瀏覽量
93128 -
AI
+關注
關注
87文章
31335瀏覽量
269695 -
深度學習
+關注
關注
73文章
5511瀏覽量
121355
發布評論請先 登錄
相關推薦
評論