在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Facebook發布高性能AI代碼

DPVg_AI_era ? 來源:未知 ? 作者:李威 ? 2018-03-05 11:50 ? 次閱讀

Facebook今天宣布發布Tensor Comprehensions,能夠自動將數學符號快速轉換成高性能機器學習代碼,將原本幾天乃至幾周的過程縮短為幾分鐘,大幅提高生產力。

Facebook AI Research(FAIR)今天宣布發布Tensor Comprehensions,這是一個C++庫和數學語言,旨在幫助彌合研究人員和工程師在從事機器學習任務時,在溝通上的差距;研究人員習慣使用數學運算,而工程師則專注在不同的硬件后端運行大規模ML模型的實際需求。

相比其他庫,Tensor Comprehensions 的主要不同是對Just-In-Time編譯有獨特的研究,能夠自動按需生成機器學習社區需要的高性能代碼。

只需幾分鐘生成高性能CPU/GPU代碼,生產力實現數量級提高

要創建新的高性能機器學習(ML)層,典型的工作流程一般包含兩個階段,時間往往需要好幾天乃至數周:

1、首先,一位研究人員在numpy級別的抽象中編寫了一個新的層,并將其與像PyTorch這樣的深度學習庫鏈接起來,然后在小規模實驗中對其進行測試。想法得到驗證后,相關的代碼,性能需要加快一個數量級才能運行大規模實驗。

2、接下來,一位工程師為GPU和CPU編寫高效代碼,而這又需要:

這名工程師需要是高性能計算的專家,這方面人才數量有限

這名工程師需要獲取上下文,制定策略,編寫和調試代碼

將代碼移到后端需要進行一些枯燥但必須完成的任務,例如反復進行參數檢查和添加Boilerplate集成代碼

因此,在過去的幾年中,深度學習社區在很大程度上都依靠CuBLAS,MKL和CuDNN等高性能庫來獲得GPU和CPU上的高性能代碼。不使用這些庫提供的原語來進行試驗,需要極高的工程水平,這對不少研究人員都構成了很大的挑戰。

如果有套件能夠將上述過程從幾周縮短為幾分鐘,我們預期,將這樣一個套件開源將具有重大實用價值。有了Tensor Comprehensions,我們的愿景是讓研究人員用數學符號寫出他們的想法,這個符號自動被我們的系統編譯和調整,結果就是具有良好性能的專用代碼。

在這次發布的版本中,我們將提供:

表達一系列不同機器學習概念的數學符號

用于這一數學符號的基于Halide IR的C++前端

基于Integer Set Library(ISL)的多面體Just-in-Time(JIT)編譯器

基于進化搜索的多線程、多GPU自動調節器

使用高級語法編寫網絡層,無需明確如何運行

最近在高性能圖像處理領域很受歡迎的一門語言是Halide。Halide使用類似的高級函數語法來描述圖像處理流水線,然后在單獨的代碼塊中,明確將其調度(schedule)到硬件上,詳細指定運算如何平鋪、矢量化、并行和融合。這對于擁有架構專業知識的人來說,是一種非常高效的語言,但對于大多數機器學習從業者卻很難使用。目前有很多研究積極關注Halide的自動調度(Automatic scheduling),但對于在GPU上運行的ML代碼,還沒有很好的解決方案。

Tensor Comprehensions使用Halide編譯器作為庫。在Halide的中間表示(IR)和分析工具的基礎上,將其與多面體編譯技術相結合,使用者可以用類似的高級語法編寫網絡層,而無需明確它將如何運行。我們還成功使語言更加簡潔,無需指定減法(reduction)的循環邊界。

Tensor Comprehensions使用Halide和Polyhedral Compilation 技術,自動合成CUDA內核。這種轉換會為通用算子融合、快速本地內存、快速減法和JIT類型特化進行優化。由于沒有或者沒有去優化內存管理,我們的流程可以輕松高效地集成到任何ML框架和任何允許調用C++函數的語言中。

與傳統的編譯器技術和庫的方法相反,多面編譯(Polyhedral Compilation)讓Tensor Comprehensions為每個新網絡按需調度單個張量元素的計算。

在CUDA層面,Tensor Comprehensions結合了affine loop transformations,fusion/fission和自動并行處理,同時確保數據在存儲器層次結構中正確移動。

圖中的數字表示最初計算張量元素的順序,箭頭表示它們之間的依賴關系。在這個例子中,數字旋轉對應loop interchange,深度算子融合就發生在這個過程中。

性能媲美乃至超越Caffe2+cuBLAS

為了推動搜索過程,我們還提供了一個集成的多線程、多GPU自動調諧庫(autotuning library),它使用Evolutionary Search來生成和評估數千種實現方案,并從中選擇性能最佳的方案。只需調用Tensor Comprehension的tune函數,你就能實時地看著性能提高,到你滿意時停止即可。最好的策略是通過protobuf序列化,立即就可重用,或在離線情況下。

在性能方面,盡管我們還有很多需要改進的地方,但在某些情況下,Tensor Comprehensions 已經可以媲美甚至超越當前整合了手動調整庫的ML框架。這主要通過將代碼生成策略適應特定問題大小的能力來實現的。下面的條形圖展示了將Tensor Comprehensions自動生成的內核與Caffe2和ATen(使用CuDNN)相比較時的結果。更多信息,請參閱論文(見文末鏈接)。

隨著我們擴大至更多硬件后端,Tensor Comprehensions將補充硬件制造商(如NVIDIA和Intel)編寫的速度很快的庫,并將與CUDNN,MKL或NNPack等庫一起使用。

未來計劃

這次發布的版本將讓研究人員和程序員用與他們在論文中使用的數學語言來編寫網絡層,并簡明地傳達他們程序的意圖。同時,研究人員還能在幾分鐘之內將他們的數學符號轉化成能夠快速實施的代碼。隨著工具鏈的不斷增長,我們預計可用性和性能將會增加,并使整個社區受益。

我們將在稍后發布PyTorch的Tensor Comprehensions集成。

我們感謝與框架團隊的頻繁交流和反饋,并期待著將這一令人興奮的新技術帶入你最喜愛的ML框架。

FAIR致力于開放科學并與機器學習社區合作,進一步推動AI研究。Tensor Comprehensions(已經在Apache 2.0協議下發布)已經是Facebook,Inria,蘇黎世聯邦理工學院和麻省理工學院的合作項目。目前工作還處于早期階段,我們很高興能夠盡早分享,并期望通過社區的反饋來改進它。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28589

    瀏覽量

    207822
  • AI
    AI
    +關注

    關注

    87

    文章

    31356

    瀏覽量

    269757
  • 代碼
    +關注

    關注

    30

    文章

    4814

    瀏覽量

    68851

原文標題:【AI大紅包】Facebook發布張量理解庫,幾分鐘自動生成ML代碼

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    廣和通發布Fibocom AI Stack,助力客戶快速實現跨平臺跨系統的端側AI部署

    1月7日-10日,2025年國際消費電子產品展覽會(CES 2025)盛大舉行,廣和通發布Fibocom AI Stack,賦智千行百業端側應用。Fibocom AI Stack提供集高性能
    的頭像 發表于 01-08 18:21 ?190次閱讀
    廣和通<b class='flag-5'>發布</b>Fibocom <b class='flag-5'>AI</b> Stack,助力客戶快速實現跨平臺跨系統的端側<b class='flag-5'>AI</b>部署

    廣和通發布Fibocom AI Stack,助力客戶快速實現跨平臺跨系統的端側AI部署

    1月7日-10日,2025年國際消費電子產品展覽會(CES 2025)盛大舉行,廣和通發布Fibocom AI Stack,賦智千行百業端側應用。Fibocom AI Stack提供集高性能
    的頭像 發表于 01-08 18:20 ?157次閱讀

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區 助力打造高性能原生應用

    高性能鴻蒙原生應用。 Nodepool:優化頁面滑動流暢性Nodepool旨在解決應用頁面滑動卡頓問題。開發中,相似頁面因業務和代碼差異,組件復用性差,引發卡頓、丟幀,影響用戶體驗。Nodepool通過
    發表于 01-02 18:00

    國芯科技與賽昉科技合作,高性能AI MCU芯片CCR7002測試成功

    近日,國芯科技與廣東賽昉科技有限公司攜手研發的CCR7002高性能AI MCU芯片產品傳來捷報,成功通過了內部嚴格的性能和功能測試。此次合作標志著RISC-V+AI技術在芯片領域的新應
    的頭像 發表于 12-09 15:04 ?495次閱讀

    賽昉聯合國芯推出高性能AI MCU芯片,實現RISC-V+AI新應用

    近日,賽昉科技與蘇州國芯科技有限公司(以下簡稱“國芯科技”)合作研發的高性能AIMCU芯片產品CCR7002已成功通過了內部性能和功能測試,實現了RISC-V+AI技術的新應用。賽昉科技將與國芯
    的頭像 發表于 11-27 11:46 ?461次閱讀
    賽昉聯合國芯推出<b class='flag-5'>高性能</b><b class='flag-5'>AI</b> MCU芯片,實現RISC-V+<b class='flag-5'>AI</b>新應用

    德晟達推出高性能醫療專用AI一體機

    隨著AI人工智能技術的飛速發展,醫療行業正迎來一場前所未有的變革,德晟達提供的硬件解決方案,服務客戶圍繞“AI人工智能+醫療”的行業創新發展方向,深度研發,將AI人工智能診斷技術與高性能
    的頭像 發表于 11-26 16:25 ?341次閱讀

    國芯科技:高性能AI MCU芯片CCR7002內部測試成功

    近日,國芯科技宣布了一項重要研發成果。11月24日,公司正式公告,其高性能AI MCU芯片新產品CCR7002在公司內部測試中取得了圓滿成功。這一成果標志著國芯科技在AI芯片研發領域取得了新的突破
    的頭像 發表于 11-25 14:45 ?426次閱讀

    國芯科技攜手賽昉科技發布高性能AI MCU芯片

    近日,從國芯科技再次傳來喜訊,國芯科技與廣東賽昉科技有限公司(以下簡稱“賽昉科技”)合作研發的高性能AI MCU芯片產品CCR7002已成功通過了內部性能和功能測試,實現了RISC-V+AI
    的頭像 發表于 11-25 10:11 ?292次閱讀

    使用AMD Versal AI引擎加速高性能DSP應用

    AMD Versal AI 引擎使您能夠擴展數字信號處理( DSP )算力與面向未來的設計,從而適應當前和下一代計算密集型 DSP 應用。借助 Versal AI 引擎,客戶能以更低的功耗1和更少的可編程邏輯資源2獲得高性能 D
    的頭像 發表于 11-20 16:35 ?370次閱讀

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術發展的基石,更是推動AI應用落地、加速產業升級的重要工具。以下,是對AI
    的頭像 發表于 11-11 09:56 ?246次閱讀

    銘瑄發布高性能800系列主板

    近日,國內知名電腦硬件品牌銘瑄在北京金隅喜來登酒店成功舉辦了新品發布會,正式推出了以“智·競未來”為主題的高性能800系列主板。此次發布的系列主板共涵蓋了12款創新型號,旨在滿足高性能
    的頭像 發表于 10-30 17:25 ?451次閱讀

    GPU高性能服務器配置

    GPU高性能服務器作為提升計算速度和效率的關鍵設備,在各大應用場景中發揮著越來越重要的作用。在此,petacloud.ai小編為你介紹GPU高性能服務器的配置要點。
    的頭像 發表于 10-21 10:42 ?252次閱讀

    SiFive發布MX系列高性能AI加速器IP

    AI技術日新月異的今天,RISC-V IP設計領域的領軍企業SiFive再次引領行業潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這一創新產品專為加速各類
    的頭像 發表于 09-24 14:46 ?394次閱讀

    SK海力士引領端側AI PC新紀元,發布高性能固態硬盤PCB01

    出了一款專為端側AI PC設計的“業界最高性能”固態硬盤(SSD)——PCB01,這不僅標志著SK海力士在存儲技術領域的又一次重大突破,也為AI存儲市場注入了新的活力。
    的頭像 發表于 06-28 14:52 ?791次閱讀

    佰維存儲研發突破,為AI高性能計算賦能

    近日,佰維存儲在接受調研時透露,公司近期成功研發并發布了支持CXL2.0規范的CXLDRAM內存擴展模塊。這款產品具有支持內存容量和帶寬擴展、內存池化共享、高帶寬、低延遲、高可靠性等優勢,特別適合于AI高性能計算的應用。
    的頭像 發表于 01-23 16:13 ?902次閱讀
    主站蜘蛛池模板: 亚洲性人人天天夜夜摸| 濑亚美莉iptd619在线观看| 国产精品夜夜春夜夜| 插吧插吧综合网| 久久综合中文字幕| 日本免费观看完整视频| 亚洲欧美人成网站综合在线| 2345成人高清毛片| 2017天天操| 国产午夜免费视频| 免费一级黄| 日本黄黄| 免费在线观看一级片| аⅴ天堂中文在线网| 免费日本黄色网址| 3344在线| 男男np主受高h啪啪肉| 亚洲国产欧美在线人成aaa| 免费啪啪网| 国产农村乱色xxxx| 狂野欧美激情性xxxx| 日本一区二区三区不卡在线看 | 免费看美女的逼| 欧美一级免费在线观看| 三级不卡| 日韩99| 日本中文在线三级在线播放| 美女拍拍拍爽爽爽爽爽爽| 久久婷婷色| 国外免费一级| 痴女中文字幕在线视频| 国产成人小视频| www.av123| 一级毛片女人喷潮| 午夜手机福利| 深夜视频免费看| 免费又爽又黄禁片视频在线播放| 在线欧美激情| 亚洲天堂免费| 久久综合九色综合98一99久久99久| 中国美女一级黄色片|