在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

摩爾線程開源高性能線性代數模板庫MUTLASS

摩爾線程 ? 來源:摩爾線程 ? 2024-11-13 11:53 ? 次閱讀

近日,摩爾線程宣布開源高性能線性代數模板庫MUTLASS,以便開發者能夠更高效針對摩爾線程全功能GPU的MUSA Core及Tensor Core等單元進行編程,加速基于國產GPU的算子開發以及算法創新。

在數值計算和深度學習領域,矩陣乘法(GEMM)及其變種(如FlashAttention、Convolution)是構建復雜上層應用的基石。然而,為了追求更高的算子融合效率或者更創新的算法,開發者們往往需要超越標準化計算接口的限制,如標準BLAS接口以及芯片廠商的計算庫接口,以實現高性能的定制化算子。

MUTLASS(MUSA Templates for Linear Algebra Subroutines)正是為滿足這一需求而設計。作為摩爾線程專為MUSA架構優化的高性能計算庫,MUTLASS是基于開源模板庫CUTLASS進行的MUSA適配和定制化開發、優化,針對矩陣乘法及相關變種,MUTLASS提供了一系列高性能的C++模板組件,并采用了與muDNN庫類似的分層分解及數據搬運策略,以確保性能的充分發揮。

在本次開源的版本中,摩爾線程適配了CuTe后端庫,為其增加了第三代MUSA架構的MMA計算原語,支持TF32/FP16/BF16/INT8等多種數據精度,并以此為基礎,初步實現了矩陣乘法、默認實例庫、性能測試器及相關工具包的支持。

借助MUTLASS,開發者們既可以靈活復用不同層級的模板組件,也可以按需修改各種模板組件的實現細節,以較低的開發成本實現定制化的高性能算子,從而在摩爾線程全功能GPU上充分釋放性能,并嘗試更多的算法創新。

摩爾線程將持續優化MUTLASS的性能,并不斷引入新的功能。我們誠邀廣大開發者體驗MUTLASS,并提供寶貴的反饋意見,共同促進MUTLASS在性能和功能上的持續完善,攜手推動基于國產GPU的生態建設。

關于摩爾線程

摩爾線程成立于2020年10月,以全功能GPU為核心,致力于向全球提供加速計算的基礎設施和一站式解決方案,為各行各業的數智化轉型提供強大的AI計算支持。

我們的目標是成為具備國際競爭力的GPU領軍企業,為融合人工智能和數字孿生的數智世界打造先進的加速計算平臺。我們的愿景是為美好世界加速。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4847

    瀏覽量

    129969
  • 開源
    +關注

    關注

    3

    文章

    3492

    瀏覽量

    43069
  • 摩爾線程
    +關注

    關注

    2

    文章

    215

    瀏覽量

    4861

原文標題:開源MUTLASS|摩爾線程加速基于國產GPU的算子開發以及算法創新

文章出處:【微信號:moorethreads,微信公眾號:摩爾線程】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    摩爾線程發布云電腦驅動MT vGPU 2.7.0

    3月18日,摩爾線程正式發布云電腦驅動MT vGPU 2.7.0。新版本在國內首次實現了國產GPU云電腦對DirectX 12的支持,同時顯著提升圖形渲染性能與兼容性。通過全功能GPU四大引擎的深度協同,
    的頭像 發表于 03-19 15:56 ?197次閱讀

    摩爾線程GPU原生FP8計算助力AI訓練

    近日,摩爾線程正式開源MT-MegatronLM與MT-TransformerEngine兩大AI框架。通過深度融合FP8混合訓練策略和高性能算子
    的頭像 發表于 03-17 17:05 ?265次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU原生FP8計算助力AI訓練

    摩爾線程支持阿里云通義千問QwQ-32B開源模型

    近日,阿里云團隊正式開源全新推理模型——通義千問QwQ-32B。摩爾線程在該模型發布后2小時內,迅速且高效完成了對千問QwQ-32B的支持。
    的頭像 發表于 03-07 17:48 ?438次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>支持阿里云通義千問QwQ-32B<b class='flag-5'>開源</b>模型

    摩爾線程全面支持DeepSeek開源周成果

    DeepSeek開源周正式收官,作為國內率先原生支持FP8計算精度的國產GPU企業,摩爾線程迅速響應,并在短時間內,成功實現對DeepSeek各個開源項目的全面支持,涵蓋FlashML
    的頭像 發表于 03-04 10:06 ?249次閱讀

    摩爾線程支持DeepSeek開源通信DeepEP和并行算法DualPipe

    DeepSeek開源周第四日,摩爾線程宣布已成功支持DeepSeek開源通信DeepEP和并行算法DualPipe,并發布相關
    的頭像 發表于 02-28 15:58 ?260次閱讀

    摩爾線程完成DeepSeek開源FlashMLA和DeepGEMM適配

    自DeepSeek啟動“開源周”以來,已陸續開源三個代碼摩爾線程基于全新MUSA Compute Capability 3.1計算架構,
    的頭像 發表于 02-27 14:40 ?348次閱讀

    摩爾線程圖形顯卡MTT S80實現DeepSeek模型部署

    摩爾線程“全功能”圖形顯卡MTT S80,不僅游戲渲染性能強大,能玩《黑神話:悟空》,現在還能本地部署DeepSeek R1蒸餾模型。搭配最新發布的MUSA SDK RC3.1.1版本,開發者直接用
    的頭像 發表于 02-21 15:46 ?920次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>圖形顯卡MTT S80實現DeepSeek模型部署

    摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務

    。 據悉,DeepSeek開源模型在多語言理解與復雜推理任務中一直表現出卓越的性能,其V3、R1等系列模型更是備受業界關注。而此次摩爾線程所實現的DeepSeek蒸餾模型推理服務部署,
    的頭像 發表于 02-06 13:49 ?558次閱讀

    摩爾線程完成股改,籌備上市

    近日,摩爾線程智能科技(北京)股份有限公司(簡稱“摩爾線程”)宣布已完成股改,并正積極籌備上市。據國家企業信用信息公示系統最新查詢結果顯示,摩爾
    的頭像 發表于 11-12 14:15 ?864次閱讀

    摩爾線程成立摩爾學院,賦能GPU開發者

    近日,摩爾線程宣布正式成立摩爾學院,為GPU開發者生態建設揭開新篇章。摩爾學院作為一個專業的GPU技術培訓與交流平臺,現已正式對外開放。
    的頭像 發表于 10-28 17:03 ?693次閱讀

    摩爾線程與超圖軟件完成產品兼容認證

    。 據悉,為了確保產品間的兼容性,摩爾線程與超圖軟件進行了嚴格的測試工作。經過雙方的努力,適配調優后的軟件在摩爾線程GPU上展現出了卓越的性能
    的頭像 發表于 10-24 10:25 ?738次閱讀

    摩爾線程正式開源音頻理解大模型MooER

    近日,國內領先的GPU創新企業摩爾線程宣布了一項重大技術突破——正式開源其自主研發的音頻理解大模型MooER(摩耳)。這一舉動標志著我國在音頻處理與理解領域邁出了堅實的一步,特別是在基于國產硬件的AI模型研發上取得了顯著成就。
    的頭像 發表于 08-27 15:24 ?680次閱讀

    摩爾線程攜手智源研究院完成基于Triton的大模型算子適配

    近日,摩爾線程與北京智源人工智能研究院(簡稱:智源研究院)已順利完成基于Triton語言的高性能算子FlagGems的適配工作。得益于摩爾
    的頭像 發表于 08-02 11:06 ?1095次閱讀

    摩爾線程與智譜AI完成大模型性能測試與適配

    近日,摩爾線程與智譜AI在人工智能領域開展了一輪深入的合作,共同對GPU大模型進行了適配及性能測試。此次測試不僅涵蓋了大模型的推理能力,還涉及了基于摩爾
    的頭像 發表于 06-14 16:40 ?1278次閱讀

    集特摩爾線程顯卡#顯卡

    顯卡摩爾線程
    jf_67464575
    發布于 :2024年05月07日 15:11:28
    主站蜘蛛池模板: 91婷婷色涩涩 | 国产农村一级特黄α真人毛片 | 大学生一级特黄的免费大片视频 | 911国产自产精选 | 五月激情啪啪网 | 狠狠干视频网 | 天天精品视频在线观看资源 | 日韩三级 | 欧美电影一区二区 | 国产精品波多野结衣 | 国产精品国产三级国产普通话对白 | 97午夜理伦片在线影院 | 免费一级大毛片a一观看不卡 | 久久网综合 | 婷婷综合久久狠狠色99h | 91麻豆麻豆 | 黄色在线播放视频 | 午夜欧美性欧美 | 国产福利vr专区精品 | 久热精品在线视频 | 欧美人与z0xxxx另类 | 色偷偷女男人的天堂亚洲网 | 狠狠色丁香婷婷综合橹不卡 | 黄色免费在线网站 | 欧美成人伊人十综合色 | 欧美洲视频在线观看 | 久久艹免费视频 | 米奇777四色精品人人爽 | 成人夜色视频网站在线观看 | 欧美zooz人与禽交 | 在线视频 亚洲 | 四虎影院的网址 | 男女交性永久免费视频播放 | 久久手机看片 | 亚洲激情综合 | 在线观看永久免费 | 黄色美女网站免费 | 经典三级第一页 | 69成人免费视频 | 国产美女亚洲精品久久久久久 | 亚洲高清美女一区二区三区 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品