在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

沐曦GPU跑通DeepSeek開源代碼庫FlashMLA

沐曦MetaX ? 來源:沐曦MetaX ? 2025-02-25 16:25 ? 次閱讀

DeepSeek 開源周

今日,DeepSeek正式啟動"開源周"計劃,首發代碼庫FlashMLA一經開源即引發全網關注。截至發稿,該項目已在GitHub斬獲超7.2K Star!

沐曦技術團隊在FlashMLA開源后迅速響應,僅用2小時即完成與沐曦GPU的適配工作,并于當日將代碼提交至開源社區。本次適配成功后,MXMACA平臺也可完美運行FlashMLA,這充分驗證了沐曦GPGPU架構與MXMACA軟件平臺在生態兼容性方面的先天優勢!

FlashMLA通過MLA解碼優化與分頁KV緩存技術等顯著提升硬件利用率,可加速大語言模型解碼過程,有效提升響應速度與吞吐量,尤其適用于聊天機器人等實時生成場景。沐曦在適配中應用矩陣吸收算法將低秩投影融入Flash Attention 2核函數,在保證計算效率的同時顯著降低顯存占用。同步構建了MXMACA自動化測試體系覆蓋常規及邊界場景,確保功能準確性與數值穩定性,為長文本生成等顯存敏感場景提供顯著性能增益。沐曦本次提交的代碼不僅突破了官方實現中對Hopper架構的依賴,還新增支持64以外的多樣化page size配置,大幅提升框架適用性,為開源社區帶來實質性技術貢獻。

明天,DeepSeek開源計劃第二彈即將揭曉,敬請期待后續動態!

關于沐曦

沐曦致力于為異構計算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產品,推出曦思N系列GPU用于智算推理,曦云C系列GPU用于通用計算,以及曦彩G系列GPU用于圖形渲染,滿足“高能效”及“高通用性”的算力需求。沐曦產品均采用完全自主研發的GPU IP,擁有完全自主的指令集和架構,配以兼容主流GPU生態的完整軟件棧(MXMACA),具備高能效和高通用性的天然優勢,能夠為客戶構建軟硬件一體的全面生態解決方案,是“雙碳”背景下推動數字經濟建設和產業數字化、智能化轉型升級的算力基石。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4841

    瀏覽量

    129893
  • 開源
    +關注

    關注

    3

    文章

    3486

    瀏覽量

    43021
  • 沐曦
    +關注

    關注

    0

    文章

    30

    瀏覽量

    1263
  • DeepSeek
    +關注

    關注

    1

    文章

    658

    瀏覽量

    501

原文標題:2小時極速適配!沐曦GPU率先跑通DeepSeek開源代碼庫FlashMLA!

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    加速DeepSeek滿血版單卡C500異構推理

    近日,基于開源KTransformers架構的 CPU/GPU 異構推理能力,云C500單卡GP
    的頭像 發表于 03-20 15:52 ?178次閱讀

    壁仞科技支持DeepSeek-V3滿血版訓練推理

    DeepSeek開源開源了部分關鍵模塊的代碼及推理系統參考架構,再次引發行業震動,但目前尚未開源De
    的頭像 發表于 03-04 14:01 ?475次閱讀

    摩爾線程全面支持DeepSeek開源周成果

    DeepSeek開源周正式收官,作為國內率先原生支持FP8計算精度的國產GPU企業,摩爾線程迅速響應,并在短時間內,成功實現對DeepSeek各個
    的頭像 發表于 03-04 10:06 ?225次閱讀

    摩爾線程支持DeepSeek開源通信DeepEP和并行算法DualPipe

    DeepSeek開源周第四日,摩爾線程宣布已成功支持DeepSeek開源通信DeepEP和并行算法DualPipe,并發布相關
    的頭像 發表于 02-28 15:58 ?227次閱讀

    摩爾線程完成DeepSeek開源FlashMLA和DeepGEMM適配

    DeepSeek啟動“開源周”以來,已陸續開源三個代碼。摩爾線程基于全新MUSA Compute Capability 3.1計算架構,
    的頭像 發表于 02-27 14:40 ?324次閱讀

    云天勵飛DeepEdge10適配DeepSeek開源周“首個大招”:FlashMLA

    2 月 24 日,DeepSeek"開源周"正式啟動,并發布首個代碼FlashMLA……
    的頭像 發表于 02-27 11:06 ?172次閱讀
    云天勵飛DeepEdge10適配<b class='flag-5'>DeepSeek</b><b class='flag-5'>開源</b>周“首個大招”:<b class='flag-5'>FlashMLA</b>

    DeepSeek宣布開源DeepGEMM

    DeepGEMM 是一個專為簡潔高效的 FP8 通用矩陣乘法(GEMM)設計的,具有細粒度縮放功能,在Deepseek開源周的第三天Deepseek正式宣布
    的頭像 發表于 02-26 15:33 ?715次閱讀

    DeepSeek扔的第二枚開源王炸是什么,跟第一枚有何不同?強烈引發外媒熱議

    與DeepEP。這兩大開源項目的發布,不僅引發了國內外媒體的廣泛關注與熱議,更在AI社區內掀起了軒然大波。 2025年2月25日,DeepSeek開源周的第二天,正式發布了名為DeepEP的
    的頭像 發表于 02-26 11:10 ?516次閱讀
    <b class='flag-5'>DeepSeek</b>扔的第二枚<b class='flag-5'>開源</b>王炸是什么,跟第一枚有何不同?強烈引發外媒熱議

    DeepSeek扔的第二枚開源王炸是什么

    DeepSeek在其開源周活動中連續扔出了兩枚震撼業界的“開源王炸”--FlashMLA與DeepEP。 ? 在25日,也就是DeepSeek
    的頭像 發表于 02-26 11:05 ?426次閱讀
    <b class='flag-5'>DeepSeek</b>扔的第二枚<b class='flag-5'>開源</b>王炸是什么

    開源大模型DeepSeek的開放內容詳析

    代碼、數據到模型的完全開源是人們渴求的方向。那么 DeepSeek開源究竟開放了什么?開放到了何種程度?本文作者——資深程序員+資深律師,一起為大家拆解
    的頭像 發表于 02-19 09:48 ?746次閱讀
    <b class='flag-5'>開源</b>大模型<b class='flag-5'>DeepSeek</b>的開放內容詳析

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇

    方案 :微調CodeLlama-34B(基于電子工程代碼)。 3. 物理設計輔助 Cadence Modus (商業化工具) 集成AI的PCB布局工具,可自動優化走線阻抗、散熱設計等(非開源模型,需
    發表于 02-14 02:08

    Gitee AI 聯合首發全套 DeepSeek R1 千問蒸餾模型,全免費體驗!

    -R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個較小尺寸的 DeepSeek 模型。值得關注的是, 本次上線的四個模型
    的頭像 發表于 02-10 09:56 ?276次閱讀
    Gitee AI 聯合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>首發全套 <b class='flag-5'>DeepSeek</b> R1 千問蒸餾模型,全免費體驗!

    深度解析deepseek開源是什么意思

    Deepseek開源是指Deepseek項目的源代碼被公開,允許任何人免費查看、使用、修改和分發。
    的頭像 發表于 02-06 09:29 ?2819次閱讀

    澎峰科技與完成聯合測試,實現全面兼容

    近日,澎峰科技與科技宣布,雙方已完成對PerfXLM推理引擎、PerfXCloud大模型服務平臺與云系列通用計算
    的頭像 發表于 01-21 15:20 ?392次閱讀

    澎峰科技計算軟件棧與GPU完成適配和互認證

    ?近期,澎峰科技與完成了對PerfXLM(推理引擎)、PerfXCloud(大模型服務平臺)與云系列通用計算
    的頭像 發表于 01-21 09:51 ?313次閱讀
    主站蜘蛛池模板: 老师下面好紧 | 亚洲第成色999久久网站 | 伊人久久网站 | 亚洲国产午夜看片 | 国产手机视频在线 | 欧美日韩一区二区视频图片 | 在线播放网址 | 操日韩美女 | 久久久免费的精品 | 亚洲色图第一页 | 年轻的护士3 | xxxx黄色| 在线观看视频一区二区 | 久久亚洲精品成人综合 | 美女露出扒开尿口让男人桶 | 欧美一欧美一区二三区性 | 久久这里只精品热在线8 | 男子扒开美女尿口做羞羞的事 | 色综合天天综合网国产成人 | 国产在线观看黄 | 久久天天躁狠狠躁夜夜呲 | 亚洲情欲网 | 爱草免费视频 | 日日爽天天干 | 在线网站黄色 | 免费看污黄视频软件 | 日本高清免费一本视频在线观看 | 午夜久久久久久 | 亚洲午夜久久久久影院 | 免费福利午夜影视网 | 日本一区二区视频在线观看 | 国产精品主播在线观看 | 狠狠干欧美 | 好男人社区www在线资源视频 | 欧美三级大片在线观看 | 狠狠狠狠干| 综合婷婷丁香 | a资源在线观看 | 天天爽夜夜爽人人爽一区二区 | 9984四虎永久免费网站 | 全免费一级毛片在线播放 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品