在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Microsoft開源了零冗余優(yōu)化器版本2(ZeRO-2)

倩倩 ? 來源:文財(cái)網(wǎng) ? 2020-07-22 15:12 ? 次閱讀

Microsoft開源了零冗余優(yōu)化器版本2(ZeRO-2),這是一種分布式深度學(xué)習(xí)優(yōu)化算法,可根據(jù)集群大小進(jìn)行超線性擴(kuò)展。與以前的分布式學(xué)習(xí)技術(shù)相比,Microsoft使用ZeRO-2培訓(xùn)了10倍的1000億參數(shù)自然語言處理(NLP)模型。

程序經(jīng)理Rangan Majumder和杰出的工程師Wang Junhua在博客中寫道,描述了該算法及其實(shí)驗(yàn)。ZeRO-2是Microsoft開源DeepSpeed庫的一部分,用于深度學(xué)習(xí)培訓(xùn)優(yōu)化。ZeRO-2優(yōu)化了訓(xùn)練過程中的內(nèi)存消耗,允許對(duì)多達(dá)1,700億個(gè)參數(shù)的模型進(jìn)行分布式訓(xùn)練。該算法還減少了分布式集群中工作節(jié)點(diǎn)之間的通信,實(shí)現(xiàn)了超線性并行加速,從而將培訓(xùn)時(shí)間減少了多達(dá)10倍。DeepSpeed團(tuán)隊(duì)在1,024個(gè)GPU的集群上使用ZeRO-2,達(dá)到了創(chuàng)紀(jì)錄的44分鐘的時(shí)間來訓(xùn)練BERT自然語言模型,比NVIDIA的結(jié)果提高了30%以上。

NLP研究的最新趨勢(shì)表明,通過在較大數(shù)據(jù)集上訓(xùn)練的較大模型,可以提高準(zhǔn)確性。OpenAI提出了一套“縮放定律”,表明模型精度與模型大小具有冪律關(guān)系,并且最近通過創(chuàng)建具有1750億個(gè)參數(shù)的GPT-3模型對(duì)該想法進(jìn)行了測(cè)試。由于這些模型太大而無法容納單個(gè)GPU的內(nèi)存,因此對(duì)其進(jìn)行訓(xùn)練需要一堆機(jī)器和模型并行訓(xùn)練技術(shù),以在整個(gè)集群中分配參數(shù)。有幾種實(shí)現(xiàn)有效的模型并行性的開源框架,包括GPipe和NVIDIA的Megatron,但是由于集群節(jié)點(diǎn)之間的通信開銷,它們具有次線性加速,并且使用框架通常需要模型重構(gòu)。

ZeRO-2使用以下三種策略來減少訓(xùn)練所需的內(nèi)存:減少模型狀態(tài)內(nèi)存需求,將層激活卸載到CPU以及減少內(nèi)存碎片。ZeRO-2可以通過在并行進(jìn)程之間劃分梯度和參數(shù),將模型狀態(tài)內(nèi)存需求減少多達(dá)8倍。層激活值是從前向訓(xùn)練過程中保存的,以便稍后在后向過程中使用,但是ZeRO-2將它們暫時(shí)從GPU的內(nèi)存移動(dòng)到主機(jī)CPU的內(nèi)存。最后,即使可用內(nèi)存不連續(xù),即使內(nèi)存可用,內(nèi)存分配也可能失敗。ZeRO-2通過為連續(xù)用途(例如激活和漸變)預(yù)先分配連續(xù)的內(nèi)存塊來減少碎片。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121182
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    618

    瀏覽量

    13561
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    488

    瀏覽量

    22038
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    開源鴻蒙5.0 Release版本關(guān)鍵特性解讀

    概述 開源鴻蒙 5.0 Release版本開源鴻蒙操作系統(tǒng)的一個(gè)里程碑,在系統(tǒng)能力、性能優(yōu)化等多個(gè)方面進(jìn)一步增強(qiáng)。本文將從系統(tǒng)功能、性能優(yōu)化
    的頭像 發(fā)表于 12-23 13:58 ?335次閱讀

    PCM1680這個(gè)zero1/2 out是個(gè)什么應(yīng)用場(chǎng)景?不接有什么問題嗎?

    PCM16801680這個(gè)zero1/2out是個(gè)什么應(yīng)用場(chǎng)景?不接有沒什么問題?
    發(fā)表于 12-11 06:32

    ?Banana Pi BPi-M4 Zero 開源硬件開發(fā)板評(píng)測(cè)試: 全志科技H618 方案設(shè)計(jì)

    Banana Pi 推出了全志 H618 開發(fā)系統(tǒng)的第二個(gè)版本,標(biāo)記為 V2.0,名稱為 BPi-M4 Zero,采用 Raspberry Pi Zero 格式。不久前,我們寫過BPi-M4
    的頭像 發(fā)表于 12-03 17:58 ?344次閱讀
    ?Banana Pi BPi-M4 <b class='flag-5'>Zero</b> <b class='flag-5'>開源</b>硬件開發(fā)板評(píng)測(cè)試: 全志科技H618 方案設(shè)計(jì)

    OrangePi?Zero 2W基準(zhǔn)測(cè)試:與OPi 3B、樹莓派3A+、樹莓派?Zero2W等進(jìn)行對(duì)比

    。OrangePiZero2W是OrangePiZero系列中最新、最小的成員。Zero系列都是小尺寸SBC,非常適合空間有限的項(xiàng)目。它采用全志H618,這是一款64位四核SoC,擁有四個(gè)運(yùn)
    的頭像 發(fā)表于 11-07 18:04 ?513次閱讀
    OrangePi?<b class='flag-5'>Zero</b> <b class='flag-5'>2</b>W基準(zhǔn)測(cè)試:與OPi 3B、樹莓派3A+、樹莓派?<b class='flag-5'>Zero2</b>W等進(jìn)行對(duì)比

    PerfXCloud重磅升級(jí) 阿里開源最強(qiáng)視覺語言模型Qwen2-VL-7B強(qiáng)勢(shì)上線!

    體驗(yàn)吧! Qwen2-VL Qwen2-VL模型由阿里推出,在描述圖像、理解視頻以及解答視覺相關(guān)問題等方面表現(xiàn)極為卓越。該模型提供2B/7B/72B不同規(guī)模的版本
    的頭像 發(fā)表于 10-23 11:07 ?294次閱讀
    PerfXCloud重磅升級(jí)  阿里<b class='flag-5'>開源</b>最強(qiáng)視覺語言模型Qwen<b class='flag-5'>2</b>-VL-7B強(qiáng)勢(shì)上線!

    ?Banana Pi BPi-M4 Zero 開源硬件開發(fā)板評(píng)測(cè)試

    還具有額外的特殊功能:100 MB 以太網(wǎng)、一個(gè) USB 2.0 和1 個(gè)紅外通訊。情況與 Orange Pi Zero 2W 類似,事實(shí)上,使用 OPi,您可以購買帶有帶狀電纜和所有連接的附加板
    發(fā)表于 10-15 12:06

    優(yōu)化多相穩(wěn)壓的高端FET電壓振鈴(第2部分)

    電子發(fā)燒友網(wǎng)站提供《優(yōu)化多相穩(wěn)壓的高端FET電壓振鈴(第2部分).pdf》資料免費(fèi)下載
    發(fā)表于 09-25 10:12 ?0次下載
    <b class='flag-5'>優(yōu)化</b>多相穩(wěn)壓<b class='flag-5'>器</b>的高端FET電壓振鈴(第<b class='flag-5'>2</b>部分)

    DiSEqC? 2.x濾波優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《DiSEqC? 2.x濾波優(yōu)化.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 10:41 ?0次下載
    DiSEqC? <b class='flag-5'>2</b>.x濾波<b class='flag-5'>器</b><b class='flag-5'>優(yōu)化</b>

    微軟更新Windows 11 24H2版本,優(yōu)化相關(guān)二進(jìn)制文件

    及Copilot+ PC功能進(jìn)行了定制化更新。最新動(dòng)態(tài)中,微軟發(fā)布編號(hào)為KB5041178的Windows 11 24H2專項(xiàng)更新,此次更新的焦點(diǎn)在于優(yōu)化Windows設(shè)置相關(guān)的二進(jìn)制文件及支持功能更新的關(guān)鍵組件。
    的頭像 發(fā)表于 08-08 17:29 ?724次閱讀

    華秋DFM新版本 #持續(xù)優(yōu)化 #服務(wù)升級(jí)

    鑼密鼓地響應(yīng)市場(chǎng)反饋,致力于為廣大工程師用戶帶來更穩(wěn)定、更高效的功能體驗(yàn)。 在此次4.2新版本中,我們不僅優(yōu)化了一系列 核心功能 ,大幅提升了軟件性能,還根據(jù)大家的反饋新增幾項(xiàng) 實(shí)用工具 ,力求讓大家
    發(fā)表于 07-04 18:44

    BEMF比較輸出PH_ZC_STS與TLE9893配置向?qū)е杏糜跈z查下降和上升過檢測(cè)的中斷不匹配,怎么解決?

    我在配置向?qū)е袨樗邢辔坏纳仙睾拖陆笛嘏渲?b class='flag-5'>了交叉中斷,但該中斷與 BEMF 比較輸出 PHx_ZC_STS 不匹配。 以下波形顯示 Phase1_zerocross (PH1_ZC_STS
    發(fā)表于 07-03 08:23

    龍芯2K0300蜂鳥板支持OpenHarmony 4.0 Release版本操作系統(tǒng)

    龍芯2K0300蜂鳥板是基于龍芯中科自研的LoongArch架構(gòu)2K0300處理設(shè)計(jì)的,整體結(jié)構(gòu)小巧緊湊,功能豐富齊全。龍芯2K0300蜂鳥板采用核心板加擴(kuò)展底板的模塊化設(shè)計(jì)方式,有
    發(fā)表于 06-20 10:02

    微軟將推出Win11 24H2更新,RTM版本預(yù)計(jì)數(shù)月內(nèi)敲定

    值得一提的是,Microsoft 近數(shù)周發(fā)布的Canary及Dev版更新主要聚焦于Bug修正,顯示出24H2更新的研發(fā)正處收官階段。同時(shí),Microsoft已在Dev渠道中啟動(dòng)推送以檢測(cè)Win11 24H
    的頭像 發(fā)表于 03-25 11:00 ?1056次閱讀

    LLaMA 2是什么?LLaMA 2背后的研究工作

    Meta 發(fā)布的 LLaMA 2,是新的 sota 開源大型語言模型 (LLM)。LLaMA 2 代表著 LLaMA 的下一代版本,并且具有商業(yè)許可證。
    的頭像 發(fā)表于 02-21 16:00 ?1124次閱讀

    什么是PLC的軟冗余和硬冗余?PLC不做性能冗余可不可以?

    什么是PLC的軟冗余和硬冗余?PLC不做性能冗余可不可以? 軟冗余和硬冗余都是指在PLC(可編程邏輯控制
    的頭像 發(fā)表于 02-02 16:58 ?1983次閱讀
    主站蜘蛛池模板: 男人女人真曰批视频播放| 天天爽夜夜| 精品黄色录像| 亚色视频在线| 免费一级特黄特色大片| 天天操天天干天天拍| 国产成人精品日本亚洲专| 国内精品久久久久久影院老狼| 手机在线观看你懂的| 香蕉视频久久久| 日本一级成人毛片免费观看| 美女扒开内裤无遮挡禁18| 欧美另类色| 一区二区中文字幕| 亚洲国产七七久久桃花| 国产真实乱xxxav| 美女露出扒开尿口让男人桶| 一级毛片一级毛片一级毛片aa| 亚洲精品国产自在久久出水| 看全色黄大色大片免费| 亚洲成人77777| 中文字幕第十页| 性瘾高h姚蕊全文免费阅读| 免费在线观看污视频| 亚洲精品国产成人| 日本美女黄视频| 色婷婷激婷婷深爱五月老司机| 欧美色综合网站| 日本.www| 色多多·com| 婷婷六月色| 欧美一级色| 日本最好的免费影院| 两性色午夜视频免费国产| 欧美videosex性欧美成人| 欧美爽爽网| 丁香婷五月| 欧美色惰aⅴ| 亚洲一区二区影视| 色视频在线观看完整免费版| 亚洲伊人久久大香线蕉结合|