在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

完善資料讓更多小伙伴認(rèn)識(shí)你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

Microsoft開源了零冗余優(yōu)化器版本2（ZeRO-2）

Microsoft開源了零冗余優(yōu)化器版本2（ZeRO-2），這是一種分布式深度學(xué)習(xí)優(yōu)化算法，可根據(jù)集群大小進(jìn)行超線性擴(kuò)展。與以前的分布式學(xué)習(xí)技術(shù)相比，Microsoft使用ZeRO-2培訓(xùn)了10倍的1000億參數(shù)自然語言處理（NLP）模型。

程序經(jīng)理Rangan Majumder和杰出的工程師Wang Junhua在博客中寫道，描述了該算法及其實(shí)驗(yàn)。ZeRO-2是Microsoft開源DeepSpeed庫的一部分，用于深度學(xué)習(xí)培訓(xùn)優(yōu)化。ZeRO-2優(yōu)化了訓(xùn)練過程中的內(nèi)存消耗，允許對(duì)多達(dá)1，700億個(gè)參數(shù)的模型進(jìn)行分布式訓(xùn)練。該算法還減少了分布式集群中工作節(jié)點(diǎn)之間的通信，實(shí)現(xiàn)了超線性并行加速，從而將培訓(xùn)時(shí)間減少了多達(dá)10倍。DeepSpeed團(tuán)隊(duì)在1，024個(gè)GPU的集群上使用ZeRO-2，達(dá)到了創(chuàng)紀(jì)錄的44分鐘的時(shí)間來訓(xùn)練BERT自然語言模型，比NVIDIA的結(jié)果提高了30%以上。

NLP研究的最新趨勢(shì)表明，通過在較大數(shù)據(jù)集上訓(xùn)練的較大模型，可以提高準(zhǔn)確性。OpenAI提出了一套“縮放定律”，表明模型精度與模型大小具有冪律關(guān)系，并且最近通過創(chuàng)建具有1750億個(gè)參數(shù)的GPT-3模型對(duì)該想法進(jìn)行了測(cè)試。由于這些模型太大而無法容納單個(gè)GPU的內(nèi)存，因此對(duì)其進(jìn)行訓(xùn)練需要一堆機(jī)器和模型并行訓(xùn)練技術(shù)，以在整個(gè)集群中分配參數(shù)。有幾種實(shí)現(xiàn)有效的模型并行性的開源框架，包括GPipe和NVIDIA的Megatron，但是由于集群節(jié)點(diǎn)之間的通信開銷，它們具有次線性加速，并且使用框架通常需要模型重構(gòu)。

ZeRO-2使用以下三種策略來減少訓(xùn)練所需的內(nèi)存：減少模型狀態(tài)內(nèi)存需求，將層激活卸載到CPU以及減少內(nèi)存碎片。ZeRO-2可以通過在并行進(jìn)程之間劃分梯度和參數(shù)，將模型狀態(tài)內(nèi)存需求減少多達(dá)8倍。層激活值是從前向訓(xùn)練過程中保存的，以便稍后在后向過程中使用，但是ZeRO-2將它們暫時(shí)從GPU的內(nèi)存移動(dòng)到主機(jī)CPU的內(nèi)存。最后，即使可用內(nèi)存不連續(xù)，即使內(nèi)存可用，內(nèi)存分配也可能失敗。ZeRO-2通過為連續(xù)用途（例如激活和漸變）預(yù)先分配連續(xù)的內(nèi)存塊來減少碎片。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5503

瀏覽量
121182
自然語言處理

自然語言處理

+關(guān)注

關(guān)注
1

文章
618

瀏覽量
13561
nlp

nlp

+關(guān)注

關(guān)注
1

文章
488

瀏覽量
22038

評(píng)論

相關(guān)推薦

開源鴻蒙5.0 Release版本關(guān)鍵特性解讀

概述開源鴻蒙 5.0 Release版本是開源鴻蒙操作系統(tǒng)的一個(gè)里程碑，在系統(tǒng)能力、性能優(yōu)化等多個(gè)方面進(jìn)一步增強(qiáng)。本文將從系統(tǒng)功能、性能優(yōu)化

發(fā)表于 12-23 13:58 ?335次閱讀

PCM1680這個(gè)zero1/2 out是個(gè)什么應(yīng)用場(chǎng)景？不接有什么問題嗎？

PCM16801680這個(gè)zero1/2out是個(gè)什么應(yīng)用場(chǎng)景？不接有沒什么問題？

發(fā)表于 12-11 06:32

?Banana Pi BPi-M4 Zero 開源硬件開發(fā)板評(píng)測(cè)試: 全志科技H618 方案設(shè)計(jì)

Banana Pi 推出了全志 H618 開發(fā)系統(tǒng)的第二個(gè)版本，標(biāo)記為 V2.0，名稱為 BPi-M4 Zero，采用 Raspberry Pi Zero 格式。不久前，我們寫過BPi-M4

發(fā)表于 12-03 17:58 ?344次閱讀

OrangePi?Zero 2W基準(zhǔn)測(cè)試：與OPi 3B、樹莓派3A+、樹莓派?Zero2W等進(jìn)行對(duì)比

。OrangePiZero2W是OrangePiZero系列中最新、最小的成員。Zero系列都是小尺寸SBC，非常適合空間有限的項(xiàng)目。它采用全志H618，這是一款64位四核SoC，擁有四個(gè)運(yùn)

發(fā)表于 11-07 18:04 ?513次閱讀

PerfXCloud重磅升級(jí) 阿里開源最強(qiáng)視覺語言模型Qwen2-VL-7B強(qiáng)勢(shì)上線！

體驗(yàn)吧！ Qwen2-VL Qwen2-VL模型由阿里推出，在描述圖像、理解視頻以及解答視覺相關(guān)問題等方面表現(xiàn)極為卓越。該模型提供2B/7B/72B不同規(guī)模的版本，

發(fā)表于 10-23 11:07 ?294次閱讀

?Banana Pi BPi-M4 Zero 開源硬件開發(fā)板評(píng)測(cè)試

還具有額外的特殊功能：100 MB 以太網(wǎng)、一個(gè) USB 2.0 和1 個(gè)紅外通訊。情況與 Orange Pi Zero 2W 類似，事實(shí)上，使用 OPi，您可以購買帶有帶狀電纜和所有連接器的附加板

發(fā)表于 10-15 12:06

優(yōu)化多相穩(wěn)壓器的高端FET電壓振鈴(第2部分)

電子發(fā)燒友網(wǎng)站提供《優(yōu)化多相穩(wěn)壓器的高端FET電壓振鈴(第2部分).pdf》資料免費(fèi)下載

發(fā)表于 09-25 10:12 ?0次下載

DiSEqC? 2.x濾波器優(yōu)化

電子發(fā)燒友網(wǎng)站提供《DiSEqC? 2.x濾波器優(yōu)化.pdf》資料免費(fèi)下載

發(fā)表于 09-24 10:41 ?0次下載

微軟更新Windows 11 24H2版本,優(yōu)化相關(guān)二進(jìn)制文件

及Copilot+ PC功能進(jìn)行了定制化更新。最新動(dòng)態(tài)中，微軟發(fā)布了編號(hào)為KB5041178的Windows 11 24H2專項(xiàng)更新，此次更新的焦點(diǎn)在于優(yōu)化Windows設(shè)置相關(guān)的二進(jìn)制文件及支持功能更新的關(guān)鍵組件。

發(fā)表于 08-08 17:29 ?724次閱讀

華秋DFM新版本 #持續(xù)優(yōu)化 #服務(wù)升級(jí)

鑼密鼓地響應(yīng)市場(chǎng)反饋，致力于為廣大工程師用戶帶來更穩(wěn)定、更高效的功能體驗(yàn)。在此次4.2新版本中，我們不僅優(yōu)化了一系列核心功能，大幅提升了軟件性能，還根據(jù)大家的反饋新增了幾項(xiàng) 實(shí)用工具，力求讓大家

發(fā)表于 07-04 18:44

BEMF比較器輸出PH_ZC_STS與TLE9893配置向?qū)е杏糜跈z查下降和上升過零檢測(cè)的中斷不匹配，怎么解決？

我在配置向?qū)е袨樗邢辔坏纳仙睾拖陆笛嘏渲?b class='flag-5'>了零交叉中斷，但該中斷與 BEMF 比較器輸出 PHx_ZC_STS 不匹配。以下波形顯示 Phase1_zerocross (PH1_ZC_STS

發(fā)表于 07-03 08:23

龍芯2K0300蜂鳥板支持OpenHarmony 4.0 Release版本操作系統(tǒng)

龍芯2K0300蜂鳥板是基于龍芯中科自研的LoongArch架構(gòu)2K0300處理器設(shè)計(jì)的，整體結(jié)構(gòu)小巧緊湊，功能豐富齊全。龍芯2K0300蜂鳥板采用核心板加擴(kuò)展底板的模塊化設(shè)計(jì)方式，有

發(fā)表于 06-20 10:02

微軟將推出Win11 24H2更新，RTM版本預(yù)計(jì)數(shù)月內(nèi)敲定

值得一提的是，Microsoft 近數(shù)周發(fā)布的Canary及Dev版更新主要聚焦于Bug修正，顯示出24H2更新的研發(fā)正處收官階段。同時(shí)，Microsoft已在Dev渠道中啟動(dòng)推送以檢測(cè)Win11 24H

發(fā)表于 03-25 11:00 ?1056次閱讀

LLaMA 2是什么？LLaMA 2背后的研究工作

Meta 發(fā)布的 LLaMA 2，是新的 sota 開源大型語言模型 (LLM)。LLaMA 2 代表著 LLaMA 的下一代版本，并且具有商業(yè)許可證。

發(fā)表于 02-21 16:00 ?1124次閱讀

什么是PLC的軟冗余和硬冗余？PLC不做性能冗余可不可以？

什么是PLC的軟冗余和硬冗余？PLC不做性能冗余可不可以？軟冗余和硬冗余都是指在PLC（可編程邏輯控制

發(fā)表于 02-02 16:58 ?1983次閱讀

精選推薦
更多

文章

資料

帖子

關(guān)聯(lián)接口函數(shù)與libmodbus移植

瑞薩MCU小百科
13小時(shí)前

167 閱讀

基于FPGA的CIC濾波器設(shè)計(jì)

FPGA設(shè)計(jì)論壇
13小時(shí)前

139 閱讀

基于FPGA的串口UART設(shè)計(jì)

FPGA技術(shù)江湖
14小時(shí)前

226 閱讀

PCB倒角對(duì)信號(hào)質(zhì)量的影響

上海為昕科技有限公司
10小時(shí)前

169 閱讀

使用交錯(cuò)接地平面改善隔離式電源噪聲濾除

德州儀器
17小時(shí)前

364 閱讀

Agilent 34830A, 34832A BenchLi

王偉
2048

5積分

29下載

TMS320VC5402A-160,pdf(Fixed-Point Digital Signal Processor)

笑盡往事
925

5積分

33下載

pwd.sh密碼管理

陳游斗
0.00 MB

2積分

1下載

Cerbos云原生應(yīng)用訪問控制引擎

李秀珍
1.43 MB

2積分

2下載

具有汽車級(jí)NCV3064控制器評(píng)估板SECO-LVDCDC3064-SIC-GEVB型數(shù)據(jù)手冊(cè)

1.95 MB

免費(fèi)

0下載

【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 智能晾衣架

full_stack
1天前

353 閱讀

【「大話芯片制造」閱讀體驗(yàn)】+ 芯片制造過程和生產(chǎn)工藝

jf_02192444
1天前

353 閱讀

【正點(diǎn)原子STM32H7R3開發(fā)套件試用體驗(yàn)】按鍵、串口通信

jf_07365693
1天前

141 閱讀

嵌入式學(xué)習(xí)-飛凌嵌入式ElfBoard ELF 1板卡-mfgtools燒錄流程之燒寫原理

jf_13411809
1天前

362 閱讀

關(guān)于更新openharmony文件系統(tǒng)時(shí)遇到的問題

jf_90063902
1天前

643 閱讀

推薦專欄
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

Microsoft開源了零冗余優(yōu)化器版本2（ZeRO-2）

評(píng)論

開源鴻蒙5.0 Release版本關(guān)鍵特性解讀

PCM1680這個(gè)zero1/2 out是個(gè)什么應(yīng)用場(chǎng)景？不接有什么問題嗎？

?Banana Pi BPi-M4 Zero 開源硬件開發(fā)板評(píng)測(cè)試: 全志科技H618 方案設(shè)計(jì)

OrangePi?Zero 2W基準(zhǔn)測(cè)試：與OPi 3B、樹莓派3A+、樹莓派?Zero2W等進(jìn)行對(duì)比

PerfXCloud重磅升級(jí) 阿里開源最強(qiáng)視覺語言模型Qwen2-VL-7B強(qiáng)勢(shì)上線！

?Banana Pi BPi-M4 Zero 開源硬件開發(fā)板評(píng)測(cè)試

優(yōu)化多相穩(wěn)壓器的高端FET電壓振鈴(第2部分)

DiSEqC? 2.x濾波器優(yōu)化

微軟更新Windows 11 24H2版本,優(yōu)化相關(guān)二進(jìn)制文件

華秋DFM新版本 #持續(xù)優(yōu)化 #服務(wù)升級(jí)

BEMF比較器輸出PH_ZC_STS與TLE9893配置向?qū)е杏糜跈z查下降和上升過零檢測(cè)的中斷不匹配，怎么解決？

龍芯2K0300蜂鳥板支持OpenHarmony 4.0 Release版本操作系統(tǒng)

微軟將推出Win11 24H2更新，RTM版本預(yù)計(jì)數(shù)月內(nèi)敲定

LLaMA 2是什么？LLaMA 2背后的研究工作

什么是PLC的軟冗余和硬冗余？PLC不做性能冗余可不可以？