在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SOK將HugeCTR中的高級(jí)特性進(jìn)行包裝使用

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:HugeCTR ? 2022-04-07 16:02 ? 次閱讀

1. Introduction

HugeCTR 能夠高效地利用 GPU 來(lái)進(jìn)行推薦系統(tǒng)的訓(xùn)練,為了使它還能直接被其他 DL 用戶,比如 TensorFlow 所直接使用,我們開(kāi)發(fā)了 SparseOperationKit (SOK),來(lái)將 HugeCTR 中的高級(jí)特性封裝為 TensorFlow 可直接調(diào)用的形式,從而幫助用戶在 TensorFlow 中直接使用 HugeCTR 中的高級(jí)特性來(lái)加速他們的推薦系統(tǒng)。

pYYBAGJOmyGAEKlZAACdxZaXMq8920.png

圖 1. SOK embedding 工作流程

SOK 以數(shù)據(jù)并行的方式接收輸入數(shù)據(jù),然后在 SOK 內(nèi)部做黑盒式地模型轉(zhuǎn)換,最后將計(jì)算結(jié)果以數(shù)據(jù)并行的方式傳遞給初始 GPU。這種方式可以盡可能少地修改用戶已有的代碼,以更方便、快捷地在多個(gè) GPU 上進(jìn)行擴(kuò)展。

SOK 不僅僅是加速了 TensorFlow 中的算子,而是根據(jù)業(yè)界中的實(shí)際需求提供了對(duì)應(yīng)的新解決方案,比如說(shuō) GPU HashTable。SOK 可以與 TensorFlow 1.15 和 TensorFlow 2.x 兼容使用;既可以使用 TensorFlow 自帶的通信工具,也可以使用 Horovod 等第三方插件來(lái)作為 embedding parameters 以為參數(shù)的通信工具。

2. TF2 Comparison/Performance

使用 MLPerf 的標(biāo)準(zhǔn)模型 DLRM 來(lái)對(duì) SOK 的性能進(jìn)行測(cè)試。

poYBAGJOmyiAeiA8AADnMNf4awU433.png

圖 2. SOK性能測(cè)試數(shù)據(jù)

相比于 NVIDIA 的 DeepLearning Examples,使用 SOK 可以獲得更快的訓(xùn)練速度以及更高的吞吐量。

3. API

SOK 提供了簡(jiǎn)潔的、類 TensorFlow 的 API;使用 SOK 的方式非常簡(jiǎn)單、直接;讓用戶通過(guò)修改幾行代碼就可以使用 SOK。

定義模型結(jié)構(gòu)

poYBAGJOmy2ARBajAADRQdPyK68016.png

左側(cè)是使用 TensorFlow 的 API 來(lái)搭建模型,右側(cè)是使用 SOK 的 API 來(lái)搭建相同的模型。使用 SOK 來(lái)搭建模型的時(shí)候,只需要將 TensorFlow 中的 Embedding Layer 替換為 SOK 對(duì)應(yīng)的 API 即可。

使用 Horovod 來(lái)定義 training loop

pYYBAGJOmziAPRIaAAEf6YbWwDc794.png

同樣的,左側(cè)是使用 TensorFlow 來(lái)定義 training loop,右側(cè)是使用 SOK 時(shí),training loop 的定義方式。可以看到,使用 SOK 時(shí),只需要對(duì) Embedding Variables 和 Dense Variables 進(jìn)行分別處理即可。其中,Embedding Variables 部分由 SOK 管理,Dense Variables 由 TensorFlow 管理。

使用 tf.distribute.MirroredStrategy 來(lái)定義 training loop

poYBAGJOm0WAXaRPAAFOJm89KHA665.png

類似的,還可以使用 TensorFlow 自帶的通信工具來(lái)定義 training loop。

開(kāi)始訓(xùn)練

pYYBAGJOm02AGDvJAACSvcfi_CM767.png

在開(kāi)始訓(xùn)練過(guò)程時(shí),使用 SOK 與使用 TensorFlow 時(shí)所用代碼完全一致。

4. 結(jié)語(yǔ)

SOK 將 HugeCTR 中的高級(jí)特性包裝為 TensorFlow 可以直接使用的模塊,通過(guò)修改少數(shù)幾行代碼即可在已有模型代碼中利用上 HugeCTR 的的先進(jìn)設(shè)計(jì)。

關(guān)于作者

NVIDIA GPU 計(jì)算專家研發(fā)團(tuán)隊(duì)成立于2020年7月,主要面向全球用戶開(kāi)發(fā)基于英偉達(dá)通用計(jì)算產(chǎn)品的軟件解決方案。 目前團(tuán)隊(duì)致力于推薦系統(tǒng)訓(xùn)練框架 Merlin HugeCTR的開(kāi)發(fā)。作為Merlin 系統(tǒng)三大核心軟件之一,Merlin HugeCTR 是一套針對(duì)于推薦系統(tǒng)設(shè)計(jì)的模型訓(xùn)練框架。項(xiàng)目啟動(dòng)于2018年,目前產(chǎn)品應(yīng)用于多家國(guó)際互聯(lián)網(wǎng)公司,自2020年以來(lái),HugeCTR持續(xù)參與并推動(dòng)國(guó)際性競(jìng)賽MLPerf DLRM訓(xùn)練項(xiàng)目,從而實(shí)現(xiàn)了業(yè)界領(lǐng)先的優(yōu)化性能。 NVIDIA GPU 計(jì)算專家研發(fā)團(tuán)隊(duì)是一個(gè)小型國(guó)際化工程團(tuán)隊(duì),核心成員來(lái)自于多個(gè)國(guó)家(中國(guó),韓國(guó),荷蘭,德國(guó)),客戶分布于世界各地。日常工作使用英語(yǔ)溝通。 團(tuán)隊(duì)主要工作圍繞軟件產(chǎn)品開(kāi)發(fā)展開(kāi),涉及產(chǎn)品維護(hù)、文檔、測(cè)試、發(fā)布、部署,日常工作中與各國(guó)硬件、產(chǎn)品、工程、客戶支持團(tuán)隊(duì)有著緊密的合作。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5038

    瀏覽量

    103306
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4754

    瀏覽量

    129099
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    接地電阻柜采用免熏蒸包裝的優(yōu)勢(shì)

    在接地電阻柜的包裝領(lǐng)域,免熏蒸包裝正逐漸成為主流選擇,具有諸多顯著優(yōu)勢(shì)。 免熏蒸包裝材料通常由環(huán)保型復(fù)合材料制成,無(wú)需進(jìn)行熏蒸處理,減少了化學(xué)藥劑的使用,更加環(huán)保安全,符合現(xiàn)代綠色發(fā)展
    的頭像 發(fā)表于 12-11 16:09 ?97次閱讀

    包裝行業(yè)設(shè)備如何通過(guò)Profinet轉(zhuǎn)EthernetIP網(wǎng)關(guān)進(jìn)行交流?

    在我們的日常生活,無(wú)論是食品、醫(yī)藥,還是化妝品行業(yè),包裝都是一個(gè)重要的環(huán)節(jié)。包裝不僅需要美觀大方,更需要快速高效。然而,許多包裝機(jī)械設(shè)備在生產(chǎn)過(guò)程
    的頭像 發(fā)表于 12-04 09:19 ?204次閱讀
    <b class='flag-5'>包裝</b>行業(yè)<b class='flag-5'>中</b>設(shè)備如何通過(guò)Profinet轉(zhuǎn)EthernetIP網(wǎng)關(guān)<b class='flag-5'>進(jìn)行</b>交流?

    Wilink8高級(jí)特性

    電子發(fā)燒友網(wǎng)站提供《Wilink8高級(jí)特性.pdf》資料免費(fèi)下載
    發(fā)表于 11-08 15:58 ?0次下載
    Wilink8<b class='flag-5'>高級(jí)</b><b class='flag-5'>特性</b>

    淺析RFID技術(shù)在循環(huán)包裝管理的應(yīng)用

    隨著物流行業(yè)的快速發(fā)展和環(huán)保意識(shí)的增強(qiáng),循環(huán)包裝逐漸成為企業(yè)減少成本、提升效率和踐行綠色發(fā)展的重要手段。循環(huán)包裝是指可多次重復(fù)使用的包裝容器,如鐵質(zhì)包裝箱、塑料托盤(pán)等。相較于一次性
    的頭像 發(fā)表于 10-31 14:26 ?244次閱讀
    淺析RFID技術(shù)在循環(huán)<b class='flag-5'>包裝</b>管理<b class='flag-5'>中</b>的應(yīng)用

    明達(dá)IO——搭建包裝產(chǎn)線新方案

    包裝行業(yè)在商品銷售扮演著至關(guān)重要的角色,其可以按照多種方式進(jìn)行分類,如按包裝容器、包裝材料、包裝
    的頭像 發(fā)表于 10-15 11:04 ?252次閱讀
    明達(dá)IO——搭建<b class='flag-5'>包裝</b>產(chǎn)線新方案

    利用新型ePWM特性進(jìn)行多相控制

    電子發(fā)燒友網(wǎng)站提供《利用新型ePWM特性進(jìn)行多相控制.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 11:25 ?0次下載
    利用新型ePWM<b class='flag-5'>特性</b><b class='flag-5'>進(jìn)行</b>多相控制

    MT6835 磁編碼 IC 技術(shù)在全自動(dòng)紙包裝機(jī)的應(yīng)用

    一、引言 在現(xiàn)代包裝行業(yè),效率和精度是衡量生產(chǎn)設(shè)備性能的關(guān)鍵指標(biāo)。全自動(dòng)紙包裝機(jī)作為包裝生產(chǎn)線的重要設(shè)備,其性能的優(yōu)劣直接影響到產(chǎn)品的
    的頭像 發(fā)表于 08-15 16:34 ?334次閱讀
    MT6835 磁編碼 IC 技術(shù)在全自動(dòng)紙<b class='flag-5'>包裝</b>機(jī)<b class='flag-5'>中</b>的應(yīng)用

    宏工科技發(fā)力包裝領(lǐng)域,解決超細(xì)粉料包裝難點(diǎn)

    宏工科技不斷在物料處理鏈條上加大研發(fā)力度,攻克了一系列“卡脖子”技術(shù)難題,以技術(shù)創(chuàng)新鑄就宏工的“品牌力”。以包裝領(lǐng)域?yàn)槔槍?duì)不同的包裝需求,宏工科技目前在工業(yè)包裝領(lǐng)域已推出了噸袋包裝
    的頭像 發(fā)表于 08-15 14:54 ?333次閱讀
    宏工科技發(fā)力<b class='flag-5'>包裝</b>領(lǐng)域,解決超細(xì)粉料<b class='flag-5'>包裝</b>難點(diǎn)

    熱收縮膜包裝機(jī)的主要作用

    熱收縮膜包裝機(jī)又稱熱收縮包裝機(jī)(也稱為收縮包裝機(jī)、熱收縮機(jī)、收縮機(jī)、膜包機(jī)等),主要作用是產(chǎn)品用熱收縮薄膜裹包后再進(jìn)行加熱,使薄膜收縮后
    的頭像 發(fā)表于 08-15 11:43 ?536次閱讀

    SOK在手機(jī)行業(yè)的應(yīng)用案例

    通過(guò)封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡(jiǎn)稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關(guān)特性
    的頭像 發(fā)表于 07-25 10:01 ?372次閱讀
    <b class='flag-5'>SOK</b>在手機(jī)行業(yè)的應(yīng)用案例

    元器件的包裝方式及常見(jiàn)的四種方式

    四種元件包裝方式在實(shí)際生產(chǎn)和使用中廣泛應(yīng)用,不同的包裝方式適用于不同類型和規(guī)格的元件,并且可以根據(jù)具體要求進(jìn)行定制化的包裝設(shè)計(jì)。不同的包裝
    的頭像 發(fā)表于 06-27 12:58 ?1711次閱讀

    機(jī)器視覺(jué)檢測(cè):薯愿外包裝檢測(cè)

    食品及包裝行業(yè)中常常需要對(duì)產(chǎn)品的包裝盒、包裝袋表面進(jìn)行缺陷檢測(cè),其檢測(cè)內(nèi)容包括產(chǎn)品混料、外包裝破損、臟污等,機(jī)器視覺(jué)技術(shù)能夠通過(guò)拍照或掃描取
    的頭像 發(fā)表于 05-08 13:36 ?514次閱讀
    機(jī)器視覺(jué)檢測(cè):薯愿外<b class='flag-5'>包裝</b>檢測(cè)

    激光打標(biāo)機(jī)在食品包裝行業(yè)的應(yīng)用與優(yōu)勢(shì)

    激光打標(biāo)機(jī)在食品包裝行業(yè)的應(yīng)用與優(yōu)勢(shì)如下:應(yīng)用:1.激光打標(biāo)機(jī)可以用于食品包裝袋、瓶蓋、罐頭等包裝材料的打標(biāo)和雕刻,打印生產(chǎn)日期、保質(zhì)期、批次號(hào)、二維碼等信息。2.激光打標(biāo)機(jī)還可以用
    的頭像 發(fā)表于 02-27 18:05 ?522次閱讀
    激光打標(biāo)機(jī)在食品<b class='flag-5'>包裝</b>行業(yè)<b class='flag-5'>中</b>的應(yīng)用與優(yōu)勢(shì)

    自動(dòng)稱重包裝機(jī)如何數(shù)據(jù)采集到云平臺(tái)進(jìn)行監(jiān)控管理

    企業(yè)的生產(chǎn)管理,數(shù)據(jù)采集和監(jiān)控管理起著至關(guān)重要的作用。 云平臺(tái)是一種基于互聯(lián)網(wǎng)的計(jì)算方式,可以提供彈性計(jì)算、存儲(chǔ)和應(yīng)用服務(wù)。將自動(dòng)稱重包裝機(jī)的數(shù)據(jù)采集到云平臺(tái),可以實(shí)現(xiàn)對(duì)生產(chǎn)數(shù)據(jù)的實(shí)時(shí)監(jiān)控、遠(yuǎn)程管理和智能
    的頭像 發(fā)表于 02-20 15:42 ?521次閱讀
    自動(dòng)稱重<b class='flag-5'>包裝</b>機(jī)如何數(shù)據(jù)采集到云平臺(tái)<b class='flag-5'>進(jìn)行</b>監(jiān)控管理

    熱收縮膜包裝機(jī)數(shù)據(jù)采集遠(yuǎn)程監(jiān)控系統(tǒng)如何實(shí)現(xiàn)

    熱收縮膜包裝機(jī)是一種使用熱收縮膜對(duì)產(chǎn)品進(jìn)行包裝的設(shè)備。它的工作原理是先將熱收縮膜加熱至軟化狀態(tài)并緊緊地包裹在產(chǎn)品上,最后通過(guò)快速冷卻使膜收縮并固化,從而緊緊地貼合在產(chǎn)品表面,形成緊密、透明的包裝效果
    的頭像 發(fā)表于 01-23 17:15 ?407次閱讀
    熱收縮膜<b class='flag-5'>包裝</b>機(jī)數(shù)據(jù)采集遠(yuǎn)程監(jiān)控系統(tǒng)如何實(shí)現(xiàn)
    主站蜘蛛池模板: 亚洲 欧美 视频| 国产午夜久久精品| 香蕉爱爱网| 国产午夜精品理论片在线| 欧美成人免费网站| 亚洲高清在线视频| 国产单男| 国产欧美在线一区二区三区| 欧美三级免费观看| 色福利网站| 泰剧天堂| 婷婷色激情| 亚洲综合色吧| 国产精品久久久久久久久齐齐| 4480yy私人午夜a级国产| 啪啪网视频| 欧美黄色三级| 啪啪网站免费| 美女视频黄a全部免费看小说 | 日本精品一在线观看视频| 四虎网址最新| 五月婷婷婷婷| 青娱乐99| 欧美女人天堂| 女人双腿搬开让男人桶 | 亚洲一区二区三| 又粗又长又大真舒服好爽漫画| 欧美网站在线| 免费看男女做好爽好硬视频| 五月伊人婷婷| 久久成人性色生活片| 久久综合色视频| 精品四虎免费观看国产高清午夜| 成人在线免费| 夜夜操天天爽| 日日操夜夜操天天操| 九色视频网| 69精品久久久久| yy6080三级理论韩国日本| 精品女同| 婷婷亚洲五月琪琪综合|