在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Merlin HugeCTR V3.4.1版本新增內容介紹

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-03-10 10:15 ? 次閱讀

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個 GPU 和節點之間分配訓練并估計點擊率(Click-through rate)。

此次v3.4更新涉及的模塊主要為:

HugeCTR 分級參數服務器

HugeCTR Python API

相關介紹:

HugeCTR 分級參數服務器介紹

V3.4.1 版本新增內容

調整了整個代碼庫中日志消息的日志級別。

現已支持對具有多個標簽的數據集進行推理:

“Softmax” 層現在已支持 FP16,并且支持混合精度以進行多標簽推理。

支持多 GPU 離線推理:

我們通過 Python 接口支持多 GPU 離線推理,它可以利用Hierarchical Parameter Server并在多個設備上實現并發執行。更多信息請參考推理 API和多 GPU 離線推理筆記本。

HPS 已構建為獨立庫:

我們重構了代碼庫并將分層參數服務器構建為一個獨立的庫,以后會進一步封裝。

metadata.json 簡介:

添加了有關 Parquet data 中 _metadata.json 的詳細信息。

增加了用于估計每個 GPU 的詞匯量大小的文檔和工具:

我們添加了一個工具來計算每個 GPU 的不同嵌入類型的詞匯量大小,在此基礎上,workspace_size_per_gpu_in_mb 可以根據嵌入向量大小和優化器類型評估更多信息請參考腳本。

訓練中支持 HDFS :

a. 現在支持從 HDFS 加載和存儲模型和優化器狀態。

b. 增加了編譯選項使 HDFS 的支持更加靈活。

c. 添加了一個筆記本來展示如何將 HugeCTR 與 HDFS 一起使用:

增加了一個演示如何分析模型文件的 Python 腳本和筆記本

錯誤修復:

修復了SOK 中的鏡像策略錯誤

修復了無法在nvcr.io/nvidia/merlin/merlin-tensorflow-training:22.02中導入稀疏操作工具包的問題。

HugeCTR 參數服務器:修復了在未配置 RocksDB 時,可能會在初始化期間發生的訪問沖突問題。

已知問題

HugeCTR 使用 NCCL 在 rank 之間共享數據,并且 NCCL 可能需要共享系統內存用于 IPC 和固定(頁面鎖定)系統內存資源。在容器內使用 NCCL 時,建議您通過發出以下命令(-shm-size=1g -ulimit memlock=-1) 來增加這些資源。

另見 NCCL 的 已知問題

還有 GitHub 問題

目前即使目標 Kafka broker 無響應,KafkaProducers 啟動也會成功。為了避免與來自 Kafka 的流模型更新相關的數據丟失,您必須確保有足夠數量的 Kafka brokers 啟動、正常工作并且可以從運行 HugeCTR 的節點訪問。

文件列表中的數據文件數量應不小于數據讀取器的數量。否則,不同的 worker 將被映射到同一個文件,從而導致數據加載不會按預期進行。

正則化器暫不支持聯合損失訓練。

原文標題:Merlin HugeCTR v3.4.1 發布說明

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4760

    瀏覽量

    129135
  • 節點
    +關注

    關注

    0

    文章

    220

    瀏覽量

    24463
  • 服務器
    +關注

    關注

    12

    文章

    9255

    瀏覽量

    85753

原文標題:Merlin HugeCTR v3.4.1 發布說明

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    OurBMC 24.12版本正式上線

    日前,經過社區開發者的共同努力,OurBMC 全新升級,24.12版本正式上線。
    的頭像 發表于 01-07 13:45 ?134次閱讀

    特斯拉FSD V13.2版本正式發布

    的又一次重要突破。 FSD V13.2版本的發布對特斯拉而言具有重要意義。該版本在技術和功能上進行了全面升級,旨在提供更加穩定、高效的自動駕駛體驗。特斯拉表示,如果新版本在初期測試中未
    的頭像 發表于 12-03 11:01 ?718次閱讀

    馬斯克宣布FSD V13版本將很快發布

    今年9月份,特斯拉的AI團隊就曾在馬斯克的X平臺上發帖,表示目標是在10月底發布FSD V13版本。然而,這一時間點并未如愿實現。到了10月下旬,特斯拉AI團隊再次表示,他們的目標是在感恩節之前推出最新的FSD V13
    的頭像 發表于 11-26 11:15 ?486次閱讀

    淺談Xpedition 2409版本的新功能

    在《創新不止|Xpedition 2409版本新功能揭秘(上)》一文中,我們了解了Xpedition 2409版本的部分改進部分。今天,我們繼續看Xpedition 2409新版本給我們帶來了什么樣的全新用戶體驗。
    的頭像 發表于 10-31 15:33 ?1087次閱讀

    實時網絡的仿真和配置工具RTaW Pegase v4.6版本更新

    隨著嵌入式系統日益復雜,高效可靠的設計工具變得愈發重要。RTaW公司的仿真工具RTaW-Pegase最新發布的4.6版本,為用戶帶來了一系列重要更新和功能增強。本文將詳細介紹
    的頭像 發表于 09-26 08:07 ?275次閱讀
    實時網絡的仿真和配置工具RTaW Pegase <b class='flag-5'>v</b>4.6<b class='flag-5'>版本</b>更新

    NVIDIA Parabricks v4.3.1版本的新功能

    會(ESHG)上發布,其加入了新的體細胞數據變異檢測功能,并將業內領先的工具升級到最新版本。這個版本是繼在 NVIDIA GTC 2024 大會上發布 Parabricks v4.3 之后推出的新
    的頭像 發表于 09-10 10:22 ?411次閱讀
    NVIDIA Parabricks <b class='flag-5'>v</b>4.3.1<b class='flag-5'>版本</b>的新功能

    SOK在手機行業的應用案例

    通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關特性和優化加速 GPU 上的分布式 Embed
    的頭像 發表于 07-25 10:01 ?376次閱讀
    SOK在手機行業的應用案例

    微軟發布智能辦公工具OfficePLUS V 3.0版本

    近日,微軟發布了智能辦公工具 OfficePLUS V 3.0 版本。全新升級的 OfficePLUS V 3.0 新增了 Excel 插件,繼已發布的 PPT/Word 插件之后,
    的頭像 發表于 06-27 09:26 ?792次閱讀

    ENV-Windows v2.0.0版本發布

    ENV-Windows v2.0.0版本發布
    的頭像 發表于 06-26 08:35 ?817次閱讀
    ENV-Windows <b class='flag-5'>v</b>2.0.0<b class='flag-5'>版本</b>發布

    chrome插件新版本v3版本)中的熱更新,即加載更新遠程js的方法探索

    1 主流方案及嘗試 現在瀏覽器插件中,大多采用直接調用遠程代碼的方式進行熱更新,由于安全策略逐步增強,越來越不支持熱更新了;chrome在新v3版本插件中直接給禁止了;對于v2版本則即
    的頭像 發表于 06-14 10:19 ?862次閱讀
    chrome插件新<b class='flag-5'>版本</b>(<b class='flag-5'>v</b>3<b class='flag-5'>版本</b>)中的熱更新,即加載更新遠程js的方法探索

    LwIP v2.0版本更換為v2.1.2版本后接收不到數據了怎么解決?

    請教下,吧 LwIP v2.0 版本更換為 v2.1.2 版本后接收不到數據了,是怎么回事啊 ?? 之前使用 v2.0
    發表于 04-23 08:20

    美國Merlin公司加速自主飛行模擬器開發

    美國Merlin公司正全力加速自主飛行模擬器的開發進程,以推動航空領域的創新與發展。這一舉措不僅體現了Merlin公司在技術研發方面的雄厚實力,也預示著自主飛行技術即將迎來新的突破。
    的頭像 發表于 04-22 11:30 ?627次閱讀

    達實智能正式發布AIoT智能物聯網管控平臺V6版本

    近日,在達實智能成立29周年慶典上,公司正式發布AIoT智能物聯網管控平臺V6版本
    的頭像 發表于 03-20 16:42 ?1445次閱讀
    達實智能正式發布AIoT智能物聯網管控平臺<b class='flag-5'>V</b>6<b class='flag-5'>版本</b>

    機智云“智家”APP V4.4.22版本發布

    新功能上線版本更新親愛的機友們,迎來了機智云智家APP全新版本V4.4.22的發布!此次更新,我們為您帶來了一系列實用的功能優化和全新的體驗,讓智能生活更加便捷、智慧!更新內容一覽01
    的頭像 發表于 03-16 08:09 ?418次閱讀
    機智云“智家”APP <b class='flag-5'>V</b>4.4.22<b class='flag-5'>版本</b>發布

    Embedded office發布安全插件V1.1版本

    Embedded office很高興地宣布安全插件V1.1版本的發布了!現在通過外部設備或不同核心架構的專門通道支持端到端受保護的安全通信。
    的頭像 發表于 02-20 11:12 ?658次閱讀
    主站蜘蛛池模板: 国产精品九九热| 国产黄色片在线观看| 午夜视频免费国产在线| 一级片在线免费观看| 在线观看886影院成人影院| 亚洲最大毛片| 天天骑夜夜操| 九九精品影院| 人人澡人人澡碰人人看软件 | 欧美日一区二区三区| 美女视频黄色的免费| 国产专区日韩精品欧美色| bt 电影天堂| 思思久久好好热精品国产| 国产美女一级片| 亚洲黄色天堂| 在线欧美视频免费观看国产| 五月婷婷免费视频| 人人精品久久| 国产精品亚洲色图| 天天插视频| riav久久中文一区二区| 亚洲一区日本| 午夜色综合| 久久精品男人的天堂| 午夜在线观看视频| xxxx黄| 亚洲欧洲第一页| 五月婷婷社区| 久久久噜噜噜| 午夜精品久久久久久91| 大色综合色综合资源站| 免费aⅴ网站| 色丁香在线视频| 国产精品美女自在线观看免费| 天天干天天玩天天操| 好紧好爽太大了h视频| 亚洲欧美日韩动漫 | 中文三 级 黄 色 片| 三级毛片免费观看| 丁香婷婷成人|