在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Merlin HugeCTRV 3.8/3.9版本新增內容

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-08-24 10:12 ? 次閱讀

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個 GPU 和節點之間分配訓練并估計點擊率(Click-through rate)。

V3.8 版本新增內容

1. 第三代 Embedding 的示例:

這個版本我們新增了一個示例筆記本,介紹了 Embedding 集合的 Python API 以及第三代 Embedding 的使用方法。

2. 用于分級參數服務器查找功能的 DLPack Python API:

這個版本我們引入了對使用 DLPack Python API 從分層參數服務器 (HPS) 查找 Embedding 的支持。新方法是 lookup_fromdlpack()。

3. 使用 Python API 從 HDFS 讀取 Parquet 數據集:

現在您可以通過 DataSourceParams 來指定 Data Reader 的數據源的配置了,例如 Hadoop 分布式文件系統的 NameNode 的主機名和 NameNode 端口號。

4. 提高了日志記錄的性能。

5. 層類的改進:

全連接層現已支持 3 維輸入,Matrix Multiply 層現已支持 4 維輸入。

6. 文檔的改進:

a. 增加了導航長頁面以提供更好的體驗。

b. Criteo 1TB 點擊日志數據集的 URL 已更新。

7. 修復的問題:

修復了 _metadata.json 配置文件內的文件名和實際數據集文件名不一致的問題。

修復了在 AUC 預熱期間在多個 GPU 上運行大型模型時發生的內存崩潰問題。

修復了 ETC 筆記本中鍵集生成的問題。

修復了使用調試模式編譯時發生的編譯錯誤。

修復多節點訓練出現重復日志的問題。

V3.9 版本新增內容

1. 第三代 Embedding 的更新:

更新了 SOK 以使用 HugeCTR 第三代 Embedding 作為開發者預覽版本。

啟用了基于 cuCollection的動態Embedding 模式。動態的Embedding能夠在用戶不配置內存使用信息時自動拓展。

2. 全新的多節點訓練教程

我們提供了一個全新的基于 HugeCTR 最新 Docker 容器使用多節點訓練的實例。

3. 現已支持 MMoE 模型的離線推理并提供了 Per-class AUC 和平均 AUC 計算。

4. 對 HPS TensorFlow 插件使用的文檔和實例更新:

一個新的簡介文檔。

新的實例筆記本。

新的API文檔。

5. 修復的問題:

修復了一個訓練性能受到 GPU 例程檢查影響的問題。該例程檢查輸入的 key 是否在規定的 Embedding Table 范圍內。對于可以保證輸入的 key 能放在指定的 workspace_size_per_gpu_in_mb 的情況,我們提供了一種解決方法:通過設置環境變量 HUGECTR_DISABLE_OVERFLOW_CHECK=1 來關閉例程檢查,以便恢復訓練性能。

我們修復了一個 Softmax 層的正確性問題。

我們刪除了一個未更新且不再使用的內聯分析器。

已知問題

以下是目前HugeCTR存在的已知問題,我們將在之后的版本中盡快修復。

HugeCTR 使用 NCCL 在 rank 之間共享數據,并且 NCCL 可能需要共享系統內存用于 IPC 和固定(頁面鎖定)系統內存資源。在容器內使用 NCCL 時,建議您通過發出以下命令來增加這些資源 -shm-size=1g -ulimit memlock=-1

另見 NCCL 的 已知問題。

還有 GitHub 問題。

目前即使目標 Kafka broker 無響應,KafkaProducers 啟動也會成功。為了避免與來自 Kafka 的流模型更新相關的數據丟失,您必須確保有足夠數量的 Kafka brokers 啟動、正常工作并且可以從運行 HugeCTR 的節點訪問。

文件列表中的數據文件數量應不小于數據讀取器的數量。否則,不同的 data reader worker 將被映射到同一個文件,導致數據加載不會按預期進行。

正則化器暫時不支持聯合損失訓練。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4762

    瀏覽量

    129151
  • python
    +關注

    關注

    56

    文章

    4802

    瀏覽量

    84890
  • GitHub
    +關注

    關注

    3

    文章

    473

    瀏覽量

    16506

原文標題:HugeCTR v3.8 & v3.9 發布說明

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    HDMI Forum發布HDMI規范2.2版本

    邁出了重要一步。 HDMI規范2.2版本內容制作商,如電視、電影和游戲工作室等,提供了更高質量的選擇。無論是當前還是未來,這一新技術都能滿足內容制作商對于高清畫質和高效傳輸的需求。同時,它還能實現多種分發平臺,為用戶提供更加豐
    的頭像 發表于 01-10 14:07 ?133次閱讀

    OurBMC 24.12版本正式上線

    日前,經過社區開發者的共同努力,OurBMC 全新升級,24.12版本正式上線。
    的頭像 發表于 01-07 13:45 ?137次閱讀

    淺談Xpedition 2409版本的新功能

    在《創新不止|Xpedition 2409版本新功能揭秘(上)》一文中,我們了解了Xpedition 2409版本的部分改進部分。今天,我們繼續看Xpedition 2409新版本給我們帶來了什么樣的全新用戶體驗。
    的頭像 發表于 10-31 15:33 ?1119次閱讀

    Percepio Tracealyzer 4.9版本改善Linux用戶體驗

    嵌入式邊緣系統工具解決方案的領先供應商Percepio AB宣布提供Tracealyzer4.9版本——這是其嵌入式軟件旗艦可觀察性工具的最新更新。
    的頭像 發表于 10-22 14:08 ?368次閱讀

    實時網絡的仿真和配置工具RTaW Pegase v4.6版本更新

    RTaW-Pegasev4.6版本的主要更新內容,涵蓋了DDS、SOME/IP、Ethernet、CAN以及SDV等多個關鍵領域的改進。無論您是汽車電子、航空航天還是工業自動化領域的專業
    的頭像 發表于 09-26 08:07 ?279次閱讀
    實時網絡的仿真和配置工具RTaW Pegase v4.6<b class='flag-5'>版本</b>更新

    USB4 2.0版本的重大更新

    USB版本一直很多,可以說是五花八門,但是隨著接口的日漸統一,USB的版本可以說減少了很多,到了USB4,只剩下USB-C接口,為何還有一個2.0版本,我們往下詳解。
    的頭像 發表于 09-09 14:37 ?659次閱讀

    微軟發布智能辦公工具OfficePLUS V 3.0版本

    近日,微軟發布了智能辦公工具 OfficePLUS V 3.0 版本。全新升級的 OfficePLUS V 3.0 新增了 Excel 插件,繼已發布的 PPT/Word 插件之后, 完成了對 Office 核心使用場景的全方位覆蓋,讓用戶擁有更加輕松的創作體驗。
    的頭像 發表于 06-27 09:26 ?792次閱讀

    ENV-Windows v2.0.0版本發布

    ENV-Windows v2.0.0版本發布
    的頭像 發表于 06-26 08:35 ?821次閱讀
    ENV-Windows v2.0.0<b class='flag-5'>版本</b>發布

    微軟Edge瀏覽器新增睡眠模式標簽頁自動舍棄策略

    據悉,微軟近期面向測試版平臺推送了Edge 125版本更新,新增加“AutoDiscardSleepingTabsEnabled”功能,即自動清除開啟休眠模式超過1.5天的標簽頁。
    的頭像 發表于 05-08 11:52 ?570次閱讀

    LwIP v2.0版本更換為v2.1.2版本后接收不到數據了怎么解決?

    請教下,吧 LwIP v2.0 版本更換為 v2.1.2 版本后接收不到數據了,是怎么回事啊 ?? 之前使用 v2.0 版本測試是完全可以了,不過目前 使用 v2.1.2版本的,dhc
    發表于 04-23 08:20

    美國Merlin公司加速自主飛行模擬器開發

    美國Merlin公司正全力加速自主飛行模擬器的開發進程,以推動航空領域的創新與發展。這一舉措不僅體現了Merlin公司在技術研發方面的雄厚實力,也預示著自主飛行技術即將迎來新的突破。
    的頭像 發表于 04-22 11:30 ?630次閱讀

    蘋果停iOS 16.7.6驗證,僅支持16.7.7版本驗證

    據悉,蘋果已于4月17日停止了對iOS 16.7.6版本的驗證服務。對于已升級至iOS 16.7.7版本的iPhone用戶來說,他們已無法返回至舊版系統。
    的頭像 發表于 04-17 10:27 ?1175次閱讀

    使用1.9.0版本時,stm32cubemx生成ETH+LWIP代碼,直接編譯出錯的原因?

    字節內容全為0,后256字節為我本次發送數據,第三次768字節,第四次1024字節,都是最后256字節有新數據,其余全為0。滿1024字節后,再也收不到數據了。 使用1.9.0版本
    發表于 03-25 08:10

    機智云“智家”APP V4.4.22版本發布

    新功能上線版本更新親愛的機友們,迎來了機智云智家APP全新版本V4.4.22的發布!此次更新,我們為您帶來了一系列實用的功能優化和全新的體驗,讓智能生活更加便捷、智慧!更新內容一覽01單設備分享優化
    的頭像 發表于 03-16 08:09 ?418次閱讀
    機智云“智家”APP V4.4.22<b class='flag-5'>版本</b>發布

    PSOC Creator由3.3版本升級到4.1版本后,程序的EEEPROM模塊無法使用怎么解決?

    PSOC Creator由3.3版本升級到4.1版本后,程序的EEEPROM模塊無法使用,請提供一下CY8C4247讀寫內部Flash的例程,謝謝 。
    發表于 02-01 06:58
    主站蜘蛛池模板: 亚色影视| 天天干中文字幕| 四虎影视免费看| 亚洲男人的天堂久久香蕉| 日本特黄绿像大片免费看| 国产精品热久久毛片| 麒麟色欧美影院在线播放| 综合一个色| 伊人久久大线蕉香港三级| 欧美性色黄大片四虎影视| 2019天天爱天天做| h视频在线观看网站| 日本不卡视频在线播放| 黄色网在线看| 色播影院性播免费看| 国产精品1区2区3区在线播放| 手机在线播放视频| 国产精品天天看| 一级大片视频| 3344在线观看永久免费| 国色天香精品亚洲精品| 性高清| 欧美亚洲综合一区| 国产激爽大片在线播放| 天天爱天天做天天爽| 在线观看的黄网| q2002在线观看免费| 国产高清在线精品| 亚洲一区在线播放| 亚洲第一毛片| 男人天堂色男人| 久久狠色噜噜狠狠狠狠97| 男人天堂网在线观看| 成人毛片在线播放| 又大又粗进出白浆直流动态图| 天堂最新资源在线| 黄色的网站在线观看| 亚洲成人www| 天堂在线观看| 色噜噜亚洲精品中文字幕| 色噜噜久久|