在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Merlin HugeCTR v3.6和v3.7版本新增內容介紹

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-06-17 09:28 ? 次閱讀

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個 GPU 和節點之間分配訓練并估計點擊率(Click-through rate)。

V3.6 版本新增內容

1. Concat 層現已支持 3D 輸入張量:

在之前的版本中,Concat 層只能處理 2D 輸入張量。現在輸入可以是 3D 并且可以沿軸 1 和軸 2 連接。

2. Parquet 數據讀取器現已支持讀取稠密特征中的列表:

在以前的版本中, HugeCTR 假設每個稠密特征只有一個值,并且數據類型必須是 float32,也就是是一種標量類型。而現在用戶可以將 float32 或者 [float32] 用于稠密特征,這意味著每個稠密特征可以有多個值。

3. 在 Merlin 容器中重新啟用 HDFS:

Merlin 容器中的 HDFS 支持現在是一個可選依賴項。有關詳細信息,請參閱核心功能文檔中的 HDFS 支持部分。

(https://nvidia-merlin.github.io/HugeCTR/v3.6/hugectr_core_features.html#hdfs-support)

4. 評估指標中增加 AUC 評估:

以前版本的 HugeCTR 僅針對二進制分類的情況計算 AUC。在這個版本中,我們支持多標簽分類的 AUC。我們使用 sklearn 的 AUC 實現作為參考 (https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html)。我們實現了未加權的宏觀平均策略,這是 sklearn 中的默認策略。用戶可以更改輸入層的“label_dim”參數以啟用多標簽分類,我們的實現將在該場景中計算多標簽 AUC。

5. 日志輸出格式升級:

我們已將默認日志輸出格式升級為毫秒級。

6. 文檔更新:

a. 發布說明現已添加到網絡文檔中,可通過以下鏈接訪問

(https://nvidia-merlin.github.io/HugeCTR/master/release_notes.html)。

b. HPS(分級參數服務器)配置手冊

我們為 HPS 添加了一個配置手冊(https://nvidia-merlin.github.io/HugeCTR/master/hugectr_parameter_server.html#configuration-book) 。這本配置手冊總結了 Python API 和 JSON 格式的所有參數及其用法。

c. 與使用多模態數據相關的示例筆記本在標題多模態示例筆記本下的導航中重新排布(https://nvidia-merlin.github.io/HugeCTR/master/notebooks/multi-modal -data/index.html),旨在提供更好的閱讀體驗。

d. 我們更清楚地描述了SOK 提供的功能以及介紹了如何使用它們。

V3.7 版本新增內容:

1. 第三代 Embedding 開發者預覽:

在這個版本中,我們引入了第三代 Embedding 的開發者預覽版本,與先前的 Embedding 相比,第三代 Embedding 主要有三個變化。首先,它允許用戶融合具有不同 Embedding 向量大小的 Embedding Table,從而提高了靈活性和性能。其次,它現在支持 concat combiner ,以及在同一個 Embedding Table 上的不同 slot 來進行查找。最后,Embedding Collection 的引入有力地支持了自定義 Embedding Table 的放置,包括數據并行和模型并行。通過提供一個 JSON 文件,您可以根據您的指定配置更改 Embedding Table 的放置策略。更詳細的使用方法,清查閱實例

https://github.com/NVIDIA-Merlin/HugeCTR/tree/v3.7/test/embedding_collection_test 下的 dlrm_train.py 腳本。

2. 分級參數服務器性能改進:

a. Kafka:模型參數現在以節省帶寬的多路復用數據格式存儲在 Kafka 中,這種數據格式極大地提高了吞吐量。在我們的測試中,每個 Kafka Broker 的傳輸速度高達 1.1 Gbps。

b. HashMap 后端:并行和單線程的 hashmap 實現已被新的統一實現取代。這個新的實現使用了一種新的基于內存池的分配方法,它極大地提高了插入性能,而不會降低召回性能。與之前的實現相比,大批量插入操作的速度提高了 4 倍。

c. 壓縮的日志:用戶可以在 Triton 服務啟動時配置多級日志輸出,從而提高在線推理的吞吐量。

d. 簡化配置:HugeCTR 后端將推理參數服務器相關配置(ps.json)和 Triton 配置(config.pbtxt)完全解耦,避免了 Triton 中的重復配置。

e. Embedding 更新的凍結功能:HugeCTR 后端已經支持通過 Triton 的模型控制接口只更新模型的密集部分,從而避免 Embedding 的在重復在線更新。

3. 離線推理可用性的增強:

線程池的大小現在可以配置了,這對于研究異步更新場景中的 Embedding Cache 性能十分有用。更多信息,請參閱分層參數服務器配置

https://nvidia-merlin.github.io/HugeCTR/master/hugectr_parameter_server.html#configuration。

4. 數據生成器性能提升:

現在可以指定 `num_threads` 參數以并行化 `Norm` 數據集生成。

5. 評估指標改進:

a. 多節點環境中的 AverageLoss 性能提升

b. AUC 性能優化和更安全的內存管理

c. NDCG 和 SMAPE

6. 使用 Parquet 數據集的 Embedding Training Cache(ETC) 演示:

現在我們提供了一個 keyset 提取腳本以生成 Parquet 數據集的 keyset文件。并且為用戶提供了一個使用 ETC 模式訓練 Parquet 數據集的端到端演示: https://github.com/NVIDIA-Merlin/HugeCTR/blob/master/notebooks/embedding_training_cache_example.ipynb 。

7. 文檔更新:

HugeCTR 分層參數服務器數據庫后端 https://nvidia-merlin.github.io/HugeCTR/master/hugectr_parameter_server.html 的文檔詳細信息已更新,以保持一致性和清晰性。

8. 修復的問題:

a. 在使用 Parquet 數據類型時,如果指定了 `slot_size_array`,則不再需要指定 `workspace_size_per_gpu_in_mb` 了。

b.如果您從頭開始構建和安裝 HugeCTR,您可以指定 `CMAKE_INSTALL_PREFIX` 變量來指定 HugeCTR 的安裝目錄。

c. 解決了使用大量 GPU 進行 SOK 訓練時 sok.init()的掛起問題:

https://github.com/NVIDIA-Merlin/HugeCTR/issues/261

https://github.com/NVIDIA-Merlin/HugeCTR/issues/302。

已知問題

以下是目前 HugeCTR 存在的已知問題,我們將在之后的版本中盡快修復。

HugeCTR 使用 NCCL 在 rank 之間共享數據,并且 NCCL 可能需要共享系統內存用于 IPC 和固定(頁面鎖定)系統內存資源。在容器內使用 NCCL 時,建議您通過發出以下命令來增加這些資源 `-shm-size=1g -ulimit memlock=-1`

另見 NCCL 的 已知問題 https://docs.nvidia.com/deeplearning/nccl/user-guide/docs/troubleshooting.html#sharing-data。還有 GitHub 問題 https://github.com/NVIDIA-Merlin/HugeCTR/issues/243 。

目前即使目標 Kafka broker 無響應, KafkaProducers 啟動也會成功。為了避免與來自 Kafka 的流模型更新相關的數據丟失,您必須確保有足夠數量的 Kafka brokers 啟動、正常工作并且可以從運行 HugeCTR 的節點訪問。

文件列表中的數據文件數量應不小于數據讀取器的數量。否則,不同的 data reader worker 將被映射到同一個文件,導致數據加載不會按預期進行。

正則化器暫時不支持聯合損失訓練。

用于 HugeCTR 訓練樣本的 Criteo 1TB Click Logs 數據集目前不可用。在它再次可下載之前,您可以基于我們的合成數據集生成器運行這些示例。有關詳細信息,請參閱 https://nvidia-merlin.github.io/HugeCTR/master/hugectr_user_guide.html#generating-synthetic-data-and-benchmarks 。

目前的數據生成器在生成 Parquet 數據集時會產生不一致的文件名,這會將導致使用合成的 Parquet 數據時報錯。

原文標題:HugeCTR v3.6 & v3.7 發布說明

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5026

    瀏覽量

    103286
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4754

    瀏覽量

    129085
  • 程序
    +關注

    關注

    117

    文章

    3792

    瀏覽量

    81189

原文標題:HugeCTR v3.6 & v3.7 發布說明

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    特斯拉FSD V13.2版本正式發布

    的又一次重要突破。 FSD V13.2版本的發布對特斯拉而言具有重要意義。該版本在技術和功能上進行了全面升級,旨在提供更加穩定、高效的自動駕駛體驗。特斯拉表示,如果新版本在初期測試中未
    的頭像 發表于 12-03 11:01 ?704次閱讀

    馬斯克宣布FSD V13版本將很快發布

    今年9月份,特斯拉的AI團隊就曾在馬斯克的X平臺上發帖,表示目標是在10月底發布FSD V13版本。然而,這一時間點并未如愿實現。到了10月下旬,特斯拉AI團隊再次表示,他們的目標是在感恩節之前推出最新的FSD V13
    的頭像 發表于 11-26 11:15 ?481次閱讀

    實時網絡的仿真和配置工具RTaW Pegase v4.6版本更新

    隨著嵌入式系統日益復雜,高效可靠的設計工具變得愈發重要。RTaW公司的仿真工具RTaW-Pegase最新發布的4.6版本,為用戶帶來了一系列重要更新和功能增強。本文將詳細介紹
    的頭像 發表于 09-26 08:07 ?269次閱讀
    實時網絡的仿真和配置工具RTaW Pegase <b class='flag-5'>v</b>4.6<b class='flag-5'>版本</b>更新

    NVIDIA Parabricks v4.3.1版本的新功能

    會(ESHG)上發布,其加入了新的體細胞數據變異檢測功能,并將業內領先的工具升級到最新版本。這個版本是繼在 NVIDIA GTC 2024 大會上發布 Parabricks v4.3 之后推出的新
    的頭像 發表于 09-10 10:22 ?401次閱讀
    NVIDIA Parabricks <b class='flag-5'>v</b>4.3.1<b class='flag-5'>版本</b>的新功能

    RaftKeeper v2.1.0版本發布,性能大幅提升!

    ClickHouse 場景中,用于解決 ZooKeeper 的性能瓶頸問題,同時 RaftKeeper 也可以用于其它大數據組件比如 HBase。 v2.1.0 作為 v2.0.0 后的重要版本,引入了一系列
    的頭像 發表于 07-15 15:10 ?349次閱讀
    RaftKeeper <b class='flag-5'>v</b>2.1.0<b class='flag-5'>版本</b>發布,性能大幅提升!

    微軟發布智能辦公工具OfficePLUS V 3.0版本

    近日,微軟發布了智能辦公工具 OfficePLUS V 3.0 版本。全新升級的 OfficePLUS V 3.0 新增了 Excel 插件,繼已發布的 PPT/Word 插件之后,
    的頭像 發表于 06-27 09:26 ?787次閱讀

    ENV-Windows v2.0.0版本發布

    ENV-Windows v2.0.0版本發布
    的頭像 發表于 06-26 08:35 ?814次閱讀
    ENV-Windows <b class='flag-5'>v</b>2.0.0<b class='flag-5'>版本</b>發布

    chrome插件新版本v3版本)中的熱更新,即加載更新遠程js的方法探索

    1 主流方案及嘗試 現在瀏覽器插件中,大多采用直接調用遠程代碼的方式進行熱更新,由于安全策略逐步增強,越來越不支持熱更新了;chrome在新v3版本插件中直接給禁止了;對于v2版本則即
    的頭像 發表于 06-14 10:19 ?850次閱讀
    chrome插件新<b class='flag-5'>版本</b>(<b class='flag-5'>v</b>3<b class='flag-5'>版本</b>)中的熱更新,即加載更新遠程js的方法探索

    單節鋰電池3V、3.3V3.7V升壓至5V9V12V,3W-30W電路demo測試合集

    單節鋰電升壓3V、3.3V3.7V升壓至5V、9V、12V電流,3W-30W電路DEMO板測試
    的頭像 發表于 05-09 16:45 ?2362次閱讀
    單節鋰電池3<b class='flag-5'>V</b>、3.3<b class='flag-5'>V</b>、<b class='flag-5'>3.7V</b>升壓至5<b class='flag-5'>V9V12V</b>,3W-30W電路demo測試合集

    LwIP v2.0版本更換為v2.1.2版本后接收不到數據了怎么解決?

    請教下,吧 LwIP v2.0 版本更換為 v2.1.2 版本后接收不到數據了,是怎么回事啊 ?? 之前使用 v2.0
    發表于 04-23 08:20

    達實智能正式發布AIoT智能物聯網管控平臺V6版本

    近日,在達實智能成立29周年慶典上,公司正式發布AIoT智能物聯網管控平臺V6版本
    的頭像 發表于 03-20 16:42 ?1436次閱讀
    達實智能正式發布AIoT智能物聯網管控平臺<b class='flag-5'>V</b>6<b class='flag-5'>版本</b>

    機智云“智家”APP V4.4.22版本發布

    新功能上線版本更新親愛的機友們,迎來了機智云智家APP全新版本V4.4.22的發布!此次更新,我們為您帶來了一系列實用的功能優化和全新的體驗,讓智能生活更加便捷、智慧!更新內容一覽01
    的頭像 發表于 03-16 08:09 ?408次閱讀
    機智云“智家”APP <b class='flag-5'>V</b>4.4.22<b class='flag-5'>版本</b>發布

    PW2051芯片,實現鋰電池3.7V到2.5V, 1.5V, 1.2V的高效降壓轉換

    電子工程師必備:PW2051芯片,實現鋰電池3.7V到2.5V, 1.5V, 1.2V的高效降壓轉換,低功耗,外圍簡單
    的頭像 發表于 03-05 13:50 ?1153次閱讀
    PW2051芯片,實現鋰電池<b class='flag-5'>3.7V</b>到2.5<b class='flag-5'>V</b>, 1.5<b class='flag-5'>V</b>, 1.2<b class='flag-5'>V</b>的高效降壓轉換

    Embedded office發布安全插件V1.1版本

    Embedded office很高興地宣布安全插件V1.1版本的發布了!現在通過外部設備或不同核心架構的專門通道支持端到端受保護的安全通信。
    的頭像 發表于 02-20 11:12 ?645次閱讀

    3.7V鋰電池浪涌靜電防護方案詳解

    3.7V鋰電池是一種標稱電壓為3.7V,滿電電壓為4.2V的鋰電池,其容量從幾百到幾千毫安時不等,一般應用于各種儀器儀表、檢測儀器、醫療儀器、POS機、筆記電腦等產品上。浪涌靜電,可
    的頭像 發表于 01-18 09:24 ?1377次閱讀
    <b class='flag-5'>3.7V</b>鋰電池浪涌靜電防護方案詳解
    主站蜘蛛池模板: 伊人久久成人| 丁香花在线电影小说观看| 俄罗斯毛片基地| 四月婷婷七月婷婷综合| 日本不卡免费一区| www.夜色| 男人的天堂免费视频| 完整日本特级毛片| 同性同男小说肉黄| 欧美精品xx| 加勒比一到三区| 伊人狼人综合| 国产tube| 亚洲最新视频| 在线观看永久免费| 天天视频在线观看免费| 又粗又爽又色男女乱淫播放男女 | 欧美另类自拍| 轻点灬大ji巴太粗太长了啊h| 扒开双腿猛进入jk校视频| 在线观看日本免费不卡| 爱射综合| www.操操操.com| 久久久久久久成人午夜精品福利| 天天操天天干天天| 午夜免费啪在线观看视频网站| xvideos国产| www.丁香| 日日做夜夜爽夜夜爽| 欧美456| 色之综综| 医生好大好硬好爽好紧| 欧美黑人xxxx猛牲大交| 日本一区二区三区视频在线观看| 亚洲国产精品综合久久网络| 在线你懂的视频| 一级片视频播放| 性喷潮久久久久久久久| 五月综合色| 色老头久久网| 日韩午夜免费|