在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA DGX SuperPOD 助力京東探索研究院 Vega-MT 模型大賽奪魁!

NVIDIA英偉達 ? 來源:未知 ? 2023-01-18 00:50 ? 次閱讀

圖片來源于京東

借助 NVIDIA DGX SuperPOD,京東探索研究院訓練了參數量近五十億的 Vega-MT 模型,在 2022 年第 17 屆國際機器翻譯大賽(WMT)上大放異彩。Vega-MT 在中文-英語(BLEU 33.5, chrF 0.611)、英文-中文(BLEU 49.7, chrF 0.446)、德語-英語(BLEU 33.7, chrF 0.585)、英語-德語(BLEU 37.8, chrF 0.643)、捷克語-英語(BLEU 54.9, chrF 0.744)、英語-捷克語(BLEU 41.4, chrF 0.651)和英語-俄羅斯語(BLEU 32.7, chrF 0.584)在七個翻譯賽道上榮獲冠軍。

作為大規模 AI 基礎架構,NVIDIA DGX SuperPOD 具備完整、先進的基礎架構。相較于原來的 V100 集群,DGX SuperPOD 除了在單卡算力上取得了接近兩倍的提升外,在算力擴展性方面也呈線性增長,即擴展性方面相較于從前也取得了兩倍的提升。在多節點的情況下總計獲得了約 4 倍的提升。因此,原本需要數月才能完成類似模型(相當規模、相當復雜度)的訓練任務縮短到了兩周,研究人員也有了更充裕的時間針對模型優化。

客戶簡介及應用背景

京東作為以供應鏈為基礎的技術與服務企業。京東探索研究院(JD Explore Academy)秉承“以技術為本,致力于更高效和可持續的世界”的集團使命,是以京東集團以各事業群與業務單元的技術發展為基礎,集合全集團資源和能力,成立的專注前沿科技探索的研發部門,是實現研究和協同創新的生態平臺。探索研究院深耕泛人工智能 3 大領域,包括“量子機器學習”、“可信人工智能”、“超級深度學習”,從基礎理論層面實現顛覆式創新,助力數智化產業發展及社會變革,以原創性科技賦能京東集團零售、物流、健康、科技等全產業鏈場景,打造源頭性科技高地,實現從量變到質變的跨越式發展,引領行業砥礪前行。

國際機器翻譯大賽(WMT)是全球學術界公認的國際頂級機器翻譯比賽,由國際計算語言學協會(ACL)舉辦,是協會旗下的頂尖賽事。自 2006 年至今,WMT 的每次比賽都是全球各大高校、科技公司與學術機構展示自身機器翻譯實力的平臺,更見證了機器翻譯技術的不斷進步。

京東探索研究院在 WMT 大賽上這一重大成就進一步驗證了自然語言處理大模型在理解、生成、跨語種建模上的優越性。

客戶挑戰

機器翻譯面臨諸多挑戰:常見的幾個語種使用廣泛數據資源豐富,小語種在跨境電商中非常必要但數據不充分,小數據集的訓練面臨挑戰;同時,挖掘語種與語種的聯系也是難點之一,因為語言生成的復雜性、多義性,表達的多樣性、文化背景,語種之間的差異等都是機器翻譯比賽中繞不開的難題。

從 2018 年的 GPT-1 的 1.1 億參數,到現今大規模語言模型擁有萬億參數,大模型在多種語言任務上準確率的顯著提高,有助于我們構建對自然語言有著更加豐富理解的智能系統。

Vega-MT 采用了諸多先進技術,包括多方向預訓練(multidirectional pre-training)、超大模型(Extremely Large Transformer)、循環翻譯(cycle translation)和雙向自訓練(bidirectional self-training),來充分挖掘雙語數據、單語數據的知識。此外,還使用了噪聲信道重排序和泛化性微調等策略來增強 Vega-MT 系統的魯棒性和譯文的信達雅水平。

但是,在訓練大模型時,我們依然會面臨諸多困難。在此之前對于一般任務一張 GPU 即可勝任模型的訓練,但是在大模型場景,需要多節點協同才能完成最終的訓練任務,這也對現有的 GPU 計算集群提出了新的挑戰。以知名的 GPT-3 為例,它使用了 45 TB 的訓練數據,最高達到 1750 億的模型參數量;在采用混合精度時,它共占用約 2.8 TB 的顯存,需要超過 35 張 GPU 才能將模型全部放下。

因此,訓練的挑戰集中在單卡算力和多卡多節點通信上,訓練也會跨越多個節點。此時數據傳輸、任務調度、并行優化、資源利用率等方面就顯得尤為重要。

應用方案

在構建 AI 基礎架構時,我們會面臨來自方方面面的挑戰,例如計算資源,網絡,存儲,乃至最上層用來進行任務調度的軟件等,而這些方面并非獨立,需要綜合考量。

京東探索研究院采用的 NVIDIA DGX SuperPOD 就是一套綜合完整的高性能解決方案。SuperPOD AI 集群,基于 DGX 服務器,HDR InfiniBand 200G 網卡以及 NVIDIA Quantum QM8790 交換機,計算網絡和儲存網絡隔離,既保證了最優的算力,又可以確保節點和卡之間的高效互聯,最大程度提升分布式訓練的效率。

算力層面,單節點算力高達 2.4 PFLOPS,采用單節點進行訓練,BERT 只需 17 分鐘即可完成訓練,Mask R-CNN 38 分鐘,RetinaNet 也只需 83 分鐘。而針對于 Transformer XL Base,181 分鐘即可完成訓練。同時,依托于多實例 GPU (Multi-Instance GPU, MIG) 技術,可以將 GPU 分割成多個實例,每個實例都有其獨立的顯存,緩存以及流式多處理器,彼此之間故障隔離。這樣一來可以進一步提升 GPU 的利用率,同時滿足需要不同算力的任務。

網絡層面,通過 Scalable Hierarchical Aggregation and Reduction Protocol (SHARP) 技術,可以讓聚合計算從 CPU 遷移到交換機網絡,消除了節點之間多次發送數據的需求,大幅縮減了到達聚合節點的網絡流量,從而顯著減少執行 MPI 的時間,同時讓通信效率與節點數目不再直接相關,進一步保障了算力的可擴展性。除此之外,將 CPU 從處理通信的任務中解脫出來,讓寶貴的 CPU 資源聚焦于計算上,進一步提升了整體集群處理任務的能力。

儲存層面,在訓練模型時,往往需要從存儲中多次讀取訓練數據,而讀取操作的耗時也會在一定程度上影響訓練的時效。DGX SuperPOD 使用了高性能的多層級儲存架構,以平衡性能、容量和成本的需求。而借助于 GPU Direct RDMA 技術,可以繞過 CPU 直接連通 GPU,儲存和網絡設備,從而進行高速低時延的數據傳輸。

軟件層面,為了構建集群以及保障集群的持久化平穩運行,上層的監控調度管理軟件不可或缺。Base Command Manager 是一個集群管理系統,它可以對集群進行一系列的配置,管理用戶訪問,資源監控,記錄日志,以及通過 slurm 進行作業任務調度。同時,NGC 上涵蓋了大量 AI,HPC,數據科學相關的資源,用戶可以輕松獲取到功能強大的軟件,容器鏡像,以及各類預訓練模型。

與此同時,探索研究院團隊對集群進行了 7x24 小時的監控管理,確保訓練任務長時間的平穩運行。監控資源利用率,也確保了每個節點上的計算資源能被充分地利用了起來。在完善的調度監控工作和 DGX SuperPOD 高可靠性的質量保證下,所有被使用到的訓練節點在模型訓練的 20 天 (2 周 pre-training + 5天 fine-tuning) 內,沒有出現任何問題,訓練最終圓滿完成。

使用效果及影響

Vega-MT 被成功應用在了京東國慶期間對外發布的 Omni-Force AIGC 小程序中。小程序的應用是用戶輸入文字生成對應的圖片,在 Vega-MT 的加持下,小程序可以支持多個語種的文字輸入,譬如中文、英文、西班牙文等等。

京東探索研究院表示: “通過 NVIDIA DGX SuperPOD 的加持,京東探索研究院可以快速迭代模型,幫助高準確度的模型快速落地,進一步提升用戶體驗,降低成本,提升效果和業務收益。此次 NVIDIA DGX SuperPOD 支持我們能在 WMT 比賽中拔得頭籌,不僅提高了企業的知名度,也助力了京東成為更受用戶信賴的品牌”。

值得一提的是,除了 Vega-MT 外,NVIDIA DGX SuperPOD 也在探索研究院的其他大模型訓練上發揮了不可或缺的作用,譬如 ViTAE,織女模型等。

點擊“閱讀原文”掃描下方海報二維碼,即可免費注冊 GTC 23,切莫錯過這場 AI 和元宇宙時代的技術大會


原文標題:NVIDIA DGX SuperPOD 助力京東探索研究院 Vega-MT 模型大賽奪魁!

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3800

    瀏覽量

    91338

原文標題:NVIDIA DGX SuperPOD 助力京東探索研究院 Vega-MT 模型大賽奪魁!

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    浪潮信息與智源研究院攜手共建大模型多元算力生態

    人工智能技術的快速發展。浪潮信息與智源研究院將充分整合各自在算力、算法和技術創新方面的優勢資源,共同探索模型多元算力的新應用和新模式。 目前,智源研究院的Triton算子庫FlagG
    的頭像 發表于 12-31 11:49 ?247次閱讀

    安謀科技與智源研究院達成戰略合作,共建開源AI“芯”生態

    12月25日,安謀科技(中國)有限公司(以下簡稱“安謀科技”)與北京智源人工智能研究院(以下簡稱“智源研究院”)正式簽署戰略合作協議,雙方將面向多元AI芯片領域開展算子庫優化與適配、編譯器與工具鏈
    發表于 12-26 17:06 ?131次閱讀
    安謀科技與智源<b class='flag-5'>研究院</b>達成戰略合作,共建開源AI“芯”生態

    浪潮信息與智源研究院達成戰略合作協議

    近日,浪潮信息與智源研究院達成戰略合作協議,雙方將緊密協作共建大模型多元算力開源創新生態,提升大模型創新研發的算力效率,降低大模型應用開發的算力門檻。目前,智源Triton算子庫Fla
    的頭像 發表于 12-26 10:25 ?190次閱讀

    NVIDIA助力丹麥發布首臺AI超級計算機

    這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創新中心共同建設,是一臺 NVIDIA DGX SuperPOD 超級計算機。
    的頭像 發表于 10-27 09:42 ?463次閱讀

    中國電信人工智能研究院完成首個全國產化萬卡萬參大模型訓練

    近日,中國電信人工智能研究院宣布了一項重大技術突破:成功完成國內首個基于全國產化萬卡集群訓練的萬億參數大模型
    的頭像 發表于 09-30 16:41 ?1717次閱讀

    鉆井工程技術研究院選購我司導熱系數測試儀

    在科研的廣闊天地里,每一次技術革新都如同星辰,點亮了人類探索未知的征途。鉆井工程技術研究院,作為行業內的領航者,始終站在科研的前沿,致力于鉆井技術的深度挖掘與創新。近日,鉆井工程技術研究院與上海和晟
    的頭像 發表于 09-11 11:19 ?240次閱讀
    鉆井工程技術<b class='flag-5'>研究院</b>選購我司導熱系數測試儀

    摩爾線程攜手智源研究院完成基于Triton的大模型算子庫適配

    近日,摩爾線程與北京智源人工智能研究院(簡稱:智源研究院)已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾線程自研統一系統計算架構MUSA,雙方在短短一周多的時間
    的頭像 發表于 08-02 11:06 ?907次閱讀

    長沙北斗研究院總部基地正式奠基

    長沙北斗研究院總部基地正式奠基 日前長沙北斗研究院總部基地正式奠基,項目由長沙北斗研究院牽頭建設;項目又名“北斗足跡”。項目一期預計2025年年底前建成投用。 據悉,長沙北斗研究院總部
    的頭像 發表于 05-16 12:49 ?1220次閱讀

    航天宏圖與天儀研究院合作共同推動遙感衛星數據應用創新

    近日,航天宏圖信息技術股份有限公司(以下簡稱“航天宏圖”)與長沙天儀空間科技研究院有限公司(以下簡稱“天儀研究院”)正式簽署戰略合作框架協議。
    的頭像 發表于 04-23 17:11 ?607次閱讀
    航天宏圖與天儀<b class='flag-5'>研究院</b>合作共同推動遙感衛星數據應用創新

    英偉達Blackwell平臺網絡配置分析

    采用 DGX GB200 系統的 NVIDIA DGX SuperPOD 專為訓練和推理萬億參數生成式AI 模型而構建。
    的頭像 發表于 04-17 11:01 ?1492次閱讀

    國家高新技術研究院發布“2023小巨人企業50強”

    3月28日,國際高新技術研究院公布了“2023小巨人企業50強”名單。 包括欣旺達動力科技股份有限公司、京東方傳感技術有限公司、士蘭半導體制造有限公司在內的多家明星企業成功登榜。
    的頭像 發表于 03-29 16:49 ?1456次閱讀

    NVIDIA Blackwell DGX SuperPOD助力萬億級生成式AI計算

    全新 DGX SuperPOD 采用新型高效液冷機架級擴展架構,基于 NVIDIA DGX GB200 系統構建而成,在 FP4 精度下可提供 11.5 exaflops 的 AI 超
    發表于 03-21 09:49 ?227次閱讀

    NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時間 3 月 18 日發布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX
    的頭像 發表于 03-21 09:49 ?738次閱讀

    英偉達推出百億參數AI模型處理方案——DGX SuperPOD

    據悉,新型DGX SuperPOD采用全新的高效水冷機架式設計,搭載英偉達DGX GB200系統,FP4精度下具備11.5 exaflops的人工智能超級計算力以及240 terabytes的高速內存。用戶可以通過加裝機架進行持
    的頭像 發表于 03-19 14:35 ?772次閱讀

    NVIDIA 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數級的生成式 AI 超級計算

    ——? NVIDIA 于今日發布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX
    發表于 03-19 10:56 ?457次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架構 <b class='flag-5'>DGX</b> <b class='flag-5'>SuperPOD</b>,適用于萬億參數級的生成式 AI 超級計算
    主站蜘蛛池模板: 国产妇女在线| 性福利视频| 欧美午夜在线播放| bl 高h文| 亚洲一二三四区| 成人丁香乱小说| 日日日天天射天天干视频| 婷婷综合激情网| 黄视频在线免费看| 一区二区中文字幕在线观看| 午夜视频免费在线播放| 日本在线观看永久免费网站| 亚洲小说区图片区另类春色| 九色亚洲| 日本欧美强乱视频在线| 激情综合五月亚洲婷婷| 亚1州区2区三区4区产品| 免费啪视频在线观看| 91夜夜人人揉人人捏人人添| 日本免费小视频| 欧美午夜影视| 国产精品资源在线播放| 日本五十交尾在线观看| 性欧美www| 日本a级在线| 欧美午夜小视频| 久久久久久9| 国产在线a不卡免费视频| 色综合国产| 天堂综合| 天天摸天天添人人澡| 亚洲国产成人在人网站天堂| 国产h视频在线| 日本人的xxxxxxxxx69| 日本午夜影院| 人妖另类亚洲xxxx| 久久精品国产99久久72| 91最新网站免费| 69pao强力打造在线| 大杳蕉伊人狼人久久一本线| 夜夜爽www|