在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何通過組件配置為深度學習培訓選擇企業服務器

星星科技指導員 ? 來源:NVIDIA ? 作者:Charu Chaubal ? 2022-04-19 15:16 ? 次閱讀

深度學習已經成為執行許多人工智能任務的最常見的神經網絡實現。數據科學家使用 TensorFlow 和 PyTorch 等軟件框架來開發和運行 DL 算法。

到目前為止,已經有很多關于深度學習的文章,你可以從許多來源找到更詳細的信息。有關良好的高層總結,請參見 人工智能、機器學習和深度學習之間有什么區別?

開始深度學習的一種流行方式是在云中運行這些框架。然而,隨著企業開始增長和成熟其人工智能專業技能,他們會尋找在自己的數據中心運行這些框架的方法,以避免基于云的人工智能的成本和其他挑戰。

在本文中,我將討論如何為 深度學習培訓選擇企業服務器。我回顧了這個獨特工作負載的具體計算需求,然后討論了如何通過組件配置的最佳選擇來滿足這些需求。

DL 培訓的系統要求

深度學習培訓通常被設計為數據處理管道。必須首先根據數據格式、大小和其他因素準備原始輸入數據。

數據通常也會經過預處理,以便相同的輸入可以以不同的方式呈現給模型,這取決于數據科學家所確定的將提供更強大的訓練集的內容。例如,圖像可以隨機旋轉,以便模型學習識別對象,而不考慮方向。然后將準備好的數據輸入 DL 算法。

pYYBAGJeYeqAJmOBAABlS6A6Eyk644.png

圖 1 深度學習培訓數據管道

了解了 DL 培訓的工作原理后,以下是以最快、最有效的方式執行此任務的具體計算需求。

GPU

深度學習的核心是 GPU 。計算網絡每一層的值的過程最終是一組龐大的矩陣乘法。每個層的數據通??梢圆⑿刑幚?,各層之間有協調步驟。

GPU 設計用于以大規模并行方式執行矩陣乘法,并已被證明是實現 深度學習的巨大速度 的理想選擇。

對于訓練,模型的大小是驅動因素,因此具有更大更快內存的 GPU ,比如 NVIDIA A100 GPU 核心張量 ,能夠更快地處理成批的訓練數據。

中央處理器

DL 訓練所需的數據準備和預處理計算通常在 CPU 上執行,盡管 recent innovations 已經使越來越多的計算能夠在 GPU 上執行。

使用高性能的 CPU 以足夠快的速度維持這些操作是至關重要的,這樣 GPU 就不會因為等待數據而感到饑餓。 CPU 應該是企業級的,例如來自英特爾至強可擴展處理器系列或 AMD EPYC 系列,而且 CPU 內核與 GPU 的比例應該足夠大,以保持流水線運行。

系統存儲器

特別是對于當今最大的機型, DL 訓練只有在有大量輸入數據可供訓練時才有效。這些數據從存儲器中批量檢索,然后由 CPU 在系統內存中處理,然后再饋送到 GPU 。

為了保持該進程以持續的速度運行,系統內存應該足夠大,以便 CPU 處理的速率可以與 GPU 處理數據的速率相匹配。這可以用系統內存與 GPU 內存的比率來表示(在服務器中的所有 GPU 中)。

不同的模型和算法需要不同的比率,但最好有更高的比率,這樣 GPU 就永遠不會等待數據。

網絡適配器

隨著 DL 模型變得越來越大,已經開發出了多種技術來執行訓練,多個 GPU 一起工作。當一臺服務器中安裝了多個 GPU 時,它們可以通過 PCIe 總線相互通信,盡管可以使用 NVLink 和 NVSwitch 等更專業的技術來實現最高性能。

Multi- GPU 培訓也可以擴展到跨多臺服務器的工作。在這種情況下,網絡適配器成為服務器設計的關鍵組件。在執行多節點 DL 訓練時,需要高帶寬 Ethernet 或 InfiniBand 適配器來最大限度地減少由于數據傳輸而產生的瓶頸。

DL 框架利用 NCCL 等庫以最佳和性能的方式執行 GPU 之間的協調。 GPUDirect RDMA 等技術使數據能夠從網絡直接傳輸到 GPU ,而無需通過 CPU ,從而消除了延遲源。

理想情況下,系統中每一兩個 GPU 就應該有一個網絡適配器,以便在必須傳輸數據時最大限度地減少爭用。

存儲

DL 培訓數據通常駐留在外部存儲陣列上。服務器上的 NVMe 驅動器通過提供緩存數據的方法,可以大大加快培訓過程。

DL I / O 模式通常由讀取訓練數據的多次迭代組成。訓練的第一步(或 epoch )讀取用于開始訓練模型的數據。如果在節點上提供了足夠的本地緩存,則后續的數據傳遞可以避免從遠程存儲中重新讀取數據。

為了避免從遠程存儲中提取數據時發生爭用,每個 CPU 應該有一個 NVMe 驅動器。

PCIe 拓撲

由于 CPU 、 GPU 和網絡之間存在復雜的相互作用,因此應該清楚的是,具有減少 DL 培訓管道中任何潛在瓶頸的連接設計對于實現最佳性能至關重要。

如今,大多數企業服務器使用 PCIe 作為組件之間的通信手段。 PCIe 總線上的主要流量發生在以下路徑上:

從系統內存到 GPU

在多次 GPU 培訓期間,在相同服務器上的 GPU 之間

在多節點培訓期間 GPU 與網絡適配器之間

poYBAGJeYfSAL-GgAAB__2rvYgs178.png

圖 2 主 PCIe 數據通信路徑

用于深度學習的服務器應具有平衡的 PCIe 拓撲結構, GPU 均勻分布在 CPU 插槽和 PCIe 根端口上。在所有情況下,每個 GPU 的 PCIe 通道數應為支持的最大數量。

如果存在多個 GPU ,且 CPU 的 PCIe 通道數量不足以容納所有通道,則可能需要 PCIe 交換機。在這種情況下, PCIe 交換機層的數量應限制為一層或兩層,以最小化 PCIe 延遲。

類似地,網絡適配器和 NVMe 驅動器應與 GPU 處于同一 PCIe 交換機或 PCIe 根復合體之下。在使用 PCIe 交換機的服務器配置中,這些設備應與 GPU 位于同一 PCIe 交換機下,以獲得最佳性能。

選擇支持 DL 培訓的經過驗證的系統

設計一個為 DL 培訓而優化的服務器很復雜。 NVIDIA 已經發布了 關于為各種類型的加速工作負載配置服務器的指南 ,基于多年在這些工作負載方面的經驗,并與開發人員合作優化代碼。

為了讓你更容易上手,NVIDIA 開發了 NVIDIA-Certified Systems 程序。系統供應商合作伙伴已使用特定的 NVIDIA GPU 和網絡適配器配置并測試了多種形式的服務器型號,以驗證 優化設計以獲得最佳性能 的有效性。

驗證還包括生產部署的其他重要功能,如可管理性、安全性和可伸縮性。系統經過針對不同工作負載類型的一系列類別認證。 合格系統目錄 有一份由 NVIDIA partners 提供的經 NVIDIA 認證的系統列表。數據中心類別的服務器已經過驗證,可以為 DL 培訓提供最佳性能。

NVIDIA 人工智能企業

除了合適的硬件,企業客戶還希望為 AI 工作負載選擇受支持的軟件解決方案。 NVIDIA 人工智能企業 是一套端到端、云計算原生的人工智能和數據分析軟件。它經過優化,因此每個組織都可以擅長人工智能,經過認證可以部署在從企業數據中心到公共云的任何地方。人工智能企業包括全球企業支持,以便人工智能項目保持正常運行。

當您在優化配置的服務器上運行 NVIDIA AI Enterprise 時,您可以放心,您正在從硬件和軟件投資中獲得最佳回報。

總結

在本文中,我向您展示了如何為 深度學習培訓 選擇具有特定計算需求的企業服務器。希望您已經學會了如何通過組件配置的最佳選擇來滿足這些需求。

關于作者

Charu Chaubal 在NVIDIA 企業計算平臺集團從事產品營銷工作。他在市場營銷、客戶教育以及技術產品和服務的售前工作方面擁有 20 多年的經驗。 Charu 曾在云計算、超融合基礎設施和 IT 安全等多個領域工作。作為 VMware 的技術營銷領導者,他幫助推出了許多產品,這些產品共同發展成為數十億美元的業務。此前,他曾在 Sun Microsystems 工作,在那里他設計了分布式資源管理和 HPC 基礎設施軟件解決方案。查魯擁有化學工程博士學位,并擁有多項專利。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5010

    瀏覽量

    103238
  • 云計算
    +關注

    關注

    39

    文章

    7837

    瀏覽量

    137529
  • 服務器
    +關注

    關注

    12

    文章

    9225

    瀏覽量

    85616
收藏 人收藏

    評論

    相關推薦

    一般企業購買云服務器帶數據庫嗎?

    ,大多數云服務提供商會提供數據庫服務作為可選的附加組件,或者允許用戶在云服務器上自行安裝和配置數據庫。關于
    的頭像 發表于 01-06 10:25 ?51次閱讀

    如何選擇合適的云服務器 --X 實例購買指南和配置詳細說明

    ? 3.1 基礎配置 ? 3.2 實例規格 ? 3.3 鏡像選擇 ? 3.4 存儲的配置 ? 3.5 網絡配置 ? 3.6 彈性網絡IP ? 3.7 云
    的頭像 發表于 12-24 17:27 ?159次閱讀
    如何<b class='flag-5'>選擇</b>合適的云<b class='flag-5'>服務器</b> --X 實例購買指南和<b class='flag-5'>配置</b>詳細說明

    配置rsyslog服務器

    配置rsyslog服務器
    的頭像 發表于 11-11 11:13 ?260次閱讀
    <b class='flag-5'>配置</b>rsyslog<b class='flag-5'>服務器</b>

    SMTP服務器配置教程

    1. 了解SMTP服務器 SMTP服務器是用于發送電子郵件的服務器。它使用SMTP協議來處理郵件的發送。配置SMTP服務器需要了解以下幾個關
    的頭像 發表于 10-30 16:16 ?1190次閱讀

    新手小白怎么通過服務器跑pytorch?

    安裝PyTorch的步驟可以根據不同的操作系統和需求有所差異,通過服務器運行PyTorch的過程主要包括選擇GPU云服務器平臺、配置
    的頭像 發表于 09-25 11:35 ?305次閱讀

    為什么選擇使用服務器

    為什么要選擇使用服務器
    的頭像 發表于 08-23 16:33 ?243次閱讀

    gpu服務器與cpu服務器的區別對比,終于知道怎么選了!

    gpu服務器與cpu服務器的區別主要體現在架構設計、性能特點、能耗效率、應用場景、市場定位等方面,在以上幾個方面均存在顯著差異。CPU服務器更適合數據庫管理和企業應用,而GPU
    的頭像 發表于 08-01 11:41 ?516次閱讀

    圖床服務器如何選擇配置

    選擇圖床服務器時,應考慮存儲空間、帶寬、安全性和穩定性等因素。建議選擇配置較高的服務器,以滿足需求。 在選擇圖床
    的頭像 發表于 07-11 15:36 ?315次閱讀

    云存儲服務器怎么配置

    云存儲服務器配置是一個復雜的過程,涉及到硬件、軟件、網絡等多個方面。 云存儲服務器配置概述 云存儲是一種基于互聯網的存儲方式,用戶可以通過
    的頭像 發表于 07-02 09:15 ?908次閱讀

    新手小白怎么學GPU云服務器深度學習?

    新手小白想用GPU云服務器深度學習應該怎么做? 用個人主機通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不動,如何實現更經濟便捷的實現GPU云服務器
    發表于 06-11 17:09

    企業選擇大帶寬服務器時需要考慮哪些其他因素?

    企業選擇大帶寬服務器時,除了成本因素,還需要考慮哪些因素,rak部落小編為您整理發布企業選擇大帶寬
    的頭像 發表于 04-12 10:31 ?369次閱讀

    OpenBSD中如何配置和使用虛擬專用服務器?

    在OpenBSD中配置和使用虛擬專用服務器(VPS)通常涉及以下步驟: 1、安裝OpenBSD:首先,在您的VPS提供商處購買并配置一個OpenBSD實例。在安裝OpenBSD時,請確保您選擇
    的頭像 發表于 03-28 17:17 ?460次閱讀

    linux服務器和windows服務器

    較為熟悉,需要高性能和穩定性,并且希望能夠進行自定義配置和更好的安全性,那 么Linux服務器是一個不錯的選擇。 而如果你對服務器操作系統不太熟悉,需要廣泛的應用支持和易用的管理工具,
    發表于 02-22 15:46

    選擇服務器硬件配置需要注意什么?

    決定了服務器同時處理數據的數量 。常規內存默認配置在8G左右。SATA硬盤通常轉速7200轉,而固態硬盤比SATA硬盤快很多倍,啟動快,讀取數據時間快。因此,在選擇時,可以考慮性價比
    的頭像 發表于 02-20 15:16 ?444次閱讀

    如何通過WebDAV服務器訪問NAS

    WebDAV的客戶端程序(如WinSCP、RaiDrive、Mac OS Finder、Linux 資源管理)訪問TNAS設備。 接下來大家分享如何通過WebDAV服務器訪問鐵威馬
    的頭像 發表于 01-16 15:30 ?1106次閱讀
    如何<b class='flag-5'>通過</b>WebDAV<b class='flag-5'>服務器</b>訪問NAS
    主站蜘蛛池模板: 在线精品国产第一页| 日本精品一卡二卡≡卡四卡| kkk4444免费观看| 国内91视频| 免费观看高清视频| 中文字幕亚洲一区| 久久婷婷婷| 亚洲成在线| 色视频欧美| 免费看污黄视频软件| 国产亚洲欧洲人人网| 又粗又硬又猛又黄的免费视频黑人| 午夜国产精品理论片久久影院| 九月丁香婷婷| 成人亚洲网站| 天天射久久| www.天天操.com| 黑色丝袜美女被视频网站| 99久久久精品免费观看国产| 毛片一区二区三区| 欧美巨大bbbb动漫| 国内精品久久久久影| 亚洲zscs综合网站| 狠狠干狠狠插| 亚洲欧美日本视频| 亚洲成人激情片| 欧美大片一区| 成年人网站黄色| 成人免费的性色视频| 天天射天天干天天插| aaa在线观看| 久久精品在| 三级毛片在线| 国产精品14p| 日本黄页网站| 亚洲欧洲第一页| 泰剧天堂| 国产免费一区二区三区最新| 人人干人人干| 亚洲国产视频一区| 视频免费黄色|