网络小说排行榜,耳根,懒人听书

面對人工智能大模型的迅速發展及其對算力資源的急劇增長需求，單芯片性能提升遭遇瓶頸，同時通過Scale Out策略擴展多機集群以增加算力也遇到了局限性。在此背景下，中國信通院與騰訊攜手GPU、CPU、交換機芯片制造商、服務器供應商、網絡設備廠商及互聯網企業等多方力量，共同發起超大帶寬ETH-X（以太網）超節點計劃，旨在通過技術創新與行業合作，構建開放可擴展的HBD（高帶寬域）超節點系統樣機，探索AI算力提升新途徑，為構建ETH-X超節點互聯開放協作產業生態提供支撐。同時，將共同編制相關技術規范，為行業樹立標準，引導超節點技術高質發展。

AI大模型發展與算力需求

AI大模型的發展依賴于持續提升算力。根據Scaling Law（規模定理），增大模型規模與增加訓練數據量是直接提升AI大模型智能水平與性能的關鍵途徑。但對集群算力需求的將呈指數級增長。

長序列是AI大模型發展的另一個重要方向。長序列提高AI大模型回答問題的質量、處理復雜任務的能力以及更強的記憶力和個性化能力的同時,也會加大對訓練和推理算力資源的需求1，尤其是對顯存資源的需求。因此滿足AI大模型發展需求，算力能力的持續提升成為一個重要基礎。

圖1 長序列帶來的準確率收益以及顯存需求

單芯片算力提升遇阻、

scale out集群算力提升受限

當前,提升集群算力已面臨一些明顯的制約因素。首先，單芯片性能提升受到HBM容量帶寬增長趕不上算力增長速度的限制，內存墻問題制約算法發揮。如在典型模型與并行方式下，Nvidia Hopper一代芯片的有效算力(HFU)明顯低于Ampere一代芯片,如圖2所示。另一種通過Scale out擴展集群規模提升整體算力的方式也受到GBS(Global Batch Size)不能無限增長的限制，導致在集群規模增大到一定程度后，HFU出現明顯下降。最后，模型參數量增大需要更大的模型并行規模，模型并行中Tensor并行或MOE類型的Expert并行都會在GPU之間產生大量的通信，并且這部分通信很難與計算進行overlap。而當前典型一機八卡服務器限制了Tensor并行的規模或Expert并行通過機間網絡，這都會導致HFU無法提高。

圖2 不同型號GPU以及不同規模集群對HFU的影響

通過scale up擴大HBD（超帶寬域）的超節點成為突破方向

HBD（High Bandwidth Domain）是一組以超帶寬（HB）互聯GPU-GPU的系統2。HBD內GPU-GPU通信帶寬是HBD之間GPU-GPU通信帶寬的數倍。如Nvidia H100 提供900GBps HB帶寬，HBD間GPU-GPU通信帶寬只有100GBps。因此在模型并行中將數據量大、無法overlap的部分限制在一個HBD內完成。

當前，HBD限制在一臺服務器內，典型1機8卡服務器是8張GPU卡之間通過某種HB連接技術實現互聯，構成一個HBD=8的系統。然而更大的參數規模、更長的序列長度、更多的MOE專家數量、更大的集群規模，都造成了更多的通信數據量。HBD=8的情況下，大量的數據通信均需經過HBD間的scale out網絡，因此通信占比提高、HFU下降的問題凸顯。

通過構建更大的HBD系統，以scale up方式提升系統算力是解決上述問題的有效途徑之一。如MIT與Meta的研究論文中，通過建模分析3，論證了擴大HBD對訓練性能的提升效果。另外，Nvidia也實現了不同規模HBD系統并進行了部署與驗證4。

圖3 HBD超節點典型代表與業務收益舉例

Nvidia將HB互聯不僅用于GPU-GPU之間，而是將其應用到GPU-CPU/Memory的超大帶寬互聯，例如GH200、GB200產品。通過此方式為GPU提供一個超帶寬訪問CPU/Memory的能力。

Nvidia產品具備支持GPU-CPU/Memory的統一內存編制以及GPU通過內存語義接口read/write直接訪問CPU/Memory的能力，具有更高效、更直接的特點。但其同步操作的方式會對時延進行限制，制約可訪問CPU/Memory的距離與容量。另外，目前的軟件生態中，未有支持直接通過內存語義訪問CPU/Memory的系統。

相反若使用異步的memory offload方式將降低對時延的約束，并發利用多節點CPU/Memory，發揮HB互聯的帶寬優勢。另外，當前memory offload已具備一定軟件生態上的基礎，例如Zero offload5。

綜上所述，超節點是一個以超大帶寬（HB）互聯16卡以上GPU-GPU以及GPU-CPU/Memory的scale up系統，以HBD超節點為單位，通過傳統scale out擴展方式可形成更大規模、更高效的算力集群。超節點Scale Up的核心需求是超大帶寬（HB），但規模不需要很大。Scale Out的核心需求是超大規模。因此Scale Up網絡與Scale Out網絡更適合是相互獨立共存的兩張網絡。

圖4 Scale Up超大帶寬與Scale Out超大規模共同構建高算力AI集群

ODCC ETH-X計劃構建開放超節點產業生態

超節點的核心是HB互聯技術，當前工業界已實現的超節點系統均是采用私有技術與協議實現HB互聯，例如Nvidia的NVLINK。但此類私有技術與協議由單一企業進行維護，無法保證技術長期、高效的發展。另外，從HBD超節點產品完善角度也無法保證系統的開放，導致無法形成良性、開放的產業生態。

以太網技術憑借開放的生態、多樣的產業鏈環境，為技術的長期演進發展提供支撐。當前以太網技術上從端口帶寬及交換容量方面已具有較強的競爭基礎。如以太網單端口800G MAC標準已成熟并產業化，以太網單芯片51.2T交換容量 ETH-switch也已在2023年產品化商用。

目前，以太網HB接口GPU產品的日益豐富，HBD超節點系統正逐步依托于以太網互聯技術，實現向更為模塊化、多元化的結構轉型，有效促進了多方廠商的積極參與，各廠商專精于系統內的不同組件或子系統開發，顯著提升了HBD超節點產品化的多樣性和方案的豐富度，為HBD超節點技術長期演進奠定穩固基石，確保其在應對未來挑戰時能夠持續進化，保持領先的技術競爭力與生態活力。

圖5 ETH-X超節點參考架構與預期收益評估

圖6 ETH-X技術規范構成與項目計劃

為推動算力產業的發展，ODCC網絡組啟動了ETH-X超節點系列項目。該項目由中國信通院、騰訊聯合快手科技、燧原科技、壁仞科技、華勤技術、銳捷網絡、新華三、云豹智能、云合智網、盛科通信、立訊精密、光迅科技等合作伙伴共同推動，以產品化樣機以及相關技術規范為目標，打造大型多GPU互聯算力集群系統。該項目計劃在2025年秋季前完成ETH-X超節點樣機軟硬件研發與相關業務系統驗證測試，同時發布ETH-X超節點技術規范1.0。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
30919

瀏覽量
269170
人工智能

人工智能

+關注

關注
1791

文章
47294

瀏覽量
238578
算力

算力

+關注

關注
1

文章
982

瀏覽量
14825

原文標題：ETH-X超節點：探索突破AI算力約束的新途徑

文章出處：【微信號：SDNLAB，微信公眾號：SDNLAB】歡迎添加關注！文章轉載請注明出處。

企業AI算力租賃模式的好處

構建和維護一個高效、可擴展的AI算力基礎設施，不僅需要巨額的初期投資，還涉及復雜的運維管理和持續的技術升級。而AI算

發表于 12-24 10:49 ?91次閱讀

奇異摩爾分享計算芯片Scale Up片間互聯新途徑

開放數據中心委員會ODCC冬季全員會議于12月4日-6日在春暖花開的昆明舉行。奇異摩爾首席系統架構師朱琛作為網絡工作組ETH-X超節點項目的核心成員分享了AI Networking S

發表于 12-09 09:36 ?344次閱讀

企業AI算力租賃是什么

企業AI算力租賃是指企業通過互聯網向專業的算力提供商租用所需的計算資源，以滿足其AI應用的需求。

發表于 11-14 09:30 ?626次閱讀

GPU算力開發平臺是什么

隨著AI技術的廣泛應用，算力需求呈現出爆發式增長。AI算力租賃作為一種新興的服務模式，正逐漸成為

發表于 10-31 10:31 ?184次閱讀

本源“量超融合先進計算平臺”入選2024算力中國·年度重大成果

近日，2024中國算力大會在河南鄭州開幕。大會主論壇上，“算力中國·年度重大成果”正式發布8項具有突破性意義的技術成果。本源量子與鄭州大學國

發表于 10-16 08:06 ?372次閱讀

本源“量<b class='flag-5'>超</b>融合先進計算平臺”入選2024<b class='flag-5'>算</b><b class='flag-5'>力</b>中國·年度重大成果

哈爾濱即將迎來算力新紀元:中國移動智算中心節點盛大啟用

8月22日，來自“哈爾濱發布”公眾號的最新消息振奮人心，宣布了中國移動智算中心（哈爾濱）節點的一項重大進展——其超萬卡智算集群將于8月30日正式投入運營。這一里程碑式的投用，不僅標志著

發表于 08-22 15:19 ?680次閱讀

大模型時代的算力需求

現在AI已進入大模型時代，各企業都爭相部署大模型，但如何保證大模型的算力，以及相關的穩定性和性能，是一個極為重要的問題，帶著這個極為重要的問題，我需要在此書中找到答案。

發表于 08-20 09:04

光子計算芯片最新突破，峰值算力超1000tops，比電芯片更適合大模型

意味著它的算力密度已經超過了先進制程的電芯片。 ? 據光本位科技介紹，矩陣規模（算力密度）和單節點光辨識度（

發表于 07-08 07:18 ?4668次閱讀

光子計算芯片最新<b class='flag-5'>突破</b>，峰值<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>超</b>1000tops，比電芯片更適合大模型

江蘇省算力基礎設施發展專項規劃：打造算力供給服務新高地

按照規劃，江蘇將全力打造“2+N+X”算力網絡梯次多元布局，包括南京、蘇州兩個國家級核心算力樞紐集群，N個省內城市級數據中心（云計算中心、智算

發表于 04-26 15:58 ?400次閱讀

千億美元打造一個系統，成本越來越高的AI超算

電子發燒友網報道（文/周凱揚）從近年來新發布的超算機器和新的HPC AI性能榜單可以看出，AI算力已經在

發表于 04-09 00:19 ?3062次閱讀

256Tops算力！CSA1-N8S1684X算力服務器

（基于BM1684X的高算力服務器）高算力AI處理器BM1684

發表于 03-23 08:02 ?1645次閱讀

智能算力規模超通用算力，大模型對智能算力提出高要求

的縮寫，即每秒所能夠進行的浮點運算數目（每秒浮點運算量）。 ? 算力可以分為通用算力、智能算力和

發表于 02-06 00:08 ?6366次閱讀

大茉莉X16-P，5800M大算力稱王稱霸

算力

Rykj365
發布于 :2024年01月25日 14:54:52

立足算力，聚焦AI！順網科技全面走進AI智算時代

“立足算力，聚焦AI”，順網科技進軍AI智算時代的號角已被吹響。 1月18日，順網科技（300113.SZ）以“躍遷·向未來”為主題的戰略升

發表于 01-19 10:57 ?461次閱讀

AI算力應用中的光模塊產品

以ChatGPT為代表的AI大模型應用普及將推動算力需求快速增長，服務器產業鏈是其中重要的受益環節之一，AI計算的普及將推動服務器產業鏈光模塊向800G升級提速。

發表于 01-02 15:32 ?554次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

ETH-X超節點:開辟AI算力約束突破的新路徑

評論

企業AI算力租賃模式的好處

奇異摩爾分享計算芯片Scale Up片間互聯新途徑

企業AI算力租賃是什么

GPU算力開發平臺是什么

本源“量超融合先進計算平臺”入選2024算力中國·年度重大成果

哈爾濱即將迎來算力新紀元:中國移動智算中心節點盛大啟用

大模型時代的算力需求

光子計算芯片最新突破，峰值算力超1000tops，比電芯片更適合大模型

江蘇省算力基礎設施發展專項規劃：打造算力供給服務新高地

千億美元打造一個系統，成本越來越高的AI超算

256Tops算力！CSA1-N8S1684X算力服務器

智能算力規模超通用算力，大模型對智能算力提出高要求

大茉莉X16-P，5800M大算力稱王稱霸

立足算力，聚焦AI！順網科技全面走進AI智算時代

AI算力應用中的光模塊產品