電子發燒友網報道(文/周凱揚)英偉達在GTC22上發布了全新的Grace Superchip,該芯片中用到了NVLink-C2C技術,而去年公開的Grace Hopper Superchip同樣用到了這一技術。根據英偉達超大規模計算部門副總裁Ian Buck的說法,Chiplet和異構計算已經成了解決摩爾定律緩慢進展的兩大有效手段。而NVLink-C2C這一面向die和chip的互聯技術,成了英偉達對愈發普及的Chiplet設計的回應。
Superchip的互聯
也許在不少人看來的印象中,提到NVLink會想到下圖這個橋接多個高端顯卡或專業顯卡的RTX NVLink Bridge,其實NVLink這一技術在服務器級別的GPU中反倒更為普遍。從P100的第一代NVLink,到V100的第二代NVLink,A100的第三代NVLink,最后再到如今H100的第四代NVLink。NVLink可以說是跟著GPU架構一路推陳出新了,如今享受第四代NVLink性能的成了Hopper架構的GPU。而在英偉達的SERDES和LINK技術發展下,NVLink也從PCB、MCM走向了硅中介層和晶圓,也因此有了NVLink-C2C。
Grace Superchip顯然用的是ARM Neoverse N2這一基于Arm v9架構的設計,但從芯片圖可以看出,單個Grace Superchip芯片由兩個Grace CPU組成,才讓總核心數達到了144。而這兩個CPU組成的方式,正是NVLink-C2C這一互聯技術。我們在開頭已經提到,去年公開的Grace Hopper Superchip同樣使用了這一互聯技術,只不過當時單個Grace Hopper Superchip芯片中互聯的,是一個Grace CPU和一個Hopper GPU。
NVLink-C2C為英偉達帶來的遠不止這樣一對一的互聯方案,而是一整套系統架構上的創新。在NVLink-C2C的支持下,英偉達可以選擇一個Grace CPU,兩個Hopper GPU的設計,或是兩個2個Grace CPU+2個Hopper GPU,甚至是2個Grace CPU+8個Hopper GPU??梢钥闯?,NVLink-C2C為Grace和Hopper在數據中心和HPC應用提供了極大的擴展性。
遠超PCIe 5.0的性能
英偉達強調,NVLink-C2C具有前所未有的性能,比如處理器與加速器之間900GB/s的高帶寬數據傳輸,以及快速同步和高頻率更新下的超低延遲,以及在先進封裝英偉達芯片下,能效比可以做到PCIe 5.0的25倍,面積效率更是達到90倍。
NVLink-C2C 900GB/s的帶寬確實優秀,也與第四代NVLink的性能一致,但這并不代表只要用上NVLink就能獲得,我們從Hopper架構的GPU H100的參數上也能窺見一二。要想獲得900GB/s的帶寬性能,必須用到SXM5的大功率卡,而不是PCIe 5.0的卡,雖然前者的功耗是后者的兩倍,達到了可怕的700W,但PCIe 5.0的H100在總體性能和帶寬上確實差SXM5一截。
兩者在PCIe 5.0上的帶寬一致,都是128GB/s,但如果用上NVLink,PCIe 5.0版本的H100只能達到600GB/s的帶寬,與第三代NVLink性能一致,只有SXM5版本下的NVLink才能達到滿血的900GB/s。
另外在第四代NVLink和第三代NVSwitch技術的組合下,英偉達推出了NVLink Switch這一方案,該系統最多支持到256個GPU,可實現57.6TB/s的總帶寬。NVLink Switch也是英偉達DGX H100 SuperPOD系統的關鍵技術,英偉達甚至把自己收購的Mellanox旗下的InfiniBand節點互聯技術拿來對比。從上圖可以看出與基于A100+InfiniBand的SuperPOD系統相比,基于H100+NVLink Switch的SuperPOD系統在對分帶寬上是前者的9倍。
開放而不是獨占
其實NVLink的存在最初讓不少人覺得有些一家獨大的意思,畢竟最早NVLink僅僅只是用于多個英偉達GPU之間的互聯,僅僅只是為自家的產品提供更多優勢而已。而去年發布的Grace Hopper Superchip同樣用到了這一技術,但這顆芯片卻是英偉達設計的Arm CPU和GPU的互聯。
這讓人不禁擔心,如果英偉達真的成功收購了Arm,會不會利用這一優勢來全面壟斷數據中心和HPC市場。畢竟Arm自己給出的互聯方案CMN-700支持的是CCIX 2.0和CXL 2.0這兩大標準互聯協議,同時為第三方加速器提供PCIe 5.0的連接。但就紙面參數給到的性能看來,NVLink這種專用方案似乎更加吃香一些。
不過Arm作為一家IP公司,目標自然是支持到多樣化的加速器,從而全面發展Arm的生態。此前Arm在接受電子發燒友網采訪時也表示,Arm期待給市場帶來更多的靈活性,支持更多像Grace這樣的系統。
好在英偉達似乎也不打算將NVLink-C2C獨占,而是宣布開放這一技術,支持集成英偉達技術的芯片半定制,通過Chiplet技術充分利用自家的GPU、DPU、NIC、CPU和SoC產品,與客戶的IP進行NVLink-C2C互聯。
盡管收購失敗,英偉達與Arm的合作并沒有就此停止,英偉達也在GTC22上宣布繼續與Arm緊密合作,以支持并在未來改進Arm的AMBA CHI協議,加上對CXL的支持,從而與更多加速器和處理器做到互聯。
與此同時,在全行業群策群力,試圖打通生態的情況下,英偉達也并不打算將NVLink-C2C作為唯一的可選方案。所以除了NVLink-C2C外,集成了英偉達芯片的定制SoC也可選用前段時日公布的UCIe通用Chiplet互聯標準,所以不必將數據中心上的CPU、DPU和GPU一整套都換成英偉達旗下的產品,給到第三方服務器芯片、DPU和加速器一個機會。不過,考慮到這兩種互聯方式只能選其一,英偉達也強調了NVLink-C2C經過優化,擁有更低的延遲、更高的帶寬和更高的能效比,該如何選擇還是看廠商自己的考量了。
原文標題:900GB/s,NVLink才是英偉達的互聯殺手锏
文章出處:【微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
芯片
+關注
關注
456文章
51019瀏覽量
425395 -
gpu
+關注
關注
28文章
4760瀏覽量
129131 -
顯卡
+關注
關注
16文章
2442瀏覽量
67896 -
英偉達
+關注
關注
22文章
3815瀏覽量
91492
原文標題:900GB/s,NVLink才是英偉達的互聯殺手锏
文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論