據(jù)TrendForce援引的消息,英偉達(dá)正計劃對其即將發(fā)布的Blackwell B300 GPU(針對人工智能AI和高性能計算HPC應(yīng)用)采用創(chuàng)新的插槽設(shè)計。這一決策的背后,是對AI GPU在高強度運算下故障率、主板替換成本以及散熱難題的深入考量。
英偉達(dá)與其他AI GPU設(shè)計者正考慮在下一代產(chǎn)品中引入插槽設(shè)計,以替代當(dāng)前GPU直接焊接到主板上的做法。然而,值得注意的是,插槽式設(shè)計往往伴隨著更高的功耗和散熱挑戰(zhàn),因為最強大的GPU通常采用BGA封裝技術(shù)。
供應(yīng)鏈方面,里昂證券分析師Chen Shuowen透露,英偉達(dá)可能從其GB200 Ultra系列開始引入GPU插槽設(shè)計。Chen提到了英偉達(dá)一個包含CPU主板的4路GPU設(shè)計方案,盡管與DGX服務(wù)器的8路GPU主板和2路CPU主板設(shè)計相比,這似乎并不尋常。
英偉達(dá)的數(shù)據(jù)中心產(chǎn)品線以其GPU(如A100、H100、B100/B200)和Grace CPU + GPU平臺(如GH100、GB200)命名。目前,GB200平臺的CPU和GPU均使用BGA封裝,但B200 Ultra的更新版本是否會有所改變,尤其是下半年可能出現(xiàn)的GB200 Ultra升級,目前尚不確定。
盡管插槽設(shè)計為維修和升級提供了便利,但在服務(wù)器環(huán)境中,它們相比BGA封裝或SXM/OAM模塊,占用的空間更大,功耗和散熱限制也更多。雖然模塊可修復(fù),但拆卸過程復(fù)雜,且可能因主板設(shè)計而異。相比之下,插槽更為便捷。
此外,附加卡和SXM/OAM模塊的制造難度高、成本昂貴,且大多數(shù)英偉達(dá)SXM模塊由富士康生產(chǎn)。從板卡或模塊轉(zhuǎn)向插槽可以降低成本,但可能會犧牲部分性能。
英偉達(dá)已推出B200 GPU(功率超過1000W),用于GB200板卡(如Bianca,配備Grace CPU和Blackwell GPU;以及Ariel,配備Ariel CPU和一個Blackwell GPU),均采用BGA封裝。此外,英偉達(dá)還推出了支持8個B200(1000W)和B100(700W)SXM模塊的Umbriel GPU板,以及Miranda和Oberon GB200等平臺。
盡管英偉達(dá)已推出基于Hopper架構(gòu)的H100甚至H200附加卡,通過降低性能以適應(yīng)傳統(tǒng)服務(wù)器的功耗和散熱限制,但英偉達(dá)尚未宣布任何基于Blackwell GPU的附加卡。
最新爆料顯示,英偉達(dá)正在準(zhǔn)備代號為B200A的產(chǎn)品,該產(chǎn)品基于單片B102處理器,采用臺積電CoWoS-S封裝技術(shù)連接四個HBM3E內(nèi)存堆棧,與雙芯片B100/B200設(shè)計形成鮮明對比。
-
gpu
+關(guān)注
關(guān)注
28文章
4766瀏覽量
129184 -
AI
+關(guān)注
關(guān)注
87文章
31393瀏覽量
269784 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3828瀏覽量
91625
發(fā)布評論請先 登錄
相關(guān)推薦
評論