電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)根據(jù)外媒The Information的報(bào)道,有知情人士透露,英偉達(dá)向其客戶表示,新款Blackwell B200芯片將延遲發(fā)布三個(gè)月或更長(zhǎng)時(shí)間,批量出貨或延遲至明年Q1。
隨后,SemiAnalysis在最新研報(bào)中剖析了英偉達(dá)Blackwell B200芯片的技術(shù)挑戰(zhàn),主要在合封方面。一顆Blackwell B200芯片包含了2個(gè)Blackwell GPU,連接2個(gè)Blackwell GPU的關(guān)鍵電路目前還存在一些問(wèn)題,導(dǎo)致芯片的良率不高。這一故障也導(dǎo)致包含2個(gè)Blackwell GPU和1個(gè)Grace CPU的GB200超級(jí)芯片同樣面臨量產(chǎn)挑戰(zhàn)。
合封是Blackwell B200和GB200發(fā)揮性能的關(guān)鍵
根據(jù)英偉達(dá)的發(fā)布會(huì)信息,Blackwell B200芯片被定義為目前地表最強(qiáng)的AI加速芯片,基于臺(tái)積電的4nm工藝打造,在芯片內(nèi)部,采用將2個(gè)Blackwell GPU互聯(lián)組成雙芯設(shè)計(jì),單顆芯片的晶體管數(shù)量高達(dá)2080億個(gè)。
先進(jìn)工藝+先進(jìn)封裝讓Blackwell B200芯片成為一個(gè)性能怪獸,AI性能可達(dá)20PFLOPS,是H100芯片的5倍,可以為 LLM(大語(yǔ)言模型)的推理帶來(lái)30倍的效率提升。Blackwell GB200芯片的性能就更強(qiáng)了,其AI性能是H100的7倍,訓(xùn)練性能是H100的4倍。
不難看出,由于摩爾定律失效,先進(jìn)封裝技術(shù)已經(jīng)成為英偉達(dá)提升芯片性能的關(guān)鍵手段。為了讓兩顆GPU合封在一起還能充當(dāng)單顆的GPU,英偉達(dá)在2個(gè)Blackwell GPU之間使用了高速帶寬接口10 TB/s NV-HBI,整塊芯片還封裝有192GB高速HBM3e顯存。
不過(guò),知情人士透露,就是2個(gè)Blackwell GPU之間的電路設(shè)計(jì)出現(xiàn)了一些問(wèn)題,導(dǎo)致B200芯片無(wú)法按照原計(jì)劃量產(chǎn)。Blackwell封裝是第一個(gè)使用臺(tái)積電CoWoS-L技術(shù)進(jìn)行大規(guī)模量產(chǎn)設(shè)計(jì)的封裝,使用帶有局部硅互連(LSI)和嵌入橋接芯片的RDL中介層。相較于此前熱門(mén)的CoWoS-S,CoWoS-L更加復(fù)雜,不過(guò)帶來(lái)的性能助益也更高。
谷歌、Meta和亞馬遜受影響最大
Blackwell芯片原計(jì)劃于2024年10月開(kāi)始批量生產(chǎn),若因延期而推遲至2025年4月,將直接影響英偉達(dá)的季度收益。而客戶方受影響最大的是谷歌、Meta和亞馬遜三家公司。
據(jù)報(bào)道,谷歌、Meta和亞馬遜三家公司已經(jīng)向英偉達(dá)下了高達(dá)600多億美元的訂單。根據(jù)著名投行摩根斯坦利的估算,單個(gè)英偉達(dá)超算計(jì)算卡采用的連接技術(shù)分別是NVL36和NVL72,也就是在一個(gè)計(jì)算卡上搭載36顆或者72顆Blackwell B200芯片,按照3萬(wàn)-4萬(wàn)美元/顆芯片單價(jià)計(jì)算,即便是36顆芯片,只算芯片的價(jià)格就超過(guò)了100萬(wàn)美元,如果是4萬(wàn)美元的話,就是150萬(wàn)美元,因此采用NVL36連接的算力卡售價(jià)將定在200萬(wàn)美元,采用NVL72連接的則定價(jià)為300萬(wàn)美元,符合黃仁勛定義的買(mǎi)得越多越便宜的標(biāo)準(zhǔn)。
如果谷歌、Meta和亞馬遜三家公司都是下定300萬(wàn)美元的NVL72計(jì)算卡,那么Blackwell B200芯片的需求量高達(dá)140萬(wàn)顆,如果大規(guī)模采購(gòu)繼續(xù)有優(yōu)惠,那么這個(gè)數(shù)量會(huì)更大。事實(shí)也確實(shí)如此,根據(jù)接近谷歌方面的人士透露,谷歌大概會(huì)投入100億美元,以獲取40萬(wàn)顆Blackwell B200芯片,以及相關(guān)的服務(wù)器設(shè)施,那么600億美元的預(yù)算可能帶來(lái)差不多240萬(wàn)顆Blackwell B200芯片需求缺口。
同時(shí),黃仁勛在發(fā)布英偉達(dá)Blackwell B200芯片時(shí)就曾透露,戴爾、微軟、OpenAI、甲骨文、特斯拉和xAI都有計(jì)劃采用Blackwell產(chǎn)品。如果單看Blackwell B200芯片,其推遲發(fā)布可能會(huì)影響到英偉達(dá)在今年的營(yíng)收目標(biāo)。
不過(guò),目前前沿?cái)?shù)據(jù)中心的打造,計(jì)算芯片基本100%來(lái)自英偉達(dá),英偉達(dá)的彌補(bǔ)措施是繼續(xù)延長(zhǎng)Hopper系列芯片發(fā)貨量,同時(shí)盡可能在今年實(shí)現(xiàn)Blackwell B200芯片供貨,一旦實(shí)現(xiàn),2025年英偉達(dá)可能會(huì)沖刺2000億美元的營(yíng)收,2024年為475億美元。
結(jié)語(yǔ)
根據(jù)半導(dǎo)體研究機(jī)構(gòu)TechInsights的統(tǒng)計(jì)數(shù)據(jù),2023年全球數(shù)據(jù)中心GPU總出貨量達(dá)到了385萬(wàn)顆,相比2022年的267萬(wàn)顆增長(zhǎng)了44.2%。其中,英偉達(dá)以98%的市場(chǎng)份額穩(wěn)居第一。基于這樣的統(tǒng)治力,英偉達(dá)Blackwell B200芯片的需求之大是可想而知的。
不過(guò),Blackwell B200芯片是一顆復(fù)雜的芯片,采用了臺(tái)積電的CoWoS-L封裝技術(shù),目前正面臨一些量產(chǎn)挑戰(zhàn),但相信以英偉達(dá)和臺(tái)積電的能力,會(huì)很快解決的。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3776瀏覽量
91081 -
AI芯片
+關(guān)注
關(guān)注
17文章
1887瀏覽量
35018
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論