生成式AI當道,吃了第一口螃蟹的英偉達生而逢時,市值從去年的五千億美元搖身一變成為與亞馬遜、谷歌等齊肩的萬億巨頭。
賣著三十萬元一張的顯卡,數著其他科技巨頭收上來的鈔票,連續打破預期的業績印證了英偉達顯卡在數據中心AI訓練領域有多么受歡迎。
然而,有超額利潤的地方總會招致競爭對手的沖擊,更何況是日新月異的科技賽道,AMD、英特爾,甚至準備自研芯片的科技巨頭躍躍欲試,英偉達的護城河,會由誰打破?
《福布斯》雜志評論稱:“如果業界還有英偉達潛在的對手,那一定包括蘇姿豐和她掌管的AMD?!?/strong>
如何戰勝芯片市場里的大Boss?
這道題AMD是最有發言權的,公司曾將英特爾在數據中心和PC的份額從將近壟斷逼到剩下六成,靠的是集結了領先制程和架構、不斷追趕的CPU產品。
這一次,面對勢頭正勁的英偉達,AMD能否再度趕超?
下一個萬億芯片巨頭會是AMD嗎?
第一
最初兩家企業在產品開發和市場選擇上形成錯位競爭,英偉達一直在圖像顯卡領域深耕,在高端芯片上處于領先地位。在向英偉達發起正面沖擊之前,AMD曾憑借全新的Zen架構和臺積電7nm工藝顛覆了PC和數據中心的CPU霸主—英特爾。
目前,英偉達在GPU領域一枝獨秀,但AMD的產品架構要更豐富一些,在PC端同時布局了X86 CPU和獨立GPU產品。相比傳統CPU,采用集成顯卡具備更強的圖像渲染能力,這為AMD日后快速進入AI加速芯片領域競爭奠定了基礎。 根據Statista,2023年第三季度PC端CPU市場中,AMD以35%的市占率僅次于英特爾;而在獨立GPU,英偉達以超過七成的份額占據領先優勢,同樣居次的AMD今年第二季度的出貨量占全球的17%。
總的來看,在GPU顯卡領域,英偉達構建了領先算力和軟件生態的強大壁壘,用戶體驗更高,在高端旗艦市場更具優勢。 而AMD顯卡不只追求圖形渲染性能,更注重通用運算性能的提升,在入門級顯卡性價比更高,但在開發者環境中,AMD采用的OpenCL實際遠不如CUDA完善,軟件不兼容的問題會影響AMD芯片的生態網絡價值。
正因為AMD較早地完成了對兩種處理器芯片的布局,在AI大模型加速普及,未來能夠塞進各種智能終端硬件時,這種全面性給了AMD構建更加多元的AI產品矩陣的機會,包括融合 Ryzen AI 的 Ryzen 7040 系列 CPU、自適應數據中心平臺 Versal AI、 Alveo 加速器、第四代 EPYC Genoa 處理器,以及目前公布即將上市的 Instinct MI300。
其中被認為最有希望挑戰英偉達地位,重現16年對英特爾的成功突圍,莫過于MI300。
AMD在CES 2023大會上推出了這款Instinct MI300加速器,是首款數據中心級的APU產品,AMD于2011年首創,簡單來說是將CPU與GPU封裝在一起,專門用于AI語言大模型訓練及推理,對標的就是英偉達的Grace Hopper(Grace CPU + Hopper H100 GPU)。
作為一款能與H100在AI訓練端匹敵的產品,從芯片架構、制程、算力、內存帶寬上比較,這款MI300在規格及性能上十分接近英偉達的GH系列,但軟件生態上的落后或暫時無法撼動英偉達在訓練端的客戶粘性。
首先看芯片架構,MI300是AMD首款結合了4 CPU與CNDA 3 GPU的產品,采用3D堆疊技術和Chipet設計,配備了9個基于5nm制程的芯片組,與英偉達 Grace Hopper的4nm制程(屬臺積電5nm體系)看齊。
MI300 晶體管數量達到1460億,多于英偉達H100的800億。MI300 配備了24個Zen 4 數據中心 CPU 核心和 128 GB HBM3 內存,并以8192位寬總線配置運行。
算力上,上代 MI250X的FP32算力達47.9 TFLOPS,雖已超越英偉達A100的 19.5TFLOPS,但其發布時間在英偉達之后。AMD并未公布MI300與H100的算力比較,我們只知道對比上一代的MI250X,MI300預計能提升8倍,能耗水平(TFLOPS/watt)將優化5倍,可以推斷此次性能提升有望接近Grace Hopper水平。
內存帶寬上,高容量及顯存帶寬是MI300的優勢,這兩項指標分別是英偉達H100的2.4倍及1.6倍,由于內存容量大幅提升,單顆MI300X芯片可以運行800億參數模型。
而近期英偉達發布的H200作為對MI 300的回應,重點也在內存帶寬上進行了升級。H200擁有高達141GB的顯存,帶寬則從3.35TB/s增加到了4.8TB/s,內存容量上超過了MI 300的128GB,帶寬按照H100的1.6倍則稍微遜色于MI 300。
AI訓練推理中隨著模型參數提升帶來的海量數據計算和傳輸,對GPU-CPU之間的數據傳輸速度提出了更高要求。
Grace Hoopper通過NVLink-C2C和NVLink Switch實現CPU-GPU和GPU-GPU互連,雙方作為內存共享對等體可以直接訪問對方的對應內存空間,支持900GB/s,高達150TB的高帶寬內存訪問,有效解決GPU大規模并行運算中“單節點本地內存不足”的痛點,優勢要更突出一些。
AMD暫未公布MI300的傳輸帶寬,但3D Chiplet架構使其內部CPU和GPU可共享同一內存空間,這樣CPU執行計算的時候不需要先將數據進行復制,減少了內存帶寬的占用。MI300使用的新一代存儲芯片HBM3內存帶寬約為819GB/s,與英偉達 NVLink C2C 900GB/s 帶寬相近。
MI300在規格性能上或已十分接近英偉達領先算力的標準,但后者真正的殺手锏,是經過長期耕耘,積累了先發優勢的CUDA生態圈,搭配芯片。其實參考微軟操作系統和Office生產工具的組合就能夠理解,一個不斷完善的軟件生態會提高用戶粘性,形成正向循環,進一步的迭代同時提高了轉換成本。英偉達全球CUDA開發者在2020年已經達到了200萬,2023年實現翻倍。
AMD的生態是ROCm,主要客戶是一些研究機構,相比CUDA已經能夠廣泛支持英偉達多條產品線,ROCm目前僅支持Instinct 系列GPU的部分SKUs,包括Radeon Pro W6800和 Radeon Pro V62。
CUDA從1.0版本開始即支持Linux和Windows,ROCm剛剛在今年4月宣布登錄Windows,但僅支持Radeon Pro W6800,Radeon RX 6900 XT和 Radeon RX 6600,今年Q1公司宣布ROCm系統融入PyTorch 2.0框架,TensorFlow和Caffe深度學習框架也已經加入到第五代ROCm中,目前ROCm已經能對應到CUDA的部分內容了。但由于起步較晚,ROCm更多用于HPC(高性能運算),覆蓋場景就沒有CUDA那么全面了。
AMD的CEO蘇姿豐表示,計劃在擴產MI300系列芯片,相關樣品已經送達客戶進行測試,預計在2024年批量銷售。隨著ROCm平臺工具鏈逐漸完善,生態端的短板在其他廠商的積極響應下或許能加快補齊。配合定價上將延續往日的高性價比風格,打開市場的難度大大減輕。
第二
截至目前,英偉達與AMD都發布了各自最新一期的財報及業績指引。
整體來看,兩家的財報都有不少令人驚喜的表現。
英偉達當季營收181.2億美元(同比+206%,環比+32%),大幅高于市場161億美元的一致預期,也遠超英偉達自身指引范圍156.8億到163.2億美元。這主要得益于數據中心業績的爆發增長,數據中心營收145.14億美元,同比增長279%、環比增長38%,占總營收80%,遠超市場預期128.2億美元。
因為產品需求爆炸增長引發價格不斷飆升,英偉達當季毛利率同比大幅提升了20.4個百分點,環比提升3.9百分點,達到了74%。
凈利潤方面,英偉達的當季GAAP凈利潤92.4億美元,同比大幅增長1259%,環比大幅增長49%,當季Non-GAAP凈利潤100.2億美元,同比及環比分別增長了588.2%、48.7%,均大幅超出市場Non-GAAP凈利潤84億美元的一致預期。
相對的,AMD三季度實現營收58.00億美元,同比增長4.22%,環比增長8.23%,略微高于此前指引的57億美元。第三季度的凈利潤為2.99億美元,同比增長353%,環比增長了10倍,但主要是前期基數太低所致。這是連續7個季度的凈利潤同比下滑之后,首次實現季度凈利潤的同比正增長,所以另投資者感到振奮。 第三季度AMD的毛利率為47%,同提升5百分點,環比提升1百分點,雖然也是吃到了AI芯片需求大爆發的紅利,但顯著不如紅利的引領者英偉達。同時,這巨大的毛利率差距體現出的是在產品競爭力、議價能力的差距,盡管這幾年AMD的顯卡技術已經得到了很大的飛躍,但離英偉達還有很長的路要追趕。
實際上,英偉達的當季凈利潤是AMD30倍還多,兩者差距,可以說已不再同一個頻道上。
第三季度AMD數據中心營收15.98億美元,同比下滑1%,營收占比28%;經營利潤3.06億美元,同比下滑40%,連續3個季度下滑。
不過,最讓市場關心的是它們的未來業績預期。
在業績指引方面:英偉達給出了一個不大樂觀的預期,預計FY24Q4營收約200億美元(±2%)、GAAP和Non-GAAP毛利率分別為74.5%、75.5%。主要原因是在于預計四季度游戲業務將出現一定程度回落。尤其是在中國和其他受美國政府10月新出口限制影響的地區,銷售量將大幅下滑。
而AMD的業績指引相對讓投資著更加驚喜,預計四季度營收為61±3億美元,毛利率為51.5%(環比+4.5pcpt),CEO蘇姿豐在電話會上表示,多家超大規模云計算公司已經承諾部署MI300,MI300將成為AMD史上最快營收過10億美元的產品,并預計將在明年的銷售收入達20億美元。
因為強勁的業績指引,AMD在發布業績后,AMD股價周三收盤大漲9.7%,并在此后數日持續上漲。
有意思的是,從營收的地區結構看,兩家的客戶對象也較為重合。
以2022年算,英偉達有30.74%的營收來自美國本土,其次是中國臺灣占比25.9%,中國內地(包括香港)的占比為21.91%,也就是說,英偉達的營收來自中國地區的共有47.81%,接近一半的比重。 不過,最新一期數據看,由于AI顯卡需求大爆發疊加美國政府的監管政策限制對華出口,導致三季報來自美國本土的營收激增,同時根據業績指引,四季度英偉達對華高端顯卡出口會明顯下滑,這個地區營收結構會出現很大變化。
不過,英偉達似乎很快找到了一個替代的方案,據CFO透露,英偉達正在為中國開發新的算力系列芯片—HGXH20、L20PCle和L2PCle,都是由H100該款而來,能夠符合美國相關規定。
而AMD方面,來自美國本土營收占比34.1%,來著中國地區(包括香港和臺灣)的營收共有32.1%,雖然占比不及英偉達,但近幾年在中國的銷售收入增速明顯。 也就是說,英偉達的中國業務受限,或可能為AMD留下一個缺口,盡管AMD也受限于美國限制政策的影響,但多少算是一個潛在的可能在未來重新同臺競爭的機會。
目前,AMD為了盡快彌補與英偉達的差距,正在大范圍地快馬加鞭收購AI及數據相關的資產,試圖加快集齊AI拼圖,為后續的數據中心業務鋪路。
今年4月4日,AMD宣布斥資19億美元收購DPU芯片廠商Pensando,以擴展其數據中心解決方案。
8月24日,AMD收購AI初創公司Mipsology,以加強人工智能推理軟件能力。
10月11日,AMD宣收購人工智能開源公司Nod.ai,以增加在AI市場的競爭力。
同時,在研發方面,近幾年AMD的研發費用率一直超過20%,并持續攀升。第三季度,AMD的研發投入15.07億美元,同比增長17.83%,研發費用率達到了25.9%,同比也提升了32.9%(對應英偉達的為最新一期財報研發投入20.4億美元,同比增長11.84%,研發費用率23.9%,同比提升12.58%)。
第三
人工智能可以賦能智能終端的愿景正在實現,AI大模型為英偉達、AMD、英特爾等芯片廠商指明了下一個潛力市場,無論是數據中心還是PC、手機等終端,芯片升級需求和高價值量趨勢將驅使他們加快研發和產品推出節奏。
雖然整體上來看,AMD在很多個方面與英偉達都還是有很大的差距,但它已經充分展現出來了不可忽視的增長潛力。 可以說,未來在AI加速芯片領域,英偉達和AMD龍爭虎斗的局面將一直延續。 *
審核編輯:劉清
-
處理器
+關注
關注
68文章
19286瀏覽量
229854 -
amd
+關注
關注
25文章
5468瀏覽量
134169 -
英偉達
+關注
關注
22文章
3776瀏覽量
91111 -
AI芯片
+關注
關注
17文章
1887瀏覽量
35027 -
生成式AI
+關注
關注
0文章
504瀏覽量
475
原文標題:誰會是下一個萬億芯片巨頭?
文章出處:【微信號:ICViews,微信公眾號:半導體產業縱橫】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論