在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

解析英偉達成長的核心戰略:研發為底、生態為徑、AI為翼

jh18616091022 ? 來源:AIOT大數據 ? 2023-05-26 14:47 ? 次閱讀

1、英偉達:算力芯片巨頭領跑 AI 時代

1.1 公司簡介:全球領先的 GPU 龍頭廠商

公司是全球 GPU 龍頭,市場份額遙遙領先。英偉達(Nvidia)是一家全球 知名的技術公司,成立于 1993 年,最初以圖形處理器(GPU)起家,通過 不斷的創新和發展,逐漸成為了高性能計算領域的領導者。根據 Jon Peddie Research 發布的 GPU 市場數據統計報告,英偉達 2022 年全年 PC GPU 出貨量高達 3034 萬塊,是 AMD 的近 4.5 倍;截至 2022 年四季度,在獨立 GPU 市場,英偉達占據 84%的市場份額,遠超同業競爭公司。

英偉達的產品創新和迭代從未止步。自英偉達成立以來,其經歷了多個重要 的發展時間點。其中包括 1999 年推出全球第一款 GPU、2006 年發布 Fermi 架構、2012 年發布 Kepler 架構、2016 年推出 AI 加速器 Tesla P100 和 Volta 架構、以及 2020 年發布 Ampere 架構等。這些重要時間點的創新和進步, 為英偉達在高性能計算、人工智能、虛擬現實等領域的發展奠定了堅實的基 礎。

7a4b25c8-fb84-11ed-90ce-dac502259ad0.jpg

橫向拓展豐富業務產品線,實現“CPU+GPU+DPU”三芯布局。英偉達的 三芯戰略側重于在數據中心市場實現 CPU、GPU和 DPU 三類硬件的布局, 旨在全面提升競爭力,滿足云計算、人工智能及機器學習等高端應用領域的 需求。CPU 的加入使英偉達能夠更好地應對各種計算任務,尤其是那些需 要快速邏輯判斷和高度并行處理能力的應用。而 DPU 則針對數據中心和網 絡設備的需求,具有高效處理數據包和協議的能力,為英偉達的產品線增添 了新的價值。通過將 CPU、GPU 和 DPU 集成到同一平臺上,英偉達可以 為客戶提供更加全面、高效的計算解決方案。目前 CPU+GPU 的產品組合 獲得超級計算中心的采用并即將廣泛部署于大型服務器,三芯戰略初顯成效。

芯片架構是英偉達的技術核心,快速迭代的新架構為產品帶來不斷的創 新與升級。自英偉達 GPU 問世以來,其架構經歷了多個重要發展階段。2006 年,Fermi 架構在 GPU 計算領域實現了重大突破,Kepler 架構進 一步提高了能效比和 GPU 性能,并引入了動態并行處理技術。隨后, Maxwell 架構實現了更加節能和高效的設計,Pascal 架構則引入了深度 學習計算中的 Tensor Core 和 NVLink 技術,以及更多的 AI 加速功能。Volta 架構則實現了更高的計算能力和存儲帶寬,并引入了深度學習加速 器 Tensor Cores V100。Turing 架構則進一步提高了光線追蹤和圖形渲染 性能,而 Ampere 架構則在 AI 加速、性能和能效方面實現了重要進展。每一代架構的創新和進步,都為 GPU 技術在高性能計算、人工智能、虛 擬現實等領域的應用奠定了堅實的基礎。

1.2 公司產品:多元化產品矩陣助力公司長期增長

英偉達產業布局多元化,解決客戶不同需求。GPU 產品為英偉達主要收入 來源,收入占比穩定在 80%以上。相比較于 CPU,GPU 在機器學習算法有 天生的優勢。英偉達一直專注于 GPU 的設計,同時由于 GPU 的并行計算 能力,可以通過數千個計算核心進行深度學習,英偉達開始將服務和系統、 軟硬件和可編程算法結合在一起,提出 CUDA 架構。從下游應用來看,英 偉達產品主要集中于游戲、專業可視化、數據中心以及自動駕駛領域:1)游戲市場:英偉達提供的產品包括 PC 游戲的 GeForce RTX 和 GeForce GTX,用于游戲和流媒體的 SHIELD 設備,用于云端游戲的 GeForce NOW, 以及用于專門控制臺游戲設備的平臺和開發服務;2)專業可視化市場:英偉達除了加速 GPU 計算解決方案,同時也為汽車、 娛樂、建筑工程、石油和天然氣、醫療等行業引入新的解決方案;3)數據中心市場:英偉達使用 NVlink 技術將多個 GPU 結合在一起,加速 神經網絡訓練和推理。同時開發出 DGX 超級計算機,進行科學計算、深度 學習和機器學習;4)自動駕駛市場:英偉達 Drive 作為一個人工智能汽車平臺,涵蓋了從交 通擁堵到機器人出租車自動駕駛的所有領域。2018 年有超過 370 家自動駕 駛汽車公司開始使用 Drive,共同開發自動駕駛的人工智能系統。

7a54d294-fb84-11ed-90ce-dac502259ad0.jpg

游戲業務:是英偉達主要產品線,作為基本盤見證了其里程碑式的革新。英偉達在游戲業務領域持續不斷的技術升級,以應對玩家日益增長的畫質需 求。游戲業務一直是英偉達的核心領域,每年都以引人注目的新產品展現其 持續的創新力。與前一代產品相比,每一代新顯卡都帶來了顯著的性能提升。從核心數量來看,英偉達顯卡產品的 CUDA 核心數量已從最初的 640 顆增 長到現在的高達 16384 顆,技術上不斷突破,包括實時光線追蹤技術等。另外,英偉達在游戲顯卡市場上有著廣泛的布局,從入門級到專業級,都提 供了相應的產品。這一策略允許英偉達滿足從獨立游戲玩家到專業電競選手 的多元需求。

數據中心:持續發力,高市占率源自于英偉達持續不斷的研發與創新。英 偉達長期占據高端 GPU 市場的領導地位,截至目前英偉達占據全球算力芯 片 90%的市場份額。高端芯片領域的霸主地位主要源自于公司不斷的技術 提升所形成強大的技術壁壘。從 2017 到 2022 這五年間,公司先后推出了 Volta、Ampere、Hopper 等針對高性能計算和 AI 訓練的架構,以此為基礎 發布了 V100、A100、H100 等高端 GPU。通過不斷的技術革新,英偉達 GPU 產品向量雙精度浮點算力已從 7.8 TFLOPS 增至 30 TFLOPS。

英偉達數據中心 GPU 在 11 年間從制程工藝到核心數量,各參數全方位提 升。從 2011 年的 Tesla M2090 開始英偉達不斷更新迭代數據中心產品,到了 2022 年發布的英偉達全新 GPU 產品 NVIDIA H100,性能上已經出現了 質的飛躍。此外,英偉達在數據中心的布局不僅僅停留在 GPU,在 CPU 方 面英偉達也全面發力,在 2022 年發布了首款 CPU 產品 Grace。Grace 內 臵下一代 Arm Neoverse 內核,采用第四代 NVIDIA NVLink,從 CPU 到 GPU 連接速度超過 900GB/s,相當于目前服務器 14 倍的帶寬速度;從 CPU 到 CPU 的速度超過 600GB/s。并且 Grace 擁有最高的內存帶寬, 采用的新內存 LPDDR5x 技術,帶寬是 LPDDR4 的 2 倍,能源效率提高 了 10 倍,能提供更多計算能力。

7a5da68a-fb84-11ed-90ce-dac502259ad0.jpg

自動駕駛業務:為英偉達提供中長期增長曲線。英偉達的自動駕駛 SoC 產 品線以其高性能、高能效和創新技術而著稱,致力于滿足不斷增長的計算需 求。英偉達推出的自動駕駛 SoC 產品包括先進的 Atlan 和 Orin 芯片,它們 集成了安培架構 GPU 核心、基于 Arm 的 Grace CPU 核心、深度學習和計 算機視覺加速器單元以及 BlueField DPU 核心,以實現卓越的算力和性能。英偉達的 SoC 產品線不斷創新,為客戶提供卓越的性能和可靠性,幫助推 動未來智能駕駛和高度互聯的汽車發展。

最新款 Atlan SoC 算力獲得指數級提升,為自動駕駛提供充足算力。2021 年, 英偉達推出了自動駕駛 SoC Atlan,其單顆算力高達 1000TOPS,是 上一代 Orin SoC(254TOPS)的近四倍。Altan 還支持 400Gbs(40 萬兆) 網絡和安全網關,可以滿足高速通信需求。同時,Atlan 可與為上一代芯片 組編寫的軟件堆棧(如 Orin 或 Xavier)兼容,使得汽車制造商和 AV 開發 人員不需要重新設計軟件就能利用新 SoC 的性能提升,大大提升使用的便 捷程度。

可視化業務:技術革新助力卓越視覺與計算體驗。在過去幾年,英偉達專業 可視化業務持續推出了一系列的技術革新,包括新的GPU架構(如Pascal、 Volta、Ampere、Ada Lovelace),更高效的顯存技術(如 GDDR6X), 以及更加智能化的軟件工具(如 RTX Studio)。這些創新大幅提升了英偉 達專業顯卡在高性能計算、人工智能、虛擬現實等領域的性能和可靠性,為 專業用戶提供了更加卓越的視覺體驗和計算能力。

英偉達專業顯卡技術不斷進步,性能顯著提升。隨著英偉達專業可視化顯卡 的不斷升級,計算能力和相關性能得到了顯著提升。從最初的幾百萬個 CUDA 核心、數百 GB/s 的顯存帶寬,到現在的數千萬個 CUDA 核心、TB/s 級別的顯存帶寬,英偉達專業顯卡已經成為高性能計算、人工智能、虛擬現 實等領域不可或缺的重要組成部分,為專業用戶提供了更加卓越的視覺體驗 和計算能力。

1.3 公司財務:財務狀況良好,反哺研發投入上升

公司營業收入高速增長,1999-2023 財年 CAGR 24%。1996 年英偉達 的營業收入僅 391 萬美元,凈利潤虧損超過 300 萬美元。此后,英偉達 的體量快速增長,到 2023 財年營收和凈利潤分別達 270 億美元和 44 億美元,1999-2023 財年營收 CAGR 24%,凈利潤 CAGR 34%。

7a6906ba-fb84-11ed-90ce-dac502259ad0.jpg

新興市場成為英偉達主要收入來源地。分地區看,中國大陸在 2023 財 年營業收入達到 58 億美元,占總收入的 21%,而在 2003 財年中國大 陸營業收入只有 2.4 億美元,占總收入的比例僅為 13%。和中國大陸市 場一樣,亞太其他地區以及美洲其他地區都出現了較大的增長幅度。相 反,中國臺灣市場出現了較大的衰退。2003 財年,中國臺灣市場占總營 收的比例為 45%,到 2023 財年下降到 32%,而美國市場收入則保持穩 定在 31%左右。

隨人工智能發展,數據中心業務收入增速最高,逐步成為公司最大營收 占比。從業務板塊看,英偉達下游應用包括游戲、數據中心、專業化視 覺、汽車、OEM 及其他。其中,數據中心業務收入在 2023 財年達到 150 億美元,占據英偉達營業總收入的 56%,數據中心業務收入同比增長 41%,主要增長來源于 AI 發展及美國云服務提供商的推動。游戲業務收 入 90.7 億美元,占總營業收入的 34%,受全球游戲行業需求下行影響 同比下降 27%。汽車、代工以及專業可視化業務都保持著低速增長。

7a72a95e-fb84-11ed-90ce-dac502259ad0.jpg

英偉達凈資產收益率周期波動,毛利率和凈利率總體呈現上升趨勢。2000 財年之后,英偉達開始負責 Xbox(微軟公司開發并于 2001 年發 售的一款家用電視游戲機)的芯片設計工作,因為 Xbox 相比較于英偉 達其他產品有著相對較少的利潤率,所以 ROE 和凈利率都呈現下降趨 勢。在此之后英偉達依靠新產品的開發,使得 ROE 重新上升到 34%。2008 財年英偉達已成長為全球圖像處理器行業龍頭,但因全球經濟危機 影響,公司 ROE 和凈利率創新低,至 2010 財年分別達-2.69%和-2.04%。2010 年后,全球經濟復蘇,游戲市場在新興市場蓬勃發展,英偉達游戲 部門業務及圖形處理器收入平穩上升。2017 財年,英偉達迎來了新一輪 的增長期,產品全面發力,GeForce、Tesla、GRID 和 Quadro 銷售收 入相較于 2016 年都出現大幅度增長。

良好的營收狀況是公司增加研發投入的基本,研發投入也保障了公司營 收的持續健康成長。相比較于競爭對手 ATI 和 AMD,英偉達在競爭初期 都處于下風。隨著研發投入的不斷增長,英偉達通過技術進步降低成本 和產品價格,不斷推出新的產品吸引更多消費者,優勢逐漸凸顯。在與 ATI 競爭的周期中,英偉達的研發費用從 1999 財年的 2507 萬美元,以 年均 55%的增長率趕上 ATI 的研發費用,在 2005 財年達到 3.6 億美元。ATI 被 AMD 收購后,英偉達在獨立顯卡的競爭對手就變為了 AMD。2005 年,AMD 的研發費用為 11 億美元,是英偉達的 3.2 倍左右,而到了 2022年,英偉達的研發費用達到了 73.4 億美元(對應 2023 財年),是 AMD 的 1.47 倍。

研發費用率保持高位,不斷吸引優秀人才加入。從早期的“三團隊-兩季 度”研發迭代模式開始,英偉達的研發目標就一直走在市場的前端。英 偉達研發團隊分為軟件工程、硬件工程、超大規模集成電路工程、工藝 工程、架構和算法團隊,負責研究開發統一的硬件和軟件架構,提供領 先市場的圖像加速技術。英偉達研發人員數量持續增長,截至 2023 財 年達到 19532 人。

2、英偉達發展歷程三部曲

2.1 1993-2000:初具規模,提升研發效率戰勝對手

1993 年黃仁勛、克里斯〃馬拉科夫斯基和柯蒂斯〃普利姆在美國加州創 立了英偉達。在創建之初,公司設想著個人電腦將會成為游戲、多媒體 的主流消費設備。90 年代初,高性能圖像被使用在工作站和視頻游戲機 上,在此之后,3 件獨立事件改變了這樣的情況,推動了 3D 圖像市場 的發展:(1)微軟推出的 Windows 95 包括了視頻、音頻功能,刺激了多媒體市 場發展。3D 圖形逐漸增加的重要使得個人電腦制造商的差異性更加明顯;(2)電腦仿真渲染動畫出現,3D 動作游戲登陸 PC 平臺;(3)在摩爾定律的推動下,IC 的集成度不斷提高,能夠將大量 3D 圖 形處理器放在一個芯片上。半導體設計和制造的不斷進步,使得以前只 能在工作站級別獲得的高性能 3D 圖形技術,現在能夠以合理的價格獲 得。而圖形處理器的不斷發展也帶動英偉達整體規模不斷增長。

推進“三團隊-兩季度”研發模式,新品不斷迭代滿足下游需求。一般圖 形市場產品有兩個開發周期:6-9 個月和 12-18 個月,英偉達執行了“三 團隊-兩季度”的運營模式,具體方式包括三個并行開發團隊,專注于三 個獨立的分階段產品開發。一個在第一年秋季,一個是在第二年春季以 及第二年秋季。這樣的運行方式允許公司每 6 個月推出一次新產品,與 圖形市場產品周期一致,并且領先市場 1-2 個研發周期,從而滿足下游 需求變化。

不斷豐富產品矩陣滿足下游客戶不同需求。GeForce 系列是英偉達為臺 式機提供圖像處理的芯片。2002 年 11 月,英偉達推出為個人電腦市場 消費者開發的產品線 GeForce FX 系列。GeForce 系列的其他產品,比 如 GeForce2、GeForce3、GeForce4 都能夠為不同價位的主流產品提 供最高的性能。

高研發帶來技術水平不斷升級,英偉達在 1996 年后接連推出旗艦產品, 擊敗行業競爭者。英偉達在 1996 年,推出 NV3 系列的 Riva 128 芯片, 在性能方面具有優勢,并且芯片尺寸更小,因此結構成本更低,通過數 據對比,RIVA128 甚至優于下一年 Intel 推出的 i740,而且 i740 不支持 任何 OpenGL 驅動程序。在英偉達推出 RIVA TNT 時已經沒有產品能夠 和其匹敵。1999 年,Intel 宣布完全退出獨立顯卡芯片組業務。而在 2000 年英偉達推出 GeForce 256,全面超過當時行業最大競爭者 3dfx,最終 3dfx 宣布破產并且被英偉達收購。

7a7d884c-fb84-11ed-90ce-dac502259ad0.jpg

2.2 2001-2006:寡頭壟斷,逐步成為獨顯市場霸主

英偉達在游戲市場率先取得突破。自 1999 年 Geforce 系列推出以來, 它一直在游戲性能的創新和提升方面保持領先地位。GeForce 系列顯卡 被廣大游戲愛好者和電子競技玩家所推崇,因為它們能提供極高的圖形 渲染能力和實時光線追蹤技術,以實現更加真實的游戲體驗。與此同時, Xbox 為代表的游戲主機興起助力了英偉達在游戲 GPU 行業的發展。英 偉達為 Xbox 視頻游戲系統設計的處理器利用雙處理架構推動了其優秀 的圖形、音頻和網絡功能,確立了英偉達在游戲機市場的穩固地位。雖 然后續英偉達未能持續成為 Xbox GPU 供應商,但是早期在 Xbox 上的 成功已經為英偉達在游戲市場的發展奠定基礎。

通過收購,技術開發以及廣納人才,英偉達進一步開拓市場,增強自身 實力,保持市場領先地位。英偉達預測未來能夠實現通話和多媒體功能 的手機半導體將會大放異彩,因此積極通過收購移動端公司來布局移動 端圖像芯片產業,并緊密融合 Direct3D 和 OpenGL 以最大程度地支持 第三方軟件。Direct3D 和 OpenGL 作為應用程序編程接口,使軟件開發 人員能夠在不需要深入了解硬件特性的情況下編寫應用程序,從而在 3D 圖形、視頻媒體通信以及超低功耗方面保持其技術的領先地位。為了維 護市場的領導地位,英偉達積極地招募業界經驗豐富的 3D 圖形和通信 工程師,并持續開發新一代的 GPU、MCP 以及 UMP。

英偉達全面完善產品線,產品覆蓋高中低端下游各應用市場。經過了不 斷的發展,英偉達的產品線逐漸豐富,覆蓋了多種不同的下游應用。首 當其沖的是 GeForce 系列顯卡,主要針對的是個人電腦的游戲領域。同 時,為了滿足科研和企業市場的需求,英偉達推出了 Tesla 和 Quadro 系列的 GPU,這些產品被廣泛應用于機器學習、數據科學、計算機視覺 等領域。此外,英偉達還在汽車自動駕駛等前沿領域推出了專門的解決 方案,如 Jetson 和 DRIVE 系列。

7a854154-fb84-11ed-90ce-dac502259ad0.jpg

2.3 2007-2023:重“芯”開始,引領人工智能計算

智能手機浪潮來臨,但是由于時機和定位上的失誤,英偉達錯失機遇。自蘋果系列產品推出后,智能手機成為一大熱點,引領時代風潮。在這樣的背景下,Intel 推出了 Atom,英偉達推出了 Tegra。然而手機芯片市 場并沒有像 PC 市場一樣被這兩個大場占領,相反高通依靠著基帶技術 的壟斷成為了移動端市場的主流。Tegra 系列在最初是依靠英偉達在圖 像處理的優勢為平板和游戲機研發的。當英偉達推出 Tegra 2 系列時, 3G/4G 技術開始成為移動端市場追逐的目標。但由于 Tegra 3 沒有能夠 整合基帶技術從而失去了占領市場的必要條件,而 Tegra 4 遲遲沒有發 布以及低性價比也失去了市場的青睞。

英偉達退出手機市場,轉向汽車、人工智能市場,調整競爭策略。在經 歷了手機市場的挑戰后,英偉達進行了戰略調整,從手機市場退出,并 將其研發重心轉向了汽車和人工智能市場。這一轉變對于英偉達來說, 不僅是其業務發展的一次機遇,更是對于行業趨勢的敏銳洞察。在汽車 市場中,英偉達通過自己的技術優勢,推出了一系列高效能的自動駕駛 處理器,逐漸在此領域確立了自己的領導地位。而在人工智能市場,英 偉達的 GPU 產品憑借其超強的并行計算能力,成為了支撐深度學習和 機器學習應用的核心設備,展現出強大的市場競爭力。

事實證明英偉達的轉型抓住了市場需求的改變,英偉達 2015-2023 年營 收增速可觀。在 2008 年全球經濟危機爆發之后,英偉達的業務收入也 受到了經濟危機的影響,在 2009 年和 2010 年財報中凈利潤呈現負值, 虧損達到三千萬和六千萬美元,但在之后的幾年中,英偉達依靠著在游 戲行業中的基礎,繼續拓寬在可視化計算、人工智能業務,并且借助于 比特幣區塊鏈對于顯卡芯片的高增長需求,在 2016 年之后,保持著 高增長的營業收入增長趨勢。高增長的凈利潤得益于英偉達每年研發費 用的投入,使得英偉達的產品領先同行業的競爭對手,更快地拓展新業 務,更早地形成進入壁壘。而凈利潤的增長又會使得英偉達有更多的資 金進行新產品的研發,從而達成良性循環,占據市場領先的地位。

7a94a414-fb84-11ed-90ce-dac502259ad0.jpg

具體從各終端來看,英偉達各方面業務保持收入增長,全面發展。從英 偉達終端用戶劃分來看,各終端產品收入都保持著穩定增長。數據中心 發展加速,游戲終端依舊是英偉達重要的業務收入基礎。

英偉達不斷更新產品技術, AI 市場成為主要目標,給英偉達帶來新的 增長。隨著 AI 市場的蓬勃發展,英偉達敏銳地將其定位為公司的主要發 展目標。英偉達開發了一系列專門針對 AI 應用的 GPU,如 Tesla、Titan 以及 Quadro 系列。這些產品能夠高效處理深度學習和機器學習的大規 模并行計算,極大地推動了 AI 的發展。2020 年在 SC20 超級計算大會 上,NVIDIA 發布了新一代 DGX Station A100 以及 NVIDIA A100 80GB GPU 支持諸如 BERT Large 推理等復雜的對話式 AI 模型。此后在 2022 年 3 月,NVIDIA 又宣布推出第四代 NVIDIA DGX系統,是全球首個 基于全新 NVIDIA H100 Tensor Core GPU 的 AI 平臺,徹底占據 AI 市場 領先地位。

總結:當 iPhone 出現后,全球智能手機市場的帷幕被拉開。移動端 GPU 市場逐漸成為了大家的焦點。但英偉達并沒有能夠在手機 GPU 市場取 得較打的成功,但英偉達將手機GPU芯片Tegra用在了其他應用領域, 為公司打開了新的業務市場。

3、英偉達發展歷程總結,借鑒意義

3.1 深耕 GPU 算力領域,研發為導向不斷提升產品競爭力

采用主流 API,借助微軟推廣產品。從英偉達創立時,公司就以市場需 求為導向。通過匹配主流 API,不斷技術更新逐漸減低產品價格,達到 消費者需求,以此來達到一家初創公司占領市場的目的。英偉達在設計 NV2 后的產品時,都將微軟推出的 DirectX 作為匹配的 API。憑借著微 軟 Windows 系列在操作系統市場占有大量份額,同時對 DirectX 和 OpenGL 加速優化,使得英偉達的產品廣受歡迎。

7aa284bc-fb84-11ed-90ce-dac502259ad0.jpg

壓縮開發周期領先市場,為下游廠商提供更好的產品。英偉達把握住了 從 2D 到 3D 過渡的風潮,通過成熟的研發體系,用速度甩開 2D 圖形廠 商。英偉達圖形業務的快速產品周期得益于其運營模式。一般圖形市場 產品有兩個開發周期:6-9 個月和 12-18 個月,英偉達執行了“三團隊兩季度”的運營模式,具體方式包括三個并行開發團隊,專注于三個獨 立的分階段產品開發。一個在第一年秋季,一個是在第二年春季以及第 二年秋季。這樣的運行方式允許公司每 6 個月推出一次新產品,與圖形 市場產品周期一致,并且領先市場 1-2 個研發周期。此外為解決芯片硬 件開發比軟件開發慢的問題(軟件可以快速測試并經過調試,通常是每天或每周一次;相比之下,芯片硬件就必須構建掩模并在進行電子測試 之前完成初步制造),英偉達大力投資了仿真技術,從而提升效率。

在產品布局多元化初期,用產品交叉服務市場。英偉達在經歷了手機端 芯片市場開拓的失敗之后,并沒有停止 Tegra 處理器的研發,而是改變 產品定位,將 Tegra 處理器運用在智能汽車、智慧城市和云端服務上。于是英偉達初步奠定了“兩產品條線-四市場”的商業模式。兩產品條線 包括了英偉達傳統產品 GPU 和 Tegra 處理器,而四市場則包括了游戲、 企業級、移動端、云端。

英偉達的商業模式戰略很好的應對了圖像處理器市場的發展趨勢。當時 的圖像處理器市場產品細化,主要分布在游戲玩家、企業級、平板電腦 和移動端用戶,不同客戶的需求差異化明顯,針對不同下游英偉達推出 了對應的產品方案:(1)游戲市場:玩家希望能夠在不同的平臺無縫的進行游戲體驗,英 偉達為此推出了端到端的服務:游戲能夠在云端運行,不需要玩家擁有 足夠高性能的電腦。大大提高了玩家碎片時間的利用率和娛樂的靈活性。(2)企業級:產品則是為汽車、電影、天然氣等行業提供可視化解決 方案,目的是提高行業生產力。英偉達面向企業市場的產品包括用于工 作站的 Quadro,用于高性能計算服務器的 Tesla 和用于企業 VDI 應用 程序的 GRID。(3)移動端:英偉達不再將移動端客戶拘泥于手機端用戶,而是將移 動端擴展到移動智能設備市場,比如智能汽車、智能家居行業。英偉達 的移動戰略轉變為了將 Tegra 應用到需要視覺設計的設備中。(4)云端服務:伴隨著計算機行業的發展也成為了可視化計算服務的 重要一環。憑借云端技術,英偉達將 GPU 的應用從 PC 端拓展到服務器 和數據中心,使得更多的用戶可以使用。英偉達開發的 GRID 使 Adobe Photoshop 遠程運行,并與應用程序交互。

7aacd32c-fb84-11ed-90ce-dac502259ad0.jpg

英偉達 AMD 雙寡頭壟斷顯卡市場。在 2009 年 Intel 取消 Larrabee 圖形 顯卡項目之后,獨立顯卡市場逐漸成為了雙寡頭市場。相較于行業的潛 在新進入者,英偉達和 AMD 擁有更長的經營歷史、更大的客戶基礎、 更全面的知識產權和專利保護,以及更多的融資、銷售、營銷和分銷資 源,二者共同構筑了行業新進入者無法逾越的天塹。研發方面,2005 年,AMD 的研發費用為 11 億美元,是英偉達的 3.2 倍左右,而到了 2022 年,英偉達的研發費用達到了 73.4 億美元(對應 2023 財年),是 AMD 的 1.47 倍。由于性能、構建、價格的不同,二者逐步產生差異化,形成 了錯位競爭。至 2022 年第三季度,英偉達基本占據 88%市場份額,AMD 則降低至 8%。

研發投入帶給英偉達高回報,在主流游戲和顯卡天梯測評上,AMD 落 后于英偉達。英偉達在 2018 年推出的 Titan RTX 和 RTX 2080 Ti 全面 超過當時的 Radeon VII,其采取的策略是推出比 AMD 稍高的性能和價 格。即使技術比 AMD 領先,也會等到 AMD 推出更高性能的產品之后, 才會推出,以此來獲得比 AMD 更高的收益。

專利數量方面英偉達逐步反超 AMD。AMD 此前在專利數量上一直多于 英偉達,但申請的數量呈現下降趨勢。英偉達在 2011 年之后申請專利 數量開始爆發,主要因其在 2007 年之后開始研發移動端 GPU 和深度學 習領域,最終給 GPU 市場帶來了新的框架和更高性能的芯片。

3.2 CUDA 自成體系:從單一產業到生態鏈,構建強護城河

CUDA 助力英偉達成長為 AI 產業龍頭,構建強大生態護城河壁壘。CUDA 是英偉達基于其生產的 GPUs 的一個并行計算平臺和編程模型, 目的是便于更多的技術人員參與開發。開發人員可以通過 C/C++、 Fortran 等高級語言來調用 CUDA 的 API,來進行并行編程,達到高性 能計算目的。CUDA 平臺的出現使得利用 GPU 來訓練神經網絡等高算 力模型的難度大大降低,將 GPU 的應用從 3D 游戲和圖像處理拓展到科 學計算、大數據處理、機器學習等領域。這種生態系統的建立讓很多開 發者依賴于 CUDA,進一步增加了英偉達的競爭優勢。

CUDA 的低成本和兼容性成為其最重要的吸引點之一。英偉達的 CUDA 是一個免費、強大的并行計算平臺和編程模型。安裝過程簡單且明確, 讓開發者能夠輕松快速地啟動并行編程。CUDA 對新手極其友好,特別 是對 C 語言、C++和 Fortran 的開發者。同時為支持其他編程語言,如 JavaPython 等,CUDA 還提供第三方包裝器進行擴展。為廣大開發者 提供了極大的便利和高效的編程體驗。操作系統方面,CUDA 在多種操 作系統上也都有良好的兼容性,包括 Windows、Linux 和 macOS。

7ab591f6-fb84-11ed-90ce-dac502259ad0.jpg

CUDA 有著豐富的社區資源和代碼庫,為編程提供良好的支持。英偉達 的 CUDA 享有強大的社區資源,這個社區由專業的開發者和領域專家組 成,他們通過分享經驗和解答疑難問題,為 CUDA 的學習和應用提供了 豐富的支持。另外,CUDA 的代碼庫資源涵蓋各種計算應用,具有極高 的參考價值,為開發者在并行計算領域的創新和實踐提供了寶貴的資源。這兩大特點共同推動了 CUDA 在并行計算領域的領先地位。

CUDA 借助燕尾服效應,搭配 GeForce 覆蓋多元市場。CUDA 技術最 初是為了配合 GeForce 系列芯片而推出的,利用 GeForce 在游戲市場 的廣泛覆蓋率,作為一個技術杠桿,推動 CUDA 的普及和發展。作為一 項可以幫助 GeForce 拓展新的市場的重要技術,CUDA 極大地提高了視 頻和圖像應用(如 CyberLink、Motion DSP 和 Nero)的性能,實現了 多倍的效率提升。

創業公司的大量采用使得 CUDA 應用場景進一步得到拓展,游戲不再是 唯一應用領域。隨著時間的推移,超過一百家創業公司開始利用 CUDA 的強大計算能力,使其應用領域得以擴展,不再局限于游戲方面。在視 頻編碼領域,英偉達與 Elemental 公司合作,利用并行計算技術加速了 高清視頻的壓縮、上傳和存儲速度。這一成功的合作不僅體現了 CUDA 在各種場景下的適用性,也進一步推動了 CUDA 技術的發展。當 Elemental 公司后被亞馬遜收購,其基于 CUDA 的視頻處理技術也成為 AWS 的服務組成部分,這一過程也讓 CUDA 的使用場景得到了進一步 的豐富和拓寬。

CUDA 形成完整生態鏈,通過大學普及學習以推廣 CUDA。英偉達將 CUDA 引入了大學的課堂中,從源頭上擴大了 CUDA 的使用范圍和受眾 群體。早在 2010 年,已經有關于 CUDA 數千篇論文,超過 350 所大學 進行 CUDA 教學課程。在此基礎之上,英偉達建立了 CUDA 認證計劃、 研究中心、教學中心,不斷完善 CUDA 的生態鏈。從結果看:2008 年 僅有 100 所大學教學 CUDA 課程,在 2010 年英偉達全球建立了 20 個 CUDA 研發中心后,2015 年已有 800 所大學開放 CUDA 課程。

對比 OpenCL,CUDA 是英偉達 GPU 編程的更優解。OpenCL 雖然具 有更廣的兼容性,但 CUDA 由于與英偉達的硬件緊密結合,能更有效地 利用其 GPU 的性能。同時,CUDA 的編程模型相比 OpenCL 更加簡潔, 易用,并提供完整的開發工具鏈。此外,CUDA 的社區資源豐富,代碼 庫多樣,使得在科學計算、深度學習等領域的應用更為便捷。因此,對 英偉達 GPU 的開發者來說,CUDA 往往是更優的選擇。

7ac03d9a-fb84-11ed-90ce-dac502259ad0.jpg

對比 ADM 的 CTM 編程模型,CUDA 擁有更廣泛的應用和更高的操作 性。從操作性來說,由于 CTM 更接近硬件,因此開發者需要有更深入 的硬件知識才能進行開發,但是這也意味著 CTM 能夠提供更精細的控 制和優化。對比之下,CUDA 提供了一套完整的開發工具鏈,包括編譯 器、調試器和性能分析工具,以及豐富的庫函數,為開發者提供了極大 的便利。從應用來說,CUDA 已經在各種領域獲得了廣泛的應用,尤其 是在科學計算和深度學習等領域,CUDA 擁有大量的優化庫和開發工具。而 CTM 的應用相對較少,但是由于它提供了對硬件的低級別控制,因 此在一些特定的應用場景中會具有優勢。

對比微軟的 DirectCompute, CUDA 勝 在配套設施的支持。與 DirectCompute 相比,CUDA 由于其豐富的功能庫,完善的開發工具和 廣泛的應用支持,尤其在科學計算和深度學習領域,具有明顯優勢。CUDA 在英偉達 GPU 上的性能優化也更為出色。而 DirectCompute 作 為跨平臺工具,其優勢在于與DirectX的兼容性以及對多種硬件的支持。但從英偉達 GPU 的應用廣泛度來看,使用 CUDA 才是開發者的首選。總的來說,雖然 DirectCompute 的通用性更強,但英偉達的 CUDA 在功 能、性能和應用范圍上提供了更強大的支持,對于使用英偉達硬件的開 發者來說是更優的選擇。

CUDA 的開發提升了英偉達的品牌競爭力和影響力。CUDA 的開發使英 偉達的 GPU 超越了僅用于圖形處理的傳統角色,轉變為通用的并行計 算設備,極大地提升了其在市場上的競爭力。英偉達因此能夠滿足廣泛 的高性能計算和人工智能需求,使其產品得以進入新的市場領域。同時, 隨著 CUDA 在各類高性能計算任務,特別是人工智能領域的廣泛應用, 英偉達的品牌影響力得到了顯著增強。越來越多的人開始認知和使用英 偉達的產品,這不僅加強了英偉達的市場地位,也為其未來的發展奠定 了堅實的基礎。

CUDA 促進了英偉達的產品創新,激發更多可能性。CUDA 的開發推動 了英偉達在并行計算技術領域的創新,尤其在硬件架構方面。這不僅體 現在優化了的 GPU 架構上,例如將流多處理器(SM)配臵為處理并行 線程的方式,也在軟件架構上如 CUDA 自身的持續更新和優化。為了更 有效地滿足用戶對于更高性能和更易用并行計算工具的需求,英偉達不 斷創新,致力于提高 CUDA 的性能和用戶體驗。這一切不僅反映出英偉 達對創新的重視,也為其在并行計算技術領域的領導地位提供了堅實的 技術支撐。

7ac90fba-fb84-11ed-90ce-dac502259ad0.jpg

英偉達的 CUDA 技術憑借其廣泛應用和強大合作伙伴網絡,鞏固了英偉 達的領導地位。CUDA 技術在眾多領域均有廣泛應用,包括但不限于深 度學習、圖像和自然語言處理、天氣模擬、流體動力學、分子動力學、 量子化學以及天體物理模擬。因此,適配 CUDA 的應用程序數量繁多, 進而催生了對 CUDA 的廣闊需求空間。英偉達與諸如 Dell、HP、聯想 等知名 OEM 廠商,以及 Netapp、Pure Storage 等渠道合作伙伴和如埃 森哲等服務公司展開了深度合作。

CUDA 整合英偉達體系,培養了開發者和使用者的用戶粘性。當開發者 融入 CUDA 的生態系統,他們往往會被其卓越的計算性能、充裕的庫函 數和出色的易用性所吸引,因此更傾向于持續利用此技術。另一方面, 為 CUDA 優化的代碼移植至其他平臺通常需要消耗大量的精力和時間, 這進一步增強了客戶的留存度。此外,英偉達不斷推陳出新,發布新的 硬件產品及 CUDA 版本,從而維持用戶對其技術的關注并持續使用。這 種深度使用使得用戶在選購硬件產品時傾向于選擇對 CUDA 有更好支 持的英偉達產品,進而建立起穩固的客戶忠誠度。

3.3 抓住人工智能發展浪潮,順利轉型切入算力芯片領域

根據 IDC 的測算,全球數據總量將以每年 50%的增速不斷增長,在 2025 年數據量會增加到 334ZB,在 2035 年則將達到 19267ZB。隨著 5G 落地, 應用方案更加具象化,未來隨之出現的數據總量和數據分析需求將會持 續上升。增長的數據量主要來源于 IoT、移動互聯網、智慧城市、自動 駕駛。大數據的應用將會從商業分析向工業、交通、政府管理、醫療、 教育等等行業滲透,并且成為產業供應鏈中不可或缺的一部分。

從目前的測算來看,智能駕駛將是算力要求最高的應用層面。一方面汽 車駕駛對于安全可靠性性要求最高,另一方面 L5 級別的汽車會攜帶的 傳感器將達到 32 個,據麥肯錫估算一輛自動駕駛汽車的數據量將達到 4TB/h,Intel 測算出的一天數據量將達到 4000GB。而英偉達的 Xavier 目前只有 1.3TFlops,還達不到處理 L5 的數據能力,自動駕駛和 ADAS 市場在接下來的 10 年之間有望保持較高增長的態勢,因此智能駕駛以 及 ADAS 存在著巨大的算力缺口。

人工智能產業將拉動 GPU 行業發展。根據 Tractica 的數據,2018 年全 球 AI 硬件市場的收入為 196 億美元,其中 GPU 的收入占 36.2%為 71 億美元。而在 2025 年將達到 2349 億美元,其中 GPU 的收入占 23.2% 為 545 億美元。盡管 GPU 市場占比出現下滑,但是全球 AI 硬件市場在 不斷上升,將會給 GPU 市場帶來更多的增長空間。

7ad78158-fb84-11ed-90ce-dac502259ad0.png

CPU 受到摩爾定律約束,應用性能增幅下降。人工智能的到來沒有因為 摩爾定律的放緩而停止到來。登納德定律是通過縮小晶體管的尺寸和電 壓讓設計師在保持功率密度時提高晶體管的密度和速度。但目前受到物 理條件的限制,CPU 架構師需要大量增加電路和能量,獲得有限的 ILP(指令級并行)。因此,在后摩爾定律時代,CPU 晶體管需要消耗更多 的性能導致應用性能的小幅提高。最近幾年 CPU 的性能僅以每年 10% 的速度增長,而過去是每年 50%。

GPU 憑借超高運算速度成為高性能計算的寵兒,相比 CPU 提高了數倍 的計算效率。在人工智能領域,圖形處理器(GPU)憑借其卓越的并行 計算能力和大規模處理單元,成為大數據運算的主力。這在深度學習模 型的訓練和推斷等任務中表現得尤為明顯。盡管中央處理器(CPU)在 順序化任務處理方面具有優勢,但其并行計算性能遠不如 GPU。自 2006 年亞馬遜在卷積神經網絡(CNN)中首次使用 GPU,其效率就已顯著 優于 CPU。如今,隨著技術不斷發展和更新,GPU 在運算效率上進一 步超越 CPU,堅定地確立了其在 AI 時代的算力核心地位。

盡管 FPGA 具有編程靈活性,但 GPU 的處理效率卻更勝一籌。FPGA 是專用集成電路(ASIC)中的一種半定制電路,被稱為現場可編程門陣 列,其性能介于定制電路和可編程器件之間。可以通過硬件描述語言 (HDL)按照特定任務或者應用程序的需求來搭配相應的 HDL。相比較 于 ASIC,FPGA 能夠使用 OpenCL 快速編程,更加具有成本效益。微 軟預測基于 FPGA 的 BrainWave 推理平臺可以在達到每秒約傳輸 500 張圖像。但是對比這兩種硬件,GPU 從效率上更顯優勢,例如英偉達的 Tesla P4 就能夠在 75w 的能耗上一秒傳輸 1676 張圖像。

英偉達以其創新力和高市場份額,在全球 GPU 市場中居于領導地位。英偉達 GPU 領域享有顯著的市場份額,在 2022 年 Q3 英偉達市場占有 率達到了歷史新高 88%。這一優勢體現了其在行業中的龍頭地位。其持 續的技術創新和強大的研發實力,尤其是 CUDA 并行計算平臺的推出, 進一步鞏固了其在市場中的優越地位。在人工智能和機器學習的加速應 用下,英偉達的 GPU 已成為行業內的首選解決方案,廣泛應用于各個 領域,從游戲和專業視覺應用到數據中心和自動駕駛汽車。

回顧英偉達的發展歷程,其成功的經驗在于以下幾點:(1)英偉達持續十幾年深耕 GPU 高性能計算潛力,產品矩陣豐富,抓 住下游人工智能和 5G 浪潮,推動 GPU 市場從游戲顯卡轉變為 AI 計算 加速處理器;(2)搭建 CUDA 生態,提高自身產品附加值,構建強大的軟件護城河 壁壘。通過大學、研究院加快 CUDA 開發,吸引人工智能行業人員加入 CUDA,將其打造成英偉達 GPU 核心競爭力;(3)加大研發投入,強大的研發能力使英偉達能夠實施創新技術,不斷 更新 GPU 架構拓展業務范圍,擴大 GPU 市場,提高營收和利潤率,達 成產業鏈的良性循環。

解析復盤英偉達,借鑒算力龍頭發展路徑。伴隨生成式 AI 火熱,大模型 持續發展對算力提出更高要求,英偉達進入快速發展時期。我們認為復 盤英偉達能夠學習海外龍頭的成長經驗,為國產廠商提供發展思路。此 外,隨國內算力行業國產替代進程持續推進,看好國產供應鏈廠商發展 機遇。

4、算力是 AI 底層土壤,從英偉達看國產發展機遇

4.1 ChatGPT 激起 AI 浪潮,大模型升級推動算力提升

AI 人工智能的發展主要依賴兩個領域的創新和演進:一是模仿人腦建立 起來的數學模型和算法,其次是半導體集成電路 AI 芯片。AI 的發展一 直伴隨著半導體芯片的演進過程,20 世紀 90 年代,貝爾實驗室的楊立昆(Yann LeCun)等人一起開發了可以通過訓練來識別手寫郵政編碼的 神 經 網 絡 , 但 在 那 個 時 期 , 訓 練 一 個 深 度 學 習 卷 積 神 經 網 絡 (Convolutional Neural Network,CNN)需要 3 天的時間,因此無法實 際使用,而硬件計算能力的不足,也導致了當時 AI 科技泡沫的破滅。

AI 芯片是 AI 發展的底層基石。英偉達早在 1999 年就發明出 GPU,但 直到2009年才由斯坦福大學發表論文介紹了如何利用現代 GPU遠超過 多核 CPU 的計算能力(超過 70 倍),把 AI 訓練時間從幾周縮短到了 幾小時。算力、模型、數據一直是 AI 發展的三大要素,而 AI 芯片所代 表的算力則是人工智能的底層基石。

ChatGPT 爆火的背后是人工智能大模型的迭代升級。ChatGPT 是基于 GPT-3.5 微調得到的新版本模型,能夠借助人類反饋的強化學習(RLHF) 技術來指導模型訓練,實現模型輸出與人類預期的需求,使對話內容更 加人性化和富有邏輯性。從 2008 年第一代生成式預訓練模型 GPT-1 誕 生以來,GPT 系列模型幾乎按照每年一代的速度進行迭代升級,未來隨 著大語言模型(LLM)技術的不斷突破,AI 相關應用有望加速落地,AI 產業或將迎來新一輪發展機遇。

大模型發展將不斷降低 AI 應用門檻,助力下游降本增效推動滲透率提 升。預訓練大模型在海量數據的學習訓練后具有良好的通用性和泛化性, 用戶基于大模型通過零樣本、小樣本學習即可獲得領先的效果,能夠顯 著降低 AI 應用的門檻,目前主流的大模型包括 Transformer、GAN、CNN 以及 RNN 等架構。

大語言模型(LLM)代表著 AI 領域的重大進步,并有望通過習得的知 識改變該領域。根據英偉達,在過去幾年中,LLM 的規模每年增加 10 倍,而且隨著這些模型的復雜程度和規模的增加,其性能也在不斷發展。大語言模型是一種基于深度學習的自然語言處理技術,其主要目的是通 過學習大量文本數據從而自動生成符合語言規則的語句、段落甚至文章。基于 Transformer 架構,大語言模型的核心思想是利用深度神經網絡來 學習自然語言的語法、語義等特征,從而能夠預測下一個詞匯的出現概 率,并根據這些概率生成新的語句。Transformer 架構在海量數據集上 并行處理數據排序的計算能力是大語言模型背后的最大驅動力。

基于 Transformer 架構,GPT 采用預訓練的方法來學習語言的概率分 布模型,經過微調后可以解決各種自然語言處理任務、生成自然流暢的 文本。其工作原理如下:1)數據收集和監督訓練。模型用示例提示進行訓練,由人類向模型演示 所需的輸出。然后由人類對模型進行監督和微調,直到它能夠進行滿足 所需性能水平的輸出。2)可比數據集手機和模型的獎勵訓練。對于相同的示例,向模型演示多 個輸出并從最好到最差排序。已經通過監督訓練的模型將生成盡可能接 近預期結果的輸出。用多組數據輸出來訓練模型以生成排名最高的輸出。3)使用強化學習來優化模型。當該模型產生一個排名最高的輸出時,它 會得到獎勵以強化這種積極的結果。訓練過的模型生成輸出后,獎勵模 型計算獎勵,如果新輸出排名較高則模型策略會自動更新。

與傳統人工智能不同,生成式 AI 具有創造性能力。傳統的人工智能模 型建立在具有預測性的判別統計模型上,其側重于從現有數據中識別模 式。而生成式模型則可以基于一組底層數據輸入來生成新的數據實例。生成式人工智能從底層數據集生成、創建新內容,以文本、圖像、音頻、 視頻、代碼等形式生成原始想法,超越了傳統的模式檢測和扭曲數據分 析。生成式 AI 能夠打破人與機器之間的通信障礙,使得人類用自然語言 而不是編程語言與計算機進行通信。

Transformer架構已經成為神經網絡學習中最重要的架構之一。傳統上, 自然語言處理領域中使用的大多數模型都基于循環神經網絡(RNN), 這些模型存在計算復雜度高、難以并行計算等眾多局限性。而 Transformer 架構基于注意力機制,比傳統的 RNN 和 CNN 更快、更穩 定,并且具有更高的準確率,更容易并行化。該技術大大減少了訓練模 型的時間和對結構化數據集的依賴,提高了人工智能的自主學習能力。

生成式 AI 主要依賴于人工智能大模型,具有參數多、包含數據量大等 特點。這些模型通常包含數十億至數萬億個參數,需要龐大的數據集進 行訓練,根據《AIGC 發展報告 2023》數據,國外主要 AIGC 預訓練模 型參數規模在 6.4 億至 5400 億之間,平均參數量高達 1541 億。未來大 模型的訓練數據不僅限于文字,還可以包括圖像、視頻等多種形式。與 自然語言處理模型相比,多模態模型訓練數據為圖像、視頻等,規模遠大 于語言類模型,因此需要更多的計算資源和算力來支持模型的訓練和推 理。

4.2 算力芯片快速增長,GPU 占據 AI 芯片主流地位

算力需求激增,AI 應用發展仍需跨越當前算力鴻溝。根據 OpenAI 數據,2012-2018 年期間,人工智能訓練任務中使用的算力正呈指數級增長, 速度為每3.5個月翻一倍,人們對于算力的需求增長了超過300,000倍。相比之下,摩爾定律是每 18 個月翻倍,如果是以摩爾定律的速度,這 期間只會有 12 倍的增長。根據 IDC 數據,中國 AI 算力規模將保持高速 增長,預計到 2026 年將達 1271.4EFLOPS,CAGRA(2022-2026 年) 達 52.3%。

算力需求的快速增長與芯片計算能力的增長形成剪刀差,推動 AI 芯片 市場規模不斷發展。當前模型計算量的增長遠超人工智能硬件算力的增 長,二者性能增長之間的不匹配,剪刀差的擴大將帶來對算力基礎設施 供給需求的不斷增長,以及算力硬件供給需求的快速增長。根據 Gartner 數據,2025 年人工智能芯片市場規模將從 2020 年的 101 億美元增長至 726 億美元,CAGR(2020-2025)為 48.4%。

AI 芯片是 AI 算力的核心,需求有望率先擴張。AI 芯片是用于加速人工 智能訓練和推理任務的專用硬件,主要包括 GPU、FPGA、ASIC 等, 具有高度并行性和能夠實現低功耗高效計算的特點。CPU 是 AI 計算的 基礎,負責控制和協調所有的計算操作。在 AI 計算過程中,CPU 用于 讀取和準備數據,并將數據來傳輸到 GPU 等協處理器進行計算,最后 輸出計算結果,是整個計算過程的控制核心。根據 IDC 數據,CPU 在 基礎型、高性能型、推理型、訓練型服務器中成本占比分別為 32%、23.3%、 25%、9.8%,是各類服務器處理計算任務的基礎硬件。

GPU、FPGA、ASIC 是 AI 計算的核心,作為加速芯片處理大規模并行 計算。具體來看,GPU 通用性較強,適合大規模并行計算,且設計及制 造工藝較成熟,目前占據 AI 芯片市場的主要份額;FPGA 具有開發周期 短、上市速度快、可配臵性等特點,目前被大量應用于線上數據處理中 心和軍工單位;ASIC 根據特定需求進行設計,在性能、能效、成本均 極大的超越了標準芯片,非常適合 AI 計算場景,是當前大部分 AI 初創 公司開發的目標產品。

相比于少核心串行結構的 CPU,多核心的并行結構 GPU 更適合處理圖 形圖像(矩陣結構)信息。CPU 通常有 4 個、8 個或 16 個強力 ALU 核 心(arithmetic logic unit,算術邏輯單元),適合做復雜的通用串行任務。GPU 是圖形計算的重要元件,主要用來處理與圖形圖像相關的數據。與 CPU 不同的是,GPU 有數百甚至數千個簡單 ALU 核心,單個 ALU 處 理能力相比 CPU 的更弱,但能夠實現多個 ALU 并行計算,適合做簡單 特定的并行任務。因此,對于復雜的單個計算任務來說,CPU 的執行效 率更高,通用性更強;而對于圖形圖像這種矩陣式多像素點的簡單計算, 更適合用 GPU 來處理,但通用性較弱。

具有并行計算架構的 GPU 是 AI 算力的重要支撐,相較 CPU 在 AI 研究 和開發中具有更高的效率。21 世紀初期,研究人員意識到,由于機器學 習算法通常具有與圖形處理算法相同類型的計算,因此 GPU 可以為機 器學習提供基于 CPU 計算的更有效的替代方案。GPU 能夠提供卓越的 并行性能,由此可以有效加速 AI 計算,滿足不斷發展的算力需求。GPU 提供的計算效率不僅僅能夠簡化了分析過程,還能促進更廣泛的模型訓 練以獲得更高的準確性,擴大了模型搜索過程的范圍以防止替代規范, 使以前無法實現的某些模型變得可行,并允許對替代數據集增加額外的 敏感性以確保其穩健性。

GPU 在 AI 研究和開發中的重要性不斷增加。AI 芯片中,GPU 占據主 要市場規模。根據 IDC 數據,2022 年國內人工智能芯片市場中,GPU 芯片所占市場份額達 89.0%。GPU 作為市場上 Al 計算最成熟、應用最 廣泛的通用型芯片,應用潛力較大,其并行計算架構相較于其他 AI 芯片 更加適合于復雜數學計算場景,支持高度并行的工作負載。

英偉達是全球領先的 GPU 和 AI 芯片制造商之一。在國內 GPU 市場, 英偉達占據了主要份額。IDC 數據顯示,2020 年英偉達在國內 GPU 服 務器市場幾乎占據 95%左右的市場份額。通過研究英偉達的發展路徑和 戰略,能夠幫助國內企業更好地了解 GPU 的應用和未來趨勢,為國內 企業提供寶貴的借鑒和啟示。

4.3 AI 芯片領域,***迅速崛起

全球GPU芯片市場主要由海外廠商占據壟斷地位,國產廠商加速布局。全球 GPU 市場被英偉達、英特爾和 AMD 三強壟斷,英偉達憑借其自身 CUDA 生態在 AI 及高性能計算占據絕對主導地位;國內市場中,景嘉微 在圖形渲染 GPU 領域持續深耕,另外天數智芯、壁仞科技、登臨科技 等一批主打 AI 及高性能計算的 GPGPU 初創企業正加速涌入。

圖形渲染 GPU:目前國內廠商在圖形渲染 GPU 方面與國外龍頭廠商差距不斷縮小。芯動科技的“風華 2 號”GPU 采用 5nm 工藝制程,與 Nvidia 最新一代產品 RTX40 系列持平,實現國產圖形渲染 GPU 破局。景嘉微 在工藝制程、核心頻率、浮點性能等方面雖落后于 Nvidia 同代產品,但 差距正逐漸縮小。

ASIC 不同于 CPU、GPU、FPGA,目前全球 ASIC 市場并未形成明顯 的頭部廠商,國產廠商快速發展;通過產品對比發現,目前國產廠商集 中采用 7nm 工藝制程,與國外 ASIC 廠商相同;算力方面,海思的昇騰 910 在 BF16 浮點算力和 INT8 定點算力方面超越 Googel 最新一代產品 TPUv4,遂原科技和寒武紀的產品在整體性能上也與 Googel 比肩。未 來國產廠商有望在 ASIC 領域繼續保持技術優勢,突破國外廠商在 AI 芯 片的壟斷格局。

4.4 國產算力公司梳理

龍芯中科:國產 CPU 設計標桿,自主研發 GPGPU

公司主要從事處理器(CPU)及配套芯片的研制、銷售及服務。主要產 品包括龍芯 1 號、龍芯 2 號、龍芯 3 號三大系列處理器芯片及橋片 等配套芯片,系列產品在電子政務、能源、交通、金融、電信、教育等 行業領域已獲得廣泛運用。

龍芯成功構建獨立信息技術體系的 CPU,不斷推出基于 LoongArch 架 構的芯片。龍芯基于自主指令系統,決心構建獨立于 Wintel 和 AA 體系 的開放信息技術體系的 CPU。龍芯技術上的持續積累使其成功地建立了 自己的指令系統架構 LoongArch。在 2021 年和 2022 年,公司相繼推出 了多款基于 LA 架構的芯片產品,目前已經擁有 9 顆基于 LA 架構的芯片 產品。

海光信息:國產高端處理器龍頭,CPU+DCU 雙輪驅動

公司主營產品包括海光通用處理器(CPU)和海光協處理器(DCU)。海光 CPU 主要面向復雜邏輯計算、多任務調度等通用處理器應用場景 需求,兼容國際主流 x86 處理器架構和技術路線。從應用場景看,海 光 CPU 分為 7000、5000、3000 三個系列,分別定位于高端服務器、 中低端服務器和邊緣計算服務器。海光 DCU 是公司基于 GPGPU 架構 設計的一款協處理器,目前以 8000 系列為主,面向服務器集群或數據 中心。海光 DCU 全面兼容 ROCm GPU 計算生態,能夠較好地適配國 際主流商業計算軟件,解決了產品推廣過程中的軟件生態兼容性問題。

CPU 與 DPU 持續迭代,性能比肩國際主流廠商。CPU 方面,目前海光 一號和海光二號已經實現量產,海光三號已經正式發布,海光四號目前 進入研發階段。海光 CPU 的性能在國內處于領先地位,但與國際廠商 在高端產品性能上有所差距,接近 Intel 中端產品水平;DCU 方面,深 算一號已實現商業化應用,深算二號已于 2020 年 1 月啟動研發。在典 型應用場景下,公司深算一號指標達到國際上同類型高端產品的水平。

寒武紀:國產 AI 芯片領先者

寒武紀是 AI 芯片領域的獨角獸。公司成立于 2016 年 3 月 15 日, 專注于人工智能芯片產品的研發與技術創新,產品廣泛應用于消費電子、 數據中心、云計算等諸多場景。公司是 AI 芯片領域的獨角獸:采用公 司終端智能處理器 IP 的終端設備已出貨過億臺;云端智能芯片及加速 卡也已應用到國內主流服務器廠商的產品中,并已實現量產出貨;邊緣 智能芯片及加速卡的發布標志著公司已形成全面覆蓋云端、邊緣端和終 端場景的系列化智能芯片產品布局。

人工智能的各類應用場景,從云端溢出到邊緣端,或下沉到終端,都離 不開智能芯片的高效支撐。公司面向云端、邊緣端、終端推出了三個系 列不同品類的通用型智能芯片與處理器產品,分別為終端智能處理器 IP、 云端智能芯片及加速卡、邊緣智能芯片及加速卡。

復旦微電:國內 FPGA 領軍企業,多元化產品打開增長空間

24 年潛心鉆研,高端芯片國產化的開創性先鋒。公司成立兩年后就成為 國內首家上市的 IC 設計公司,二十余年發展過程中又陸續成為首家獲得 IC 制造商的國際注冊代碼,推出國內首個非接觸卡等產品,打破國外廠 商壟斷并在諸多領域取得突破。目前,復旦微的 RFID 芯片、智能卡芯 片、EEPROM、智能電表 MCU 等多類產品市占率都位列前茅。此外, 復旦微推出的億門級 FPGA 產品已實現供貨,填補了國產高端 FPGA 的 空白,具有取代進口 FPGA 產品的巨大潛力。

復旦微電產品應用廣泛,獲得業內認可。作為國內頂尖的集成電路設計 企業,公司以二十多年的深厚積淀構建了多元化的產品線。其 RFID 芯 片、智能卡芯片、EEPROM 以及智能電表 MCU 等多種產品在市場上享 有領先地位,獲得了三星、LG、VIVO 等海內外知名廠商的高度認可。

FPGA 芯片國內技術領軍者,國產替代種子選手。復旦微在國內 FPGA 領域處于領先地位,目前可提供千萬門級、億門級 FPGA 芯片以及嵌入 式可編程芯片等系列產品。研發方面,當前一方面基于 14/16nm 工藝制 程開發 10 億門級產品,另一方面豐富 28nm 制程的 FPGA 及 PSoC 芯 片種類,繼續保持在國產 FPGA 技術的領先地位。

安路科技:民用 FPGA 領先廠商,國產替代正當時

安路科技是國內領先的 FPGA 芯片設計企業。安路科技成立于 2011 年, 自成立至今,公司一直專注于 FPGA 芯片設計領域,通過多年的技術累 積,公司在 FPGA 芯片設計技術、SoC 系統集成技術、FPGA 專用 EDA 軟 件技術、FPGA 芯片測試技術和 FPGA 應用解決方案等領域均有技術突破。公司主要專注于 FPGA 芯片和專用 EDA 軟件的研發、設計和銷售。產品的 主要下游應用領域主要包括工業控制網絡通信、消費電子和數據中心 等。

公司主要向客戶提供 FPGA 產品,包括 FPGA 芯片和專用 EDA 軟件兩部 分。基于目前的核心技術體系,公司成功構建了由 ELF 系列、EAGLE 系 列和 PHOENIX 系列 FPGA 芯片和 TangDynasty 系列專用 EDA 軟件組成的 產品矩陣,2021 年,公司 FPSoC 產品新增了面向工業和視頻接口的低功 耗 SWIFT 系列。公司產品覆蓋 28nm-55nm 的工藝制程,形成了多種邏輯 規模 FPGA 芯片和軟件的全產品線覆蓋,并持續致力于高容量、高性能的 FPGA 和 FPSoC 芯片的研發與拓展。公司目前已成為國內領先的 FPGA 芯 片供應商,產品已廣泛應用于工業控制、網絡通信、數據中心、消費電 子等產業中。

布局卡位打造軟硬件生態體系行業壁壘較高,公司未來成長邏輯清晰。公司立足于中低端 CPLD 產品起步,產品從幾十、幾百 K 的高性價比產 品到目前 400K 的中高端產品全覆蓋,客戶積累深厚。公司采用軟硬件 協同模式,軟件配套構建良好生態,其自主開發的 FPGA 專用 EDA 軟 件擁有較高技術水平,是國內目前擁有最多客戶的國產 EDA 廠商,可以 立足于廣大的客戶群體,不斷反饋完善自身軟件和配套的生態體系,打 造自身軟硬件護城河。正是因為 FPGA 芯片行業需要廠商同時具備較高 的硬件芯片設計能力以及軟件開發能力,行業進入壁壘較高。公司作為 目前國產 FPGA 芯片行業的領先廠商,立足 FPGA 行業快速增長,擁有 廣闊國產替代空間,提前布局卡位未來競爭優勢明顯,稀缺性成長性兼 備,伴隨中高端產品放量,未來成長邏輯清晰。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31429

    瀏覽量

    269832
  • 英偉達
    +關注

    關注

    22

    文章

    3833

    瀏覽量

    91652
  • 算力芯片
    +關注

    關注

    0

    文章

    47

    瀏覽量

    4554

原文標題:解析英偉達成長的核心戰略:研發為底、生態為徑、AI為翼

文章出處:【微信號:AIOT大數據,微信公眾號:AIOT大數據】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    smart與元戎啟行達成戰略合作 布局智能駕駛AI大模型

    “含AI量”夠不夠?已經成為2025年消費者衡量汽車是否值得購買的重要標準。 ? 近日,smart與人工智能企業元戎啟行宣布達成戰略合作,率先搶跑AI賽道,
    發表于 01-17 09:26 ?151次閱讀
    smart與元戎啟行<b class='flag-5'>達成</b><b class='flag-5'>戰略</b>合作 布局智能駕駛<b class='flag-5'>AI</b>大模型

    美銀分析師:英偉達加大“物理AI”投入明智之舉

    近日,美國銀行的分析師對英偉達在“物理AI”領域的最新動向發表了評論。分析師指出,英偉達決定加大對“物理AI”的投入,是其在人工智能領域發展的合乎邏輯的下一步舉措。 “物理
    的頭像 發表于 01-08 10:51 ?194次閱讀

    雷鳥創新與阿里云達成戰略合作,引領 AI大模型與AR眼鏡融合新紀元

    大模型與AI眼鏡硬件廠商開展的深度定制合作,阿里云通義系列大模型將為雷鳥創新的AI眼鏡提供全套AI技術和產品支持。這也是阿里云在AI眼鏡領域的首個
    發表于 01-03 13:45 ?106次閱讀
    雷鳥創新與阿里云<b class='flag-5'>達成</b><b class='flag-5'>戰略</b>合作,引領 <b class='flag-5'>AI</b>大模型與AR眼鏡融合新紀元

    安謀科技與智源研究院達成戰略合作,共建開源AI“芯”生態

    12月25日,安謀科技(中國)有限公司(以下簡稱“安謀科技”)與北京智源人工智能研究院(以下簡稱“智源研究院”)正式簽署戰略合作協議,雙方將面向多元AI芯片領域開展算子庫優化與適配、編譯器與工具鏈
    發表于 12-26 17:06 ?184次閱讀
    安謀科技與智源研究院<b class='flag-5'>達成</b><b class='flag-5'>戰略</b>合作,共建開源<b class='flag-5'>AI</b>“芯”<b class='flag-5'>生態</b>

    支付寶與華為終端達成戰略合作

    近日,支付寶與華為終端正式宣布達成戰略合作,共同致力于鴻蒙生態與碰一下生態的深度融合與發展。
    的頭像 發表于 11-11 14:46 ?389次閱讀

    英偉達年度研發支出超120億美元,AMD的兩倍之多

    研發費用被視為預示未來收入增長的關鍵高質量指標之一,而英偉達(NVIDIA)因其不斷上調的未來季度營收預期,在研發領域的領先地位超越包括AMD在內的競爭對手,實屬意料之中。   在截至7月
    的頭像 發表于 10-15 15:53 ?676次閱讀

    vivo發布藍心智能AI戰略

    在2024年的vivo開發者大會上,vivo隆重推出了全新的AI戰略——“藍心智能”。該戰略核心是利用AI技術重構系統體驗,
    的頭像 發表于 10-10 16:57 ?443次閱讀

    安全獲數千萬元深創投獨家投資

    網絡安全領域再添融資喜訊,萬安全近日宣布完成數千萬元新一輪增資,由深創投獨家投資。自2013年成立以來,萬安全作為網絡安全行業的佼佼者,始終秉持“AI+YAK”
    的頭像 發表于 09-27 11:49 ?416次閱讀

    英偉達與阿聯酋G42合作開發天氣預測AI模型

    英偉達近期宣布與阿聯酋的領先AI應用開發企業G42達成戰略合作,共同探索天氣預測技術的新前沿。雙方將整合各自的技術優勢,依托英偉達的Eart
    的頭像 發表于 09-24 15:41 ?304次閱讀

    英偉達擬收購軟件初創公司Shoreline,強化AI軟件生態

    近日,據知情人士透露,全球領先的圖形處理器制造商英偉達已達成協議,將收購面向軟件開發人員的初創公司Shoreline.io。這次收購對Shoreline的估值達到了約1億美元,標志著英偉達在A
    的頭像 發表于 06-19 14:34 ?718次閱讀

    非夕科技與西門子達成戰略合作協議,正式加入西門子Xcelerator生態

    近日,Flexiv非夕科技與西門子達成戰略合作協議,正式加入西門子 Xcelerator 生態,雙方將聯合打造面向多行業的自適應機器人應用解決方案。
    的頭像 發表于 05-24 14:49 ?825次閱讀

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    能,加速模型的訓練和推理過程。 2. 生成式 AI 解決方案 與英偉達 Grace CPU、新一代網絡芯片等產品一起,面向生成式 AI 共同組成完整解決方案,數據中心提供強大的計算能
    發表于 05-13 17:16

    越南FPT與英偉達成AI全面戰略合作,投資2億美元興建AI工廠

    根據聲明,FPT將借助英偉達技術推動AI研發,并為越南及全球客戶提供相關服務;而英偉達則助力FPT深度挖掘AI在汽車以及數字化轉型領域的價值
    的頭像 發表于 04-23 16:39 ?655次閱讀

    OPPO發布1+N智能體生態戰略

    OPPO近日在全球科技界掀起了波瀾,正式發布了其獨特的1+N智能體生態戰略,標志著這家科技巨頭在人工智能領域的全新布局。該戰略核心在于兩大組件:A
    的頭像 發表于 02-21 10:36 ?762次閱讀

    德睿智藥與復宏漢霖達成戰略合作,共同研發AI賦能的ADC藥物和抗衰老療法平臺

    2024年1月19日,臨床階段AI驅動的創新藥物研發公司德睿智藥宣布與上海復宏漢霖生物技術股份有限公司(以下簡稱“復宏漢霖”)達成戰略合作,共同研發
    的頭像 發表于 01-26 18:14 ?2505次閱讀
    主站蜘蛛池模板: 国产精品午夜国产小视频| 四虎免费在线播放| 日本黄色大片在线观看| 美女扒开尿囗给男生桶爽| 午夜视频免费观看黄| 天天操天天干天天操| freesexvideo性欧美医生护士| 噜噜噜色噜噜噜久久| 手机天堂网| 日日噜噜夜夜狠狠va视频| 亚洲国产成人久久三区| 老师解胸罩喂我吃奶| 黄色视奸| 午夜撸| brazzersvideosexhd欧美高清| 久久青草国产精品一区| 欧美一级三级在线观看| 色久优优 欧美色久优优| 五月综合激情久久婷婷| 亚洲综合丁香婷婷六月香| 美女露出扒开尿口让男人桶| 正在播放91大神调教偷偷| 亚洲美女视频一区| 黄色在线观看视频网站| 亚洲免费区| 亚洲线精品一区二区三区| 欧美人成一本免费观看视频| 亚洲一区欧美一区| 中文字幕亚洲一区二区三区| 欧美色啪| 91夫妻视频| 91网站在线播放| 九九热re| 视频在线你懂的| 久久本道综合色狠狠五月| 久久国产精品夜色| 一级毛片在线播放| 天天在线免费视频| 日日操天天射| 免费成人黄色| 福利在线看|