春節之后,ChatGPT這個名字在國內聲名鵲起,它能夠與用戶進行流暢、自然、有趣的對話,展示了人工智能在自然語言處理領域的巨大進步。
“AI的‘iPhone時刻’已經到來”,全球最大的AI芯片制造商之一英偉達CEO在3月21日的GTC大會上這樣說到,“各行各業正在應對可持續發展、生成式AI和數字化等強大的動態挑戰,因此加速計算和AI的到來恰逢其時。”
為支撐OpenAI訓練出ChatGPT,微軟打造了一臺由數萬個A100 GPU組成的AI超級計算機,此外,還有60多個數據中心、幾十萬張GPU支持ChatGPT的推理工作,預計GPT-4模型的商業化將需要超過3萬枚A100芯片。可以說AI算力芯片是人工智能大模型的發動機,也是人工智能產業發展的重要基礎。
01AI算力芯片是何方神圣?AI算力芯片,也被稱為AI加速器或計算卡,即專門用于處理人工智能應用中的大量計算任務的模塊。從廣義范疇上講,面向AI計算應用并提供算力的芯片都被稱作AI算力芯片,可滿足AI算法的復雜度和多樣性需求,具有高性能、低功耗、低延遲、高并行度等特點。其主要包括基于傳統芯片架構的中央處理器(CPU)、圖形處理器(GPU)、現場可編程門陣列(FPGA)和專用集成電路(ASIC),以及前沿的神經擬態芯片、類腦芯片、可重構通用AI芯片等,在云計算、數據中心、邊緣計算、物聯網、智能手機、智能汽車等領域具有廣泛的應用場景。
GPU成AI算力芯片霸主
當前主流的AI算力芯片有GPU、FPGA和ASIC芯片,其中,GPU作為目前應用最廣的AI芯片,是GPT訓練模型中精度最高和算力最快的AI芯片,主要采用并行計算處理技術,堪稱AI時代的算力核心。隨著人工智能訓練與推理需求的增加,還應運而生了通用圖形處理單元(GPGPU)——它可利用GPU的大量核心和高帶寬內存,實現高度并行的數據處理,顯著提高計算效率和性能;也可利用GPU的專用硬件,如紋理單元、著色器等,實現特定功能的加速,解決傳統CPU難以處理的問題,如科學計算、機器學習、圖像處理等。四類主要AI算力芯片的比較
訓練與推理,從云到端的混合部署
根據機器學習算法步驟,人工智能有訓練(training)和推理(inference)兩個重要環節:
訓練是指通過大量的標注數據來構建和優化一個復雜得神經網絡模型,其能夠適應特定的功能,如圖像識別、語音識別、自然語言處理等。
推理是指利用訓練好的模型,使用新數據推理出各種結論,如識別圖像中的物體、轉換語音為文本、生成自然語言回答等。
訓練需要大量的數據和計算資源,以及一定的通用性,以便完成各種各樣的學習任務;通常在云端或服務器上進行,需要高性能、高帶寬、高精度的AI算力芯片。
推理需要快速將推理結果轉化為行動,以及考慮單位能耗算力、時延、成本等綜合指標。推理可以在云端或終端進行,需要低功耗、低延遲、低成本的AI算力芯片。
訓練與推理AI算力芯片的比較結合實際應用場景,根據芯片部署的位置,AI算力芯片又可分為云端訓練、云端推理、邊緣計算和終端四大類:
云端訓練AI算力芯片用于構建和優化深度神經網絡模型,具備高吞吐量、高精確率、可編程性、分布式、可擴展性、高內存與帶寬等特點;
云端推理AI算力芯片用于利用訓練好的神經網絡模型進行預測和分析,對擴展性和帶寬的要求較低,但具有低延時特點;
邊緣計算AI算力芯片是在邊緣設備上進行深度學習模型推理,實現模型的離線運行和本地處理的芯片,具有輕量化和可擴展特點;
終端AI算力芯片是實現模型的輕量化和優化,對數據進行本地處理和分析的芯片,可實現數據收集、環境感知、人機交互等功能,具有低功耗和協同性特點。
02
信息時代躍入智能時代?
人工智能是數據、算法、算力的有機整合,正在從單一的技術工具演變為行業必不可少的生態系統,幫助人們解決復雜問題,改變人的生活和溝通方式。AI算力芯片作為底層算力設施的關鍵一環,在提高算法的運行速度和效率,降低成本和功耗等方面發揮舉足輕重的作用。可以說,AI算力芯片是人工智能發展的基石,有望促進人工智能應用場景落地和萬億級數字經濟產業變革,驅動智能化時代加速到來。在數字化轉型、AIGC等浪潮下,AI算力芯片市場需求猛增。據TrendForce預測,2025年全球AI算力芯片市場規模有望達740億美元;而據IDC數據,到2025年GPU仍將占據AI算力芯片80%的市場份額。可以預見,GPU在較長期時間內,依然是全球AI算力芯片廠商的角斗場。
美國占據全球AI算力芯片市場絕對優勢
據Mordor Intelligence報告,目前,美國AI算力芯片市場主要玩家有英偉達、英特爾、AMD,分為GPU和FPGA兩大陣營。英偉達在GPU市場一家獨大,市場份額高達90%,在訓練和推理芯片領域遙遙領先其它廠商;英特爾與AMD則在CPU市場持續占據統治地位,雙方各自收購了FPGA巨頭Altera與Xilinx,旨在進入數據中心與嵌入式市場進行互博。
英偉達——AI算力芯片領跑者
英偉達作為全球領先的芯片廠商,其GPU產品線豐富、產品性能頂尖、開發生態成熟,已經成為AI算力芯片的生態構建者和領跑者。其主流AI芯片分為四大類:面向數據中心的AI訓練和推理芯片,如A100和H100;面向云端工作負載的AI推理芯片,如T4;面向邊緣設備的AI加速芯片,如不同級別的Jetson系列SOC;面向專業圖形和虛擬現實的AI芯片,如Quadro系列芯片等。其中,面向數據中心的AI訓練和推理芯片最為行業所關注:
英偉達A100與H100產品簡介
據英偉達公開數據表明,對于當今的主流AI和HPC機型,配備InfiniBand interconnect的H100的性能是A100的30倍。英偉達A100與H100產品性能對比
AI算力芯片自主可控任重道遠
據IDC報告,CPU+GPU的產品組合占中國AI服務器市場的91.9%,國內AI行業對GPU依賴性極高。
隨著美國《2022芯片與科學法案》的出臺以及針對中企進一步擴充“實體清單”名錄等措施的落地,英偉達和AMD高端AI算力芯片被全面禁售給中國,敲響了高端AI算力芯片國產自主可控的警鐘。但受限于工藝制程、EDA、IP核等技術封鎖,國內AI芯片廠商的自主研制水平與國際一流水平還存在較大差距:
芯片制程工藝方面,全球3nm量產能力被三星和臺積電兩家企業壟斷,英特爾與臺積電在美工廠預計明年將實現4nm量產,而中國大陸目前還不具備4nm與7nm的制程工藝,由于臺積電被限制技術轉移,其只能在大陸投資落地28nm制程的生產線,大陸與世界領先水平整體差距在5-6年。
高端AI算力芯片方面,由于英偉達的A100與H100芯片向中國禁售,當前能獲得的最佳替代品是專供中國市場的A800芯片(A100“閹割版”),但其整體通信的帶寬性能僅為A100的70%,數據傳輸速度受限、功耗更大,且市場高度緊缺。
英偉達數據中心芯片售價情況哪里有差距,哪里就有追趕,具有高校、科研機構與國內外知名AI芯片廠商創始團隊背景的中國AI芯片企業正加速涌現,國產AI算力芯片產品也不斷實現創新突破。例如:寒武紀思元590在中國首發的大語言模型文心一言中已有小規模部署;海光信息深算1號的效能與NVIDIA P100相當,可運行AI大模型,蘇州、成都等多地超算中心均搭載其CPU與DCU。放眼未來,沐曦計劃于今年6月發布其GPU產品C100,公布的性能指標接近NVIDIA H100的水平;壁仞科技的BR100性能指標也對應NVIDIA H100,雖然其收到美國商務部打壓需要重新設計產品,但其產品仍讓人有所期待。
國產AI算力芯片公司主要產品對比
03新一線算力第一城成都AI算力芯片發展水平幾何?
國家信息中心提出未來80%的場景都將基于人工智能,所占據的算力資源將主要由智算中心提供。繼2020年成都超算中心落地后,2022年成都智算中心也成功投入使用,提供300P并在未來達到1000P的算力規模,成都成為全國除上海外僅有的投運超算和智算雙中心的城市,也是全國首個專門出臺算力產業專項政策的城市。
雙中心可以近乎實時地存儲、檢索、處理和分析海量數據,提供業務性能授權單元支持,提供數據智能處理、AI模型快速開發部署等能力,同時提供高可靠的資源管理、用戶管理、AI集群設備的運維和監控服務,成為本地乃至全國AI算力芯片產業發展的重要基地和動力引擎,推動中國AI算力芯片走向全球領先地位。雙中心為AI算力芯片帶來的發展機遇:
為AI算力芯片的研發、測試、驗證、優化等提供強大的計算支撐和數據服務,加速AI算力芯片的創新和突破;
為AI算力芯片的應用場景和需求提供豐富的案例和數據,推動AI算力芯片的產業化和商業化;
邊緣計算AI算力芯片是在邊緣設備上進行深度學習模型推理,實現模型的離線運行和本地處理的芯片,具有輕量化和可擴展特點;
為AI算力芯片的人才培養和交流提供平臺和機會,促進AI算力芯片產業的人才聚集和創新氛圍。
AI產業生態基礎良好
成都作為西部新一線領跑城市,2019年以來積極布局人工智能產業,形成了一批具有自主創新能力和市場競爭力的企業和團隊。據統計,截至2022年9月,全市人工智能產業規模達469.2億元,較2020年增長147%,核心產業規模位列全國第五,已基本形成完整的人工智能產業生態,覆蓋基礎層、技術層、應用層全產業鏈,特別是AI芯片、智能傳感、數據和計算服務智能機器人等十大細分領域優勢突出。成都人工智能企業數量及產業價值鏈分布
其中,高新區擁有完整的電子信息產業鏈,集聚了全市75%的成長型人工智能核心企業。高新區在近日還發布了《成都高新區集成電路建圈強鏈三年攻堅計劃(2023-2025)》,提出以模擬芯片為核心,以算力芯片、存儲芯片及功率器件為重點,構建規模大、技術強、要素全的集成電路全產業鏈,加快“中國存儲谷”建設,電子信息萬億級產業集群加快成型成勢,本地算力芯片迎來新的發展機遇期。
AI算力芯片加速萌芽
據統計,2021年成都芯片產業總規模達1464億元,同比增長20%,匯集英特爾、德州儀器、華為海思、成都海光、雷電微力、海威華芯等上下游企業200余家。其中,AI芯片產業規模約為184億元(2020年),代表性企業有中科創達、啟英泰倫、華天科技、北信源等,覆蓋人工智能芯片設計、制造、封裝、測試等全環節,囊括CPU、GPU、FPGA、ASIC等多種技術架構和云端、邊緣、終端等多種應用場景。
啟英泰倫,成都高新區瞪羚企業、省級專精特新中小企業、成都市新經濟百家重點培育企業,成立于2015年,是集語音芯片、語音算法、應用方案、開發平臺于一體的行業領導型語音解決方案供應商。成立至今,啟英泰倫已推出多款智能語音芯片,涵蓋離線語音芯片,語音AIoT芯片,語音藍牙芯片,其中CI1006芯片被認定為國內首創,CI110X系列芯片被認定為國際先進。公司芯片產品現已廣泛應用于智慧家居家電、智慧養老、智慧穿戴、智慧醫療、智慧酒店、智慧安防、智慧教育、智慧汽車和機器人等領域,服務客戶超過1000家。
SynSense時識科技成立于2017年,是一家起源于瑞士的類腦智能與應用解決方案提供商,公司秉承了蘇黎世大學和蘇黎世聯邦理工學院20+年的類腦技術研發成果,專注于類腦智能的研究與開發,聚焦邊緣計算應用場景,提供超低功耗、超低延時的全棧式類腦智能解決方案與服務,曾獲評“全球唯一橫跨感知與計算兩界的類腦科技公司”“全球最值得關注的100家半導體新創公司”“麻省理工科技評論50家聰明公司”。公司開發了多款低功耗、高性能、架構創新的類腦芯片產品,擁有全球首款“感算一體”動態視覺智能SoC Speck、XYLO 類腦處理器、DYNAP-CNN神經形態處理器及完整工具鏈,可運用于智能家居人機交互、機器人、自動駕駛、可穿戴設備、智能安防、物聯網等。
04
打破技術壁壘未來可期
雖然國內寒武紀、百度、燧原、華為等一眾企業的技術水平及產品性能都落后于英偉達一代或兩代,但AI算力芯片作為數字中國的算力基礎,國產突破勢在必行。面對摩爾定律邊際效用遞減的困境,ASIC芯片的弱通用性難以應對下游算法的快速演化,GPGPU又難解高功耗與低算力利用率問題,業界正翹首以盼新架構、新工藝、新材料、新封裝,以進一步突破算力天花板。誰能率先填補大模型算力需求的缺口,誰就有機會搶占新一輪AI芯片搶位賽的前排。
其關鍵在于探尋“彎道超車”路徑,特別是存算一體、超異構、Chiplet(芯粒)、3D封裝等新興技術路線的提出,跳出了馮·諾依曼架構體系,理論上擁有高能效比優勢,兼顧更強通用性與更高性價比,算力發展空間巨大,有望彌補中國企業與英偉達在硬件技術和軟件生態方面的差距,擺脫國內對先進制程技術的依賴。例如:存算一體芯片對工藝要求較低,在28nm工藝上實現的算力和能效就能比肩甚至超過傳統架構芯片在7nm工藝上的表現。
從超異構來看,國內CPU有廣受歡迎的開源RISC-V架構,GPGPU有新興的開源架構“青花瓷”平臺,存算一體也有億鑄科技等廠商在大力投入研發。隨著工藝不斷迭代,國內企業“超車”速度會越來越快,優勢會越來越明顯。
突破技術瓶頸并非一日之事,必須腳踏實地,加大資源持續投入,有耐心有定力,久久為功,才能踏上發展的“快車道”;我們希望有更多的本土企業走到換道前行的賽道上,為破解國內AI大算力困局探尋屬于中國AI芯片產業的發展道路。
文章參考來源
·AI CHIPSETS MARKET - GROWTH, TRENDS, COVID-19 IMPACT, AND FORECASTS (2023 - 2028) —— Mordor Intelligence
·GLOBAL AI CHIPSETS MARKET (2022 - 2027) ——Mordorintelligence
·2022中國人工智能芯片 行業研究報告 ——億歐智庫
·UNITED STATES,SECURITIES AND EXCHANGE COMMISSION, WASHINGTON, DC 20549
·全球人工智能支出指南 ——IDC
·ChatGPT 系列報告:算力“軍備競賽” ——民生證券
·40張圖表解析中國“芯”勢力:2021年中國AI芯片發展簡報及典型廠商案例——甲子光年
·GTC 2023 主題演講——NVIDIA
·2022年成都市人工智能行業產業鏈現狀及發展前景分析——前瞻產業研究院
·邁向巔峰之路——中國成長型AI企業研究報告——英特爾,德勤,深圳市人工智能行業協會
·2018 人工智能芯片研究報告——清華-中國工程院知識智能聯合實驗室
·把GPT時代引擎拉滿,國產AI大算力芯片換道狂飆——智東西
-
芯片
+關注
關注
456文章
50937瀏覽量
424685 -
AI
+關注
關注
87文章
31101瀏覽量
269435
發布評論請先 登錄
相關推薦
評論