“數字時代的關鍵資源是數據、算力和算法,其中數據是新生產資料,算力是新生產力,算法是新生產關系,三者構成數字經濟時代最基本的生產基石。”
2021年9月,中國信息通信研究院發布的《中國算力發展指數白皮書》中,用上述結論強調了算力在數字經濟時代的基礎性作用。今年2月,多部委聯合印發通知,同意在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群,這標志著全國一體化大數據中心體系——“東數西算”工程正式全面啟動。
這項被稱為數字經濟時代的“南水北調”“西電東送”“西氣東輸”的重大工程受到全社會高度關注。而在熱點背后,當上千億參數的超大規模深度學習模型成為現實,指引整個人工智能產業尋找一條新的可行之路,縮短我們與通用智能的距離之時,海量數據所引發的超大算力需求,導致了目前的一個客觀現狀:算力的發展始終未能跟上算法的發展,這對芯片半導體領域提出了新的挑戰。
怎樣實現“既能低功耗、又能高精度、還能大算力”,已成為“后摩爾時代”全球數字經濟體可持續發展的基礎與核心。
實際上,當大洋彼岸的美國對我國芯片半導體產業一步步封鎖,通過不斷干預中國購買光刻機、組建“芯片聯盟”阻礙中國發展先進半導體產業以來,我國就在為擺脫芯片受制于人的局面大力推動產業創新。先是8月9日美國通過《2022年芯片和科學法案》,接著是8月31日,芯片巨頭英偉達和AMD均接到美國政府的要求,被限制向中國出口最新旗艦GPU計算芯片及板卡,一批擁有國產自主研發能力的半導體企業主動或被動地走入了大眾視野。
創立于2020年,以存算一體AI大算力芯片技術作為突破口的億鑄科技便是其中之一,作為國內首家研發基于ReRAM(RRAM)全數字存算一體AI大算力芯片的企業,在摩爾定律逼近物理極限的情況下,億鑄科技嘗試通過架構創新突破馮·諾伊曼瓶頸,成為中國AI芯片創業大軍中的革新者,也為解決國內AI算力尤其是大算力的困局提供了新的方向。
超越“摩爾時代”,億鑄聚焦存算一體架構的AI大算力芯片
早在1992年,中國工程院院士許居衍就預測,到2014年后,半導體產業將會遇到拐點,并進入“后摩爾時代”。
這種預測的根據在于,在傳統的馮·諾依曼計算系統采用存儲和運算分離的架構下,80%-90%的功耗發生在數據傳輸上,99%的時間消耗在存儲器讀寫過程中,真正用于計算的能耗和時間占比很低,于是造成“能耗墻”和“存儲墻”的出現。而存算分離的架構非常容易導致數據搬運過程中發生擁塞,尤其是在動態環境下,對數據進行調度和管理其實非常復雜,導致編譯器無法在靜態可預測的情況下對算子、函數、程序或者網絡做整體的優化,只能手動、一個個或者一層層對程序進行優化,包括層與層之間的適配,耗費了大量時間,于是出現了“編譯墻”。
在“三堵墻”的限制下,采用馮·諾依曼架構的計算系統將嚴重制約人工智能領域的算力和能效提升。以智能汽車領域為例,十年前,汽車的算力還不足1TOPS,而未來,為滿足L5級別的無人駕駛技術,汽車需要達到4000TOPS的算力水平才有可能實現,到那時若仍以傳統的馮·諾依曼架構研發芯片,其功耗將非常夸張。
為解決這一問題,科學家就必須要翻越這“三堵墻”。實際上,早在1969年,斯坦福大學研究員Kautz等人就提出過存算一體計算機的概念,但在當時,一方面受限于芯片設計復雜度與制造成本問題,另一方面由于缺少大數據應用驅動,這些存算一體概念僅停留在研究階段,并未獲得實際應用。直到近年來,伴隨GPT-3、“悟道”等人工智能大模型的問世,海量數據所引發了超大算力需求和高能效比的矛盾而開始受到重視,業界逐漸形成一個共識——存算一體架構可能是現階段基于CMOS工藝能同時滿足大算力、高精度、高能效比的最有效途徑。
全球范圍內,再度興起了對存算一體的產業研究,海外巨頭諸如英特爾、三星、IBM、東芝、SK海力士等都在進行相關領域的布局和產品研發。在億鑄科技首席技術官Debu看來,由于存儲器件以及配套工藝發展等原因,此前的存算一體芯片多基于Flash通過模擬計算的方式實現,后來出現了基于SRAM的存算一體技術。這些技術無疑為存算一體架構和生態發展做出了很大的貢獻,他們不僅向業界證明了存算一體技術的可實現性以及價值,同時也為存算一體生態的建設做了很多基建工作。
但要注意到,既有的存算一體技術仍然主要聚集于小算力、低精度的場景,并未能將存算一體高能效比的優勢應用于大算力比如云計算、自動駕駛等領域。因此,億鑄的技術價值在于“將存算一體架構切實向大算力、高精度、高能效比的方向推進和落地,實現這一存算一體架構里程碑式的發展節點”。
億鑄科技創始人、董事長兼CEO熊大鵬博士表示:“億鑄科技以全數字化的方式將ReRAM 應用于存算一體AI大算力芯片,這么做的優勢在于:一, ?存算一體架構可以打破傳統馮·諾依曼架構下的存算墻、能耗墻和編譯墻;二,?存儲介質ReRAM在算力潛能、算力精度和算力效率等主要指標上有著數量級優勢,是目前最適合做存算一體AI大算力芯片的憶阻器;三,全數字化的技術路徑在滿足大算力的同時還能做到支持高精度,使得存算一體架構真正在AI大算力方向落地。因此,億鑄科技能夠為業界帶來大算力、超能效比、低功耗、易部署的AI推理計算解決方案。”
他強調,ReRAM這一新型憶阻器具有非易失性、面積小、密度高、成本低、功耗低、讀寫速度快等一系列優點,隨著ReRAM的產業配套逐步完善和成熟,該技術無疑已經到了“商業應用爆發前夜”。此外,ReRAM與CMOS工藝兼容,不管是本身密度的發展,還是通過工藝制程的演進以及3D堆疊的技術的使用,均能從多個維度持續推進ReRAM密度和能效比的提升。億鑄相信,億鑄在產品算力與能效比方面的提升在國內屬于一流水準。
“億鑄初代產品可以基于28納米工藝實現同等算力、10倍能效比,同時擁有更低的軟件生態兼容和建設成本,而且選擇的憶阻器未來有很大的成長空間,這些都是支撐億鑄未來發展動力以及確定性的重要因素。”
?
大算力賽道上,中國企業以技術突圍
隨著AI的場景變得越來越普及以及多元化,算法模型也變得越來越復雜,社會對算力的需求遠超我們想象。根據《中國算力發展指數白皮書》,2020年,全球算力總規模達到429EFlops,增速達到39%,據IDC預測,2025年全球物聯網設備數將超過400億臺,產生數據量接近80ZB,預估未來五年全球算力規模將以超過50%的速度增長,到2025年整體規模將達到3300EFlops。其中,中國2021年的AI芯片市場規模超過400億元人民幣,其中AI推理計算占比超50%,預計未來5年CAGR超40%。
但國家對碳達峰、碳中和的戰略目標設定又要求AI算力在不斷攀升的同時,還要實現能效比的快速提升,如此,才能既滿足市場對AI算力的要求、又滿足國家對能源結構性優化的要求。熊大鵬博士認為,在傳統異構AI芯片面臨工藝摩爾墻的技術瓶頸、算法模型日益復雜和龐大、能耗使用監管日益嚴格的大背景下,存算一體AI芯片有著不可多得的歷史發展機遇,這也讓存算一體這一先進計算架構成為前沿研究熱點,存算一體及AI大算力芯片也即將迎來了行業爆發的契機。
億鑄的全數字化存算一體技術可切實將存算一體架構在大算力、高能效比的芯片平臺應用并落地,這一技術通過稀疏化的設計原理以及無需AD/DA(數模轉換)部分,將芯片的面積和能耗用于數據計算本身,從而實現大算力和高精度的多維度滿足。
憑借技術實力強勁的團隊和國產產業鏈核心節點的支持,億鑄即將于2023年上半年推出自己的第一代芯片,并于同年投片第二代芯片。
存算一體架構的AI大算力芯片作為技術領域跨度多、集成度高、創新型強的技術賽道,需要行業資深從業者以及優秀的前沿科學家。
億鑄團隊研發能力覆蓋存儲器件、存算陣列、芯片架構、芯片設計、軟件生態、AI算法和工程落地等全鏈條,研發團隊發表頂會論文40余篇,工程團隊成員平均擁有25年以上在高端集成電路設計領域的經驗;還擁有20+顆SoC芯片的設計、量產及銷售經驗,因此,團隊在技術定位和技術戰略上的深謀遠慮,也有對存算一體技術探索的底氣。
芯片作為人類社會各產業信息化、數字化、智能化發展的基本生產資料,其發展根植于人類社會信息化、數字化和智能化發展的要求,這正是美國阻撓中國芯片半導體產業發展,并大力投入爭奪頭部芯片企業支持的原因。而在AI芯片領域,對算力的需求在未來較長的一段時間內仍將保持較高速度的發展,這一點已經成為整個產業界的共識。
但從另一角度來看,當前存算一體領域的挑戰與機遇并存。2021年,中國芯片進口額超過4300億美元,隨著中國本土工廠擴大產能,去年中國對海外芯片制造設備的采購訂單增長58%,若不能通過先進技術實現突破,我國對海外芯片半導體產業的依賴將持續增加,當前局勢刻不容緩。
在億鑄看來,在先進工藝短期內無法完全實現全鏈國產化的大前提下,國內半導體企業必須具備與先進工藝制成解耦的技術,同時還要實現與基于先進工藝制程的芯片產品同等甚至更好的性能表現,在這方面,億鑄基于傳統28納米CMOS工藝和既有國內產業配套設計的存算一體AI大算力芯片可以實現與先進工藝制程的AI芯片同等算力但10倍能效比。
此外,億鑄的目標除了將存算一體架構切實在AI大算力領域商用落地之外,還期望和其他存算一體賽道上共同奮斗的創業伙伴們一起共建存算一體生態。
芯片半導體領域發展至今,已成為全鏈高度耦合的產業,各個環節唇齒相依、缺一不可。但通過架構的創新,基于可國產化的產業配套,億鑄將為業界提供大算力、超高能效比、易部署的AI大算力芯片產品,在不改變數據中心物理空間和既有基建的前提下,大大提升算力密度,以及能效比,為國內產業的智能化發展貢獻出自己的力量。
2021年9月,中國信息通信研究院發布的《中國算力發展指數白皮書》中,用上述結論強調了算力在數字經濟時代的基礎性作用。今年2月,多部委聯合印發通知,同意在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群,這標志著全國一體化大數據中心體系——“東數西算”工程正式全面啟動。
這項被稱為數字經濟時代的“南水北調”“西電東送”“西氣東輸”的重大工程受到全社會高度關注。而在熱點背后,當上千億參數的超大規模深度學習模型成為現實,指引整個人工智能產業尋找一條新的可行之路,縮短我們與通用智能的距離之時,海量數據所引發的超大算力需求,導致了目前的一個客觀現狀:算力的發展始終未能跟上算法的發展,這對芯片半導體領域提出了新的挑戰。
怎樣實現“既能低功耗、又能高精度、還能大算力”,已成為“后摩爾時代”全球數字經濟體可持續發展的基礎與核心。
實際上,當大洋彼岸的美國對我國芯片半導體產業一步步封鎖,通過不斷干預中國購買光刻機、組建“芯片聯盟”阻礙中國發展先進半導體產業以來,我國就在為擺脫芯片受制于人的局面大力推動產業創新。先是8月9日美國通過《2022年芯片和科學法案》,接著是8月31日,芯片巨頭英偉達和AMD均接到美國政府的要求,被限制向中國出口最新旗艦GPU計算芯片及板卡,一批擁有國產自主研發能力的半導體企業主動或被動地走入了大眾視野。
創立于2020年,以存算一體AI大算力芯片技術作為突破口的億鑄科技便是其中之一,作為國內首家研發基于ReRAM(RRAM)全數字存算一體AI大算力芯片的企業,在摩爾定律逼近物理極限的情況下,億鑄科技嘗試通過架構創新突破馮·諾伊曼瓶頸,成為中國AI芯片創業大軍中的革新者,也為解決國內AI算力尤其是大算力的困局提供了新的方向。
超越“摩爾時代”,億鑄聚焦存算一體架構的AI大算力芯片
早在1992年,中國工程院院士許居衍就預測,到2014年后,半導體產業將會遇到拐點,并進入“后摩爾時代”。
這種預測的根據在于,在傳統的馮·諾依曼計算系統采用存儲和運算分離的架構下,80%-90%的功耗發生在數據傳輸上,99%的時間消耗在存儲器讀寫過程中,真正用于計算的能耗和時間占比很低,于是造成“能耗墻”和“存儲墻”的出現。而存算分離的架構非常容易導致數據搬運過程中發生擁塞,尤其是在動態環境下,對數據進行調度和管理其實非常復雜,導致編譯器無法在靜態可預測的情況下對算子、函數、程序或者網絡做整體的優化,只能手動、一個個或者一層層對程序進行優化,包括層與層之間的適配,耗費了大量時間,于是出現了“編譯墻”。
在“三堵墻”的限制下,采用馮·諾依曼架構的計算系統將嚴重制約人工智能領域的算力和能效提升。以智能汽車領域為例,十年前,汽車的算力還不足1TOPS,而未來,為滿足L5級別的無人駕駛技術,汽車需要達到4000TOPS的算力水平才有可能實現,到那時若仍以傳統的馮·諾依曼架構研發芯片,其功耗將非常夸張。
為解決這一問題,科學家就必須要翻越這“三堵墻”。實際上,早在1969年,斯坦福大學研究員Kautz等人就提出過存算一體計算機的概念,但在當時,一方面受限于芯片設計復雜度與制造成本問題,另一方面由于缺少大數據應用驅動,這些存算一體概念僅停留在研究階段,并未獲得實際應用。直到近年來,伴隨GPT-3、“悟道”等人工智能大模型的問世,海量數據所引發了超大算力需求和高能效比的矛盾而開始受到重視,業界逐漸形成一個共識——存算一體架構可能是現階段基于CMOS工藝能同時滿足大算力、高精度、高能效比的最有效途徑。
全球范圍內,再度興起了對存算一體的產業研究,海外巨頭諸如英特爾、三星、IBM、東芝、SK海力士等都在進行相關領域的布局和產品研發。在億鑄科技首席技術官Debu看來,由于存儲器件以及配套工藝發展等原因,此前的存算一體芯片多基于Flash通過模擬計算的方式實現,后來出現了基于SRAM的存算一體技術。這些技術無疑為存算一體架構和生態發展做出了很大的貢獻,他們不僅向業界證明了存算一體技術的可實現性以及價值,同時也為存算一體生態的建設做了很多基建工作。
但要注意到,既有的存算一體技術仍然主要聚集于小算力、低精度的場景,并未能將存算一體高能效比的優勢應用于大算力比如云計算、自動駕駛等領域。因此,億鑄的技術價值在于“將存算一體架構切實向大算力、高精度、高能效比的方向推進和落地,實現這一存算一體架構里程碑式的發展節點”。
億鑄科技創始人、董事長兼CEO熊大鵬博士表示:“億鑄科技以全數字化的方式將ReRAM 應用于存算一體AI大算力芯片,這么做的優勢在于:一, ?存算一體架構可以打破傳統馮·諾依曼架構下的存算墻、能耗墻和編譯墻;二,?存儲介質ReRAM在算力潛能、算力精度和算力效率等主要指標上有著數量級優勢,是目前最適合做存算一體AI大算力芯片的憶阻器;三,全數字化的技術路徑在滿足大算力的同時還能做到支持高精度,使得存算一體架構真正在AI大算力方向落地。因此,億鑄科技能夠為業界帶來大算力、超能效比、低功耗、易部署的AI推理計算解決方案。”
他強調,ReRAM這一新型憶阻器具有非易失性、面積小、密度高、成本低、功耗低、讀寫速度快等一系列優點,隨著ReRAM的產業配套逐步完善和成熟,該技術無疑已經到了“商業應用爆發前夜”。此外,ReRAM與CMOS工藝兼容,不管是本身密度的發展,還是通過工藝制程的演進以及3D堆疊的技術的使用,均能從多個維度持續推進ReRAM密度和能效比的提升。億鑄相信,億鑄在產品算力與能效比方面的提升在國內屬于一流水準。
“億鑄初代產品可以基于28納米工藝實現同等算力、10倍能效比,同時擁有更低的軟件生態兼容和建設成本,而且選擇的憶阻器未來有很大的成長空間,這些都是支撐億鑄未來發展動力以及確定性的重要因素。”
?
大算力賽道上,中國企業以技術突圍
隨著AI的場景變得越來越普及以及多元化,算法模型也變得越來越復雜,社會對算力的需求遠超我們想象。根據《中國算力發展指數白皮書》,2020年,全球算力總規模達到429EFlops,增速達到39%,據IDC預測,2025年全球物聯網設備數將超過400億臺,產生數據量接近80ZB,預估未來五年全球算力規模將以超過50%的速度增長,到2025年整體規模將達到3300EFlops。其中,中國2021年的AI芯片市場規模超過400億元人民幣,其中AI推理計算占比超50%,預計未來5年CAGR超40%。
但國家對碳達峰、碳中和的戰略目標設定又要求AI算力在不斷攀升的同時,還要實現能效比的快速提升,如此,才能既滿足市場對AI算力的要求、又滿足國家對能源結構性優化的要求。熊大鵬博士認為,在傳統異構AI芯片面臨工藝摩爾墻的技術瓶頸、算法模型日益復雜和龐大、能耗使用監管日益嚴格的大背景下,存算一體AI芯片有著不可多得的歷史發展機遇,這也讓存算一體這一先進計算架構成為前沿研究熱點,存算一體及AI大算力芯片也即將迎來了行業爆發的契機。
億鑄的全數字化存算一體技術可切實將存算一體架構在大算力、高能效比的芯片平臺應用并落地,這一技術通過稀疏化的設計原理以及無需AD/DA(數模轉換)部分,將芯片的面積和能耗用于數據計算本身,從而實現大算力和高精度的多維度滿足。
憑借技術實力強勁的團隊和國產產業鏈核心節點的支持,億鑄即將于2023年上半年推出自己的第一代芯片,并于同年投片第二代芯片。
存算一體架構的AI大算力芯片作為技術領域跨度多、集成度高、創新型強的技術賽道,需要行業資深從業者以及優秀的前沿科學家。
億鑄團隊研發能力覆蓋存儲器件、存算陣列、芯片架構、芯片設計、軟件生態、AI算法和工程落地等全鏈條,研發團隊發表頂會論文40余篇,工程團隊成員平均擁有25年以上在高端集成電路設計領域的經驗;還擁有20+顆SoC芯片的設計、量產及銷售經驗,因此,團隊在技術定位和技術戰略上的深謀遠慮,也有對存算一體技術探索的底氣。
芯片作為人類社會各產業信息化、數字化、智能化發展的基本生產資料,其發展根植于人類社會信息化、數字化和智能化發展的要求,這正是美國阻撓中國芯片半導體產業發展,并大力投入爭奪頭部芯片企業支持的原因。而在AI芯片領域,對算力的需求在未來較長的一段時間內仍將保持較高速度的發展,這一點已經成為整個產業界的共識。
但從另一角度來看,當前存算一體領域的挑戰與機遇并存。2021年,中國芯片進口額超過4300億美元,隨著中國本土工廠擴大產能,去年中國對海外芯片制造設備的采購訂單增長58%,若不能通過先進技術實現突破,我國對海外芯片半導體產業的依賴將持續增加,當前局勢刻不容緩。
在億鑄看來,在先進工藝短期內無法完全實現全鏈國產化的大前提下,國內半導體企業必須具備與先進工藝制成解耦的技術,同時還要實現與基于先進工藝制程的芯片產品同等甚至更好的性能表現,在這方面,億鑄基于傳統28納米CMOS工藝和既有國內產業配套設計的存算一體AI大算力芯片可以實現與先進工藝制程的AI芯片同等算力但10倍能效比。
此外,億鑄的目標除了將存算一體架構切實在AI大算力領域商用落地之外,還期望和其他存算一體賽道上共同奮斗的創業伙伴們一起共建存算一體生態。
芯片半導體領域發展至今,已成為全鏈高度耦合的產業,各個環節唇齒相依、缺一不可。但通過架構的創新,基于可國產化的產業配套,億鑄將為業界提供大算力、超高能效比、易部署的AI大算力芯片產品,在不改變數據中心物理空間和既有基建的前提下,大大提升算力密度,以及能效比,為國內產業的智能化發展貢獻出自己的力量。
評論
查看更多