將數以億計的晶體管集成到指甲蓋大小的芯片上,并不斷提高其集成密度,是過去幾十年提高芯片算力的主要方法,也是引領業界超過半個世紀之久的摩爾定律的核心內容。但由于人工智能、大數據、物聯網等產業急速發展,數字經濟浪潮席卷而來,作為核心生產力的算力需求激增,逐漸與芯片自身的物理極限產生矛盾,曾被視為“金科玉律”的摩爾定律正面臨失效的窘境。
光或將成為解決這一問題的突破口?光子具有高通量、低延遲、低能耗的優勢,且不易受到溫度、電磁場和噪聲變化的影響。此前,光子技術常被應用于長距離通信傳輸領域,光纖通信已成為各種通信網的主要傳輸方式。然而,光在人類社會進步中可發揮的作用可能遠比我們想象中來得更大、更重要。
曦智科技率先將目光投向光領域,提出開創性的“光電混合計算新范式”概念,試圖給集成電路產業提供一個區別于目前傳統芯片計算范式的全新“解題思路”。近期,曦智科技CTO孟懷宇博士在“DeepTech科技創新周先進計算論壇”上以“計算需求大爆發下的光電混合計算新范式”為主題,對這一概念進行了詳細介紹。
從光計算開始的新革命
所謂光計算,是指利用光的物理特性完成線性計算。孟懷宇博士以生活中常見的光計算——眼鏡為例,指出了光計算的三大優勢。
首先是低延遲,眼鏡后的觀察者感知到眼鏡前的圖像變化所需時間等于以光速穿越這一段距離所耗的時間——幾乎微乎其微;其次是低能耗,眼鏡放置在那里本身并不消耗能量,所有能量都消耗在光信號的產生與吸收;最后是高通量,當光信號發生高速變化時,眼鏡后接收的信息也會發生高速變化,即眼鏡的二維傅里葉變換正在進行高速的大通量計算。
雖然眼鏡不可編程,但它的原理為光計算的實現帶來了靈感。為了用光來實現一個可編程的真正有用的計算系統,曦智科技創始人兼CEO沈亦晨博士開創性地提出了利用集成光子技術實現深度學習的全新計算架構,并于2017年創立曦智科技。2019年,曦智科技發布了全球首款光子芯片原型板卡,成功驗證了以光子替代電子進行高性能計算的開創性想法。2021年,在此基礎上,曦智科技團隊又發布了高性能光子計算處理器PACE(Photonic Arithmetic Computing Engine,光子計算引擎),通過重復矩陣乘法和巧妙利用受控噪聲組成的緊密回環來實現低延遲,從而生成了伊辛問題(Ising)的高質量解決方案。
孟懷宇博士表示:“ PACE主要利用了光計算的低延遲優勢。其可在3納秒內完成伊辛問題單次迭代計算,速度達到目前高端GPU的800倍以上。”
PACE與目前高端GPU性能對比
光互聯,光電混合計算新范式的另一半
“光電混合計算新范式”的另一半重點則是解決數據互聯問題,即“內存墻”(memory wall)問題,主要包括容量和帶寬兩部分內容。算力爆發的今天,相應硬件的增長速度卻望塵莫及。以AI典型模型Transformer為例,兩年時間,算法大小提升240倍的背后是硬件存儲容量僅提高2倍的事實。因此出現了內存墻的容量瓶頸,即如何容納更大的應用程序。
另一大挑戰則是帶寬瓶頸。孟懷宇博士解釋道,如果將芯片想象成一個平面方塊,則芯片算力與方塊的面積成正比,而芯片對外的帶寬與其邊長成正比。因此,當芯片上晶體管密度越來越高時,如果將芯片的邊長密度提高2倍,算力密度就將提高4倍。因此,無論是摩爾定律越往前走,還是通過新的計算范式來提高單位面積的算力,“喂飽”算力所需的帶寬就越將成為問題。在過去的20年中,硬件的算力提升了9萬倍,但DRAM帶寬及網絡帶寬只提升了30倍。
曦智科技給出的解決方案是一種數據互聯的新范式——光互聯。相較于電互聯的性能會隨距離增長而逐漸下降,光互聯受距離的影響則小得多。孟懷宇博士表示:“理想情況下,對超過10毫米的數據傳輸,使用光互聯更具優勢,它能為解決帶寬瓶頸與容量瓶頸帶來更大可能,這也是曦智科技對光互聯新范式的底層邏輯?!?/p>
光互聯與電互聯對比
目前,光互聯解決方案已被應用于數據中心中,但由于光模塊與使用光模塊的數字芯片的距離往往在1米以上,光互聯就被電互聯所限制了,從而導致光互聯的應用范圍被局限于機架之間,機架內部,甚至服務器內部的光互聯使用非常少。為消除電互聯的瓶頸,曦智科技所倡導的光互聯新范式就是將光電轉換和數字芯片高度集成,形成“芯片出光”,并以此拓寬眾多計算范式的可行性。孟懷宇博士將目前數據中心的“資源池化”趨勢作為例子,他表示:“我會把這種大范圍的資源池化理解成計算資源的‘共享經濟’。目前一個服務器要去訪問另一個服務器的資源會比較困難,因為它們的互聯性較差。而光互聯就可以幫助實現更好的互聯性,讓大范圍的資源共享變成可能。最終通過資源池化,我們可以讓每一個計算芯片都能訪問更大的內存,有更大的帶寬,從而解決內存墻問題。”
光互聯讓數據中心“資源池化”變為可能
超大規模光電混合集成是實現以上一切的底層技術。對此,曦智科技也已完成了相關技術驗證,成功將一塊集成硅光芯片和一塊電子芯片以3D封裝形式垂直堆疊,使兩塊芯片之間的距離變得最小,實現了比現有的 Transceiver高1000倍以上的集成密度。
最后,孟懷宇博士還介紹了曦智科技“光電混合晶圓級計算平臺”解決方案。如今,業界許多公司推出了“晶圓級計算平臺”的概念,即通過更大的芯片面積來實現更高的性能,如Cerebras公司的WSE芯片。但它們的局限也顯而易見:首先由于電不適合長距離通信,因此只能進行最近鄰數據傳輸;其次,它們將面臨更為嚴重的“內存墻”問題。對此,“光電混合晶圓級計算平臺”解決方案通過晶圓級片上光互聯,實現任意互聯拓撲、低延遲及低能耗。同時,為了打破“內存墻”,可設立一個遠端的資源池,并通過高效率的光互聯,直接接入晶圓級計算平臺內部的光網絡,最終實現所有計算資源的最優配置。
責任編輯:彭菁
-
數據中心
+關注
關注
16文章
4840瀏覽量
72273 -
光互聯
+關注
關注
0文章
6瀏覽量
6786
發布評論請先 登錄
相關推薦
評論