芯片制造商開始重新審視異構系統中應該使用多少暗硅,在哪里工作得最好,以及有哪些替代方案可用——這是摩爾定律擴展放緩以及SoC日益分解的直接后果。
暗硅的概念已經存在了幾十年,但隨著物聯網的引入,所有東西都必須安裝在單個芯片上,并使用小電池工作,暗硅才真正開始發展起來。事實證明,對于智能手表和手機的初始版本來說,這種做法是存疑的。而當時最好的解決方案是關閉任何基本應用不需要的電路。
然而,其他問題接踵而至。例如,當設備重新通電時,浪涌電流(特別是那些需要更快打開的設備)會給電路帶來壓力,從而導致芯片損壞。因此,雖然關閉芯片的某些部件的電源可以減少老化,但快速打開它們也可能引發問題。在過去十年中,通過低功耗芯片的工程設計,其中大部分問題已經得到解決,并且暗硅加上極其高效的設計,推動了下一代移動設備的發展,同時也對極大縮減了數據中心的能源成本。
現在的問題是,除了延長兩次充電之間的時間之外,還能做些什么,而僅僅添加更多的暗硅并不能解決這個問題。相反,人們更加關注滿足應用需求的芯片設計,而這得益于從設計到制造流程的一系列開發。其中:
整個生態系統一直在圍繞先進封裝發展和高效設計工具,OSAT和代工廠提供了經過硅驗證的分立元件(如Chiplet)以及各種封裝方法。這使得芯片制造商能夠開發更復雜的器件,同時還可以更有效地為特定領域應用進行分區和優先排序。
先進的封裝為更短的信號路徑和更快的互連開辟了道路。與大型平面芯片相比,信號在封裝中的傳播距離可能更短,并且這些信號可以通過利用先進的互連和新材料,從而在驅動時實現更快速、功耗更低的數據傳輸。
超低功耗設計和各種功能(例如接近閾值計算)在很大程度上仍處于觀望狀態,然而目前卻正在受到更廣泛的關注。此外,在過去十年中,電池內部的密度以每年平均5%至6%的速度增長,使設備能夠使用相同尺寸甚至更小的電池做更多的事情。雖然終端設備的外形尺寸往往相對一致,但可以在不影響電池壽命的情況下將更多設備封裝在設備內部。
所有這些變化都是日積月累的。因此,與其關閉芯片的大部分電源,不如使用較小的芯片或Chiplet來完成更多工作,這可以更具成本和能效。此外,芯片中的各種功能可以在最佳工藝節點上開發,權衡成本、用例、靜態電流泄漏和尺寸等因素。
“還有更多各種各樣的解決方案,”Arm的研發研究員Rob Aitken表示。“暗硅背后的部分想法是有一個固定的功率預算,特別是對于移動計算。但是,如果縮小設備,同時提高頻率,那么功率就不會真正改善。相反,最終會得到這個空白空間,并且有各種各樣的想法來解決這個問題。
對于智能手機和可穿戴設備來說,暗硅是一種經過驗證的解決方案,但它不是最有效的解決方案。還有其他選擇,從限制各種組件尺寸到將它們分散在封裝中,從而在增加密度時減少熱效應。這對于內存尤其有價值,因為內存在較低溫度下可以更有效地運行。因此,當附近的電路斷電時,內存可能會保持冷卻,但浪涌電流會很快使其過熱。更好的選擇是將內存與先進封裝中的主動邏輯物理分離。
“如果溫度太接近最大允許的工作范圍,你可能不得不更頻繁地刷新內存,”Rambus的杰出發明家Steven Woo指出。“當內存器件過熱時,最終可能會失效。如果器件溫度升高,那就不得不做所謂的節流。注意縮短以最佳性能運行的時間,或者在短時間內運行,讓其再次冷卻下來。”
所有這些技術以及其他發展使移動設備能夠進行比過去更密集的計算,而不會耗盡。“在移動領域,功率實際上升了,”Arm的Aitken認為。“與15年前相比,如今的芯片消耗了更多的功率。由于電池技術的發展,以及更多的物理區域,可以讓器件更有效地散熱,從而提高了芯片功率。”
通過三維層級規劃隔離芯片的各個部分,并采用各種技術,如動態電壓頻率調節,以及一些暗硅,可以更有效地進行熱管理。它也可以使用更少的硅面積來完成,這提高了性能,并為相同器件中的其他功能和特性打開了大門。
這種方法還有其他好處。“過去有理由選擇越來越大的芯片,這樣你就可以將更多的功能集成到單個芯片中,”Fraunhofer IIS自適應系統部門工程設計方法負責人Roland Jancke表示。“如果你不需要硅的某些部分,那么你可以關閉它們以節省電力。但是還有其他原因使用較小的芯片。例如,相較于數字電路,如果在設計中包含模擬電路,則通常位于成熟工藝節點中,因此它會占用更多區域(這使得減小數字元件的尺寸更具優勢)。而對于RF而言,則需要大量的功率。Chiplet也有安全優勢,很難復制整體系統功能,僅在以相同方式將相同部分集成到相同封裝中時,它才有效。如果你使用這些芯片中的任何一個都失敗了,那么你就錯過了整體功能。
人工智能的影響
重新思考關閉部件以及關閉時間的驅動因素之一涉及人工智能和機器學習,其中芯片設計旨在實現最大的性能和吞吐量。對于需要非常快速地處理大量數據的大型數據中心尤其如此。通常,這涉及并行工作的強大處理器內核,其中一些內核是專門為這些數據中心工作負載設計的,通常與GPU、CPU、某種類型的NPU和DSP結合使用。問題是這些設備依賴于穩定的數據流,并且該數據流并不總是一致地流動。
“如果有兩種解決方案,其中一種解決方案更有效地使用晶體管,那么每美元和每瓦特將獲得更多的吞吐量,”Flex Logix首席執行官Geoff Tate指出。“因此,從客戶的角度來看,采用暗硅是不可取的。很難開發出高利用率的架構,但利用率越高越好。
在過去的五年里,隨著人工智能變得越來越普遍,人們對什么是最佳方案的看法改變了。“在人工智能的早期階段,第一個挑戰就是讓一些功能發揮作用并改進模型,使它們越來越好,并沿著學習曲線上升,” Tate指出。“在數據中心領域,其擁有巨大的預算和巨額利潤,這使他們能夠做一些以前無法做到的事情。但是,當我們尋求將AI部署到大批量應用,且對價格更敏感的解決方案中時,客戶將尋找能夠為其功率預算和金錢預算提供最大的推理性能的供應商,我們看到的大多數企業在達到他們的資金預算之前就達到了功率預算。這不僅僅是出于成本原因而有效地使用晶體管。擁有的晶體管越多,泄漏就越多。因此,如果你能用更少的晶體管完成工作,它將更加節能。”
在人工智能世界中,“暗硅”也可以具有另一種含義。“盡管供應商試圖提供所有芯片和所有馬力,但當你試圖運行實際的神經網絡模型時,甚至無法獲得接近40%的系統,”AMD數據中心人工智能和計算市場高級總監Nick Ni表示。“引擎可以非常快,但如果你沒有要處理的數據,那么它們就閑置了。這就是導致暗硅的原因。”
圖 1:AMD 的 3D V-Cache 使用堆疊在處理器上的緩存小芯片(圖源:AMD)
挑戰在于徹底了解需要處理的上下文和數據量,然后圍繞這些因素設計芯片。AMD收購Xilinx的原因之一,以及英特爾收購Altera的原因之一,是能夠微調其中一些設備的使用方式。可編程邏輯可以根據需要動態重新配置和調整大小,因此可以根據需要使用小型FPGA,而不是巨型FPGA。雖然巨型FPGA的效率永遠不如硬連線ASIC,但較小的可編程邏輯芯片可用于減少未充分利用或未利用的硅的數量。
“雖然能夠為每個市場構建定制ASIC會很好,但其中一些用例是如此多樣化,以至于市場變得越來越小,而構建ASIC的成本正在上升,”Rambus的Woo表示。“因此,FPGA與x86結合使用是有意義的。您可以加載位文件以用于特定于市場的工作,然后利用 x86 的通用基礎結構來完成其他所有操作。”
Chiplet架構的影響
Chiplet增加了另一個級別的靈活性,因為芯片尺寸可以根據特定功能所需的任何條件進行調整。這意味著可以完全消除芯片中未使用的部分,而不是將其置于睡眠狀態,并且可以將附加功能放在不同的小芯片上。
“芯片尺寸是采用Chiplet的主要驅動力之一,”TechSearch總裁Jan Vardaman在最近的一次演講中說。“如今,GPU和CPU的芯片尺寸非常大,我們確實必須擁有更多的晶體管。只是我們必須弄清楚如何經濟地將所有這些晶體管放在一起并發揮作用。因此,我們在推動Chiplet采用方面所做的額外工作將使我們能夠制作出更高密度的更精細的封裝。您可以做一些提高電源效率的事情,這在我們的許多應用中都非常重要。”
關鍵是能夠以最有效的方式將各個部分組合在一起。“我們必須能夠以一種新的方式思考設計。這是一個系統架構,“Vardaman表示。“因為你得到的是一個更小的模具,這可以提高產量,所以你將使用最先進的節點來制造需要這些節點的零件。您不會在高性能邏輯節點中制造芯片的模擬部分。您將在其他節點中將其鑄造,因為它更便宜。你要把所有這些放在一起。小芯片是硬 IP 塊。它必須共同優化。所有這些東西都可以一起工作。你不能孤立地設計這些東西。”
在這種情況下,暗硅只是降低功耗的另一種選擇,而不一定是最好的選擇。雖然它可以為特定功能提供儲備計算能力,但它不是設計復雜系統的最有效方法。
總結
將更多功能封裝到芯片上的能力不斷削弱,但功耗和性能優勢也在不斷縮小。因此,芯片制造商正在尋求通過先進封裝來繼續降低功耗、提升性能。但在封裝中,暗硅并不如單個高性能芯片那么有吸引力,后者的尺寸更具普適性,并且數量在十億芯片范圍內。即使在最理想的條件下,暗硅似乎也顯示出它的年齡。
“我們正處于這種暗硅軌跡中,”Aitken稱。“有一堆東西進入了暗硅思維過程,這些東西已經逐漸成為主流。您將構建一個具有許多不同核心功能的芯片。但是,如何始終打開所有功能以最大化提高計算性能仍然是一個非常困難的問題。這是你可能不想回答的問題,因為它會產生大量的熱量,無論如何你都無法處理。”
審核編輯 :李倩
-
芯片
+關注
關注
456文章
51096瀏覽量
425995 -
生態系統
+關注
關注
0文章
703瀏覽量
20759 -
異構系統
+關注
關注
0文章
8瀏覽量
7652 -
異構集成
+關注
關注
0文章
34瀏覽量
1911
原文標題:異構集成趨勢下,如何解決暗硅效應?
文章出處:【微信號:CloudBrain-TT,微信公眾號:云腦智庫】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論