生成式 AI 引領(lǐng)智能革命成為產(chǎn)業(yè)升級(jí)的核心動(dòng)力并點(diǎn)燃了“百模大戰(zhàn)”。多樣化的大模型應(yīng)用激增對(duì)高性能AI 芯片的需求,促使行業(yè)在摩爾定律放緩的背景下,加速推進(jìn)2.5D、3D及3.5D異構(gòu)集成技術(shù)。與此同時(shí),AI 的驅(qū)動(dòng)作用正在助力 EDA 和半導(dǎo)體產(chǎn)業(yè)實(shí)現(xiàn)顛覆性的變革。
在現(xiàn)今 AI 時(shí)代,AI 芯片設(shè)計(jì)將面臨哪些挑戰(zhàn)?EDA 與 IP 工具又將如何借助 AI 的力量來(lái)應(yīng)對(duì)這些挑戰(zhàn)?12 月 11-12 日上海集成電路 2024 年度產(chǎn)業(yè)發(fā)展論壇暨第三十屆中國(guó)集成電路設(shè)計(jì)業(yè)展覽會(huì)(ICCAD - Expo 2024)上,楷登電子(Cadence)數(shù)字設(shè)計(jì)及簽核事業(yè)部產(chǎn)品驗(yàn)證群總監(jiān)李玉童,以及楷登電子技術(shù)支持總監(jiān)李志勇分別帶來(lái)了題為《3D-IC —— 打破 AI 芯片的設(shè)計(jì)桎梏》以及《基于標(biāo)準(zhǔn)的協(xié)議對(duì)未來(lái)人工智能工作負(fù)載至關(guān)重要》的精彩演講,深入探討了這些問(wèn)題。
3D-IC —— 打破 AI 芯片的設(shè)計(jì)桎梏
生成式AI推動(dòng)了大模型應(yīng)用的蓬勃發(fā)展,這一浪潮已蔓延至EDA領(lǐng)域,Cadence 推出全面的“芯片到系統(tǒng)” AI 驅(qū)動(dòng)的EDA工具平臺(tái)Cadence JedAI Platform正是在 AI 大模型的推動(dòng)下應(yīng)運(yùn)而生的工具。通過(guò) JedAI 這個(gè)統(tǒng)一的數(shù)據(jù)平臺(tái),可以有效地進(jìn)行數(shù)據(jù)存儲(chǔ)、分類(lèi)、壓縮和管理,推動(dòng) EDA 工具和設(shè)計(jì)流程的自我學(xué)習(xí)優(yōu)化,從而實(shí)現(xiàn)生產(chǎn)力的極大提升以及功耗、性能和面積(PPA)的進(jìn)一步優(yōu)化。
李玉童在演講中介紹,JedAI平臺(tái)采用分層的大型語(yǔ)言模型(LLM)訓(xùn)練架構(gòu),包含四個(gè)層級(jí)。最底層是開(kāi)源基礎(chǔ)模型,由第三方利用公共數(shù)據(jù)進(jìn)行訓(xùn)練。在此基礎(chǔ)上,Cadence 利用專(zhuān)有數(shù)據(jù)訓(xùn)練出專(zhuān)屬模型,以更好地滿(mǎn)足芯片設(shè)計(jì)客戶(hù)的需求。客戶(hù)可以在 Cadence 模型的基礎(chǔ)上,使用自身的數(shù)據(jù)進(jìn)行進(jìn)一步訓(xùn)練,從而生成私有模型。最頂層是用戶(hù)界面,允許用戶(hù)通過(guò)自然語(yǔ)言輸入各種請(qǐng)求,與 Cadence JedAI 大型語(yǔ)言模型進(jìn)行交互,以獲得所需的專(zhuān)業(yè)解答。諸如此類(lèi)的大模型應(yīng)用中,AI 芯片成為支撐引擎,為大模型應(yīng)用提供強(qiáng)有力的支持。而大模型應(yīng)用的繁盛,讓 AI 芯片的發(fā)展來(lái)到了一個(gè)新高度。
不難看出,LLM 的參數(shù)量指數(shù)級(jí)增長(zhǎng)對(duì)與處理器匹配的內(nèi)存系統(tǒng)提出了更高的要求,AI 存儲(chǔ)要求更大容量、更大帶寬、更低功耗,從而使得 AI 芯片的設(shè)計(jì)面臨前所未有的挑戰(zhàn)。
HBM 是此前克服“內(nèi)存墻”(Memory Walls)的主要解決方案,其強(qiáng)大的 I/O 并行化能力,使 HBM 成為 Al 系統(tǒng)中用于訓(xùn)練和推理的高規(guī)格存儲(chǔ)設(shè)備,且已經(jīng)成為大部分高端數(shù)據(jù)中心 GPU 和 SoC 的標(biāo)配。當(dāng)下業(yè)內(nèi)正在開(kāi)發(fā)的 DRAM-on-Logic 堆疊方案,有望將 AI 芯片帶寬進(jìn)一步提升至 32TB/s,使得 AI 大模型應(yīng)用響應(yīng)速度進(jìn)一步加快,更接近人類(lèi)直接交流。然而,3D 堆疊技術(shù)雖然能解決 AI 芯片內(nèi)存墻的問(wèn)題,卻也需要面對(duì)從 2D 到 3D 芯片設(shè)計(jì)方法轉(zhuǎn)變的挑戰(zhàn)。
李玉童詳細(xì)介紹了封裝級(jí) 3D-IC 和晶圓級(jí) 3D-IC(3D-SoIC/X-Cube)、同構(gòu)與異構(gòu) 3D-IC 等 3D-IC 路線(xiàn)圖和挑戰(zhàn)。如果將多個(gè) 2.5D、3D 封裝的芯片堆疊到同一個(gè)系統(tǒng)級(jí)芯片封裝中,就得到了所謂的 3.5D-IC。從 2.5D 到 3D-IC 乃至 3.5D-IC,對(duì)于 AI 芯片而言,無(wú)論是帶寬,還是處理單位數(shù)據(jù)的能效比所帶來(lái)的優(yōu)勢(shì)都是無(wú)與倫比的。同時(shí),因?yàn)樾酒询B產(chǎn)生了與堆疊的不同組件和整個(gè)系統(tǒng)相關(guān)的新復(fù)雜性,該技術(shù)也在三維芯片架構(gòu)和系統(tǒng)規(guī)劃,不同層間的鍵合策略選擇,傳輸層和運(yùn)算層的 Bump 對(duì)齊、時(shí)鐘樹(shù)協(xié)同優(yōu)化,以及系統(tǒng)層次的 STA、IR-Drop、Thermal、LVS 等方面帶來(lái)新的挑戰(zhàn)。
李玉童強(qiáng)調(diào),隨著摩爾定律逐漸失效,晶圓級(jí) 3D-IC 已成為行業(yè)的焦點(diǎn),3D-IC 的先進(jìn)性將極大地豐富系統(tǒng)公司從系統(tǒng)方面提升芯片性能的手段。Cadence 自 2018 年起就專(zhuān)注于各種類(lèi)型的同構(gòu)異構(gòu)集成技術(shù),成為業(yè)內(nèi)首個(gè)推出從芯片到系統(tǒng)完整解決方案的 EDA 公司,并推出了業(yè)界首個(gè)高性能高集成度的CadenceIntegrity 3D-IC Platform 平臺(tái)。
該平臺(tái)整合了系統(tǒng)規(guī)劃、封裝和設(shè)計(jì)流程早中后期系統(tǒng)級(jí)分析功能,可提供芯片上(on-chip)以及芯片外(off-chip)的跨芯片的時(shí)序分析、供電網(wǎng)絡(luò)規(guī)劃、IR 和熱分析以及不依賴(lài)第三方規(guī)則文件的系統(tǒng)級(jí) LVS/DRC 物理驗(yàn)證,幫助系統(tǒng)設(shè)計(jì)師從 3D-IC 項(xiàng)目初期規(guī)劃、分析三維芯片系統(tǒng)的堆疊方案選擇(2.5D/3D, Face2Face / Face2Back / Back2Back),并利用多物理場(chǎng)系統(tǒng)分析技術(shù),基于不同階段項(xiàng)目參考庫(kù)文件和網(wǎng)表從零到 100%的不同完成度,探索、分析、迭代及決策 3D-IC 最佳系統(tǒng)架構(gòu)。
這將幫助 3D-IC 設(shè)計(jì)實(shí)現(xiàn)團(tuán)隊(duì)有充裕的三維物理時(shí)序功耗設(shè)計(jì)裕量進(jìn)行跨芯片并行數(shù)字后端實(shí)現(xiàn),并無(wú)縫調(diào)用 Cadence 的 Virtuoso和Allegro模擬和封裝實(shí)現(xiàn)平臺(tái)進(jìn)行協(xié)同設(shè)計(jì)。
最后,李玉童分別通過(guò)以客戶(hù)同構(gòu)設(shè)計(jì)、異構(gòu)設(shè)計(jì)芯片的流片項(xiàng)目為例,詳細(xì)闡述了在一個(gè)完整的設(shè)計(jì)流程內(nèi)如何通過(guò)該平臺(tái)來(lái)進(jìn)行熱分析、功耗分析、裸片間靜態(tài)時(shí)序分析和物理驗(yàn)證,優(yōu)化系統(tǒng)性能。他強(qiáng)調(diào),3D-IC 技術(shù)的發(fā)展將為高帶寬 AI 芯片的性能提升帶來(lái)革命性的變化,Cadence 將通過(guò)不斷創(chuàng)新和優(yōu)化其設(shè)計(jì)平臺(tái),致力于幫助客戶(hù)克服技術(shù)挑戰(zhàn),實(shí)現(xiàn)更高的產(chǎn)品性能和市場(chǎng)競(jìng)爭(zhēng)力。
基于標(biāo)準(zhǔn)的協(xié)議
對(duì)未來(lái)人工智能工作負(fù)載至關(guān)重要
在分論壇上,李志勇首先分析了 AI 時(shí)代的市場(chǎng)趨勢(shì)和關(guān)鍵驅(qū)動(dòng)因素,以及生成式 AI 對(duì)半導(dǎo)體行業(yè)的重大影響。在不同的 AI 應(yīng)用中,對(duì)處理器和 SoC 的需求各不相同,不同的工作負(fù)載需要不同的系統(tǒng)構(gòu)成。李志勇指出,無(wú)論是推理、訓(xùn)練、數(shù)據(jù)挖掘或圖形分析,異構(gòu)應(yīng)用都需要非常獨(dú)特的解決方案才能優(yōu)化實(shí)施。這些技術(shù)使用不同的系統(tǒng)架構(gòu)和資源,在 HPC/AI 領(lǐng)域并不存在一種適合所有情況的最佳系統(tǒng)架構(gòu)。也正是因此,面對(duì)不同 AI 應(yīng)用需求的各類(lèi) AI 處理器和 SoC 架構(gòu)將面臨前所未有的設(shè)計(jì)挑戰(zhàn)。
首先,數(shù)據(jù)傳輸設(shè)計(jì)是關(guān)鍵,通用設(shè)計(jì)的復(fù)用將帶來(lái)增量性能和成本方面的優(yōu)勢(shì),包括計(jì)算、內(nèi)存和 I/O 等。其次,標(biāo)準(zhǔn)接口是設(shè)計(jì)的關(guān)鍵組成部分。當(dāng)前市場(chǎng)上的各類(lèi)主流及創(chuàng)新架構(gòu)均大量使用了各種標(biāo)準(zhǔn)接口,HPC、AI/ML 和云對(duì)各類(lèi) IP 的需求正在不斷增加。最后,隨著摩爾定律來(lái)到極限,以 UCIe 和其他形式實(shí)現(xiàn)的 D2D 接口的封裝和標(biāo)準(zhǔn)化方面的進(jìn)步使分解和基于芯粒的設(shè)計(jì)正在成為現(xiàn)實(shí)。
Cadence 通過(guò)不斷創(chuàng)新和優(yōu)化全棧 IP 解決方案,幫助客戶(hù)克服 AI 芯片設(shè)計(jì)挑戰(zhàn)。在存儲(chǔ)接口方面,Cadence 的協(xié)議選項(xiàng)涵蓋先進(jìn)技術(shù)節(jié)點(diǎn)中所有最新標(biāo)準(zhǔn)和數(shù)據(jù)速率的深度解決方案組合,包括 DDR、LPDDR、GDDR、HBM等,可幫助客戶(hù)利用多功能內(nèi)核以更快的速度完成更多任務(wù),全面滿(mǎn)足客戶(hù)從存儲(chǔ)到 AI,再到圖形和內(nèi)存擴(kuò)展器的各種應(yīng)用需求。
在高速串行接口方面,Cadence 是唯一一家擁有 8 通道 Gen6 控制器和 PHY 測(cè)試芯片的 IP 提供商,同時(shí),Cadence 在 PCIe 7 也將保持領(lǐng)先,Gen7 已經(jīng)向客戶(hù)演示了 demo,并有望在 2027 年滿(mǎn)足市場(chǎng)需求。
在高速以太網(wǎng)方面,Cadence 的解決方案包括業(yè)界領(lǐng)先的 224G/112G/56G 物理層 IP 和控制器 IP,可支持高達(dá) 800G/1.6T 的子系統(tǒng),還展現(xiàn)出卓越的硅性能,在 Cadence 測(cè)試芯片和客戶(hù)生產(chǎn)芯片中均已得到驗(yàn)證。
與此同時(shí),隨著 Chiplet 成為后摩爾時(shí)代的共識(shí),D2D 接口 IP 需求迅速增加。Cadence 已推出使用 UCIe 標(biāo)準(zhǔn)接口實(shí)現(xiàn)處理器、系統(tǒng) IP 和內(nèi)存 IP 的高效集成解決方案,可滿(mǎn)足高性能計(jì)算、汽車(chē)和數(shù)據(jù)中心行業(yè)不斷變化的需求,并幫助客戶(hù)克服設(shè)計(jì)挑戰(zhàn)并加快產(chǎn)品上市時(shí)間。
-
Cadence
+關(guān)注
關(guān)注
65文章
921瀏覽量
142128 -
ICCAD
+關(guān)注
關(guān)注
0文章
66瀏覽量
6144 -
AI芯片
+關(guān)注
關(guān)注
17文章
1887瀏覽量
35017
原文標(biāo)題:ICCAD 2024:人工智能浪潮下,Cadence 如何打破 AI 芯片的設(shè)計(jì)桎梏?
文章出處:【微信號(hào):gh_fca7f1c2678a,微信公眾號(hào):Cadence楷登】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論