作者:Ken Brock,新思科技公司(Synopsys)產(chǎn)品營(yíng)銷(xiāo)經(jīng)理
***積體電路制造公司(簡(jiǎn)稱(chēng)為臺(tái)積電(TSMC))最近宣布了其第四個(gè)28nm工藝進(jìn)入了量產(chǎn) - 28HPC Plus(即28HPC +)。臺(tái)積電(TSMC)的前兩項(xiàng)28nm工藝(聚氮氧化硅28LP和高K 金屬閘28HP / 28HPL / 28HPM)已生產(chǎn)了數(shù)百萬(wàn)個(gè)生產(chǎn)晶片。臺(tái)積電(TSMC)已利用28HPC優(yōu)化了移動(dòng)和消費(fèi)設(shè)備在性能和成本之間的平衡需求,然后開(kāi)發(fā)了28HPC +,從而進(jìn)一步提高性能和降低泄漏。設(shè)計(jì)人員通過(guò)結(jié)合這些新工藝技術(shù)和專(zhuān)為這些工藝而設(shè)計(jì)的高質(zhì)量標(biāo)準(zhǔn)單元邏輯庫(kù),可實(shí)現(xiàn)其性能、功耗和面積目標(biāo),同時(shí)減小設(shè)計(jì)進(jìn)度風(fēng)險(xiǎn)。
本文介紹了六個(gè)方面,設(shè)計(jì)人員可以利用這些采用新工藝的最新邏輯庫(kù)技術(shù)來(lái)優(yōu)化其系統(tǒng)級(jí)芯片(SoC)的性能、功耗和面積。
-
首先,臺(tái)積電(TSMC)28HPC/HPC+工藝相對(duì)于28LP/HP/HPL/HPM,能更好的控制全局慢速和全局快速(SSG,F(xiàn)FG)工藝角,因此可以提高系統(tǒng)級(jí)芯片(SoC)性能。改良的性能可以使用較低驅(qū)動(dòng)(較小的)邏輯單元來(lái)滿(mǎn)足關(guān)鍵時(shí)序路徑。
-
其次,臺(tái)積電(TSMC)對(duì)28HPC工藝進(jìn)行更嚴(yán)格的工藝控制,可以減少對(duì)應(yīng)工藝角中的20%漏電來(lái)降低功耗。
-
第三,28HPC +提高了15%性能,降低了25%漏電。
-
第四,28HPC和28HPC +都能減少面積,靈活的工藝規(guī)則,使得邏輯庫(kù)設(shè)計(jì)者可以設(shè)計(jì)出更小的可布線(xiàn)性更好的邏輯單元。
-
第五,這些相同的靈活規(guī)則使得能夠得到相對(duì)于28HPM工藝更長(zhǎng)的溝道長(zhǎng)度,從而減少最高50%的漏電,而不需要使用高成本的基于光刻的閘極偏置。
-
第六,在28HPC工藝引入的新的邏輯庫(kù)功能,如多重延遲、多重建立時(shí)間和多位觸發(fā)器(MBFF),可幫助設(shè)計(jì)人員優(yōu)化處理器內(nèi)核的性能和功耗。
創(chuàng)新工藝技術(shù)和邏輯庫(kù)設(shè)計(jì)功能的結(jié)合,以及最新的EDA工具創(chuàng)新和流程,使系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)人員能夠利用他們的設(shè)計(jì)技能,設(shè)計(jì)出最高性能、 最低成本、最低功耗的產(chǎn)品。
1. 通過(guò)全局工藝角簽核來(lái)提升系統(tǒng)級(jí)芯片(SoC)性能傳統(tǒng)開(kāi)發(fā)的邏輯庫(kù),包括總工藝角工藝、電壓、溫度(PVT)模擬試驗(yàn),可反映典型的P溝道和N溝道晶體管性能,統(tǒng)計(jì)學(xué)上性能最慢的(slow-slow或SS在3 sigma)和性能最快的(fast-fast或FF在3 sigma)。這些工藝角用于模擬典型的預(yù)期性能、最慢情況(用于觸發(fā)器setup)和最快情況(用于觸發(fā)器hold),且包括預(yù)期die和die之間、wafer和wafer之間以及l(fā)ot和lot之間的變化,從而確保良率。
由于工藝變異性的降低,臺(tái)積電(TSMC)能夠提供高良率的新工藝角,稱(chēng)之為slow-slow global(SSG)。與之前的28HPM工藝相比提高了10-15%的性能,這需要更保守的SS 簽核 (圖1)。工藝變異性改進(jìn)可使處理器運(yùn)行速度提高10-15%,因此,28HPC邏輯庫(kù)必須能夠支持在更高的速度下電路的額外動(dòng)態(tài)功耗和電遷移要求。
圖1. 臺(tái)積電(TSMC)28HPC SSG工藝角和28HPM SS 工藝角
2. 隨著工藝變異性減小,閘門(mén)漏電流也減少HPC工藝變異性的改進(jìn)降低了晶體管泄漏,因此根據(jù)不同的工藝選項(xiàng)和條件,28HPC工藝將比28HPM減少約20%的漏電量(圖2)。
圖2. TSMC 28HPC FFG工藝角和28HPM FFG工藝角
3.使用28HPC +改進(jìn)工藝秘訣臺(tái)積電(TSMC)利用28HPC +改善了28HPM和28HPC上使用的高K金屬工藝,具有新的摻雜特性,并從高K金屬閘上分離了一些原子,提高了15%的性能和降低25%的漏電流。
圖3.左邊的曲線(xiàn)顯示了28HPC的性能分布,右圖顯示了28HPC +的性能分布。請(qǐng)注意,這些曲線(xiàn)比較了相同的SSG工藝角
圖4.右側(cè)曲線(xiàn)顯示28HPC的漏電分布,左側(cè)顯示28HPC +處的漏電分布。請(qǐng)注意,這些曲線(xiàn)比較了相同的FFG工藝角
因?yàn)檫@是工藝中心的平移,而不僅僅是工藝的加強(qiáng),現(xiàn)有的電路塊或其它IP塊至少需要重新驗(yàn)證是否存在違例,或重新進(jìn)行綜合以利用改良的性能和漏電。
4.更長(zhǎng)的溝道長(zhǎng)度減少漏電工藝改進(jìn)帶動(dòng)了臺(tái)積電(TSMC)設(shè)計(jì)規(guī)則的變化,使得邏輯庫(kù)相對(duì)于TSMC 28HPM可以有更多的柵極長(zhǎng)度范圍。
同時(shí),新的靈活設(shè)計(jì)規(guī)則去除了一些光刻步驟,使得以30nm,35nm和40nm繪制的單元格能夠以稍大的柵極間距來(lái)改善性能或漏電。
圖5.上面的圖顯示,與下面的28HPM工藝相比,TSMC 28HPC / HPC +工藝的140nm間距和3個(gè)柵極長(zhǎng)度,為連接提供了更多空間
更寬范圍的柵極長(zhǎng)度和相關(guān)的光刻簡(jiǎn)化,使設(shè)計(jì)人員能夠使用28HPC優(yōu)化的邏輯庫(kù),以及綜合和布局布線(xiàn)工具中最新的漏電優(yōu)化功能,得到更廣泛的性能與漏電折中范圍。
5.靈活的設(shè)計(jì)規(guī)則加強(qiáng)高密度臺(tái)積電在28HPC / HPC +工藝中的靈活設(shè)計(jì)規(guī)則和更高的性能,使設(shè)計(jì)人員能夠在邏輯庫(kù)中使用更矮的單元格高度,以便在一些能滿(mǎn)足時(shí)序要求的block設(shè)計(jì)中,得到更小的芯片面積。使用較矮的邏輯庫(kù)和實(shí)現(xiàn)更高速度之間存在一個(gè)折中,因?yàn)檩^矮的邏輯庫(kù)需要更大的驅(qū)動(dòng)單元,從而有可能抵消面積節(jié)省。 每個(gè)邏輯庫(kù)在單元高度和性能之間都具有“最佳點(diǎn)”,以此來(lái)提供優(yōu)化結(jié)果 ,但是采用更低高度的單元并不總是最好的辦法。
圖6:在較低的頻率下,較矮的邏輯庫(kù)可以是某些block的最優(yōu)選擇
也就是說(shuō),臺(tái)積電的靈活設(shè)計(jì)規(guī)則使更矮的單元變得更容易繞線(xiàn),如果邏輯庫(kù)設(shè)計(jì)者利用布局和布線(xiàn)工具中的最新功能來(lái)設(shè)計(jì)邏輯庫(kù),則可通過(guò)更好的連接可能性來(lái)得到更高的利用率。
6.可大幅改良PPA的邏輯庫(kù)設(shè)計(jì)創(chuàng)新結(jié)合TSMC 28HPC / HPC +工藝與創(chuàng)新的邏輯庫(kù)設(shè)計(jì)和優(yōu)化布局的優(yōu)點(diǎn),可以幫助設(shè)計(jì)工程師通過(guò)綜合和布局布線(xiàn)完成RTL數(shù)字邏輯設(shè)計(jì)。 使用優(yōu)化的邏輯庫(kù)電路(如組合邏輯,多重建立、多重延遲觸發(fā)器和多位觸發(fā)器(MBFF))以及TSMC 28HPC / HPC +工藝來(lái)獲得面積及性能優(yōu)勢(shì)。
組合單元
優(yōu)化寄存器到寄存器路徑需要豐富的標(biāo)準(zhǔn)單元庫(kù),其中包含適當(dāng)?shù)墓δ埽?qū)動(dòng)強(qiáng)度和設(shè)計(jì)變化。需要合成優(yōu)化功能(與非、或非、與、或、反相器、緩沖器、異或、同或、多路選擇器、加法器、壓縮器等),以創(chuàng)建最佳綜合效果,優(yōu)化的布局技術(shù)需要最大限度地利用最新的繞線(xiàn)算法來(lái)消除擁塞。先進(jìn)的綜合和布局布線(xiàn)工具可以利用不同的驅(qū)動(dòng)強(qiáng)度,以最佳地處理由單元之間的設(shè)計(jì)拓?fù)浜臀锢砭嚯x產(chǎn)生的不同扇出和負(fù)載。
時(shí)序單元
觸發(fā)器的建立時(shí)間加上延遲時(shí)間有時(shí)被稱(chēng)為“死區(qū)”或“黑洞”時(shí)間。 像時(shí)鐘不確定性一樣,該時(shí)間可以侵蝕每個(gè)時(shí)鐘周期,而該周期內(nèi)本可以進(jìn)行一些有用的計(jì)算工作。 需要各種類(lèi)型的高性能觸發(fā)器來(lái)對(duì)這死區(qū)時(shí)間進(jìn)行優(yōu)化處理。延遲優(yōu)化的觸發(fā)器(多重延遲觸發(fā)器)快速地將信號(hào)發(fā)送到關(guān)鍵路徑邏輯中,而建立時(shí)間優(yōu)化的觸發(fā)器(多重建立時(shí)間觸發(fā)器)則可以更快的捕獲寄存器。綜合和繞線(xiàn)優(yōu)化工具可以有效利用這些多重建立或多重延遲觸發(fā)器組,從而提高15-20%的性能。
圖7:時(shí)序單元用于解決高性能核心設(shè)計(jì)挑戰(zhàn)。多重觸發(fā)器可實(shí)現(xiàn)定向優(yōu)化
圖8:將兩個(gè)單位觸發(fā)器組合成具有共享時(shí)鐘的雙觸發(fā)器
多位觸發(fā)器提供了一組額外的觸發(fā)器,已經(jīng)針對(duì)功耗和面積進(jìn)行了優(yōu)化,在性能和布局靈活性方面進(jìn)行了輕微的折中。觸發(fā)器共享一個(gè)公共時(shí)鐘引腳,這便降低了多位觸發(fā)器單元中N個(gè)觸發(fā)器的總時(shí)鐘負(fù)載,減少相應(yīng)的漏電功耗,并明顯降低時(shí)鐘樹(shù)上的動(dòng)態(tài)功耗(雙重觸發(fā)高達(dá)50%,四重或八重會(huì)降低更多)。
多位觸發(fā)器通常用于不在最高芯片工作頻率的關(guān)鍵路徑模塊中。它們的范圍從小型的面向總線(xiàn)的系統(tǒng)級(jí)芯片(SoC)配置數(shù)據(jù)寄存器(僅在上電時(shí)計(jì)時(shí))到每個(gè)周期都計(jì)時(shí)的、同時(shí)之間有多種變量的主要數(shù)據(jù)路徑。系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)人員使用替換比率,通過(guò)設(shè)計(jì)中標(biāo)準(zhǔn)觸發(fā)器的被替代的數(shù)量來(lái)衡量,和其產(chǎn)生的PPA改進(jìn)結(jié)果,以確定其整體芯片功率和面積節(jié)省量。多位觸發(fā)器和被替代的單位觸發(fā)器也必須具有相同的功能(時(shí)鐘邊沿、置位/復(fù)位和掃描配置)。
圖7顯示了一個(gè)32位處理器,該處理器用TSMC 28HPM(藍(lán)線(xiàn))的邏輯庫(kù)綜合,且再次用TSMC 28HPC(橙色線(xiàn))邏輯庫(kù)綜合,您可以發(fā)現(xiàn)會(huì)得到更小的面積以及更高的性能。而使用Synopsys高性能核心設(shè)計(jì)套件中的創(chuàng)新邏輯單元將使系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)人員在更小的面積內(nèi)實(shí)現(xiàn)給定頻率或者得到更高的頻率,如紅色和藍(lán)色虛線(xiàn)所示。使用28HPC +工藝將該曲線(xiàn)向右移動(dòng)15%。
圖9:使用Synopsys邏輯庫(kù)將28HPM工藝與28HPC工藝進(jìn)行比較,并添加Synopsys HPC設(shè)計(jì)工具庫(kù),通過(guò)時(shí)序約束來(lái)設(shè)計(jì)32位處理器,直到該庫(kù)無(wú)法使時(shí)序收斂
與最新數(shù)字EDA工具功能結(jié)合
TSMC 28HPC/HPC+工藝的邏輯庫(kù)必須通過(guò)數(shù)字EDA工具來(lái)進(jìn)行綜合,布局,繞線(xiàn),驗(yàn)證和優(yōu)化以獲得最優(yōu)的性能,功耗和設(shè)計(jì)規(guī)則兼容性。數(shù)字EDA工具和流程使設(shè)計(jì)人員能夠充分利用電路創(chuàng)新,如多位觸發(fā)器和緊湊布局設(shè)計(jì)成最有效的邏輯庫(kù)。
總結(jié)臺(tái)積電(TSMC)的28HPC高K金屬閘工藝改進(jìn)了工藝規(guī)則和可變性,以利用更少的功耗實(shí)現(xiàn)更小的設(shè)計(jì),更高的性能。 臺(tái)積電(TSMC)的新型28HPC +工藝進(jìn)一步推動(dòng)了其發(fā)展,并提供了令人難以抗拒的平臺(tái)。如果他們擁有合適的邏輯庫(kù),并充分利用這些新的流程功能,領(lǐng)先的綜合、布局和繞線(xiàn)工具可以最大利用這些工藝的改進(jìn)來(lái)滿(mǎn)足嚴(yán)格的設(shè)計(jì)規(guī)范要求。采用TSMC 28HPC / HPC + 工藝的Synopsys邏輯庫(kù)和領(lǐng)先的EDA工具,旨在使系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)人員能夠追求性能、面積和功耗的極限,并充分利用這些新工藝的功能。
-
soc
+關(guān)注
關(guān)注
38文章
4183瀏覽量
218559 -
eda
+關(guān)注
關(guān)注
71文章
2769瀏覽量
173464 -
Synopsys邏輯庫(kù)
+關(guān)注
關(guān)注
0文章
1瀏覽量
2652
原文標(biāo)題:TSMC 28HPC+工藝邏輯庫(kù)改善PPA的六個(gè)方法
文章出處:【微信號(hào):FPGA-EETrend,微信公眾號(hào):FPGA開(kāi)發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論