Chris Rowen :當(dāng)然。那些可以為不同應(yīng)用優(yōu)化處理器的架構(gòu)是很重要的。而且我們也發(fā)現(xiàn),即使在一個新的水平,很多需求也是 相似的。因此同樣的Hi-Fi工具,同樣的音頻DSP,即可部署在世界最好的智能手機(jī)上,也同樣可以部署在最好的數(shù)字電視、藍(lán)光(Blue Ray)影碟機(jī)上。因?yàn)樗欠浅P《斓?。這方面的要求是相同的。
同樣,如果你看下Altas LTE的內(nèi)部架構(gòu),其主要構(gòu)造模塊BBE16或許是世界上最快的DSP核。而它同樣也在數(shù)字電視解調(diào)子系統(tǒng)中使用。同樣再一次因?yàn)樗目焖?、易編程,以?節(jié)約功耗。所以,我們可以看到在手機(jī)和客廳之間,在這兩個媒體處理器和基帶處理器之間,都有著共同的需求。
7、我看到您說,芯片的整合將集中在射頻、存儲和數(shù)字電路。那么您覺得它們?nèi)哌€有可能合并成一個嗎?
Chris Rowen :嗯。如果你從半導(dǎo)體工藝(Semiconductor Process)技術(shù)的角度來看,我認(rèn)為在晶體管和器件優(yōu)化的層面將會有些事情發(fā)生。因此在某些情況下,你可以作出權(quán)衡。特別是,我們正與很多客戶一起工 作,以簡化射頻電路。通過盡量多的數(shù)字處理器,你可以部分程度地脫離射頻和數(shù)字間的邊界。由于相比射頻而言,數(shù)字會有更加陡峭的生產(chǎn)成本曲線(Cost Production Curve),我們也就有更大的動力去做。因此,我們會越來越依賴于數(shù)字方面的有效解決方案。
同樣的事情發(fā)生在存儲器。人們偶爾也會使它們結(jié)合在一起,但不是一個簡單的組合,內(nèi)存的加工設(shè)備(Fabrication Facility)與一般的優(yōu)化有所不同。所以我相信,多芯片封裝(Multi-Chip Packaging)將越來越重要。尤其當(dāng)你將芯片組(Die)一塊又一塊摞起來的時候。所以,你可以在數(shù)字芯片組上面摞存儲芯片組,然后上面再摞射頻芯 片組。這有可能在成本上是最劃算的。然后也可能有一種折衷的工藝技術(shù),把它們所有三個都放在一塊硅片上。這取決于你的應(yīng)用程序,比如需要一些存儲單元,又 或者需要一些射頻的單元。
但最終,我想我們還會堅持三套不同的加工工藝,然后依靠封裝技術(shù)來整合在一起。不過這并不意味著,只要你能想辦法把它們?nèi)齻€捏一塊兒,你就得到一個 系統(tǒng)(System)了。因?yàn)檫€有物理屬性的要求,比如要多加塊電池什么的。但總的來說你要知道,物理尺寸是會越來越小了。
但你要知道還有個巨大的挑戰(zhàn),就是人們的手指不能變小,眼睛也不能變小。所以所謂得到“小尺寸”的設(shè)備,我們還是有實(shí)際限制的。我們在元器件層面的小,其實(shí)是對應(yīng)于我們自己可以接受 多小的屏幕和按鈕。所以說到最后,這事兒還是更和成本相關(guān)。
8、在書里您還預(yù)測了FPGA的未來。而幾天之前,Xilinx宣布嵌入ARM 的Cortex A9核。您覺得這是否是一種新趨勢?是否與Tensilica的 DPU形成競爭呢?
Chris Rowen :其實(shí)……并沒啥。我的意思是這種往處理器里一股腦嵌入FPGA的活兒,大概已經(jīng)折騰了快10年了。Altera宣布他們與ARM互相嵌的時候,讓我想想啊,也是8年前了吧? (Larry:沒錯!)
所以,這就跟任何一個系統(tǒng)想要找塊芯片,或者三塊芯片一塊兒呆著,沒啥區(qū)別。當(dāng)然,偶爾你也會碰巧搞出一塊啥都囊括了的數(shù)字芯片。話說回 來,F(xiàn)PGA兄弟們有一個根本性的挑戰(zhàn),那就是FPGA的通用性非常高,可以做的事兒也賊多。但禍福相倚,要是讓它專注做一件事的話,也就不是那么有效率 了。所以,如果你想真正有效地利用處理器,我估計你情愿在處理器里隨便嵌一個稍微穩(wěn)定點(diǎn)的東西,而不是FPGA。
我認(rèn)為這是非常自然的一步。Xlinx以前也搭過Power PC,對吧?這其實(shí)是一碼事。它壓根沒有改變?nèi)魏卧械募軜?gòu),也沒有在CPU和FPGA的功能之間取得任何邏輯上的合并(Merge)。部分是因?yàn)樗麄儧] 有任何合并的工具軟件模式。
當(dāng)然,F(xiàn)PGA是很容易配置的,而且價格也便宜。因此,他們占據(jù)了一部分的市場,尤其是那些量低而開發(fā)成本又低的。因此,我們在市面上看到大量的FPGA設(shè)計。但是基于FPGA的設(shè)計總量是很小的。它其實(shí)是一個利基(Niche)市場。極端地說,即便有很多工程師在使用它,但幾乎所有都是低產(chǎn)量 的。
所以我的意思是,F(xiàn)PGA很重要,但不是Tensilica公司關(guān)注的。我們專注于高產(chǎn)量,并且?guī)椭切┰噲D在設(shè)計上節(jié)約幾納米硅片的兄弟們。他們離得是遠(yuǎn)了點(diǎn)兒。當(dāng)然他們偶爾也會重疊。譬如基站。以前有很多基站是采用Altera的儲存方 案的。挺重的。慢慢地我們看到越來越多因?yàn)槿萘?、成本和功耗的要求,從FPGA轉(zhuǎn)向了更加高集成度的芯片解決方案。
9、我在IEEE的設(shè)計與測試(Design & Test)上看到一篇您的談話。您說,如果我們想要進(jìn)入嵌入式系統(tǒng)設(shè)計的大規(guī)模并行領(lǐng)域,可配置的多核處理器SoC就有一些問題必須得到解決。幾年前,您 還提到過,Intel最大的問題是怎樣為通用計算應(yīng)用配置多核處理器。您現(xiàn)在還覺得多核處理器遭遇困境嗎?
Chris Rowen :這個……其實(shí)是分開的兩碼事。對于多核應(yīng)用層面而言,確實(shí)存在著重大考驗(yàn)。就是如何找到足夠多的線程 (Thread)來運(yùn)行。但它不是Intel單獨(dú)遇到的問題。這是一個涉及到應(yīng)用程序是如何被調(diào)用,以及在當(dāng)下如此小型的設(shè)備上如何架構(gòu)的問題。即便打開 我自己的筆記本電腦,當(dāng)我想看看到底有多少個線程準(zhǔn)備在跑,它基本上都是很少的。通常情況下,操作系統(tǒng)、用戶界面和應(yīng)用程序開發(fā)等等所調(diào)用的方式,都完全 沒有最大化利用線程的數(shù)量。
所以,我認(rèn)為你在基本的架構(gòu)層面可以做的,就是提供更多的線程運(yùn)行,并且充分地利用到并行。當(dāng)然在應(yīng)用層面也會有很多層級限制。你知道現(xiàn)在很方便就 去搞個四核八核十六核的,但是在PC這一端,相對于服務(wù)器,只有相對較少的條件可以讓我們找到這些線程。于是一大現(xiàn)象便是操作系統(tǒng)和應(yīng)用程序的逐步重組 (Restructuring)。
另一個同樣重要的現(xiàn)象是,確定哪些任務(wù)可以被放進(jìn)數(shù)據(jù)層(Data Plane)。讓我們來想想哪些東西通常是可以被放進(jìn)數(shù)據(jù)處理器的,譬如在無線信道這類的通訊子系統(tǒng),譬如存儲系統(tǒng),比如你怎么分發(fā)數(shù)據(jù),或者你知道的, 安全冗余,也可能是針對壓縮流(Packing Stream)的特殊網(wǎng)絡(luò)處理器,它可以是視頻也可以是音頻。這些東西其實(shí)是更本質(zhì)(Inherently)的并行處理。
所以吧,我覺得這里有兩種并行重組。其一是所謂的,去各地兒找更多的線程應(yīng)用。另一種是為了維持整體系統(tǒng)中卸載(Off Loading)并行部分的最大值,并讓之進(jìn)入數(shù)據(jù)層。實(shí)際上我認(rèn)為,在數(shù)據(jù)層提取并行是更容易操作的。因此,在數(shù)據(jù)層有效使用多核的數(shù)量,遠(yuǎn)大于單單在 應(yīng)用層面使用的多核。這也就是為啥我們認(rèn)為自己正走在康莊大道上。關(guān)注于數(shù)據(jù)層,可以使我們在多核方面的成長速度大大超過那些只盯著應(yīng)用層面的兄弟。
10、所以在手機(jī)上就不是個問題咯?
Chris Rowen :恩可以這么說。這變得相當(dāng)容易,讓我們舉一個LTE基帶(Baseband)的例子吧。我們的Atlas平 臺可以弄出七或八核,取決于你想怎么用。DoCoMo和他的合作伙伴,NEC、富士通以及松下,已經(jīng)宣布并且詳細(xì)描述了他們LTE基帶架構(gòu)。第一代是8到 10核。另一個叫做Blue Wonder Communication的合作伙伴也推出了他們的8至10核的LTE基帶。因此,現(xiàn)在就有三種不同的LTE基帶,而這三種都使用了約8個核。在這個層 面上是可以有大量的并行解決方案的。
再看看下一代的LTE,大概有六點(diǎn)性能方面的因素需要考慮。其中一些是單核怎樣可以更快,但更大部分和多核有關(guān)。所以我們很容易找到那些有效應(yīng)用而 20核甚至更多核于單一功能譬如基帶的案例。和那些圍觀應(yīng)用處理器的哥們比起來,他們?nèi)绻杏X好,就整兩個核玩玩;如果還很爽,那就再整四個。我覺得在數(shù) 據(jù)層和應(yīng)用層上,多核是有完全不同的機(jī)會的。
11、最后一個問題:您當(dāng)年在斯坦福參與奠基了RISC 架構(gòu),后來也曾是MIPS的共同創(chuàng)始人。那么,請問您如何看待RISC架構(gòu)的未來?依舊是ARM和MIPS之間的戰(zhàn)爭,抑或會發(fā)生一些新的大事件?
Chris Rowen :這個……在科學(xué)上,理想架構(gòu)已經(jīng)完全改變了。這場關(guān)于CISC和RISC架構(gòu)的爭論,其實(shí)就是通用(General Purpose)架構(gòu)甲跟通用架構(gòu)乙之間的競爭罷了。RISC贏得了一職半銜,是因?yàn)樵谀硞€特定時期內(nèi)它手下有好幾十項(xiàng)半導(dǎo)體技術(shù)。但在這場戰(zhàn)爭中,摩爾 定律一下給出了這么多的晶體管,以至于你隨便搞個簡單的解碼或者流水線,都能奢侈地愛用多少就用多少。沒人管。所以一個RISC解碼器可能要一萬門,而 CISC解碼器需要五萬門。其實(shí)也差不多了多少。
不過我覺得除了通用架構(gòu)之間互掐以外,還有一場更加深遠(yuǎn)的革命。我們現(xiàn)在來比較通用架構(gòu)和一大家子的特殊用途(Special Purpose)架構(gòu),怎么樣?幾乎任何時候你都可以說,如果一個產(chǎn)品是圍繞某種特定的需求來設(shè)計,那么特殊用途架構(gòu)鐵定勝出。RISC扁了CISC一段時間,因?yàn)樗男矢叱?倍以上。那么為具體應(yīng)用特殊定制的架構(gòu),就比所有通用架構(gòu)都高效5至10倍以上了。
因此,這個世界不能再簡單分成我的通用架構(gòu),和你的通用架構(gòu)。當(dāng)然對于那些非常分散(Defused)并且普適(Generic)的應(yīng)用程序,就好 比在筆記本上用的那些,我們還是需要通用架構(gòu)的。因?yàn)橐粫耗阋匆曨l,一會兒又要運(yùn)行Word或打游戲,或者Excel工作表。這是非常多 樣的。所以你需要一個德智體全面發(fā)展的處理器。不能太特別。
但總之,你不得不面對一個世界,那里有各種各樣不同的任務(wù),而每樣任務(wù)都是獨(dú)特的。而且更為重要的是,當(dāng)你因?yàn)槟柖啥谛酒霞傻钠舷到y(tǒng)越 多,你越會發(fā)覺有足夠多的處理器適用于各種特定的應(yīng)用子系統(tǒng)。
因此對于我來說,計算的未來不是產(chǎn)生新的通用架構(gòu),而是特殊用途架構(gòu)的集合。譬如一個音頻子系統(tǒng)、視頻子系統(tǒng),一個基帶子系統(tǒng)、存儲子系統(tǒng),哦對, 還有應(yīng)用處理器子系統(tǒng)。其中只有一個需要通用的結(jié)構(gòu)(Construction),其他里面都將是特殊的架構(gòu)。在科學(xué)上,摩爾定律帶來多核,多核又將帶來 特殊架構(gòu)的解決方案。異型多核(Heterogenic Multi-Core)就是一種新架構(gòu)。而且我覺得會成為主流。Intel、ARM、MIPS這些公司當(dāng)然還會有很大的市場,但只限于應(yīng)用處理器領(lǐng)域。其實(shí)在科學(xué)上,通用目的(General Purpose)最終就會變成某一個特殊目的(Specific Purpose)。
更多ic設(shè)計資料請訪問http://elecfans.com/el@jfchina~~/archives_do.php?aid=254239&dopost=viewArchives
評論
查看更多