“時來天地皆同力,運去英雄不自由”。
計算機背后的集成電路已由上世紀 40 年代占地 150 平方米、重達 30 噸的龐然大物,演進成僅有手指般大小的超高密度的電子芯片。芯片是 IT 時代的算力底座,市場規模近萬億美元,但這個領域一直是我們被“卡脖子”的軟肋。
近日,接連不斷的并購案和頻繁涌現的新品發布,讓芯片行業處于前所未有的大變局之中。
去年 9 月,英偉達宣布以 400 億美元的價格從軟銀手中收購 Arm,以加強自己在 CPU 方面的短板,憑借 CPU+GPU 的方式正式進軍云數據中心;10 月,英特爾宣布將 NAND 業務以 90 億美元的價格賣給 SK 海力士;同月,AMD 收購 FPGA 行業的巨頭 Xilinx,同樣劍指云數據中心;而這樣紛繁復雜的局面在一代神芯蘋果 M1 發布之后變得更加撲朔迷離。
不僅如此,近期英特爾也官宣將在一個月后換帥,現任掌門人 Bob Swan 此前是英特爾的財務官,缺乏技術方面的專業背景。可能也正是由于這方面的欠缺,英特爾在技術層面衍生出許多問題,遲遲陷在 14nm 制程上無法突破,也帶來了“火線換帥”的局面。
此外,另一巨頭英偉達帶著 RTX3060 也正式登場,并采用了 3584 CUDA 核心,GPU 頻率可達 1.78G Hz,配備了 12GB 的 GDDR6 顯存,可以說英偉達在顯卡市場上也開始拼盡全力了。
在此趨勢下,我們不僅要看清芯片巨頭們的競爭格局,更要躬身入局,加快我們自身的追趕步伐。也希望本文能為正走在這條道路上的技術人們帶來一些思考。
1. 蘋果 M1 芯片“抗打”
眾所周知,IT 界每十年就會產生一種新的生態,如二十年前的 Wintel 的 PC 生態、如十年前 Android、iOS+ARM 形成的移動終端生態,未來的一兩年內,想必也會有新生態形成,因此哪種芯片能夠領先競爭對手,那么誰的生態就可能笑傲江湖,而統治 IT 生態對于科技巨頭而言是保持基業常青的最大砝碼,這也是蘋果耗費巨大精力也要打造出 M1 的主要原因。
M1 的優勝原因在于,目前計算機的體系架構更偏向于劃定界限明確分工,CPU、內存等模塊都是彼此都是獨立的,不過 M1 打破了這個潛規則,本質上 M1 并不是一顆傳統意義上的 CPU,而是 CPU、GPU、內存乃至協處理器集成在一塊 SOC 上的微型主機。
不過,這樣做的缺點是擴展性差,使用 M1 的主機無法擴展內存,但這樣的好處也非常明顯,集成式 SOC 所帶來的性能提升令人驚嘆。據最新的評測來看,M1 的單核得分超過了 AMD 最新的 ZEN 3 架構的 Ryzen 9 5950X 和 Intel i9-10900K。
M1 不僅 CPU 性能強悍,它的圖形性能也很出眾,已經完全脫離了之前業界對于集成顯卡的理解范圍。據數據顯示,M1 的顯卡性能與英偉達的 GTX 1650 與 GTX 1050Ti 之間,比目前輕薄本主流集成顯卡性能高出好幾個數量級。
另外,M1 的功耗也非常低。據網友用《古墓麗影:崛起》進行測試案例結果時,M1 的平均功率分別是 CPU 7.5W、GPU 7W,作為對比僅是 1650 顯卡功率要求就有 75W。
這樣的表現除了對筆記本桌面市場帶來一定震撼外,也為云數據中心指明了一條道路。畢竟,云數據中心不僅對于電力消耗的要求極其高,而且如何為服務器降溫更是一個巨大的課題,業界中如微軟、Facebook 等企業此前為了解決這一難題甚至將數據中心建到海底,阿里云也有液冷服務器的技術,當然這些都是針對 CPU 這個耗能大戶設計的,如果能 CPU 耗能低到 10w 以內,將對于云計算服務商產生巨大的吸引力。
目前云操作系統基本是 Linux 的天下,這意味著,一旦低耗能高性能的 M1 可以平穩運行 Linux,那么云平臺和 Android 平臺的大量生態級應用就可以全部被 ARM 和開源的聯盟收入囊中,這樣帶來的可能性正是開源社區正在全力向 M1 上移植 Linux 的原因,而如何面對 M1 集成式 SOC 的趨勢將是今后各大巨頭的必須要回答的問題。
2. 英特爾“求變”
相比之下,另一科技巨頭英特爾的處境似乎不太好,一直以來 CPU 領域的跟隨者 AMD 已經大有后來者居上的氣勢,不但推出了 ZEN3 架構的 CPU,制程 7nm 性價比也全面超越它,并且還收購了人工智能領域 FPGA 芯片巨頭賽靈思。
英特爾在 14nm 制造上遲遲無法突破,而蘋果這樣的消費者硬件廠商,對于先進制程芯片帶來的節能效應還是非常看重的,因此蘋果發布自研 M1 終止與英特爾合作,這使得英特爾無論如何也不能再擠牙膏了。
英特爾于日前宣布任命帕特。基辛格為新任 CEO,與前任 CEO 財務出身不同,基辛格是與英特爾一起成長起來的技術專家,新帥基辛格的回歸勢必要劍指先進制程。
不過,近來以來,芯片市場中桌面業務明顯趨于萎縮,而云計算領域卻是不斷增長,英偉達收購 ARM、AMD 收購賽靈思其實都是在布局云數據中心。在這里,不得不提一下基辛格的前東家,2012 年,基辛格接手 VMware CEO 一職,經過多年的努力,如今 VMware 在云計算方面幾乎沒有敵手,取得了營收翻 3 倍的成績,且在虛擬化云計算領域也是佼佼者,因此基辛格的王者歸來,讓大家對英特爾充滿了期待,也相信英特爾將很快會重新取得突破,迎來嶄新未來。
3. AMD vs NVIDIA:關鍵在制程
在顯卡市場,一直被英偉達(NVIDIA)吊打的 AMD 也在近期迎來了高光時刻,AMD 在去年年底發布的 RX6000 系列顯卡在很多方面幾乎反過來壓制了英偉達同級別的 GPU。事實上,制約顯卡性能最大的因素在于帶寬,而RX6000 系列有 RDNA 2 無限緩存技術的加持,相比 RDNA 帶寬提升 50%,頻率提升 30%,這意味著 RDNA 2 的默頻可以輕松達到 2G 以上,這對于性能的提升幅度將是巨大的,而微軟官宣 XBox X|S 是全球唯一搭載 RDNA 2的游戲主機平臺,這樣的表態可以看作是微軟對于 AMD 顯卡性能的一種“背書”。
而 AMD 能在 CPU 領域與英特爾一較長短,在 GPU 也能和英偉達正面較量的關鍵原因還是在于制程。
此前,由于財務原因,AMD 在 2008 年底賣掉了自己的晶圓廠,自此以后,AMD 的主要芯片代工制造商就是臺積電,這樣的結盟使得 AMD 能夠率先用上 7nm 的制程。正如我們上文所說,能掌握先進節能的芯片,對于 IT 廠商建立自身生態意義非凡,因此才會出現眾巨頭爭搶臺積電產能的情況。
憑借對先進制程的把握與高超的芯片工藝水平,近些年來,英偉達也將很多之前屬于三星的訂單轉投給臺積電,根據今年三季度的財務,臺積電這家芯片制造業的巨頭今年的毛利潤率已經達到了 53%,這代表他們芯片制造的成本還不到出廠價的一半,這在世界 500 強的公司當中是絕無僅有的,甚至遠超被稱為 IT 界奢侈品牌的蘋果公司。
建設和維護晶圓廠實在太花錢了,還需要不斷按部就班的升級工藝,業界目前也就臺積電和三星兩大玩家。由于分工的明確化,臺積電從起家就一直專注于芯片代工,不僅工藝升級非常快,而且在良品率上也很讓人滿意,而且臺積電多年來從來沒有涉及過芯片設計,對 AMD、英偉達這類客戶芯片 IP 保護工作做的非常好,也正是由于專注在芯片制造,臺積電才有精力和財力把業務做好做大,這也符合未來芯片行業的分工趨勢。
基于以上,在看清巨頭的紛爭后,我們還是要解決自己的問題,在打壓了華為、大疆以后,最近美國又把目光盯上了小米、中微電子等公司,通過分析巨頭們的策略,筆者認為針對芯片的不同領域,我們需要采用不同的策略加以應對。
4. 國芯前路之 EDA:相信時間累積而非資本力量
EDA 其實是工業軟件計算機輔助設計 CAD 的一個分支,依靠 EDA 工具,芯片設計人員可以從概念、算法、協議等開始設計電子系統,完成電子產品從電路設計、性能分析到設計出 IC 版圖或 PCB 版圖的整個過程。
有數據顯示,2018 年全球 EDA 市場規模還沒突破 100 億美元,EDA 相對于幾千億美元的芯片產業來說從產值上看根本不值一提,不過少了 EDA 整個芯片產業都得停擺。EDA 市場前三位的 Synopsys、Cadence 和西門子在我國 EDA 的市場份額達到 95% 以上,因此 EDA 軟件是我們芯片行業亟待突破的第一關。
EDA 行業是一個典型的小而美的行業,可分為前端和后端,前端主要負責邏輯實現,后端跟工藝緊密結合。
與 MATLAB 等工業軟件一樣,EDA 的前端技術需要最新邏輯元件的資料輸入,不過大部分國產 EDA 廠商還無法支持 7nm 的邏輯元件,與臺積電、三星等頂級芯片制造商的聯系較少,巧婦難為無米之炊,沒有最新工藝資料 EDA 前端,很難真正做好。
EDA 后端則需要高質量的模擬與仿真,這需要長時間的技術積累,乃至不斷地并購才能保持自身在技術迭代的浪潮中保持優勢的方法。筆者認為想解決國內的 EDA 軟件問題,或可從以下幾個方面入手:
國家層面不斷推動企業整合。這方面美國的經驗非常值得我們借鑒,他們的 EDA 企業并非沒有過惡性競爭,不過政府并沒有放任這種競爭的持續而是直接出手干預了市場。EDA 三巨頭之一的 Synopsys 成立以來,就發起幾十余項并購交易,不斷尋找那些在 EDA 功能模塊中做得比較有特色的成功企業進行并購,從而使得自身能夠覆蓋前后端整個設計流程。
尤其是 2002 年 Synopsys 在美國商務部、司法部的牽線下,以 8.3 億美元收購了 Avanti 公司,使得 Synopsys 成為 EDA 歷史上第一家可以提供頂級前后端完整 IC 設計方案的領先 EDA 工具供應商,并在 2008 年超越 Cadence 成為全球最大的 EDA 工具廠商。
而值得注意的是,在此之前 Avanti 一直與 Cadence 公司深陷于專利官司之中,這場并購幾乎由美國政府主導,也正是通過這樣的并購,使得美國的 EDA 公司結束了專利內斗,迅速拓展并占領了海外市場。
持續提高投入。以 EDA 的三巨頭為例,從三家公司財務來看,其最大支出部分用于產品的研發,其中 Synopsys 和 Cadence 這兩家公司在 2019 年的研發支出超過了 20 億美元。
加大人才培養力度。綜合來看,國內包括芯愿景、華大九天等在內的 EDA 公司,最大短板在于研發力量的薄弱,而我們需要不斷加強人才的培養與輸出。
5. 國芯前路之指令集:重點突破優先
既使有了 EDA 軟件,進行芯片設計了,我們的芯片設計師們在動手之前,也必須先決定芯片的指令集。
指令集之所以重要,舉例說明,正如 x86 芯片中有 SSE(Stream SIMDExtentions)數據流單指令多數據擴展,SSE 系列指令提供了 8 個 128bit 的寄存器進行 SIMD 操作。
目前主流的 CPU 是 64 位的,即在一個 CPU 振蕩周期都只能處理 64 位長的數據并得到一個 64 位長的結果,而 SSE 的擴展恰恰就是可讓 64 位的 CPU 在一個周期內對 128 位長的數據進行處理并得到 128 位長的結果,從而大幅提高雙精度數據的處理效率。因此我們看到很多用于科學計算的軟件包底層都是使用 C 語言內聯嵌入 SSE 匯編指令的代碼進行性能優化,并取得極好的效果。而 ARM 系列芯片的成名之作就是大小核,其中大核專門針對性能優化,小核專門針對功耗優化,可謂忙時用大核干得歡,閑時用小核歇得爽。像這樣的芯片指令集都是被專利保護的,想使用必須得到 IP 授權,因此指令集也是一個我們必須直面困難的領域。
目前我國擁有完整知識產權的芯片指令集就是龍芯在去年底時發布的 LoongArch。LoongArch 是一種可以支持模擬運行 x86 或者 ARM 的指令集,因此可以深度兼容 Windows、Linux、Android 程序,但是這種模擬運行也有性能損耗,而且從目前來看這種性能代價還是不小的,當然據筆者所知龍芯目前正在全面優化虛擬化模擬的代碼,以盡力將損耗壓縮到 20% 以內。
除了 LoongArch 以外,RISC-V 也是一個突破方向。
RISC-V 是 2010 年新出現的開源精簡指令集架構,架構設計上沒有歷史包袱,采用的理念和方法較為先進。和主流架構 x86/ARM 相比,RISC-V 架構篇幅更少,基本指令集更少,支持模塊化和拓展性,而且為貫徹開源精神,目前 RISC-V 基金會已經有搬遷至瑞士的計劃了,不過 RISC-V 架構出現時間晚,適配軟件和工具方面沉淀不足,目前雖然由阿里達摩院推出了號稱最強 RISC-V 的玄鐵 910 芯片,不過總體上講其生態環境構建尚需時間。
6. 國芯前路之晶圓制造:還需國家引導基礎科學發展
與 EDA 相同,晶圓制造也是一個需要時間積累的領域。在制造領域需要光刻機、光掩膜、光刻膠與芯片工藝相結合才行,這其中涉及太多基礎物理、化學方面的知識。
不過我國光刻技術的起步并不晚,早在上個世紀 60 年代,中科院就開始研究光刻機了,并且在 1965 年就研制出 65 型接觸式光刻機,1972 年武漢無線電元件三廠編寫的《光刻掩模的制造》的書中,具體講述了當時那個時代,我們光刻技術的發展歷程,后來 1980 年中國清華大學第四代分布式投影光刻機獲得成功,將光刻精度縮小至 3 微米,這個制程與當時國際先進水平非常接近,有關這段往事筆者曾經在前文《國產芯回憶錄:造光刻機的去賣早點,搞 EDA 的去組裝電腦》中介紹過了,這里不加贅述了。
而我們想在芯片制造方面突破,最關鍵的還是要靠國家層面的政策支持與引導。
此外,我們也必須清醒的認識到,芯片雖然是 IT 領域的核心產業,但芯片制造卻更偏向于基礎科學的屬性,只能結硬寨,打硬仗,沒有捷徑可言,這里筆者也呼吁業界同仁給予華為以及我國整個芯片業以更多耐心,以期破壁圖強,逆境重生。
責任編輯:tzh
-
芯片
+關注
關注
455文章
50817瀏覽量
423683 -
集成電路
+關注
關注
5388文章
11547瀏覽量
361840 -
cpu
+關注
關注
68文章
10863瀏覽量
211786 -
蘋果
+關注
關注
61文章
24411瀏覽量
198787
發布評論請先 登錄
相關推薦
評論