芯片已經(jīng)成為生產(chǎn)力提升過程中的絕對主角。 ? 上周三,美國收緊對于我國的芯片政策,相比上次,這次更加嚴苛,不僅用于AI計算的高算力芯片被禁,還可能要波及4090這樣的消費級產(chǎn)品。 消息發(fā)出后,4090顯卡瞬間成為微博熱搜,雖然現(xiàn)在還無法確定4090顯卡是否會正式出現(xiàn)在這一波的名單中,但從美國修改政策頻率來看,芯片已經(jīng)成為生產(chǎn)力提升過程中的絕對主角。 ? 盡管近些年,我們在GPU或者說加速計算芯片上出現(xiàn)了壁仞100這樣不錯的產(chǎn)品,但去年剛流片成功的它,今年就被寫上了實體清單,所以壁仞100大規(guī)模量產(chǎn)很有可能將被推遲。因此,目前在市場上我們還看不到類似英偉達或者AMD的國產(chǎn)GPU。 但在起步更早的國產(chǎn)CPU領域,已經(jīng)可以看到一些可以達到國際主流水平的產(chǎn)品了,比如在這個月GMIF2023大會上,龍芯宣布最新CPU——3A6000將會在這個季度正式發(fā)布。 ? 作為一直關注***領域的我們,也是早早申請了媒體測試機,終于在兩周前拿到了搭載3A6000的主機。
***啥樣?
打開主機,不僅主板和CPU出自龍芯,其余配件也都出自國產(chǎn)廠商,內存和硬盤也分別來自紫光和大華,機箱電源也是來自愛國者。只有顯卡采用了AMD的RX580芯片,但戰(zhàn)狼的型號命名,讓它在一眾國產(chǎn)配件前也不是很違和。 龍芯3A6000實拍圖,右上角的ES代表測試版 這塊最新主板上還集成了龍芯自主研發(fā)的最新7A2000橋片,除了用來控制像USB,音頻,網(wǎng)絡這樣的接口外,里面還集成了龍芯自研的GPU芯片,也就是說,即使不裝上顯卡,這臺電腦依然可用,并且實現(xiàn)了全部配件100%國產(chǎn)化。 龍芯自主研發(fā)的7A2000橋片,帶有GPU功能 在系統(tǒng)方面,除了主流的國產(chǎn)統(tǒng)信操作系統(tǒng)還有龍芯自研的Loongnix。兩者都是基于Linux的系統(tǒng),但為了照顧大家的習慣,在界面設計上都非常貼近Windows,所以用起來的學習成本很低。
真的追上10代酷睿了嗎?
在流片成功時,龍芯官方公眾號曾發(fā)文稱,3A6000的總體性能已經(jīng)追上2020年上市的Intel第10代酷睿4核心處理器,雖然Intel最新的產(chǎn)品是第十三代,但這些年CPU性能過剩,第10代的性能已經(jīng)足以覆蓋日常辦公,娛樂和游戲等需求。 并且在頻率方面,10代i3也領先不少,它的基礎頻率就達到3.6Ghz,睿頻加速后,單核最高可以達到4.3Ghz。而龍芯3A6000的頻率和前一代一樣,只是固定的2.5Ghz,不過這次它增加了超線程技術,從4核心4線程升級到了現(xiàn)在的4核心8線程。 這次測試,我們采用了兩款軟件——SPEC 2006用來測試CPU和Stream用來測試內存速度。 SPEC作為市面上專業(yè)的測試軟件,SPEC是先編譯然后再運行各類測試項目,所以這個軟件理論上可以運行在各種架構CPU和各類的系統(tǒng)中,無論是X86還是LongArch,無論是Windows還是Linux上,SPEC都可以用來測試當前平臺處理器的性能。因此SPEC也成了目前主流的CPU測試軟件。
SPEC編譯過程截圖 Stream用來測試CPU和內存之間的速度,在CPU設計中,內存控制器是非常關鍵的一環(huán)。因為要處理的數(shù)據(jù)一般都儲存在內存中,所以如果CPU計算速度上去了,但是和內存之間的數(shù)據(jù)交換速度過慢,就會大大限制CPU的發(fā)揮。所以Stream也是必要測試的一個項目。
Stream測試過程截圖 在SPEC2006的測試中,龍芯3A6000的整數(shù)部分單核得分40.4,多核得分146,浮點部分單核得分51.6,多核得分136。
SPEC得分截圖 而10代i3的只有整數(shù)單核和浮點多核的得分略高于3A6000,其他兩個項目龍芯得分均超過對手。(10代i得分:整數(shù):單核42.5 多核147 浮點:單核51.3 多核 150) 在這個純CPU計算性能比拼中,龍芯可以說是和10代i3打了一個五五開。看來在計算性能方面,現(xiàn)在的龍芯可以讓大家放心了,接下來看看新一代龍芯在內存交互上有著怎么樣的表現(xiàn)。 在Stream測試中,龍芯和內存的最高交互速度出現(xiàn)在四線程的測試中,四個項目的速度都超過了40GB/S,在同樣的項目中,i310100F只有30GB/S,同樣的情況也出現(xiàn)在單線程和8線程的測試中。因此,在內存控制器方面,龍芯的表現(xiàn)已經(jīng)超過10代酷睿i3了,并且還超出不少。
Stream最終成績,均超過40G/S 綜合上面的這兩項測試來看,在理論性能方面,龍芯3A6000確實已經(jīng)有10代酷睿四核處理器的水平。那么在實際體驗中,用起來是怎么樣的呢? 不過在此之前,要說一個非常有意思的事情,在拿到龍芯主機時,為了測試兼容性,我把同事的兩條頻率為3200的16G金士頓內存插上去,測試沒有問題后,就一直用了下去。在SPEC跑分的時候,成績總是低不少,后來把兩條國產(chǎn)內存換上去,分數(shù)就正常了,看來這國產(chǎn)硬件之間似乎可以產(chǎn)生某種神秘的BUFF。
***能干啥?
作為自主的研發(fā)的代表,龍芯的3A6000在底層上采用了自主研發(fā)的LoongArch(以下稱龍架構),和Intel的X86架構有著非常大的區(qū)別。 所以龍芯的CPU無法裝載Windows系統(tǒng),目前只能使用開源的Linux系統(tǒng),而不同的架構和系統(tǒng)讓很多Windows上的軟件無法在龍芯的系統(tǒng)上運行。 所以,我們在測試完性能后,還要看看龍芯的生態(tài)軟件發(fā)展成什么樣子了,不然買回龍芯電腦只能用它來跑分,而不能用來實際使用一些日常軟件,就有些說不過去了。 龍芯目前最主要的任務肯定就是辦公生產(chǎn)力了。Linux版本的WPS已經(jīng)可以很好的適配龍架構了,使用起來和Windows上的不能說大差不差吧,只能說一模一樣。大家看到的這篇稿子就是我在龍芯電腦上敲出來的。 ? 輕度辦公沒問題了,那么重度呢?讓我們一起測測看吧。 首先打開50M的百萬字的Word文件,基本上可以實現(xiàn)秒開,在經(jīng)過幾秒加載后,就可以順暢地編輯全文了。在打開200M的Word文件時,會有3秒左右的延遲。這種情況和我日常使用的11代i3移動處理器差不多。 接下來的50M的Excel和PPT以及500頁的PDF,都是可以實現(xiàn)秒開,并且直接編輯。但旁邊的筆記本這次就要慢上很多了。 ? 在娛樂方面,主板橋片上集成GPU就有點撐不住了,在播放4K本地視頻的時候,基本上處于播放PPT的狀態(tài)。 裝上RX580戰(zhàn)狼顯卡后,視頻播放就沒有什么壓力了,本地4K和B站在線4K都非常流暢,不過要說明一點,在B站觀看4K視頻中,如果遇到彈幕較多時,會出現(xiàn)掉幀的情況,并且彈幕越多,掉幀越嚴重。 ? 在游戲上,可以說是有意外收獲了,本來以為Linux上并沒有什么游戲可玩。但現(xiàn)在的龍芯可以通過轉譯(可以理解為把外文翻譯成中文),可以運行不少X86架構上的游戲,并且流暢度都非常不錯。 像勞拉,火炬之光2,甚至魔獸世界都可以流暢運行。經(jīng)典的CS1.6,魔獸爭霸3,通過轉譯也都可以運行起來,并且還非常流暢。 ? 在做轉譯測試的時候,發(fā)現(xiàn)3A6000居然可以運行Photoshop,雖然會遇到字體的BUG,但日常P圖完全夠用了。 ? 像瀏覽網(wǎng)頁等日常體驗,3A6000可以說是毫無壓力,無論是一次開幾十個網(wǎng)頁還是說各大網(wǎng)站的高清視頻播放,體驗完整性上絲毫不遜于Intel等X86平臺。
***目前的最大敵人:生態(tài)系統(tǒng)
通過理論性能測試和日常使用體驗來看,龍芯最新的3A6000確實已經(jīng)追上2020年發(fā)布的10代酷睿四核處理器,并且這還是在頻率比競品低了1個多Ghz的前提下。 按照龍芯董事長胡偉武的介紹,龍芯目前也在踐行Intel的Tick-Tock戰(zhàn)略,目前處于打磨架構的階段。下一代龍芯如果能用上比12nm更加先進的制程,那么性能會變得更加強悍。 在2002年龍芯1號剛剛發(fā)布的時候,性能只有當時主流型號的5%,2021年的3A5000基本能達到當時主流性能的50%(差不多是第四代酷睿的水平),而今年的3A6000已經(jīng)基本上追上主流水平了。不得不說,龍芯這幾年的性能提升是肉眼可見的快。
圖片來源:龍芯在上證路演截圖
但這個時候不禁讓人想到一個問題,在性能達到主流后,軟件生態(tài)怎么樣?如果空有一身本領,沒地方用,那就悲劇了。 如果想要啟動個原神,還需要先轉譯,再繁瑣的設置一番,并且玩起來還有些字體上的BUG,那就不好了。 根據(jù)目前市面上的主流軟件生態(tài),龍芯現(xiàn)在面臨三個問題: 第一,需要有一套龍芯自己的系統(tǒng),并且這套系統(tǒng)的兼容性最好要做到像X86架構下的Windows那樣,從Intel處理器換到AMD處理器,系統(tǒng)都可以兼容,在最新的Windows11系統(tǒng)下也可以玩20多年前Windows98上運行的紅警2。
第二,能不能搞一套轉譯性能更好的東西,把X86上成熟的應用做到可用,不要求以多高的性能運行,只要兼容性最好就行。 就像蘋果搞的Rosetta1一樣,當初Mac從IBM處理器遷移到Intel處理器時,它就保證了不少關鍵程序的可用性,一直到五年后,基本上所有的程序都完成了Intel的X86架構原生支持,Rosetta1才下線。而2020年,在蘋果宣布Mac產(chǎn)品線全部從Intel轉移到自研的M芯片后,Rosetta2正式上線,至今幫助不少像AfterEffects等專業(yè)軟件保證兼容可用。 蘋果轉向Intel芯片時,專門推出Rosseta1 第三,就是如何吸引更多的開發(fā)者來開發(fā)基于龍架構的應用?只有開發(fā)者多了起來,龍芯應用才會出現(xiàn)百花齊放的效果。 好在3A6000成功流片后,龍芯內部也意識到這個問題。在今年的業(yè)績說明會中,胡偉武把龍芯自己的生態(tài)解決方案拿了出來。
首先,龍芯要基于Linux打造自己的操作系統(tǒng)——Loongnix(以下稱龍系統(tǒng))。傳統(tǒng)的Linux在大的版本更新后,軟件兼容性上常常會出問題,打個比方,就像大家從Windows10升級到Windows11,突然發(fā)現(xiàn),在Win10上運行好好的軟件,在Win11要么無法運行,要么運行起來一大堆的Bug。 龍系統(tǒng)目前著重解決的就是應用在不同版本Linux之間不兼容的問題,現(xiàn)在在龍系統(tǒng)上運行的軟件,在大更新以后,也依然可用。在硬件兼容性上,龍系統(tǒng)的目標也是達到任何一代龍架構的CPU,都可以運行最新的龍系統(tǒng)。 龍系統(tǒng)另外一個目標就是要打造成為Linux里面的安卓,其他使用龍芯CPU的廠家可以根據(jù)自己的需求在龍系統(tǒng)上進行魔改,就像小米在安卓上開發(fā)出自己的Miui一樣。
另外在開發(fā)應用上,龍芯目前也在學習iOS和安卓,打算搞出一套自己的龍芯自主編程框架。幫助開發(fā)者們更好地開發(fā)基于龍架構的各種生態(tài)應用。相信過幾年應該就可以在微信安卓版旁邊看到微信龍芯版了。 其次,在轉譯方面,龍芯也在努力地搞出一套高效的轉譯,因為具有完全的自主性,所以添加一些優(yōu)化進去,會更加方便。不過這個轉譯效果來看,目前還不夠理想,比如前面測試Photoshop,還有一些游戲等,多少會有影響使用的BUG出現(xiàn)。 希望在未來優(yōu)化過后,能做到蘋果一樣的效果就好,效率也不用特別高,能達到轉譯前的80%左右就行,主要是兼容性要好。這樣才能吸引更多的Windows用戶過來。 另外,根據(jù)介紹,接下來龍芯這套轉譯系統(tǒng)還會支持ARM上的應用,所以不久后應該就能看到一些安卓應用在龍芯上跑起來了。
最后就是如何吸引開發(fā)者過來,說實話,這是一個很難破解的難題。想要有更多的開發(fā)者,就需要有很大的用戶基礎,想要更多的用戶,就需要有開發(fā)者開發(fā)出好用的程序。 因此,想要打破這個循環(huán),就需要有一方做出部分犧牲,是用戶犧牲體驗,還是開發(fā)者犧牲收益。目前來看,龍芯的做法只能是后者。畢竟,在開放性的市場,不能讓按著用戶的頭來用自己的產(chǎn)品。所以龍芯現(xiàn)在大力加強瀏覽器,影音軟件等基礎軟件體驗,然后再聯(lián)合微信,QQ,騰訊會議,飛書等這樣的大企業(yè)把必要的應用生態(tài)做好,吸引更多的用戶進來,從而進入到一個良性循環(huán)。
芯片追趕,一切才剛開始
兩年前,我們還在為中國自主的CPU的性能突破慶祝,現(xiàn)在,3A6000的出現(xiàn),讓性能不再成為國產(chǎn)CPU的短板。我們反而開始擔心起來沒有軟件在這顆處理器上運行起來。 起初我想用甜蜜的負擔來形容這一切,后來我發(fā)現(xiàn),想要打造自己的芯片,其實遠比我們想的要難。 當你的芯片性能足夠好的時候,你還需要建立起一整套自己的生態(tài)體系,用戶才能買單。 在這一點上,龍芯才剛開始。 雖然競爭對手已經(jīng)霸占市場多年,但龍芯的機會還是有很多的。從上到下的自導自主,意味著很多方面優(yōu)化起來會更加方便。比如傳統(tǒng)X86平臺的電腦,在運行一些機密軟件的時候,需要配一臺密碼機才可以,而龍芯因為內部添加了這些加密的指令集,所以使用龍芯電腦的時候,不需要添任何外部設備,就可以運行這些加密的軟件。
在生態(tài)上的追擊,龍芯表現(xiàn)出的決心更大,在今年的多場演講中,胡偉武多次提到,在性能追平后,將全力轉到生態(tài)建設上來,目前龍芯自己就有幾百名軟件開發(fā)人員,下游的開發(fā)人員更是達到了幾十萬。相信幾年后,我們就能看到一套生態(tài)基礎完善,邁入良性循環(huán)的龍芯體系。 在GPU方面也是如此,現(xiàn)在我們已經(jīng)有了超過英偉達A100的壁仞100,但英偉達靠著CUDA已經(jīng)培養(yǎng)出一大批在GPU上編程的開發(fā)者。這就像蘋果的iOS一樣,背靠如此多的開發(fā)者,就會有非常多的應用給用戶使用。對于英偉達來講,CUDA就是它的iOS。 目前剛剛起步的國產(chǎn)GPU公司也意識到這個問題,像壁仞和摩爾線程,它們在追趕性能的同時,也在大力發(fā)展自己的社區(qū),兼容目前主流的開發(fā)框架。 ***的未來,讓人無比期待,龍芯用了20年就追上了別人60年的水平,所以現(xiàn)在,請大家給予國產(chǎn)GPU芯片的一些寬容和支持,生態(tài)環(huán)境還需大家一同建設。
審核編輯:黃飛
?
評論
查看更多