自從英特爾公司聯合創始人戈登·摩爾在上個世紀60年代提出“摩爾定律”以后,這個定律目前已經被推斷可適用于所有技術,包括智能終端在內的產品。例如以智能手機為例,目前業界普遍相信技術進步的速度應該每兩年提高一倍,而實際上這一定律也確實得到了廣泛驗證。
回望2013年的移動終端界,可以確認這是一個極其重要且具有承上啟下意義的時間節點。在當年,蘋果推出了全球首款64位手機處理器A7,震動業界。而另外兩家同屬安卓陣營的亞洲芯片設計巨頭聯發科和三星公司則是共同將安卓移動終端帶入了八核心處理器時代,安卓設備性能的飛速提升也從這個時期開始了。
八核處理器對于手機算力的提升是用戶有目共睹的,但是在當時的手機技術宅用戶群體中,他們更想要了解的是,剛剛問世的八核處理器到底在使用中表現如何?所以在此之前,我們有必要從全球首款“4+4”八核處理器,也就是第一代大小核芯片三星Exynos 5410這款芯片說起。
自從三星在2013年CES上發布這款主打高端市場的Exynos 5 Octa(Exynos 5410)處理器之后,業界圍繞著其真假八核的爭論就從來沒有停止過。它的出現讓原本就甚囂塵上的“多核無用論“備受爭議,而這種討論在技術宅用戶中持續的聲音最廣。
如今我們回過頭去看,其實三星Exynos 5 Octa處理器并不是三星自己原創的架構,而是ARM提出的big.LITTLE架構設計在三星平臺的第一次實際展現。所以你可以看到Exynos 5 Octa采用四顆A15大核心來作為“超高性能”的代表,并配備四顆A7小核心同樣代表“節能功耗”,二者通過ARM的CCI-400互聯,根據工作負荷的大小來進行切換。
這樣帶來的后果就是,當年的exynos 5410處理器雖然號稱是使用了豪華陣容的八個物理核心,但受限于ARM公版授權方案的設計初衷,無論你怎么進行調度,核心運作時最多能展現在用戶面前的就只有四顆核心。
而當時爭議的焦點在于,Exynos 5410的大小核調度模式,一度讓花了高價買三星旗艦機型的技術宅消費者覺得無法接受。
圖:三星exynos 5410內部的結構設計圖
不過從現在來看,大小核運作的方式已經被消費者逐步接受,并且其優點也逐步顯現。例如你在視頻播放、文檔處理、上網沖浪這些所謂的輕度應用時系統會將工作分配和小核心,達到節能省電的效果;但你進入大型游戲、高清錄影等模式時則會切入大核心的模式,這種調度其實就是如今集群遷移調度的雛形,也就是所謂的“4+4”模式,這種調度模式在之后高通的驍龍835,甚至蘋果的A10 Fusion下都能找到他的影子。
不過作為第一代大小核產品,在當時由于制程工藝的落后和ARM高性能核心的功耗,再加上總線吞吐量等問題的制約。用戶再進行不同場景,不同強度應用的時候,頻繁的進行大小核心的切換,反而帶來了巨大的延遲,造成用戶體驗的崩塌,當時可謂是空有最強公版A15的性能,卻敗于調度模式,因此本質上這種調度方案仍是讓設備以四核心的方式在運作。
圖:聯發科MT6592以HMP方案實現了八核全開,首款真八核芯片
而之后由聯發科技推出的主打中端市場的MT6592卻以支持異構多處理(Heterogeneous Multi-Processing/HMP)方案受到中端用戶的好評,相比三星的big.LITTLE架構,它通過并行處理器技術,可同時運行所有的八個核心,并提供核心配置和軟件整合方案支持,確保每個核心獨立靈活地運轉。
此種調度方式復雜度比簡單的集群遷移模式要高好幾個數量級,需要系統內核調度器能夠辨別多核心的存在與不同,智能地將負載分配給八顆核心,而且切換的延遲要非常低,從而發揮全部核心的最大能效能。在當時,MT6592雖然只是一顆定位于中端的手機處理器,但是卻在核心調度方案上使用了當時旗艦機型都沒有使用的HMP模式,讓用戶在多場景使用中體驗到設備高能效的流暢體驗。
當然實際上這也是ARM公版大小核架構的最新功能,不過有了新技術的加持和內部的優化,聯發科后續還推出了首款真八核4G LTE芯片MT6595,成為當年紅極一時的明星產品,而聯發科的“真八核”也成為之后很長一段時間IC廠商爭相角逐的標桿。
時至今日,消費者對核數之爭已經有了理性的認知,更多的關注點落在了核數之間的分工協作上。而處理器的架構也從大小核分工、單核大小頻率協作、多叢集設計方案演進,例如近日海思980就搭載了 ARM的 DynamIQ 調度特性,雖然華為官方將其稱之為Flex-Scheduling多核智能調度機制,但本質上就屬于多叢集的協作過程。
圖:海思980使用的多核調度機制,使用2xA76+2xA76+4xA55設計
我們可以直觀的看下,海思980的架構主要分為三部分,其中A76的核心又分為兩組,分別是兩顆最高主頻為2.6GHz的運算部分,負責提供高性能運算;兩顆主頻為1.92GHz的能效比部分,負責日常的大部分應用。最后四顆則是主頻為1.8GHz的A55小核心,負責低負載的應用,提升續航能力等,整體上是屬于三檔能效架構混合組成。
海思的這個架構其實很有意思,它可以針對不同的運算需求分配不同的核心去執行,能夠將性能均衡分配,當然續航效果也更優。另外海思980的這個方案雖然很有亮點,但對手機芯片產品有關注的朋友其實不難發現,當年主打十核的聯發科Helio X20其實也使用了類似的多叢集方案。
當年聯發科Helio X20率先打出10核可謂是震驚業界,但我覺得它的最主要亮點反到不是在十核方面,而是提出了三(多)叢集的概念。聯發科X20通過MCSI互聯總線把這個十核進行連接,形成三叢集的核心群,然后這三核心群再通過聯發科自研的CorePilot 3.0技術進行實時調控。
我們注意到CorePilot 3.0的技術文檔中有一個Square的排前算法,簡單來說就是這個算法會考慮到應用的類別,對應用的特性有一個實時的學習,從而知道這個應用對性能的需求程度,再調用相對應的核心去進行運算,在這個調用的過程中,不同叢集的核心是可以搭配互相使用,例如可以兩大四小、可以四中四小,主要還是要依據當前處理器的狀況以及應用對運算的需求。
例如你在使用手機看電子書、回郵件、聽音樂的時候,系統就會主要啟動小核心進行工作;而你在持續微信聊天、看電影、上網沖浪的時候,具備更高性能的中核心則會負責這部分的運算。
至于在開啟大型游戲、極限預算的時候,大核心則會加入工作,并且在不同的使用場景下,不同的核心數都能參與進來,所以網絡上此前調侃的“一核有難,九核圍觀”實際上給聯發科處理器帶來了莫大的冤屈。
伴隨著AI人工智能、大數據、5G網絡的到來,消費人群在移動終端體驗上已經有更加多元化的需求,例如智能手機方面的AI特性、多攝方案、全面屏等功能已經代表著次世代移動終端的發展方向,而在用戶對設備提出更高強度的使用情況下,處理器的調度模式顯得更加重要,這也對各家移動終端廠商調試處理器的技術提出了更高的要求。
聯發科此前被吐槽為“一核有難,多核圍觀”, 所以這一點上我們依舊來看看聯發科的做法。
以聯發科目前最熱的Helio P60來說,不僅處理器運算性能上早已經可以實現八核全開,破除了“多核圍觀”的迷思,而且最關鍵的是聯發科已經開始朝著分工協作的思路演進,例如P60就集成了雙核APU(AI處理單元),一開始就讓AI處理器進入了多核的時代。當然這確實是出彩的一部分,但我倒覺得聯發科思路更正確的則是持續演進其NeuroPilot AI技術,讓手機芯片和AI的結合更近一步。
關于聯發科的NeuroPilot技術其實網絡上已經有很多分析,簡單來說它是聯發科把CPU、GPU以及自主研發的APU(AI處理單元)等異構運算功能整合到SoC中的技術, 其中APU還可以進一步擴展到多核,而NeuroPilot平臺則會根據不同的場景和實際需求來進行運算的合理分配,實現專核專用、續航功能持續提升的特性,從根源上解決了網絡傳言的“一核有難,多核圍觀”的尷尬情況。
當然還有一點就是,聯發科還提供NeuroPilot SDK,完整支持安卓神經網絡API,不僅可以讓開發者可以更貼近硬件的方式進行編程,提高性能和功能,還可以方便系統各個硬件的分工協作,也將系統優化從以往的CPU層面擴展到各種專用核心,進一步優化了效率和功耗。
聯發科目前有多款芯片已經使用NeuroPilot技術,例如Helio P60、A22,此外最新發布的Helio P70也同樣沿用這一思路,其自帶有APU專核,AI處理效率進一步提升,此外還支持拍照美顏、人臉識別、場景優化、景深預覽等,甚至實現了人體姿態識別這樣的功能。
當然不可否認的是,隨著手機處理器的性能瓶頸逐漸到來,以及手機芯片制程工藝的紅利不復,各大芯片設計廠商也開始研究如何突破“摩爾規律”的限定,而AI顯然成為接下來一段時間的重心所在,聯發科目前在核心數這條路上確實找準了方向,大膽布局ASIC(專用集合電路)機制的AI專核,兩代產品已經打出一些成績。
而在AI的推動下,據悉包括蘋果、三星、海思等產品未來都可能會具備AI專核,打破多核迷思,逐步演進為專核專用將會是業界未來的主流思路。
從目前聯發科的布局來看,其AI已經從智能手機延伸至智能穿戴、多媒體影音、智能家庭以及更廣泛的萬物互聯設備等,而聯發科也在持續與多家中、美技術業者結盟,包含騰訊、曠視科技、商湯科技、虹軟等,整體前景值得看好,這家低調的華人企業在IC領域持續推進科技的普惠,這也是筆者最欣賞的部分。
-
聯發科
+關注
關注
56文章
2687瀏覽量
254883 -
AI
+關注
關注
87文章
31155瀏覽量
269493
原文標題:被誤解的聯發科:早已專核專用,實現AI提前布局
文章出處:【微信號:IC-008,微信公眾號:半導體那些事兒】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論