電子發燒友網報道(文/周凱揚)在亞馬遜、英偉達和阿里巴巴等廠商紛紛圍繞Arm Neoverse架構打造服務器處理器之際,Ampere Computing選擇了一條與眾不同的路線,自研核心。近日,Ampere宣布推出全新的AmpereOne系列處理器,可配置多達192個核心,且這些都是基于Ampere自有IP打造的自研核心。
Ampere Altra到AmpereOne,Ampere的自研之路
憑借前兩代Ampere Altra系列產品80核Ampere Altra和128核Ampere Altra Max,Ampere成了在Arm服務器CPU領域的先行者之一。主流的大型云服務廠商(CSP)都已經推出了基于這兩款CPU的服務器,如京東云就在近日推出了其首款基于Arm架構的云主機,搭載的正是Ampere Altra Max CPU。
CSP廠商紛紛擁抱Arm的原因很簡單,高并發、高算力和更低的價格,為上云提供了極具性價比的選擇。但如何做好差異化,是每個Arm服務器CPU廠商都需要思考的問題,比如英偉達選擇了與自己的GPU結合打造Grace Hopper這樣的SuperChip。
而擁有Arm ISA架構授權的Ampere選擇了從微架構上進一步創新,打造自研的Arm云原生核,從絕對性能和可擴展性上超越同類產品。單個AmpereOne CPU的可配置核心已經達到192個,比上一代的Ampere Altra Max多出了50%,內核數為業界最高。
這意味著基于AmpereOne CPU的單機架性能將再創新高,為了匹配新CPU強大計算能力,AmpereOne還采用了8通道DDR5、128通道PCIe 5.0和更大私有緩存的設計,斷絕了內存帶寬和I/O性能上出現瓶頸的可能。針對高速增長的云原生應用,AmpereOne還集成了一系列新特性,包括網格擁塞管理、細粒度電源管理和內存標簽等。Ampere表示,AmpereOne將幫助該公司進一步擴大在每機架性能方面的優勢。
Ampere首席產品官Jeff Wittich:“192 核是一個非常大的數字,比英特爾和 AMD 要多很多。用一個具體的場景來說明,在云環境中運行虛擬機時,用192核的AmpereOne對比96核的AMD Genoa,或者60核的英特爾Sapphire Rapids,AmpereOne每機架運行的虛擬機數量是AMD Genoa的2.9倍,是英特爾Sapphire Rapids的4.3倍。”
AmpereOne發力Chiplet與AI推理
得益于工藝的進步和架構的創新,AmpereOne能做到如此規格似乎并不意外,但能在Ampere Altra Max面世后的短時間內推出這樣一個“性能怪獸”,其實也離不開在設計方法上的轉變。從AmpereOne的架構可以看出,與此前Ampere Altra系列不同的是,新的處理器轉為采用Chiplet設計。近來不少先進芯片設計中都采用了這一技術,電子發燒友網也就這一轉變詢問了Ampere,Chiplet究竟有何助力,是否加快了芯片設計周期?
Jeff Wittich指出:“綜合而言,我們在Ampere中轉為大量采用小芯片帶來了許多的優勢,其中第一點就是能夠有更高的靈活度,第二點就是如問題中提到的,幫助我們加快了整個芯片設計周期。在采用了Chiplet架構之后,產品的TTM也會隨之縮短,還可以提供更高的可擴展性,從而提供現代云原生CPU的最佳性能。第三,Chiplet拓撲的設計也可以使AmpereOne更輕易地實現內存到內核的訪問,而不需要為處理器引入額外的HOPs。”
另外值得注意的一點是,在早前的Ampere Altra系列CPU中,雖然也可以用于AI推理,但從CSP已發布服務器的定位來看,其主要還是用于Web服務、視頻編解碼以及云游戲等非AI應用上。而此次發布的AmpereOne,則在AI計算上加大了力度。
從性能對比上,我們可以看出AmpereOne在AI推理負載上的領先,比如在生成式AI和推薦算法上,AmpereOne的單機架性能是AMD EYPC 9654 Genoa的兩倍或以上,但兩者卻有著近乎相同的系統功耗,AmpereOne的優勢在此展現得一覽無余。
這與Ampere自身的發展以及行業趨勢也緊密相關,AI負載已經成為云端最大的算力需求之一。而Ampere除了解決了AI硬件的問題外,也在布局AI軟件生態。比如2020年,Ampere收購了專注于打造AI軟件的OnSpecta,通過軟硬件協同優化,為AmpereOne提供卓越的AI性能,比如對BF16精度的支持等等。
解決性能與能效的矛盾
在Ampere公布今年的路線圖時,創始人/董事長兼首席執行官Renée J. James表示:“Ampere已經向行業證明,擊破單核性能與能耗之間的矛盾正是行業所有人都在尋找的新象限。在能耗與性能的坐標軸之中,朝坐標軸的右下方移動是行業發展的新常態,目的是實現更低的能耗和更高的性能。”
針對云計算的需求,在設計產品的過程中,Ampere借助Arm架構的優勢,綜合考量從核、SoC到等其他方面的因素,致力于實現每瓦性能、每機架性能的提升。對比x86架構的CPU,Ampere Altra系列的的云原生處理器可以實現每機架2.5倍的性能提升,降低能耗2.8倍,并僅占用1/3的空間。而新發布的AmpereOne將幫助Ampere進一步擴大領先優勢。
Jeff Wittich表示:“其實我們Ampere Altra系列處理器已經提供了行業領先的單機架性能,在能效方面已經是行業標桿性的產品。不僅是在性能方面,在能效方面我們也是領先AMD和英特爾所有的產品,即使是他們近期發布的低功耗產品。”
寫在最后
誠然,對于大部分服務器CPU而言,面向的客戶都是CSP和服務器OEM廠商,而他們提高競爭力的方式之一即提供差異化的高質量方案。不少Arm服務器CPU,雖然都在設計上做了差異化,但計算核心的性能并未拉開太大差距。Ampere選擇了自研云原生核的方式,既滿足了更高性能的需求,也解決了他們的另一大痛點,可擴展性與規模化。
成立5年多來,Ampere,已經在x86壟斷的服務器市場占領了一席之地。在一切背后,是Ampere 認為云需要一種從本質上而言完全不同的方法。隨著所有的計算轉移到云端,整個平臺的云原生化趨勢不可避免,而Ampere正在做的就是為云原生進行徹底的CPU創新。
Ampere Altra到AmpereOne,Ampere的自研之路
CSP廠商紛紛擁抱Arm的原因很簡單,高并發、高算力和更低的價格,為上云提供了極具性價比的選擇。但如何做好差異化,是每個Arm服務器CPU廠商都需要思考的問題,比如英偉達選擇了與自己的GPU結合打造Grace Hopper這樣的SuperChip。
而擁有Arm ISA架構授權的Ampere選擇了從微架構上進一步創新,打造自研的Arm云原生核,從絕對性能和可擴展性上超越同類產品。單個AmpereOne CPU的可配置核心已經達到192個,比上一代的Ampere Altra Max多出了50%,內核數為業界最高。
這意味著基于AmpereOne CPU的單機架性能將再創新高,為了匹配新CPU強大計算能力,AmpereOne還采用了8通道DDR5、128通道PCIe 5.0和更大私有緩存的設計,斷絕了內存帶寬和I/O性能上出現瓶頸的可能。針對高速增長的云原生應用,AmpereOne還集成了一系列新特性,包括網格擁塞管理、細粒度電源管理和內存標簽等。Ampere表示,AmpereOne將幫助該公司進一步擴大在每機架性能方面的優勢。
Ampere首席產品官Jeff Wittich:“192 核是一個非常大的數字,比英特爾和 AMD 要多很多。用一個具體的場景來說明,在云環境中運行虛擬機時,用192核的AmpereOne對比96核的AMD Genoa,或者60核的英特爾Sapphire Rapids,AmpereOne每機架運行的虛擬機數量是AMD Genoa的2.9倍,是英特爾Sapphire Rapids的4.3倍。”
AmpereOne發力Chiplet與AI推理
得益于工藝的進步和架構的創新,AmpereOne能做到如此規格似乎并不意外,但能在Ampere Altra Max面世后的短時間內推出這樣一個“性能怪獸”,其實也離不開在設計方法上的轉變。從AmpereOne的架構可以看出,與此前Ampere Altra系列不同的是,新的處理器轉為采用Chiplet設計。近來不少先進芯片設計中都采用了這一技術,電子發燒友網也就這一轉變詢問了Ampere,Chiplet究竟有何助力,是否加快了芯片設計周期?
Jeff Wittich指出:“綜合而言,我們在Ampere中轉為大量采用小芯片帶來了許多的優勢,其中第一點就是能夠有更高的靈活度,第二點就是如問題中提到的,幫助我們加快了整個芯片設計周期。在采用了Chiplet架構之后,產品的TTM也會隨之縮短,還可以提供更高的可擴展性,從而提供現代云原生CPU的最佳性能。第三,Chiplet拓撲的設計也可以使AmpereOne更輕易地實現內存到內核的訪問,而不需要為處理器引入額外的HOPs。”
另外值得注意的一點是,在早前的Ampere Altra系列CPU中,雖然也可以用于AI推理,但從CSP已發布服務器的定位來看,其主要還是用于Web服務、視頻編解碼以及云游戲等非AI應用上。而此次發布的AmpereOne,則在AI計算上加大了力度。
?
AI推理性能對比 / Ampere
AI推理性能對比 / Ampere
從性能對比上,我們可以看出AmpereOne在AI推理負載上的領先,比如在生成式AI和推薦算法上,AmpereOne的單機架性能是AMD EYPC 9654 Genoa的兩倍或以上,但兩者卻有著近乎相同的系統功耗,AmpereOne的優勢在此展現得一覽無余。
這與Ampere自身的發展以及行業趨勢也緊密相關,AI負載已經成為云端最大的算力需求之一。而Ampere除了解決了AI硬件的問題外,也在布局AI軟件生態。比如2020年,Ampere收購了專注于打造AI軟件的OnSpecta,通過軟硬件協同優化,為AmpereOne提供卓越的AI性能,比如對BF16精度的支持等等。
解決性能與能效的矛盾
針對云計算的需求,在設計產品的過程中,Ampere借助Arm架構的優勢,綜合考量從核、SoC到等其他方面的因素,致力于實現每瓦性能、每機架性能的提升。對比x86架構的CPU,Ampere Altra系列的的云原生處理器可以實現每機架2.5倍的性能提升,降低能耗2.8倍,并僅占用1/3的空間。而新發布的AmpereOne將幫助Ampere進一步擴大領先優勢。
Jeff Wittich表示:“其實我們Ampere Altra系列處理器已經提供了行業領先的單機架性能,在能效方面已經是行業標桿性的產品。不僅是在性能方面,在能效方面我們也是領先AMD和英特爾所有的產品,即使是他們近期發布的低功耗產品。”
寫在最后
誠然,對于大部分服務器CPU而言,面向的客戶都是CSP和服務器OEM廠商,而他們提高競爭力的方式之一即提供差異化的高質量方案。不少Arm服務器CPU,雖然都在設計上做了差異化,但計算核心的性能并未拉開太大差距。Ampere選擇了自研云原生核的方式,既滿足了更高性能的需求,也解決了他們的另一大痛點,可擴展性與規模化。
成立5年多來,Ampere,已經在x86壟斷的服務器市場占領了一席之地。在一切背后,是Ampere 認為云需要一種從本質上而言完全不同的方法。隨著所有的計算轉移到云端,整個平臺的云原生化趨勢不可避免,而Ampere正在做的就是為云原生進行徹底的CPU創新。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
ARM
+關注
關注
134文章
9104瀏覽量
367848 -
cpu
+關注
關注
68文章
10873瀏覽量
212032 -
AI
+關注
關注
87文章
30998瀏覽量
269328 -
Ampere
+關注
關注
1文章
67瀏覽量
4546
發布評論請先 登錄
相關推薦
蘋果自研5G基帶將亮相iPhone 16E
指出,基帶芯片的性能和穩定性對于手機的信號接收、通話質量和上網體驗具有至關重要的影響。因此,蘋果在推出自研5G基帶時采取了謹慎的策略,選擇在價格相對親民的iPhone 16E上進行試水。這一舉措旨在通過實際使用來檢驗自
東風四款自研新能源動力上榜年度“十佳”
強勁“中國心”,創新“加速度”。東風汽車實現關鍵核心技術自主掌控,自研動力成為轉型發展“新動力”,提升高質量發展“含金量”。
蘋果計劃2025年起采用自研藍牙Wi-Fi芯片
近日,據最新報道,蘋果公司為了減少對博通(Broadcom)的依賴,并進一步提升其設備的性能和能效,已經制定了一項重要的芯片自研計劃。據悉,從2025年開始,蘋果將正式啟用自
龍芯自研顯卡來了!性能看齊AMD熱銷顯卡
在信息技術領域,顯卡作為計算機圖形處理的核心組件,其自主研發能力一直被視為衡量一個國家技術實力的重要標準。近日,龍芯科技宣布正在研發自家顯卡——龍芯9A1000,這一消息在國產硬件領域引起了廣泛關注
Arm成功將Arm KleidiAI軟件庫集成到騰訊自研的Angel 機器學習框架
Arm 與騰訊攜手合作,成功將 Arm KleidiAI 軟件庫集成到騰訊自研的 Angel 機器學習框架。 ? 借助 KleidiAI 解鎖卓越性能、能效和可移植性,騰訊混元大模型能夠實現更快
蘋果自研5G芯片或于明年亮相
蘋果公司正加速推進其自研5G芯片的研發進程,有望最快在明年推出首款自研5G調制解調器。這一舉措對高通而言,無疑構成了巨大的挑戰。
比亞迪最快于11月實現自研算法量產,推進智駕芯片自研進程
10月21日市場傳出消息,比亞迪正計劃整合其新技術院下的自研智能駕駛團隊,目標是在今年11月實現自研智能駕駛算法的量產,并持續推進智能駕駛芯片的自
國產DSP,自研指令集內核C2000,F28335、F280049、F28377
國產DSP,自研指令集內核架構,自研工具鏈,完美替代TI的 C2000系列產品,F280049、F28335、F28377
性能、主頻、外設
發表于 09-26 13:56
蘋果自研Wi-Fi芯片或明年商用,用于部分iPad
9月20日最新資訊顯示,蘋果公司在自研芯片領域的成就斐然,其標志性的A系列芯片在iPhone和iPad上持續多年引領性能巔峰,而自2020年起推出的M系列芯片更是成功助力Mac產品線完
消息稱小鵬汽車自研智駕芯片流片成功
小鵬汽車近期傳來振奮人心的消息,其自主研發的智能駕駛芯片已成功完成流片,標志著小鵬在核心技術自研領域邁出了堅實的一步。據知情人士透露,這款小鵬智駕芯片專為滿足高度智能化的駕駛需求而生,采用先進的端到端大模型設計理念,構建了一套艙
國產車企自研智駕芯片加速落地,蔚來小鵬等領跑賽道
在智能汽車產業加速變革的浪潮中,中國車企正以前所未有的決心和速度推進核心技術自研,特別是在智能駕駛芯片這一關鍵領域,蔚來、小鵬等頭部企業已邁出堅實步伐,自
Ampere下一代AmpereOne系列處理器將擁有256個核心
雖然訓練 AI 需要超強大的 GPU 算力,但 AI 算法的執行首先需要超高效的芯片。就像 AmpereCPU,未來的 AmpereOne 將擁有不少于256個內核,其功率僅為350W。(原文轉自 Adrian Branco 發
理想汽車自研大模型Mind GPT通過國家備案
理想汽車近日宣布,其全自研的多模態認知大模型Mind GPT已正式通過國家《生成式人工智能服務管理暫行辦法》備案,成為汽車行業中首個成功通過該備案的自研大模型。這一里程碑式的成就,彰顯
微軟正在研發新型網卡,旨在提升自研AI芯片性能
微軟近日被曝正在秘密研發一款高性能的新型網卡,這一創新旨在增強其自研的Maia AI服務器芯片的功能,并可能大幅度降低對外部芯片設計廠商如英偉達的依賴。據知情人士透露,這款網卡的設計思路與英偉達熱銷的ConnectX-7網卡有著
英偉達缺貨?OpenAI選擇自研芯片
?電子發燒友網報道(文/周凱揚)在生成式AI和大模型帶來的AI洪流下,不少大廠都不約而同地選擇了自研AI芯片。即便這意味著組建新的團隊,花費大量的資金,但從長遠發展的角度來看,自研芯片
評論