雖然訓練 AI 需要超強大的 GPU 算力,但 AI 算法的執行首先需要超高效的芯片。就像 AmpereCPU,未來的 AmpereOne 將擁有不少于256個內核,其功率僅為350W。(原文轉自 Adrian Branco 發表于2024年6月10日)
Adrian Branco pour les Numériques - AmpereOne 256
或許你永遠無需自己購買處理器,但毫無疑問,你每天都會在不知不覺中使用。Ampere Computing 是一家美國公司,由英特爾前高管 Renée James 創立。Ampere 的使命是設計和銷售用于數據中心和超級計算機的基于 ARM 架構的CPU,其最新一代 AmpereOne 不久前剛剛亮相。 這與我們的應用程序和使用有什么關系呢?隨著基于云的 AI 助手的不斷發展,行業玩家們正在努力尋求降低購買和消費方面的使用費用。在這個游戲中,Ampere 基于ARM 架構的 CPU 具有很多優勢。
首先讓我們來談談芯片:雖然192核5nm版本的 AmpereOne 已經上市,并集成到法國 Scaleway 公司(我們去年12月訪問過其后臺)等數據中心,但 Ampere 未來的芯片將走得更遠。得益于迄今為止蘋果芯片獨有的3nm工藝,Ampere 能夠將內核數量增加33%,將 CPU 核心數量提高到256個。 但是,面對越來越耗電的芯片,英特爾正在積極研發從1KW到2KW的散熱芯片,英偉達毫不掩飾自己也在走同樣的道路 —— Ampere 正在做戰略性的押注,以不斷散熱的方式尋求性能提升。通過添加越來越多的內核來實現這一點,即創造更加高效的“心”。
恒定功耗下的更多內核
Jeff Wittich, Chief Product Officer at Ampere
根據 Ampere 的路線圖,該公司計劃于2025年推出的下一代旗艦產品 AmpereOne 將擁有256個內核。但正如 Ampere 首席產品官 Jeff Wittich 所解釋的那樣,這種芯片與 GPU 和其他高功率加速器相反。“數據中心行業的能源消耗增長速度是不可持續的,你不可能總是消耗更多的電力,你必須盡可能優化消耗。我們在市場上的優勢在于,我們設計了一種專門用于云計算的芯片架構。盡管我們的競爭對手擁有云前和 AI 前的核心設計,但我們的 CPU 內核和芯片完全是為滿足這一需求而設計的”, Jeff 說。
Ampere 的第一個武器是其芯片中嵌入的內核數量驚人。“目前,我們最密集的芯片有192個 CPU 內核。但到2025年,我們的3nm AmpereOne 將提供不少于256個內核。” 這就是 Ampere 的第二個武器。新芯片的功耗將與當前芯片完全相同,也就是說 “在300W到350W之間”,Jeff解釋道,“我們不想消耗更多的能源,我們總是想用同樣的功率做更多的事情。Ampere 的架構是可擴展的,特別適合 AI ”。等一下,AI不是 GPU 的領域嗎?
85%的AI與訓練無關
Victor Jakubiuk, Head of AI at Ampere
面對如今市值達30000億美元的英偉達,一個小玩家如何撼動這樣一個龐然大物呢?Ampere AI 主管 Victor Jakubiuk 解釋道:“這不是一回事。強大的 GPU 是用來訓練 AI 的。我們談論的是密集型計算,這需要高性能的芯片。但 AI 訓練只占該領域相關計算的15%。剩下的85%用于推理,即使用這些 AI。因為一旦一個模型經過訓練,需要數周或數月的時間,它就會被數百萬用戶大量使用。這就是 Ampere 處理器的用武之地” 。
以最優化的方式運行模型的處理器,它們是什么型號?Jeff Wittich 回答說:“除了 CPU 的經典用途(如MongoDB等數據庫)外,我們的 CPU 核心還用于許多日常任務。當您觀看視頻時,我們的 CPU 負責生成自動字幕并翻譯這些字幕。當您在銀行應用程序中使用聊天機器人時,我們的 CPU 可能也在運行并提供支持”。
真正的節省,而不僅僅是在AI方面
Damien Lucas, CEO of Scaleway
為了驗證 Ampere 團隊的說法,我們回到了去年我們見過的 Scaleway 首席執行官 Damien Lucas 那里。他面帶微笑,非常直接地說:“Ampere 芯片的節能是真實的”。他說,雖然 ARM CPU 在數據中心的發展之路并不總是一帆風順, 但“自從 Scaleway 幾年前提出并停止使用ARM以來”,該指令集正在強勢回歸,“這要歸功于客戶的需求。我認為,一方面,壟斷對市場來說從來都不是一件好事,但另一方面,Ampere CPU 可以顯著節省能源”。根據 Ampere 的說法,在 AI 中,這意味著 “與英偉達 GPU 相比,推理的增益從 x3到x5”。
An Ampere server from Scaleway
效率的提高并不局限于 AI 推理領域。Damien Lucas 表示:“雖然我們將所有技術和芯片都投放市場,為客戶服務,但由于我們與每個人合作,我們在Scaleway 也有自己的基礎設施。事實是,我們已經將所有內部服務器從 x86切換到了Ampere。我們的能源費用減少了30%” 他非常興奮地說。
但是,不要被云玩家的責任沖昏頭腦:盡管那些有推理需求的人可能會集體轉向 Ampere 這樣的芯片,但與能耗這個龐然大物對抗仍有很長的路要走。 “目前這是一場與時間的賽跑。可用的 GPU 永遠不夠。在 Scaleway,我們為所有類型的客戶提供服務。我們可以清楚地看到雙重趨勢:一方面,我們稱之為超密集型計算,另一方面是超高效計算”。能效,是Ampere的強項。
2030年將推出1000核處理器?
處理器計算能力的提高面臨著巨大的挑戰,比如進一步降低雕刻技巧的困難。然而,Jeff Wittich 似乎并不擔心芯片每瓦性能的未來改進。他向我們保證:“即使制造工藝多年來一直停留在3nm,即使使用350W的封裝,我們仍然可以做得更好。” 在同意做出預測之前,他承諾:“即使有這些限制,到2030年,我們也可以擁有1000核芯片。我們的架構仍有很大的空間”。 最后他總結道:“因為在我們的世界里,我們不再浪費能源。”
關于 Ampere Computing
Ampere Computing 是一家現代化半導體企業,致力于塑造云計算的未來,并推出了世界上首款云原生處理器。為可持續云而生,Ampere 云原生處理器兼具最高性能和最佳每瓦性能,助力加速多種云計算應用的交付,為云提供行業領先的性能、能效和可擴展性。
-
處理器
+關注
關注
68文章
19329瀏覽量
230142 -
cpu
+關注
關注
68文章
10873瀏覽量
212093 -
Ampere
+關注
關注
1文章
67瀏覽量
4547
原文標題:256核 AI 動力:一款能實時翻譯視頻并為聊天機器人提供動力的處理器
文章出處:【微信號:AmpereComputing,微信公眾號:安晟培半導體】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論