電子發燒友網報道(文/黃晶晶)據預測,到2026年底中國道路上將有超過100萬輛搭載L3級別ADAS(高級駕駛輔助系統)的汽車。到今年年底,中國將有超過1.7 億臺支持AI的智能手機,55% 的PC 將支持AI功能。同時,AI 數據中心將增長5倍。從這組數據中,我們已經看到AI正在快速地推進眾多行業的智能化進程。當前首要任務是夯實AI底座,構建一個強大的生態系統,為AI應用打下堅實的根基,從而助力其實現指數級增長。
在最近舉辦的Arm Tech Symposia年度技術大會上,Arm終端事業部產品管理副總裁James McNiven表示,在過去的三十多年里,Arm一直致力于打造全球最大的計算平臺,并以無與倫比的能源效率著稱。憑借Arm的行業洞察和數十年與生態伙伴的合作,Arm的計算平臺正持續推動新一代生態系統合作伙伴關系的發展。正如 Arm 曾經助力智能手機的崛起,Arm 也將成為AI計算平臺的驅動者。
圖:Arm終端事業部產品管理副總裁James McNiven
大會期間,James說道:“我們正面臨全新的需求,無論是算力、性能、能效,還是上市時間的需求都在不斷提升。”在談及Arm如何以超越硬件的設計方法助力AI應用時,James分享:“要想充分釋放 AI 的潛力,我們需要從系統層面思考問題,將硬件、軟件和生態無縫集成到一個全面的解決方案,使其具備卓越的可擴展性、性能和能效,并且能夠加速產品上市。”
以硬件為基石
Arm推出的計算子系統 (CSS),正是為客戶提供優化的解決方案,強大的軟件生態系統,以及更快的上市時間。該解決方案主要聚焦于異構計算并實現對系統多種計算要素的優化協作,實現高效率的軟件編寫方式、易用且可擴展的全球解決方案,讓開發者能夠針對硬件進行開發。
James強調,Arm多年來持續投資Armv9架構。在過去幾年中,通過加入許多以 AI 為核心的功能,使該架構適用于未來發展,而這一進程還在持續。十多年前,Arm首次將 AI 功能引入 Arm 架構,隨后在 Armv8 架構中引入了64位技術,但真正開啟AI時代的,則是 Armv9。
這其中包括兩大關鍵技術,可伸縮向量擴展 (SVE)和可伸縮矩陣擴展 (SME)。
SVE2 已應用于一些領先的計算產品中,如全新的天璣 9400,可加速工作負載,惠及開發者和終端用戶。SVE2 提升了視頻和圖像處理,提供更好的照片質量。
SME新一代架構功能將為開發者提供通用指令集,使其能夠一次在多個硬件平臺上實現 Arm 架構中的加速效果。
James表示,未來十年的Arm計算平臺將持續為 AI 而優化,所有功能將通過軟硬件能力的結合來實現。
以軟件為中心
在傳統的、AI 熱潮興起前的初創公司中,硬件和軟件工程師的比例大約是 50/50。但現在這一比例變成了 10/90,即10% 的硬件工程師和90%的軟件工程師。軟件的地位已經壓倒性地提升,而圍繞軟件構建的復雜性也在持續增長。
針對這一趨勢,James表示,Arm 聚焦于整體的技術棧,從底層硬件到整個技術棧中的軟件和應用程序。Arm已投入 30 多年來編寫和優化軟件,軟件始終是 Arm 計算平臺不可或缺的一部分。未來技術將變得更加復雜,并且需要大量的支持。軟件的開發成本高且耗時,因此投資策略也必須不斷進化。
Arm相信我們正處于以軟件為中心的未來。目前已有2000萬名開發者在Arm平臺上進行軟件開發。受到如此多的開發者青睞,正是因為Arm 擁有全球最大的計算平臺,這形成了良性循環,即更多的硬件吸引更多開發者開發軟件,進而推動對高能效硬件的需求,彼此互為循環。這一過程貫穿整個技術棧,從底層的操作系統到頂層的應用程序和用戶與科技的互動方式。一致的計算平臺為開發者提供了信心,使他們能夠編寫出可在當前數十億臺Arm 硬件上良好運行的軟件。
為了進一步以技術賦能開發者,Arm正在抽象化許多硬件相關的技術細節,真正實現對開發者友善的設計,讓他們能專注于打造優秀的軟件與簡單的整合。
其今年中旬發布的KleidiAI,是一款致力于提升人工智能計算性能的軟件庫,旨在通過與主流AI框架的深度集成,為開發者無縫獲取底層硬件架構的高性能。目前KleidiAI已與PyTorch、TensorFlow和MediaPipe等熱門框架集成,能夠顯著優化如Meta Llama 3和Phi-3等大型語言模型的性能。在本次年度大會上,Arm還宣布其與騰訊合作,通過 KleidiAI 集成提升混元大模型端側 AI 性能,為騰訊眾多應用場景提供卓越的 AI 體驗。當與Arm終端CSS結合使用時,KleidiAI借助Neon、SVE2和SME2等技術實現了性能的顯著提升,特別是在生成式AI應用中的效率得到了極大的優化。
James解析,Kleidi 技術可以用于加速Armv9 和Armv8 架構。最初的版本實際上是覆蓋 Neon 指令集,而Arm陸續新增了 SVE (可伸縮向量擴展)、SVE2 和 SME (可伸縮矩陣擴展)等新架構功能。因此,它將適用于多個不同版本的架構,包括 Armv8、Armv9.0,乃至目前最新的Armv9.2。
Kleidi 技術以其卓越的性能給人留下深刻印象,通過集成 Kleidi,騰訊混元大模型的預填充部分加速了 100%,而解碼器的速度提高了 10%。這些性能改善有助于實現更快、更高效的 AI 操作。其應用范圍從發布伊始的終端市場,已經擴展到云端應用,例如在基于Arm架構的 AWS Graviton 處理器上運行Llama 3 模型時,詞元 (token) 首次響應時間可提高2.5 倍。
在談及Kleidi未來的發展,James表示:“隨著 Kleidi 的逐步普及和更多開發者的參與,我們將看到更多的優化。作為開源生態系統的一部分,我們期待開發者為其貢獻力量,從而在整個 Arm 生態系統中實現更廣泛的協作。”
此外,在此次大會期間,Arm也展示了其對生態系統合作的重視。今年,Arm與vivo持續深化合作,宣布成立聯合實驗室,分別發揮各自在技術賦能和用戶理解領域的優勢,為用戶帶來卓越的 AI 體驗,這成為Arm生態合作的一個優秀范例。此外,Arm還與合作伙伴攜手,積極推進產業標準化進程,旨在構建一個健康、可持續的Arm生態系統。James 表示,Arm正在思考如何打造一個軟件庫,通過將其集成到合作伙伴的軟件中,讓這些應用能夠在包括移動終端在內的端側領域,充分發揮 Arm CPU 的性能優勢。同時,Arm也將持續投入軟件,例如,在企業場景中提供支持,通過與 Linaro 的合作,持續強化對 Linux 的支持,在固件標準(如 UEFI)上的貢獻,以及對一些開源工具的支持等,盡可能減少產業的碎片化。
Arm加快AI PC進程
Arm正在加緊建設AI PC的相關生態。目前Windows on Arm 平臺已成功運行很多原生應用程序,并配備了豐富的開發工具,而且越來越多的創新應用正在涌現,如愛奇藝、嗶哩嗶哩和搜狗等原生支持 Windows on Arm 的應用,可以充分利用AI PC的全部AI功能。未來,用戶將會看到更多、更加卓越的使用體驗。
Arm正與包括微軟在內的多家合作伙伴攜手合作,繼續深化Arm的AI PC進程。現在微軟已經推出了專門針對Arm 架構的 Windows 11 系統。談到業內擔心的基于Arm 架構運行時面臨的軟件兼容和生態問題,James解釋道:“我們持續和微軟合作,通過微軟提供的仿真環境,我們也為應用程序的開發者提供更多指引和建議。根據微軟的統計,其 PC 用戶投入在筆記本電腦上的時間,大約 90% 是用在原生應用上,表明了目前 WoA 原生應用的用戶體驗得到了顯著提升。”
小結:
預計到2025年,將會有1,000億臺基于 Arm 架構的設備可用于AI,這其中包括廣泛的面向邊緣 AI 的產品,從Arm Cortex-M到 Arm Cortex-A涵蓋了不同的性能水平和功耗需求。而Arm終端CSS、KleidiAI以及廣泛的生態合作,將助力開發者更方便快捷地釋放AI技術的潛力。
-
ARM
+關注
關注
134文章
9094瀏覽量
367541
發布評論請先 登錄
相關推薦
評論