在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

打破定制加速器的桎梏:在邊緣AI中擁抱靈活性

穎脈Imgtec ? 2024-07-04 08:28 ? 次閱讀

先進計算技術如今已成為提升生產力和改變日常體驗的普遍工具。以汽車領域為例,高級駕駛輔助系統(ADAS)具備處理大量計算密集型任務的能力,從攝像頭數據預處理直到傳感器融合和路徑規劃,而且這些均不影響車輛的正常行駛里程。

邊緣計算方面的最新創新包括Wayve的LINGO-2,這是一個基礎模型,將視覺、語言和行動聯系起來,用以解釋和確定駕駛行為。這類解決方案正推動汽車行業走向新的方向,其中車輛中的AI能夠提供諸如直覺、語言響應界面、個性化駕駛風格以及協同駕駛等功能,從而增強自動駕駛體驗。

在邊緣計算的其他領域,AI筆記本電腦提供了諸多優勢,從借助AI賦能的內容創作工具以提高生產效率,到能夠在本地運行而無需與云共享用戶數據的協同駕駛。這些筆記本電腦將需要比以往任何移動PC更強的AI性能;微軟新推出的Copilot+PC就采用了GPT-4模型和40+TOPS的配置,同時具備輕薄設計和全天候續航能力。


邊緣基礎模型

AI達到這一能力水平并非因為程序員最終成功地將人腦轉化為代碼,而是研究人員成功地將云中可用的大量加速計算應用于通用模型,正如Rich Sutton在其《苦澀的教訓》(The Bitter Lesson)論文中所討論的那樣。基于上述提到的GPT-4等通用基礎模型進行微調的解決方案,正成為普及AI的首選方法。與其創建特定領域的算法,不如使用功能強大、可跨多個領域應用的模型,這些模型利用云資源與大量多模態數據進行訓練,然后針對特定應用和設備進行微調。

為了適應邊緣環境,這些經過調整的模型需要在更小、功能極具受限的設備上運行,這些設備具有嚴格的安全標準、有限的電源供應和不穩定的互聯網連接。它們不僅要提供基本的推理能力,還要支持設備上的微調和終身持續學習。此外,它們還需要與維護最佳用戶體驗的關鍵日常功能共享系統級芯片(SoC),如用戶界面、圖像處理和音頻處理。

然而,盡管在可用性能、熱管理技術甚至是商業模式方面存在差異,邊緣AI仍可借鑒AI在云計算中成功的理念:即從加速器硬件到AI框架的所有方面都使用通用方法。隨著晶體管縮放和新封裝技術的進步,計算量即便大幅增加也可輕松擴展。是以,為支持客戶在邊緣AI取得成功,Imagination同時采用了以下兩種方案策略:

基于開放標準開發軟件

  • 提升通用計算加速器的硬件能力

基于開放標準開發軟件

Imagination在邊緣AI的交付中采取軟件優先的方法,以最大化硬件的可編程性和靈活性。啟用優化庫等軟件和工具包提供了一種機制,以實現最高效率和對調度及內存管理的嚴格控制。目前已經有一個不斷增長的框架和庫生態系統,它們以OpenCL后端為基礎,加速上市時間,并提供了作為異構計算系統子集進行更高級優化和集成的機會。它涵蓋了AI部署環境以及計算機視覺和其他通用計算庫。

合作是成功的關鍵。去年,Imagination與其他領先科技公司一起,作為創始成員加入了UXL基金會,這是一個被稱為與NVIDIA封閉CUDA語言相抗衡的開放、跨平臺、供應商中立組織。該基金會正在開發oneAPI編程模型和DPC++ SYCL實現。通過使這一計劃成為Linux基金會下真正的開源項目,UXL基金會為像Imagination 這樣的公司提供了催化劑,將已經在高性能計算領域廣泛應用的oneAPI標準的優勢,擴展到邊緣計算領域。這將在應對計算應用的程序快速開發和跨平臺復用的挑戰中發揮重要作用。

Imagination正通過UXL基金會積極參與并影響oneAPI標準的制定,同時我們也在為邊緣平臺開發和推出下一代計算工具和軟件堆棧。我們與合作伙伴和客戶緊密合作,鼓勵更廣泛地參與并采用這一標準。我們旨在為開發過程中的所有利益相關者,提供易于訪問的適用于Imagination平臺的工具包,這些工具包將提供符合當前邊緣計算應用開發周期典型需求的“功能性到高性能再到最優”的工作流程,同時也利用構建和運行時目標獨立性的優勢。


提升通用計算加速器的能力

Imagination幫助客戶在邊緣AI領域取得成功第二個策略,主要通過保持硬件靈活性和可編程性的同時,向邊緣設備注入更強的計算性能。目前,邊緣計算加速通常在以下處理器類型中進行:

中央處理器(CPUs):SoC的傳統控制中心和主要工作組件;CPU越來越具備AI能力,擁有一定程度的并行性(例如多核)并支持相關數據格式;它們可以根據需要卸載更專業的計算處理器。

數字信號處理器(DSPs):廣泛應用于汽車、電信等多個市場,用于音頻、視頻、攝像頭和連接性處理,最近還通過矢量處理支持AI應用。

圖形處理器(GPUs):GPU本質上是可編程和通用的。雖然它們傳統上僅用于圖形加速,但近年來其并行性已應用于諸如超分辨率、點云處理和非機器學習算法等計算應用中,并且越來越多地采用低精度算術功能。

神經處理單元(NPUs):高度優化的領域特定加速器,專注于低精度算術,以有效處理深度學習算法訓練中常見的密集矩陣乘法代碼。

未來的問題是:這些處理器類型中哪一種為下一代邊緣AI加速器提供了最佳基礎?

這是Imagination擅長解決的問題。我們的工程師通過創造創新解決方案來解決技術難題,使客戶能夠成功。我們在四個市場中出貨超過130億顆芯片,產品范圍涵蓋GPU、CPU、AI IP以及軟件。我們的工程團隊在設計用于計算和AI的半導體技術方面擁有豐富的經驗,從針對CNN風格工作負載優化的NNA產品線開始,目前該產品線已運用于多個汽車和消費市場的SoC中,例如玄鐵TH1520 SoC。

盡管客戶在NNA上取得了許多成功,但Imagination認識到邊緣AI將需要開發新一代更靈活和可編程的NPU,或是新一代GPU加速器,這些加速器在保持能效的同時提供更強的計算性能。這與依賴通用而非過度定制化方法的原則相一致,正是這一原則使得AI在云端取得了成功,而這一目標的實現將得益于半導體市場上幾個關鍵趨勢的推動。


打破定制加速器(ASIC)的桎梏

首先,值得更詳細地探討為什么通用加速器比高度定制化的硬件更受歡迎。當前邊緣AI的處理方式,特別是在注重性能的設備如汽車和筆記本電腦中,聚焦于NPU:這是一種高度優化的處理器,能在較小的面積或功耗預算內實現高效率。與傳統的GPU張量核心相比,NPU具有更大的矩陣片規模,具有專門為神經網絡加速設計的固定功能硬件,關注低精度數值格式,進行graph編譯和優化以減少數據的搬運和增強數據的本地性。


低精度數字格式

半導體計算中關鍵趨勢之一是,提升通用加速器(如GPU)計算性能的是低精度數字格式的激增。這些格式歷來是NPU領域的專屬,但現在在GPU等其他加速器中也越來越常見。像開放計算項目(Open ComputeProject,簡稱OCP, 這樣的組織正開始推動從FP32到FP4及微縮比例(MX)兼容格式的標準化工作,這些格式適用于CPU、GPU、NPU等多種處理器。預期這些數字格式將從數據中心領域擴展到整個軟件生態系統中。


先進工藝節點帶來的機遇與挑戰

此外,多年以來,半導體行業一直受益于摩爾定律:在相同硅片面積上每代性能的提升。英特爾三星和臺積電等晶圓廠,對于挖掘這種邏輯電路尺寸縮小帶來的好處起到了根本性作用。先進工藝節點是通用加速器提升計算性能至邊緣AI所需水平的關鍵之一。

然而,SRAM(靜態隨機存取存儲器)被證明很難縮小。隨著AI模型對性能、數據本地性和低延遲要求的提高,實際上任何給定處理器,特別是如NPU這樣的領域特定加速器,對SRAM的需求反而增加了。未來的疑問是,我們是否真的能承受將如此昂貴的資源專門分配給僅在其功能需要時才激活的單一處理器?

與此同時,隨著晶體管密度的增加,熱管理問題比現在變得更加嚴峻。高度優化且能耗大的加速器加劇了這一挑戰,在SoC內部形成了工作負載特定的熱點,難以緩解。

然而,如果像CPU和GPU這樣的通用加速器在保持能效的同時增加其計算能力,那么基于少量高效、通用、可擴展加速器的邊緣SoC,將是解決先進工藝節點熱管理挑戰的一個有前景的方案。這種方法最小化了暗硅現象,為系統設計師提供了在整個核心中分布處理而非創建特定應用熱點的機會,并保證了集成、系統和編程復雜度的可控性。

475268be-399c-11ef-a655-92fbcf53809c.png

邊緣AI的下一代技術

考慮到這些發展,基于GPU和RISC-V架構的下一代處理器正逐步成為提供高性能、低功耗且適用于通用目的的加速器,這是邊緣AI所必需的。Imagination在邊緣圖形和計算技術領域處于世界領先地位。我們的GPU徹底改變了智能手機市場,并且從未停止開拓創新,比如生產出了首款能夠在移動設備上實現的實時光線追蹤的高效架構。隨著GPU和RISC-V CPU成為實現邊緣AI的首選處理器,我們的工程師正在開發客戶及更廣泛技術生態系統取得成功所需的技術解決方案。未來幾個月將有確切內容發布。在此期間,如果:

您是一家開發具備AI能力SoC的半導體公司

您是對即將改變用戶體驗的技術感興趣的原始設備制造商(OEM)

您是一家開發基于AI應用的軟件公司

都可以通過與我們銷售團隊預約會議來提前了解Imagination的計算產品路線圖。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    804

    瀏覽量

    37968
  • 自動駕駛
    +關注

    關注

    784

    文章

    13895

    瀏覽量

    166688
  • 邊緣AI
    +關注

    關注

    0

    文章

    98

    瀏覽量

    5041
收藏 人收藏

    評論

    相關推薦

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創意加速器

    加速器
    龍智DevSecOps
    發布于 :2024年11月26日 13:42:47

    RISC-V,即將進入應用的爆發期

    RISC-V是一種開放標準指令集架構 (ISA),最初由加州大學伯克利分校的研究人員于2010年開發。業界稱,這種開源特性為芯片設計者提供了極大的靈活性,可以根據具體需求定制AI加速器
    發表于 10-31 16:06

    使用低成本MSPM0 MCU提高電池管理設計的靈活性

    電子發燒友網站提供《使用低成本MSPM0 MCU提高電池管理設計的靈活性.pdf》資料免費下載
    發表于 09-07 10:53 ?0次下載
    使用低成本MSPM0 MCU提高電池管理設計的<b class='flag-5'>靈活性</b>

    使用低成本MSPM0 MCU提高電子溫度計設計的靈活性

    電子發燒友網站提供《使用低成本MSPM0 MCU提高電子溫度計設計的靈活性.pdf》資料免費下載
    發表于 09-07 09:46 ?0次下載
    使用低成本MSPM0 MCU提高電子溫度計設計的<b class='flag-5'>靈活性</b>

    使用BQ27Z746實現反向充電保護的設計靈活性

    電子發燒友網站提供《使用BQ27Z746實現反向充電保護的設計靈活性.pdf》資料免費下載
    發表于 08-30 11:45 ?0次下載
    使用BQ27Z746實現反向充電保護的設計<b class='flag-5'>靈活性</b>

    下一代高功能新一代AI加速器(DRP-AI3):10x高級AI系統高級AI更快的嵌入處理

    電子發燒友網站提供《下一代高功能新一代AI加速器(DRP-AI3):10x高級AI系統高級AI
    發表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x<b class='flag-5'>在</b>高級<b class='flag-5'>AI</b>系統高級<b class='flag-5'>AI</b><b class='flag-5'>中</b>更快的嵌入處理

    OPSL 優勢1:波長靈活性

    與其他類型的連續激光相比,光泵半導體激光 (OPSL) 技術有許多優勢,包括波長的靈活性。 特別是OPSL打破了傳統技術的限制,可以通過設計與應用的波長要求相匹配。 不折不扣的波長
    的頭像 發表于 07-08 06:30 ?351次閱讀
    OPSL 優勢1:波長<b class='flag-5'>靈活性</b>

    Imagination 引領邊緣計算和AI創新,擁抱AI未來發展

    6月25日,2024“N+”AI互動創新論壇南京舉辦,Imagination中國資深副總裁張曉波受邀出席。主題演講,張曉波表示,Imagination作為圖形、計算和
    的頭像 發表于 06-28 08:28 ?564次閱讀
    Imagination 引領<b class='flag-5'>邊緣</b>計算和<b class='flag-5'>AI</b>創新,<b class='flag-5'>擁抱</b><b class='flag-5'>AI</b>未來發展

    8芯M16公頭如何提升靈活性

      德索工程師說道電子設備的連接和傳輸,8芯M16公頭作為一種重要的電氣連接,其靈活性對于提高連接效率、降低故障率和增強用戶體驗至關重要。因此,本文將詳細探討如何提升8芯M16公
    的頭像 發表于 05-25 17:48 ?271次閱讀
    8芯M16公頭如何提升<b class='flag-5'>靈活性</b>

    Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構,性能提升四倍

    電子發燒友網報道(文/黃晶晶)嵌入式領域,邊緣與端側AI推理需求不斷增長,Arm既有Helium 技術使 CPU 能夠執行更多計算密集型的 AI 推理算法,也有Ethos 系列
    的頭像 發表于 04-16 09:10 ?4666次閱讀
    Arm推動生成式<b class='flag-5'>AI</b>落地<b class='flag-5'>邊緣</b>!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>支持Transformer 架構,性能提升四倍

    Tenstorrent將為日本LSTC新型邊緣2納米AI加速器開發芯片

    加拿大AI芯片領域的初創公司Tenstorrent與日本尖端半導體技術中心(LSTC)達成了一項多層次合作協議。根據協議內容,LSTC將采用Tenstorrent的世界級RISC-V架構和芯片IP來開發其新型邊緣2納米人工智能加速器
    的頭像 發表于 02-28 10:49 ?713次閱讀

    家居智能化,推動AI加速器的發展

    電子發燒友網報道(文/黃山明)AI加速芯片,也稱為人工智能加速器AI Accelerator),是一種專為執行機器學習和深度學習任務而設計的ASIC或
    的頭像 發表于 02-23 00:18 ?4625次閱讀

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子恒定強磁場的運動。本文將詳細介紹回旋
    的頭像 發表于 01-30 10:02 ?4412次閱讀

    恩智浦與MicroEJ共同開發新平臺加速器

    恩智浦與MicroEJ共同開發的新平臺加速器,利用具有標準API的軟件容器,為工業和物聯網邊緣應用帶來與智能手機類似的軟件設計靈活性,幫助客戶大幅降低開發成本,縮短產品上市時間。
    的頭像 發表于 01-22 10:16 ?751次閱讀

    納米軟件電源自動測試系統的靈活性特點詳解

    ,實現自動化測試的同時,也為客戶實現經濟效益最大化。該系統的靈活性體現在:儀器靈活、流程靈活、分析靈活、報告靈活
    的頭像 發表于 01-16 16:23 ?422次閱讀
    主站蜘蛛池模板: 97人人在线视频| 天天干天天色天天干| 你懂的免费在线视频| 免费色在线| 极品色天使在线婷婷天堂亚洲| 韩国三级hd中文字幕好大 | 日本人69xxx| 亚洲免费二区三区| 爱爱帝国亚洲一区二区三区 | 香蕉网影院在线观看免费| 欧美男人的天堂| 欧美国产精品主播一区| 在线天堂中文官网| 视频一区日韩| 麦克斯奥特曼免费观看| 成人欧美一区二区三区视频 | 天天舔天天干天天操| 久久va| 免费免费啪视频在线| 久热99| 四虎永久免费影院在线| 免费看欧美一级特黄a大片一| 国产精品一区二区三区四区| 午夜视频在线观看一区二区| 国产免费一区二区三区香蕉精| 永久免费看黄| 婷婷色综合久久| 久久精品国产亚洲综合色| 天天在线综合网| 亚洲性爱城| 亚洲天堂婷婷| wwwcom日本| 九九99久久精品午夜剧场免费| xx视频在线观看| 久久www免费人成看片色多多| xxx69欧美| 一级毛片一级毛片| 免费大片黄日本在线观看| 夜夜操天天射| 五月婷婷六月丁香激情| 在线精品91青草国产在线观看|