在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

揭秘AI推理芯片的未來

穎脈Imgtec ? 2024-01-26 08:29 ? 次閱讀

來源:內(nèi)容由半導(dǎo)體行業(yè)觀察(ID:icbank)編譯自design-reuse,謝謝。


人工智能行業(yè)包含一個受技術(shù)進(jìn)步、社會需求和監(jiān)管考慮影響的動態(tài)環(huán)境。機(jī)器學(xué)習(xí)、自然語言處理和計(jì)算機(jī)視覺方面的技術(shù)進(jìn)步加速了人工智能的發(fā)展和采用。社會對醫(yī)療保健、金融和制造等各個領(lǐng)域的自動化、個性化和效率的需求進(jìn)一步推動了人工智能技術(shù)的融合。此外,不斷變化的監(jiān)管環(huán)境強(qiáng)調(diào)了人工智能部署道德、數(shù)據(jù)隱私和算法透明度的重要性,指導(dǎo)人工智能系統(tǒng)負(fù)責(zé)任的開發(fā)和應(yīng)用。

人工智能行業(yè)將訓(xùn)練和推理過程結(jié)合起來,以有效地創(chuàng)建和部署人工智能解決方案。人工智能推理和人工智能訓(xùn)練都是整個人工智能生命周期不可或缺的組成部分,其重要性取決于具體的環(huán)境和應(yīng)用。雖然人工智能訓(xùn)練對于通過學(xué)習(xí)模式和從數(shù)據(jù)中提取見解來開發(fā)和微調(diào)模型至關(guān)重要,但人工智能推理在利用這些經(jīng)過訓(xùn)練的模型進(jìn)行實(shí)時預(yù)測和決策方面發(fā)揮著至關(guān)重要的作用。人工智能推理的重要性日益增長(目前超過 80% 的人工智能任務(wù))在于其在推動數(shù)據(jù)驅(qū)動的決策、個性化用戶體驗(yàn)和跨行業(yè)運(yùn)營效率方面發(fā)揮著關(guān)鍵作用。

高效的人工智能推理實(shí)施面臨著數(shù)據(jù)可用性、計(jì)算資源、算法復(fù)雜性、可解釋性和監(jiān)管合規(guī)性方面的挑戰(zhàn)。適應(yīng)動態(tài)環(huán)境和管理可擴(kuò)展性,同時控制成本會帶來額外的障礙。克服這些挑戰(zhàn)需要全面的策略,包括強(qiáng)大的數(shù)據(jù)管理實(shí)踐、硬件功能的進(jìn)步和算法的改進(jìn)。開發(fā)可解釋的人工智能模型并遵守道德和監(jiān)管準(zhǔn)則對于建立用戶信任和確保合規(guī)性至關(guān)重要。此外,通過高效的運(yùn)營實(shí)踐和技術(shù)創(chuàng)新來平衡資源分配和成本管理對于在不同行業(yè)領(lǐng)域?qū)崿F(xiàn)可持續(xù)和有效的人工智能推理解決方案至關(guān)重要。通過自動化任務(wù)、增強(qiáng)預(yù)測性維護(hù)和實(shí)現(xiàn)高級分析,人工智能推理可以優(yōu)化流程、減少錯誤并改善資源分配。人工智能推理為自然語言處理提供動力,改善人與機(jī)器之間的溝通和理解。

它對制造業(yè)的影響包括預(yù)測性維護(hù)、質(zhì)量控制和供應(yīng)鏈管理、提高效率、減少浪費(fèi)和提高產(chǎn)品質(zhì)量,凸顯了其對行業(yè)運(yùn)營的變革性影響。人工智能推理面臨高能耗、密集計(jì)算需求和實(shí)時處理限制等挑戰(zhàn),導(dǎo)致運(yùn)營成本增加和環(huán)境影響。AI總功耗超過60%來自推理,推理需求的增加導(dǎo)致數(shù)據(jù)中心容量在兩年內(nèi)增長了2.5倍(GAFA數(shù)據(jù))。對于服務(wù)器來說,密集計(jì)算過程中產(chǎn)生的熱量需要復(fù)雜的冷卻系統(tǒng),這進(jìn)一步增加了人工智能流程的整體能耗。此外,平衡高效實(shí)時處理與低延遲要求(服務(wù)器、高級駕駛輔助系統(tǒng) (ADAS) 或制造應(yīng)用程序的強(qiáng)制要求)構(gòu)成了重大挑戰(zhàn),需要先進(jìn)的硬件設(shè)計(jì)和優(yōu)化的計(jì)算策略。在不影響準(zhǔn)確性的情況下,優(yōu)先考慮可再生能源和環(huán)保舉措的節(jié)能解決方案對于減輕人工智能推理過程對環(huán)境的影響至關(guān)重要。

傳統(tǒng)的人工智能推理硬件設(shè)計(jì),使用CPUGPU,由于人工智能算法的復(fù)雜性和特殊性,在實(shí)現(xiàn)能源效率方面面臨限制,導(dǎo)致高功耗(服務(wù)器每個多核單元數(shù)百瓦)。處理單元和內(nèi)存之間低效的數(shù)據(jù)移動進(jìn)一步影響能源效率和吞吐量;例如,訪問外部 DRAM 比訪問本地寄存器消耗的能量多 200 倍。最后,由于更高的計(jì)算需求,到 2025 年,使用 CPU 和 GPU 的下一代服務(wù)器的功耗可能高達(dá) 1,000 W。在資源有限的電池供電設(shè)備上部署 AI 推理更具挑戰(zhàn)性,因?yàn)樽罡咝У脑O(shè)備基于 CPU 和 GPU 的設(shè)計(jì)功耗為 10 mW 到幾瓦,受到強(qiáng)大的吞吐量限制,限制了 AI 復(fù)雜性和最終用戶體驗(yàn)。在能源效率與性能和精度要求之間取得平衡需要在設(shè)計(jì)過程中進(jìn)行仔細(xì)權(quán)衡,從而需要全面的優(yōu)化策略。對復(fù)雜人工智能工作負(fù)載的硬件支持不足可能會影響能源效率和性能。可持續(xù)發(fā)展目標(biāo)、降低成本目標(biāo)和新用途推動了行業(yè)對節(jié)能人工智能推理解決方案不斷增長的需求。企業(yè)尋求可擴(kuò)展的高性能解決方案來管理復(fù)雜的人工智能工作負(fù)載,而不會產(chǎn)生過多的能源成本。

另一方面,節(jié)能的人工智能推理將使移動和資源受限的設(shè)備能夠執(zhí)行復(fù)雜的任務(wù),而不會快速耗盡電池,同時減少對基于云的處理的依賴,最大限度地減少數(shù)據(jù)傳輸和延遲問題。它將通過實(shí)時語言翻譯、個性化推薦和準(zhǔn)確圖像識別等高級功能的新用途來增強(qiáng)用戶體驗(yàn),從而提高參與度和滿意度。為了克服 CPU 和 GPU 的限制,創(chuàng)新的硬件加速器專為 AI 推理工作負(fù)載而設(shè)計(jì),可實(shí)現(xiàn)高效和優(yōu)化的處理,同時最大限度地減少能耗。此類加速器通過人工智能應(yīng)用程序中使用的專用運(yùn)算符(池化、激活函數(shù)、標(biāo)準(zhǔn)化等)實(shí)現(xiàn)優(yōu)化的數(shù)據(jù)流。數(shù)據(jù)流引擎是矩陣乘法單元,是一個大型處理元件陣列,能夠有效處理大型矩陣向量乘法、卷積和許多更復(fù)雜的運(yùn)算,因?yàn)榇蠖鄶?shù)神經(jīng)網(wǎng)絡(luò)都基于矩陣乘法運(yùn)算。為了進(jìn)一步優(yōu)化能源效率,人工智能加速器采用了新技術(shù),例如近內(nèi)存計(jì)算。近內(nèi)存計(jì)算將處理元件集成在內(nèi)存子系統(tǒng)內(nèi),從而能夠在內(nèi)存附近實(shí)現(xiàn)更快的數(shù)據(jù)處理,從而減少與數(shù)據(jù)傳輸相關(guān)的能耗。最近,使用“非標(biāo)準(zhǔn)”技術(shù)的新方法,例如內(nèi)存計(jì)算或尖峰神經(jīng)網(wǎng)絡(luò)(SNN),是實(shí)現(xiàn)高能效人工智能推理的最積極的解決方案。內(nèi)存計(jì)算直接在內(nèi)存內(nèi)進(jìn)行電路級計(jì)算,無需數(shù)據(jù)傳輸并提高處理速度。

處理可以以模擬或數(shù)字方式執(zhí)行,并實(shí)現(xiàn)不同的存儲技術(shù),例如 SRAM、閃存或新的 NVM(RRAM、MRAM、PCRAM、FeFET 等)。這種方法對于涉及大型數(shù)據(jù)集的復(fù)雜人工智能任務(wù)特別有益。SNN 還代表了一種創(chuàng)新的人工智能推理方法:它們通常由通過尖峰進(jìn)行通信的互連節(jié)點(diǎn)組成,能夠模擬復(fù)雜的時間過程和基于事件的計(jì)算,這對于處理時間敏感數(shù)據(jù)或模擬大腦等任務(wù)非常有用。利用近內(nèi)存/內(nèi)存計(jì)算或 SNN 的 AI 加速器為 AI 行業(yè)帶來重大影響,包括提高能源效率、提高處理速度和先進(jìn)的模式識別功能。這些加速器推動硬件設(shè)計(jì)的優(yōu)化,從而創(chuàng)建針對特定人工智能工作負(fù)載量身定制的專用架構(gòu)。此外,它們還促進(jìn)了邊緣計(jì)算的進(jìn)步,促進(jìn)直接在邊緣設(shè)備上進(jìn)行高效的人工智能處理并減少延遲。這些技術(shù)的變革潛力凸顯了它們在醫(yī)療保健和制造、汽車和消費(fèi)電子產(chǎn)品等不同行業(yè)變革中的關(guān)鍵作用。高能效人工智能推理在醫(yī)療保健和汽車領(lǐng)域的集成產(chǎn)生了變革性的影響。在醫(yī)療保健領(lǐng)域,它通過快速數(shù)據(jù)分析促進(jìn)更快的診斷和個性化患者護(hù)理,從而改善治療結(jié)果和量身定制的醫(yī)療干預(yù)措施。此外,它還可以開發(fā)遠(yuǎn)程患者監(jiān)測系統(tǒng),確保對慢性病患者進(jìn)行持續(xù)的健康跟蹤和主動干預(yù)。

此外,在藥物發(fā)現(xiàn)領(lǐng)域,節(jié)能的人工智能推理可以加快潛在候選藥物的識別,加速藥物研發(fā)進(jìn)程,促進(jìn)醫(yī)療和療法的創(chuàng)新。在汽車行業(yè),節(jié)能的人工智能推理在提升安全功能和自動駕駛能力方面發(fā)揮著至關(guān)重要的作用。它為車輛提供 ADAS 和實(shí)時碰撞檢測功能,從而增強(qiáng)整體道路安全。此外,它還有助于自動駕駛技術(shù)的發(fā)展,使車輛能夠根據(jù)實(shí)時數(shù)據(jù)分析做出明智的決策,從而改進(jìn)導(dǎo)航系統(tǒng)和自動駕駛功能。此外,實(shí)施基于節(jié)能人工智能推理的預(yù)測性維護(hù)解決方案可以及早發(fā)現(xiàn)潛在的車輛問題,優(yōu)化性能,減少停機(jī)時間并延長車輛使用壽命。

促進(jìn)可持續(xù)運(yùn)營、優(yōu)化資源利用率和延長設(shè)備電池壽命的需求推動了行業(yè)對節(jié)能人工智能推理解決方案的關(guān)鍵需求。這些解決方案在促進(jìn)環(huán)保實(shí)踐、降低運(yùn)營成本和增強(qiáng)競爭優(yōu)勢方面發(fā)揮著至關(guān)重要的作用。通過促進(jìn)邊緣計(jì)算應(yīng)用并最大限度地減少能源消耗,節(jié)能的人工智能推理解決方案使企業(yè)能夠提高盈利能力、簡化流程并確保移動和物聯(lián)網(wǎng)設(shè)備的功能不間斷。滿足這一需求需要開發(fā)節(jié)能算法和優(yōu)化的硬件架構(gòu),這在很大程度上基于智能近內(nèi)存/內(nèi)存計(jì)算技術(shù)。許多新玩家?guī)е鴦?chuàng)新的計(jì)算解決方案進(jìn)入市場,并承諾在從傳感器到數(shù)據(jù)中心的任何地方運(yùn)行人工智能,并雄心勃勃地提供全新的用戶體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51157

    瀏覽量

    426558
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31493

    瀏覽量

    270052
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47643

    瀏覽量

    239863
收藏 人收藏

    評論

    相關(guān)推薦

    生成式AI推理技術(shù)、市場與未來

    (reasoning)能力,這一轉(zhuǎn)變將極大推動上層應(yīng)用的發(fā)展。 紅杉資本近期指出,在可預(yù)見的未來,邏輯推理推理時計(jì)算將是一個重要主題,并開啟生成式AI的下一階段。新一輪競賽已然開始。
    的頭像 發(fā)表于 01-20 11:16 ?336次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術(shù)、市場與<b class='flag-5'>未來</b>

    AI云平臺的未來趨勢與發(fā)展方向

    AI云平臺通過提供高效的數(shù)據(jù)處理、模型訓(xùn)練、推理服務(wù)以及便捷的開發(fā)工具,極大地降低了企業(yè)應(yīng)用AI的門檻,加速了AI技術(shù)的普及與創(chuàng)新。以下是對AI
    的頭像 發(fā)表于 12-02 17:34 ?293次閱讀

    AI推理CPU當(dāng)?shù)溃珹rm驅(qū)動高效引擎

    AI的訓(xùn)練和推理共同鑄就了其無與倫比的處理能力。在AI訓(xùn)練方面,GPU因其出色的并行計(jì)算能力贏得了業(yè)界的青睞,成為了當(dāng)前AI大模型最熱門的芯片
    的頭像 發(fā)表于 11-13 14:34 ?2604次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>CPU當(dāng)?shù)溃珹rm驅(qū)動高效引擎

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    的訓(xùn)練和推理提供了強(qiáng)大的算力支持,使得AI在科學(xué)研究中的應(yīng)用更加廣泛和深入。 3. 數(shù)據(jù)驅(qū)動的研究范式 第二章還強(qiáng)調(diào)了數(shù)據(jù)在AI for Science中的核心地位。數(shù)據(jù)是AI模型的輸
    發(fā)表于 10-14 09:16

    黃仁勛:AI未來關(guān)鍵在于推理,芯片成本驟降成核心要素

     英偉達(dá)CEO黃仁勛近期強(qiáng)調(diào),人工智能(AI)的未來趨勢將聚焦于具備“推理”能力的服務(wù),但這一愿景的實(shí)現(xiàn)需以降低計(jì)算成本為前提。這一觀點(diǎn)是在他與Arm首席執(zhí)行官Rene Haas的對話中提出的,該對話由Arm在其官方網(wǎng)站上發(fā)布。
    的頭像 發(fā)表于 10-10 14:35 ?448次閱讀

    AMD助力HyperAccel開發(fā)全新AI推理服務(wù)器

    提高成本效率。HyperAccel 針對新興的生成式 AI 應(yīng)用提供超級加速的芯片 IP/解決方案。HyperAccel 已經(jīng)打造出一個快速、高效且低成本的推理系統(tǒng),加速了基于轉(zhuǎn)換器的大型語言模型
    的頭像 發(fā)表于 09-18 09:37 ?425次閱讀
    AMD助力HyperAccel開發(fā)全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務(wù)器

    揭秘中國汽車芯片市場:主要企業(yè)有哪些?

    揭秘中國汽車芯片市場:主要企業(yè)有哪些?
    的頭像 發(fā)表于 07-19 10:12 ?641次閱讀
    <b class='flag-5'>揭秘</b>中國汽車<b class='flag-5'>芯片</b>市場:主要企業(yè)有哪些?

    如何基于OrangePi?AIpro開發(fā)AI推理應(yīng)用

    。通過昇騰CANN軟件棧的AI編程接口,可滿足大多數(shù)AI算法原型驗(yàn)證、推理應(yīng)用開發(fā)的需求。AscendCL(AscendComputingLanguage,昇騰計(jì)算
    的頭像 發(fā)表于 06-04 14:23 ?589次閱讀
    如何基于OrangePi?AIpro開發(fā)<b class='flag-5'>AI</b><b class='flag-5'>推理</b>應(yīng)用

    AI芯片哪里買?

    AI芯片
    芯廣場
    發(fā)布于 :2024年05月31日 16:58:19

    邊緣側(cè)AI芯片提供商超星未來完成數(shù)億元 Pre-B輪融資

    AI產(chǎn)業(yè)生態(tài)中,計(jì)算芯片被視為行業(yè)的“賣水人”。依據(jù)云端/邊緣端、訓(xùn)練/推理兩大分類標(biāo)準(zhǔn),AI芯片可劃分為四個類別,其中邊緣側(cè)
    的頭像 發(fā)表于 05-09 09:38 ?604次閱讀

    開發(fā)者手機(jī) AI - 目標(biāo)識別 demo

    Network Runtime 神經(jīng)網(wǎng)絡(luò)運(yùn)行時,作為中間橋梁連通上層AI推理框架和底層加速芯片,實(shí)現(xiàn)AI模型的跨芯片
    發(fā)表于 04-11 16:14

    AI芯片未來會控制這個世界嗎?

    AI芯片行業(yè)資訊
    芯廣場
    發(fā)布于 :2024年03月27日 18:21:28

    AMD EPYC處理器:AI推理能力究竟有多強(qiáng)?

    如今,AMD EPYC處理器已經(jīng)成為最常被選擇用于AI推理的服務(wù)器平臺,尤其是第四代Genoa EPYC 9004系列,執(zhí)行AI推理的能力又得到了巨大的飛躍。
    發(fā)表于 03-15 09:47 ?560次閱讀

    AI推理框架軟件ONNX Runtime正式支持龍架構(gòu)

    近日,知名AI推理框架開源社區(qū)ONNX Runtime正式發(fā)布支持龍架構(gòu)的版本1.17.0。
    的頭像 發(fā)表于 03-12 12:23 ?619次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>框架軟件ONNX Runtime正式支持龍架構(gòu)

    Groq LPU崛起,AI芯片主戰(zhàn)場從訓(xùn)練轉(zhuǎn)向推理

    人工智能推理的重要性日益凸顯,高效運(yùn)行端側(cè)大模型及AI軟件背后的核心技術(shù)正是推理。不久的未來,全球芯片制造商的主要市場將全面轉(zhuǎn)向人工智能
    的頭像 發(fā)表于 02-29 16:46 ?1279次閱讀
    主站蜘蛛池模板: 6080午夜 | 国产成人精品一区二区仙踪林 | 一级做a爰片久久毛片一 | 午夜黄色小视频 | 黄黄网址 | 99 久久99久久精品免观看 | 一级特黄特色的免费大片视频 | 天堂在线国产 | 亚洲精品成人网 | 欧美视频一区二区三区在线观看 | 欧美黄色xxx | 色天使美国 | 91中文在线观看 | 特黄特黄一级高清免费大片 | 丁香婷婷影院 | 日韩欧美一卡二区 | 国产一区二区高清在线 | 国产高清亚洲 | 国产美女在线观看 | 激情六月丁香 | 免费视频不卡一区二区三区 | 女人被免费网站视频在线 | 视频一区二区在线 | 好紧好爽的午夜寂寞视频 | 亚洲香蕉视频 | avtt加勒比手机版天堂网 | 5g国产精品影院天天5g天天爽 | 伊人婷婷色香五月综合缴激情 | 1024国产基地永久免费 | 男女午夜免费视频 | 亚洲a人片在线观看网址 | 在线免费观看h视频 | 好爽~~~~嗯~~~再快点明星 | 丁香花在线 | 狠狠色噜噜狠狠狠狠91 | xxxxbbbb欧美 | 2021久久精品99精品久久 | 性欧美护士18xxxxhd视频 | 六月丁香激情网 | 国产精品夜夜春夜夜 | 美女操出水 |