在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

炬芯科技周正宇:Actions Intelligence 端側AI音頻芯未來

科技見聞網 ? 來源:科技見聞網 ? 作者:科技見聞網 ? 2024-11-08 10:22 ? 次閱讀

ChatGPT激發了人們的好奇心也打開了人們的想象力,伴隨著生成式AI(Generative AI)以史無前例的速度被廣泛采用,AI算力的需求激增。與傳統計算發展路徑類似,想讓AI普及且發掘出AI的全部潛力,AI計算必須合理的分配在云端服務器和端側裝置(如PC,手機,汽車, IoT裝置),而不是讓云端承載所有的AI負荷。這種云端和端側AI協同作戰的架構被稱為混合AI(Hybrid AI),將提供更強大,更有效和更優化的AI。換句話說,要讓AI真正觸手可及,深入日常生活中的各種場景,離不開端側AI的落地。

端側AI將機器學習帶入每一個IoT設備,減少對云端算力的依賴,可在無網絡連接或者網絡擁擠的情況下,提供低延遲AI體驗、還具備低功耗,高數據隱私性和個性化等顯著優勢。AIoT的一個最重要載體是電池驅動的超低功耗小型IoT設備,其數量龐大且應用豐富,在新一代AI的浪潮中,端側AI是實現人工智能無處不在的關鍵,而為電池驅動的低功耗IoT裝置賦能AI又是讓端側AI變為現實的關鍵。

2024年11月5日,炬芯科技股份有限公司董事長兼CEO周正宇博士受邀出席Aspencore2024全球CEO峰會,結合AI時代熱潮及端側AI所帶來的新一代AI趨勢,分享炬芯科技在低功耗端側AI音頻的創新技術及重磅產品,發表主題演講:《Actions Intelligence: 端側AI音頻芯未來》。

周正宇博士表示:在從端側AI到生成式AI的廣泛應用中,不同的AI應用對算力資源需求差異顯著,而許多端側AI應用是專項應用, 并不需要大模型和大算力。 尤其是以語音交互,音頻處理,預測性維護,健康監測等為代表的AIoT領域。

炬芯科技目標是在電池驅動的中小模型機器學習IoT設備上實現高能效的AI算力

在便攜式產品和可穿戴產品等電池驅動的IoT設備中,炬芯科技致力于在毫瓦級功耗下實現TOPS級別的AI算力,以滿足IoT設備對低功耗、高能效的需求。以穿戴產品(耳機和手表)為例, 平均功耗在10mW-30mW之間, 存儲空間在10MB以下,這框定了低功耗端側AI,尤其是可穿戴設備的資源預算。

周正宇博士指出”Actions Intelligence”是針對電池驅動的端側AI落地提出的戰略,將聚焦于模型規模在一千萬參數(10M)以下的電池驅動的低功耗音頻端側AI應用,致力于為低功耗AIoT裝置打造在10mW-100mW之間的功耗下提供0.1-1TOPS的通用AI算力。也就是說”Actions Intelligence“將挑戰目標10TOPS/W-100TOPS/W的AI算力能效比。根據ABI Research預測,端側AI市場正在快速增長,預計到2028年,基于中小型模型的端側AI設備將達到40億臺,年復合增長率為32%。到2030年,預計75%的這類AIoT設備將采用高能效比的專用硬件。

現有的通用CPUDSP解決方案雖然有非常好的算法彈性,但是算力和能效遠遠達不成以上目標,依據ARMCadence的公開資料,同樣使用28/22nm工藝,ARM A7 CPU 運行頻率1.2GHz時可獲取0.01TOPS的理論算力,需要耗電100mW,即理想情況下的能效比僅為0.1TOPS/W;HiFi4 DSP運行600MHz時可獲取0.01TOPS的理論算力,需要耗電40mW,即理想情況下的能效比0.25TOPS/W。即便專用神經網路加速器(NPU)的IP ARM周易能效比大幅提升,但也僅為2TOPS/W。

以上傳統技術的能效比較差的本質原因均源于傳統的馮?諾依曼計算結構。傳統的馮?諾伊曼計算系統采用存儲和運算分離的架構,存在“存儲墻”與“功耗墻”瓶頸,嚴重制約系統算力和能效的提升。

在馮?諾伊曼架構中,計算單元要先從內存中讀取數據,計算完成后,再存回內存。隨著半導體產業的發展和需求的差異,處理器和存儲器二者之間走向了不同的工藝路線。由于工藝、封裝、需求的不同,存儲器數據訪問速度跟不上處理器的數據處理速度,數據傳輸就像處在一個巨大的漏斗之中,不管處理器灌進去多少,存儲器都只能“細水長流”。兩者之間數據交換通路窄以及由此引發的高能耗兩大難題,在存儲與運算之間筑起了一道“存儲墻”。

此外,在傳統架構下,數據從內存單元傳輸到計算單元需要的功耗是計算本身的許多倍,因此真正用于計算的能耗和時間占比很低,數據在存儲器與處理器之間的頻繁遷移帶來嚴重的傳輸功耗問題,稱為“功耗墻”。

基于SRAM的存內計算是目前低功耗端側AI的最佳解決方案

周正宇博士表示:弱化或消除”存儲墻”及”功耗墻”問題的方法是采用存內計算Computing-in-Memory(CIM)結構。其核心思想是將部分或全部的計算移到存儲中,讓存儲單元具有計算能力,數據不需要單獨的運算部件來完成計算,而是在存儲單元中完成存儲和計算,消除了數據訪存延遲和功耗,是一種真正意義上的存儲與計算融合。同時,由于計算完全依賴于存儲,因此可以開發更細粒度的并行性,大幅提升性能尤其是能效比。

機器學習的算法基礎是大量的矩陣運算,適合分布式并行處理的運算,存內計算非常適用于人工智能應用。

要在存儲上做計算,存儲介質的選擇是成本關鍵。單芯片為王,炬芯的目標是將低功耗端側AI的計算能力和其他SoC的模塊集成于一顆芯片中,于是使用特殊工藝的DDR RAM和Flash無法在考慮范圍內。而采用標準SoC適用的CMOS工藝中的SRAM和新興NVRAM(如RRAM或者MRAM)進入視野。SRAM工藝非常成熟,且可以伴隨著先進工藝升級同步升級,讀寫速度快、能效比高,并可以無限多次讀寫。唯一缺陷是存儲密度較低,但對于絕大多數端側AI的算力需求,該缺陷不會成為阻力。短期內SRAM是在低功耗端側AI設備上打造高能效比的最佳技術路徑,且可以快速落地,沒有量產風險。

長期來看,新興NVRAM 如RRAM由于密度高于SRAM,讀功耗低,也可以集成入SoC,給存內計算架構提供了想象空間。但是RRAM工藝尚不成熟,大規模量產依然有一定風險,制程最先進只能到22nm,且存在寫次數有限的致命傷(超過會永久性損壞)。故周正宇博士預期未來當RRAM技術成熟以后,SRAM 跟RRAM的混合技術有機會成為最佳技術路徑,需要經常寫的AI計算可以基于SRAM的CIM實現,不經常或者有限次數寫的AI計算由RRAM的CIM實現,基于這種混合技術有望實現更大算力和更高的能效比。

炬芯科技創新性采用模數混合設計實現基于SRAM的存內計算(CIM)

業界公開的基于SRAM的CIM電路有兩種主流的實現方法,一是在SRAM盡量近的地方用數字電路實現計算功能, 由于計算單元并未真正進入SRAM陣列,本質上這只能算是近存技術。另一種思路是在SRAM介質里面利用一些模擬器件的特性進行模擬計算,這種技術路徑雖然實現了真實的CIM,但缺點也很明顯。一方面模擬計算的精度有損失,一致性和可量產性完全無法保證,同一顆芯片在不同的時間不同的環境下無法確保同樣的輸出結果。另一方面它又必須基于ADCDAC來完成基于模擬計算的CIM和其他數字模塊之間的信息交互, 整體數據流安排以及界面交互設計限制多,不容易提升運行效率。

炬芯科技創新性的采用了基于模數混合設計的電路實現CIM,在SRAM介質內用客制化的模擬設計實現數字計算電路,既實現了真正的CIM,又保證了計算精度和量產一致性。

周正宇博士認為,炬芯科技選擇基于模數混合電路的SRAM存內計算(Mixed-Mode SRAM based CIM,簡稱MMSCIM)的技術路徑,具有以下幾點顯著的優勢:

第一,比純數字實現的能效比更高,并幾乎等同于純模擬實現的能效比;

第二,無需ADC/DAC, 數字實現的精度,高可靠性和量產一致性,這是數字化天生的優勢;

第三,易于工藝升級和不同FAB間的設計轉換;

第四,容易提升速度,進行性能/功耗/面積(PPA)的優化;

第五,自適應稀疏矩陣,進一步節省功耗,提升能效比。

而對于高質量的音頻處理和語音應用,MMSCIM是最佳的未來低功耗端側AI音頻技術架構。由于減少了在內存和存儲之間數據傳輸的需求,它可以大幅降低延遲,顯著提升性能,有效減少功耗和熱量產生。對于要在追求極致能效比電池供電IoT設備上賦能AI,在每毫瓦下打造盡可能多的 AI 算力,炬芯科技采用的MMSCIM技術是真正實現端側AI落地的最佳解決方案。

周正宇博士首次公布了炬芯科技MMSCIM路線規劃,從路線圖中顯示:

1、炬芯第一代(GEN1)MMSCIM已經在2024年落地, GEN1 MMSCIM采用22 納米制程,每一個核可以提供100 GOPS的算力,能效比高達6.4 TOPS/W @INT8;

2、到 2025 年,炬芯科技將推出第二代(GEN2)MMSCIM,GEN2 MMSCIM采用22 納米制程,性能將相較第一代提高三倍,每個核提供300GOPS算力,直接支持Transformer模型,能效比也提高到7.8TOPS/W @INT8;

3、到 2026 年,推出新制程12 納米的第三代(GEN3)MMSCIM,GEN3 MMSCIM每個核達到1 TOPS的高算力,支持Transformer,能效比進一步提升至15.6TOPS/W @INT8。

以上每一代MMSCIM技術均可以通過多核疊加的方式來提升總算力,比如MMSCIM GEN2單核是300 GOPS算力,可以通過四個核組合來達到高于1TOPS的算力。

炬芯科技正式發布新一代基于MMSCIM端側AI音頻芯片

炬芯科技成功落地了第一代MMSCIM在500MHz時實現了0.1TOPS的算力,并且達成了6.4TOPS/W的能效比,受益于其對于稀疏矩陣的自適應性,如果有合理稀疏性的模型(即一定比例參數為零時),能效比將進一步得到提升,依稀疏性的程度能效比可達成甚至超過10TOPS/W?;诖撕诵募夹g的創新,炬芯科技打造出了下一代低功耗大算力、高能效比的端側AI音頻芯片平臺。

周正宇代表炬芯科技正式發布全新一代基于MMSCIM端側AI音頻芯片,共三個芯片系列:

1、第一個系列是 ATS323X,面向低延遲私有無線音頻領域;

2、第二個系列是ATS286X,面向藍牙AI音頻領域;

3、第三個系列是 ATS362X,面向AI DSP領域。

三個系列芯片均采用了CPU(ARM)+ DSP(HiFi5)+ NPU(MMSCIM)三核異構的設計架構,炬芯的研發人員將MMSCIM和先進的HiFi5 DSP融合設計形成了炬芯科技“Actions Intelligence NPU(AI-NPU)”架構,并通過協同計算,形成一個既高彈性又高能效比的NPU架構。在這種AI-NPU架構中MMSCIM支持基礎性通用AI算子,提供低功耗大算力。同時,由于AI新模型新算子的不斷涌現,MMSCIM沒覆蓋的新興特殊算子則由HiFi5 DSP來予以補充。

以上全部系列的端側AI芯片,均可支持片上1百萬參數以內的AI模型,且可以通過片外PSRAM擴展到支持最大8百萬參數的AI模型,同時炬芯科技為AI-NPU打造了專用AI開發工具“ANDT”,該工具支持業內標準的AI開發流程如Tensorflow,HDF5,Pytorch和Onnx。同時它可自動將給定AI算法合理拆分給CIM和HiFi5 DSP去執行。 ANDT是打造炬芯低功耗端側音頻AI生態的重要武器。借助炬芯ANDT工具鏈輕松實現算法的融合,幫助開發者迅速地完成產品落地。

根據周正宇博士公布的第一代MMSCIM和HiFi5 DSP能效比實測結果的對比顯示:

當炬芯科技GEN1 MMSCIM與HiFi5 DSP均以500MHz運行同樣717K參數的Convolutional Neural Network(CNN)網路模型進行環境降噪時,MMSCIM相較于HiFi5 DSP可降低近98%功耗,能效比提升達44倍。而在測試使用935K 參數的CNN網路模型進行語音識別時,MMSCIM相較于HiFi5 DSP可降低93%功耗,能效比提升14倍。

另外,在測試使用更復雜的網路模型進行環境降噪時,運行Deep Recurrent Neural Network模型時,相較于HiFi5 DSP可降低89%功耗;運行Convolutional Recurrent Neural Network模型時,相較于HiFi5 DSP可降低88%功耗;運算Convolutional Deep Recurrent Neural Network模型時,相較于HiFi5 DSP可降低76%功耗。

最后,相同條件下在運算某CNN-Con2D算子模型時,GEN1 MMSCIM的實測AI算力可比HiFi5 DSP的實測算力高16.1倍。

綜上所述,炬芯科技此次推出的最新一代基于MMSCIM端側AI音頻芯片,對于產業的影響深遠,有望成為引領端側AI技術的新潮流。

炬芯科技Actions Intelligence助力AI生態快速發展

從ChatGPT到Sora,文生文、文生圖、文生視頻、圖生文、視頻生文,各種不同的云端大模型不斷刷新人們對AI的預期。然而,AI發展之路依然漫長,從云到端將會是一個新的發展趨勢,AI的世界即將開啟下半場。

以低延遲、個性服務和數據隱私保護等優勢,端側AI在IoT設備中扮演著越來越重要的角色,在制造、汽車、消費品等多個行業中展現更多可能性?;赟RAM的模數混合CIM技術路徑,炬芯科技新產品的發布踏出了打造低功耗端側 AI 算力的第一步,成功實現了在產品中整合 AI 加速引擎,推出CPU+ DSP + NPU 三核 AI 異構的端側AI音頻芯片。

最后,周正宇博士衷心希望可以通過”Actions Intelligence”戰略讓AI真正的隨處可及。未來,炬芯科技將繼續加大端側設備的邊緣算力研發投入,通過技術創新和產品迭代,實現算力和能效比進一步躍遷,提供高能效比、高集成度、高性能和高安全性的端側 AIoT 芯片產品,推動 AI 技術在端側設備上的融合應用,助力端側AI生態健康、快速發展。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    33000

    瀏覽量

    272750
  • 電池
    +關注

    關注

    84

    文章

    10812

    瀏覽量

    132683
  • IOT
    IOT
    +關注

    關注

    187

    文章

    4253

    瀏覽量

    199235
  • 炬芯科技
    +關注

    關注

    2

    文章

    118

    瀏覽量

    10840
收藏 0人收藏

    評論

    相關推薦

    科技探索AI技術與應用

    隨著人工智能技術的迅猛發展,AI應用正從云端向終端迅速擴張。AI的核心在于讓智能設備在本地完成數據處理和推理決策,并且可以在較低能耗情況下的持續工作,從而減少對云端的依賴,提升交互
    的頭像 發表于 03-27 14:58 ?264次閱讀

    AI SoC#科技 AI 處理器芯片:三核異構,存內計算

    科技 AI 處理器芯片產品主要為CPU+DSP雙核異構高算力單芯片解決方案,現在主推的
    的頭像 發表于 03-24 14:27 ?483次閱讀
    <b class='flag-5'>AI</b> SoC#<b class='flag-5'>炬</b><b class='flag-5'>芯</b>科技<b class='flag-5'>端</b><b class='flag-5'>側</b> <b class='flag-5'>AI</b> 處理器芯片:三核異構,存內計算

    兩大芯片廠商比拼AI音頻芯片,高算力藍牙6.0成亮點

    ,廣泛應用于各類智能設備中。就在近期,科技、中科藍訊均發布了公司新一代AI芯片。 ? 不同場景對
    的頭像 發表于 03-24 08:51 ?933次閱讀

    科技再發端 AI音頻芯片 ATS362X 低功耗大算力引爆音頻新浪潮

    隨著Deepseek掀起的又一波熱潮,科技順應人工智能從云端到迅速擴展的趨勢,作為
    的頭像 發表于 03-12 11:05 ?189次閱讀

    科技ATS362X 低功耗大算力AI音頻芯片

    隨著Deepseek掀起的又一波熱潮,科技順應人工智能從云端到迅速擴展的趨勢,作為
    的頭像 發表于 03-10 15:05 ?494次閱讀
    <b class='flag-5'>炬</b><b class='flag-5'>芯</b>科技ATS362X 低功耗大算力<b class='flag-5'>AI</b><b class='flag-5'>音頻</b>芯片

    訊通首次發布全新AI全棧解決方案SIMCom AI Stack

    近日,世界移動通信大會MWC 2025在西班牙巴塞羅那正式開幕。訊通攜5G-A、AIoT、5G RedCap等眾多前沿領域的創新成果驚艷亮相,并首次發布全新AI全棧解決方案SIM
    的頭像 發表于 03-08 09:56 ?343次閱讀

    藍牙音箱方案規格

    藍牙音箱方案規格
    發表于 01-23 16:24 ?5次下載

    科技:混合AI架構大有可為,2025AI是IoT設備關鍵

    網策劃了《2025年半導體產業展望》專題,收到數十位國內外半導體創新領袖企業高管的前瞻觀點。其中,電子發燒友特別采訪了科技市場推廣部總監馬大行,以下是他對2025年半導體市場的分析與展望。 ?
    發表于 12-30 14:38 ?906次閱讀
    <b class='flag-5'>炬</b><b class='flag-5'>芯</b>科技:混合<b class='flag-5'>AI</b>架構大有可為,2025<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>是IoT設備關鍵

    科技發布ATS323X系列AI音頻芯片

    剛過去不久,科技宣布全新一代基于模數混合SRAM存內計算(Mixed-mode SRAM based CIM,簡稱“MMSCIM”)技術的A
    的頭像 發表于 12-12 14:58 ?579次閱讀

    科技發布全新AI音頻芯片

    近日,搭載科技藍牙音頻SoC芯片的新一代AI智能藍牙耳機全新上市!
    的頭像 發表于 11-21 14:41 ?625次閱讀

    AI浪潮已來!科技發布新一代AI音頻芯片,能效比和AI算力大幅度提升

    電子發燒友原創 章鷹 ? 11月5日,在深圳會展中心7號館內,科技董事長兼CEO周正博士帶來了《
    的頭像 發表于 11-06 09:11 ?3327次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>浪潮已來!<b class='flag-5'>炬</b><b class='flag-5'>芯</b>科技發布新一代<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b><b class='flag-5'>音頻</b>芯片,能效比和<b class='flag-5'>AI</b>算力大幅度提升

    ATS3031單芯片藍牙音頻解決方案資料文檔

    AT3031?
    發表于 08-06 14:25 ?11次下載

    科技亮相2024亞洲音頻展暨發表主題演講

    在此次展會上,科技將展示其最新無線音頻SoC芯片解決方案及其終端應用。作為國內領先的AIoT芯片設計廠商,科技專注于無線
    的頭像 發表于 05-24 14:43 ?675次閱讀

    科技智能手表SoC采用原2.5D GPU IP

    近日,原股份與低功耗AIoT芯片設計廠商科技股份有限公司(科技)達成合作。
    的頭像 發表于 05-16 14:58 ?1994次閱讀

    科技趙新中:無線音頻SoC的AI算法未來和應用

    的平臺。 科技算法研發中心高級總監趙新中受邀出席,于電聲元器件及芯片專題論壇發表以《無線音頻SoC的AI算法未來和應用》為主題的演講,分
    的頭像 發表于 04-10 11:13 ?599次閱讀
    <b class='flag-5'>炬</b><b class='flag-5'>芯</b>科技趙新中:無線<b class='flag-5'>音頻</b>SoC的<b class='flag-5'>AI</b>算法<b class='flag-5'>未來</b>和應用
    主站蜘蛛池模板: 国产福利2021最新在线观看 | 色天天综合 | 四虎在线精品免费高清在线 | www.操操操.com| 色天使久久 | 你懂的国产 | 久久精品影院永久网址 | 亚洲一区二区三区免费在线观看 | 国产视频三级 | 天堂资源中文官网 | 久久久亚洲欧美综合 | 成人小视频在线 | 韩国在线免费视频 | 欧美深深色噜噜狠狠yyy | 伊人久久大香线蕉综合影 | bt磁力在线搜索 | 99精品在免费线视频 | 久久国产高清视频 | 国产精品免费一级在线观看 | 老司机成人精品视频lsj | 日韩精品一区二区三区免费视频 | 男女交性视频免费播放视频 | 中国人黑人xxⅹ性猛 | 亚洲va久久久噜噜噜久久狠狠 | 一区二区在线观看高清 | 成年人看的黄色 | 免费一级片在线 | 高清欧美一级在线观看 | 特污兔午夜影院 | 曰本女人一级毛片看一级毛 | 5060午夜一级 | 国产精品久久国产三级国不卡顿 | 上课被同桌摸下面做羞羞 | 国产亚洲精品在天天在线麻豆 | 亚洲视频一二三 | 亚洲国产成人成上人色 | 午夜神马影院 | 日黄网站 | 亚洲一级色片 | 韩国免费人成在线观看网站 | 久久久久国产精品免费看 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品