在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

大算力AI芯片,迎戰(zhàn)自動駕駛芯片算力焦慮

新機器視覺 ? 來源:36氪 ? 作者:36氪 ? 2022-07-07 16:26 ? 次閱讀

后摩智能點亮首款基于SRAM的「存算一體」大算力AI芯片,迎戰(zhàn)自動駕駛芯片算力焦慮。

自動駕駛芯片,越來越「熱鬧」了。

近年來,自動駕駛的普及以肉眼可見的速度加快,根據(jù)1月12日工信部數(shù)據(jù),2021年新能源汽車銷售352.1萬輛,其中搭載組合輔助駕駛系統(tǒng)的乘用車新車市場占比達到20%。而兩年前,L2級輔助駕駛的滲透率僅為3.3%。

相伴而生的,是汽車「大腦」自動駕駛AI芯片的競爭加劇。

英偉達英特爾等老牌芯片企業(yè)早就瞄準了這一賽道,特斯拉、蔚來、小鵬等車企,黑芝麻、地平線、芯馳科技寒武紀、后摩智能等國內(nèi)芯片廠商也都紛紛入局。

比如,蔚來汽車有自研芯片的計劃;高通去年宣布和寶馬合作,2025年使用高通驍龍Ride自動駕駛平臺;初創(chuàng)公司有的直接聚焦在自動駕駛上,也有的業(yè)務范圍更廣,覆蓋自動駕駛、智能座艙、中央網(wǎng)關、高可靠MCU等;收購、合作等關系網(wǎng)也在不斷變動,這一戰(zhàn)場的發(fā)令槍已經(jīng)拉響了。

然而,與常見的數(shù)據(jù)中心AI芯片不同,應用于汽車場景的AI芯片,在算力、功耗、性能方面都提出了更極端的要求。

在摩爾定律逐漸失效、“存儲墻”問題日益凸顯的當下,汽車AI芯片到底需要提供多大算力?何種路徑才是突破摩爾定律的存儲墻壁壘的最接近落地方法?面對山頭林立、秩序井然的芯片市場,初創(chuàng)公司的市場機遇和差異化優(yōu)勢又是什么?

「存算一體」也許是個值得研究的答案。

一筆取舍賬,自動駕駛需要多少算力

過去幾年中,用于衡量一款自動駕駛芯片最直接的標準之一,就是算力高低。

自動駕駛級別越高時,產(chǎn)生的數(shù)據(jù)越多,對芯片的算力要求也就越高。

2014年時,最早應用Mobileye的第一代EyeQ芯片,算力只有0.256TOPS;2015年,就已有專門面向自動駕駛的平臺,每年要迭代1-2次;英偉達也預告將在2025年上市1000T算力的Atlan芯片。

算力的不斷提升,是否意味著自動駕駛的需求已經(jīng)得到了滿足,自動駕駛玩家們可以跑出算力焦慮了?

遠還沒有。

一方面,大算力也意味著更高的成本。實際上在現(xiàn)有的自動駕駛芯片中,單片算力很難滿足高級別自動駕駛的需求,車企或自動駕駛企業(yè)多會采取“堆料”的方式,用芯片數(shù)量的增加來實現(xiàn)大算力。成本的增加不可避免,難以推動自動駕駛技術的規(guī)模化應用,車企也很難實現(xiàn)技術和商業(yè)的平衡。

另一方面,除了對算力需求高,智能駕駛場景也對芯片的功耗和散熱有很高的要求。服務于豐田的創(chuàng)業(yè)者Amnon Shashua曾在多個場合表示過,效率比算力更重要。具體解釋,算力、功耗、成本就像是一個三角架構,一角的增減要用另一角來填補才行。

除此之外,「算力」并不真正代表著「性能」。

1000Tops的芯片參數(shù),并不意味著這塊芯片在實際應用中能夠發(fā)揮出1000Tops的真實性能。

在當前的馮·諾伊曼架構當中,內(nèi)存系統(tǒng)的性能提升速度大幅落后于處理器的性能提升速度,有限的內(nèi)存帶寬無法保證數(shù)據(jù)高速傳輸,形成了一道“存儲墻”。

一方面,大量的計算單元受限于帶寬的限制,無法發(fā)揮作用,造成算力利用率很低;另一方面,數(shù)據(jù)來回傳輸又會產(chǎn)生巨大功耗,進一步加大汽車電動化大潮下的里程焦慮。

因此,僅僅簡單用算力高低來評估,遠遠達不到自動駕駛的需求。

汽車AI芯片不僅需要大算力,更要有實際利用率的大算力,而且能夠保障低功耗、低延遲以及可承受的成本。

存算一體,金字塔從頭建起

為了解決“存儲墻”問題,當前業(yè)內(nèi)主要有三種方案:

用GDDR 或HBM來解決存儲墻問題的馮·諾依曼架構策略;算法和芯片高度綁定在一起的DSA方案;以及存算一體的方案。

HBM是目前業(yè)內(nèi)超大算力芯片常用的方案之一,其優(yōu)勢在于能夠暫時緩解“存儲墻”的困擾,但其性能天花板明顯,并且成本較高。

DSA方案以犧牲靈活性換取效率提升,算法和硬件高度耦合,適用于已經(jīng)成熟的AI算法,但并不適用于正處于快速迭代的自動駕駛AI算法中。

最后是存算一體方案,這是一項誕生于實驗室的新興技術,其創(chuàng)新性在于打破了傳統(tǒng)·馮諾伊曼架構局限性,實現(xiàn)了計算與存儲模塊一體化的整合創(chuàng)新,解決了傳統(tǒng)芯片架構中計算與存儲模塊間巨大的數(shù)據(jù)傳輸延遲、能量損耗痛點,既增加了數(shù)據(jù)處理速度,又大大降低了數(shù)據(jù)傳輸?shù)墓模瑥亩剐酒苄П龋疵客吣芴峁┑乃懔Γ┑玫?-3個數(shù)量級(》100倍)的提升。

達摩院計算技術實驗室科學家鄭宏忠曾講過:“存算一體是顛覆性的芯片技術,它天然擁有高性能、高帶寬和高能效的優(yōu)勢,可以從底層架構上解決后摩爾定律時代芯片的性能和能耗問題。”

因此,存算一體架構可以把算力做的更大,其芯片算力天花板比傳統(tǒng)馮·諾依曼架構更高;同時,大幅降低了數(shù)據(jù)傳輸?shù)哪芰繐p耗,提升了能效比;另外,還能得到更低的延時,存儲和計算單元之間數(shù)據(jù)搬運的減少,大幅縮短了系統(tǒng)響應時間。

更重要的是,用存算一體架構做大算力AI芯片另一大優(yōu)勢在于成本控制。不依賴于GDDR 或HBM,存算一體芯片的成本能夠相應的降低50%~70%。

換句話說,真正創(chuàng)新架構的AI芯片是將上文中提到的算力、功耗、成本三角形結構從原來的位置往上挪了三個檔位。不僅可以提高算力,還可以達到降低功耗、控制成本的效果。

摘取「高掛的果實」

最近幾年,在缺芯的時代背景下,隨著政策支持的不斷加碼,我們看到國內(nèi)半導體產(chǎn)業(yè)迎來了發(fā)展的良機。芯片的“國產(chǎn)替代”已經(jīng)在很多細分領域取得了進展,深受資本市場青睞。

但是資本市場也有越來越多的人意識到,熱門芯片賽道的“國產(chǎn)替代”創(chuàng)業(yè)項目已經(jīng)日趨飽和。一部分嗅覺敏銳的投資人開始關注后摩爾時代的“創(chuàng)新架構”,認為要想在純市場化競爭中挑戰(zhàn)英偉達等國際芯片巨頭,必須另辟蹊徑。于是差異化的技術創(chuàng)新成為芯片投資中的重要策略。

HBM、DSA、存算一體都屬于芯片行業(yè)當前的技術創(chuàng)新路徑,三者對比來看,存算一體可以算作是一條難度最大、顛覆性最強、風險最高,但差異化和創(chuàng)新性也最顯著的路徑。

近年來,國內(nèi)外涌現(xiàn)出不少專注于存算一體芯片的新興創(chuàng)企,巨頭們紛紛加快了產(chǎn)業(yè)布局,資本也對其青睞有加。國內(nèi)最近一筆相關融資來自今年4月,國內(nèi)存算一體明星創(chuàng)企「后摩智能」宣布獲得數(shù)億人民幣Pre-A+輪融資。

不過,一直以來,傳統(tǒng)的存算一體研究大多集中在低功耗、低算力的「小」芯片場景中,比如語音、AIoT、安防等邊緣領域。

能夠應用在車載AI的存算一體「大」算力芯片,即便在學術界也是一大難題,產(chǎn)業(yè)界敢于迎戰(zhàn)者更是屈指可數(shù)。

想要將二者融合,既需要存儲單元陣列、AI core、工具鏈等各個方面都需要有深厚積累的團隊,又需要進行整體的協(xié)同優(yōu)化設計,才能最終實現(xiàn)一款高效的基于存算一體的大算力AI芯片。

所幸,這一創(chuàng)新性技術已經(jīng)讓市場看到了落地可能性。

5月23日,后摩智能首款基于SRAM的存算一體大算力AI芯片已成功點亮,并跑通智能駕駛算法模型。首次在存內(nèi)計算架構上跑通了智能駕駛場景下多場景、多任務算法模型,為高級別智能駕駛提供了一條全新的技術路徑。

存算一體很難,存算一體大芯片更難。但在產(chǎn)業(yè)巨頭林立,市場秩序森嚴的芯片產(chǎn)業(yè),新興創(chuàng)企若是只愿意選擇容易走的路、采摘「低垂的果實」,是難以取得成功的。

在保證存算一體帶來的高能效比、高性價比的前提下,又能將其成功擴展到滿足自動駕駛「大」算力需求的級別,屬于產(chǎn)業(yè)中「高掛的果實」。

從成立之初就聚焦于存算一體大算力芯片的后摩智能,正是瞄準了這一道路。

以團隊組成來說,后摩智能的核心創(chuàng)始團隊既有來自美國普林斯頓大學、UCSB, Penn State大學等海內(nèi)外知名高校的學術人才,又有在AMD、Nvidia、華為海思、地平線等一線芯片企業(yè)中擁有豐富大芯片設計與實戰(zhàn)經(jīng)驗的產(chǎn)業(yè)專家。

今年5月大算力存算一體芯片宣布點亮,對于后摩智能來說,離摘取「高掛的果實」已經(jīng)越來越近了。

傳統(tǒng)高算力芯片山頭林立,后來者想要在現(xiàn)有賽道上實現(xiàn)超越,確實是充滿挑戰(zhàn)的。

但隨著HBM等昂貴方案的不斷的提出,馮·諾伊曼架構的最后一絲紅利已經(jīng)被榨干,市場迫切地需要新架構、新出路。

在AI算法快速迭代,摩爾定律逐漸失效的當下,我們期待看到越來越多像后摩智能這樣愿意投身于基礎創(chuàng)新的芯片創(chuàng)企,不斷推進產(chǎn)業(yè)走向下一個時代。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 摩爾定律
    +關注

    關注

    4

    文章

    636

    瀏覽量

    79156
  • 自動駕駛
    +關注

    關注

    784

    文章

    13910

    瀏覽量

    166760
  • AI芯片
    +關注

    關注

    17

    文章

    1901

    瀏覽量

    35140

原文標題:自動駕駛芯片的算力焦慮,「存算一體」能解決嗎?

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中心的如何衡量?

    (ComputationalPower)是指智中心通過其內(nèi)部的計算設備(如CPU、GPU、AI芯片等)對數(shù)據(jù)進行處理和計算的能力。它體現(xiàn)了智中心在單位時間內(nèi)能夠完成的計算任務量,
    的頭像 發(fā)表于 01-16 14:03 ?261次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    企業(yè)AI租賃模式的好處

    構建和維護一個高效、可擴展的AI基礎設施,不僅需要巨額的初期投資,還涉及復雜的運維管理和持續(xù)的技術升級。而AI
    的頭像 發(fā)表于 12-24 10:49 ?165次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計算資源,以滿足其AI應用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?931次閱讀

    GPU開發(fā)平臺是什么

    隨著AI技術的廣泛應用,需求呈現(xiàn)出爆發(fā)式增長。AI租賃作為一種新興的服務模式,正逐漸成為
    的頭像 發(fā)表于 10-31 10:31 ?221次閱讀

    億鑄科技熊大鵬探討AI芯片的挑戰(zhàn)與解決策略

    在SEMiBAY2024《HBM與存儲器技術與應用論壇》上,億鑄科技的創(chuàng)始人、董事長兼CEO熊大鵬博士發(fā)表了題為《超越極限:大芯片的技術挑戰(zhàn)與解決之道》的演講,深入剖析了AI大模型
    的頭像 發(fā)表于 10-25 11:52 ?452次閱讀

    AI芯片供電電源測試利器:費思低壓大電流系列電子負載

    AI芯片作為驅(qū)動復雜計算任務的核心引擎,其性能與穩(wěn)定性成為了決定應用成敗的關鍵因素。而在這背后,供電電源的穩(wěn)定性和高效性則是保障AI
    的頭像 發(fā)表于 10-25 11:26 ?616次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>供電電源測試利器:費思低壓大電流系列電子負載

    一體架構創(chuàng)新助力國產(chǎn)大AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《存一體架構創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?377次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    1章 從TOP500和MLPerf看芯片格局 1.1科學最前沿TOP500 1.2 AI
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構分析

    ,在全球范圍內(nèi),對于推動科技進步、經(jīng)濟發(fā)展及社會整體的運作具有至關重要的作用。隨著信息技術的高速發(fā)展,高性能計算(HPC)和人工智能(AI)等技術在多個領域的應用變得日益廣泛,芯片
    發(fā)表于 09-02 10:09

    大模型時代的需求

    現(xiàn)在AI已進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    揭秘芯片:為何它如此關鍵?

    在數(shù)字化時代,芯片作為電子設備的核心組件,其性能直接關系到設備的運行速度和處理能力。而芯片,即其計算能力,更是衡量芯片性能的重要指標。
    的頭像 發(fā)表于 05-09 08:27 ?1206次閱讀
    揭秘<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>:為何它如此關鍵?

    數(shù)據(jù)語料庫、算法框架和芯片AI大模型中的作用和影響

    數(shù)據(jù)語料庫、算法框架和芯片的確是影響AI大模型發(fā)展的三大重要因素。
    的頭像 發(fā)表于 03-01 09:42 ?1230次閱讀

    芯片:未來科技的加速器?

    在數(shù)字化時代,芯片作為電子設備的核心組件,其性能直接關系到設備的運行速度和處理能力。而芯片,即其計算能力,更是衡量芯片性能的重要指標。
    的頭像 發(fā)表于 02-27 09:42 ?976次閱讀
    高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>:未來科技的加速器?

    智能規(guī)模超通用,大模型對智能提出高要求

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)是設備通過處理數(shù)據(jù),實現(xiàn)特定結果輸出的計算能力,常用FLOPS作為計量單位。FLOPS是Floating-point Operations Per Second
    的頭像 發(fā)表于 02-06 00:08 ?6459次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發(fā)布于 :2024年01月25日 14:54:52
    主站蜘蛛池模板: 99伊人| 手机看片1024久久| 91牛牛| 香蕉视频国产在线观看| 一级片在线播放| 天天插天天射| 久久精品系列| 日本69xxxx| 国产精品久久久久久影院| 俄罗斯欧美色黄激情| 丁香六月啪| 好大好硬好爽免费视频| 一区二区亚洲视频| 国产免费亚洲| 男同小黄文| 亚洲情欲网| 岬奈奈美在线 国产一区| 亚洲欧美视频在线播放| 日本一区二区免费在线观看| 最新丁香六月| 五月婷婷色| 亚洲成色999久久网站| 在线国产高清| 深爱综合网| 狠狠色狠狠色| 午夜欧美福利视频| 大又大粗又爽又黄少妇毛片| 亚洲综合免费| 香蕉视频一级| 久久性| 五月天婷婷影院| www.五月婷| 另类专区欧美| 丁香五月欧美成人| 岬奈奈美在线 国产一区| 色老久久精品偷偷鲁一区| 精品一级毛片| 天天操夜| 夜色成人网| 四虎精品影院永久在线播放| 黄色w站|