在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何透過數字直剖本質評估AI芯片的真實性能?

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 作者:地平線HorizonRobot ? 2021-05-03 18:11 ? 次閱讀

特斯拉 Hardware 3.0 的效率之謎

特斯拉在其推出的 Hardware 3.0 自動駕駛平臺中,采用自研芯片替代了Nvidia Drive PX2,其理論算力直線提升了 3 倍,而以 MAPS 方式來評估,其真實 AI 性能更是驚人的提升了 21 倍。具體而言,Hardware 2.0 時每秒只能處理 110 幀圖像,而現在則高達 2300 幀。

那么,Hardware 的效率提升應該如何認識呢?在“算力至上”的今天,如何透過數字直剖本質評估 AI 芯片的真實性能?

算力攀升,為什么卻看不到實用性?

隨著芯片制程技術的演進,摩爾定律的發展卻逐漸進入瓶頸期,這與當下計算 AI 計算需求量爆發式的增長顯得格格不入。追求純算力突破并不可持續,同時算力也并不代表汽車智能芯片“真實性能”,芯片計算效率也同樣需要關注。于是,軟硬結合、算法加持的 AI 芯片接過了跑贏新場景的接力棒。

當前,行業普遍以“TOPS”為單位來評估AI的理論峰值算力。盡管在目前主流的AI芯片性能基準測試( MLPerf )下很多頂級廠商頻繁刷新榜單記錄,但在實際場景下的算力有效利用率卻差強人意。

2b80db88-9572-11eb-8b86-12bb97331649.png

人們逐漸認識到,AI 芯片理論峰值算力并不一定能在實際運行中完全釋放。例如,一款擁有理論峰值算力為 16 TOPS 的芯片,在計算不同模型時甚至會有接近 80% 的差異。此外,在卷積神經網絡任務實測中,從 2014 年到 2019 年,最好的神經網絡計算效率相差了 100 倍,相當于計算效率每 9 個月翻一倍,遠快于每 18 個月翻倍的摩爾定律。因此在模型算法演進速度遠快于芯片性能提升的速度的現在,不僅需要算力更高的芯片,也需要更合理的性能評估方法幫助用戶選擇適合的 AI 芯片。

對這些 AI 時代出現的新變化,以地平線為代表的 AI 芯片企業認為,單純依賴于 PPA 芯片設計指標,很容易陷入算力至上的“誤區”,但算力并不是完全反應芯片性能唯一評估標準。因此,地平線提出了 MAPS(Mean Accuracy-guaranteed Processing Speed)概念和評估方法,以此作為檢驗 AI 性能的真正標準。通俗來說,就是在特定的 AI 應用領域,看芯片處理 AI 任務的速度和精度,即“多快”和“多準”。

MAPS 動態評估芯片真實 AI 性能

隨著 AI 算法的不斷演進,幾乎每 10-14 個月,相同的計算精度計算量可以下降一半。這種提升與算法設計的精妙程度息息相關,但算法的快速演進也對計算架構提出巨大的挑戰,尤其是對傳統通用的并行架構而言,例如亟需高效AI專用處理器的自動駕駛場景。

MAPS 其實是在物理算力的基礎上,通過對大量模型的測試,綜合各個模型的速度(正比與物理算力*實際利用率)和準確率得到的最佳方案的量化結果。它更聚焦于使用戶能夠通過可視化的圖表直觀的感知 AI 芯片真實算力。正如對于汽車來說,馬力(單位: HP)不如百公里加速時間(單位:秒)更真實反映整車動力性能;算力(單位: TOPS)并不反映汽車智能芯片實際性能,而每秒準確識別幀率 MAPS(單位: FPS)才是更真實的性能指標。

2bb9df64-9572-11eb-8b86-12bb97331649.png

MAPS=最佳模型多邊形面積/(精度上界—精度下界),其中橫軸反應幀率,縱軸反應精度

此外,在自動駕駛中應該如何對速度和精度做取舍呢?現實生活中我們經常遇到一些極端的案例,例如當汽車遭遇小孩子橫穿馬路的突發狀況時,如果自動駕駛識別延時過高,會剎車不及時;如果精度不夠,則會造成無法識別。在很多類似的場景中,我們往往面臨既要“快”,又要兼顧“準”的境況。而在 MAPS 評估方法下,我們可以清晰看到幀率和精度之間的動態關系,這也是其對實際場景的重要價值之一。

更高級別自動駕駛需要多少“FPS”?

軟件定義的汽車的趨勢下,未來汽車正逐步成為四個輪子上的超級計算機。可以清晰預見的是,電動車賣點不是車,而是「智能」,這是一個堪比計算機誕生級別的創新。

特斯拉在 Hardware 3.0 中,采用其自研 AI 芯片 FSD Chip 替代了 Hardware 2.5 中的 Nvidia Drive PX2,算力從 24 TOPS 提升到了 72 TOPS,但運行同樣模型的精度卻驚人的提升了 21 倍。具體而言,Hardware 2.0 時每秒只能處理 110 幀圖像,而現在則高達 2300 幀。除了絕對算力的提升,額外提升則來自于利用率的提升。同時特斯拉也宣布針對 Hardware 3.0 重寫自動駕駛軟件,從而在 2020 年 10 月推出了 FSD beta,這是唯一不受場地限制、大規模測試的自動駕駛方案。

特斯拉革命性技術的重構與 MAPS背后體現的理念有相通之處:提升物理算力(HW 3.0 提升 3 倍)、提升利用率(提升近 2 倍),找到最佳的速度和準確率提升(重寫自動駕駛軟件),使得特斯拉從簡單場景的 NOA 一步步突破到不受限的自動駕駛。而地平線在芯片設計之中一直貫徹 MAPS 背后的技術理念,關注提升物理算力的同時關注利用率的提升,并且不斷把算法發展趨勢,使得軟硬件可以協同共振,發揮最高效能。

為了助力汽車廠商突破“特斯拉困境”,實現高級別自動駕駛的落地。地平線即將推出的征程 5 MAPS 整體跑分高達 3020 FPS,其中 MAPS@COCO (檢測任務COCO MAPS) 跑分可高達 116,而 Nvidia Xavier MAPS@COCO 為 41 FPS (GPU&DLA@32W mode ),如此高的性能將助力車廠加速實現自動駕駛方案的落地。

驅動新基建數字底座,需要有算力也要有效率。自成立以來,地平線便致力于兼備算力與效率的高性能芯片。未來,地平線將推出性能更強大的征程6,其不僅在功耗、面積優化的基礎上,同時在MAPS上繼續提升一個數量級,助力全行業共同努力進一步大幅提升自動駕駛的安全性。

原文標題:不看算力看效率,更高級別的自動駕駛需要多少 “FPS”?

文章出處:【微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 特斯拉
    +關注

    關注

    66

    文章

    6322

    瀏覽量

    126704
  • AI
    AI
    +關注

    關注

    87

    文章

    31432

    瀏覽量

    269832
  • 自動駕駛
    +關注

    關注

    784

    文章

    13918

    瀏覽量

    166793

原文標題:不看算力看效率,更高級別的自動駕駛需要多少 “FPS”?

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2.5D/3D封裝技術升級,拉高AI芯片性能天花板

    電子發燒友網報道(文/李彎彎)一以來,提升芯片性能主要依靠先進制程的突破。但現在,人工智能對算力的需求,將芯片封裝技術的重要性提升至前所未有的高度。為了提升
    的頭像 發表于 07-11 01:12 ?6706次閱讀

    數字電路仿真實

    電子發燒友網站提供《數字電路仿真實現.pdf》資料免費下載
    發表于 01-21 09:24 ?0次下載
    <b class='flag-5'>數字電路仿真實</b>現

    AI跑分超8000,天璣9400憑實力碾壓一眾旗艦芯片

    蘇黎世AI Benchmark榜單冠軍,以稱霸行業的AI性能,加速智能手機的智能體化進程。 AI Benchmark自2018年推出以來,一
    的頭像 發表于 01-10 12:40 ?110次閱讀
    <b class='flag-5'>AI</b>跑分超8000,天璣9400憑實力碾壓一眾旗艦<b class='flag-5'>芯片</b>

    賽昉聯合國芯推出高性能AI MCU芯片,實現RISC-V+AI新應用

    近日,賽昉科技與蘇州國芯科技有限公司(以下簡稱“國芯科技”)合作研發的高性能AIMCU芯片產品CCR7002已成功通過了內部性能和功能測試,實現了RISC-V+AI技術的新應用。賽昉科
    的頭像 發表于 11-27 11:46 ?465次閱讀
    賽昉聯合國芯推出高<b class='flag-5'>性能</b><b class='flag-5'>AI</b> MCU<b class='flag-5'>芯片</b>,實現RISC-V+<b class='flag-5'>AI</b>新應用

    ADS1299如何保證數據真實性

    %時,調整為6倍增益。 后面的AD轉換是接近實時的轉換,在調整增益時,如何保障記錄到的調整數據接近真實的連接,即保證數據真實性
    發表于 11-26 06:16

    多通道負載測試和性能評估

    情況下的性能。這種測試通常用于評估系統的最大處理能力,以及確定系統在何種負載下開始出現性能下降。多通道負載測試可以模擬真實的用戶行為,包括用戶的請求、響應和數據處理等。 在進行多通道負
    發表于 11-11 16:44

    如何評估AI大模型的效果

    評估AI大模型的效果是一個復雜且多維度的過程,涉及多個方面的考量。以下是一些關鍵的評估方法和步驟: 一、基準測試(Benchmarking) 使用標準數據集和任務來評估模型的
    的頭像 發表于 10-23 15:21 ?1371次閱讀

    光學透過率測量儀的技術原理和應用場景

    :在建筑行業中,光學透過率測量儀被用于測試建筑材料(如窗戶、天窗和其他透明部件)的透明度,以確保它們符合質量和性能標準。這對于需要控制光線進入量的建筑物尤為重要,如展覽館、圖書館等。此外,它還
    發表于 10-16 14:38

    過數字隔離器將SPI轉換為GPIO

    電子發燒友網站提供《通過數字隔離器將SPI轉換為GPIO.pdf》資料免費下載
    發表于 09-21 10:20 ?0次下載
    通<b class='flag-5'>過數字</b>隔離器將SPI轉換為GPIO

    3D DRAM內嵌AI芯片AI計算性能暴增

    當前高帶寬內存(HBM)中的DRAM芯片,通過在3D DRAM中實現AI處理來解決數據總線問題。 ? 通常來說,當前的 AI芯片架構將數據存儲在高帶寬內存中,并通
    的頭像 發表于 08-16 00:08 ?3307次閱讀
    3D DRAM內嵌<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,<b class='flag-5'>AI</b>計算<b class='flag-5'>性能</b>暴增

    AI芯片哪里買?

    AI芯片
    芯廣場
    發布于 :2024年05月31日 16:58:19

    知存科技助力AI應用落地:WTMDK2101-ZT1評估板實地評測與性能揭秘

    資料后博主自己總結:存內計算技術的發展對于提高計算設備的整體性能、降低能耗并改善數據處理效率具有重要意義。值得一提的是,我國知存科技推出的 WTM2101 芯片即采用存內計算這種方式。 近存計算和存內
    發表于 05-16 16:38

    risc-v多核芯片AI方面的應用

    得RISC-V多核芯片能夠更好地適應AI算法的不同需求,包括深度學習、神經網絡等,從而提高芯片性能和效率,降低成本,使AI邊緣計算晶片更具
    發表于 04-28 09:20

    英偉達將用AI設計AI芯片

    AI芯片行業資訊
    深圳市浮思特科技有限公司
    發布于 :2024年02月19日 17:54:43

    數字功放推薦-家庭影院常用的數字功放芯片

    隨著科技的不斷發展,數字功放芯片在家庭影院領域的應用越來越廣泛;作為家庭影院的核心組件之一,其性能和質量對家庭影院的音質和畫質有著至關重要的影響;其高效、穩定、音質優良等特點,為家庭影院帶來了更加
    的頭像 發表于 01-26 11:15 ?1793次閱讀
    主站蜘蛛池模板: 亚洲视频久久| 午夜精品福利在线| 欧美黄色大全| 免费h网站在线观看| 国产性猛交xx乱| 轻点灬大ji巴太大太深了| 美女无遮挡拍拍拍免费视频| 高清一区二区在线观看| 亚洲嫩草影院在线观看| 天天爱天天色| 欧美特级黄| 国产免费私拍一区二区三区| 又黄又粗暴的120秒免费gif视频| 天天干天天色天天射| 久草cm| 欧美性受xxxx| 国产精品11页| 色久天| 狠狠色噜噜狠狠狠| 综合视频网| 婷五月综合| 色婷婷激情| 九月丁香婷婷| 亚洲成a人片在线看| 黄色免费在线网址| 性夜影院爽黄a爽免费视| 亚洲+国产+图片| 免费看 s色| 午夜操操| 欧美xx高清| 亚洲成网| 久久ww| 天天插夜夜| semm亚洲欧美在线高清| 亚洲精品在线免费观看视频| 女人被狂躁视频网站免费| www.夜色| 一级片免费观看视频| 久久作爱视频| 亚洲精品第三页| 娇妻被黑人蹂躏|