在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何在推理引擎中脫穎而出

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Geoff Tate ? 2022-07-06 14:48 ? 次閱讀

隨著人工智能的爆炸式增長,人們越來越關注能夠提供人工智能所需性能的新型專業推理引擎。因此,在過去六個月中,我們看到了一系列神經推理硬件公告,所有這些都承諾提供比市場上任何其他產品更好的加速。然而,挑戰在于沒有人真正知道如何衡量一個與另一個。這是一項新技術,就像任何新技術一樣,我們需要指標,我們需要真正重要的指標。

一切都與吞吐量有關

當推理引擎的性能出現時,供應商會拋出諸如 TOPS(Tera-Operations/Second)性能和 TOPS/Watt 之類的基準。研究這些的系統/芯片設計人員很快意識到這些數字通常毫無意義。真正重要的是推理引擎可以為模型、圖像大小、批量大小和過程以及 PVT(過程/電壓/溫度)條件提供多少吞吐量。這是衡量其性能表現的第一個衡量標準,但令人驚訝的是,很少有供應商提供它。

TOPS 的最大問題是,當一家公司說他們的引擎執行 X TOPS 時,他們通常會引用這一點而沒有說明條件是什么。在不知道這些信息的情況下,他們錯誤地認為 X TOPS 意味著它可以執行 X 萬億次操作。實際上,報價 130 TOPS 的公司可能僅提供 27 TOPS 的可用吞吐量。

另一個正在使用但不太常用的基準是 ResNet-50。這個基準的問題是大多數引用它的公司都沒有給出批量大小。如果他們不這樣做,芯片設計人員可以假設這將是一個大批量,以最大限度地提高他們的硬件利用率。這使得 ResNet-50 作為基準不是很有幫助。相比之下,例如 YOLOv3 需要 100 倍以上的操作來處理 2 兆像素的圖像。在“真實世界”模型中,硬件利用率將面臨更大挑戰。

如何正確測量神經推理引擎

在評估神經推理引擎時,需要注意幾個關鍵事項。以下是最重要的考慮因素以及它們為何真正重要的原因。

定義什么是操作:一些供應商將乘法(通常為 INT 8 乘以 INT 8)計為一次操作,將累加(加法,通常為 INT 32)計為一次操作。因此,一次乘法累加等于 2 次操作。但是,一些供應商在其 TOPS 規范中包含其他類型的操作,因此必須在開始時進行澄清。

詢問 操作條件是什么: 如果供應商提供 TOPS 而不提供條件,他們通常使用室溫、標稱電壓和典型工藝。通常他們會提到他們所指的工藝節點,但不同供應商的運行速度不同,大多數工藝提供2、3或更多的標稱電壓。由于性能是頻率的函數,而頻率是電壓的函數,因此芯片設計人員在 0.9V 時可以獲得比在 0.6V 時高兩倍以上的性能。頻率因條件/假設而異。有關這方面的更多信息,請參閱此應用說明。

看看批量大小:即使供應商提供最壞情況的 TOPS,芯片設計人員也需要弄清楚所有這些操作是否真的有助于計算他們的神經網絡模型。實際上,實際利用率可能非常低,因為沒有推理引擎始終 100% 地使用所有 MAC。這就是批量大小很重要的原因。批處理是為給定層加載權重并同時處理多個數據集。這樣做的原因是為了提高吞吐量,但放棄的是更長的延遲。ResNet-50 擁有超過 2000 萬個權重;YOLOv3 擁有超過 6000 萬個權重;并且必須為每個圖像獲取每個權重并將其加載到 MAC 結構中。權重太多,無法讓它們都駐留在 MAC 結構中。

poYBAGLFMEOAYgAkAAFI6_5PqUw443.png

找出你的 MAC 利用率:并非所有神經網絡的行為都相同。您需要以您需要的批量大小找出您想要部署的神經網絡模型的神經推理引擎的實際 MAC 利用率。

深入TOPS

如果您是一名正在研究神經推理引擎的設計師,希望這篇文章能夠闡明要尋找的內容。請記住——重要的是吞吐量。重要的是不要陷入諸如 TOPS 和 ResNet-50 之類的毫無意義的基準測試中,除非您知道圍繞這些問題要問的問題。首先提出以下問題:在批量大小 = A 和 XYZ PVT 條件下,可以為特定模型(例如 YOLOv3)處理多少圖像/秒。一旦您開始指定條件和假設,您將開始了解任何神經推理在現實世界中的表現如何。歸根結底,這才是最重要的。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    50965

    瀏覽量

    424829
  • 神經網絡
    +關注

    關注

    42

    文章

    4774

    瀏覽量

    100903
  • 人工智能
    +關注

    關注

    1792

    文章

    47442

    瀏覽量

    238994
收藏 人收藏

    評論

    相關推薦

    選用哪款條碼掃描引擎嵌入手持終端類使用?尺寸小巧讀取率高?

    引擎為何能在眾多產品脫穎而出,成為嵌入手持終端的理想選擇。LV30條碼掃描引擎以其緊湊的設計著稱,這一特性使得它能夠輕松融入各種尺寸的手持終端
    的頭像 發表于 01-06 15:19 ?55次閱讀
    選用哪款條碼掃描<b class='flag-5'>引擎</b>嵌入手持終端類使用?尺寸小巧讀取率高?

    喜報!全國首批!賽思成功獲選國家級專精特新重點“小巨人”企業!

    萬里挑一!賽思從16000多家專精特新“小巨人”企業脫穎而出,榮獲國家級專精特新“重點小巨人企業。
    的頭像 發表于 12-05 11:46 ?350次閱讀
    喜報!全國首批!賽思成功獲選國家級專精特新重點“小巨人”企業!

    重磅!賽思榮膺投資家網“2024年度最具投資價值企業TOP100”!

    入選率僅2%!賽思憑借在時鐘同步及混合數模領域的卓絕表現,從4600余家企業脫穎而出
    的頭像 發表于 12-03 18:52 ?233次閱讀
    重磅!賽思榮膺投資家網“2024年度最具投資價值企業TOP100”!

    尼爾森數據背后:Shokz韶音如何在全球運動耳機市場脫穎而出

    全球市場調研機構尼爾森,近日在巴黎馬拉松期間發布了Sport2024調研報告。數據表明,68%的消費者在跑步時有聽音樂的習慣,而在消費者跑步時最常佩戴的耳機品牌,蘋果、韶音等榜上有名。其中,定位
    的頭像 發表于 11-18 14:53 ?285次閱讀
    尼爾森數據背后:Shokz韶音如<b class='flag-5'>何在</b>全球運動耳機市場<b class='flag-5'>脫穎而出</b>

    李開復:中國擅長打造經濟實惠的AI推理引擎

    10月22日上午,零一萬物公司的創始人兼首席執行官李開復在與外媒的交流透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實現了顯著優勢,比OpenAI的GPT-4o模型低了31倍。他強調,中國擅長打造經濟實惠的AI
    的頭像 發表于 10-22 16:54 ?374次閱讀

    國產MCU廠商,靠什么從內卷脫穎而出

    導語在當下內卷的大環境下,航順芯片是如何消除內卷,突破高端的?當前,全球半導體行業正經歷寒冬。受經濟環境疲軟、消費需求減弱、庫存調整等因素影響,半導體市場增速顯著放緩。在這種背景下,半導體廠商間的競爭日益激烈,價格戰已成常態,MCU市場亦不例外。SIA數據顯示,中國MCU市場占全球25%左右。盡管市場規模龐大,但國內MCU廠商的產品主要集中在中低端市場,同質
    的頭像 發表于 10-22 16:20 ?347次閱讀
    國產MCU廠商,靠什么從內卷<b class='flag-5'>中</b><b class='flag-5'>脫穎而出</b>?

    澎峰科技高性能大模型推理引擎PerfXLM解析

    模型的高性能推理框架,并受到廣泛關注。在歷經數月的迭代開發后,澎峰科技重磅發布升級版本,推出全新的高性能大模型推理引擎:PerfXLM。
    的頭像 發表于 09-29 10:14 ?504次閱讀
    澎峰科技高性能大模型<b class='flag-5'>推理</b><b class='flag-5'>引擎</b>PerfXLM解析

    何在華東電機控制器市場脫穎而出?

    華東電機控制器市場的創新方向,文中參考答案都有了。 前言: 隨著工業自動化和智能化進程的加速推進,電機控制器作為驅動系統的核心部件,在推動產業升級轉型扮演著至關重要的角色。華東電機控制器市場以其
    的頭像 發表于 08-05 10:59 ?224次閱讀
    如<b class='flag-5'>何在</b>華東電機控制器市場<b class='flag-5'>脫穎而出</b>?

    NAS設備鐵威馬F4-424是如何從市場脫穎而出

    簡便又性能卓越的家用NAS,成為了眾多家庭面臨的難題。今天,我們將聚焦于鐵威馬F4-424這款NAS設備,探討它是如何憑借其出色的性能與易用性,在家用NAS市場脫穎而出,成為家庭用戶的理想之選。
    的頭像 發表于 07-18 17:28 ?793次閱讀

    深度學習編譯器和推理引擎的區別

    深度學習編譯器和推理引擎在人工智能領域中都扮演著至關重要的角色,但它們各自的功能、應用場景以及優化目標等方面存在顯著的差異。以下是對兩者區別的詳細探討。
    的頭像 發表于 07-17 18:12 ?1286次閱讀

    運動相機為什么會脫穎而出

    ? 01 運動相機為什么會脫穎而出 與傳統相機或手機拍攝相比,運動相機具備防水和耐沖擊的特性,適合在戶外活動中使用。運動相機通常具有的廣角鏡頭、高分辨率和高幀率的功能,可以拍攝的范圍更廣,畫面也更
    的頭像 發表于 06-27 16:01 ?683次閱讀
    運動相機為什么會<b class='flag-5'>脫穎而出</b>

    新一代驅動器產品,PI SCALE-iFlex? XLT如何脫穎而出

    即插即用!作為新一代驅動器產品,看SCALE-iFlex? XLT如何以其獨特的設計和出色的性能,在市場脫穎而出! 在電力電子領域,高效、緊湊且安全的門極驅動器產品設計一直是研發的焦點。隨著儲能
    的頭像 發表于 05-27 14:55 ?327次閱讀
    新一代驅動器產品,PI SCALE-iFlex? XLT如何<b class='flag-5'>脫穎而出</b>?

    慧視圖像處理板 究竟憑什么脫穎而出

    市面上的圖像處理板有很多,如何通過分析獲得自己滿意的產品,從而減少自身項目的開發時間,是一個重要的過程。如果你有圖像處理板的需要,那么這篇短文你應該往下看一看!經驗豐富成都慧視光電多年來一直致力于圖像處理板的開發應用,有著超十年開發經驗的團隊成員,能夠快速進行軟硬件的模塊化集成,定制出符合行業需求的圖像處理板。曾服務過安防巡檢、鐵路、空港、高校研究院、事業研
    的頭像 發表于 04-30 08:29 ?472次閱讀
    慧視圖像處理板  究竟憑什么<b class='flag-5'>脫穎而出</b>?

    大模型推理顯卡選購指南:4090顯卡為何成為不二之選

    開發者非常關注的話題。 現在市面上加速卡型號多如牛毛,但說到適用大模型推理的顯卡,那4090顯卡絕對是現階段“推理王卡”般的存在。論性能不如H100,論價格不如3090,看似平平無奇的4090顯卡為何能在眾多競爭者
    的頭像 發表于 04-11 11:00 ?793次閱讀
    大模型<b class='flag-5'>推理</b>顯卡選購指南:4090顯卡為何成為不二之選

    解鎖AI時代的利器——訊飛AI鼠標AM30助你在AI時代脫穎

    飛AI鼠標AM30就是你在AI時代的利器,它憑借其出色的功能和特點,助你在激烈的競爭脫穎而出。 訊飛AI鼠標AM30搭載了星火認知大模型AI,為你提供了多種強大的功能。 PPT制作、問答、寫作還是繪畫 ,AI都能幫你輕松搞定。你只需要輸入相關指令,AI就會立即
    的頭像 發表于 03-25 13:37 ?577次閱讀
    解鎖AI時代的利器——訊飛AI鼠標AM30助你在AI時代<b class='flag-5'>脫穎</b>
    主站蜘蛛池模板: 美女好紧好大好爽12p| jlzzjlzz亚洲日本| 永久视频免费| 亚洲精品蜜桃久久久久久| 新版天堂资源在线官网8| 天天色播| 国产网红主播精品福利大秀专区| jlzzjlzzjlzz日本亚洲| h小视频在线观看| 男人j进入女人免费视频| 亚洲综合一| 色播视频在线观看免费| 美女一级免费毛片| 爱射综合| 欧美在线黄色| 国产精品三级a三级三级午夜| 亚洲特级aaaaaa毛片| 日韩中文字幕电影| 精品一区 二区三区免费毛片| 艹逼免费视频| 男女激情做爰叫床声视频偷拍| 一起射综合网| 4338×亚洲全国最大色成网站| 色噜噜噜| 丁香午夜| 久久久网站亚洲第一| 一区二区视频网| 亚洲美女精品| 免费黄色的视频| 欧美一级高清片在线| 激情五月婷婷丁香| 亚洲欧美圣爱天天综合| 国产乱子伦| 欧美日本视频一区| 色婷婷精品| 成人a大片高清在线观看| 九九午夜| xxxxxx性bbbbbb| 欧美色图综合| 一级特黄a免费大片| 国产大片91精品免费观看不卡|