在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA TensorRT 8.2將推理速度提高6倍

星星科技指導員 ? 來源:NVIDIA ? 作者:About Jay Rodge ? 2022-03-31 17:10 ? 次閱讀

NVIDIA 發布了 TensorRT 8.2 ,對十億參數 NLU 模型進行了優化。其中包括 T5 和 GPT-2 ,用于翻譯和文本生成,使實時運行 NLU 應用程序成為可能。

TensorRT 是一款高性能的深度學習推理優化器和運行時,為人工智能應用程序提供低延遲、高吞吐量推理。 TensorRT 用于醫療、汽車、制造、互聯網/電信服務、金融服務和能源等多個行業。

PyTorch 和 TensorFlow 是擁有數百萬用戶的最流行的深度學習框架。新的 TensorRT 框架集成現在在 PyTorch 和 TensorFlow 中提供了一個簡單的 API ,并提供了強大的 FP16 和 INT8 優化,從而將推理速度提高了 6 倍。

亮點包括

TensorRT 8.2:T5 和 GPT-2 的優化運行實時翻譯和摘要,與 CPU 相比,性能提高了 21 倍。

TensorRT 8.2 :適用于使用 Windows 的開發人員的簡單 Python API 。

Torch TensorRT:PyTorch 的集成與 GPU 上的框架內推理相比,僅需一行代碼即可提供高達 6 倍的性能。

TensorFlow TensorRT:TensorFlow 與 TensorRT 的集成提供了比使用一行代碼在 GPU 上進行框架內推理快 6 倍的性能。

資源

Torch- TensorRT 在 NGC catalog 的 PyTorch 容器中提供。

TensorFlow- TensorRT 目前可從 NGC catalog 的 TensorFlow 容器中獲得。

TensorRT 免費提供給 NVIDIA 開發程序 的成員。

在 TensorRT 產品頁面了解更多信息

關于作者

About Jay Rodge

Jay Rodge 是 NVIDIA 的產品營銷經理,負責深入學習和推理產品,推動產品發布和產品營銷計劃。杰伊在芝加哥伊利諾伊理工學院獲得計算機科學碩士學位,主攻計算機視覺和自然語言處理。在 NVIDIA 之前,杰伊是寶馬集團的人工智能研究實習生,為寶馬最大的制造廠使用計算機視覺解決問題。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4986

    瀏覽量

    103058
  • 互聯網
    +關注

    關注

    54

    文章

    11155

    瀏覽量

    103309
  • 深度學習
    +關注

    關注

    73

    文章

    5503

    瀏覽量

    121162
收藏 人收藏

    評論

    相關推薦

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術,該技術現在可與 NVIDIA TensorRT-LLM 一起使用。
    的頭像 發表于 12-25 17:31 ?118次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個專為優化大語言模型 (LLM) 推理而設計的庫。它提供了多種先進的優化技術,包括自定義 Attention Kernel、Inflight
    的頭像 發表于 12-17 17:47 ?159次閱讀

    NVIDIA TensorRT-LLM Roadmap現已在GitHub上公開發布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現已在 GitHub 上公開發布!
    的頭像 發表于 11-28 10:43 ?272次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM Roadmap現已在GitHub上公開發布

    TensorRT-LLM低精度推理優化

    本文分享 TensorRT-LLM 中低精度量化內容,并從精度和速度角度對比 FP8 與 INT8。首先介紹性能,包括速度和精度。其次,介紹量化工具
    的頭像 發表于 11-19 14:29 ?300次閱讀
    <b class='flag-5'>TensorRT</b>-LLM低精度<b class='flag-5'>推理</b>優化

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響力的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應用部署,
    的頭像 發表于 08-23 15:48 ?455次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業的生成式 AI
    的頭像 發表于 07-25 09:48 ?709次閱讀

    MediaTek與NVIDIA TAO加速物聯網邊緣AI應用發展

    在即將到來的COMPUTEX 2024科技盛會上,全球知名的芯片制造商MediaTek宣布了一項重要合作——NVIDIA的TAO(TensorRT Accelerated Optimizer)與其NeuroPilot SDK(
    的頭像 發表于 06-12 14:49 ?476次閱讀

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    大型語言模型(LLM)和專家混合(MoE)模型的推理過程。 第二代Transformer引擎采用8位浮點(FP8)和新的精度等技術,大型語言模型如GPT-MoE-1.8T的訓練速度提高
    發表于 05-13 17:16

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優化從 PC 到云端的
    的頭像 發表于 04-28 10:36 ?567次閱讀

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新開源大語言模型采用 NVIDIA 技術構建,其經過優化后可在云、數據中心、邊緣和 PC 的 NVIDIA GPU 上運行。
    的頭像 發表于 04-23 09:52 ?462次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRTNVIDIA Merlin HierarchicalKV(HKV)
    的頭像 發表于 04-20 09:39 ?727次閱讀

    NVIDIA cuOpt算法路徑優化求解速度提高100

    NVIDIA cuOpt 是一個用于解決復雜路徑問題的加速優化引擎。它能高效解決不同方面的問題,如休息時間、等待時間、多個車輛成本和時間矩陣、多個目標、訂單-車輛匹配、車輛起始和結束位置、車輛起始和結束時間等。
    的頭像 發表于 04-19 10:09 ?444次閱讀
    <b class='flag-5'>NVIDIA</b> cuOpt算法<b class='flag-5'>將</b>路徑優化求解<b class='flag-5'>速度</b><b class='flag-5'>提高</b>100<b class='flag-5'>倍</b>

    使用NVIDIA Triton推理服務器來加速AI預測

    這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。
    的頭像 發表于 02-29 14:04 ?585次閱讀

    利用NVIDIA產品技術組合提升用戶體驗

    本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型,并借助NVIDIA Triton推理服務器在NVIDIA V1
    的頭像 發表于 01-17 09:30 ?693次閱讀

    Torch TensorRT是一個優化PyTorch模型推理性能的工具

    那么,什么是Torch TensorRT呢?Torch是我們大家聚在一起的原因,它是一個端到端的機器學習框架。而TensorRT則是NVIDIA的高性能深度學習推理軟件工具包。Torc
    的頭像 發表于 01-09 16:41 ?1742次閱讀
    Torch <b class='flag-5'>TensorRT</b>是一個優化PyTorch模型<b class='flag-5'>推理</b>性能的工具
    主站蜘蛛池模板: 色av.com| 激情免费视频| 国产亚洲精品自在久久77| 午夜在线观看视频| 日本人的xxxxxxxxx69| 亚洲特级aaaaaa毛片| 美女视频黄免费| 午夜视频网| 91夫妻视频| 手机在线观看a| 丁香婷婷视频| 成年美女黄网站色大免费视频| 一本到在线观看视频不卡| 99精品视频在线播放2| 亚洲国产成人在线| 国产三级在线免费| yezhulu在线永久网址yellow| 伊人蕉久| 国产女人在线观看| 国产爱搞| 一区二区中文字幕在线观看| 桃色婷婷| 在线日本人观看成本人视频| 日本xxxxbbbb| 国产精品第一页在线观看| 五月婷婷综合激情| 成年人色网站| www.xxx欧美| 日本高清色www| 人人揉人人爽五月天视频| 黄网站视频观看免费| 国产三片理论电影在线| 2019天天操| 任你操免费视频| 欧美天天| 亚洲国内精品久久| 有没有免费的视频在线观看| 日本亚洲视频| 国产精品www视频免费看| xxxx 欧美| 久久国产精品久久久久久久久久|