在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

提高AI算力,異構優化也是關鍵

英特爾中國 ? 來源:英特爾中國 ? 2023-03-12 09:16 ? 次閱讀

近期,勁爆亮相的ChatGPT著實讓人們眼前一亮,讓普羅大眾也“親密”體驗了人工智能AI)的神奇魔力,窺見了智能未來的璀璨前景之一斑。

然而,就在這離生活愈來愈近的AI讓人們對未來充滿無限憧憬、滿懷激動的同時,也有冷靜的分析指出,諸如ChatGPT等AI規模應用也是一個“吞金獸”,其帶來的不僅僅是讓人急呼“AI算力告急”的算力消耗(有研究顯示,中國智能算力需求規模,到2026年就將進入每秒十萬億億次浮點計算(ZFLOPS)級別,達到1,271.4EFLOPS,從2021到2026年,年復合增長率將達52.3%1);更有從云端、邊緣到終端廣泛AI應用場景,使得IT運營環境日益復雜和多樣,讓各種AI方案在異構平臺獲得便捷、易用且有效優化成為急迫的需求。

異構計算,主要指不同類型的指令集和體系架構的計算單元組成的系統的計算方式,在云數據中心、邊緣計算場景等有著廣泛應用。

異構計算的興起與工作負載密切相關,在能有效發揮異構計算優勢的應用場景中,人工智能場景可謂是典型的代表場景之一,不管是深度學習訓練,還是深度學習推理,都會進行大量矩陣運算,需要異構計算提供更有力支撐;而隨著AI應用快速走向邊緣,由此引致的云邊端協同,對異構計算提出了更高要求。計算平臺在提升自身算力水平的同時,也需要通過提供優化策略,幫助用戶更好地提升AI方案的性能,助力AI應用降本增效。

騰訊云創新打造TACO Kit套件,為AI應用提供異構加速

為幫助廣大用戶應對日益復雜的異構環境給AI應用帶來的挑戰,騰訊云創新推出計算加速套件TACO Kit (TencentCloud Accelerated Computing Optimization Kit),通過在異構硬件平臺上提供全棧式的軟硬件解決方案的模式,為AI方案設計者、AI開發人員以及AI使用者構建全新的異構計算加速軟件服務,助其借助多元化異構、高性能加速框架、離線虛擬化技術以及靈活的商業模式,輕松駕馭多元算力,助力AI應用全方位、全場景降本增效。

而作為異構加速服務的入口,TACO Kit內置AI推理加速引擎TACO Infer,能針對AI應用中不同的訓練和服務框架、個性的優化實踐和使用習慣、各異的軟件版本和硬件偏好,以計算加速、無感接入和魯棒易用的特性和優勢,幫助用戶一站式解決AI模型在生產環境中部署與應用的痛點。

94f5a4c2-c072-11ed-bfe3-dac502259ad0.png

圖一 AI推理加速引擎TACO Infer

TACO Infer引擎具備的功能特性包括:

■無感集成:可跨平臺透明適配CPUGPU、NPU等異構芯片;尊重用戶使用習慣,無需改變模型源格式;無需進行IR(Intermediate Representation,中間表示)轉換,對無顯式算子結構模型友好;

■基于原生框架Runtime:可基于多種流行原生框架,包括TensorFlow、PyTorch、ONNXRuntime 等運行;可基于框架原Runtime構建,并可充分利用框架自定義的擴展機制;

■無縫對接服務框架:包括TF Serving、Triton以及TorchServe等。

基于以上特性,無論在何種場景中,用戶在硬件平臺上部署AI應用,都只需要進行簡單地前端交互,就能讓TACO Kit在后臺以最佳模式啟動工作負載,并獲得更優的推理性能。

而這一優異推理性能的獲得,離不開英特爾和騰訊云面向TACO Kit開展的深度協作加持。具體講,就是將英特爾 Neural Compressor集成到TACO Kit之中,來大幅提升AI推理性能,加速各類AI應用便捷高效落地。

英特爾 Neural Compressor提供優化支持,助力TACO Kit加速推理

英特爾 Neural Compressor是英特爾開源的神經網絡模型壓縮庫,不僅面向如量化、修剪以及知識提取等主流模型壓縮技術,提供了跨多個深度學習框架的統一接口,還具有以下模型性能調優特性:

■具備由精度驅動的自動化調整策略,幫助用戶快速獲得最佳量化模型;

■可使用預定義的稀疏性目標生成修剪模型,實現不同的權重修剪算法

■能夠從更大的網絡(“教師”)中提取知識用于訓練更小的網絡(“學生”),實現更小的精度損失。

英特爾和騰訊云協作,通過插件的方式將英特爾 Neural Compressor集成到TACO Kit,讓TACO Kit充分利用英特爾 Neural Compressor的優勢特性。如圖二所示,利用量化壓縮技術來為不同的深度深度框架(如TensorFlow、PyTorch、ONNXRuntime等)提供統一的模型優化 API,便捷實現模型推理優化(由FP32數據類型量化為INT8數據類型)。同時,也可以利用壓縮庫內置的精度調優策略,根據不同的模型內部結構生成精度更佳的量化模型,幫助用戶大幅降低模型量化的技術門檻,并有效提升AI模型的推理效率。

9533478c-c072-11ed-bfe3-dac502259ad0.png

圖二 集成英特爾 Neural Compressor后的TACO Kit工作流程

在云端部署時,量化后的模型可通過英特爾 至強 可擴展平臺內置的英特爾 DL Boost,來獲得有效的硬件加速和更高的推理效率。以指令集中的vpdpbusd指令為例,以往需要3條指令(vpmaddubsw、vpmaddwd、vpaddd)完成的64次乘加過程,現在僅需1條指令(vpdpbusd)即可,并能夠消除運行過程中的處理器飽和問題,再輔之以乘加過程中的中間數值直接從內存播送,可使得處理性能達初始FP32模型的4倍2。這無疑為TACO Kit加速推理,進而幫助用戶在異構環境更高效地構建和部署AI提供了關鍵助力。

9552c080-c072-11ed-bfe3-dac502259ad0.png

圖三 英特爾 DL Boost(AVX-512_VNNI)技術

方案驗證顯真實性能,展異構AI加速優勢

那么,集成英特爾 Neural Compressor后的TACO Kit的性能究竟有何等驚艷提升呢?實踐最有發言權,數據最有說服力。套件打造完成后,英特爾與騰訊云一起選取了多種被廣泛應用的自然語言處理深度學習模型,對TACO Kit性能加速進行了驗證測試。

測試中,各個深度學習模型在通過TACO Kit進行優化后,使用英特爾 Neural Compressor進行INT8量化及性能調優,推理性能加速結果令人滿意。如圖四所示3,在保持精度水平基本不變的情況下,各深度學習模型的推理性能均獲得顯著提升,提升幅度從55%到139%不等,在其中的bert-base-uncased-mrpc場景中,推理性能更是達到了基準值的2.39倍。

957e82ba-c072-11ed-bfe3-dac502259ad0.png

圖四 集成英特爾 Neural Compressor的TACO Kit所帶來的推理性能加速4

對TACO Kit引入英特爾 Neural Compressor獲得的大幅性能加速,騰訊云異構計算專家級工程師葉帆直言,這一合作成果能幫助不同角色的用戶在異構硬件平臺上獲得便捷、易用且經過有效優化的 AI 加速能力,助力AI 應用實現全方位、全場景的降本增效。而英特爾 Neural Compressor 是 TACO Kit 中 AI 推理負載獲得充分性能加速的有效技術保證。

基于這一成果,英特爾和騰訊云也將面向未來繼續深化合作,通過融合硬件廠商優化算子、自研AI編譯技術升級等措施,驅動TACO Infer在軟硬件兼容性和性能上不斷迭代優化。同時,雙方還計劃進一步將第四代英特爾 至強 可擴展平臺及其內置的深度學習加速技術與騰訊計算加速套件TACO Kit相融合,借助新平臺更為澎湃的算力輸出與深度學習加速新技術,為用戶提供更加高效可用的異構AI加速能力,進而在推動AI走向更廣泛應用的同時,助力應對多模態大模型等對算力提出的更嚴峻挑戰,驅動智能應用向縱深化演進,為經濟社會的高質量發展提供強勁數字生產力。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10002

    瀏覽量

    172098
  • AI
    AI
    +關注

    關注

    87

    文章

    31364

    瀏覽量

    269765
  • 人工智能
    +關注

    關注

    1793

    文章

    47567

    瀏覽量

    239417

原文標題:提高AI算力,異構優化也是關鍵

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中心的如何衡量?

    作為當下科技發展的重要基礎設施,其的衡量關乎其能否高效支撐人工智能、大數據分析等智能應用的運行。以下是對智中心算衡量的詳細闡述:一、
    的頭像 發表于 01-16 14:03 ?261次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    北電數智前進·AI異構計算平臺,繪制國產商業化落地新藍圖

    在當今的數字經濟時代,人工智能已然成為推動科技進步與社會發展的核心動力。作為助推AI浪潮與數字經濟發展的基礎設施,AI芯片和相關產業成為撬動全球智能化、數字化發展的
    的頭像 發表于 12-24 11:54 ?404次閱讀

    企業AI租賃模式的好處

    構建和維護一個高效、可擴展的AI基礎設施,不僅需要巨額的初期投資,還涉及復雜的運維管理和持續的技術升級。而AI
    的頭像 發表于 12-24 10:49 ?165次閱讀

    企業AI租賃是什么

    企業AI租賃是指企業通過互聯網向專業的提供商租用所需的計算資源,以滿足其AI應用的需求。
    的頭像 發表于 11-14 09:30 ?931次閱讀

    AI時代的重要性及現狀:平衡發展與優化配置的挑戰

    AI時代,扮演著至關重要的角色。如果說數據是AI大模型的“燃料”,那么則是其強大的“動
    的頭像 發表于 11-04 11:45 ?516次閱讀

    再躍升!億萬克發布新一代AI服務器——G882N7+!

    異構,指的是利用不同類型的處理器,比如CPU、GPU、FPGA等進行并行計算,來適應不同任務的計算需求,提高計算效率和性能。 ? 隨著人工智能技術熱潮的不斷發展,大模型迅猛發展呈現出新質生產
    的頭像 發表于 10-25 17:02 ?230次閱讀

    芯片 高性能 CPU/GPU/NPU 微架構分析》第1-4章閱讀心得——之巔:從基準測試到CPU微架構的深度探索

    ,還優化了能效比,使天河二號在Green500榜單上也表現出色。另一方面,MLPerf的出現標志著AI時代對需求的變化。它涵蓋了圖像分類、目標檢測、自然語言理解、智能推薦算法、強化
    發表于 10-19 01:21

    聯想亮相2024中國大會

    日前,2024中國大會在河南鄭州拉開帷幕。作為全球領先的基礎設施和服務提供商,聯想集團參會參展并攜手異構
    的頭像 發表于 10-14 11:43 ?568次閱讀

    青云科技強化AI架構,升級產品與服務體系

    10月9日,青云科技正式揭曉了其升級版的產品與服務陣容、行業及場景定制化解決方案,以及全新的生態戰略。該公司旨在通過AI平臺、AI
    的頭像 發表于 10-10 16:42 ?518次閱讀

    中國智能汽車騰飛,為什么異構是第一生產

    智能時代的“世紀之車”,異構是第一驅動力
    的頭像 發表于 09-14 10:32 ?3773次閱讀
    中國智能汽車騰飛,為什么<b class='flag-5'>異構</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是第一生產<b class='flag-5'>力</b>?

    大模型時代的需求

    現在AI已進入大模型時代,各企業都爭相部署大模型,但如何保證大模型的,以及相關的穩定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發表于 08-20 09:04

    安謀科技異構組合,破局生成式AI挑戰

    近日,此芯科技集團有限公司(以下簡稱“此芯科技”)AI PC戰略暨首款芯片發布會在上海舉行,正式推出了其首款專為AI PC打造的異構高能效芯片產品——“此芯P1”。作為國產新一代AI
    的頭像 發表于 08-13 09:12 ?604次閱讀

    安謀科技異構賦能AI計算,此芯科技首款AI PC芯片發布

    7月30日,此芯科技集團有限公司(以下簡稱“此芯科技”)AI PC戰略暨首款芯片發布會在上海舉行,正式推出了其首款專為AI PC打造的異構高能效芯片產品——“此芯P1”。作為國產新一代AI
    發表于 07-31 14:36 ?1073次閱讀
    安謀科技<b class='flag-5'>異構</b><b class='flag-5'>算</b><b class='flag-5'>力</b>賦能<b class='flag-5'>AI</b>計算,此芯科技首款<b class='flag-5'>AI</b> PC芯片發布

    神州鯤泰亮相北京數字安全大會,以智能構筑數據安全的堅實底座

    GPU資源虛擬化或池化,完成跨集群之間的調度;打造異構加速平臺HICA,屏蔽集群內底層
    的頭像 發表于 07-18 16:06 ?463次閱讀
    神州鯤泰亮相北京數字安全大會,以智能<b class='flag-5'>算</b><b class='flag-5'>力</b>構筑數據安全的堅實底座

    異構混訓整合不同架構芯片資源,提高利用率

    的解決方案。通過混合使用多種異構芯片,可以充分利用不同芯片的優勢,提高利用率,降低成本,
    的頭像 發表于 07-18 00:11 ?3555次閱讀
    主站蜘蛛池模板: 日韩乱轮| 免费视频久久看| 国产婷婷| 在线天堂bt中文www在线| 在线 你懂| 天堂资源在线中文| 日本黄色一级网站| 免费一级大毛片a一观看不卡| 激情六月网| 99久久无色码中文字幕| 五月婷婷天| 国产午夜不卡在线观看视频666| 亚洲欧美4444kkkk| 欧美视频免费一区二区三区| 久久黄色视屏| 精品视频卡1卡2卡3| 爱爱永久免费视频网站| 天天爽夜夜爽免费看| 国产成人亚洲影视在线| 亚洲一区在线观看视频| 亚洲美女高清一区二区三区| 日韩黄a级成人毛片| 好硬好大好爽女房东在线观看| 亚洲午夜精品久久久久久人妖| 女人成午夜大片7777在线| 在线免费看| 日本高清免费一本视频在线观看| 高清一级| 国产性老妇女做爰在线| 色多多拼多多网站| 黄色网址你懂的| 天天插插插| 欧美精品区| 在线色网站| 欧美1区| 4hu影院在线观看| 国产又爽又黄又粗又大| 欧美美女福利视频| 日日噜噜噜夜夜爽爽狠狠| 成人免费淫片95视频观看网站| 免费a级午夜绝情美女视频|