在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

攜程攜手英特爾優(yōu)化AI推理性能,提升性能的同時(shí)降低TCO

英特爾中國(guó) ? 來(lái)源:未知 ? 2023-06-09 20:30 ? 次閱讀

據(jù)文化和旅游部數(shù)據(jù)中心測(cè)算,2023年“五一”假期全國(guó)國(guó)內(nèi)旅游出游合計(jì)2.74億人次,同比增長(zhǎng)70.83%,按可比口徑恢復(fù)至2019年同期的119.09%1。后疫情時(shí)代,旅游人數(shù)的激增與旅游場(chǎng)景的多元化,給人工智能AI)技術(shù)在旅游行業(yè)的應(yīng)用帶來(lái)更多機(jī)遇和挑戰(zhàn)。例如自然語(yǔ)言處理(NLP)、機(jī)器翻譯、計(jì)算機(jī)視覺(jué)、搜索排序等 AI 技術(shù)的快速發(fā)展和日臻成熟,可以為游客提供更便捷的服務(wù)和更精準(zhǔn)的內(nèi)容。

作為一站式旅行平臺(tái),攜程旅行已經(jīng)將諸多AI 技術(shù)應(yīng)用于酒店、機(jī)票、自由行、跟團(tuán)游、簽證、玩樂(lè)、租車(chē)等旅游度假的多個(gè)業(yè)務(wù)線,為全球用戶(hù)提供一套完整的旅行產(chǎn)品、服務(wù)及差異化的旅行內(nèi)容等。為了在滿(mǎn)足業(yè)務(wù)需求的同時(shí)降低成本壓力,攜程構(gòu)建了基于英特爾至強(qiáng) 可擴(kuò)展處理器的 AI 推理算力平臺(tái),并通過(guò)高性能算子庫(kù)、計(jì)算圖優(yōu)化、模型壓縮等方式提升 AI 推理性能。

2cffaa56-06be-11ee-962d-dac502259ad0.png ? ? ? ? ? ?

采用英特爾 至強(qiáng)解決方案

實(shí)現(xiàn)性能與經(jīng)濟(jì)性的更佳平衡

隨著 AI 應(yīng)用的不斷擴(kuò)展和深入,大型旅行服務(wù)平臺(tái)面臨的算力挑戰(zhàn)主要存在于兩個(gè)方面:

一方面,AI 技術(shù)正在日趨多樣化與復(fù)雜化,為了適應(yīng)不同的業(yè)務(wù)場(chǎng)景需求,企業(yè)常常需要融合使用傳統(tǒng)機(jī)器學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、Transformer 等深度學(xué)習(xí)模型結(jié)構(gòu),以及知識(shí)圖譜、圖神經(jīng)網(wǎng)絡(luò)等技術(shù)。同時(shí),AI模型的深度、寬度以及結(jié)構(gòu)復(fù)雜度也在不斷提升,增加了企業(yè)的開(kāi)發(fā)門(mén)檻,也使得 AI算力調(diào)度、AI 性能優(yōu)化更具挑戰(zhàn)。

另一方面,智能化應(yīng)用正在迅速擴(kuò)張,需要由 AI 模型處理的數(shù)據(jù)也在不斷增長(zhǎng)。例如內(nèi)容與廣告?zhèn)€性化推薦、實(shí)時(shí)風(fēng)控、機(jī)器翻譯、智能客服、圖像處理等領(lǐng)域正在越來(lái)越多地使用 AI 技術(shù),以從海量的數(shù)據(jù)中生成高價(jià)值的商業(yè)洞察,從而帶來(lái)了較高的算力基礎(chǔ)設(shè)施建設(shè)成本。與此同時(shí),上層應(yīng)用對(duì)于 AI 模型推理也有著特定的服務(wù)級(jí)別協(xié)議 (SLA) 要求。企業(yè)需要在滿(mǎn)足 SLA 要求的前提下,通過(guò)模型優(yōu)化等方式,更好地發(fā)揮硬件的性能潛力,降低算力基礎(chǔ)設(shè)施的總體擁有成本(TCO)。

面對(duì)上述挑戰(zhàn),企業(yè)首先要面臨硬件平臺(tái)的選擇問(wèn)題:雖然基于獨(dú)立 GPU 的推理方案能夠提供強(qiáng)大的算力,但未必是一個(gè)經(jīng)濟(jì)的選擇。這是因?yàn)楠?dú)立 GPU 不僅采購(gòu)或租用成本相對(duì)較高,而且通常是以專(zhuān)用服務(wù)器的模式進(jìn)行部署和運(yùn)維,帶來(lái)了較高的綜合成本。考慮到旅行服務(wù)中大量的 AI 推理場(chǎng)景所需要的性能經(jīng)過(guò)優(yōu)化能夠得到滿(mǎn)足,采用 CPU 的方案將更具成本效益。因此,攜程采用基于英特爾至強(qiáng) 可擴(kuò)展處理器的 AI 推理算力平臺(tái),旨在為算法模型提供更全面易用、穩(wěn)定性更好、使用和維護(hù)成本更低的優(yōu)化解決方案。 英特爾至強(qiáng) 可擴(kuò)展處理器內(nèi)置人工智能加速功能,已針對(duì)工作負(fù)載進(jìn)行優(yōu)化,能夠?yàn)楦鞣NAI 應(yīng)用以及高密度基礎(chǔ)設(shè)施帶來(lái)一流的性能和內(nèi)存帶寬。同時(shí),采用矢量神經(jīng)網(wǎng)絡(luò)指令(VNNI) 的英特爾 深度學(xué)習(xí)加速(英特爾DL Boost),能夠有效提高 AI 推理的表現(xiàn),使其成為深度學(xué)習(xí)應(yīng)用的卓越基礎(chǔ)設(shè)施。

2cffaa56-06be-11ee-962d-dac502259ad0.png ? ? ? ? ? ?

構(gòu)建并優(yōu)化AI推理算力平臺(tái)

Bert-base推理時(shí)間由15毫秒降至6毫秒

在基于英特爾 至強(qiáng) 可擴(kuò)展處理器的硬件平臺(tái)層基礎(chǔ)上,攜程構(gòu)建了 AI 推理算力平臺(tái),該平臺(tái)還包括引擎框架層、推理優(yōu)化層、算法模型、應(yīng)用場(chǎng)景。同時(shí),為了盡可能地提升 AI 推理性能,釋放硬件潛力,攜程進(jìn)行了推理優(yōu)化。主要的優(yōu)化思路為兩點(diǎn):一是通過(guò)調(diào)整/簡(jiǎn)化模型結(jié)構(gòu),或改進(jìn)算法以降低算法復(fù)雜度;二是優(yōu)化軟件執(zhí)行效率,使用硬件優(yōu)勢(shì)特征,提升硬件執(zhí)行效率。 2d17463e-06be-11ee-962d-dac502259ad0.png

攜程基于英特爾 至強(qiáng) 可擴(kuò)展處理器的硬件平臺(tái)層基礎(chǔ)上

構(gòu)建 AI 推理算力平臺(tái)

攜程以機(jī)器翻譯應(yīng)用的 Transformer模型來(lái)測(cè)試其性能表現(xiàn)。在該測(cè)試中,攜程除了使用上述的優(yōu)化方法,還分割模型并使用 jit 跟蹤方法來(lái)提高性能。同時(shí),在batchsize 超過(guò) 16 個(gè)的情況下,使用 mm op 進(jìn)行優(yōu)化。攜程使用固定算例的平均響應(yīng)時(shí)延作為測(cè)試數(shù)據(jù),tokens 為 10,batchsize=1,Bert-base模型推理時(shí)間由優(yōu)化前的15.05毫秒降至優(yōu)化后的6.44毫秒2 2d238bec-06be-11ee-962d-dac502259ad0.png

Bert-base 模型優(yōu)化前后的性能對(duì)比2

基于英特爾 至強(qiáng) 可擴(kuò)展平臺(tái)的基礎(chǔ)算力和深度的 AI 模型推理性能優(yōu)化,用戶(hù)將獲得的收益包括:在特定的 SLA 要求下,降低 AI 推理應(yīng)用的 TCO

在通過(guò)本輪優(yōu)化之后,攜程的 CPU 服務(wù)器 AI 推理性能得到提升,能夠滿(mǎn)足大量 AI 推理場(chǎng)景對(duì)于時(shí)延等 SLA 指標(biāo)的要求,避免了在昂貴的專(zhuān)用 AI 加速器方面的支出。

提升基礎(chǔ)設(shè)施的敏捷性與靈活性

通過(guò)本輪優(yōu)化,攜程能夠高效利用現(xiàn)有的 CPU 服務(wù)器,根據(jù)實(shí)際負(fù)載需求進(jìn)行靈活調(diào)度,而無(wú)需為 AI 推理新增需求部署專(zhuān)用服務(wù)器。

為 AI 推理性能優(yōu)化提供了標(biāo)準(zhǔn)的參考流程

本方案提供了一套標(biāo)準(zhǔn)、可自動(dòng)完成的參考模型優(yōu)化流程,能夠賦能更多的 AI 應(yīng)用。

攜程與英特爾的合作,驗(yàn)證了 AI 模型推理方案在英特爾 至強(qiáng) 可擴(kuò)展處理器上的應(yīng)用潛力,在成本、性能方面實(shí)現(xiàn)了平衡。同時(shí),隨著推理性能優(yōu)化技術(shù)的逐步提高,將極大地降低人工智能應(yīng)用的部署成本,加快AI應(yīng)用的落地速度并擴(kuò)充應(yīng)用場(chǎng)景,推動(dòng)人工智能行業(yè)的整體發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9985

    瀏覽量

    171970
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10882

    瀏覽量

    212250

原文標(biāo)題:攜程攜手英特爾優(yōu)化AI推理性能,提升性能的同時(shí)降低TCO

文章出處:【微信號(hào):英特爾中國(guó),微信公眾號(hào):英特爾中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾帶您解鎖云上智算新引擎

    在近日舉辦的2024火山引擎FORCE原動(dòng)力大會(huì)上,英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強(qiáng) 6 性能核處理器的第四代服務(wù)器實(shí)例,以打造彈性算力底座的產(chǎn)品化實(shí)踐。同時(shí)
    的頭像 發(fā)表于 12-23 14:05 ?241次閱讀

    Inflection AI攜手英特爾推出企業(yè)級(jí)AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項(xiàng)重大合作——推出基于英特爾Gaudi 3 AI加速器和Tiber
    的頭像 發(fā)表于 10-09 16:40 ?459次閱讀

    英特爾發(fā)布至強(qiáng)6性能核處理器,攜手生態(tài)加速數(shù)據(jù)中心算力升級(jí)

    9月26日,英特爾正式發(fā)布英特爾? 至強(qiáng)? 6性能核處理器(代號(hào)Granite Rapids),為AI、數(shù)據(jù)分析、科學(xué)計(jì)算等計(jì)算密集型業(yè)務(wù)提供卓越
    的頭像 發(fā)表于 09-27 10:54 ?4098次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布至強(qiáng)6<b class='flag-5'>性能</b>核處理器,<b class='flag-5'>攜手</b>生態(tài)加速數(shù)據(jù)中心算力升級(jí)

    開(kāi)箱即用,AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

    。 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國(guó)家標(biāo)準(zhǔn)《人工智能服務(wù)器系統(tǒng)性能測(cè)試規(guī)范》(征求意見(jiàn)稿)相關(guān)要求,使用AISBench?2.0測(cè)試工具,完成了第五代英特爾至強(qiáng)可擴(kuò)展處理器的AI大模型
    的頭像 發(fā)表于 09-06 15:33 ?364次閱讀
    開(kāi)箱即用,AISBench測(cè)試展示<b class='flag-5'>英特爾</b>至強(qiáng)處理器的卓越<b class='flag-5'>推理性能</b>

    英特爾新一代AI PC酷睿Ultra處理器強(qiáng)勢(shì)來(lái)襲

    近日,在臺(tái)北國(guó)際電腦展上,英特爾展示了大力加速AI生態(tài)的前沿技術(shù)和架構(gòu),遍及數(shù)據(jù)中心、云與網(wǎng)絡(luò)邊緣和PC。得益于更高計(jì)算處理性能、出色的能效表現(xiàn)、和更低的總體擁有成本(TCO),用戶(hù)能
    的頭像 發(fā)表于 06-15 11:39 ?879次閱讀

    英特爾發(fā)布AI創(chuàng)作應(yīng)用AI Playground,將于今夏正式上線!

    AI PC入門(mén)應(yīng)用程序AI Playground,讓廣大用戶(hù)在本地即可快速實(shí)現(xiàn)AI個(gè)性化創(chuàng)作。 英特爾Xe2 GPU架構(gòu),帶來(lái)50%的性能
    的頭像 發(fā)表于 06-14 09:44 ?498次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布<b class='flag-5'>AI</b>創(chuàng)作應(yīng)用<b class='flag-5'>AI</b> Playground,將于今夏正式上線!

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?560次閱讀
    <b class='flag-5'>英特爾</b>助力京東云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器采用第五代英特爾至強(qiáng)可擴(kuò)展處理器

    “基于第五代英特爾 至強(qiáng) 可擴(kuò)展處理器的寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器,可以在滿(mǎn)足大量AI推理場(chǎng)景在吞吐量、時(shí)延、容量、并發(fā)能力等方面的需求,而且與專(zhuān)用的GPU服務(wù)器相比,在靈活性方面更具優(yōu)勢(shì)。我們希望能夠與
    的頭像 發(fā)表于 05-27 11:46 ?848次閱讀
    寧暢B5000 G5多節(jié)點(diǎn)服務(wù)器采用第五代<b class='flag-5'>英特爾</b>至強(qiáng)可擴(kuò)展處理器

    英特爾重磅發(fā)布全新AI戰(zhàn)略,攜手生態(tài)共同釋放企業(yè)AAI潛力

    在近期舉行的Intel Vision 2024大會(huì)上,英特爾重磅發(fā)布其開(kāi)放的、可擴(kuò)展的全新AI戰(zhàn)略,同時(shí)公布了英特爾?至強(qiáng)?6處理器的品牌煥新,滿(mǎn)足客戶(hù)對(duì)于處理器能效和
    的頭像 發(fā)表于 04-28 11:11 ?579次閱讀
    <b class='flag-5'>英特爾</b>重磅發(fā)布全新<b class='flag-5'>AI</b>戰(zhàn)略,<b class='flag-5'>攜手</b>生態(tài)共同釋放企業(yè)AAI潛力

    自然語(yǔ)言處理應(yīng)用LLM推理優(yōu)化綜述

    當(dāng)前,業(yè)界在將傳統(tǒng)優(yōu)化技術(shù)引入 LLM 推理同時(shí)同時(shí)也在探索從大模型自回歸解碼特點(diǎn)出發(fā),通過(guò)調(diào)整推理過(guò)程和引入新的模型結(jié)構(gòu)來(lái)進(jìn)一步
    發(fā)表于 04-10 11:48 ?628次閱讀
    自然語(yǔ)言處理應(yīng)用LLM<b class='flag-5'>推理</b><b class='flag-5'>優(yōu)化</b>綜述

    借助英特爾? QAT從而顯著提升網(wǎng)絡(luò)和存儲(chǔ)應(yīng)用的性能

    全新第四代和第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器內(nèi)置英特爾? 數(shù)據(jù)保護(hù)與壓縮加速技術(shù)(英特爾? QAT),可通過(guò)卸載計(jì)算密集型工作負(fù)載來(lái)降低 CPU 占用率,從而顯著
    的頭像 發(fā)表于 03-18 16:25 ?1063次閱讀
    借助<b class='flag-5'>英特爾</b>? QAT從而顯著<b class='flag-5'>提升</b>網(wǎng)絡(luò)和存儲(chǔ)應(yīng)用的<b class='flag-5'>性能</b>

    借助英特爾DLB技術(shù)優(yōu)化網(wǎng)絡(luò)性能

    英特爾? DLB技術(shù)的出現(xiàn),無(wú)疑為數(shù)據(jù)處理和網(wǎng)絡(luò)傳輸領(lǐng)域帶來(lái)了一場(chǎng)革命性的變革。通過(guò)其獨(dú)特的負(fù)載均衡、數(shù)據(jù)包調(diào)度優(yōu)先排序以及降低網(wǎng)絡(luò)流量時(shí)延的能力,英特爾? DLB顯著提升了高數(shù)據(jù)包速
    的頭像 發(fā)表于 03-11 09:52 ?688次閱讀

    英特爾至強(qiáng)處理器優(yōu)化升級(jí),助力打造未來(lái)高能效數(shù)據(jù)中心

    %。與此同時(shí)英特爾還對(duì)該處理器進(jìn)行了大量優(yōu)化,以滿(mǎn)足日益增長(zhǎng)的AI算力需求。 該適用于企業(yè)級(jí)服務(wù)器的英特爾高端CPU受到了眾多行業(yè)專(zhuān)家們的
    的頭像 發(fā)表于 02-26 17:39 ?754次閱讀

    是德科技與英特爾攜手完成負(fù)載均衡單節(jié)點(diǎn)2100萬(wàn)連接新建性能測(cè)試

    2024年1月18日,是德科技(Keysight Technologies,Inc.)與英特爾攜手完成負(fù)載均衡產(chǎn)品單節(jié)點(diǎn)2100萬(wàn)連接新建性能測(cè)試。英特爾提供軟硬件結(jié)合
    的頭像 發(fā)表于 01-18 14:11 ?638次閱讀
    是德科技與<b class='flag-5'>英特爾</b><b class='flag-5'>攜手</b>完成負(fù)載均衡單節(jié)點(diǎn)2100萬(wàn)連接新建<b class='flag-5'>性能</b>測(cè)試

    英特爾AMX助華棲云多場(chǎng)景AI推理性能大幅提升多達(dá)96倍

    AI技術(shù)應(yīng)用已經(jīng)深入到各行各業(yè),特別是云服務(wù)提供商將AI能力集成到云服務(wù)中,能夠更好地滿(mǎn)足用戶(hù)對(duì)性能、效率和體驗(yàn)的需求。
    的頭像 發(fā)表于 01-13 10:46 ?1031次閱讀
    <b class='flag-5'>英特爾</b>AMX助華棲云多場(chǎng)景<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>大幅<b class='flag-5'>提升</b>多達(dá)96倍
    主站蜘蛛池模板: 亚洲精品网站日本xxxxxxx| 一级一级18女人毛片| 国产免费一区二区三区在线| 婷婷五月在线视频| 男女视频免费| 欧美 激情 在线| 91大神视频在线播放| 5278欧美一区| 好爽好大www视频在线播放 | 老司机深夜影院入口aaaa| 色婷婷色丁香| 欧洲无线区一二区| 色97色| 污女网站| 色吧视频| 久久六月丁香婷婷婷| 国产gaysexchina男同men1068| 欲色影院| 久久久久久久久久免免费精品| 丁香色婷婷| 天天视频官网天天视频在线| 小屁孩cao大人免费网站| 色综合色综合色综合网址| 成人午夜久久| 亚洲啪啪| 美女露出尿口让男人桶爽网站| 香港三级理论在线观看网站| 亚洲人免费视频| 亚洲色图 欧美| 色婷婷中文字幕| 青草青视频在线观看| 韩国视频在线播放| 午夜视频在线观看一区二区| 天天干天天拍天天操| 天堂8资源在线官网资源 | 深爱开心激情| 韩国三级中文字幕hd| 天天干影视| 4438x成人全国最大| 婷婷色在线观看| 国内精品视频免费观看|