在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

借助Arm Neoverse加速Hugging Face模型

Arm社區 ? 來源:Arm社區 ? 2024-09-02 10:44 ? 次閱讀

作者:Arm 基礎設施事業部高級產品經理 Ashok Bhat

人工智能 (AI) 有望觸及并改變我們生活的方方面面。如今,包括醫療保健、金融、制造、教育、媒體和運輸等在內的各行各業都在利用 AI 進行創新。它們通過運行復雜的 AI 工作負載來提高生產力,改善消費者決策,提升教育體驗等,而這些都需要消耗大量算力和數據中心電力。

如今,數據中心已經非常耗電,而隨著 AI 部署的擴大和底層基礎模型規模的擴展,耗電量只會繼續增加。面對這一挑戰,Arm 力求在不增加能耗的情況下提高 AI 能力。隨著生成式 AI 和基礎模型的普及,專用計算硬件的可用性及其高成本給部署帶來了困難。與此同時,大模型需要消耗大量資源,加劇了原有的問題。隨著小語言模型和量化等技術的興起,開發者開始考慮針對機器學習 (ML) 使用 CPU。規模較小的模型不僅效率高,而且可以針對特定應用進行定制,因此部署起來更切合實際,成本效益也更高。

Arm 基于 Neoverse 的最新 CPU 平臺為云數據中心提供高性能、高能效的處理器。借助 Arm Neoverse,云服務提供商能夠靈活地定制芯片并優化軟件與系統,以應對要求苛刻的工作負載,同時獲得出色的性能和能效。正因如此,所有主要的云服務提供商均采用了 Neoverse 技術來設計其計算平臺,從而滿足開發者對 AI 和 ML 等各種云工作負載的需求。

Hugging Face 中的熱門開源模型可在 CPU 上高效、高性能地運行。模型的部署是一項耗時且極具挑戰性的任務,通常需要精通 ML 和底層模型代碼的專業知識。Hugging Face Pipeline 將復雜的代碼抽象化,使開發者能夠使用 Hugging Face Hub 中的任何模型進行推理。開發者在構建 AI 應用和項目時,借助 Arm 平臺賦能的云實例,可受益于云基礎設施資源的便利性,實現高能效并節省成本。

面向 ML 的 Neoverse CPU 的關鍵特性

長期以來,CPU 得益于只需使用單指令就能同時處理多個數據點,進而能夠實現數據級并行和性能提升,這種技術被稱為單指令流多數據流 (SIMD)。Arm Neoverse CPU 支持 Neon 和可伸縮矢量擴展 (SVE) 等先進的 SIMD 技術,能夠加速 HPC 和 ML 中的常見算法

通用矩陣乘法 (GEMM) 是 ML 中的一種基本算法,它對兩個輸入矩陣進行復雜的乘法運算,得到一個輸出。Armv8.6-A 架構新增了 SMMLA 和 FMMLA 指令,可在寬度為二或四的陣列上同時執行這些乘法運算,從而將取指周期縮短 2 至 4 倍,將計算周期縮短 4 至 16 倍。諸多基于 Arm 架構的服務器處理器均含有這些指令,包括 AWS Graviton3、Graviton4、NVIDIA Grace、Google Axion 和 Microsoft Cobalt。

在許多用例中,這些關鍵特性可為 ML 帶來諸多優勢,其中包括:

圖像分類:這是監督學習的一種形式,可將特定標簽或類別分配給整個圖像。

對象檢測:這是在圖像或視頻中定位對象實例的計算機視覺技術。

自然語言處理:這是一種 AI 形式,可賦予機器閱讀、理解和推導人類語言含義的能力。

自動語音識別:這是一種 ML 形式,可將人們的語音內容轉換為文本。

推薦系統:這是利用數據向用戶推薦項目或內容的 ML 算法。

小語言模型 (SLM):這是大語言模型 (LLM) 的精簡版,其架構更簡單、參數更少,訓練所需的數據和時間也更少。

憑借這些 ML 推理能力,基于 Arm Neoverse 平臺的 AWS Graviton3 處理器在性能方面比上一代 AWS Graviton2 處理器提高了三倍。下面來看一個情感分析用例。

利用 Hugging Face Pipeline 進行情感分析

情感分析是一項重要的 AI 技術,它能找出文本中的情緒和觀點。企業可以利用該技術來理解客戶的想法,評估用戶對品牌的看法,并制定營銷決策。但是,要想高效運行情感分析模型,對計算資源的要求非常高。本文將深入探討 Arm Neoverse CPU 如何加快情感分析,帶來更快且更有成效的 AI 驅動的洞察。

具體來說,我們將著重于如何在 Arm Neoverse CPU 上使用 pytorch.org 提供的默認 PyTorch 軟件包來加速 NLP PyTorch 模型(BERT、DistilBERT 和 RoBERTa)。我們將使用 Hugging Face Transformer 情感分析 Pipeline 來運行這些模型

Hugging Face Transformer 通過 Pipeline 這一強大工具來簡化預訓練模型的使用。這些 Pipeline 可在后臺處理復雜問題,讓開發者能夠專注于解決實際問題。例如,如果你想要分析一段文本的情感,只需將該文本輸入 Pipeline。它將進行正面或負面的情感分類,你無需擔心模型的加載、分詞等其他技術細節。

這段代碼使用 Pipeline 來檢查用戶所輸入文本的情感。它在后臺使用 Hugging Face Model Hub 中的現成模型。

代碼

wKgaombVJraAfHYlAAA6i2yywfs469.jpg

輸出

wKgZombVJtSAEwRWAAAgUP4IDvw231.jpg

你還可以使用模型參數來指定所選模型。

pipe = pipeline("sentiment-analysis", model=”distilbert-base-uncased”)

在現有應用中添加情感分析時,需要考慮延遲問題。對于實時用例而言,響應時間少于 100ms 通常被視為瞬時響應。但對于具體需求而言,更長的延遲有時也可接受。

AWS Graviton 處理器的性能

我們選取了兩篇評論,一篇較短(使用 BertTokenizer 分詞后,有 32 個詞元),另一篇較長(使用 BertTokenizer 分詞后,有 128 個詞元),并在 AWS Graviton2 (c6g) 和 AWS Graviton3 (c7g) 上進行了基準測試。

如下圖所示,對于短篇評論的情感分析,AWS Graviton2 (c6g) 和 AWS Graviton3 (c7g) 僅使用四個虛擬 CPU (vCPU) 就達到了理想的 100ms 實時延遲目標。

wKgaombVJuiAQipVAACUvTQAND0975.jpg

對于較長評論的情感分析,啟用了 BF16 的 AWS Graviton3 (c7g) 可使用四個 vCPU 達到理想的實時延遲目標。與使用 Arm Neoverse N1 CPU 的上一代 c6g 實例相比,基于 Neoverse V1 的 c7g 實例性能可提升三倍之多。

wKgZombVJvGAXyX0AACsWc1E-yo216.jpg

基準測試設置

我們對以下 AWS EC2 實例進行了基準測試:

使用 Arm Neoverse N1 CPU 的 c6g.xlarge 實例

使用 Arm Neoverse V1 CPU 的 c7g.xlarge 實例

各實例均有四個 vCPU。我們通過以下軟件對實例進行設置:

Ubuntu Server 22.04 LTS (HVM) - ami-0c1c30571d2dae5c9(64 位 (x86))和 ami-0c5789c17ae99a2fa(64 位 (Arm))

PyTorch 2.2.2

Transformers 4.39.1

并按照以下設置步驟操作:

1.sudo apt-get update

2.sudo apt-get install python3 python3-pip

3.pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu

4.pip3 install transformers

有關安裝過程的詳細信息,請參閱《Arm PyTorch 安裝指南》。除了該指南外,《在 AWS Graviton 處理器上實現 PyTorch 推理性能調優》中也提供了一些針對 Arm 平臺的調優參數。(鏈接見文末)

為了進行基準測試,我們在所有平臺上啟用了 BF16 快速數學內核,如下所示。在 AWS Graviton3 上,這使得 GEMM 內核能夠使用硬件中提供的 BF16 MMLA 指令。

export DNNL_DEFAULT_FPMATH_MODE=BF16

我們使用了兩篇評論,分別是一篇短評論和一篇長評論。

短評論原文:“I'm extremely satisfied with my new Ikea Kallax; It's an excellent storage solution for our kids. A definite must have.”

長評論原文:“We were in search of a storage solution for our kids, and their desire to personalize their storage units led us to explore various options. After careful consideration, we decided on the Ikea Kallax system. It has proven to be an ideal choice for our needs. The flexibility of the Kallax design allows for extensive customization. Whether it’s choosing vibrant colors, adding inserts for specific items, or selecting different finishes, the possibilities are endless. We appreciate that it caters to our kids’ preferences and encourages their creativity. Overall, the boys are thrilled with the outcome. A great value for money.”

我們使用情感分析 Pipeline 對三個 NLP 模型(distilbert-base-uncased、bert-base-uncased 和 roberta-base)進行了評估

對于每個模型,我們均測量短句和長句的執行時間。在基準測試函數中,我們進行了運行 Pipeline 100 次的熱身,以確保結果的一致性。接著,我們測量每次運行的執行時間,并計算平均值和第 99 百分位值。

結 論

通過 AWS Graviton3,你只需使用四個 vCPU,就能將情感分析添加到現有應用中,并可滿足嚴格的實時延遲要求。

AWS Graviton3 搭載的 Arm Neoverse V1 CPU 具有 BF16 MMLA 擴展等 ML 特定功能,為 Hugging Face 情感分析 PyTorch 模型提供了出色的推理性能。

歡迎各位開發者使用自己的模型進行嘗試。友情提示,根據模型的不同,你可能需要對性能進行微調。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9121

    瀏覽量

    368233
  • AI
    AI
    +關注

    關注

    87

    文章

    31262

    瀏覽量

    269626
  • 人工智能
    +關注

    關注

    1792

    文章

    47497

    瀏覽量

    239210
  • 模型
    +關注

    關注

    1

    文章

    3279

    瀏覽量

    48970

原文標題:利用 Arm Neoverse 加速熱門 Hugging Face 模型

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Arm Neoverse V1的AWS Graviton3在深度學習推理工作負載方面的作用

    :區域任務模型想象圖像分類Resnet50-v1.5語自然語言處理BERT-大平臺我們在三種 AWS EC2 云實例類型上運行,涵蓋兩代 Arm Neoverse 內核(Arm
    發表于 08-31 15:03

    Arm Neoverse V1 PMU指南

    事件之一時計數發生。 2.1范圍 本文檔提供了Neoverse V1 PMU事件的高級描述。有參考資料體系結構行為和Neoverse V1微觀體系結構行為事件描述。有關Arm架構的更完整描述,請參閱
    發表于 08-09 07:30

    Arm Neoverse? N1 PMU指南

    本文檔提供了Neoverse N1 PMU事件的高級描述。 對體系結構行為和Neoverse N1微體系結構行為的引用闡明了這些事件描述。 有關ARM架構的更完整描述,請參閱ARM?架
    發表于 08-12 07:10

    Hugging?Face獲投1500萬美元?這個虛擬陪聊朋友會察言觀色

    ,Richard Socher,Greg Brockman,Kevin Durant 跟投。 「Hugging Face」是一個在青少年群體中頗受歡迎的聊天機器人應用。用戶可以使用該應用程序生成一個虛擬朋友
    的頭像 發表于 12-18 17:55 ?2.8w次閱讀

    Hugging Face更改文本推理軟件許可證,不再“開源”

    據悉,TGI 已成為 Hugging Face 商業產品(如推理端點)及其商業合作伙伴(如 Amazon SageMaker、Azure 機器學習和 IBM watsonx )的重要組成部分。而 Hugging
    的頭像 發表于 07-31 14:42 ?687次閱讀

    NASA 攜手 IBM 發布 Hugging Face 平臺最大開源地理空間 AI 基礎模型

    近日,IBM (NYSE: IBM) 與開源 AI 平臺 Hugging Face 共同宣布,基于美國宇航局 ( NASA) 衛星數據構建的 IBM watsonx.ai 地理空間基礎模型,現已
    的頭像 發表于 08-08 18:15 ?668次閱讀
    NASA 攜手 IBM 發布 <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 平臺最大開源地理空間 AI 基礎<b class='flag-5'>模型</b>

    NVIDIA 與 Hugging Face 將連接數百萬開發者與生成式 AI 超級計算

    NVIDIA DGX Cloud 集成到 Hugging Face 平臺將加速大語言模型(LLM)的訓練和調優,簡化了幾乎每個行業的模型定制
    發表于 08-09 11:41 ?221次閱讀
    NVIDIA 與 <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 將連接數百萬開發者與生成式 AI 超級計算

    NVIDIA 與 Hugging Face 將連接數百萬開發者與生成式 AI 超級計算

    NVIDIA DGX Cloud 集成到 Hugging Face 平臺將加速大語言模型(LLM)的訓練和調優,簡化了幾乎每個行業的模型定制
    的頭像 發表于 08-09 11:38 ?1180次閱讀
    NVIDIA 與 <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 將連接數百萬開發者與生成式 AI 超級計算

    Hugging Face被限制訪問

    目前尚不清楚 Hugging Face 何時出現訪問限制問題。雅虎的報道稱,早在今年 5 月起,就已經有用戶在 HF 的論壇上抱怨連接問題。另外有報道稱,至少從 9 月 12 日起,Hugging
    的頭像 發表于 10-22 15:51 ?1735次閱讀
    <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b>被限制訪問

    Hugging Face LLM部署大語言模型到亞馬遜云科技Amazon SageMaker推理示例

    ?本篇文章主要介紹如何使用新的Hugging Face LLM推理容器將開源LLMs,比如BLOOM大型語言模型部署到亞馬遜云科技Amazon SageMaker進行推理的示例。我們將部署12B
    的頭像 發表于 11-01 17:48 ?963次閱讀
    <b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> LLM部署大語言<b class='flag-5'>模型</b>到亞馬遜云科技Amazon SageMaker推理示例

    ArmArm Neoverse計算子系統(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    Arm宣布了兩款新的Arm Neoverse計算子系統(CSS),它們基于“迄今為止最好的一代Neoverse技術”。是什么讓這些新產品在擁擠的計算技術領域脫穎而出?
    的頭像 發表于 04-24 17:53 ?1124次閱讀
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>計算子系統(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS V3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3

    Hugging Face推出開源機器人代碼庫LeRobot

    AI領域的佼佼者Hugging Face近日宣布重磅推出并全面開源其機器人工具包——LeRobot。這一創新工具包基于史上最大規模的眾包機器人數據集,為開發者提供了一個前所未有的平臺。
    的頭像 發表于 05-09 10:32 ?607次閱讀

    亞馬遜云攜手AI新創企業Hugging Face,提升AI模型在定制芯片計算性能

    Hugging Face作為一家估值為45億美元的公司現已成為了眾多AI研究員和開發者分享Chatbot和相關軟件的核心平臺,受到亞馬遜、谷歌、英偉達等巨頭的青睞。
    的頭像 發表于 05-23 14:24 ?423次閱讀

    Hugging Face科技公司推出SmolLM系列語言模型

    7月22日最新資訊,Hugging Face科技公司在語言模型領域再創新高,正式推出了SmolLM系列——一款專為適應多樣計算資源而設計的緊湊型語言模型家族。該系列包含三個版本,分別搭
    的頭像 發表于 07-23 16:35 ?361次閱讀

    Arm Neoverse如何加速實現AI數據中心

    在快速演進的云計算和人工智能 (AI) 時代,企業需要能助力其優化性能、降低成本并在市場競爭中保持領先的方法。Arm Neoverse 已成為眾多前沿企業的選擇,他們希望在推動創新的同時,能夠顯著
    的頭像 發表于 11-26 09:30 ?368次閱讀
    主站蜘蛛池模板: 五月天婷婷在线观看| 天天草b| h网址在线观看| 天天射天天射天天射| 国产一区美女| 日本a网| 特级毛片aaa免费版| 一级毛片日韩a欧美| 午夜在线观看cao| 中文在线天堂网| 亚洲欧美视频一区二区三区| 26uuu欧美性色| 蜜色网| 天天添| 美女牲交毛片一级视频| 在线视频永久在线视频| 亚洲黄色天堂| 性欧美高清精品videos| 在线黄色免费观看| 香蕉久久夜色精品国产2020| 伊人久久大香线蕉影院95| 五月婷婷丁香综合| 欧美日韩生活片| 欧美一级视频免费| 色老头影视| 久久久噜噜噜久久| 亚洲午夜精品久久久久| 超级狂色而且免费又超好看| 国产免费一区二区三区最新| 亚洲天天| 操天天| 午夜在线亚洲男人午在线| 在线观看视频播放| 亚洲国产网址| 特黄特色大片免费视频播放 | 国产情侣露脸| 国产伦精品一区二区三区网站| 123456成年免费视频| 一区二区三区四区在线不卡高清| h视频在线观看视频观看| 一级做a爱片特黄在线观看免费看|