在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

交互式人工智能(CAI)簡介

一汀煙雨666 ? 來源:一汀煙雨666 ? 作者:一汀煙雨666 ? 2022-08-07 09:29 ? 次閱讀

本篇白皮書詳細介紹了自動語音識別(ASR)的應用場景,以及Achronix如何在實現ASR解決方案的同時將相關成本降低高達90%。

交互式人工智能(CAI)簡介

什么是交互式人工智能(AI)?

交互式人工智能(CAI)使用機器學習(ML)的子集深度學習(DL),通過機器實現語音識別、自然語言處理和文本到語音的自動化。CAI流程通常用三個關鍵的功能模塊來描述:

1.語音轉文本(STT),也稱為自動語音識別(ASR)

2自然語言處理(NLP)

3文本轉語音(TTS)或語音合成



圖1:交互式AI構建模塊 細分市場和應用場景

僅在美國就有超過1.1億個虛擬助手在發揮作用[1],大多數人對使用CAI服務都很熟悉。主要示例包括移動設備上的語音助手,例如蘋果的Siri或亞馬遜的Alexa;筆記本電腦上的語音搜索助手,例如微軟的cortana;自動呼叫中心應答助理;以及支持語音功能的設備,例如智能音箱、電視和汽車等。

支持這些CAI服務的深度學習算法可以在本地電子設備上進行處理,或者聚集在云中進行遠程大規模處理。支持數百萬用戶交互的大規模部署是一個巨大的計算處理挑戰,超大規模的提供商已經通過開發專用的芯片和設備來處理這些服務。

現在,大多數小型企業都可以使用亞馬遜、IBM、微軟和谷歌等公司提供的云API,輕松地將語音接口添加到他們的產品中。然而,當這些工作負載的規模增加時(本白皮書后面將介紹一個具體的示例),使用這些云API的成本將會變得過高,迫使企業尋求其他解決方案。此外,許多企業運營對數據安全性有更高的要求,因此需要將解決方案必須保留在企業的數據安全范圍內。

企業級CAI解決方案可用于以下應用場景:

·自動呼叫中心

·語音和視頻通信平臺

·健康和醫療服務

·金融和銀行服務

·零售和售貨販賣設備

詳細介紹ASR處理過程

ASR是CAI流程的第一步,在這里語音被轉錄為文本。一旦文本可用,就可以使用自然語言處理(NLP)算法以多種方式對其進行處理。NLP包括關鍵內容識別、情感分析、索引、語境化內容和分析。在端到端的交互式AI算法中,語音合成用于生成自然的語音響應。

最先進的ASR算法是通過端到端的深度學習來實現。不同于卷積神經網絡(CNN),遞歸神經網絡(RNN)在語音識別中很常見。正如來自TechTarget[10]的David Petersson在《CNN與RNN:它們有何不同?》文章中提到:RNN更適合處理時間數據,與ASR應用非常適配。基于RNN的模型需要較高的計算能力和存儲帶寬來處理神經網絡模型,并滿足交互式系統所需的嚴格的延遲目標。當實時或自動響應太慢時,它們會顯得遲緩和不自然。通常只有犧牲處理效率才能實現低延遲,這會增加成本,并且對于實際部署來說會變得過于龐大。

Achronix與采用現場可編程邏輯門陣列(FPGA)進行AI推理的專業技術公司Myrtle.ai展開合作。Myrtle.ai利用其MAU推理加速引擎在FPGA上實現基于RNN的高性能網絡。該設計已集成到Achronix Speedster7t AC7t1500 FPGA器件中,可以利用Speedster7t架構的關鍵架構優勢(將在本白皮書后面進行探討),大幅提高實時ASR神經網絡的加速處理,從而與服務器級中央處理器CPU)相比,可處理的實時數據流(RTS)的數量增加2500%。

數據加速器:如何實現資源的合理平衡分配

數據加速器可以卸載通常由主CPU執行的計算、網絡和/或存儲處理工作負載,從而可以顯著減少服務器的占用空間。本白皮書介紹了用一臺服務器和一個Achronix基于ASR的加速卡可取代多達25臺服務器。這種架構大大降低了工作負載成本、功耗和延遲,同時提高了工作負載吞吐量。然而,只有在硬件得到有效使用并且部署具有成本效益的情況下,使用數據加速硬件來實現高性能和低延遲才有意義。

ASR模型對現代數據加速器來說是一種挑戰,通常需要手動調整以實現比平臺主要性能規格的個位數效率更高的性能。實時ASR工作負載需要高存儲帶寬以及高性能計算。這些大型神經網絡所需的數據通常存儲在加速卡上的DDR存儲器中。將數據從外部存儲器傳輸到計算平臺是該工作負載中的性能瓶頸,特別是在進行實時部署的時候。

圖形處理器(GPU)架構是基于數據并行模型,較小的批處理量(batchsize)會導致GPU加速硬件的利用率較低,從而導致成本增加和效率降低。硬件加速解決方案數據表(以TOPS即每秒萬億次操作為單位進行衡量)中的性能數據并不能總是很好地表示實際性能,因為許多硬件加速器件由于與器件架構相關的瓶頸而未得到充分利用。這些數據以TOPS為單位,強調了加速器計算引擎的處理能力,但忽略了關鍵因素,例如外部存儲器的批處理量、速度和規模,以及在外部存儲器和加速器計算引擎之間傳輸數據的能力。對于ASR工作負載,關注存儲帶寬和在加速器內高效地傳輸數據為加速器性能和效率的實現提供了更強有力的指導。

加速器必須具有更大的外部存儲規模和非常高的帶寬。當今的高端加速器通常使用高性能的外部存儲器,存儲規模達8-16GB,運行速度可高達4 Tbps。它還必須能夠將這些數據傳輸到計算平臺而不會影響性能。然而,無論如何去實現高速存儲和計算引擎之間的數據通道,它幾乎在所有情況下都是系統性能的瓶頸,特別是在實時ASR這樣的低延遲應用中。

FPGA設計旨在存儲和計算之間提供最佳的數據路由通道,從而為這些工作負載提供一個出色的加速平臺。

Achronix解決方案與其他FPGA解決方案的對比

在機器學習(ML)加速領域中,已有FPGA架構宣稱其推理速度可高達150TOPS。然而在實際應用中,尤其是在那些對延遲敏感的應用(如ASR)中,由于無法在計算平臺和外部存儲器之間高效地傳輸數據,所以這些FPGA遠不能達到其聲稱的最高推理速度。由于數據從外部存儲器傳輸到FPGA器件中的計算引擎時出現了瓶頸,從而造成了這種性能上的損失。AchronixSpeedster7t架構在計算引擎、高速存儲接口和數據傳輸之間取得了良好的平衡,使Speedster7t FPGA器件能夠為實時、低延遲的ASR工作負載提供高性能,可實現最高TOPS速率的64%等級。



圖2:Speedster7t器件的計算、存儲和數據傳輸能力

Speedster7t架構如何實現更高的計算效率

在Speedster7t上搭載的機器學習處理器(MLP)是一種優化的矩陣/向量乘法模塊,能夠在單個時鐘周期內進行32次乘法和1次累加,是計算引擎架構的基礎。AC7t1500器件中的BlockRAM(BRAM)與2560個MLP實例都處于同一位置,這意味著更低的延遲和更高的吞吐量。

借助于這些關鍵的架構單元,Myrtle.ai的MAU低延遲、高吞吐量的ML推理引擎已集成到Speedster7tFPGA器件中。

在構建最佳的ASR解決方案時,集成了之前提到的來自Myrtle.ai的MAU推理引擎,使用了2560個MLP中的2000個。由于MLP是一個硬模塊,它可以運行在比FPGA邏輯陣列本身更高的時鐘速率上。



圖3:機器學習處理器

在AC7t1500器件中使用了8個GDDR6存儲控制器,它們總共可提供高達4Tbps的雙向帶寬。如上所述,強大的計算引擎和大容量、高帶寬的存儲依賴于高速、低延遲和確定性的數據傳輸,以提供低延遲ASR應用所需的實時結果。

隨后這些數據進入到Speedster7t的二維片上網絡(2DNoC)。該二維片上網絡是Speedster7t架構中的另一種硬結構,時鐘頻率高達2 GHz,可與所有I/O、內部硬模塊和FPGA邏輯陣列本身互連。憑借20Tbps的總帶寬,2D NoC提供了最高的吞吐量,并通過適當的實現方式,可以在外部Gddr6存儲器和支持MLP的計算引擎之間提供最具確定性的、低延遲的數據傳輸。

poYBAGLs2BSAYtKOAAaTPlv6rNE471.png

圖4:總帶寬為20 Tbps的2D NoC

與其他競爭性廠商的解決方案不同,2DNoC消除了Speedster7t ASR解決方案在存儲器和計算引擎之間的任何瓶頸,在這些非常低的批處理速率下,硬件加速器的利用率達到最佳狀態。

將所有這些功能放在一個roofline圖中,就可以清楚地說明AchronixSpeedster7t器件在低延遲ASR應用中相對于其他競爭性FPGA解決方案的優勢。該roofline圖使用了由每個制造商公布的經過驗證的TOPS數據,展示了這些器件在實際應用中可以達到的效果。

下圖顯示了一個有效TOPS的roofline模型,它使用了Achronix為微基準(GEMV和MLP)和測試而構建的子集,以及公司A[4] [5]和公司B(基于架構)發布的數據。橙色的豎線表示批處理量為8毫秒和80毫秒音頻模塊的最佳操作點,用于低延遲、實時ASR數據流應用。在這個最佳操作點上,Achronix的有效TOPS比公司A提高了44%,比公司B的解決方案提高了260%。



圖5:有效TOPS的Roofline模型

在一年內實現ASR處理成本降低高達90%的目標

大多數ASR解決方案由Google、Amazon、microsoftAzure和Oracle等大型云服務提供商提供。隨著運營規模的擴大,以及這些產品在市場上取得的成功,在這些云API基礎上構建產品的服務提供商面臨著越來越高的成本壓力。較大規模的ASR提供商公開宣傳成本從每分鐘0.01美元到0.025美元不等[6]、[7]、[8]、[9]。行業報告顯示,呼叫中心的平均呼叫時間約為5分鐘。考慮一個大型企業數據或呼叫中心服務公司每天要處理50,000通電話,每通電話5分鐘。按照上述費率計算,ASR處理成本將是每天1,500至6,000美元或每年50萬至200萬美元。Achronix和Myrtle.ai的解決方案可以集成在一個加速卡上支持處理4000個RTS,每天可以處理超過一百萬次的呼叫。

有許多因素會決定獨立ASR設備的成本。在這個特定示例中,假設Achronix ASR加速解決方案是通過基于FPGA的PCIe卡提供,并集成到基于x86架構的2U服務器中。該設備從系統集成商那里出售,價格可能為50,000美元,而每年運行服務器的成本可能是這個成本的兩倍。這樣一來,本地ASR設備第一年的費用就達到了10萬美元。將這種本地解決方案與云API服務進行比較,終端用戶可以在第一年節省5到20倍的費用。



表1:AchronixASR解決方案與云API服務的對比總結

高度緊湊的系統使企業能夠隨著其業務的增加而擴展,而無需依賴日益昂貴的ASR云API,也無需構建龐大的數據中心基礎設施來提供本地解決方案。

總結

CAI中的ASR功能要求RNN機器學習算法具有低延遲、高吞吐量的計算,這對現代AI加速器提出了挑戰。聲稱推理速度高達150TOPS的FPGA硬件加速器在大型計算引擎和高速存儲器之間傳輸數據時會遇到瓶頸,這些瓶頸可能導致硬件利用率低至5%。Achronix和Myrtle.ai攜手推出一個ASR平臺,該平臺由一個200W、x16PCIe Gen4加速卡和相關軟件組成,可以同時支持多達4000個RTS,每24小時可以處理多達100萬個、時長5分鐘的轉錄文件。將單臺x86服務器上的PCIe加速卡與云ASR服務的成本相比,第一年的資本支出(CAPEX)和運營成本(OPEX)就可以降低高達90%。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21777

    瀏覽量

    604779
  • 加速器
    +關注

    關注

    2

    文章

    804

    瀏覽量

    37980
  • 人工智能
    +關注

    關注

    1793

    文章

    47532

    瀏覽量

    239306
  • ASR
    ASR
    +關注

    關注

    2

    文章

    43

    瀏覽量

    18759
收藏 人收藏

    評論

    相關推薦

    什么是嵌入人工智能

    。嵌入人工智能的目標是使嵌入系統具備智能化的感知、分析和響應能力,從而實現自主決策、自適應學習和智能
    的頭像 發表于 12-11 09:23 ?359次閱讀
    什么是嵌入<b class='flag-5'>式</b><b class='flag-5'>人工智能</b>

    嵌入人工智能究竟是什么關系?

    嵌入人工智能究竟是什么關系? 嵌入系統是一種特殊的系統,它通常被嵌入到其他設備或機器中,以實現特定功能。嵌入系統具有非常強的適應性和靈活性,能夠根據用戶需求進行定制化設計。它
    發表于 11-14 16:39

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內容詳實,干活滿滿。 《AI for Science:人工智能驅動科學創新》這本書的第一章,作為整個著作的開篇
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領域的應用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析: 一、RISC-V的基本特點 RISC-V
    發表于 09-28 11:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發表于 07-29 17:05

    又一家人工智能企業成功IPO,核心技術涉及感知、理解、執行

    電子發燒友網報道(文/李彎彎)日前,交互式人工智能領域龍頭聲通科技在港交所主板上市。聲通科技成立于2005年,公司致力于向企業級用戶提供全棧交互式人工智能AI解決方案,賦能其信息交換和
    的頭像 發表于 07-17 00:16 ?3128次閱讀

    交互式AI領導者聲通科技,引領企業級市場進入智能問答時代

    在數字化浪潮席卷全球的今天,AI智能技術已經成為推動產業創新、社會進步的重要力量。作為中國企業級信息技術解決方案的領軍者,上海聲通信息科技股份有限公司(以下簡稱“聲通科技”)憑借其在交互式人工智能
    的頭像 發表于 05-27 16:06 ?448次閱讀

    中國企業級交互式人工智能市場潛力巨大,聲通科技積極拓展市場份額

    隨著人工智能、云計算、大數據、5G等新一代信息技術的迅猛發展,企業正迎來數字化轉型的浪潮。在這一浪潮中,企業級交互式人工智能的商業化應用成為推動企業提升溝通效率、實現智能化轉型的關鍵力
    的頭像 發表于 05-24 09:46 ?400次閱讀

    深耕交互式人工智能領域,聲通科技為用戶提供更加智能的解決方案

    在數字化浪潮席卷全球的今天,人工智能已成為推動社會進步的重要力量。作為中國交互式人工智能(CoAI)領域的開拓者與領軍者,上海聲通信息科技股份有限公司(以下簡稱“聲通科技”)憑借其創新
    的頭像 發表于 05-16 09:42 ?379次閱讀

    聲通科技:Voicecomm Suites引領企業交互式人工智能新風尚

    隨著科技的快速發展,人工智能和通信技術不斷融合,為企業級用戶帶來了前所未有的商業機遇。在這個大背景下,上海聲通信息科技股份有限公司(以下簡稱“聲通科技”)憑借其在交互式人工智能領域的深厚積累和持續
    的頭像 發表于 04-12 12:02 ?300次閱讀

    市場前景向好,交互式人工智能提供商聲通科技迎廣闊發展空間

    根據艾瑞咨詢報告,2022年中國企業級交互式人工智能解決方案的市場滲透率僅為10.4%,美國市場滲透率為16.7%。目前中國企業級交互式人工智能解決方案的市場滲透率仍有巨大提升空間,預
    的頭像 發表于 04-11 14:12 ?368次閱讀

    聲通科技全棧交互式人工智能,助力企業智能化升級

    在數字化浪潮席卷全球的今天,人工智能已經成為企業轉型升級、提升競爭力的關鍵力量。上海聲通信息科技股份有限公司(以下稱:聲通科技或公司)作為中國第二大企業級全棧交互式人工智能解決方案提供商,憑借其強大
    的頭像 發表于 03-20 09:56 ?381次閱讀

    以人才為核心,聲通科技加速推動企業級全棧交互式人工智能發展

    源源不斷的創新活力。 據聲通科技IPO招股書顯示,公司成立于2005年,是以人工智能和大數據融合通訊為技術基座,定位于復雜實時交互場景(人、物、信息之間的交互)的企業級全棧交互式
    的頭像 發表于 03-19 10:04 ?304次閱讀

    嵌入人工智能的就業方向有哪些?

    嵌入人工智能的就業方向有哪些? 在新一輪科技革命與產業變革的時代背景下,嵌入人工智能成為國家新型基礎建設與傳統產業升級的核心驅動力。同時在此背景驅動下,眾多名企也紛紛在嵌入
    發表于 02-26 10:17

    生成人工智能和感知人工智能的區別

    生成人工智能和感知人工智能人工智能領域中兩種重要的研究方向。本文將探討這兩種人工智能的區別
    的頭像 發表于 02-19 16:43 ?1921次閱讀
    主站蜘蛛池模板: 精品二区| 日韩一级片在线播放| 国产美女精品一区二区三区| 久操视频在线观看| 天天天综合| 99精品国产高清自在线看超| 免费你懂的| 人人入人人爱| 他也色在线视频| 91破处视频| 玖玖草在线观看| 午夜特片网| 在线视频久久| 逼逼视频网站| 国产视频三区| 国模精品视频一区二区三区| 久久综合婷婷| 噜噜噜噜私人影院| 欧美深夜| 日本黄色a级| 激情啪啪网站| 国产免费一区二区三区在线| 久久2017| 黄 色美 女人| 狠狠色狠狠色综合日日不卡| ts人妖在线观看| 91正在播放| 久久网免费视频| 91亚色视频在线观看| 亚洲视频在线播放| 国产网站黄| 成年1314在线观看| re99热| 曰本又色又爽又黄三级视频| 中文字幕第一页在线| 在线观看色视频| 日本中文字幕在线播放| 在线免费看黄| 青草悠悠视频在线观看| 免费三级黄色| 一本高清在线|