上周, NVIDIA GTC 2022 宣布了對(duì) Riva 的重大更新。 Riva 是一個(gè)用于構(gòu)建語音 AI 應(yīng)用程序的 SDK ,以及一個(gè)付費(fèi)的 Riva 企業(yè)產(chǎn)品。 NeMo Megatron 是一個(gè)用于訓(xùn)練大型語言模型的框架,它的幾項(xiàng)關(guān)鍵更新也已宣布。
Riva 2.0 通用性
Riva 為跨多種語言的實(shí)時(shí)自動(dòng)語音識(shí)別( ASR )和文本到語音( TTS )技能提供了世界級(jí)的準(zhǔn)確性,并且可以部署在 prem 上、任何云中。 Snap 、 T-Mobile 、 RingCentral 和 Kore 等行業(yè)領(lǐng)導(dǎo)者。 ai 在客戶服務(wù)中心應(yīng)用程序、轉(zhuǎn)錄和虛擬助理中使用 Riva 。
最新的 Riva 版本包括:
ASR 有多種語言:英語、西班牙語、德語、俄語和普通話。
高質(zhì)量的 TTS 語音可定制獨(dú)特的語音字體。
使用 TAO Toolkit 或 NVIDIA NeMo 進(jìn)行特定于領(lǐng)域的定制,在口音、領(lǐng)域和國(guó)家特定術(shù)語方面具有無與倫比的準(zhǔn)確性。
支持在云端、 prem 和嵌入式平臺(tái)上運(yùn)行。
圖 1:NVIDIA Riva 可控文本到語音使得使用 SSML 標(biāo)簽可以輕松調(diào)整音調(diào)和速度。
在手機(jī)上嘗試 Riva 自動(dòng)語音識(shí)別 Riva 產(chǎn)品頁(yè)面 。
Defined.ai 與 NVIDIA 合作,為希望購(gòu)買跨語言、域和錄音類型的語音培訓(xùn)和驗(yàn)證數(shù)據(jù)的企業(yè)提供一個(gè)順暢的工作流程。可在 此處 中找到針對(duì) NVIDIA 開發(fā)人員的 DefinedCrowd 數(shù)據(jù)集示例。
下載 RIVA ,它是免費(fèi)的NVIDIA 開發(fā)人員的成員從 NGC 免費(fèi)。
Riva 企業(yè)
NVIDIA 還推出了 Riva Enterprise ,這是一款付費(fèi)產(chǎn)品,面向在NVIDIA 專家的業(yè)務(wù)標(biāo)準(zhǔn)支持下大規(guī)模部署 Riva 的企業(yè)。
好處包括:
在任何云和 prem 平臺(tái)上不受限制地使用 ASR 和 TTS 服務(wù)。
在當(dāng)?shù)貭I(yíng)業(yè)時(shí)間與NVIDIA 人工智能專家聯(lián)系,獲取有關(guān)配置和性能的指導(dǎo)。
為維護(hù)控制和升級(jí)計(jì)劃提供長(zhǎng)期支持。
優(yōu)先訪問新版本和功能。
Riva Enterprise 在 NVIDIA Launchpad 上提供免費(fèi)試用版,供企業(yè)評(píng)估并制作應(yīng)用程序原型。
Riva launchpad 上的 Enterprise 包括引導(dǎo)實(shí)驗(yàn)室,用于:
與實(shí)時(shí)語音 AI API 交互。
將語音 AI 功能添加到對(duì)話 AI 應(yīng)用程序中。
在自定義數(shù)據(jù)上微調(diào)語音 AI 管道以獲得更高的準(zhǔn)確性。
申請(qǐng) 用于您的 Riva 企業(yè)試用。
通過 對(duì)話人工智能解謎 GTC 課程了解有關(guān)如何構(gòu)建、優(yōu)化和部署語音 AI 應(yīng)用程序的更多信息。
NeMo Megatron
NVIDIA 宣布了新的更新 NVIDIA NeMo Megatron ,這是一個(gè)培訓(xùn)大型語言模型( LLM )的框架,其參數(shù)高達(dá)數(shù)萬億。基于 Megatron paper 的創(chuàng)新, NeMo Megatron 的研究機(jī)構(gòu)和企業(yè)可以培訓(xùn)任何 LLM ,以實(shí)現(xiàn)融合。 NeMo Megatron 提供數(shù)據(jù)預(yù)處理、并行(數(shù)據(jù)、張量和管道)、編排和調(diào)度,以及自動(dòng)精度自適應(yīng)。
它包括經(jīng)過徹底測(cè)試的配方、流行的 LLM 架構(gòu)實(shí)現(xiàn),以及組織快速開始 LLM 之旅所需的工具。
瑞典,法學(xué)博士。 com 、 Naver 和佛羅里達(dá)大學(xué)是 Nvidia 技術(shù)的早期采用者,用于建立大型語言模型。
最新版本包括:
Hyperparameter tuning tool 會(huì)根據(jù)客戶需求和基礎(chǔ)設(shè)施限制自動(dòng)創(chuàng)建配方。
T5 和 mT5 車型的參考配方。
支持在云上培訓(xùn) LLM ,從 Azure 開始。
分布式數(shù)據(jù)預(yù)處理腳本,縮短端到端培訓(xùn)時(shí)間。
關(guān)于作者
About Siddharth Sharma:
Siddharth Sharma 是NVIDIA 加速計(jì)算的高級(jí)技術(shù)營(yíng)銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營(yíng)銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設(shè)計(jì)來創(chuàng)建控制軟件。
About Gordana Neskovic:
Gordana Neskovic 是AI/DL產(chǎn)品營(yíng)銷團(tuán)隊(duì)的成員,負(fù)責(zé) NVIDIA Maxine。在加入 NVIDIA 之前,Gordana曾在VMware、Wells Fargo、Pinterest、SFO-ITT和KLA Tencor擔(dān)任過各種產(chǎn)品營(yíng)銷、數(shù)據(jù)科學(xué)家、AI架構(gòu)師和工程職位。她擁有博士學(xué)位。圣塔 Clara 大學(xué),塞爾維亞貝爾格萊德大學(xué)電氣工程碩士和學(xué)士學(xué)位。
About Sirisha Rella:
Sirisha Rella 是 NVIDIA 的技術(shù)產(chǎn)品營(yíng)銷經(jīng)理,專注于計(jì)算機(jī)視覺、語音和基于語言的深度學(xué)習(xí)應(yīng)用。 Sirisha 獲得了密蘇里大學(xué)堪薩斯城分校的計(jì)算機(jī)科學(xué)碩士學(xué)位,是國(guó)家科學(xué)基金會(huì)大學(xué)習(xí)中心的研究生助理。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5039瀏覽量
103309 -
AI
+關(guān)注
關(guān)注
87文章
31192瀏覽量
269557
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論