NVIDIA Omniverse Avatar實現實時對話式AI助手
美國加利福尼亞州圣克拉拉——GTC大會——2021年11月9日——NVIDIA于今日發布用于生成交互式AI虛擬形象的技術平臺——NVIDIA Omniverse Avatar。
Omniverse Avatar能夠連接NVIDIA在語音AI、計算機視覺、自然語言理解、推薦引擎和模擬方面的技術。在該平臺上創建的虛擬形象是具有光線追蹤3D圖像效果的交互式角色,可以看到、說話、談論各種主題,以及合理地理解表達意圖。
Omniverse Avatar為AI助手的創建開辟了道路,而且可以根據各個行業的需求輕松定制。AI助手可以幫助處理數十億次日常客戶服務互動,比如餐廳訂單,銀行交易,個人預約和預訂等,帶來更多商機并提升客戶滿意度。
NVIDIA創始人兼首席執行官黃仁勛表示:“智能虛擬助手的前景一片光明。Omniverse Avatar將我們的基礎圖像、模擬和AI技術結合在一起,打造出一些有史以來最復雜的實時應用。協作機器人和虛擬助手的案例令人難以置信,影響深遠。”
Omniverse Avatar是用于3D工作流程的虛擬世界模擬和協作平臺——NVIDIA Omniverse的一部分,Omniverse公測版用戶現已超過7萬人。
在NVIDIA GTC主題演講中,黃仁勛分享了使用Omniverse Avatar的多個例子,包括用于客戶支持的Project Tokkio、用于永久在線車載智能服務的NVIDIA DRIVE Concierge以及用于視頻會議的Project Maxine。
在第一個Project Tokkio演示中,黃仁勛展示了NVIDIA的同事們與一個黃仁勛的卡通虛擬形象進行互動——就生物學和氣候科學等話題開展對話。
在第二個Project Tokkio演示中,黃仁勛著重介紹了餐廳自助服務亭中的一個客戶服務虛擬形象。演示中,有兩名顧客正在訂購素食漢堡、薯條和飲料,該虛擬形象看到了他們、與他們交談并理解了他們。這些演示由NVIDIA AI軟件和目前全球最大的可定制語言模型——Megatron 530B驅動。
在DRIVE Concierge AI平臺演示中,中央儀表盤屏幕上的數字助理幫助駕駛者選擇了最佳駕駛模式以準時到達目的地,然后按照駕駛者的要求,設置在汽車續航里程下降到100英里以下時進行提醒。
另外,黃仁勛還展示了Project Maxine如何為虛擬協作和內容創作應用增加最先進的視頻和音頻功能。演示中,一個講英語的人在嘈雜的咖啡館里進行視頻通話,但是其他人可以清楚地聽到她所說的話,沒有背景噪音。當她講話時,她的話被實時轉錄并翻譯成德語、法語和西班牙語,并且聲音和語調與原話完全相同。
Omniverse Avatar主要組成部分
Omniverse Avatar 所使用的語音AI、計算機視覺、自然語言理解、推薦引擎、面部動畫和圖像元素,通過以下技術實現:
其語音識別基于NVIDIA Riva。這個軟件開發工具包可以識別多種語言的語音。Riva還可通過文本語音轉換功能生成接近真人的語音反饋。
其自然語言理解基于Megatron 530B大型語言模型。該模型可以識別、理解和生成人類語言。Megatron 530B是一個預訓練模型,它可以在很少或沒有訓練的情況下完成句子、回答主題廣泛的問題、總結長而復雜的故事、翻譯成其他語言,并應對許多它未接受過專門訓練的情景。
其推薦引擎由NVIDIA Merlin提供。該框架使企業可以建立能夠處理大量數據的深度學習推薦系統,以提出更明智的建議。
其感知功能來自用于視頻分析的計算機視覺框架——NVIDIA Metropolis。
其虛擬形象動畫由AI賦能的2D和3D面部動畫和渲染技術——NVIDIA Video2Face和Audio2Face驅動。
這些技術被集成在一個應用,并使用NVIDIA統一計算框架進行實時處理。這些技術被打包成可擴展、自定義微服務后,能夠通過NVIDIA Fleet Command在多個地點安全地部署、管理和協調。
原文標題:GTC21 | NVIDIA發布用于創建AI虛擬形象的平臺
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
責任編輯:pj
-
NVIDIA
+關注
關注
14文章
5026瀏覽量
103287 -
計算機
+關注
關注
19文章
7520瀏覽量
88263 -
AI
+關注
關注
87文章
31158瀏覽量
269524
原文標題:GTC21 | NVIDIA發布用于創建AI虛擬形象的平臺
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論