SoundHound 是一家位于硅谷的初創(chuàng)公司。通過(guò)將AI技術(shù)應(yīng)用于其服務(wù),它革新了傳統(tǒng)的語(yǔ)音搜索。隨著產(chǎn)品規(guī)模的不斷擴(kuò)大,該公司目前已獲得1億美元的戰(zhàn)略投資。NVIDIA GPU Ventures是其早期投資者之一,它致力于支持從事深度學(xué)習(xí)研究的初創(chuàng)公司。
除了同名的音樂(lè)識(shí)別應(yīng)用程序外,SoundHound 還提供 Hound 語(yǔ)音搜索應(yīng)用程序和 Houndify 語(yǔ)音平臺(tái),以幫助企業(yè)創(chuàng)建基于 AI 的語(yǔ)音服務(wù)。即使在亞馬遜、蘋果、谷歌和微軟等巨頭云集的市場(chǎng)中,該公司的技術(shù)也已成為語(yǔ)音搜索領(lǐng)域最具競(jìng)爭(zhēng)力的方案之一。
加入研發(fā) Collective AI
該公司正在迅速推出自己的語(yǔ)音領(lǐng)域,以實(shí)現(xiàn)更流暢和快速的自然語(yǔ)言處理。其領(lǐng)域范圍已經(jīng)從 50 個(gè)發(fā)展到了 200 個(gè),這些領(lǐng)域的語(yǔ)音服務(wù)質(zhì)量也在兩年內(nèi)實(shí)現(xiàn)迅速提升。
與此同時(shí),SoundHound 還在持續(xù)推動(dòng)各領(lǐng)域相互“交流”的能力,以此為消費(fèi)者提供更出色的搜索功能。該公司將此項(xiàng)工作稱為Collective AI,并表示這會(huì)讓使用相關(guān)架構(gòu)的產(chǎn)品更智能、更強(qiáng)大。
Collective AI 旨在幫助人們提出復(fù)雜的請(qǐng)求或問(wèn)題,并獲得回復(fù)。例如:請(qǐng)找到舊金山 4 星級(jí)以上最好的意大利餐廳,要適合兒童就餐,不能是連鎖餐廳,且在周三晚上 9 點(diǎn)以后仍然營(yíng)業(yè)。
該公司的 Collective AI 聯(lián)盟企業(yè)包括 NVIDIA、Yelp、AccuWeather.com、Sportstrader、Xignite、FlightStats、Onkyo、Sharp、Uber 和 Samsung ARTIK。
此外,SoundHound 還希望借助 Houndify 語(yǔ)音平臺(tái)脫穎而出。這項(xiàng)白標(biāo)簽授權(quán) (white-label licensed) 服務(wù)允許公司在產(chǎn)品中使用自己的名稱來(lái)定制語(yǔ)音助手,并保留生成的客戶數(shù)據(jù)。這使公司能夠打造自己的語(yǔ)音搜索品牌,同時(shí)透過(guò)客戶數(shù)據(jù)發(fā)現(xiàn)其他商機(jī)。
Houndify 開(kāi)發(fā)人員數(shù)量增至三倍
去年年初,SoundHound 有 2 萬(wàn)多名開(kāi)發(fā)人員注冊(cè)使用 Houndify,而如今這一數(shù)字已增至 6 萬(wàn)多。
SoundHound 也在不斷為 Houndify 吸引客戶。目前,該公司的合作伙伴包括 11 家汽車制造商,以及從事機(jī)器人、聯(lián)網(wǎng)揚(yáng)聲器、電器、增強(qiáng)現(xiàn)實(shí)和智能家居設(shè)備行業(yè)的公司。
現(xiàn)代集團(tuán)正在為未來(lái)汽車中的新一代語(yǔ)音系統(tǒng)配置 Houndify。汽車制造商的智能助手旨在預(yù)測(cè)駕駛員對(duì)信息的需求(例如提供會(huì)議提醒)。它還支持免提通話、發(fā)送信息、搜索目的地和音樂(lè),以及查詢天氣和管理日歷等功能。此外,語(yǔ)音的應(yīng)用范圍還將擴(kuò)展至對(duì)空調(diào)、門鎖及其他車輛的控制功能。
NVIDIA DRIVE和Jetson TX2平臺(tái)幫助 SoundHound 分別在汽車和機(jī)器人應(yīng)用領(lǐng)域?qū)崿F(xiàn)了"Speech-to-Meaning"技術(shù)。
適用于機(jī)器人的 Jetson TX2 開(kāi)發(fā)者工具包
雙重語(yǔ)音識(shí)別方法
SoundHound 采用了一種全新方法來(lái)提供快速的語(yǔ)音識(shí)別服務(wù)。該公司的系統(tǒng)采用的是本地識(shí)別模型和遠(yuǎn)程識(shí)別引擎雙重語(yǔ)音識(shí)別方法,并已獲得專利。SoundHound 的混合工程設(shè)計(jì)利用 NVIDIA Drive 的 GPU 來(lái)更快地處理語(yǔ)音查詢。
SoundHound 提供的雙重方法實(shí)現(xiàn)了對(duì)車輛中語(yǔ)音查詢的實(shí)時(shí)響應(yīng),改變了傳統(tǒng)語(yǔ)音系統(tǒng)的“蝸”速問(wèn)題。
正是這種獨(dú)創(chuàng)性使得 AI 應(yīng)用到了網(wǎng)絡(luò)終端產(chǎn)品中。過(guò)去,嵌入式技術(shù)只能識(shí)別少量詞匯,并且速度和準(zhǔn)確性較低。然而,SoundHound 通過(guò)利用 NVIDIA GPU 運(yùn)行大量詞匯來(lái)快速、準(zhǔn)確地識(shí)別語(yǔ)音和理解自然語(yǔ)言。
SoundHound 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Keyvan Mohajer 說(shuō):“我們利用 NVIDIA DRIVE 平臺(tái)創(chuàng)建了嵌入式版本系統(tǒng),從而將可識(shí)別自然語(yǔ)言的字?jǐn)?shù)增加到了一百多萬(wàn)字。它的速度非常快,而且可擴(kuò)展。”
在機(jī)器人領(lǐng)域,Mayfield Robotics 正在開(kāi)發(fā)可使用 Houndify 的 Kuri 機(jī)器人以實(shí)現(xiàn)語(yǔ)音交互,從而使人們可以與機(jī)器人互動(dòng)并向其發(fā)號(hào)施令。
在電器領(lǐng)域,開(kāi)發(fā)人員利用 Houndify 在 Sure Immersion 咖啡機(jī)上展示了一個(gè)參考模型,通過(guò)“好的,咖啡師”這一語(yǔ)音提示可喚醒咖啡機(jī)。客戶可以使用語(yǔ)音指令來(lái)操作機(jī)器制作咖啡,還可以在等待咖啡沖泡時(shí)搜索天氣、體育和其他信息。
SoundHound 使用 NVIDIA GPU 訓(xùn)練神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí),并基于 GPU 運(yùn)行著自己的數(shù)據(jù)中心。該公司在數(shù)千臺(tái)服務(wù)器上進(jìn)行自然語(yǔ)言處理,并且可以處理數(shù) TB 的數(shù)據(jù)。
Mohajer 說(shuō):“曾經(jīng)可能需要幾個(gè)月才能完成的工作,現(xiàn)在只需幾天便可完成,這都要?dú)w功于 GPU。如果沒(méi)有 GPU,這個(gè)行業(yè)將無(wú)法前行。”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5026瀏覽量
103270 -
gpu
+關(guān)注
關(guān)注
28文章
4754瀏覽量
129080 -
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112727
原文標(biāo)題:NVIDIA GPU 助力 SoundHound 深耕語(yǔ)音 AI 市場(chǎng)
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論