世界機(jī)器人大會(huì)由北京市人民政府、工業(yè)和信息化部、中國(guó)科學(xué)技術(shù)協(xié)會(huì)主辦,在北京亦創(chuàng)國(guó)際會(huì)展中心舉行。大會(huì)論壇邀請(qǐng)了中、德、美、日、韓等國(guó)知名專家、企業(yè)家就機(jī)器人前沿科學(xué)研究、技術(shù)發(fā)展路線及戰(zhàn)略政策制定等問題開展高水平的學(xué)術(shù)交流和探討
10月24日上午,由中國(guó)電子學(xué)會(huì)承辦的《迎接人工智能與機(jī)器人時(shí)代論壇》如期舉行,IEEE R&A中國(guó)北京大區(qū)主席/北京航空航天大學(xué)教授王田苗、真格基金創(chuàng)始人徐小平、國(guó)家科技部技術(shù)中心研究員劉進(jìn)長(zhǎng)等出席論壇。哈工大機(jī)器人研究所所長(zhǎng)趙杰、思必馳首席科學(xué)家/上海交通大學(xué)教授俞凱、美國(guó)北卡羅來納大學(xué)教授蕭靜等業(yè)界權(quán)威學(xué)者專家進(jìn)行了論壇主題演講,展望了人工智能時(shí)代與機(jī)器人領(lǐng)域的未來發(fā)展。
圖 思必馳首席科學(xué)家俞凱分享現(xiàn)場(chǎng)
思必馳首席科學(xué)家/上海交通大學(xué)俞凱教授就《智能語(yǔ)音技術(shù)步入認(rèn)知時(shí)代》為主題進(jìn)行了分享。俞凱教授表示,互聯(lián)網(wǎng)發(fā)展使信息搜索向移動(dòng)端遷徙,口語(yǔ)對(duì)話交互成為移動(dòng)信息搜索的新習(xí)慣,思必馳的核心技術(shù)側(cè)重于端到端的非配合自然口語(yǔ)交互系統(tǒng),專注為智能車載、智能家居、智能機(jī)器人領(lǐng)域提供語(yǔ)音交互方案。為了滿足人性智能交互新需求,思必馳推出了極富表現(xiàn)力的多種合成音,從標(biāo)準(zhǔn)男女聲、名人音合成、童聲,到個(gè)性快速合成、小說閱讀、歌聲合成等,可實(shí)現(xiàn)個(gè)性化定制。
俞凱教授表示,人工智能的重要突破點(diǎn)在算法上,深度學(xué)習(xí)算法成為重要的突破口。思必馳與上海交大成立的聯(lián)合實(shí)驗(yàn)室也在智能語(yǔ)音研究領(lǐng)域取得了較大進(jìn)展,推出的VDCNN算法模型在降噪處理上表現(xiàn)出不可取代的優(yōu)勢(shì),相比于傳統(tǒng)語(yǔ)音模型僅使用1至2層卷積層,思必馳通過堆疊較小的卷積層和池化層,將語(yǔ)音模型中的卷積層的深度提高到了10層以上。利用小卷積核更加精細(xì)的局部刻畫能力和頻率不變性描述,能夠更好地在語(yǔ)音模型的內(nèi)部實(shí)現(xiàn)了聲學(xué)自動(dòng)降噪的能力。該模型在噪聲環(huán)境語(yǔ)音識(shí)別的業(yè)界基準(zhǔn)庫(kù)Aurora4上,取得了7.09%的詞錯(cuò)誤率。相比于世界其他機(jī)構(gòu)目前10%左右的最好結(jié)果,有一個(gè)大幅度的明顯優(yōu)勢(shì),在抗噪語(yǔ)音識(shí)別上是一個(gè)新的里程碑。
俞凱教授指出,自然口語(yǔ)交互中存在不確定性,語(yǔ)音是處理不確定性的高效管道,不確定性在情景理解和多輪交互中可以有效的減少甚至消除。思必馳深耕垂直場(chǎng)景下的語(yǔ)義理解技術(shù),通過數(shù)據(jù)收集及分析,可追蹤用戶意圖,更準(zhǔn)備進(jìn)行場(chǎng)景交互。智能語(yǔ)音正在經(jīng)歷著從感知智能向認(rèn)知智能的過渡,在智能語(yǔ)音感知智能上,機(jī)器能夠接受信息,采集數(shù)據(jù),輔助人類完成任務(wù)。而一旦實(shí)現(xiàn)過渡,認(rèn)知智能就能夠使機(jī)器聽懂語(yǔ)音并主動(dòng)思考給予人類反饋。
演講中,俞凱教授強(qiáng)調(diào)原始技術(shù)創(chuàng)新的重要性。對(duì)于產(chǎn)品應(yīng)用公司而言,工程化是重點(diǎn),在借助Google、Facebook開源的研究技術(shù)之后,能夠很快實(shí)現(xiàn)技術(shù)應(yīng)用落地。但是,對(duì)于像思必馳這樣的技術(shù)平臺(tái)公司而言,基層的技術(shù)研究與原始創(chuàng)新成為企業(yè)生存的關(guān)鍵。正因如此,思必馳強(qiáng)調(diào)科研工作的重要性,致力于打造更人性化的語(yǔ)音交互方案。
正如俞凱教授所言,思必馳確實(shí)不斷通過技術(shù)創(chuàng)新帶給大家驚喜。如,2015年10月,思必馳針對(duì)國(guó)內(nèi)智能車載市場(chǎng)推出AIOS For Car對(duì)話操作系統(tǒng),2016年6月升級(jí)至AIOS3.0版本新增7大功能,2016年10月升級(jí)至AIOS3.1版本,新增【one-shot一把手】功能,成為國(guó)內(nèi)首家實(shí)現(xiàn)該功能技術(shù)落地及市場(chǎng)應(yīng)用的企業(yè),合作客戶JADO遠(yuǎn)界系列智能后視鏡新發(fā)布的二代產(chǎn)品即應(yīng)用該升級(jí)版功能。除軟件解決方案外,思必馳同樣提供軟硬一體化解決方案,“環(huán)形6+1遠(yuǎn)場(chǎng)麥克風(fēng)陣列”是國(guó)內(nèi)首款投諸市場(chǎng)應(yīng)用的7麥方案,實(shí)現(xiàn)360度全角度拾音與5米遠(yuǎn)場(chǎng)交互,與亞馬遜echo的環(huán)形7麥又異曲同工之妙,思必馳環(huán)麥方案迅速投入到了國(guó)內(nèi)智能機(jī)器人、智能音箱、家居中控等智能硬件產(chǎn)品中,受到市場(chǎng)青睞。
思必馳作為國(guó)內(nèi)唯一一家專注智能硬件領(lǐng)域的語(yǔ)音公司,將憑借著近10年的技術(shù)積淀及專注性,為垂直領(lǐng)域打造更專業(yè)的語(yǔ)音交互方案,讓未來人機(jī)交互更有用、更有趣。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28522瀏覽量
207530 -
人工智能
+關(guān)注
關(guān)注
1792文章
47437瀏覽量
238983 -
智能語(yǔ)音
+關(guān)注
關(guān)注
10文章
786瀏覽量
48813
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論