專注智能硬件語(yǔ)音交互的思必馳于2007年在英國(guó)劍橋的高新區(qū)創(chuàng)立,早期曾提供語(yǔ)音口語(yǔ)教育服務(wù)。當(dāng)2014年智能硬件風(fēng)潮興起,他們看到人機(jī)對(duì)話真正的 落地的終端機(jī)會(huì),于是思必馳將教育事業(yè)部剝離出去成立了馳聲科技,開(kāi)始全力深耕智能硬件領(lǐng)域的語(yǔ)音交互技術(shù)。其中,智能機(jī)器人領(lǐng)域也是思必馳所要垂直進(jìn)攻的領(lǐng)域之一。
(原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)注明來(lái)自ElecFans)
隨著人工智能行業(yè)的快速發(fā)展,未來(lái)機(jī)器人都將在各行各業(yè)發(fā)揮重要的作用,且充滿無(wú)限可能。在電影《超能陸戰(zhàn)隊(duì)》中,機(jī)器人主角“大白”既能識(shí)別他人跟它說(shuō)的話,又能“機(jī)智”地給出回答。當(dāng)語(yǔ)音識(shí)別和人工智能兩項(xiàng)技術(shù)完善到一定程度,從冰冷的機(jī)器身上獲得人與人交往的溫度將成為可能。而智能語(yǔ)音作為最天然的交互入口,儼然已成為機(jī)器人領(lǐng)域的場(chǎng)景標(biāo)配,尤其是服務(wù)型機(jī)器人領(lǐng)域。
?
專注智能硬件語(yǔ)音交互的思必馳于2007年在英國(guó)劍橋的高新區(qū)創(chuàng)立,早期曾提供語(yǔ)音口語(yǔ)教育服務(wù)。當(dāng)2014年智能硬件風(fēng)潮興起,他們看到人機(jī)對(duì)話真正的落地的終端機(jī)會(huì),于是思必馳將教育事業(yè)部剝離出去成立了馳聲科技,開(kāi)始全力深耕智能硬件領(lǐng)域的語(yǔ)音交互技術(shù)。其中,智能機(jī)器人領(lǐng)域也是思必馳所要垂直進(jìn)攻的領(lǐng)域之一。
?
市場(chǎng)高需求意味著哪些高要求
?
當(dāng)然市場(chǎng)的高需求,也意味著對(duì)智能語(yǔ)音的高要求。鑒于此,我們采訪了思必馳機(jī)器人事業(yè)部商務(wù)總監(jiān)王巍。她表示:“單純強(qiáng)調(diào)識(shí)別率、喚醒率的語(yǔ)音技術(shù)已經(jīng)不能滿足市場(chǎng)需求。隨著感知智能的發(fā)展,大量的數(shù)據(jù)資源的積累成為了下一步發(fā)展的基礎(chǔ),如何培養(yǎng)智能語(yǔ)音的認(rèn)知智能,達(dá)到思考決策的目的,成為當(dāng)前熱點(diǎn)議題?!?br /> ?
針對(duì)目前這種現(xiàn)狀,思必馳語(yǔ)音技術(shù)更加專注于人性化的交互體驗(yàn),在機(jī)器人領(lǐng)域,思必馳提供語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音喚醒、多輪對(duì)話等純軟件技術(shù)方案,也提供如環(huán)形“6+1”遠(yuǎn)場(chǎng)麥克風(fēng)陣列等軟硬一體化的解決方案。
?
例如,360兒童機(jī)器人巴迪應(yīng)用了思必馳的語(yǔ)音合成技術(shù),浙江大華旗下的樂(lè)橙小樂(lè)機(jī)器人應(yīng)用了環(huán)形“6+1”遠(yuǎn)場(chǎng)麥克風(fēng)陣列,蘿卜科技的小蘿卜機(jī)器人一代應(yīng)用了思必馳的單麥方案,二代機(jī)器人將應(yīng)用環(huán)形“6+1”遠(yuǎn)場(chǎng)麥克風(fēng)陣列。這些產(chǎn)品受到目標(biāo)家庭的歡迎,均屬于市場(chǎng)熱銷的家用服務(wù)型機(jī)器人。
?
出色的市場(chǎng)表現(xiàn)離不開(kāi)思必馳軟硬一體化的解決方案和一直對(duì)人機(jī)交互體驗(yàn)不懈的追求。
?
1、軟硬一體化的解決方案
環(huán)形6+1遠(yuǎn)場(chǎng)麥克風(fēng)陣列是軟硬一體化的解決方案,主要針對(duì)機(jī)器人和智能家居中需求全角度拾音的硬件產(chǎn)品,其中6個(gè)麥克風(fēng)呈360°排列,準(zhǔn)確定位聲源,誤差控制在±10°以內(nèi);1個(gè)麥克風(fēng)置于中間;自主研發(fā)降噪及回聲消除技術(shù),可實(shí)現(xiàn)回聲消除(AEC)、聲源定位(DOA)、波束成形(BF)、語(yǔ)音增強(qiáng)(SE)等功能;而且可實(shí)現(xiàn)業(yè)界領(lǐng)先的5米遠(yuǎn)場(chǎng)交互,5米92%,3米94%,1米96%。
?
環(huán)麥方案的應(yīng)用意義重大,還表現(xiàn)在它相對(duì)單麥、雙麥、線性麥克風(fēng)陣列,它打破了原有麥克風(fēng)拾音角度及交互距離的局限。一方面,實(shí)現(xiàn)全角度拾音,能更好的滿足機(jī)器人及音箱類、中控類等需要全角度拾音的智能硬件的需求,進(jìn)行精準(zhǔn)生源定位;另一方面,麥克風(fēng)陣列在前端充分利用其空域?yàn)V波特性,抑制拾音波束外的回聲、混響等噪聲,進(jìn)行語(yǔ)音增強(qiáng)處理,輔之以語(yǔ)音識(shí)別引擎的二次處理,實(shí)現(xiàn)優(yōu)質(zhì)的遠(yuǎn)場(chǎng)識(shí)別交互。
?
機(jī)器人事業(yè)部商務(wù)總監(jiān)王巍特別提到,風(fēng)靡國(guó)際的大家已熟知的亞馬遜Echo音箱,她表示:“這一市場(chǎng)典范級(jí)產(chǎn)品應(yīng)用的也是環(huán)形麥克風(fēng)陣列,與思必馳環(huán)麥6+1麥克風(fēng)陣列方案有異曲同工之妙?!?br /> ?
2、交互始終是思必馳語(yǔ)音技術(shù)的重點(diǎn)之一。
與同行相比,思必馳是國(guó)內(nèi)首先強(qiáng)調(diào)機(jī)器學(xué)習(xí)“認(rèn)知智能”的語(yǔ)音企業(yè),強(qiáng)調(diào) “基于多輪對(duì)話的認(rèn)知型對(duì)話系統(tǒng)”對(duì)智能硬件的核心作用。
?
思必馳認(rèn)為,智能硬件中的人機(jī)口語(yǔ)交互的核心問(wèn)題是:感知智能中的抗噪、遠(yuǎn)場(chǎng)識(shí)別和回聲消除,以及強(qiáng)大的認(rèn)知智能。從而增強(qiáng)語(yǔ)音方案的意圖追蹤及決策功能,為用戶提供更人性化的交互方案。
?
如何應(yīng)對(duì)語(yǔ)音交互體驗(yàn)存在的問(wèn)題
?
機(jī)器人事業(yè)部商務(wù)總監(jiān)王巍認(rèn)為,盡管機(jī)器人市場(chǎng)的確十分火爆,同時(shí)智能語(yǔ)音作為交互方式的必備手段也備受期待,但是目前市場(chǎng)機(jī)器人交互體驗(yàn)存在兩個(gè)非常明顯的問(wèn)題:一是交互刻板,無(wú)法判斷用戶意圖,缺乏認(rèn)知智能;二是后端資源欠缺,無(wú)法滿足用戶需求。
?
針對(duì)上述問(wèn)題,思必馳是這樣做的:
?
一方面,思必馳的語(yǔ)音解決方案更側(cè)重于垂直場(chǎng)景下的語(yǔ)音交互,注重認(rèn)知智能,追蹤用戶的真正說(shuō)話意圖,并反饋更精準(zhǔn)有效的資源,增強(qiáng)交互。
?
另一方面,思必馳不斷擴(kuò)充后端資源,在社交、導(dǎo)航、音樂(lè)、天氣查詢、O2O、生活資訊、金融股票等各個(gè)領(lǐng)域擴(kuò)充資源,滿足用戶更多需求。
?
堅(jiān)持To B的商業(yè)模式,專注智能語(yǔ)音研發(fā)
?
這些年來(lái),人機(jī)交互手段不斷發(fā)生著變化,鍵盤、鼠標(biāo)、觸控到現(xiàn)在的語(yǔ)音交互,人工智能的不斷發(fā)展必然會(huì)引起交互手段的不斷變革,智能語(yǔ)音必然會(huì)成為每個(gè)領(lǐng)域場(chǎng)景交互的標(biāo)配。
?
王巍認(rèn)為,目前智能語(yǔ)音在車聯(lián)網(wǎng)領(lǐng)域的應(yīng)用較為領(lǐng)先與成熟,在物聯(lián)網(wǎng)領(lǐng)域的應(yīng)用緊隨其后,整個(gè)智能硬件領(lǐng)域?qū)χ悄苷Z(yǔ)音的需求更為強(qiáng)烈。她表示:“未來(lái)智能語(yǔ)音技術(shù),必將從當(dāng)前的感知智能走向認(rèn)知智能,進(jìn)行自我思考,最終形成決策控制?!?br /> ?
思必馳目前針對(duì)智能車載、智能家居、智能機(jī)器人三個(gè)垂直領(lǐng)域提供智能語(yǔ)音交互方案。除提供語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音識(shí)別++、語(yǔ)義理解、交互對(duì)話等核心軟件技術(shù)之外,思必馳也提供整套的解決方案,如針對(duì)智能車載領(lǐng)域推出了AIOS對(duì)話操作系統(tǒng),針對(duì)機(jī)器人及智能家居領(lǐng)域的環(huán)形6+1遠(yuǎn)場(chǎng)麥克風(fēng)陣列軟硬一體化方案等。
?
未來(lái)思必馳將一直專注在智能語(yǔ)音的認(rèn)知智能,讓語(yǔ)音交互更加人性化。它也將會(huì)依托思必馳上海交大聯(lián)合實(shí)驗(yàn)室,持續(xù)在智能語(yǔ)音的研發(fā)與應(yīng)用領(lǐng)域發(fā)力,堅(jiān)持To B的商業(yè)模式。據(jù)王巍透露,針對(duì)機(jī)器人領(lǐng)域,思必馳將在近期推出針對(duì)智能機(jī)器人領(lǐng)域的AIOS FOR ROBOT對(duì)話操作系統(tǒng),通過(guò)對(duì)上層領(lǐng)域制定的抽象接口,可極大縮短開(kāi)發(fā)者的時(shí)間,提高開(kāi)發(fā)者的效率,降低開(kāi)發(fā)者后期維護(hù)成本。
?
思必馳也將依托穩(wěn)健的研發(fā)技術(shù),不斷擴(kuò)展在機(jī)器人領(lǐng)域的業(yè)務(wù)范圍,我們拭目以待。
評(píng)論
查看更多