人能與機(jī)器人交互,已經(jīng)不是什么新鮮事了,那么通人性的狗子是不是也能與機(jī)器人交互呢?
就這個(gè)問題,耶魯大學(xué)社交機(jī)器人實(shí)驗(yàn)室的研究人員進(jìn)行了一項(xiàng)「狗機(jī)交互」的研究,發(fā)現(xiàn)寵物狗真的會(huì)聽從社交機(jī)器人發(fā)出的命令!
這一研究由耶魯大學(xué)在讀博士生 Meiying Qin 等人展開,研究成果在 2020 年 3 月底的 ACM/IEEE 國際人機(jī)交互會(huì)議(HRI 2020)上公布,相關(guān)論文以 Dog Sit! Domestic Dogs [Canis familiaris] Follow a Robot‘s Sit Commands(坐下!寵物狗聽從機(jī)器人的“坐下”命令)為題發(fā)表于 SCI 期刊 IEEE Spectrum。
如何做到有效的「狗機(jī)交互」
雷鋒網(wǎng)從 IEEE Spectrum 官網(wǎng)了解到,這類「狗機(jī)交互」的研究已有先例:
一組研究人員(Pongrácz 領(lǐng)銜)測試狗是否能在不同條件下聽從主人的命令——主人與狗在同一個(gè)房間內(nèi)(3D 情況),或主人經(jīng)由流媒體視頻與狗實(shí)時(shí)交互(2D 情況),或僅僅通過主人從揚(yáng)聲器傳出的聲音與狗交互(0D 情況)。結(jié)果不難想象,狗在 3D 情況下最能聽從命令,0D 情況下最不能聽從命令,2D 的情況介于前述二者之間。
另一組研究人員(Lakatos 領(lǐng)銜)測試狗是如何對擁有定制手臂的 PeopleBot 經(jīng)濟(jì)型人機(jī)交互機(jī)器人給出的指示做出反應(yīng)的。具體來講,首先在互動(dòng)階段,機(jī)器人與主人進(jìn)行 6 分鐘的交互,狗在一旁觀察,然后機(jī)器人給狗食物作為獎(jiǎng)勵(lì);隨后是測試階段,面對著兩個(gè)裝有隱藏食物獎(jiǎng)勵(lì)的桶,機(jī)器人對著狗指向了其中的一個(gè)桶。研究發(fā)現(xiàn),狗在有機(jī)器人的情況下會(huì)比沒有機(jī)器人的情況表現(xiàn)得更好。然而這項(xiàng)研究也反映出了一些問題:機(jī)器人并非能顯著影響狗的行為,狗并非任何時(shí)候都很聽機(jī)器人的話,人類能比機(jī)器人更好的影響狗的行為。
在這些研究的基礎(chǔ)之上,耶魯大學(xué)社交機(jī)器人實(shí)驗(yàn)室的研究團(tuán)隊(duì)便明確了其研究的目的,他們希望能探索狗是否能很好地理解人類的社會(huì)行為——在它們眼中,機(jī)器人更像是它們所服從的人類,還是它們所不服從的揚(yáng)聲器。
雷鋒網(wǎng)了解到,該研究團(tuán)隊(duì)設(shè)計(jì)的實(shí)驗(yàn)分別調(diào)查狗是否會(huì)在社交機(jī)器人叫了他們的名字后做出響應(yīng)、狗是否會(huì)聽從機(jī)器人給出的“sit”(坐下)命令。
34 只寵物狗(17 只為實(shí)驗(yàn)組、17 只為對照組)參與了實(shí)驗(yàn),在實(shí)驗(yàn)的房間里,有研究人員、狗主人、機(jī)器人、揚(yáng)聲器,以及寵物狗。
下圖為攝像機(jī)在不同視角下拍攝到的實(shí)驗(yàn)/對照組的實(shí)驗(yàn)情況。
如下圖,每個(gè)狗狗經(jīng)歷的實(shí)驗(yàn)流程大致是:在對測試環(huán)境做了簡短的介紹后,機(jī)器人或揚(yáng)聲器叫出了狗的名字(聲音完全一樣),此時(shí)研究人員便在一旁觀察狗是否有所反應(yīng)。然后,機(jī)器人或揚(yáng)聲器將與狗主人開始交談一會(huì)兒,試圖在寵物狗面前提升存在感,隨后為寵物狗提供一些小獎(jiǎng)勵(lì),最后發(fā)出一聲“坐下”的命令,研究人員也會(huì)密切觀察狗狗此時(shí)是否會(huì)聽話地坐下。
研究表明,在被叫了名字后,狗更多時(shí)候盯著機(jī)器人看,而不是擴(kuò)音器;在聽到“坐下”指令時(shí),相比揚(yáng)聲器(不足 20%),狗狗聽從機(jī)器人(約 60%)指令的次數(shù)更多。
從下圖就能看出,不論是寵物狗對眼前發(fā)號施令者的觀察時(shí)間還是聽從指令的次數(shù),機(jī)器人的效果都明顯優(yōu)于揚(yáng)聲器。
機(jī)器人還是機(jī)器狗?
值得一提的是,實(shí)驗(yàn)中用到的機(jī)器人,正是軟銀集團(tuán)的機(jī)器人 NAO。NAO 是一個(gè)小型人形機(jī)器人,專門用于與人進(jìn)行交互,可以走路、跳舞、說話、識別人臉和物體,目前已經(jīng)發(fā)展到了第六代,被用于全球范圍內(nèi)的研究、教育和醫(yī)療。
此次實(shí)驗(yàn)中,NAO 發(fā)出的所有聲音都來自位于其頭部的揚(yáng)聲器。為避免任何可能存在的誤差,NAO 傳出的聲音都是經(jīng)過剪輯的人聲音頻,并非是內(nèi)置的文本轉(zhuǎn)語音(TTS)模塊。
這背后的原因具體來說有兩點(diǎn):
一些主人會(huì)按自己的喜好給寵物起一些偏門的名字,TTS 無法保證可以正確地念出來。
狗比人對聲音更敏感,即使一些對人類來說已經(jīng)算是自然的 TTS 也可能缺少狗所依賴的聲學(xué)特征,且大多數(shù) TTS 能提供的音調(diào)也是有限的,狗可能無法理解 TTS 的一些表達(dá)。
而對于這項(xiàng)實(shí)驗(yàn),有些人可能會(huì)問:給寵物狗做實(shí)驗(yàn),為什么要用機(jī)器人,而不是機(jī)器狗?
對機(jī)器人領(lǐng)域有一定了解的人可能聽說過索尼的 AIBO 機(jī)器狗。
據(jù)悉,AIBO 最早于 1999 年推出,但在 2006 年遭遇停產(chǎn)。時(shí)隔 12 年后,索尼再次進(jìn)入家用機(jī)器人行業(yè),于 2018 年春季推出新版 AIBO。
相比以前的版本,2018 年推出的機(jī)器狗動(dòng)作更流暢自然,配備了魚眼攝像頭,可與傳感器一起探測、分析聲音和圖像。另外,同步定位和映射技術(shù)使其能夠適應(yīng)環(huán)境,而控制這一切的是一個(gè) 64 位的四核 CPU,其功耗為 14 瓦,續(xù)航時(shí)間約 2 小時(shí)。
不過研究人員并未將 AIBO 作為參與實(shí)驗(yàn)的機(jī)器人,原因就在于 AIBO 往往不會(huì)被寵物狗視為競爭對手,也不會(huì)像對待其他狗一樣對待 AIBO。在汪星人的世界里,AIBO 連“一只奇怪的狗”都算不上,只是“一個(gè)鬼東西”。
對于這項(xiàng)研究,研究團(tuán)隊(duì)表示,其貢獻(xiàn)在于首次發(fā)現(xiàn)了狗對社交機(jī)器人會(huì)表現(xiàn)出積極的行為,同時(shí)社交機(jī)器人也可以影響狗的行為。因此,這一研究加深了我們對人與社交機(jī)器人交互的本質(zhì)的理解。
但擺在研究人員面前的一個(gè)更深入的問題是,盡快確定可能會(huì)增加或減少寵物狗與機(jī)器人交互可能性的具體因素,因此他們也在嘗試一些更為理想的場景。例如,通過狗主人與機(jī)器人更多的互動(dòng)(交談、眼神交流等)鼓勵(lì)狗對機(jī)器人消除焦慮、建立好感,以便提升狗對機(jī)器人的注意力。
責(zé)任編輯:pj
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28632瀏覽量
208104 -
實(shí)驗(yàn)
+關(guān)注
關(guān)注
0文章
121瀏覽量
23020
發(fā)布評論請先 登錄
相關(guān)推薦
評論