在FAIR和蒙特利爾大學合作的最新研究中,研究人員首次將實驗中將感知、行動和使用自然語言交互達成目標這三個任務結合在一起:讓兩個Bot使用自然語言對話,讓“導游bot”將“游客bot”帶到指定地點,而且導航成功率超越了人類。
Facebook讓兩個Bot自己游紐約,“導游Bot”在模擬的紐約市中導航定位,使用自然語言跟“游客Bot”交流,成功率超過了88%!
這已經顯著超越某些“路癡”人類,而且,兩個Bot還是使用自然語言在交流。
兩個Bot使用自然語言交流導航定位
在今天最新上傳到arxiv的一篇研究論文中,Facebook人工智能實驗室(FAIR)與蒙特利爾大學合作,研究人工智能系統如何定位,并比人類更好地傳達觀測數據。
研究人員把他們的實驗成為“Talk the Walk”。在實驗中,他們將游客Bot隨機放到紐約市的一個街角,再讓一個導游Bot將前者引導到2D地圖上的某個位置。導游Bot知道地圖,也知道目標地點,但是不知道游客Bot在哪里;游客Bot擁有360°視角,但不知道地圖,也不清楚目標地點。
游客和導游必須相互溝通,交流彼此所知道的信息,才能實現目標。
想象一下兩個Bot的對話:
導游:你好,你在附近嗎?
游客:你好,在我面前是“布魯克斯兄弟”。
導游:這是家商店還是餐館?
游客:這是一家服裝店。
導游:你往地圖西北角的十字路口走。
游客:我身后似乎有一家銀行。
導游:好的,左轉然后沿著那條路直行。
...
研究人員表示,Talk the Walk是首個將所有三個要素結合在一起的任務:感知(游客Bot觀察世)、行為(游客Bot在環境中導航),以及語言交互達成目標(導游Bot為游客Bot提供引導幫助其實現目標)。
首次將感知、行動和使用自然語言交流達成目標結合在一起
實驗中使用的街景地圖數據,是MTurk眾包手動收集的幾個紐約市街區的360°視圖。這些街景環境被整合到ParlAI中,這是Facebook的一個用于訓練AI的框架,支持很多任務,包含的數據集包括SQuAD,bAbI tasks,MS MARCO,MCTest,WikiQA,WebQuestions等等。
實驗中使用的自然語言數據,也是MTurk的真人對話,用幾周時間收集,包含10k成功的導航對話。平均來說,人類需要超過62次行動(對話和走路)才能順利到達目標地點。大部分行動發生在游客這邊,平均每次對話44次行動。人類導游大約說了9次話(稍微比游客的8次話多一點點)。
雖然研究人員的目標是讓Bot通過自然語言來處理收集到的信息,但他們發現,當Bot使用“合成語言”時,完成任務的效果更好,因為后者更依賴于使用更簡單的符號來傳達信息和位置。這種不那么自然的數據通信方式不僅優于人類的聊天,還能讓Bot比人在自然語言聊天中更簡單快讀地找到自己的道路。
機器比人類更擅長導航定位!
Talk The Walk的實驗環境設置全部來自現實世界,因此尤其困難。讓兩個人用文字描述自己周圍的不熟悉環境已經不容易,何況兩個Bot?
為了解決這個問題,研究人員提出了一個名為MASC(Masked Attention for Spatial Convolution)的機制,讓Bot能快速從語言模型中解析對方回應的關鍵字的內容。Facebook表示,利用該流程可以使正在測試的結果的準確性翻倍。
結果顯示,他們最好的溝通模型(emergent communication model)準確率幾乎達到了70%,要顯著優于從人類話語中得到最好的定位模型(大約20%),這表明人類很不善于定位,因為人類并不總能很好地傳達自己的觀察和行動。
不僅如此,他們最好的定位模型(continuous communication, with MASC, and T = 3)在整個導航任務測試中達到了88.33%的準確率,超過了人類76.74%的表現。
激動人心的新研究方向:用自然語言對話解決現實世界問題
研究人員表示,這是一項基礎性研究,這次實驗只是初步結果,還提出了更多的問題等待解決。
“如果你真的想要解決所有人工智能問題,那么你可能要有解決不同子問題的不同模塊或組件,”Facebook AI研究科學家Douwe Kiela在接受TechCrunch記者采訪時表示:“從這個意義上說,這個問題是一個真正的挑戰。”
他希望有更多的人參與進來與他們共同在這個激動人心的新研究方向上與他們合作。
-
Facebook
+關注
關注
3文章
1429瀏覽量
54754 -
導航定位
+關注
關注
0文章
36瀏覽量
11031 -
自然語言
+關注
關注
1文章
288瀏覽量
13350
原文標題:兩個Bot自創新語言!Facebook機器人紐約自由行導航定位碾壓人類
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論