機(jī)器人是一種顛覆現(xiàn)實(shí)世界的創(chuàng)新,但在它們特定的領(lǐng)域之外,它們的用處是非常有限的。因此,靈活性是一個(gè)不斷研究的領(lǐng)域。三款新的機(jī)器人裝置展示了它們可以進(jìn)化到適應(yīng)新情況的方式:摔倒后可以借助兩只“手”站起來,以及理解他們從未見過的視覺指令。
這些機(jī)器人都是獨(dú)立研發(fā)的,今天將在《科學(xué)機(jī)器人》(Science Robotics)專門研究學(xué)習(xí)的專刊上發(fā)表。每一款機(jī)器人都傳達(dá)出:機(jī)器人可以改善他們與現(xiàn)實(shí)世界的互動(dòng)。
能夠用“手”敏捷抓取物體的機(jī)器人
首先是在工作中使用正確工具的問題。由于人類的手指的靈活性以及多功能性,我們可以很容易完成這個(gè)任務(wù)。我們能夠從我們的生活經(jīng)驗(yàn)中理解我們需要用鉗子夾起這個(gè)輕的物體或者我們需要借助工具才能搬動(dòng)這個(gè)重物等等。
當(dāng)然,機(jī)器人沒有這方面的固有知識(shí),這會(huì)讓事情變得困難;它可能不理解它無法拾起某種給定大小、形狀或紋理的東西。伯克利的機(jī)器人專家開發(fā)了一種新系統(tǒng),它可以作為一種基本的決策過程,將物體分為能用普通鉗子夾住或用吸盤夾住的兩類。
一個(gè)在手臂末端同時(shí)安裝這兩種工具的機(jī)器人,可以通過使用基于深度的圖像來決定抓取什么物品應(yīng)該使用什么工具;測(cè)試結(jié)果表明,即使是在成堆的物體,其可靠性也非常高,這是以前從未見過的。
它是通過神經(jīng)網(wǎng)絡(luò)來完成的,這個(gè)神經(jīng)網(wǎng)絡(luò)部署了數(shù)百萬個(gè)關(guān)于物品、安排和試圖獲取它們的數(shù)據(jù)點(diǎn)。如果你想用吸盤抱起一只泰迪熊,但前一萬次都失敗了,你還會(huì)繼續(xù)嘗試嗎?這個(gè)系統(tǒng)能夠?qū)W會(huì)了做出此類的決定,這樣的事情對(duì)于在倉庫完成挑選任務(wù)的機(jī)器人來說是非常重要的。
有趣的是,伯克利的Ken Goldberg在一封電子郵件中解釋道,由于復(fù)雜神經(jīng)網(wǎng)絡(luò)的“黑盒”性質(zhì),很難確切地說出Dex-Net 4.0的選擇實(shí)際上是基于什么,盡管有一些明顯的偏好。神經(jīng)網(wǎng)絡(luò)的“黑箱子”是指:一般來說, 神經(jīng)網(wǎng)絡(luò)是一連串神經(jīng)層所組成的把輸入進(jìn)行加工再輸出的系統(tǒng)。中間的加工過程就是我們所謂的黑盒。
他寫道:“我們從經(jīng)驗(yàn)上發(fā)現(xiàn),,遠(yuǎn)離邊緣的光滑平面通常在吸力模型中得分較高,而對(duì)映點(diǎn)在抓取模型中得分較高。”
現(xiàn)在可靠性和通用性都很高了,下一步是速度;Goldberg說,該團(tuán)隊(duì)正在“研究一種令人興奮的新方法”來減少網(wǎng)絡(luò)的計(jì)算時(shí)間,毫無疑問,這將在未來的論文中被敘述。
摔倒后能夠站起來的機(jī)器人
四肢行走的機(jī)器人已經(jīng)很靈活了,它們能自信地處理各種地形。但是當(dāng)他們摔倒的時(shí)候,基本就是災(zāi)難區(qū)。一般來說,他們靠自己是沒法重新站起來的。
這些機(jī)器人的腿的配置方式使得它們很難完成在直立方式下能做到的事情。不過,由蘇黎世聯(lián)邦理工學(xué)院(ETH Zurich)開發(fā)的機(jī)器人ANYmal配備一個(gè)更多功能的裝置,可以讓它的腿獲得額外的自由度。
這個(gè)額外的自由度有什么用?可以做各種事情。但是要找出機(jī)器人運(yùn)動(dòng)的最佳方式來達(dá)到速度和穩(wěn)定性的最大化是非常困難的。那么,為什么不使用模擬來同時(shí)測(cè)試數(shù)千個(gè)奇跡人可能遇到的不同場(chǎng)景,并將其結(jié)果用于現(xiàn)實(shí)世界呢?
這種基于模擬的學(xué)習(xí)并不總是有效,因?yàn)楝F(xiàn)在還不可能準(zhǔn)確地模擬所有涉及到的物理現(xiàn)象。但是它可以產(chǎn)生非常新穎的行為,或者簡(jiǎn)化人類認(rèn)為已經(jīng)是最優(yōu)的行為。
無論如何,蘇黎世聯(lián)邦理工學(xué)院的研究人員的新研究不能僅讓機(jī)器人跑得更快,還教會(huì)了它一個(gè)驚人的新技巧:從跌倒中爬起來。不管怎么跌倒都能爬起來。聽起來很優(yōu)秀吧!
令人驚奇的是,這個(gè)機(jī)器人發(fā)明了一種基本的技術(shù),可以從幾乎任何可能的摔倒中站起來。記住,這不是人們?cè)O(shè)計(jì)出來的——是模擬和進(jìn)化算法通過反復(fù)嘗試數(shù)千種不同的行為,并保持那些有效的行為而得到的。
能夠讀懂抽象指令并與現(xiàn)實(shí)世界連接起來的機(jī)器人
假設(shè)給你三個(gè)碗,中間那個(gè)碗里有紅球和綠球。然后給你一張紙:
人類具有大腦,你根據(jù)這張紙上的指示,你就會(huì)明白綠色和紅色的圓圈代表著這些顏色的球,紅色的要往左,綠色的要往右。
這是一種人類應(yīng)用大量知識(shí)和直覺理解卻沒有意識(shí)到的事情。你是怎么決定用圓圈來代表這些球的?因?yàn)樾螤睿磕敲礊槭裁醇^不指向“真正的”箭頭呢?你怎么知道向右或向左走多遠(yuǎn)?你怎么知道這張紙上的內(nèi)容就是告訴你某種規(guī)則?你可以在瞬間解決所有的問題,但任何一個(gè)問題都可能難倒機(jī)器人。
研究人員已經(jīng)邁出了一小步,他們希望能夠?qū)⑸鲜龀橄蟮谋硐笈c現(xiàn)實(shí)世界聯(lián)系起來,而這一任務(wù)涉及到大量的機(jī)器創(chuàng)造力或想象力。
在圖中的白色背景上的綠點(diǎn)與現(xiàn)實(shí)世界中黑色背景上的綠色圓形物之間建立連接并不明顯,但由Miguel Lázaro-Gredilla和他的同事在Vicarious AI創(chuàng)造的“視覺認(rèn)知計(jì)算機(jī)”似乎表現(xiàn)的就很不錯(cuò)。
當(dāng)然,它現(xiàn)在還非常不完善,但在理論上,它是人們用來組裝一件宜家家具的相同工具集:查看一個(gè)抽象的表示,將它與現(xiàn)實(shí)世界的對(duì)象連接起來,然后根據(jù)指令操作這些對(duì)象。我們離這個(gè)目標(biāo)還有好幾年的時(shí)間,但就在不久前,我們離機(jī)器人自己從跌倒中爬起來,或者決定用吸盤或鉗子更好地?fù)炱饢|西還有好幾年的時(shí)間。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28483瀏覽量
207440 -
指令
+關(guān)注
關(guān)注
1文章
608瀏覽量
35750 -
視覺
+關(guān)注
關(guān)注
1文章
147瀏覽量
23981
原文標(biāo)題:三款神作機(jī)器人:用“手”敏捷抓取物體、摔倒后能夠站起來、可讀懂抽象指令
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論