2018世界機器人大會擬于8月15日至19日在北京亦創國際會展中心舉行。大會以“共創智慧新動能 共享開放新時代”為主題,由“論壇”、“博覽會”、“大賽”、“地面無人系統展示活動”四大版塊構成。 本屆大賽匯聚了來自美國、俄羅斯、德國、日本、以色列等全球近20個國家和地區的1萬余支賽隊和數百名頂尖專家,共計超過5萬多名參賽選手同臺競技。
IEEE RAS主席、德國弗萊堡大學教授 Wolfram Burgard 進行主題演講“基于深度學習的智能機器人導航和感知”。
以下是演講全文:
大家下午好!今天想為大家講一講機器人行業的一些變化以及機器人行業的未來,重點會放在智能機器人導航和感知相關的內容,包括行業未來的趨勢。
這是一個希臘神話故事,希斯夫是希臘神話當中著名的神,他相信他比宙斯還要聰明,所以他在肩上扛了一塊巨石,每當搬起這塊巨石快走到山頂的時候就會滾下山去,一直想把這塊巨石搬到山頂,但卻永遠無法到達山頂,每次都要重新再來。這其實就是我們在科學當中要經歷的過程,每當要解決一個問題的時候就會發現這個問題無法完全解決,需要重新尋找路徑解決。每當找到新的方法但發現還是不能解決全部問題的時候,又要再一次重新尋找路徑。似乎每次我們都好像即將抵達山頂,但最后還要從山腳重新走上去,畢竟在解決問題的過程中總會遇到全新的問題。
機器人導航可以分為三個部分,包括定位、建圖以及運動控制。當然,這三個部分當中也有一些重疊,比如同時定位和主動定位,或者是位置探索,這是三者的結合點。這些領域當中我們所取得的進展,這里做了一個大概的評級,其中星號數量表明我們在不同的基礎上取得了多少進展。
這是一部自動駕駛的汽車,使用的是雷達掃描儀,有了這種掃描儀就可以知道周邊發生了什么情況。這種技術對自動駕駛來說是非常重要的,只有有了自動掃描才能實現自動駕駛,所以也是自動導航能夠發揮作用的重要領域。
很多制造流程用的都是自動化技術,但如果能夠實現自動化生產,效率就會非常高了,但靈活度會比較低。被中國公司收購的庫卡公司也解決了一部分這樣的問題,即讓機器人實現更加靈活的生產過程,有了這種技術就可以打造一些非常棒的東西,比如高精度定位等等。
這種定位的方式叫做蒙特卡洛,也就是在一個全局當中來做細致的定位。當然,首先是要做繪圖,然后再做測量。通常可以做到非常準確,比如這樣一個小的移動機器人就能夠實現非常精準的定位。當然,可以把它用到工廠當中,比如庫卡就可以將它和一些重型的卡車結合使用。重卡可能是高重量的,可以做這種非常小而輕的物體運送。工廠當中可能會用到這種小型機器人,也可以用于其它領域,比如用它運送一些非常大型的物體,甚至波音777客機,所以這種精準導航的技術都有很高的要求。
我們在導航領域也取得了一些進展,比如高精度定位,很多公司都在使用這種技術實現一定的智能化,當然,還需要繪制精度非常高的地圖。而在過去的十五到二十年當中這種繪圖的技術也在不斷發展,現在已經有了比較強大的繪圖技術。這是用機器人繪制的圖,甚至可以看到機器人行走的軌跡,使用的也是激光掃描儀來掃描這樣的路徑,可以通過不斷的移動繪制出當地的地圖。
我們可以在各種應用環境當中繪制非常高精準的地圖,有些可以直接在手機上繪制,甚至畫出3D圖,比如這是弗萊堡大學的3D圖,可以看到中間可能有個長方形的建筑。當然,如果應用在自動駕駛汽車當中就可以為之制作更為復雜的地圖,比如知道停車場在哪里,加上定位的技術也就能夠實現車輛的自主泊車而不需要人工。幾年前就在某些地方做過這種實驗,實際上這些應用已經在斯坦福的無人駕駛汽車實驗當中測試過了,可以在自己的停車場當中自動停車。雖然我們還沒有完全解決繪圖領域的全部問題,但現在已經有非常高智能的停車系統了。
目前我們在導航技術方面還面臨著一些關鍵性的挑戰,從長期的角度來說,解決了高精度定位、高魯棒性的建圖等問題,但從長期自主決策的角度我們怎么實現這種目標呢?這個世界不是靜態的,有著很多的環境是我們預測不到的,這些車輛怎么應對這樣的問題呢?比如在城市當中的自動駕駛,我們能否使機器人在城市當中實現自動駕駛?在人口眾多的城市中心機器人如何自我導航,機器人若能有這樣的自我導航功能,就可以完成快遞比薩等工作。
這里我們看到的是在弗萊堡城市中心的小機器人,它在城市中心到處移動,機器人需要防止掉到運河當中。
另外一個挑戰就是人,特別是孩子,孩子特別喜歡和機器人玩耍,有的時候我們在弗萊堡的城市中心去做實驗的時候孩子們會抓住機器人跟它玩,可以看到孩子們站在機器人的前面,機器人想轉個向,孩子卻把它擋住了,看起來機器人沒有辦法到達它的目標地點了,所以我們要解決的問題是給這些孩子買些冰淇淋,他們就把機器人放掉了,這是我們在城市中心經常會遇到的問題。
我們還做了一個自動導航實驗,是在弗萊堡奧伯利路上面,機器人的自我導航沒有出現任何問題,可以看到這條路徑也是它自我決定的。這個視頻是讓我們看到機器人怎么在城市中心自我導航,大概花了兩個半小時到達了城市中心的目標地點,獨立繞過了很多的障礙。這也就意味著機器人是有可能實現長期自主決策,幾天甚至幾周連續自我決策。但仍然還有一些缺少的地方,例如在自我駕駛車輛的方面,有的時候速度非常的快,而且有很多的情況是預測不到的,所以在這種情況下真的很難實現完全的自動駕駛。
現在的問題是,我們怎樣建造一個基于技術的自我駕駛汽車,我們應該做些什么,需要開發什么其它的技術,下一步怎么走,今后這項技術應該怎樣發展以便于我們有機器人自動駕駛車輛,所以從我的角度來說,最關鍵的解決方案在今后幾年都是機器學習。這其實也是我在一開始提到的,當你到了山頂的時候石頭又會滾下來,然后出現了一些新的現象,又得重新往前走,這其實是目前我們在做的一件事情,也就是大量地依賴于機器學習。
舉個例子,什么學習的方式對這種情況是有用的呢?比如學習駕駛的風格,要在帕利托或者加利福尼亞開車的方法和在北京是完全不一樣的,或者在新德里、提爾瓦這些世界上交通狀況最復雜的區域開車也是不一樣的,機器人在這樣的環境當中要讓汽車能夠適應當地的環境和導航情況,用戶也有不同的期望??紤]到我自己父母的情況,他們可能更喜歡在車里慢慢地開,我開的會比他們快很多,所以我們駕駛的風格不一樣,很多的參數是需要調整的,需要使其效率更高。我們可能不能100%地解決這些問題,需要通過工程和設計的方式改進它。如果我們采用了自動駕駛技術的話,每輛自動駕駛的汽車都必須適應每個用戶的期待和需求。
除此之外,我們還需要有高級互動的功能,這樣的功能也是現在我們正在致力于開發的。我們企圖實現人和汽車之間的互動,希望能夠監測用戶在使用過程當中的一些錯誤,如果出現錯誤的話需要機器來糾正,所以如果有一個用戶和機器之間互動的界面可以實現互動,也可以實現在駕駛期間實時的調整和糾偏,自動駕駛系統可能做緊急剎車的行動。再就是需要在線預測用戶的偏好,我們有機器人可以幫助去組織和整理貨架,機器人可以輔助日常生活,比如清理廚房,或者把早餐的碗碟拿到洗碗機里面。
機器人如何知道什么東西應該放在貨架的什么地方呢?一個解決方案就是從用戶那里學習,我們可以看到這張圖片,如果把貨架上面的一個東西改變位置的話,機器人會把其它的東西換到其它的地點,所以我們采取多元方式,需要有足夠的信息輸入機器,然后機器才知道把什么東西放在什么位置,用戶也會有自己不同的偏好。因此,組織貨架的時候你是有自己的習慣,決定把某個東西放在某個貨架上面,機器人就會適應每個用戶的偏好和需求。
另一個我們經常會遇到的問題就是深度學習,給大家舉幾個例子,都是我們在研究過程當中遇到的一些問題,深度學習可以幫助機器人的感知,并且提升現有的技術。這里給大家看的一些例子是物體的監測、人體部位的檢測以及導航,通過深度學習來實現這幾點。
首先是用于物體監測的深度卷積神經網絡,我們是融合自動學習,結合兩個網絡的特征輸出。訓練的過程當中第一層網絡的參數保持固定,這是學習的結果,實現了類別的識別,已經有幾年的歷史了,現在有更好的方法來實現物體的識別,只是想告訴大家在當時通過使用深度卷積神經網絡我們實現了最新的識別技術。
基于圖像的人體部位檢測的深度學習,我們可以看到孩子在機器人面前移動,可能阻礙住了機器人,機器人要識別出這是人還是自行車,所以這就需要對人體部位進行檢測識別,這方面我們做了很多的工作,采用的是全卷積的神經網絡。這是我的一個學生,她躺在一堆木頭當中,機器人要識別人體部分,這在搜救的過程當中非常管用。再就是在線的數據,比如剛才提到的奧伯利路的機器人實驗,體現的是對奧伯利路數據的應用。
這是深度學習用于基于聲音的地面分類,通過輪胎和地面產生的聲音來識別地面,利用的也是卷積神經網絡的技術。我們用一個麥克風把聲音記錄下來,然后由機器人來識別不同的地面。如果你們冬天開過車的話都知道這種聲音和平常是不一樣的,因為在雪地上開車和在平地上開車的聲音肯定不一樣,所以我們的功能可以自動識別在駕駛的地面,可以自動調整你的駕駛模式。我們所看到的有各種各樣的地面,瀝青的、木頭的、地板的、草地的等等,甚至還有雜草叢生,沒有修公路的地面,通過機器人可以準確識別地面的狀況來調整駕駛模式。
這些是我們所做的實驗結果,和最新的聲音識別技術相結合,實現了在500毫秒的窗口上取得了99.41%的準確率,相比于之前的技術水平有16.9%的提升。大家可以看看這個網站,評估一下自己的性能,如果大家去實驗其實也是蠻不錯的,我們已經對它進行了足夠的訓練,并且達到了足夠高的水平。我們也將它用于室外的自動駕駛,也就是通過地面識別的技術助力室外的自動駕駛。導航的過程當中也是基于深度卷積神經網絡的路面分類,這個圖像當中我們可以看到一種地面,通過深度卷積神經網絡結構作出的路面分類,運動分割會把一個移動的車和停止的車分開,比如綠色表示移動的,藍色表示停止的,紅色是指距離很遠的車,甚至可以判斷如果這輛車停下來的話會從綠色變成藍色,網絡會根據顏色的變化作出決策。
最后一個問題就是我們能不能實現端到端的自動導航,可以把自動導航考慮為一個分類的現象,其實我們也可以把它看作一個迷宮。如果有這樣一個迷宮的話,你只能上下左右移動,綠色是目標點,也就是機器人應該去的地方。你所做的需要一些算法計算它的最優路徑,也就是端到端的自動導航,如果能夠訓練一個網絡來做這些決策的話效果會更好,最后得到的就是基于最近的觀察。可以看到左上角這個藍色的點,其實這是機器人可以看到的,因為這是一個飛行機器人,可以看到周圍的空間情況。這樣的圖像序列當中可以判斷下一個需要進行的行動是什么,比如有地面的識別,這些都作為輸入。
這是計算出來的一個最佳途徑,旁邊是網絡產生的結果。需要提到的是,網絡對路徑的規劃并不了解,只是知道整體的環境,只是對歷史進行積累和回顧,就是從一些錯誤當中吸取經驗和積累數據,可以捕捉不同位置的信息。觀察當中我們發現其實我們并不需要路徑規劃這樣復雜的算法就能夠實現導航,通過把這些數據轉換成激光圖數據。
現在的問題在于,我們要想定位的話首先要對當地的環境建圖,現在的問題是機器人在一個新的環境當中能否自己建圖呢?回答是肯定的,我們其實是可以做到的,甚至可以把我們在一個環境當中獲得的信息遷移到其他環境當中,只要這些環境是類似的。比如超市環境,歐洲超市的結構都是很類似的,所以要去找牙刷的話肯定不會是在超市的入口,因為超市的入口一般都是水果,這樣的環境當中可以實現更好的導航,機器人的導航背后其實就是數學的算法。
這張圖當中紅線其實是最優化的路線,也就是A點到B點最好的做法,藍線就是從最開始學習一直到最后形成最好路線的過程,綠線是在監督下學習的結果,也就是基于一些規則進行訓練的過程,基于規則試圖讓它盡快學習到最優化的訓練方式。這就相當于在之前環境當中學到的經驗拷貝到另一個環境當中進行監督式的學習,機器人實際上可以將在一個環境當中學到的經驗應用到另外一個環境當中。
這是一個實際的例子,可以看到機器人在之前學習環境的基礎上做出一些變化以后進行導航,更換了地圖的情況下還可以正常運轉,能夠繞過障礙到達預定的地點。機器人花一點點精力就可以在另外一個環境下運行,這從科學的角度來說是非常有意思的話題,意味著如果用相應的網絡,這個網絡當中不用非常復雜的計算就可以實現同樣的功能,也就是說我們可以用技術減少很多的工程工作量,未來我們甚至可以將一個解決方案應用到更多類似的問題上面。
有些人可能讀過這本書,里面講了很多數學的問題,比如有了一個端到端的解決方案以后是否能夠應用到其它領域當中。有些時候可能有了一個解決方案以后,其它的就不用再做重復的開發了,至于未來真正會走向何方還是值得大家去討論的,我們也不是百分之百確定這樣的未來會真正發生。
-
機器人
+關注
關注
211文章
28618瀏覽量
207927 -
自動駕駛
+關注
關注
784文章
13918瀏覽量
166789 -
深度學習
+關注
關注
73文章
5511瀏覽量
121392
原文標題:Wolfram教授:如何讓機器人在城市中實現自動駕駛?
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論