導(dǎo)讀:Waymo 近期宣布在鳳凰城地區(qū)開(kāi)放沒(méi)有安全員的無(wú)人駕駛出租車(chē),實(shí)現(xiàn)首個(gè)商用的真正的無(wú)人駕駛。與此同時(shí),Waymo 也公開(kāi)分享了一系列新的研究論文,本文就來(lái)講解一下 Waymo 在行為預(yù)測(cè)方面的研究成果。
周?chē)能?chē)輛和行人在接下來(lái)數(shù)秒中會(huì)做什么?要實(shí)現(xiàn)安全的自動(dòng)駕駛,這是一個(gè)必須回答的關(guān)鍵問(wèn)題,這也就是自動(dòng)駕駛領(lǐng)域中的行為預(yù)測(cè)問(wèn)題。
行為預(yù)測(cè)的難點(diǎn)在于周?chē)腥恕④?chē)輛的不確定性和各種規(guī)則之外的行為。這些狀況難以用規(guī)則進(jìn)行總結(jié),因此最近研發(fā)人員們開(kāi)始利用基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)的方法,以達(dá)到更加合理的預(yù)測(cè)效果。
在這方面,來(lái)自 Waymo 和谷歌的團(tuán)隊(duì)提出了一系列用于自動(dòng)駕駛行為預(yù)測(cè)的模型,讓無(wú)人車(chē)?yán)斫獬橄蟮牡缆翻h(huán)境,并實(shí)現(xiàn)對(duì)車(chē)輛、行人的多可能性預(yù)測(cè)。
在今年 6 月的一篇 CVPR 論文中,這個(gè)團(tuán)隊(duì)首先提出了一個(gè)全新模型 VectorNet。
在該模型中,團(tuán)隊(duì)首次提出了一種抽象化認(rèn)識(shí)周?chē)h(huán)境信息的做法:用向量(vector)來(lái)簡(jiǎn)化地表達(dá)地圖信息和移動(dòng)物體,這一做法拋開(kāi)了傳統(tǒng)的用圖片渲染的方式,達(dá)到了降低數(shù)據(jù)量、計(jì)算量的效果。Waymo 也在其博客文章中明確表示,該技術(shù)提高了其行為預(yù)測(cè)的精準(zhǔn)度。
近日,這個(gè)團(tuán)隊(duì)公布了進(jìn)一步的工作,提出了 TNT (Target-driveN Trajectory Predictio)。TNT 是一種目的地引導(dǎo)的軌跡預(yù)測(cè)方法,運(yùn)用了監(jiān)督學(xué)習(xí)的方法對(duì)車(chē)輛和行人進(jìn)行多軌跡回歸,最終的模型能夠輸出多個(gè)未來(lái)軌跡的預(yù)測(cè),同時(shí)明確指出各個(gè)軌跡可能性。
論文中介紹,TNT 在公開(kāi)數(shù)據(jù)集 Argoverse 的測(cè)試表現(xiàn)與冠軍結(jié)果相當(dāng),同時(shí)在 INTERACTION、Stanford Drone,以及 Waymo 內(nèi)部數(shù)據(jù)集中取得了非常好的效果。
目前該論文已經(jīng)被國(guó)際機(jī)器人學(xué)習(xí)會(huì)議 CoRL(Conference on Robot Learning)接收。
預(yù)測(cè)多種可能的未來(lái)情形
Waymo 在博客中指出,VectorNet 突破性地提出了用向量的方式來(lái)抽象化表達(dá)這個(gè)世界,從而感知、理解周?chē)h(huán)境。在理解環(huán)境以后,下一步就是實(shí)現(xiàn)更好的行為預(yù)測(cè)。
自動(dòng)駕駛行為預(yù)測(cè)和其他問(wèn)題不一樣的地方在于,周?chē)能?chē)輛、行人在接下來(lái)數(shù)秒時(shí)間里有多種行進(jìn)的可能性。這些可能性本身也將影響自動(dòng)駕駛車(chē)輛的決策規(guī)劃。
比方說(shuō),如果機(jī)器能算出:前方車(chē)輛有 80% 的概率左轉(zhuǎn)、20% 的概率右轉(zhuǎn),自動(dòng)駕駛車(chē)輛都能根據(jù)這一結(jié)果進(jìn)行更好的決策規(guī)劃。同時(shí)對(duì)機(jī)器來(lái)說(shuō),就算別的車(chē)輛只有 1% 的可能性右轉(zhuǎn),這種可能性也不能被忽視。
而這種針對(duì)多種可能性的多軌跡預(yù)測(cè),有著很大的技術(shù)難度。當(dāng)下的神經(jīng)網(wǎng)絡(luò)難以很好應(yīng)對(duì)多軌跡預(yù)測(cè)的任務(wù)。
據(jù)業(yè)內(nèi)人士介紹,神經(jīng)網(wǎng)絡(luò)擅長(zhǎng)于一對(duì)一和多對(duì)一的擬合問(wèn)題,而非一對(duì)多的問(wèn)題。多對(duì)一如常見(jiàn)的分類(lèi)問(wèn)題,輸入多張車(chē)輛的照片,神經(jīng)網(wǎng)絡(luò)能準(zhǔn)確識(shí)別這些照片為 “車(chē)” 的類(lèi)別。一對(duì)一如常見(jiàn)的回歸問(wèn)題,輸入一張車(chē)輛的照片,神經(jīng)網(wǎng)絡(luò)能估計(jì)它的長(zhǎng)寬高等尺寸。但如果輸入一個(gè)樣本,想讓神經(jīng)網(wǎng)絡(luò)回歸出三個(gè)結(jié)果,這是神經(jīng)網(wǎng)絡(luò)所不擅長(zhǎng)的事情。
據(jù)介紹,現(xiàn)在市面上基礎(chǔ)的方案是基于交通規(guī)則獲得周?chē)?chē)輛、行人的行進(jìn)可能性。如果交規(guī)允許這條道路直行、左右轉(zhuǎn),那么就算三種可能性。但這種方式的預(yù)測(cè)結(jié)果并不完全可靠,因?yàn)橐?guī)則之外的案例并未被考慮其中,如借道,違法掉頭,事實(shí)上,要保障自動(dòng)駕駛長(zhǎng)時(shí)間運(yùn)行下的安全性,應(yīng)對(duì)規(guī)則之外的情形的能力非常重要。
近兩年的論文內(nèi)容顯示,很多團(tuán)隊(duì)正在嘗試使用生成模型來(lái)進(jìn)行多軌跡預(yù)測(cè)。即利用如 GAN,VAE 等模型在隱空間 latent space 進(jìn)行采樣,得到周?chē)繕?biāo)在特定場(chǎng)景下的多種潛在選擇。
但依靠生成模型的問(wèn)題在于,樣本采集存在很大的隨機(jī)性,這對(duì)一個(gè)要求可靠的系統(tǒng)來(lái)說(shuō)是難以接受的。假設(shè)前方來(lái)車(chē)左拐的可能性有 90%,右拐的可能性有 10%,用采樣的方法很有可能我們采樣三次得到的都是左拐,而忽略了它往右拐的可能性。在自動(dòng)駕駛領(lǐng)域,依靠這種方式的行為預(yù)測(cè)難以進(jìn)行實(shí)際應(yīng)用。
用監(jiān)督學(xué)習(xí)實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)
該團(tuán)隊(duì)提出的 TNT 首次運(yùn)用了監(jiān)督學(xué)習(xí)的方法對(duì)車(chē)輛和行人進(jìn)行多軌跡預(yù)測(cè),是一種目的地引導(dǎo)的軌跡預(yù)測(cè)方法。其模型的最大貢獻(xiàn),就是能夠不依靠采樣,純靠監(jiān)督學(xué)習(xí)來(lái)進(jìn)行多軌跡的行為預(yù)測(cè)。
具體來(lái)說(shuō),該模型的行為預(yù)測(cè)按順序分為三步,每一步都有著特定目標(biāo):1、利用地圖的先驗(yàn)信息,離散化并預(yù)測(cè)目的地;2、在預(yù)測(cè)目的地基礎(chǔ)之上,進(jìn)一步預(yù)測(cè)目標(biāo)的運(yùn)行軌跡;3、在預(yù)測(cè)出多條運(yùn)行軌跡當(dāng)中,對(duì)每條軌跡進(jìn)行篩選和打分,預(yù)測(cè)出各個(gè)選擇的可能性,也同時(shí)選擇出可能性最高的幾個(gè)運(yùn)行軌跡。
在技術(shù)層面,運(yùn)用監(jiān)督學(xué)習(xí)的好處在于能夠讓最終的模型給出多個(gè)未來(lái)軌跡的預(yù)測(cè),同時(shí)明確指出各個(gè)軌跡可能性。比如在輸出三個(gè)軌跡的情況下,模型能夠明確指出,30% 可能性左轉(zhuǎn)、30% 可能性右轉(zhuǎn),直行的可能性為 40%。這樣的預(yù)測(cè)結(jié)果就能真正地被決策系統(tǒng)所使用。
在最終的表現(xiàn)上,單個(gè) TNT 模型的行為預(yù)測(cè)準(zhǔn)確性在公開(kāi)數(shù)據(jù)集 Argoverse 的測(cè)試表現(xiàn)與冠軍結(jié)果相當(dāng),同時(shí)在 INTERACTION、Stanford Drone 等測(cè)試中取得了非常好的效果。
圖|論文作者團(tuán)隊(duì),左至右分別為趙行、高繼揚(yáng)、孫晨
論文核心作者來(lái)自 Waymo 和谷歌。其中,趙行是 Waymo 研究科學(xué)家,本科畢業(yè)于浙江大學(xué),在麻省理工學(xué)院獲得博士學(xué)位;高繼揚(yáng)目前是 Waymo 的高級(jí)工程師,本科畢業(yè)于清華大學(xué),后在美國(guó)南加州大學(xué)獲博士學(xué)位;孫晨本科同樣就讀于清華大學(xué),后博士畢業(yè)于南加州大學(xué),目前在谷歌任研究科學(xué)家。
責(zé)編AJX
-
谷歌
+關(guān)注
關(guān)注
27文章
6172瀏覽量
105628 -
模型
+關(guān)注
關(guān)注
1文章
3267瀏覽量
48921 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13867瀏覽量
166597
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論