如今科技發(fā)展日新月異,諸如機(jī)器人、AR/VR等前沿科技產(chǎn)品已走入了大眾生活當(dāng)中。但是想在這些領(lǐng)域讓用戶有更好的體驗,就需要很多底層技術(shù)的支持,SLAM就是其中之一。如果說機(jī)器人離開了SLAM,就相當(dāng)于人類失去了雙眼一樣。
一、什么是視覺SLAM?
SLAM的英文全稱是Simultaneous Localization and Mapping,中文稱作「即時定位與地圖創(chuàng)建」,而視覺SLAM就是用攝像頭來完成環(huán)境的感知工作。
舉個例子,當(dāng)你第一天去上大學(xué)的時候,為了迅速熟悉校園環(huán)境并且找到宿舍時,你會做以下的事情:
1.用眼睛一直觀察周圍的教學(xué)樓、籃球場、噴泉等標(biāo)志性建筑物,并且記住它們的特征。(特征提取)
2.根據(jù)你剛才眼睛觀察到的信息,在腦海里把這些有特征的標(biāo)志性建筑物建立成一個地圖。(建圖)
3.在繼續(xù)行走時,又看到了一些如咖啡店、健身房等新的標(biāo)志性建筑物,再把它們加到腦海中的地圖里面校對一下。(狀態(tài)更新)
4.根據(jù)你前一段時間行走獲得的標(biāo)志性建筑物,確定自己的位置。(路徑規(guī)劃)
5.當(dāng)無意中走了很長一段路的時候,和腦海中的以往標(biāo)志性建筑物進(jìn)行匹配,看一看是否走回了原路。(回環(huán)檢測)
其實上面你做的這些事情,就是視覺SLAM里面的幾個部分。
二、視覺SLAM的分類
視覺SLAM研究主要分為三大類:單目、雙目(或多目)、RGBD。
單目僅用一支攝像頭就能完成SLAM。最大的優(yōu)點(diǎn)是傳感器簡單且成本低廉,但同時也有個大問題,就是不能確切的得到深度,存在尺寸不確定的現(xiàn)象,比如丟失深度信息的相片中,我們能見到“手捏太陽”“借位拍照”這樣的現(xiàn)象。
一方面是由于絕對深度未知,單目SLAM不能得到機(jī)器人運(yùn)動軌跡及地圖的真實大小,如果把軌跡和房間同時放大兩倍,單目看到的像是一樣的,因此,單目SLAM只能估計一個相對深度。另一方面,單目相機(jī)無法依靠一張圖像獲得圖像中物體離自己的相對距離。為了估計這個相對深度,單目SLAM要靠運(yùn)動中的三角測量,來求解相機(jī)運(yùn)動并估計像素的空間位置。即是說,它的軌跡和地圖,只有在相機(jī)運(yùn)動之后才能收斂,如果相機(jī)不進(jìn)行運(yùn)動時,就無法得知像素的位置。同時,相機(jī)運(yùn)動還不能是純粹的旋轉(zhuǎn),這就給單目SLAM的應(yīng)用帶來了一些麻煩。
雙目(多目)顧名思義是由兩個或多個攝像頭來完成SLAM,其普遍為雙目視覺方案。雙目視覺既可以在運(yùn)動時估計深度,亦可在靜止時估計,雙目視覺融合兩個攝像頭獲得的圖像并觀察它們之間的差別,獲得明顯的深度感,建立特征間的對應(yīng)關(guān)系,將同一空間物理點(diǎn)在不同圖像中的映像點(diǎn)對應(yīng)起來。并且可以精準(zhǔn)感知周圍的物體和自身移動的軌跡,從而對周圍環(huán)境形成三維立體的認(rèn)識,解決了上面提到的問題。不過通過雙目圖像計算像素距離,計算量大,而且在特征少的白墻或暗光環(huán)境易丟失目標(biāo)。
目前雙目的應(yīng)用程度明顯較高,針對雙目方案拓展應(yīng)用場景上,大多融和了IMU或者IR等傳感器,比如國內(nèi)立體視覺方案公司indemind推出的雙目視覺慣性模組,采用了“雙目攝像頭+IMU”多傳感器融合架構(gòu)與微秒級時間同步機(jī)制,可提供精準(zhǔn)穩(wěn)定數(shù)據(jù)源;并且內(nèi)置了自研高精度Vi-SLAM算法,以滿足SLAM研究、智能機(jī)器人、無人機(jī)避障、室內(nèi)外導(dǎo)航定位等使用需求。
RGBD相機(jī)是2010年左右開始興起的一種相機(jī),它最大的特點(diǎn)是可以通過紅外結(jié)構(gòu)光或Time-of-Flight原理,直接測出圖像中各像素離相機(jī)的距離。因此,它比傳統(tǒng)相機(jī)能夠提供更豐富的信息,也不必像單目或雙目那樣費(fèi)時費(fèi)力地計算深度。
目前常用的RGBD相機(jī)有Kinect/Kinect V2等等。不過,現(xiàn)在多數(shù)RGBD相機(jī)還存在測量范圍窄、噪聲大、視野小、受陽光,墻面反光等諸多問題。出于量程的限制,主要用于室內(nèi)SLAM。
目前,視覺SLAM主要被運(yùn)用于無人機(jī)、無人駕駛、機(jī)器人、AR、智能家居等領(lǐng)域,單目需要靠運(yùn)動估計深度導(dǎo)致避障效率不高,RGBD存在量程的限制,主要用于室內(nèi)SLAM。因此,目前在視覺SLAM中,雙目的應(yīng)用程度和落地前景都是最高的。
不管是哪種視覺SLAM方案,都是作為人工智能的眼睛,獲取地圖數(shù)據(jù),并構(gòu)建地圖,規(guī)避路程中遇到的障礙物,實現(xiàn)路徑的規(guī)劃。
隨著城市物聯(lián)網(wǎng)和智能系統(tǒng)的完善,視覺SLAM必是大勢所趨。雖然目前視覺SLAM技術(shù)方面還存在著一些問題,但這些都會隨著消費(fèi)刺激和產(chǎn)業(yè)鏈的發(fā)展逐步解決、趨于完善。
lw
-
人工智能
+關(guān)注
關(guān)注
1791文章
47279瀏覽量
238511 -
SLAM
+關(guān)注
關(guān)注
23文章
424瀏覽量
31833 -
無人駕駛
+關(guān)注
關(guān)注
98文章
4059瀏覽量
120513
發(fā)布評論請先 登錄
相關(guān)推薦
評論