機(jī)器人需要一張保姆級地圖。
隨著機(jī)器人的智能化技術(shù)不斷迭代,對于復(fù)雜的行為決策、人機(jī)交互等任務(wù)僅感知環(huán)境的空間幾何信息已無法滿足要求,它需要讓機(jī)器人能夠像人一樣,懂得環(huán)境中的物體類別及其位置,即環(huán)境的語義信息。以掃地機(jī)器人為例,一個(gè)清掃餐桌底部的任務(wù)便要求它需要知道目標(biāo)的類別和位置。然而目前主流的傳統(tǒng)2D柵格地圖、拓?fù)涞貓D雖然能夠描述環(huán)境中存在的障礙物幾何特征及其環(huán)境結(jié)構(gòu)信息,但卻缺乏機(jī)器人用于理解環(huán)境、人機(jī)/物機(jī)交互等業(yè)務(wù)邏輯的高層次語義信息,相反,3D語義地圖不僅包含物體及環(huán)境的結(jié)構(gòu)信息,還有物體類別、功能屬性等“常識”性信息,可以說是機(jī)器人的保姆級地圖。
從技術(shù)角度而言,3D語義地圖的地圖模型是針對真實(shí)場景的三維環(huán)境重構(gòu),包含區(qū)域性場景信息及場景中每個(gè)獨(dú)立物體的屬性、空間中的三維模型、位姿信息等,使機(jī)器人在語義層次上理解環(huán)境信息,模仿人類大腦對環(huán)境理解的方式,從而為實(shí)現(xiàn)更高層次的智能化操作提供信息支持。
如何構(gòu)建3D語義地圖?
要構(gòu)建3D語義地圖,前提是需要提取出你所需要的物體特征,并進(jìn)行語義切割。INDEMIND在實(shí)現(xiàn)構(gòu)建3D語義地圖中,采用了立體視覺技術(shù)路線,通過對雙目視覺傳感器獲取到3D視覺點(diǎn)云信息進(jìn)行點(diǎn)云聚類,并結(jié)合邊緣端的嵌入式深度學(xué)習(xí)和VSLAM算法,輸出個(gè)體性物體語義和區(qū)域性場景語義,從而實(shí)現(xiàn)3D語義地圖構(gòu)建。
在真實(shí)場景中,無論是家庭、公司還是超市,大多擁有著3個(gè)及3個(gè)以上的細(xì)分場景,且這些場景大多有著相似性,當(dāng)機(jī)器人收到指定房間作業(yè)任務(wù)后如何快速準(zhǔn)確地理解房間的功能屬性,找到對應(yīng)房間,并能根據(jù)不同房間的功能屬性進(jìn)行個(gè)性化作業(yè)還需要極高的場景理解準(zhǔn)確度。
因此,INDEMIND是根據(jù)輸出的區(qū)域性場景語義和個(gè)體性物體語義二者融合的方式實(shí)現(xiàn)場景理解。首先,根據(jù)獲取到的區(qū)域性場景語義信息,進(jìn)行整體特征識別;其次,會根據(jù)個(gè)體性物體語義識別,對場景中一系列獨(dú)立個(gè)體信息進(jìn)行識別,并作為場景特征標(biāo)志,最終通過二相疊加判斷,實(shí)現(xiàn)準(zhǔn)確穩(wěn)定地場景理解。
在實(shí)際表現(xiàn)中,應(yīng)用3D語義地圖的機(jī)器人,結(jié)合INDEMIND VSLAM算法和智能決策引擎,在AI識別、智能避障、指令智能作業(yè)、人機(jī)/物機(jī)交互等方面均有優(yōu)異表現(xiàn)。
在AI識別和避障方面,基于3D語義地圖,能夠快速提取環(huán)境中各類圖像特征,結(jié)合深度學(xué)習(xí)可立體識別行人、動物、固定/移動物體等個(gè)體性障礙物,以及樓梯、自動扶梯等危險(xiǎn)場景,避免危險(xiǎn)情況發(fā)生,這種結(jié)合物體3D信息的識別和避障效果的穩(wěn)定性、準(zhǔn)確率都得到顯著提升。同時(shí),通過識別到與顯示匹配的障礙物3D信息,機(jī)器人還可做出類似人類規(guī)避動作的精細(xì)化操作,能夠讓機(jī)器人有預(yù)判、有策略的實(shí)現(xiàn)主動避障。
在交互和智能作業(yè)方面,3D語義地圖通過對場景中獨(dú)立個(gè)體、房間信息做語義識別及物體分割,機(jī)器人懂得人類“常識”后,便能實(shí)現(xiàn)高層次的交互邏輯,配合INDEMIND自研的自然語言交互技術(shù),可通過語音、手勢、動作等指令,命令機(jī)器人進(jìn)行安全、搜尋、跟隨、自主尋路、定向清掃等多種智能作業(yè)邏輯。以定向清掃為例,發(fā)布語音命令:“清掃一下臥室”可被識別為針對地圖上識別到的臥室區(qū)域進(jìn)行一次規(guī)劃清掃,告別粗糙的交互體驗(yàn)。
目前,3D語義地圖技術(shù)已應(yīng)用到INDMEIND推出的家用機(jī)器人導(dǎo)航方案「家用機(jī)器人AI Kit」和商用機(jī)器人導(dǎo)航方案「商用機(jī)器人AI Kit」中,兩種方案的市場表現(xiàn)均得到了客戶的廣泛認(rèn)可。
值得一提的是,兩種方案由于采用視覺技術(shù)路線,在成本方面相對于競品均有著明顯優(yōu)勢。「家用機(jī)器人AI Kit」在實(shí)現(xiàn)同等水平的技術(shù)效果的同時(shí),成本只有激光雷達(dá)融合方案的1/3,且激光視覺融合方案雖然也能獲取到場景中的語義信息,但受限于傳感器限制,事實(shí)上只能識別到物體的二維信息,無法構(gòu)建3D語義地圖。「商用機(jī)器人AI Kit」相比激光雷達(dá)方案,成本下降了60-80%,機(jī)器人開發(fā)成本最低可以下探到2千元以內(nèi),包含導(dǎo)航和電池的完整底盤成本則可以下探到5千元以內(nèi),顯著降低機(jī)器人的開發(fā)成本和周期。
審核編輯 黃宇
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28618瀏覽量
207927 -
智能
+關(guān)注
關(guān)注
8文章
1715瀏覽量
117635 -
AI
+關(guān)注
關(guān)注
87文章
31433瀏覽量
269832 -
VSLAM
+關(guān)注
關(guān)注
0文章
23瀏覽量
4333
發(fā)布評論請先 登錄
相關(guān)推薦
評論