有声小说下载,盗墓笔记有声小说,遮天辰东小说

來(lái)源：3D視覺(jué)工坊

0. 這篇文章干了啥？

視覺(jué)定位旨在估計(jì)在已知環(huán)境中捕獲的給定圖像的旋轉(zhuǎn)和位置，大致可以分為絕對(duì)姿態(tài)回歸（APR），場(chǎng)景坐標(biāo)回歸（SCR）和分層方法（HM）。APR將地圖嵌入到高級(jí)姿態(tài)特征中，并使用多層感知器（MLP）預(yù)測(cè)6自由度姿態(tài)；它們對(duì)于大規(guī)模場(chǎng)景來(lái)說(shuō)速度很快，但由于隱式3D信息表示，精度有限。與APR不同，SCR對(duì)像素進(jìn)行3D坐標(biāo)回歸以直接構(gòu)建2D-3D匹配，并使用PnP和RANSAC估計(jì)姿態(tài)。盡管在室內(nèi)環(huán)境中具有很高的精度，但SCR無(wú)法擴(kuò)展到室外大規(guī)模場(chǎng)景。HMs不使用端到端的2D-3D匹配預(yù)測(cè)，而是采用全局特征在數(shù)據(jù)庫(kù)中搜索參考圖像，然后建立提取的查詢關(guān)鍵點(diǎn)和參考圖像之間的對(duì)應(yīng)關(guān)系；這些2D-2D匹配被提升為2D-3D匹配，并用于使用PnP和RANSAC的絕對(duì)姿態(tài)估計(jì)，就像SCR一樣。由于精度高和靈活性強(qiáng)，HMs最近被廣泛使用。然而，2D關(guān)鍵點(diǎn)存儲(chǔ)的巨大內(nèi)存成本損害了它們?cè)趯?shí)際應(yīng)用中的效率。

這篇文章旨在找到一種高效準(zhǔn)確的大規(guī)模視覺(jué)定位任務(wù)的解決方案。為了實(shí)現(xiàn)這一目標(biāo)，作者采用了一種混合地圖的方法，僅通過(guò)渲染有用的稀疏像素來(lái)實(shí)現(xiàn)NeRFs的高效定位。混合地圖由兩部分組成：顯式幾何地圖（EGM）和隱式學(xué)習(xí)地圖（ILM）。EGM包含稀疏的3D點(diǎn)以及它們?cè)趨⒖紙D像上的2D觀測(cè)。ILM是由NeRFs表示的隱式地圖。在測(cè)試時(shí)，參考圖像的2D觀測(cè)提供先驗(yàn)的稀疏像素位置和相機(jī)姿態(tài)作為NeRFs的輸入。NeRFs返回每個(gè)稀疏像素的RGB值。為了提高精度，為每個(gè)像素渲染一個(gè)具有恒定大小的補(bǔ)丁。這些渲染的補(bǔ)丁進(jìn)一步用于使用PnP和RANSAC進(jìn)行絕對(duì)姿態(tài)估計(jì)的2D-3D匹配。

2. 摘要

視覺(jué)重定位是自動(dòng)駕駛、機(jī)器人技術(shù)和虛擬/增強(qiáng)現(xiàn)實(shí)的關(guān)鍵技術(shù)。經(jīng)過(guò)數(shù)十年的探索，絕對(duì)姿態(tài)回歸（APR）、場(chǎng)景坐標(biāo)回歸（SCR）和分層方法（HMs）已成為最流行的框架。然而，盡管 APR 和 SCR 具有較高的效率，但在大規(guī)模室外場(chǎng)景中精度有限；HMs 具有較高的精度，但需要存儲(chǔ)大量用于匹配的 2D 描述符，導(dǎo)致效率低下。在本文中，我們提出了一種高效且準(zhǔn)確的框架，稱為 VRS-NeRF，用于稀疏神經(jīng)輻射場(chǎng)的視覺(jué)重定位。具體來(lái)說(shuō)，我們引入了顯式幾何地圖（EGM）用于 3D 地圖表示和隱式學(xué)習(xí)地圖（ILM）用于稀疏補(bǔ)丁渲染。在這個(gè)定位過(guò)程中，EGP 提供了稀疏 2D 點(diǎn)的先驗(yàn)信息，ILM 利用這些稀疏點(diǎn)使用稀疏 NeRF 渲染補(bǔ)丁進(jìn)行匹配。這使我們能夠丟棄大量的 2D 描述符以減小地圖大小。此外，僅為有用的點(diǎn)渲染補(bǔ)丁，而不是整個(gè)圖像中的所有像素，可以顯著減少渲染時(shí)間。這個(gè)框架繼承了 HMs 的精度，但丟棄了它們的低效率。對(duì) 7Scenes、CambridgeLandmarks 和 Aachen 數(shù)據(jù)集的實(shí)驗(yàn)表明，我們的方法比 APR 和 SCR 具有更好的準(zhǔn)確性，并且與 HMs 的性能相近，但效率更高。

3. 效果展示

亞琛數(shù)據(jù)集上場(chǎng)景劃分的可視化。場(chǎng)景的統(tǒng)一劃分導(dǎo)致了不平衡的片段(左)，在參考姿勢(shì)上的聚類給出了更平衡的結(jié)果(右)。

渲染圖像的可視化。可視化了來(lái)自7 scenes（上圖）、Cambridge landmarks（中圖）和Aachen（下圖）數(shù)據(jù)集的渲染和地面實(shí)況圖像。

匹配的可視化。可視化了來(lái)自7 scenes（頂部）、Cambridge landmarks（中間）和Aachen（底部）數(shù)據(jù)集的查詢圖像（左）和參考圖像（右）之間的匹配。

4. 主要貢獻(xiàn)

（1）提出了一種混合方法，結(jié)合顯式幾何地圖和隱式學(xué)習(xí)地圖進(jìn)行視覺(jué)定位，使定位系統(tǒng)高效且準(zhǔn)確。

（2）僅為有用的稀疏關(guān)鍵點(diǎn)渲染補(bǔ)丁，而不是渲染圖像，避免了耗時(shí)的渲染過(guò)程。

（3）采用基于聚類的策略進(jìn)行場(chǎng)景劃分，使NeRFs能夠在大規(guī)模室外環(huán)境中工作。

5. 基本原理是啥？

借助EGM和ILM，VRS-NeRF能夠在線渲染有用的像素，而不是依賴離線2D描述符進(jìn)行匹配，從而使定位系統(tǒng)更加高效。為了使當(dāng)前的NeRFs在大規(guī)模場(chǎng)景中工作，VRS-NeRF采用了基于聚類的策略來(lái)自適應(yīng)自動(dòng)地將場(chǎng)景劃分為較小的場(chǎng)景。

6. 實(shí)驗(yàn)結(jié)果

將VRS-NeRF與之前的APRs和HMs進(jìn)行比較。APRs給出了最大的誤差，因?yàn)樗鼈冊(cè)诙ㄎ贿^(guò)程中與圖像檢索具有相似的行為，導(dǎo)致姿態(tài)精度有限。由于大多數(shù)APRs只報(bào)告中位誤差，因此它們的成功率不可用。SCRs由于其顯式的三維坐標(biāo)回歸，獲得比APRs高得多的準(zhǔn)確性。HMs在中位誤差方面實(shí)現(xiàn)了最佳準(zhǔn)確性。然而，由于依賴稀疏關(guān)鍵點(diǎn)，它們對(duì)無(wú)紋理區(qū)域的魯棒性較差，因此其報(bào)告的準(zhǔn)確性比某些SCRs，如DSAC*和ACE稍差一些。盡管VRS-NeRF用于定位稀疏補(bǔ)丁，但其在中位誤差方面的表現(xiàn)接近于HMs，并且在中位誤差方面明顯優(yōu)于APRs和SCRs。與HMs類似，VRS-NeRF也對(duì)無(wú)紋理區(qū)域敏感。由于EGM繼承了HMs的優(yōu)點(diǎn)，它優(yōu)于以前的方法LENS和NeRF-loc，它們分別將NeRFs引入了APRs和SCRs。

劍橋地標(biāo)數(shù)據(jù)集上先前方法和VRS-NeRF的結(jié)果。報(bào)告中位平移（厘米）和旋轉(zhuǎn)（°）誤差以及誤差閾值為25厘米，2°內(nèi)的姿勢(shì)成功率。由于缺少嵌入的三維信息，APRs的誤差比SCRs大2倍以上。SCRs在中位平移和旋轉(zhuǎn)誤差方面報(bào)告了令人滿意的準(zhǔn)確性。然而，它們?cè)?5厘米，2°誤差閾值內(nèi)的成功率遠(yuǎn)遠(yuǎn)低于HMs。即使是最先進(jìn)的DSAC*和ACE也無(wú)法達(dá)到與HMs相當(dāng)?shù)臏?zhǔn)確性。這些比較揭示了SCRs在戶外場(chǎng)景中的準(zhǔn)確性并不如預(yù)期那樣高。HMs仍然是中位誤差和成功率方面最準(zhǔn)確的方法。由于VRS-NeRF也保留了顯式的幾何信息作為顯式幾何圖，其結(jié)果與HMs一樣準(zhǔn)確，并且比APRs和SCRs準(zhǔn)確得多。與先前基于NeRF的LENS和NeRF-loc相比，VRS-NeRF也實(shí)現(xiàn)了顯著更好的準(zhǔn)確性。

地圖大小和時(shí)間分析。地圖大小。在表IV中，展示了APRs，SCRs，HMs和VRS-NeRF的地圖大小。對(duì)于APRs和SCRs，地圖大小是模型大小。對(duì)于HMs，地圖大小是局部描述符，全局描述符和三維點(diǎn)的總和。由于VRS-NeRF舍棄了局部描述符并引入了NeRFs，VRS-NeRF的地圖大小是全局描述符，三維點(diǎn)和NeRFs的總和。APRs和SCRs都是內(nèi)存有效的，因?yàn)樗鼈儗⒌貓D壓縮到神經(jīng)網(wǎng)絡(luò)中，以損失準(zhǔn)確性為代價(jià)。由于存儲(chǔ)了2D描述符，HMs的地圖大小較大。SFD2+IMP的地圖大小比SP+SG小，因?yàn)镾FD2具有較小的2D描述符維度。通過(guò)舍棄2D描述符，VRS-NeRF顯著減小了地圖大小。

消融研究，探討了不同補(bǔ)丁大小對(duì)姿勢(shì)準(zhǔn)確性的影響。表V顯示，隨著補(bǔ)丁大小從8×9增加到15×15，姿勢(shì)準(zhǔn)確性也增加。在國(guó)王學(xué)院這樣的戶外場(chǎng)景中，這一點(diǎn)更為明顯，因?yàn)椴樵兒蛥⒖紙D像的視角和照明變化較大。然而，對(duì)于室內(nèi)場(chǎng)景，由于查詢和參考圖像之間的變化很小，增加補(bǔ)丁大小的改進(jìn)并不明顯。此外，隨著補(bǔ)丁大小的增加，渲染一個(gè)補(bǔ)丁所需的時(shí)間也會(huì)增加。因此，最終的解決方案是在準(zhǔn)確性和效率之間取得平衡。對(duì)于沒(méi)有查詢和參考圖像之間大變化的室內(nèi)場(chǎng)景，作者建議使用較小的補(bǔ)丁大小以提高效率。對(duì)于查詢和參考圖像之間有大視角，照明變化的室外場(chǎng)景，較大的補(bǔ)丁大小可以帶來(lái)更好的準(zhǔn)確性。

7. 總結(jié) & 未來(lái)工作

這篇文章提出了一種將NeRFs應(yīng)用于視覺(jué)定位任務(wù)的新方法。具體來(lái)說(shuō)，引入了顯式幾何地圖（EGM）和隱式學(xué)習(xí)地圖（ILM），以提供稀疏關(guān)鍵點(diǎn)和渲染補(bǔ)丁，以建立查詢和渲染圖像之間的稀疏匹配。通過(guò)從EGM提供的稀疏點(diǎn)進(jìn)行稀疏渲染，VRS-NeRF避免了耗時(shí)的全圖像渲染。通過(guò)NeRFs表示的ILM，VRS-NeRF舍棄了消耗內(nèi)存的2D描述符。因此，VRS-NeRF更加高效。然而，與最先進(jìn)的方法相比，在大規(guī)模亞琛數(shù)據(jù)集上的準(zhǔn)確性仍然有限。作者希望這項(xiàng)工作可以成為一個(gè)基線，更多的研究人員可以在將來(lái)使其變得更好。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
211

文章
28418

瀏覽量
207096
自動(dòng)駕駛

自動(dòng)駕駛

+關(guān)注

關(guān)注
784

文章
13812

瀏覽量
166457
視覺(jué)定位

視覺(jué)定位

+關(guān)注

關(guān)注
5

文章
51

瀏覽量
12394

原文標(biāo)題：VRS-NeRF：基于神經(jīng)輻射場(chǎng)的視覺(jué)重定位了解一下？

文章出處：【微信號(hào)：3D視覺(jué)工坊，微信公眾號(hào)：3D視覺(jué)工坊】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

基于線性化技術(shù)的二次分配問(wèn)題求解新方法

【作者】：張惠珍;馬良;【來(lái)源】：《系統(tǒng)工程理論與實(shí)踐》2010年03期【摘要】：文章在對(duì)已有二次分配問(wèn)題(QAP)線性化模型深入研究的基礎(chǔ)上,提出一種二次分配問(wèn)題線性化新方法,進(jìn)而給出了對(duì)稱二次

發(fā)表于 04-24 09:49

一種標(biāo)定陀螺儀的新方法

一種標(biāo)定陀螺儀的新方法

發(fā)表于 08-17 12:17

一種在金上生成硫醇封端的SAM的新方法

一種在金上生成硫醇封端的SAM的新方法 - 應(yīng)用簡(jiǎn)報(bào)

發(fā)表于 10-30 11:05

一種均勻直線陣列干擾抑制的新方法

一種均勻直線陣列干擾抑制的新方法:本文提出一種應(yīng)用于均勻直線陣列的干擾抑制方法，對(duì)均勻直線陣列進(jìn)行虛擬平移對(duì)信號(hào)作變換，應(yīng)用最大信號(hào)與干擾加

發(fā)表于 10-24 15:22 ?4次下載

一種級(jí)數(shù)混合運(yùn)算產(chǎn)生SPWM波新方法

一種級(jí)數(shù)混合運(yùn)算產(chǎn)生SPWM波新方法_耿衛(wèi)東

發(fā)表于 01-07 18:39 ?0次下載

一種求解動(dòng)態(tài)及不確定性優(yōu)化問(wèn)題的新方法

一種求解動(dòng)態(tài)及不確定性優(yōu)化問(wèn)題的新方法_劉曉

發(fā)表于 01-07 18:56 ?0次下載

一種設(shè)計(jì)同步時(shí)序邏輯電路的新方法

一種設(shè)計(jì)同步時(shí)序邏輯電路的新方法

發(fā)表于 02-07 15:05 ?29次下載

PC機(jī)與單片機(jī)串行通信的一種新方法

PC機(jī)與單片機(jī)串行通信的一種新方法

發(fā)表于 09-04 14:20 ?4次下載

PC機(jī)與單片機(jī)串行通信的<b class='flag-5'>一種</b><b class='flag-5'>新方法</b>

目前微通道面臨的限制,突破硅技術(shù)的一種新方法

有用。Yuan說(shuō)道，“我們介紹了一種以纖維方式制作微流控裝置的新方法，該方法與傳統(tǒng)基于芯片的形式相比具有諸多優(yōu)勢(shì)。”

發(fā)表于 12-18 15:01 ?4416次閱讀

Abacus展示了一種用于深度學(xué)習(xí)的新方法的技術(shù)

與1月份的最后一次重大公告一樣，該公司還展示了一種用于深度學(xué)習(xí)的新方法的技術(shù)，在這種情況下，該公司提供了

發(fā)表于 07-22 10:26 ?5044次閱讀

一種復(fù)制和粘貼URL的新方法

它也存在于瀏覽器中，Microsoft Edge也不例外。但是，雷蒙德（Redmond）的用戶啟用了一種復(fù)制和粘貼URL的新方法，該方法有些簡(jiǎn)單，但并非所有用戶都知道如何利用它。這是最合乎邏輯的，因?yàn)樵跒g覽器中處理地址的

發(fā)表于 12-21 16:55 ?4016次閱讀

一種改善微波模塊增益指標(biāo)溫度特性的新方法

電子發(fā)燒友網(wǎng)站提供《一種改善微波模塊增益指標(biāo)溫度特性的新方法.pdf》資料免費(fèi)下載

發(fā)表于 10-25 10:05 ?0次下載

一種產(chǎn)生激光脈沖的新方法

英國(guó)和韓國(guó)的科學(xué)家提出了一種產(chǎn)生激光脈沖的新方法，其功率是現(xiàn)有激光脈沖的1000多倍。

發(fā)表于 11-20 16:56 ?579次閱讀

一種產(chǎn)生激光脈沖新方法

等離子體中脈沖壓縮的概念英國(guó)和韓國(guó)的科學(xué)家提出了一種產(chǎn)生激光脈沖的新方法，其功率是現(xiàn)有激光脈沖的1000多倍。科學(xué)家們使用計(jì)算機(jī)模擬聯(lián)合研究，展示了一種壓縮光的新方法，以充分提高光

發(fā)表于 12-07 06:32 ?507次閱讀

一種降低VIO/VSLAM系統(tǒng)漂移的新方法

本文提出了一種新方法，通過(guò)使用點(diǎn)到平面匹配將VIO/VSLAM系統(tǒng)生成的稀疏3D點(diǎn)云與數(shù)字孿生體進(jìn)行對(duì)齊，從而實(shí)現(xiàn)精確且全球一致的定位，無(wú)需

發(fā)表于 12-13 11:18 ?154次閱讀