在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

持續在榜的RAFT-Stereo,你確定不來了解嗎?

3D視覺工坊 ? 來源:計算機視覺工坊 ? 2023-05-19 09:24 ? 次閱讀

論文題目:RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching

作者:Lahav Lipson ;Zachary Teed; Jia Deng等人

作者機構:Princeton University(普林斯頓大學)

項目代碼:https://github.com/princeton-vl/RAFT-Stereo(論文中提到的開源代碼,用的是Pytorch框架)

在公眾號「3D視覺工坊」后臺回復「原論文」,可獲取對應論文pdf文件。

RAFT-Stereo是一種用于立體匹配的算法,它使用多層循環場變換(Multilevel Recurrent Field Transforms)來精確定位左右兩幅圖像中的對應點。它包括一個RAFT網絡和一個立體匹配分支,能夠幫助解決深度估計中的一些挑戰,如紋理缺失、遮擋和低紋理等問題。RAFT-Stereo能夠有效地利用循環場變換來捕捉像素之間的長程依賴性,從而提高立體匹配的準確性。其次,它還使用了多個尺度和不同的分辨率,使算法對多尺度立體匹配具有良好的適應性。此外,RAFT-Stereo算法還采用了門控循環單元(GRU)來進一步提高處理速度??偟膩碚f,RAFT-Stereo是一種有潛力的立體匹配算法,能夠在多種深度估計應用中發揮作用。RAFT-Stereo也是作為middleburry排行榜中前五名中,唯一一個2021年就提出的算法,持續至今依然名列前茅。

d7ea8174-f5d0-11ed-90ce-dac502259ad0.png

1 前言

立體深度估計是一個基本的視覺問題,應用范圍廣泛。早期的研究集中在特征匹配和正則化兩個關鍵部分。在處理中使用3D卷積神經網絡計算代價體是主流方法,但代價較大,需要特殊方法才能操作高分辨率的圖像。而光流問題則通常使用迭代精化的方法。光流和矯正立體鏡頭是緊密相關的問題,但兩個任務的神經網絡結構卻有很大差異。這里,作者提出了RAFT-Stereo,一種新的雙視立體結構體系,利用了RAFT特有的3D體積和迭代細化法。RAFT-Stereo僅使用2D卷積和一個輕量級的成本體積,相比之前的立體網絡,具有更好的泛化能力且不需要復雜的損失項。RAFT-Stereo在KITTI、ETH3D和Middlebury等真實數據集上表現非常出色,且具有更好的跨數據集泛化能力。

2 相關背景

計算機視覺領域,立體匹配一直是一個關鍵性的問題,早期方法集中在設計更好的匹配成本和高效的推斷算法上,而深度學習被應用于改進立體匹配的成本函數。目前的方法更注重于端到端可訓練的3D神經網絡架構,該架構包括用于從圖像塊計算成本的2D卷積網絡,構建3D成本體,以及3D卷積層用于處理該成本體。這些方法在一些數據集上表現出色,但3D卷積的計算成本很高,往往不能泛化到其被訓練的領域之外。因此,盡管一些努力已經集中在提高它們的泛化能力上,但許多工作仍然需要通過替換更輕量級的模塊來提高計算效率。RAFT-Stereo是一種內存效率更高的算法,能夠在百萬像素圖像上預測全分辨率的立體。

3 方法

給定一對矯正后的圖像(IL, IR),目標是估計一個視差場d,使每個IL中的像素都有水平的位移。與RAFT類似,RAFT-Stereo的方法由三個主要組件組成:特征提取器、相關金字塔和基于GRU的更新運算符,如圖1所示。更新運算符迭代地從相關金字塔中檢索特征并對視差場進行更新。

d81e56fc-f5d0-11ed-90ce-dac502259ad0.png

3.1 Feature Extraction - 特征提取

作者介紹了一種基于特征編碼器和上下文編碼器的特征提取方法。特征編碼器應用于左右圖像并生成密集的特征圖,用于構造相關體積。上下文編碼器與特征編碼器結構相同,但采用批量歸一化替代實例歸一化,僅在左圖像上應用。在作者的方法中,上下文特征用于初始化更新運算符的隱藏狀態,并在每次迭代中注入GRU。

3.2 Correlation Pyramid - 相關金字塔

作者提出了相關金字塔,用于提高矯正立體視覺的精度和魯棒性。相關體積基于特征向量之間的點積,用于計算圖像之間的相似性;相關金字塔通過對最后一個維度進行平均池化構建,它具有增加的接受野,但僅通過對最后一個維度進行池化,可以保留原始圖像中的高分辨率信息,從而允許恢復非常細微的結構;為了從相關金字塔中檢索像素,作者使用相關查找算法,它利用一個類似于 RAFT 中定義的查找算子和線性插值來實現檢索。該方法具有高效性和魯棒性,并且易于實現。

d83e55d8-f5d0-11ed-90ce-dac502259ad0.png

3.3 Multi-Level Update Operator - 多級更新運算符

作者從一個初始的起點d0 = 0開始預測一系列視差場{d1、…、dN}。在每次迭代中,作者使用目前的視差估計來索引相關體積,產生一組相關特征。這些特征經過了2個卷積層。同樣地,目前的視差估計也經過了2個卷積層。然后將相關特征、視差和上下文特征連接起來并注入到GRU中。GRU更新隱藏狀態,新的隱藏狀態然后用于預測視差更新。

多個隱藏狀態:原始的RAFT完全在固定的高分辨率上進行更新。這種方法的一個問題是,隨著GRU更新次數的增加,接受域的增加非常緩慢。這可能對紋理較大、局部信息較少的場景有影響。作者通過提出一個同時在1/8、1/16和1/32分辨率上操作特征映射的多分辨率更新運算符來解決這個問題。

上采樣:預測的視差場分辨率為輸入圖像的1/4或1/8。為了輸出全分辨率的視差圖,作者使用了和RAFT相同的凸上采樣方法。RAFT-Stereo將全分辨率的視差值視為其粗略分辨率鄰居3x3網格的凸組合。最高分辨率的GRU預測凸組合權重。

d85b8dba-f5d0-11ed-90ce-dac502259ad0.png

3.4 Slow-Fast GRU - Slow-Fast遞歸神經網絡模型

在這個部分中,作者介紹了Slow-Fast GRU的方法,針對隱藏狀態的1/8分辨率進行GRU更新所需的FLOPs大約是更新1/16分辨率隱藏狀態的4倍。為了加快推理速度,在RAFT-Stereo的一個版本中,每次更新1/8分辨率的隱藏狀態時都會多次更新1/16分辨率和1/32分辨率的隱藏狀態。這種修改將運行時間降低了52%,但是不顯著降低性能,使得RAFT-Stereo能夠在實時運行中得到高效的計算結果。

3.5 Supervision - 監督

在整個預測序列中,作者監督預測和地面真相差距之間的距離l1, {d1,…, dN},權值呈指數增長。給定地真差dgt,損失定義為:

d8738df2-f5d0-11ed-90ce-dac502259ad0.png

4 實驗

4.1 數據集和評估指標

作者在ETH3D、Middlebury 和KITTI-2015上評估了RAFT-Stereo的性能。遵循以前的工作,使用合成Sceneflow數據集對模型進行預訓練。在ETH3D和Middlebury的排行榜上,RAFT-Stereo取得了較為先進的性能,并且RAFT-Stereo在ETH3D、KITTI和Middlebury的零樣本泛化設置中優于其他的方法。

4.2 實施細節

RAFT-Stereo使用Pytorch實現,并使用兩個RTX 6000 GPU進行訓練。所有模塊都從頭開始隨機初始化。在訓練期間,使用AdamW優化器。在訓練計劃中進行32次視差場更新后評估RAFT-Stereo:最終模型使用批量大小為8的合成數據進行200k步的訓練,而去除實驗使用批量大小為6進行100k步的訓練。在訓練過程中運行消融實驗,使用16個視差場更新,最終結果使用22個更新進行訓練。作者使用一個單周期學習率計劃,學習率最小值為。所有RAFT-Stereo實驗都在隨機選擇的360x720裁剪上進行訓練(不包括基準提交),所有實驗,除了消融實驗外,都使用數據增強。具體來說:圖像飽和度在0(灰度)和1.4之間調整;右圖被擾動以模擬常見于ETH3D和Middlebury等數據集中的不完美矯正;作者通過在范圍內使用隨機因子來拉伸圖像和視差,以模擬一系列可能的視差分布。

d8916ffc-f5d0-11ed-90ce-dac502259ad0.png

d8ab7b18-f5d0-11ed-90ce-dac502259ad0.png

4.3 Ablations - 消融

RAFT-Stereo使用了多個隱藏狀態和單獨的backbone來提高性能。在運行時間和內存使用方面做了權衡,并通過簡化成本體積和Slow-Fast技術進一步加快了運行時間。在視差估計上保持更高的分辨率可以提高性能,但會增加運行時間和內存使用。最優分辨率視場大小的選擇需要在準確性和計算代價之間進行權衡。

4.4 Real-time Inferences - 實時推理

RAFT-Stereo在KITTI分辨率下可實現實時推理,可與DSMNet相媲美。Slow-Fast雙級GRU和單個backbone的使用是實現實時推理的關鍵。RAFT-Stereo實現的雙線性采樣器可以進一步優化成像質量。

5 總結

RAFT-Stereo利用多級GRUs擴展了RAFT,實現了雙視圖立體結構。它在跨數據集上的表現達到了先進水平,并且在Middlebury基準測試中排名持續位列前五,在ETH3D上表現也非常優秀。

RAFT-Stereo是一種基于RAFT的深度圖估計算法。是一種稠密光流算法,能夠在輸入圖像之間估計像素之間的運動。RAFT-Stereo的主要思想是將光流作為控制變量來解決輸入圖像的深度圖估計問題。該算法在流形空間中優化存儲著光流場和深度圖的全局能量函數。這種方法既可以考慮全局的能量函數,又可以在局部優化,具有高準確性和穩定性。

相比傳統的基于視差的立體匹配算法,RAFT-Stereo在場景中具有更高的魯棒性和魯棒性。此外,RAFT-Stereo還支持在多GPU上進行訓練和推理,并且速度非???。總之,RAFT-Stereo是一種強大的深度估計算法,具有高準確性和魯棒性。它可以用于許多應用程序,例如3D場景重建、自動駕駛汽車、虛擬現實和增強現實等。

d91d73da-f5d0-11ed-90ce-dac502259ad0.png

d92e0448-f5d0-11ed-90ce-dac502259ad0.png

d9679fbe-f5d0-11ed-90ce-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4778

    瀏覽量

    101023
  • 圖像
    +關注

    關注

    2

    文章

    1089

    瀏覽量

    40531
  • 提取器
    +關注

    關注

    0

    文章

    14

    瀏覽量

    8125

原文標題:持續在榜的RAFT-Stereo,你確定不來了解嗎?

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    FHT4644國產替代必然性崛起不來了解一下芯片這些事嗎

    FHT4644國產替代必然性崛起不來了解一下芯片這些事嗎 國產芯片崛起,讓國內發展環境變得更加穩定,國產芯片FHT4644通過性能實驗測試,更高效。實驗室常溫條件下,實測數據,輸出電流Iout
    發表于 06-24 17:38

    ESP32用send函數發送數據時,經常出現進到send后就出不來了的情況,為什么?

    使用ESP32的WIFI發送TCP數據時(模塊做AP,TCP-Server),用send函數發送數據時,經常出現進到send后就出不來了的情況,唯一的解救辦法就是斷開WIFI連接,send才會返回
    發表于 06-26 07:00

    菜鳥求助:程序有時進入延時后就出不來了,不知怎么回事

    菜鳥求助:程序有時進入延時后就出不來了,不知怎么回事
    發表于 08-27 17:16

    DSP F2812 GPIOF12配置成通用I/O口,為什么輸出不來了高電平?

    DSP F2812 GPIOF12配置成通用I/O口,為什么輸出不來了高電平?難道說引腳沒有內部上拉,就輸出不了高電平嗎?還是什么原因?
    發表于 10-31 17:17

    來了,在哪?

    來了在哪?
    發表于 10-25 15:23

    請問AD1955處于DSD模式時只能是stereo嗎?

    AD1955處于DSD模式時,只能是stereo嗎?就算之前設置的是MONO,只要設置為SACD Slave后Output Fomat自動轉換Stereo了。
    發表于 09-29 15:48

    為什么任務跑起來直接進入了while(1)出不來了?

    我建立了2個相同優先級的任務,一個任務里是while(1);死循環,另一個是閃爍燈, 為什么任務跑起來直接進入了while(1)出不來了?不是有時間片輪詢嗎?
    發表于 07-24 04:35

    uCOSIII移植運行到OSStart();這個函數里面就出不來了是怎么回事?

    我把uCOSIII移植到STM32F103C8T6的時候,程序運行到OSStart();這個函數里面就出不來了,我移植是跟著原子哥的視頻來的,以前的移植到STM32F103ZET6的時候都沒有問題,但是這次不知道怎么回事,求幫忙,折騰了一下午了,實在沒辦法了
    發表于 09-03 04:35

    AD1955處于DSD模式時只能是stereo嗎?

    AD1955處于DSD模式時,只能是stereo嗎?就算之前設置的是MONO,只要設置為SACD Slave后Output Fomat自動轉換Stereo了。
    發表于 11-29 08:24

    high performance stereo routin

    high performance stereo routing switcher
    發表于 04-18 20:37 ?48次下載
    high performance <b class='flag-5'>stereo</b> routin

    MLCC最新缺貨型號排行,電子行業的各位趕緊來了解吧!

    MLCC最新缺貨型號排行,電子行業的各位趕緊來了解吧,
    的頭像 發表于 09-09 09:35 ?4402次閱讀

    用案例來了解貼片功率電感的作用

    的朋友或許就會說我使用的電感,難道還沒有了解的清楚?電感方面的問題或許真沒有我了解的清楚。今天我們結合相關案例
    的頭像 發表于 01-07 14:10 ?919次閱讀
    用案例<b class='flag-5'>來了解</b>貼片功率電感的作用

    使用 RAPIDS RAFT 進行機器學習和數據分析的可重用計算模式

    使用 RAPIDS RAFT 進行機器學習和數據分析的可重用計算模式
    的頭像 發表于 07-05 16:30 ?608次閱讀
    使用 RAPIDS <b class='flag-5'>RAFT</b> 進行機器學習和數據分析的可重用計算模式

    多種角度來了解OBD2

    多種角度來了解OBD2
    的頭像 發表于 09-04 09:55 ?2988次閱讀
    多種角度<b class='flag-5'>來了解</b>OBD2

    無需電流采樣電阻的智能電機驅動IC,不來了解一下么?

    無需電流采樣電阻的智能電機驅動IC,不來了解一下么?
    的頭像 發表于 11-30 17:43 ?478次閱讀
    無需電流采樣電阻的智能電機驅動IC,<b class='flag-5'>不來了解</b>一下么?
    主站蜘蛛池模板: 免费一区在线观看| 特黄大片aaaaa毛片| 免费在线观看视频网站| 国产成人mv 在线播放| 可以免费看黄色的网站| 国产精品久久久久久福利 | 在线免费观看你懂的| 在线欧美色图| 四虎永久免费在线| 欧美日韩在线成人免费| 激情综合五月亚洲婷婷| 凹凸福利视频导航| 午夜国产视频| 久久草在线精品| 中文字幕一区二区三| 中文字幕欧美日韩| 色猫av| 久久免费公开视频| 米奇777四色精品人人爽| 国产成人影院| 日本免费一区视频| 香蕉色网| 久久伊人色| 天天摸天天碰色综合网| 欧美午夜影视| 国产精品亚洲玖玖玖在线靠爱| 越南黄色录像| 丁香色综合| 高清视频一区| 日本三级中文字幕| 特黄特级毛片免费视| 美女免费观看一区二区三区| xvsr-365波多野结衣| 人操人爱| 日本不卡免费高清一级视频| 五月天六月丁香| 久久久久久久国产视频| 在线看逼| 操她射她| 91久久麻豆| 久久免费手机视频|