在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于通過非常稀疏的視角輸入合成場景的方法

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-06-13 09:29 ? 次閱讀

作者引入了一種方法,可以僅使用單個寬基線立體圖像對生成新視角。在這種具有挑戰性的情況下,3D場景點只被正常觀察一次,需要基于先驗進行場景幾何和外觀的重建。作者發現從稀疏觀測中生成新視角的現有方法因恢復不正確的3D幾何和可導渲染的高成本而失敗,這阻礙了其在大規模訓練中的擴展。作者通過構建一個多視圖轉換編碼器、提出一種高效的圖像空間極線采樣方案來組裝目標射線的圖像特征,以及一個輕量級的基于交叉注意力的渲染器來解決這些問題。作者的貢獻使作者的方法能夠在一個大規模的室內和室外場景的真實世界數據集上進行訓練。作者展示了本方法學習到了強大的多視圖幾何先驗,并降低了渲染時間。作者在兩個真實世界數據集上進行了廣泛的對比實驗,在保留測試場景的情況下,明顯優于先前從稀疏圖像觀測中生成新視圖的方法并實現了多視圖一致的新視圖合成。

1 前言

本文介紹了在極端稀疏輸入條件下進行新視圖合成的問題,提出了一個從單個廣角立體圖像對中生成高質量新視圖的方法。為了更好地推理三維場景,提出了一個多視圖視覺變換器來計算每個輸入圖像的像素對準特征,并引入多視圖特征匹配以進一步煉化三維幾何。通過采用以圖像為中心的采樣策略,提出了一種高效的可微分渲染器,解決了樣本稀疏問題,從而大大減少了樣本量需求。實驗證明了該方法在幾個數據集上均獲得了最先進的結果,比現有方法表現出更好的性能。

2 相關背景

IBR方法通過融合一組輸入圖像的信息生成新的相機視角下的圖像。單場景體繪制方法則利用可微渲染進行的3D場景表示來進行新視角合成。不同于IBR方法需要多個輸入圖像,單場景體繪制方法需要數百個密集采樣的3D場景的輸入圖像。與這兩種方法不同,一些方式使用可微渲染來監督基于先驗的推理方法,即先驗知識可以幫助優化3D重建和視圖合成。現有的方法普遍依賴于多個圖像觀測,而作者的方法通過僅使用一組寬基線立體圖像對場景進行重建來解決這一問題。

3 方法

本文提出一種用于生成3D場景新視角圖像的方法。該方法使用已知相機內參和外參以及寬基線立體圖像計算像素對齊的特征,并使用基于交叉注意力的渲染器將特征轉換為新視角的圖像渲染結果。該方法為解決新視角圖像生成問題提供了一種有效的解決方案。

bb9b7ba0-0975-11ee-962d-dac502259ad0.png

3.1 Multiview Feature Encoding - 多視圖特征編碼

本文中提出了一種多視角編碼器來獲取特征。該方法包括兩個階段:首先通過ResNet50提取基礎卷積特征。然后,通過學習的每像素位置嵌入和相機位置嵌入將這兩個圖像轉換為平面特征向量。接下來,這些向量經過視覺Transformer編碼器處理,使每個向量的表示包含了整個場景的上下文。最后,用一個低分辨率的基礎CNN獲取高頻的圖像信息,這些信息與之前的圖像特征映射級聯在一起。

3.2 Epipolar Line Sampling and Feature Matching - 線極線采樣和特征匹配

本文提出了一種基于像素對齊特征的通用的新視角合成方法。通過對極線采樣來找到樣本點,然后使用特征匹配模塊計算來自另一個視圖的次要特征,以進一步處理表面細節。采用基礎矩陣來定義不同視圖生產的極線,并在其上采樣像素來獲得樣本。深度值可通過封閉形式的三角測量獲得。在這種方法中,樣本點的數量已達到有效最大值。

3.3 Differentiable Rendering via Cross-Attention - 交叉注意力實現可微分渲染

本文介紹了使用交叉注意力實現可微分渲染的方法。為了將樣本集映射到顏色值,作者將每個視差線上的點嵌入為一個射線查詢標記。然后,作者的渲染程序通過兩輪交叉注意力,得到特征嵌入,然后通過簡單的 MLP 解碼為顏色。作者的方法不需要顯式計算精確的場景深度,而是可以使用目標相機射線信息和少數視差樣本計算像素顏色。

3.4 Training and Losses - 訓練和損失函數

在視圖合成中,訓練圖像合成模型的損失函數是關鍵。模型應該能夠生成與真實圖像盡可能接近的合成圖像。本文提出了由圖像損失和正則化損失組成的損失函數,其中圖像損失通過LPIPS感知損失測量。此外,正則化損失有助于提高多視角一致性。作者還使用幾何一致的數據增強來提高模型的泛化能力。

bbc64042-0975-11ee-962d-dac502259ad0.pngbbe59c80-0975-11ee-962d-dac502259ad0.pngbbfc53bc-0975-11ee-962d-dac502259ad0.png

4 實驗

在本文中,作者展示的方法可以從寬基線立體圖像中有效地渲染新視角。作者在不同類型的場景中進行了評估和分析,并且成功應用了該方法在野外捕獲的場景中。

4.1 實驗細節

作者在RealEstate10k和ACID這兩個大型室內外場景的數據集上進行訓練和評估。作者使用67477個場景進行RealEstate10k的訓練和7289個場景進行測試,11075個場景進行ACID的訓練和1972個場景進行測試,按照默認的劃分方法。作者使用256×256分辨率的圖像對作者的方法進行訓練,并在測試場景中評估方法的重建中間視角的能力(詳細信息在附錄中)。

作者將作者的方法與幾種現有的從稀疏圖像觀測中合成新視角的方法進行比較。作者將比較使用像素對齊特征的pixelNeRF和IBRNet,這些特征被解碼成使用體積渲染渲染的3D體積。作者還將與使用視覺變換器骨干計算極線特征和基于光場渲染器計算像素顏色的通用補丁渲染(GPNR)進行比較。這些基線涵蓋了現有方法中使用的各種設計選擇,例如使用CNN和transformer計算的像素對齊特征圖,使用MLP和transformer進行的特征解碼體積渲染以及基于光場的渲染。

作者為所有基線使用公開可用的代碼庫,并使用作者用于公正評估的相同數據集對其進行訓練。有關更多基線的比較,請參見補充材料。評估指標。作者使用LPIPS ,PSNR,SSIM和MSE指標來比較渲染圖像與地面真實圖像的圖像質量。

4.2 室內場景的神經渲染

在各種評估指標下,本文的方法在室內場景中渲染新視角時均優于比較的基線。此外,與其他方法相比,該方法能更好地重建場景的3D結構,并捕獲更多的高頻細節,這為視覺應用提供了更好的合成質量。

bc170040-0975-11ee-962d-dac502259ad0.pngbc28c032-0975-11ee-962d-dac502259ad0.pngbc44c8fe-0975-11ee-962d-dac502259ad0.png

4.3 室外場景的神經渲染

本文研究對具有潛在無界深度的戶外場景進行了神經渲染的評估,展示了定性和定量結果,指出了該方法在重建幾何結構、多視角一致的渲染以及各項指標方面的表現均優于基線方法。

bc52d340-0975-11ee-962d-dac502259ad0.pngbc6d70d8-0975-11ee-962d-dac502259ad0.png

4.4 消融實驗

本文研究進行了組件分析和消融實驗。消融實驗表明了我們方法的各個組件對性能的貢獻,其中包括2D極線采樣、多視編碼器、跨圖像的對應關系匹配、多視一致性的正則化損失以及數據增強。此外,本研究對不同渲染方法的質量和速度進行了比較,結果顯示我們的輕量級方法在質量和速度方面實現了最佳的平衡,并提升了高質量視頻的渲染速度。最后,我們可視化了我們方法中的基礎極線注意權重,用來分析渲染器的學習計算。

bc8c65ec-0975-11ee-962d-dac502259ad0.pngbc9b8c7a-0975-11ee-962d-dac502259ad0.pngbcb30f3a-0975-11ee-962d-dac502259ad0.png

4.5 從不規定姿態圖像中合成新視角

本文提出了一種方法,可以使用寬基線立體圖像合成新視角,即使在未知相對位姿的情況下。在這種情況下,使用SuperGlue計算像素對應關系,使用平均內參估計本質矩陣,從而推導出姿態信息。這一方法可以處理不規定姿態的圖像,能較好地推斷場景的幾何形狀。

5 討論

本文提出了一種通過非常稀疏的視角輸入合成場景的方法。然而,該方法的渲染結果質量不如其他基于更多圖像的優化方法。同時,由于該方法依賴于學習先驗知識,其適用范圍受到限制。雖然該方法能夠擴展到處理多于兩個輸入視角,但是目前只嘗試了處理兩個視角。

6 總結

本文提出了一種僅使用自監督訓練實現從單個寬基線立體圖像對中進行隱式3D重建和新視角合成的方法。該方法利用多視角編碼器、圖像空間對極線特征采樣方案和基于交叉注意力的渲染器,在具有挑戰性場景數據集上超越了以往方法的質量,同時在渲染速度和質量之間取得了很好的平衡。同時,利用對極線幾何在結構化和通用化學習范例之間進行平衡,該方法可在RealEstate10k等現實數據集上進行訓練。

責任編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2878

    瀏覽量

    107549
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24703
  • 渲染器
    +關注

    關注

    0

    文章

    18

    瀏覽量

    3238

原文標題:CVPR2023 I 一種全新的單個寬基線立體圖像對中學習渲染新視角的方法

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于稀疏編碼的遷移學習及其在行人檢測中的應用

    一定進展,但大都需要大量的訓練數據.針對這一問題,提出了一種基于遷移學習的半監督行人分類方法:首先基于稀疏編碼,從任意的未標記樣本中,學習到一個緊湊、有效的特征表示;然后通過遷移學習,將學習到的特征表示
    發表于 04-24 09:48

    【學習打卡】【ELT.ZIP】OpenHarmony啃論文俱樂部——淺析稀疏表示醫學圖像

    瘋狂懂了!原來這就是人眼視覺系統(HVS)【技術DNA】【智慧場景】基于稀疏表示的醫學序列圖像壓縮方法背景隨著醫學影像技術的發展,近年來,各種醫學影像設備產生了大量的醫學數字圖像。醫學數字圖像具有
    發表于 07-09 10:08

    【ELT.ZIP】OpenHarmony啃論文俱樂部——淺析稀疏表示醫學圖像

    瘋狂懂了!原來這就是人眼視覺系統(HVS)【技術DNA】【智慧場景】基于稀疏表示的醫學序列圖像壓縮方法背景隨著醫學影像技術的發展,近年來,各種醫學影像設備產生了大量的醫學數字圖像。醫學數字圖像具有
    發表于 07-09 10:10

    基于特征矢量稀疏分解的DOA估計方法

    基于特征矢量稀疏分解的DOA估計方法_李鵬飛
    發表于 01-07 16:24 ?0次下載

    基于分層稀疏編碼的行人檢測算法

    針對復雜環境中的行人檢測問題,提出了一種有效的基于分層稀疏編碼的圖像表示方法。首先通過兩層稀疏編碼模型結合基于KSVD的深度學習算法來獲得圖像的稀疏
    發表于 11-24 10:24 ?0次下載
    基于分層<b class='flag-5'>稀疏</b>編碼的行人檢測算法

    結合彈性網絡的稀疏分解方法的人臉識別

    動態剔除機制,提出一種結合彈性網絡的稀疏分解方法。通過采用訓練樣本的線性組合來表示測試樣本,并運用迭代機制從所有樣本中剔除對分類貢獻度較小的類別和樣本,采用Elastic Net算法來進行系數分解,從而選擇出對分類貢獻度較大
    發表于 12-05 15:50 ?0次下載
    結合彈性網絡的<b class='flag-5'>稀疏</b>分解<b class='flag-5'>方法</b>的人臉識別

    基于坐標下降的并行稀疏子空間聚類方法

    問題,提出一種基于坐標下降的并行稀疏子空間聚類方法。該方法利用稀疏子空間聚類可以建模為求解一系列的樣本自稀疏表達子問題的特點,使用坐標下降
    發表于 12-23 11:48 ?0次下載
    基于坐標下降的并行<b class='flag-5'>稀疏</b>子空間聚類<b class='flag-5'>方法</b>

    基于塊稀疏表示的行人重識別方法

    針對非重疊視角下的行人重識別和高維特征提取等問題,提出基于塊稀疏表示的行人重識別方法。采取典型相關分析( CCA)方法進行特征投影變換,通過
    發表于 03-29 14:57 ?0次下載

    如何使用自適應嵌入的半監督多視角特征實現降維的方法概述

    半監督模式下的多視角特征降維方法,大多并未考慮到不同視角間特征投影的差異,且由于缺乏對降維后的低維矩陣的稀疏約束,無法避免噪聲和其他不相關特征的影響。針對這兩個問題,提出自適應嵌入的半
    發表于 12-18 14:19 ?10次下載
    如何使用自適應嵌入的半監督多<b class='flag-5'>視角</b>特征實現降維的<b class='flag-5'>方法</b>概述

    稀疏投影CT重建圖像的條形偽影解決方法

    稀疏投影CT重建圖像的條形偽影解決方法
    發表于 06-18 11:43 ?5次下載

    基于稀疏采樣的GPS軌跡數據路口識別方法

    基于稀疏采樣的GPS軌跡數據路口識別方法
    發表于 06-28 16:52 ?20次下載

    稀疏微波成像的研究案例

    此基礎上介紹了稀疏微波成像的主要研究進展以及原理樣機的機載飛行實驗,實驗結果表明了稀疏微波成像原理和 方法的可行性和有效性;另外,該文還討論了稀疏微波成像在 3 維雷達成像、逆
    發表于 05-27 16:24 ?10次下載

    從多視角圖像做三維場景重建 (CVPR&apos;22 Oral)

    最近,有方法提出基于隱式神經表示做三維重建。NeRF [3] 通過可微分的體積渲染技術從圖像中學習隱式輻射場。NeRF可以實現有真實感的視角合成,但是幾何重建結果噪音很嚴重,主要是因為
    的頭像 發表于 02-20 10:11 ?2832次閱讀

    近場合成孔徑雷達稀疏測量微波成像簡析

    基于寬帶微波合成孔徑雷達系統稀疏測量的10種圖像重建方法的實驗研究。這四種方法包括兩種使用零填充(ZF)和非均勻快速傅里葉變換(NUFFT)的去噪
    的頭像 發表于 05-12 14:48 ?1431次閱讀
    近場<b class='flag-5'>合成</b>孔徑雷達<b class='flag-5'>稀疏</b>測量微波成像簡析

    讀者理解:LEAP泛化到新的物體類別和場景

    本文主要介紹了兩個與NeRF(Neural Radiance Fields)相關的工作,分別是針對稀疏視角輸入的NeRF變體和稀疏視角相機姿
    的頭像 發表于 10-17 15:46 ?479次閱讀
    讀者理解:LEAP泛化到新的物體類別和<b class='flag-5'>場景</b>
    主站蜘蛛池模板: 美女黄18以下禁止观看| 无遮挡很爽很污很黄的网站w| 五月天色网址| 亚洲精品成人在线| 另类激情网| 欧美在线视频7777kkkk| 日本亚洲一区二区| 欧美激情91| 奇米欧美成人综合影院| 美女把尿口扒开让男人桶出水 | 久久xxxx| 四虎成人影院网址| 夜夜操天天| 日本免费一区二区在线观看| 欧美xxxxx性视频| 欧美综合天天夜夜久久| 永久免费品色堂| 国产乱码精品一区二区三| 51xx嘿嘿午夜| 午夜伦y4480影院中文字幕| 草逼网址| 嫩草影院在线入口| 欧美jizzhd精品欧美4k| 亚洲综合啪啪| www五月婷婷| 69日本xxxhd| 你懂的免费在线| 国产伦精品一区二区三区在线观看| 亚洲综合色吧| 一级录像| 国产在播放一区| 成人女人a毛片在线看| 久久草在线看| 婷婷了五月色香综合缴情| 亚洲免费黄色网址| 国产叼嘿视频免费网站| 成人三级电影在线观看| 中文字幕亚洲一区二区三区| 久久99精品久久久久久野外| 在线视频91| 免费人成激情视频在线观看冫|