在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CVPR 2023最佳論文候選!真實高精3D物體數據集OmniObject3D

CVer ? 來源:CVer ? 2023-06-19 15:30 ? 次閱讀

導讀

為了促進真實世界中感知、重建和生成領域的發展,我們提出了 OmniObject3D,一個高質量的大類別真實三維物體數據集。本數據集有三個主要優勢:1)類別豐富:覆蓋 200 余個類別的約 6K 個三維物體數據;2)標注豐富:包括了高精表面網格、點云、多視角渲染圖像,和實景采集的視頻;3)真實掃描:專業的掃描設備保證了物體數據的精細形狀和真實紋理。

OmniObject3D 是目前學界最大的真實世界三維掃描模型數據集,為未來的三維視覺研究提供了廣闊的空間。利用該數據集,我們探討了點云識別、神經渲染、表面重建、三維生成等多種學術任務的魯棒性和泛化性,提出了很多有價值的發現,并驗證了其從感知、重建、到生成領域的開放應用前景。我們希望 OmniObject3D 以及其對應的 benchmarks 能夠為學術研究和工業應用帶來新的挑戰和機會。作為 CVPR 2023 的投稿,我們收到了 4 位審稿人的一致滿分評價,并獲推CVPR Award Candidate(top 12 / 9155)。

論文名稱:

OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation

6a16fc12-0e72-11ee-962d-dac502259ad0.png

背景介紹

面向真實 3D 物體的感知、理解、重建與生成是計算機視覺領域一直倍受關注的問題,也在近年來取得了飛速的進展。然而,由于社區中長期缺乏大規模的實采 3D 物體數據庫,大部分技術方法仍依賴于 ShapeNet[1] 等仿真數據集。再者,仿真數據與真實數據之間的外觀和分布差距巨大,這大大限制了它們在現實生活中的應用。

為了解決這一困難,近年來也有一些優秀的工作如 CO3D[2] 等從視頻/多視角圖片中尋求突破點,并利用 SfM 的方式重建 3D 點云,然而這種方式得到的點云往往難以提供完整、干凈、精準的 3D 表面和紋理。因此,社區迫切需要一個大規模且高質量的真實世界 3D 物體掃描數據集,這將有助于推進許多3D視覺任務和下游應用。

6a4c36fc-0e72-11ee-962d-dac502259ad0.png

仿真數據與真實掃描數據的對比:仿真數據的紋理和幾何往往比較簡單且失真。

6a597a24-0e72-11ee-962d-dac502259ad0.jpg

多視角圖片重建點云與真實掃描數據的對比。重建點云往往含有噪聲,且無法恢復精細的表面與紋理,在沒有拍攝到的位置存在大面積空洞。

數據集特點

OmniObject3D 為每一個物體提供了四種模態信息,包括:帶紋理的高精模型、點云、多視角渲染圖像、實景拍攝的環繞視頻。對于每個拍攝的視頻,我們平均抽取了 200 幀,并提供前景掩碼和 SfM 重建的相機位姿和稀疏點云。

6a775f62-0e72-11ee-962d-dac502259ad0.jpg

6a80d66e-0e72-11ee-962d-dac502259ad0.jpg

模態示例

文件層級

數據集的整體類別內物體數量呈長尾分布,與 ImageNet[3]、COCO[4]、LVIS[5] 和 ShapeNet[1] 等熱門 2D 及 3D 數據集中的常見類別有高度共享。

6a8c06ce-0e72-11ee-962d-dac502259ad0.png

每個類別內物體數量分布圖

下游應用

OmniObject3D 為學界帶來了廣泛的探索空間,在本文中,我們選取了四個下游任務進行評估與分析。

任務一:

點云分類魯棒性(Point Cloud Classification Robustness)

物體點云分類是 3D 感知中最基本的任務之一。在本節中,我們展示了 OmniObject3D 如何通過解耦 out-of-distribution styles & out-of-distribution corruptions 來實現更全面的點云分類的魯棒性分析。

6abce62c-0e72-11ee-962d-dac502259ad0.png

OmniObject3D 提供了一個干凈的真實世界物體點云數據集,使得能夠針對 OOD styles & OOD corruptions 的魯棒性進行細粒度分析。

具體來說,1)CAD 模型與真實掃描模型之間的差異引入了 OOD styles;2)常見點云破壞因子產生了 OOD corruptions。

在之前的研究工作中,含噪的真實物體數據集如 ScanObjectNN[6] 將兩種情況藕合起來,無法實現解耦分析;主動加入破壞因子的仿真數據集如 ModelNet-C[7] 則僅僅反映了第二種情況。OmniObject3D 則具備將兩種情況解耦分析的要素。

我們對十種最常見的點云分類模型進行了測試,并揭示了其與 ModelNet-C 數據集中結論的異同。在應對這兩個挑戰時,如何實現一個真正魯棒的點云感知模型仍需更加深度的探索。

6ac939e0-0e72-11ee-962d-dac502259ad0.png

點云分類魯棒性實驗結果

6ab253c4-0e72-11ee-962d-dac502259ad0.gif

任務二:

新視角合成(Novel View Synthesis)

自 NeRF[8] 提出以來,新視角合成一直是領域內的一個熱門方向。

我們在 OmniObject3D 上研究了兩種賽道下的新視角合成方法:

1)利用密集視角圖片輸入,對單一場景進行優化訓練;

2)挖掘數據集中不同場景之間的先驗,探索類 NeRF 模型的泛化能力。

首先,對于單場景優化的模型,我們觀察到基于體素的方法會更加擅長建模高頻紋理信息,而基于隱式模型的方法則相對更能抵抗表面凹陷或弱紋理等容易產生幾何歧義的情況。

數據集中物體多變而復雜的形狀和外觀為這項任務提供了一個全新的評估基準。

6adb5e54-0e72-11ee-962d-dac502259ad0.png

多個常見方法的單場景優化效果示例

相對于擬合的單個場景的模型,跨場景可泛化框架在本數據集上的表現則更令人期待。網絡從很多同類別、甚至跨類別的數據中學習到可以泛化的信息,即可對于一個全新場景的稀疏視角輸入做出新視角預測。

實驗表明,作為一個幾何和紋理信息豐富的數據集,OmniObject3D 有助于促使模型學到對新物體或甚至新類別的泛化能力。

6ae87bd4-0e72-11ee-962d-dac502259ad0.gif

泛化性模型效果示例

6ab253c4-0e72-11ee-962d-dac502259ad0.gif

任務三:

表面重建(Surface Reconstruction)

除了新視角合成外,如果能恢復物體的顯式表面,將更加有助于下游應用的開發。同時,我們的數據具備精準且完整的三維表面,能夠充分支持表面重建精度的評測需要。

類似的,我們也為表面重建任務設置了兩條賽道:

1)稠密視角采樣下的表面重建;

2)稀疏視角采樣下的表面重建。

稠密視角下表面重建結果展示了數據集內幾何形狀的顯著多樣性。精準的掃描使得我們能夠使用 Chamfer Distance 作為重建精度的度量。將類別劃分為三個“難度”等級,可以觀察到所有方法在不同等級上的結果存在明顯的差距。

與僅包含 15 個場景的標準 DTU[9] 基準相比,我們的數據集在這項任務上提供了更全面的評估結果。

6afc51ea-0e72-11ee-962d-dac502259ad0.gif

6b1945fc-0e72-11ee-962d-dac502259ad0.gif

6b2ee614-0e72-11ee-962d-dac502259ad0.gif

稠密視角表面重建示例

稀疏視圖表面重建是一個更具挑戰性的任務,在所有方法的結果中我們都觀察到了明顯瑕疵,均未達到能夠滿足實際應用的水平。

除了專為稀疏視角表面重建設計的方法外,我們還評估了前面提到的泛化性新視角合成模型的幾何恢復能力——數據集提供的精準 3D Ground Truth 在評測中再次發揮了優勢,然而他們的表現同樣無法令人滿意。

綜上所述,這個問題的探索空間仍然巨大,而 OmniObject3D 為該領域進一步的研究提供了扎實的數據基礎。

6b90f908-0e72-11ee-962d-dac502259ad0.png

稠密和稀疏視角表面重建效果示例

6ab253c4-0e72-11ee-962d-dac502259ad0.gif

任務四:

3D 物體生成(3D Object Generation)

除了重建之外,OmniObject3D 還可以用來訓練真實 3D 物體的生成模型。我們采用 GET3D[10] 框架同時生成形狀和紋理,并嘗試使用單個模型從數據集中同時學習多種類別的生成。

6ba5f33a-0e72-11ee-962d-dac502259ad0.png

帶紋理的 3D 物體生成

通過在隱空間插值,可以觀察到生成模型跨類別變化的特性。我們在文章中還著重探討了由于訓練數據不平衡導致的生成語義分布失衡特點,詳細請參考論文。

6baeb6c8-0e72-11ee-962d-dac502259ad0.png

形狀和紋理低維隱碼插值結果

未來工作

關于數據集本身,我們會致力于不斷擴大和更新數據集以滿足更廣泛的研究需求。除了現有的應用,我們還計劃進一步發展其他下游任務,如 2D / 3D 物體檢測和 6D 姿態估計等。除了感知和重建任務外,在 AIGC 時代,我們相信 OmniObject3D 能夠在推動真實感 3D 生成方面發揮至關重要的作用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2882

    瀏覽量

    107585
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24713
  • AIGC
    +關注

    關注

    1

    文章

    362

    瀏覽量

    1550

原文標題:CVPR 2023最佳論文候選!真實高精3D物體數據集OmniObject3D

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    下一站創新:3D顯示屏、3D物體識別技術?

    “視網膜”之后會出現什么樣的顯示屏呢?可能是可彎折顯示屏,也可能是3D顯示屏。比起指紋識別,似乎3D物體識別聽起來會更酷一些。最近,在網上就曝光了亞馬遜將配備于自家智能手機的3D
    發表于 10-23 09:26 ?1372次閱讀

    基于深度學習的方法在處理3D點云進行缺陷分類應用

    背景部分介紹了3D點云應用領域中公開可訪問的數據的重要性,這些數據對于分析和比較各種模型至關重要。研究人員專門設計了各種
    的頭像 發表于 02-22 16:16 ?1179次閱讀
    基于深度學習的方法在處理<b class='flag-5'>3D</b>點云進行缺陷分類應用

    3D掃描的結構光

    耐用性。由于尺寸、冷卻和電池要求,系統設計將光通量和能效視為重中之重。 目前有很多對3D結構光圖形進行優化的技術。其中一個特別有效的方法就是自適應圖形。算法確定了圖形與波長的最佳組合,以提高被掃描
    發表于 08-30 14:51

    浩辰3D的「3D打印」你會用嗎?3D打印教程

    設計。由浩辰CAD公司研發的浩辰3D作為從產品設計到制造全流程的高端3D設計軟件,不僅能夠提供完備的2D+3D一體化解決方案,還能一站式集成3D打印的多元化
    發表于 05-27 19:05

    基于3D打印的原理及應用

    3D打印原理:分層打印(2D)與層疊堆砌(3D), 3D打印(3DP)即快速成型技術的一種,它是一種以數字模型文件為基礎,運用粉末狀金屬或塑
    發表于 09-23 10:19 ?20次下載

    自動駕駛的核心基礎在3D地圖

    要想自動駕駛落地應用,趕緊搞高清3D地圖吧,目前,全球科技巨頭早已默默布局這一領域,同時眾多創企也在對3D地圖技術發力。
    發表于 02-25 22:17 ?1531次閱讀
    自動駕駛的核心基礎在<b class='flag-5'>高</b><b class='flag-5'>精</b><b class='flag-5'>3D</b>地圖

    探討3D地圖對無人駕駛汽車的重要性

    3D地圖對無人駕駛汽車至關重要,不僅提供位置信息,還承擔安全功能,但目前該行業呈碎片化,面臨數據收集和缺乏標準的問題。
    的頭像 發表于 08-14 09:54 ?4737次閱讀

    3D技術在全方位汽車立體監視系統中應用

    3D基于人對空間和物體的認知,是有深度、全視角的。3D可使人們獲得更直觀和互動的體驗。生成3D圖像需要復雜尖的圖像顯示控制器(Graphi
    的頭像 發表于 11-01 07:55 ?2141次閱讀

    地圖之3D柵格地圖的應用

    什么是3D柵格地圖
    的頭像 發表于 07-24 10:58 ?8246次閱讀

    谷歌AI發布3D物體數據,附帶標記邊界框、相機位姿、稀疏點云

    見過3D物體數據,見過會動的3D物體數據
    的頭像 發表于 11-13 14:28 ?2266次閱讀

    NVIDIA 3D MoMa:基于2D圖像創建3D物體

    可逆渲染流程 NVIDIA 3D MoMa 將于本周在新奧爾良舉行的計算機視覺和模式識別會議 CVPR 上亮相。
    的頭像 發表于 06-23 11:00 ?1298次閱讀

    3D點云數據3D數字化技術中的應用

    隨著計算機視覺技術的不斷發展,3D 數字化技術已經成為了當今工業制造領域和三維醫學影像領域的關鍵技術。然而,構建高精度、高分辨率的 3D 點云數據對于實現這一技術至關重要。在這篇文章
    的頭像 發表于 05-06 16:46 ?1449次閱讀

    3D形狀分析利器】3D掃描應用案例分享

    3D數據集成度測量頭,包含高低倍鏡頭,軟件一鍵切換可與3D-CAD對比,實現形變的可視化,失效分析等【主要應用方向:】3D對比:對比產品與
    的頭像 發表于 02-01 11:50 ?1138次閱讀
    【<b class='flag-5'>3D</b>形狀分析利器】<b class='flag-5'>3D</b>掃描應用案例<b class='flag-5'>集</b>分享

    創造歷史!商湯聯合團隊斬獲CVPR最佳論文,推出首個“感知決策一體化”自動駕駛通用大模型

    一篇最佳論文,一篇最佳論文候選,共計54篇論文被接收 ,商湯科技及聯合實驗室交出
    的頭像 發表于 06-22 06:15 ?458次閱讀
    創造歷史!商湯聯合團隊斬獲<b class='flag-5'>CVPR</b><b class='flag-5'>最佳</b><b class='flag-5'>論文</b>,推出首個“感知決策一體化”自動駕駛通用大模型

    Nullmax提出多相機3D目標檢測新方法QAF2D

    今天上午,計算機視覺領域頂會CVPR公布了最終的論文接收結果,Nullmax感知部門的3D目標檢測研究《Enhancing 3D Object Detection with 2
    的頭像 發表于 02-27 16:38 ?1148次閱讀
    Nullmax提出多相機<b class='flag-5'>3D</b>目標檢測新方法QAF2<b class='flag-5'>D</b>
    主站蜘蛛池模板: 99久热只有精品视频免费观看17| 免费的三及片| 免费日韩一级片| 在线免费日韩| 欧美一卡二卡3卡4卡无卡六卡七卡科普 | 澳门久久| 手机看片欧美日韩| 国产一级aaa全黄毛片| 黄色三级视频| 二级黄绝大片中国免费视频| 全国男人的天堂天堂网| 一级毛片a| 亚洲一区二区三区中文字幕5566| 永久免费av网站| 狠狠色噜噜狠狠狠狠97影音先锋| 在线视频亚洲欧美| 四虎影院永久网址| 亚洲伊人久久大香线蕉结合| 亚洲jjzzjjzz在线观看| 在线色国产| 亚洲国产精品综合久久网络| 色多多www网站| 天堂在线中文字幕| 一级做a爱片特黄在线观看免费看| 亚洲xxx视频| 欧美精品videosex性欧美| 色老头久久网| 扛着高跟鞋丝袜腿呻吟视频| free 欧美| 国产精品久久久精品视频| 夜夜cao| 国产精品天天干| 国产日日操| 亚洲一二| 亚洲人成电影在线| 欧美zoozzooz性欧美| 99国产国人青青视频在线观看| 成人一二| 99久久亚洲国产高清观看| 日韩爱爱| 韩国理论片2023现在观看|