在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探索ICLR‘24 Spotlight中的首個十億級別3D通用大模型

3D視覺工坊 ? 來源:3DCV ? 2024-01-25 10:10 ? 次閱讀

智源視覺團隊近期的工作:3D視覺大模型Uni3DICLR 2024的評審中獲得了688分,被選為Spotlight Presentation。在本文中,作者第一次將3D基礎模型成功scale up到了十億(1B)級別參數量,并使用一個模型在諸多3D下游應用中取得SOTA結果。代碼和各個scale的模型(從6M-1B)均已開源:

3ebcb348-bb0d-11ee-8b88-92fbcf53809c.png

作者主要探索了3D視覺中scale up模型參數量和統一模型架構的可能性。在NLP / 2D vision領域,scale up大模型(GPT-4,SAM,EVA等)已經取得了很impressive的結果,但是在3D視覺中模型的scale up始終沒有成功。Uni3D旨在將NLP/2D中scale up的成功復現到3D表征模型上。

wKgaomWxwz2APhVyAAK0x5tfPxA652.png

在這項工作中,作者提出了一個3D基礎大模型Uni3D,直接將3D backbone統一為ViT(Vision Transformer),以此利用豐富和強大的2D預訓練大模型作為初始化。Uni3D使用CLIP模型中的文本/圖像表征作為訓練目標,通過學習三個模態的表征對齊(點云-圖像-文本)實現3D點云對圖像和文本的感知。同時,通過使用ViT中成功的scale up策略,我們將Uni3D逐步 scale up,訓練了從Tiny到giant的5個不同scale的Uni3D模型,成功地將Uni3D擴展到10億級別參數。

3ed39fcc-bb0d-11ee-8b88-92fbcf53809c.png

下游應用:

Uni3D在多個3D任務上達到SoTA,如:zero-shot classification, few-shot classification,open-world understanding, open-world part segmentation.

零樣本/少樣本分類

Uni3D在ModelNet上實現了88.2%的零樣本分類準確率,甚至接近了有監督學習方法的結果(如PointNet 89.2 %);

在最困難的Objaverse-LVIS基準下,Uni3D取得了55.3%的零樣本分類準確率,大幅刷新了該榜單。

而在Objaverse-LVIS基準的少樣本分類測試中,Uni3D實現了83.1%的準確率(16樣本下),明顯超過了以往的最先進基準OpenShape 32%。

3ed74f32-bb0d-11ee-8b88-92fbcf53809c.png

開放世界的理解能力

研究團隊采用與CLIP2相同的設置在ScanNet測試集下探究Uni3D在現實場景下的零樣本識別性能。與之前最先進的SOTA方法PointCLIP、PointCLIP V2 、CLIP2Point 和CLIP2 相比,Uni3D表現最佳。

3f647e02-bb0d-11ee-8b88-92fbcf53809c.png

3f68d704-bb0d-11ee-8b88-92fbcf53809c.png

Uni3D在少樣本點云部件分割任務上也展示出了卓越的性能。下表結果顯示,在各種實驗條件下,Uni3D的性能都明顯優于Point-BERT等基線方法。即便只使用每類一個樣本訓練,Uni3D也達到了使用10%的訓練數據的先前基線方法(如PointNet++,Point-BERT)的水平,在訓練集的規模相對減少兩個數量級的情況下,仍能顯示出Uni3D更強的細粒度3D結構理解能力。

3f89fe3e-bb0d-11ee-8b88-92fbcf53809c.png

由于學到了強大的多模態表征能力,Uni3D還能夠做一些有意思的應用,如point cloud painting(點云繪畫),text/image-based 3D shape retrieval(基于圖像/文本的3D模型檢索),point cloud captioning(點云描述):

點云繪畫:體現了在3D AIGC上的潛在能力

給定一個文本,Uni3D通過優化點云的顏色來提高點云和文本在特征空間的相似度,基于此實現文本操控的點云內容創作和點云繪畫。

3f8dd298-bb0d-11ee-8b88-92fbcf53809c.png

文本驅動/圖像驅動的三維形狀檢索:體現在構建多模態檢索庫上的潛在能力

Uni3D通過學習到的統一的三維多模態表示,具有感知多個2D/語言信號的能力,可以通過圖像或文本輸入從大型3D數據集中檢索三維形狀。這是通過計算查詢圖像/文本提示的embedding與3D形狀的embedding入之間的余弦相似度來實現了對查詢的最相似3D形狀的獲取。

Uni3D 還可根據輸入文本來檢索 3D 形狀

將之前已經成熟的“文搜圖/圖搜圖”擴展到“文搜3D/圖搜3D”,這使得檢索互聯網上大規模未標定的繁雜三維模型成為可能,為相關三維領域從業者、創作者搜集素材提供實用工具。

Uni3D 還可給定點云生成對應的文本描述

Uni3D擴展為Text-to-3D generation tasks的評測指標

在text-to-3D研究領域,目前量化度量仍然是一個較難的問題。目前的量化指標都是將生成的3D模型渲染為2D圖片,利用2D指標衡量生成質量。然而由于渲染角度互相獨立以及3D模型自遮擋等問題,2D評價指標難以完全真實反映出3D生成模型的真實能力。如下圖,生成的3D模型有明顯的3D不一致性問題,但是單獨看其中大部分的視角渲染圖片都是正常的物體,導致2D評價指標往往難以反映生成3D模型的不一致問題。

作者團隊近期推出的Text-to-3D generation 工作GeoDream提出利用目前最大最強的3D基礎模型Uni3D,直接對3D模型進行評估,避免渲染帶來的視角問題。相應的評價指標代碼也開源到GeoDream的代碼庫中 (https://github.com/baaivision/GeoDream) 。

量化比較:在生成質量和語義保持性的量化測試上,GeoDream相比于之前方法取得顯著提升。在基于渲染2D圖片的量化指標(FID,CLIP-Score)和直接在3D空間度量生成的3D資產量化指標(Uni3D-Score)上均有提升,說明GeoDream渲染的圖片和3D結構均有優勢。

3fe8b046-bb0d-11ee-8b88-92fbcf53809c.png

審核編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D視覺
    +關注

    關注

    4

    文章

    433

    瀏覽量

    27527
  • 大模型
    +關注

    關注

    2

    文章

    2459

    瀏覽量

    2736

原文標題:ICLR‘24 Spotlight 首個十億級別3D通用大模型

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ad193d模型不顯示?

    封裝庫導入3d模型不顯示,但導入3d模型后的封裝庫生成pcb文件時顯示3d模型,這是什么原因導致
    發表于 04-24 13:41

    LABVIEW如何驅動3D模型

    基于soildwork繪制的3D機器人模型,要求實際的機器人在運動時,將3D模型加載在LABVIEW,與實際機器人同步動作,做運動演示。
    發表于 02-28 16:51

    Labview 3D模型

    新手求助……有沒有哪位大神會利用labview顯示3D模型(含裝配體,需要轉動不同的部位)嗎?是用3D傳感器映射啊?
    發表于 08-26 01:20

    Labview如何導入3D模型

    Labview如何導入3D模型,例如3Dmax生成的模型。嘗試過用.STL格式導入Labview。但是
    發表于 01-26 13:13

    3d模型問題

    最近在學3d模型,遇到些問題,請教大家。1.3D模型的格式。模型是用3dmax做的,為
    發表于 11-12 17:14

    分享貼片3D模型

    分享貼片3D模型
    發表于 12-18 21:08

    浩辰3D軟件如何創建槽特征?3D模型設計教程!

    3D模型設計創建槽特征是十分常見的,那么在浩辰3D軟件如何創建槽特征呢?下面小編就來給大家介紹一下浩辰
    發表于 09-28 16:16

    浩辰3D軟件入門教程:如何比較3D模型

    差異。步驟一:點選「比較模型」功能在浩辰3D軟件的開始菜單,選擇「工具」選項卡,并且點選「比較模型」功能。輸入參考模型和工作
    發表于 12-15 13:45

    AD的3D模型繪制功能介紹

    `  首先,在封裝庫的編輯界面下,我們點擊菜單欄目的Place-》3D Body,見圖(1)。    圖(1)3D模型打開步驟  打開后就會出現信息編輯界面,見圖(2)。我們可以看到AD的3D
    發表于 01-14 16:48

    3D模型的基礎介紹

    3D模型基礎
    發表于 01-28 07:50

    3D設計軟件怎么創建風扇葉模型?浩辰3D基礎教程

    環節。下面,小編將通過繪制生活中常見的風扇葉模型,展示如何通過浩辰3D設計軟件高效地完成日常的創新設計需求。1、葉轂繪制在浩辰3D設計軟件的草圖選項卡,點選「草圖繪制」,繪制出葉轂的
    發表于 06-04 14:11

    3D模型

    3D模型, 淘寶網上買的3D元器件庫需要的自行下載
    發表于 11-04 15:36 ?0次下載

    3D技術的應用探索3D機器視覺庫

    3D技術的應用探索3D機器視覺庫 的資料。
    發表于 03-22 15:01 ?0次下載

    關于 AD 如何創建 3D 模型及設計教程 Ver1.0

    關于Altium_Design如何創建3D模型3D設計教程Ver1.0
    發表于 01-25 17:24 ?29次下載

    高分工作!Uni3D3D基礎大模型,刷新多個SOTA!

    我們主要探索3D視覺scale up模型參數量和統一模型架構的可能性。在NLP / 2D v
    的頭像 發表于 01-30 15:56 ?889次閱讀
    高分工作!Uni<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>基礎大<b class='flag-5'>模型</b>,刷新多個SOTA!
    主站蜘蛛池模板: tv电影天堂| 久久www免费人成看片色多多| 久久成人亚洲| 毛片毛片免费看| 久久久精品免费国产四虎| 美女视频黄视大全视频免费网址| 美日毛片| 国产亚洲新品一区二区| 国产高清在线看| 亚洲丝袜一区二区| 一区二区三区四区五区| 久久是精品| 国产精品久久福利网站| 免费大片黄国产在线观看| 亚洲免费在线看| www三级| 亚洲国产日韩精品怡红院| 天天操电影| 欧美色欧| 国产成人精品1024在线| 久久精品9| 大香伊人网| 天天草b| 97久草| 国产精品久久久久影视不卡| 欧美小网站| 亚洲黄色官网| 国产精品一级香蕉一区| 又粗又长又爽又长黄免费视频| 亚洲欧美日韩特级毛片| 亚洲黄色小视频| 久久澡人人澡狠狠澡| 亚洲精品美女久久久久网站| 可以在线看黄的网站| 8888四色奇米在线观看不卡| 最近2018中文字幕2019高清| 特级毛片免费视频观看| 久久婷婷影院| 天天干天天射天天爽| www.射射| 一区二区三区网站|