在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA拿下CVPR 2023 3D Occupancy預測第一名!

CVer ? 來源:機器之心 ? 2023-06-21 14:04 ? 次閱讀

自動駕駛中的三維占用預測難題,一場比賽給出了解決方案。

道路錯綜復雜、交通工具形態各異、行人密集,這是當前城市道路交通的現狀,也是自動駕駛領域面臨的現實挑戰。為了應對這一挑戰,感知和理解三維環境至關重要。

在傳統的三維物體檢測任務中,前景物體通常由三維邊界框表示。然而,這種方法存在一些弊端,一方面,現實世界的物體幾何形狀非常復雜,無法用簡單的三維框表示;另一方面,這種方法容易忽略背景元素的感知。對于實現全面的 L4/L5 自動駕駛,傳統的三維感知方法是遠遠不夠的。

最近,端到端自動駕駛研討會 (End-to-End Autonomous Driving Workshop) 聯合視覺中心自動駕駛研討會 (Vision-Centric Autonomous Driving Workshop) 在 CVPR 2023 上舉辦了自動駕駛挑戰賽,其中就包括三維占用預測(3D occupancy prediction)賽道。

dab614dc-0ff1-11ee-962d-dac502259ad0.png

圖 1 CVPR2023 自動駕駛挑戰賽

三維占用預測是自動駕駛領域的新興任務,要求對車輛行駛場景進行細粒度建模,對于實現自動駕駛的通用感知能力有著重要意義。比賽提供基于 nuScenes 數據集的大規模占用預測評估基準,對三維空間進行體素化表示,并在三維占用任務的基礎上結合兩項新任務:估計三維空間中體素的占據狀態和語義信息。整個任務旨在在給定多視角圖像的情況下對三維空間進行密集預測。

本次比賽是三維占用感知領域的首個國際頂尖權威賽事,吸引了業界和學界的廣泛關注。比賽共有 149 個團隊參與角逐,其中包括來自小米汽車,華為,42dot,海康威視的業界團隊,也有來自北京大學,浙江大學,中國科學院等科研院所的學術界團隊。

最終,來自英偉達 (NVIDIA) 和南京大學的團隊在激烈的競爭中脫穎而出,同時贏得了三維占用預測任務的冠軍和最佳創新獎兩個重磅獎項。下面我們來看一下冠軍團隊的獲獎方案。

冠軍方案

不同于以往比賽對于數據利用方面的限制,本次自動駕駛比賽允許參賽者使用額外的開源數據或者模型進行數據驅動算法的探索。因此在本次比賽中,英偉達和南大的研究人員在設計高效的模型結構的基礎上,也在大模型的訓練方面進行了探索,將模型參數擴展到 10 億量級,達到過去常用 3D 感知模型的 10 倍以上。

憑借先進的模型結構設計和大模型強大的表征能力,該團隊提出的方案 FB-OCC 實現了單模型 50+% mIoU 的出色性能,并最終取得了 54.19% mIoU 的最佳成績。

網絡架構

FB-OCC 的主要創新在于使用了前向和后向投影相結合的三維空間建模方式。

如圖 2 所示,在前向投影過程中,參考 LSS 投影范式,FB-OCC 會根據每個像素的深度分布生成場景對應的三維體素 (3D voxel) 表征。同時,由于 LSS 范式生產的特征傾向于稀疏且不均勻,FB-OCC 引入反向投影機制來優化稀疏的場景特征。

db056b86-0ff1-11ee-962d-dac502259ad0.png

圖 2 網絡架構圖

此外,考慮到計算負擔,FB-OCC 在方向投影的過程中會將場景特征壓縮為鳥瞰圖 (BEV) 表征,最后將三維體素表征和鳥瞰圖表征相結合。結合后得到的三維體素特征在后續還會經過額外的體素編碼器 (Voxel encoder) 來增強特征感受野。

大規模模型探索

增加模型參數量是提升模型精度的最便捷的方式,但在三維視覺感知領域,研究人員發現更大規模的模型更容易產生過擬合現象,而現有主流感知模型的參數仍在 100M 量級。

在本次比賽中,FB-OCC 模型嘗試使用 10 億參數量級的 InternImage 主干網絡,模型總體參數量是現有常用模型的十倍以上。大模型訓練通常需要大數據與之匹配,但受限于自動駕駛數據采集標注的高昂成本,開源的三維感知數據集并不足以支撐 10 億參數規模的模型。

針對這個痛點,FB-OCC 使用了多輪預訓練機制。由于可獲取的二維感知數據集遠遠豐富于三維感知數據,FB-OCC 首先在大規模開源數據集 Objects365 上進行通用目標檢測預訓練。然后,如圖 3 所示,FB-OCC 引入深度和語義聯合預訓練來建立二維感知和三維感知的橋梁。

db11d3c6-0ff1-11ee-962d-dac502259ad0.png

圖 3 深度和語義聯合預訓練

為了生成語義分割標簽,FB-OCC 還使用 Meta 的 SAM 模型來進行自動標注,分別使用框提示和點提示來生成不同類別的語義。經過多輪預訓練后,大規模模型在占用感知任務上可以避免嚴重的過擬合問題。

實驗結果

研究團隊在實驗中證明了 FB-OCC 的出色性能。如表 1 所示,FB-OCC 在 ResNet-50 主干網絡以及 256x704 分辨率的輸入圖像下,借助時序融合、深度監督等技術,模型性能從最初的 23.12% mIoU 增長至 42.06% mIoU。

db467086-0ff1-11ee-962d-dac502259ad0.png

表 1 小規模模型的消融實驗結果

為了獲得更好的精度,FB-OCC 使用了更大參數量的模型。如表 2 所示,在 400M 的模型規模下,FB-OCC 獲得了單模型 50+% mIoU 的效果。借助 InternImage 主干網絡,10 億參數量級的模型進一步取得了 52.79% 的極佳效果。

db921b30-0ff1-11ee-962d-dac502259ad0.png

表 2 不同模型規模下的效果

最終,FB-OCC 多個模型的集成結果取得了目前測試集上最高的準確率 ——54.19%,贏得了比賽的冠軍并被授予最佳創新獎。FB-OCC 為自動駕駛中復雜的三維占用預測問題貢獻了新的思路。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5013

    瀏覽量

    103244
  • 三維
    +關注

    關注

    1

    文章

    510

    瀏覽量

    29000
  • 自動駕駛
    +關注

    關注

    784

    文章

    13856

    瀏覽量

    166587

原文標題:NVIDIA拿下CVPR 2023 3D Occupancy預測第一名!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    祝賀 | 鵬城實驗室開源 EDA 團隊勇奪 ICCAD 競賽第一名

    的 iEDA 3Dplacer 團隊獲得了該項賽事三大賽道之第一名。本屆 CAD Contest@ICCAD 算法競賽共有來自國內外知名高校與研究機構的166 支隊伍參與,如東京大學、臺灣大學
    發表于 12-13 18:29

    口碑最好的國產手機,華為mate9排第五!第一名你認可嗎!

    近日,安兔兔發布了2017年1月安卓手機好評TOP10,從發布的榜單來看,基本都是近期比較熱門的手機,這里就為大家盤點下。第一名:小米MIX第二/三3/
    發表于 02-13 11:57 ?7168次閱讀

    三星認為自家手機才是手機拍照的第一名

    昨晚華為發布的P30 Pro手機登上DxOMark(以下簡稱DxO)后置拍照排行榜第一名的位置。三星對此表示不服,今天三星官方微博將Galaxy S10+ DxO前置拍照得分和后置得分加在起,總分超過華為了P30 Pro,他們認為自己才是手機拍照
    發表于 03-28 09:42 ?631次閱讀

    iPhone 11依舊占據手機銷量的第一名

    最近看到雙11戰況,好像最賣力的品牌就是蘋果了,因為iPhone 11直牢牢占據了手機銷量的第一名,4999元不占優勢就4799元,大有舍我其誰的架勢。而在其之后,都是1000多元的性價比手機。
    的頭像 發表于 11-10 10:17 ?2085次閱讀

    五菱宏光mini EV以2萬輛的銷量奪回國內新能源汽車市場銷量第一名

    10月份公布的新能源汽車銷量數據顯示,五菱宏光mini EV銷量高達20631輛,高居國內新能源汽車銷量第一名,其銷量比第二的特斯拉model3高近七成。 特斯拉model3自從去年
    的頭像 發表于 11-16 15:24 ?3114次閱讀

    小米電視2020年出貨量位列國內第一名

    昨天上午,小米電視通過官方微博宣布,小米電視2020年出貨量位列國內第一名,并連續2年穩居中國出貨第一名
    的頭像 發表于 02-23 09:30 ?5335次閱讀

    Python能否成為編程語言榜單的第一名

    Python 在不久的將來或將超越C語言成為榜單的第一名
    的頭像 發表于 06-15 09:31 ?1828次閱讀
    Python能否成為編程語言榜單的<b class='flag-5'>第一名</b>?

    中國芯片第一名是誰

    在中國比較厲害的芯片公司有華為海思、匯頂科技、比特大陸、清華紫光、中興微電子等,那么中國芯片第一名是誰?
    的頭像 發表于 12-16 17:08 ?6w次閱讀

    京東618會議平板榜,新銳品牌會參謀(leaderhub)第一名

    京東618會議平板榜,新銳互聯網爆款品牌會參謀細分品類多項第一名 京東618巔峰決戰已經結束!各大廠商也拿出看家本領,毫不吝嗇地發放各種福利、優惠,只為在被譽為“消費風向標”的京東排行榜爆發,拿下
    的頭像 發表于 06-21 18:52 ?2749次閱讀

    NVIDIA 3D MoMa:基于2D圖像創建3D物體

    可逆渲染流程 NVIDIA 3D MoMa 將于本周在新奧爾良舉行的計算機視覺和模式識別會議 CVPR 上亮相。
    的頭像 發表于 06-23 11:00 ?1307次閱讀

    NVIDIA Research 在 CVPR 上贏得自動駕駛挑戰賽并獲得創新獎

    新研究成果帶來實現安全自動駕駛系統所需的先進 3D Occupancy 預測NVIDIA 以自動駕駛開發大賽 3D
    的頭像 發表于 08-24 17:10 ?488次閱讀
    <b class='flag-5'>NVIDIA</b> Research 在 <b class='flag-5'>CVPR</b> 上贏得自動駕駛挑戰賽并獲得創新獎

    華潤微電子以第一名的成績榮獲新吳區區長質量獎

    近日,無錫高新區(新吳區)召開2023年度高質量發展總結暨2024年工作推進會,會議隆重表彰了新吳區區長質量獎單位,華潤微電子以第一名的成績榮獲新吳區區長質量獎。
    的頭像 發表于 04-07 09:19 ?672次閱讀
    華潤微電子以<b class='flag-5'>第一名</b>的成績榮獲新吳區區長質量獎

    潤和軟件連續四年蟬聯數字業務類解決方案市場第一名

    ,連續四年蟬聯數字業務類解決方案市場第一名。在細分領域:數字信貸系統解決方案子市場持續保持第一名,數字銀行解決方案子市場穩居第二,開放銀行解決方案子市場上升至第三。 ? 數字業務類
    的頭像 發表于 07-31 10:10 ?602次閱讀

    軟通動力榮獲2023年中國IT服務市場第一名

    近日,賽迪顧問最新發布《2023-2024年中國IT服務市場研究年度報告》。報告中,軟通動力憑借在數字化轉型浪潮中卓越的數字化能力和表現,持續領跑IT服務市場,位列2023年中國IT服務市場第一名
    的頭像 發表于 07-31 10:18 ?462次閱讀

    蔚來獲得CACSI車型滿意度和售后服務滿意度第一名

    近日,由中國質量協會發布的2024年中國新能源汽車用戶滿意度測評結果(CACSI)出爐。蔚來ET5T榮獲純電動中型轎車滿意度第一名,蔚來品牌榮獲售后服務滿意度第一名。蔚來已連續兩年獲得CACSI車型滿意度和售后服務滿意度第一名
    的頭像 發表于 12-06 17:19 ?876次閱讀
    主站蜘蛛池模板: wwwxx免费| 伊人男人天堂| 亚洲欧洲一区| 91大神精品| 黄色福利站| 午夜剧场刺激性爽免费视频| 国外一级毛片| 免费一级网站| 四虎国产精品永久在线看| 狠狠色噜噜狠狠狠狠97老肥女| 三级高清| 在线日韩一区| 免费a网| hdhdhd69日本xxx| 日本xxxxx69hd日本| 国产亚洲欧美成人久久片| 日日日日人人人夜夜夜2017| 夜色综合| 18年大片免费在线| 国产91久久最新观看地址 | 六月婷婷激情| 五月天丁香婷婷开心激情五月| 国产久热精品| 免费福利午夜影视网| 天天看夜夜操| 婷婷四房播客五月天| 免费高清视频在线观看| 欧美18xxoovideos| 黄色在线网站视频| 欧美另类v| 国产精品一久久香蕉产线看| 免费看男女做好爽好硬视频| 亚洲色图视频在线| 欧美性一区二区三区| 色播丁香| 国产专区日韩精品欧美色| 天天爽夜夜爽每晚高澡| 天天草视频| 欧美一级看片a免费观看| 美女自熨出白浆视频在线播放| 欧美午夜精品一区二区三区|