在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

LinK:用線性核實現3D激光雷達感知任務中的large kernel

CVer ? 來源:CVer ? 2023-05-31 14:41 ? 次閱讀

【CVPR 2023】LinK:用線性核實現3D激光雷達感知任務中的large kernel

本文介紹我們媒體計算研究組(MCG)在3D激光雷達感知領域提出的新型網絡設計。針對點云數據的稀疏性,使用線性核(LinK)來擴大模型的有效感受野,提升3D檢測、分割等任務的性能。

6d227078-ff52-11ed-90ce-dac502259ad0.png

LinK: Linear Kernel for LiDAR-based 3D Perception

論文鏈接:https://arxiv.org/abs/2303.16094

代碼鏈接:https://github.com/MCG-NJU/LinK

研究動機

在2D計算機視覺任務中,更大的感受野使得模型在語義分割、目標檢測等下游任務上的性能獲得顯著的提升。此前,一些方法(RepLKNet[1]等)探究了2D圖像處理領域中使用更大的卷積核來獲得更大范圍的感知能力。

由于3D數據模態的稀疏性,將大卷積核的設計引入3D存在兩方面的障礙。一是效率問題:3D任務中,開銷隨尺寸立方增長,若將卷積核大小從3×3×3簡單地擴張到7×7×7,模型大小會是原來的10倍,擴展到21×21×21則會變為343倍。另一方面是優化問題:由于點云在空間中分布較為稀疏,如果卷積核的每個位置都被賦予一定的權重,那么3D數據的稀疏性會導致大量空閑位置的權重在網絡迭代中并沒有參與更新,導致參數更新緩慢。此前有人嘗試使用局部塊內元素共享參數的方式來緩解這兩個問題,提出了大小為7×7×7的空間共享權重卷積核(LargeKernel3D[2])。該設計成功地在3D語義分割和目標檢測任務上提升了小卷積核的性能,但感受野的擴張幅度仍然有限。

為了解決這些問題,我們提出線性核LinK,以類卷積的方式實現更大的感知范圍。該方法有兩處核心設計:一是用線性核生成器替換靜態的卷積權重,僅為非空區域的點云提供權重。同時,該模塊是逐層共享的,避免了稀疏分布的權重在某次迭代中沒有被優化的情況,改善了優化問題。二是在不同滑動窗口的重疊區域復用預先計算的聚合結果,使整體計算復雜度進一步降低,甚至最終計算量為常量,與實際感受范圍無關。換句話說,我們可以基于LinK以一致的開銷實現任意大小的線性核。

我們的方法

核生成器

前文中討論了大卷積核下稀疏卷積的兩大缺陷:開銷大以及優化困難。我們首先采用神經網絡模塊 來在線生成權重,取代靜態卷積核 ,使得網絡參數量與不隨卷積核尺寸增長而增長,與之前方法對比如下:

6d3015ca-ff52-11ed-90ce-dac502259ad0.png

線性核生成器解決了參數量增長的問題,然后,并沒有解決計算量的問題。于是我們考慮,能否將不同卷積窗口的重疊區域的特征聚合結果進行復用,這樣有可能降低計算量。

為此,我們以一個toy case為例。假設兩個相鄰窗口中的元素集合分別為

其中每個元素表示一個體素。這兩個窗口的重疊區域為

我們分別將 中的元素特征聚合到 和 ,聚合過程為

可以發現,每個重疊區域中的元素對 和 采用不同的local offset來獲得權重。因此,基于local offset的方式難以復用重疊區域的聚合結果,如下圖所示:

6d3f00f8-ff52-11ed-90ce-dac502259ad0.png

基于global coordinate的預聚合

為了解決這個問題,考慮到每個位置的global coordinate是唯一的,我們提出,將local offset拆分為global coordinate的組合。對于區域 ,我們使用如下公式計算這三個元素的預聚合結果:

也是kernel generator。然后,若要得到 在區域 上的聚合特征,我們用如下方式生成基于local offset的結果:

這樣,不管有多少個元素要來復用區域 上的聚合特征,都不需要再重新計算 。

那么問題來了,上式成立的前提是

為了使其成立,我們參考APP-Net[3],使用線性映射 來實現 和 。我們將這過程稱為線性核生成器,也即LinK方法名字的由來(Linear Kernel Generator)。這兩個函數可以用三角函數、指數函數等不同的形式進行激活,正文中主要采用了余弦函數的方式。此時兩個窗口A、B的聚合過程如下圖所示:

6d687ee2-ff52-11ed-90ce-dac502259ad0.png

基于LinK的類卷積核設計

基于上述設計,我們將整體點云劃分為不重疊的塊,每個塊的大小為 ,對每個塊進行特征預聚合。為每個塊查詢其周圍 個近鄰塊,生成一個感受范圍為 的大塊的預聚合特征 。對 使用上述合成local offset的操作,即可為每個聚合中心算得最終的特征。這部分的具體公式可見論文原文。在實驗中,設 ,即可得到 21×21×21 的感知范圍。整體過程如下圖所示:

6d728ff4-ff52-11ed-90ce-dac502259ad0.png

網絡結構

LinK模塊結構

LinK模塊由兩個分支組成:一個分支為使用線性投影+三角核函數實現的大核分支,另一分支為 3×3×3 的稀疏卷積小核旁路,結構圖如下所示。

6d7cf2b4-ff52-11ed-90ce-dac502259ad0.png

下游任務應用

應用到下游任務(檢測和分割)中時,我們分別選取CenterPoint和MinkUnet作為基礎架構,并使用基于LinK的backbone替代了原本基于稀疏卷積實現的backbone,保留了原始的檢測頭和分割頭不變,具體結構如下圖所示。

6d87e674-ff52-11ed-90ce-dac502259ad0.png

實驗

我們在nuScenes上評估了目標檢測的結果,在SemanticKITTI上評估了語義分割的結果。結果分別如下所示:

nuScenes

6d921ca2-ff52-11ed-90ce-dac502259ad0.png

截止論文發表,我們的方法在nuScenes數據集上取得了SOTA(73.4 NDS)。得益于超大的感受野,與baseline CenterPoint相比,我們的方法在大尺寸的物體(例如bus、con-veh等)上提升顯著。

SemanticKITTI

6d9c911e-ff52-11ed-90ce-dac502259ad0.png

在SemanticKITTI上,我們的方法相較baseline MinkUNet獲得了2.7 mIoU的提升。更多可視化分析見原始論文。

總結

在本文中,我們提出了一個線性核生成器LinK,能夠以不變的計算量任意擴大模型感受野,大幅提升現有模型在下游任務(檢測、分割)上的性能。我們通過實驗證明了LinK對下游任務性能提升的有效性與通用性。LinK在nuScenes(LiDAR only)上達到了SOTA性能,希望可以讓大家對大感受野的新方法以及其在3D感知任務上的應用有更多關注。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Link
    +關注

    關注

    0

    文章

    101

    瀏覽量

    26964
  • 生成器
    +關注

    關注

    7

    文章

    315

    瀏覽量

    21011
  • 激光雷達
    +關注

    關注

    968

    文章

    3972

    瀏覽量

    189923

原文標題:LinK: Linear Kernel for LiDAR-based 3D Perception

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    常見激光雷達種類

    。單線激光主要用于規避障礙物,由于單線激光雷達比多線和3D激光雷達在角頻率和靈敏度反映更加快捷,所以,在測試周圍障礙物的距離和精度上都更加精確。但是,單線
    發表于 09-25 11:30

    激光雷達究竟為什么這么牛,這么貴

    激光雷達為什么這么牛?因為激光雷達能夠幫助車輛識別周圍的環境信息,更好的運行車輛。激光雷達在無人駕駛的兩個核心作用:1.3D建模進行環境感知
    發表于 10-16 16:31

    固態設計激光雷達

    圍繞LR30進行感知環境,精確建圖和定位導航的功能研發,以實現低速自動駕駛輔助和封閉園區自動駕駛。二、已量產的固態激光雷達CE30-D當其他公司展位擺放著《樣品預約測試表》的時候,北醒
    發表于 01-25 09:41

    激光雷達除了可以激光測距外,還可以怎么應用?

    運用紅外激光設備把紅外線投影到屏幕上。當屏幕被阻擋時,紅外線便會反射,而屏幕下的攝影機則會捕捉反射去向,再經系統分析,便可作出反應。 激光雷達應用之 3D建模與環境掃描RPLIDAR 3D
    發表于 05-11 15:33

    5 款激光雷達:iDAR、高清3D LiDARInnovizPro、S3、SLAM on Chip、VLS-128

    ,我們的任務就是要推動自動駕駛汽車大規模商用,現在我們離實現這一目標越來越近了。”Innoviz 公司發言人在一份聲明說道。S3(Quanergy)Quanergy S
    發表于 07-26 20:45

    讓機器人在陌生環境里穿梭自如的激光雷達

    `這輛汽車對于科技愛好者絕不陌生,這就是谷歌研發的無人駕駛汽車。在行駛過程,無人車需要感知周圍環境,但無法像人一樣眼睛完成,這一切就要依靠車頂安裝的激光雷達。該裝置可檢測周圍障礙物
    發表于 09-10 16:32

    除了機器人行業,激光雷達還能應用于哪些領域?

    器人在房間里實現智能清掃,清掃的過程繪制地圖,實時傳輸到手機APP,就算用戶不在家,也可以通過手機APP查看清掃情況,以及安排其他地方清掃。 無人車領域——自主感知道路環境及規劃路線在無人車領域,
    發表于 12-10 14:55

    自制低成本3d激光掃描測距儀激光雷達

    自制低成本3d激光掃描測距儀激光雷達
    發表于 05-27 16:23

    激光雷達知多少:從技術上講講未來前景

    ,其云底高度的測量范圍可達7500m。 按線數分類: 單線激光雷達 單線激光雷達主要用于規避障礙物,其掃描速度快、分辨率強、可靠性高。由于單線激光雷達比多線和3D
    發表于 07-14 07:56

    自制低成本3D激光掃描測距儀(3D激光雷達)

    自制低成本3D激光掃描測距儀(3D激光雷達)
    發表于 03-04 10:51

    由iphone12說說激光雷達 FMCW激光雷達 精選資料分享

    。另一個就是比較火的AR(增強現實 ),通過LIDAR能夠測出這個現實物體的大小尺寸,進而能夠很好的3D建模,當然待開發的應用還有很多很多,畢竟相當于賦予了手機一雙人的眼睛。主要說一下這個激光雷達
    發表于 07-22 09:12

    3D激光雷達的現在和未來

    近年來,激光雷達市場非常活躍,一些參與者在推出汽車級3D激光雷達傳感器模塊產品方面取得了出色的進展。
    的頭像 發表于 03-23 16:19 ?8759次閱讀

    3D激光雷達和相機校準是如何考慮傳感器之間誤差的?

    作者:Raphael Voges and Bernardo Wagner 來源:IROS 2020 大家好,今天為大家帶來的文章是—— 集員法對3D激光雷達和相機的外部校準
    的頭像 發表于 05-26 09:15 ?5112次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>激光雷達</b>和相機校準是如何考慮傳感器之間誤差的?

    3D Flash 激光雷達測繪和手勢識別

    3D Flash 激光雷達測繪和手勢識別
    的頭像 發表于 01-05 09:43 ?1443次閱讀

    激光雷達與視覺感知的優劣對比

    3D激光雷達在無人駕駛車輛的定位、路徑規劃、決策、感知等方面有著重要的作用。2022-2025年之間預計絕大部分的主機廠會量產上激光雷達,從國際上看,沃爾沃和Luminar宣布量產,國
    發表于 10-30 18:14 ?564次閱讀
    <b class='flag-5'>激光雷達</b>與視覺<b class='flag-5'>感知</b>的優劣對比
    主站蜘蛛池模板: 99热免费| 欧美三级中文字幕hd| 免费一级欧美片片线观看| 成人99国产精品一级毛片| 国内精品 第一页| 久久精品国产亚洲婷婷| 欧美色图亚洲激情| 天天看天天爽| 日本一区免费在线观看| 日韩电影毛片| 天天做天天爱天天爽天天综合 | 老师下面好紧| 欧洲综合色| 午夜啪| 在线婷婷| 欧美三级视频在线| 手机看片中文字幕| 狠狠干成人| 亚色视频在线| 全日本爽视频在线| 成人a毛片高清视频| 99涩涩| 三级视频网站在线观看播放| 在线天堂中文| 色网站免费视频| 久久国产色| 成人国产一区二区三区| 婷婷丁香久久| 新版天堂资源在线官网8| 色婷婷九月| 国产一级爱c片免费播放| jlzzjlzzjlzz亚洲女| 天堂bt资源www在线| 午夜快播| 在线免费成人网| 爱逼综合| 日本aaaaa级毛片片| 黄色大全片| 97dyy影院理论片| 噜噜噜狠狠夜夜躁| 午夜黄网|