在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種全新的數據蒸餾方法來加速NeRF

電子工程師 ? 來源:機器之心 ? 作者:Huan Wang ? 2022-08-08 10:53 ? 次閱讀

神經輻射場 (Neural Radiance Field, or NeRF) [Mildenhall et al., ECCV, 2020] 開啟了用神經網絡表征三維場景的新范式。NeRF 這兩年在學術界和工業界都很火熱, 但 NeRF 一個比較大的缺點是, 渲染速度慢。雖然 NeRF 用的神經網絡 (11 層的 MLP) 本身很小, 但是渲染一個像素需要采集一條光線上的很多點(上百個), 這導致渲染一張圖的計算量非常大, 如下圖所示: 用 PyTorch 在單張 NVIDIA V100 顯卡測試, 渲染 400x400 的圖片就需要 6.7s 的時間, 這顯然不利于 NeRF 在業界落地 (例如各種 AR/VR 設備, meta universe 等)。

90536e9a-16c2-11ed-ba43-dac502259ad0.png

學術界已有不少研究工作來加速 NeRF。比較流行的一種方式是, 給定訓練好的 NeRF, 采用更高效的數據結構進行存儲, 如 Sparse Voxel Octree [Yu et al., ICCV, 2021]. 盡管加速很可觀 (如 [Yu et al., ICCV, 2021] 實現了 3000x 的渲染加速), 但這種數據結構也破壞了 NeRF 作為場景表征存儲小的優點。譬如, 原始 NeRF 網絡僅僅 2.4MB 大小就可以存儲一個場景, 而采用 Sparse Voxel Octree 則需要 1.93GB [Yu et al., ICCV, 2021], 這顯然難以在端上應用。 因此, 如何加速 NeRF 渲染并維持其存儲小的優點 (簡言之: 小且快), 仍然是當前的研究熱點, 也是本文的動因。

908ec648-16c2-11ed-ba43-dac502259ad0.png

Arxiv: https://arxiv.org/abs/2203.17261

Code: https://github.com/snap-research/R2L

Webpage: https://snap-research.github.io/R2L/

核心方法 我們所提出的核心方法從整體范式上來說非常簡單: 通過數據蒸餾將神經輻射場 (NeRF) 轉化為神經光場(Neural Light Field, or NeLF) -- 從 NeRF 到 NeLF, 所以我們把方法命名為 R2L。 NeLF 與 NeRF 一樣, 都可以作為一個場景的表征. 不同的是:

NeRF 的輸入是場景中的一個點 (該點的坐標 + 該點所在視線的方向), 輸出是該點的 RGB 和不透明度。NeRF 網絡的輸出是中間結果, 并不是圖片上的 RGB 值. 要想得到一個像素的 RGB 值, 需要對該像素對應光線上的很多點進行積分 (即 Alpha Compositing)。

而 NeLF 的輸入是一條光線, 輸出直接是該光線對應圖片上像素值, 不需要 Alpha Compositing 這一步。

對于 Novel View Synthesis 這個任務來說, NeLF 的優勢很明顯: 速度快! 要得到一個像素的 RGB 只需要跑一次網絡, 而 NeRF 則需要跑上百次。

909aa80a-16c2-11ed-ba43-dac502259ad0.png

但它的缺點也很明顯, 主要有兩個缺點: (1)NeLF 網絡要擬合的目標函數比 NeRF 更難。這一點可以這么理解: 在一張圖片上相鄰兩個像素的 RGB 可能突變 (因為遮擋), 而相鄰兩個像素的光線方向其實差別很小, 這就意味著, 這個函數的輸入稍微變化一點, 輸出可能劇變, 這種函數的不連續性強, 復雜度高. 相比之下, NeRF 表達的函數是空間中的點, 空間中的點由于物理世界的連續性, 相鄰位置上 RGB 劇變的可能性小, 所以函數相對簡單。 (2)同樣一堆圖片, 用來訓練 NeLF 的話, 樣本量會大幅降低. 一張圖片, 長寬為 H, W, 用來訓練 NeLF 的話樣本量就是 H*W, 而訓練 NeRF 樣本量是 H*W*K (K 是 NeRF 中的一條光線上的采樣點個數, 在 NeRF 原文中 K=256). 所以, 從 NeRF 到 NeLF 訓練樣本量會變為原來的 1/K, 這是很大的縮減。 神經網絡有效, 通常需要有大量的訓練數據。從 NeRF 變為 NeLF, 一方面要擬合的目標函數變復雜了, 同時樣本量卻減小了, 無疑雪上加霜. 如何解決這些問題呢? 為了解決上述問題(1), 我們需要用一個更深的網絡來表征更復雜的函數, 所以在我們的文章中提出了一個 88 層的深度殘差 MLP (deep residual MLP), 網絡結構如下:

90c1ad74-16c2-11ed-ba43-dac502259ad0.png

這樣的深層網絡在之前 NeRF 相關的工作沒有出現過 (之前的 NeRF 相關工作大多繼承了原始 NeRF 文章中的網絡結構, 小修小補)。為了能讓它訓練起來, 我們引入了殘差結構的設計。這一點跟 ResNet 的思想一樣, 本身并沒有更多的創新, 但把這一點引入到 NeRF/NeLF 中, 據我們所知, 本文是第一篇工作。殘差結構的引入很有必要, 因為深度網絡沒有殘差結構基本訓練不起來, 這一點在文中的消融實驗中也得到了證實。 另一個值得注意的創新點是關于如何表征一條光線。理論上說, 一條光線用一個方向向量就可以確定, 但如果真的只用方向向量去表征, 就會出現上面說的 “輸入很接近, 輸出卻可能劇變” 的情況, 這就無疑會給 NeLF 網絡的學習帶來困難。為了使得 NeLF 網絡要學習的函數更容易一些, 我們需要增強輸入的差別. 具體來說, 我們采用一條光線上采樣的多個點的坐標 (如下圖所示), 將其串聯(concat) 起來成一個向量, 以此作為該光線的表征, 作為我們 NeLF 網絡的輸入。

90da5ebe-16c2-11ed-ba43-dac502259ad0.png

這種表征非常簡單直接, 同時也很有效。在文中, 我們也展示了它比之前的 NeLF 工作中用到的其他表征 (例如 Plucker 坐標 [Sitzmann et al, NeurIPS, 2021]) 要更為有效。 為了解決上述問題(2), 我們使用了一個預訓練好的 NeRF 模型來產生大量偽數據 (pseudo data)。具體來說, 當 NeRF 對一個場景學習完之后, 給定任意一個角度 (ray direction), NeRF 都能返回這個角度下的圖片, 我們就把這些圖片收集起來, 形成了很多 (origin, direction, RGB) triplets。這些 triplets 就是訓練我們模型的數據, loss 函數是 mean squared error (MSE), 如下所示:

90e8e182-16c2-11ed-ba43-dac502259ad0.png

在我們的實驗中, 我們收集了 10k 張圖片, 是原始數據集 (大概 100 張圖片) 的 100 倍, 這些數據確保了有充足的樣本去訓練 NeLF。文中的消融實驗也表明, 大量偽數據對性能至關重要 (6.9dB PSNR 提升)! 值得一提的是, 如果僅僅是用偽數據訓練, 我們的模型最優也只能復制 teacher NeRF, 無法超越它。為了能超越, 我們在原始圖片上再微調 (Finetune) 一下模型。這個操作被證明有非常顯著的效果, 使得我們的模型可以顯著超越 teacher NeRF。 實驗效果 總的來說, 我們的模型在 NeRF Synthetic 數據集 (圖片尺寸 400x400) 上實現了將近 30x 的加速, 并把 PSNR 大幅提升了 1.4dB, 比同類其他方法更加高效。

91175b0c-16c2-11ed-ba43-dac502259ad0.png

視覺效果圖對比如下, 可以看到, 相比于 NeRF, 我們的模型 (Ours-2, 即在原始數據上微調后的模型)有肉眼可見的提升, 且計算量僅僅是 NeRF 的 1/26。

912cf0d4-16c2-11ed-ba43-dac502259ad0.png

更多結果請參考我們的文章。代碼已經開源: https://github.com/snap-research/R2L, 歡迎嘗試! 總結與未來工作 本文提出了一種全新的數據蒸餾方法來加速 NeRF: 我們使用訓練好的 NeRF 模型產生偽數據, 來訓練提出的深度殘差 NeLF 網絡。該 NeLF 網絡可以達到超過 NeRF 的渲染質量, 且實現將近 30x 加速, 并維持了存儲小的優點。 未來工作方向: (1) 從 NeRF 中可以得到深度信息, 目前我們還沒提供從 NeLF 網絡中得到深度信息的方法, 這是不錯的探索方向。(2) 如何用更少, 更高質量的偽數據 (譬如進行數據篩選) 來加速 NeLF 的訓練也非常值得探索。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4776

    瀏覽量

    100952
  • 數據結構
    +關注

    關注

    3

    文章

    573

    瀏覽量

    40163
  • pytorch
    +關注

    關注

    2

    文章

    808

    瀏覽量

    13283

原文標題:ECCV 2022|Snap&東北大學提出R2L:用數據蒸餾加速NeRF

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種面向飛行試驗的數據融合框架

    天地氣動數據一致性,針對某外形飛行試驗數據開展了典型對象的天地氣動數據融合方法研究。結合數據挖掘的隨機森林
    的頭像 發表于 11-27 11:34 ?273次閱讀
    <b class='flag-5'>一種</b>面向飛行試驗的<b class='flag-5'>數據</b>融合框架

    全面總結動態NeRF

    1. 摘要 神經輻射場(NeRF)是一種新穎的隱式方法,可以實現高分辨率的三維重建和表示。在首次提出NeRF的研究之后,NeRF獲得了強大的
    的頭像 發表于 11-14 16:48 ?432次閱讀
    全面總結動態<b class='flag-5'>NeRF</b>

    PyTorch GPU 加速訓練模型方法

    在深度學習領域,GPU加速訓練模型已經成為提高訓練效率和縮短訓練時間的重要手段。PyTorch作為個流行的深度學習框架,提供了豐富的工具和方法來利用GPU進行模型訓練。 1. 了解GPU加速
    的頭像 發表于 11-05 17:43 ?593次閱讀

    一種創新的動態軌跡預測方法

    本文提出了一種動態軌跡預測方法,通過結合歷史幀和歷史預測結果提高預測的穩定性和準確性。它引入了歷史預測注意力模塊,以編碼連續預測之間的動態關系,并通過三重因子注意力模塊實現了最先進的性能。本
    的頭像 發表于 10-28 14:34 ?474次閱讀
    <b class='flag-5'>一種</b>創新的動態軌跡預測<b class='flag-5'>方法</b>

    一種簡單高效配置FPGA的方法

    本文描述了一種簡單高效配置FPGA的方法,該方法利用微處理器從串行外圍接口(SPI)閃存配置FPGA設備。這種方法減少了硬件組件、板空間和成本。
    的頭像 發表于 10-24 14:57 ?736次閱讀
    <b class='flag-5'>一種</b>簡單高效配置FPGA的<b class='flag-5'>方法</b>

    一種利用wireshark對遠程服務器/路由器網絡抓包方法

    一種利用wireshark對遠程服務器/路由器網絡抓包方法
    的頭像 發表于 09-21 08:03 ?3328次閱讀
    <b class='flag-5'>一種</b>利用wireshark對遠程服務器/路由器網絡抓包<b class='flag-5'>方法</b>

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結構進行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。 層析成像是一種強大的無
    的頭像 發表于 07-19 06:20 ?418次閱讀
    <b class='flag-5'>一種</b>無透鏡成像的新<b class='flag-5'>方法</b>

    rup是一種什么模型

    部分)開發的,它基于統建模語言(UML)和面向對象的軟件開發方法。RUP提供了一種結構化的方法來開發軟件,它包括系列的階段、迭代和里程碑
    的頭像 發表于 07-09 10:13 ?1347次閱讀

    干貨分享 數據記錄儀自動測量與記錄加速度:振動,顛簸,沖擊和定位

    什么是加速度數據記錄儀?我們如何記錄振動?顛簸或沖擊是什么意思?我們可以使用什么方法來檢測因沖擊而造成的貨物損壞?“快速峰值”是什么意思?篇文章讓你弄懂所有問題!
    的頭像 發表于 07-04 14:46 ?423次閱讀
    干貨分享  <b class='flag-5'>數據</b>記錄儀自動測量與記錄<b class='flag-5'>加速</b>度:振動,顛簸,沖擊和定位

    基于助聽器開發的一種高效的語音增強神經網絡

    受限的微控制器單元(microcontroller units,MCU)上,內存和計算能力有限。在這項工作中,我們使用模型壓縮技術彌補這差距。我們在HW上對RNN施加約束,并描述了一種方法來滿足它們
    發表于 06-07 11:29

    AD8338有沒有可行的方法來測量大增益?

    AD8338是款VGA芯片,可變增益范圍為-10dB至70dB。然而,理論上的70dB增益過大,導致來自源的輸入信號非常小,容易受到干擾,導致70dB增益未得到驗證。有沒有可行的方法來測量大增益?
    發表于 05-21 07:06

    如果是使用六步方波的方法來控制電機,要如何實現過電流保護?

    請問下如果是使用六步方波的方法來控制電機,要如何實現過電流保護? 以免電流過大造成板子損壞
    發表于 04-22 08:10

    下通過采用HPC方法來解決汽車行業工程挑戰的兩個具體實例

    大家可能都知道,將Ansys解決方案與高性能計算(HPC)相結合,可帶來巨大的投資回報(ROI)。接下來,讓我們來看下通過采用HPC方法來解決汽車行業工程挑戰的兩個具體實例。
    的頭像 發表于 03-12 14:29 ?612次閱讀

    基于NeRF/Gaussian的全新SLAM算法

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數,通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發表于 01-26 10:48 ?678次閱讀
    基于<b class='flag-5'>NeRF</b>/Gaussian的<b class='flag-5'>全新</b>SLAM算法

    一種使用石墨陽極制造快速充電鋰離子電池的新方法

    鋰離子電池 (LiB) 是目前廣泛使用的電池,為我們日常使用的大多數電子產品提供動力。因此,確定可擴展的方法來提高這些電池的充電速度是能源領域的主要目標之,因為它不需要改用全新的電池成分。
    發表于 01-23 15:37 ?485次閱讀
    <b class='flag-5'>一種</b>使用石墨陽極制造快速充電鋰離子電池的新<b class='flag-5'>方法</b>
    主站蜘蛛池模板: 国产精品嫩草影院人体模特| 黄网站色| 国产巨大bbbb俄罗斯| 热九九精品| 免费一级毛片不卡在线播放| 免费鲁丝片一级观看| 国产午夜a理论毛片在线影院| 操人视频网站| 黄色国产视频| 美女被异性狂揉下部羞羞视频| chinese国产一区二区| 午夜免费福利片| 色吧久久| www.午夜视频| 一级黄色毛片播放| 四虎国产精品免费久久影院| 日本特黄a级高清免费大片18| 欧美大胆一级视频| 国产三级黄色录像| 新版天堂中文资源8在线| 国产精品美女一区二区三区| www.亚洲.com| 奇米久久久| 视色4se视频在线观看| 午夜视频www| 五月激情片| 午夜三级影院| 日本大片免aaa费观看视频| 国产一区二区三区不卡观| 午夜在线影院| 国产亚洲精品aaa大片| 亚洲 欧美 视频| 午夜在线观看完整高清免费| 欧美αv| 97色综合| yy6080亚洲半夜理论一级毛片| 欧美 亚洲 一区| 色日本视频| 成人性色生活影片| 一级特黄aaa大片免费看| 久久久精品免费观看|