在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

比CNN表現更好,CV領域全新卷積操作OctConv厲害在哪里?

電子工程師 ? 來源:YXQ ? 2019-04-24 11:35 ? 次閱讀

CNN卷積神經網絡問世以來,在計算機視覺領域備受青睞,與傳統的神經網絡相比,其參數共享性和平移不變性,使得對于圖像的處理十分友好,然而,近日由Facebook AI、新家坡國立大學、360人工智能研究院的研究人員提出的一種新的卷積操作OctConv使得在圖像處理性能方面得到了重大突破與提升,OctConv和CNN中的卷積有什么不同呢?

論文下載地址:

https://arxiv.org/pdf/1904.05049.pdf

CNN網絡中的卷積層主要用來提取圖像特征,如下圖所示,利用卷積核(也稱濾波器)對輸入圖像的每個像素進行卷積操作得到特征圖,由于圖像中相鄰像素的特征相似性,卷積核橫掃每個位置,獨立的存儲自己的特征描述符,忽略空間上的一致性,使得特征圖在空間維度上存在大量的冗余。

圖1 普通卷積操作示意圖

OctConv主要基于于處理多空間頻率的特征映射并減少空間冗余的問題提出的。

原文地址:

https://export.arxiv.org/pdf/1904.05049

下面文摘菌將從論文的四個部分展開對OctConv原理的闡述。

Why?—OctConv之誕生

文章摘要(Abstract)部分指出,在自然圖像中,信息以不同的頻率傳輸,其中高頻率通常以細節進行編碼,而較低頻率通常以總體結構進行編碼,同理卷積層的輸出可以看做不同頻率的信息混合,在論文中,研究者提出通過頻率對特征融合圖進行分解,并設計出了一種新的Octave卷積(OctConv)操作,旨在存儲和處理在空間上變化緩慢的較低分辨率的特征圖,從而降低內存和計算成本。與現存的多尺度方法不同,OctConv是一種單一、通用、即插即用的卷積單元,可以直接代替普通卷積,而無需調整網絡結構。

OctConv與那些用于構建更優拓撲或者減少分組或深度卷積中信道冗余的方法是正交和互補的。

實驗表明,通過使用OctConv替代普通卷積,能很好的提高語音和圖像識別任務中的精度,同時降低內存和計算成本,一個配備有OctConv的ResNet-152能夠以僅僅22.2 GFLOP在ImageNet數據集上達到82.5%的top-1分類準確率。

What?—初探OctConv

論文Introduction(介紹)部分基于CNN現存的空間維度冗余問題引出了下圖:

圖2 論文思路闡述圖

(a)動機:研究表明,自然圖像可以分解為低空間頻率和高空間頻率兩部分;

(b)卷積層的輸出圖也可以根據空間頻率進行分解和分組;

(c)所提出的多頻特征表示將平滑變化的低頻映射存儲字低分辨率張量中,以減少空間冗余;

(d)所提出的OctConv直接作用于這個表示。它會更新每個組的信息,并進一步支持組之間的信息交換。

具體解釋為:如圖 2(a) 所示,自然圖像可以分解為描述平穩變化結構的低空間頻率分量和描述快速變化的精細細節的高空間頻率分量。類似地,我們認為卷積層的輸出特征映射也可以分解為不同空間頻率的特征,并提出了一種新的多頻特征表示方法,將高頻和低頻特征映射存儲到不同的組中,如圖 2(b) 所示。因此,通過相鄰位置間的信息共享,可以安全地降低低頻組的空間分辨率,減少空間冗余,如圖 2(c) 所示。

How?—再探OctConv

論文Method(方法)部分:octave feature 減少了空間冗余,比原始表示更加緊湊。然而,由于輸入特征的空間分辨率不同,傳統卷積不能直接對這種表示進行操作。避免這個問題的一種簡單方法是將低頻部分上采樣到原始的空間分辨率,將它與連接起來,然后進行卷積,這將導致額外的計算和內存開銷。為了充分利用緊湊的多頻特征表示,我們提出 Octave Convolution,它可以直接在分解張量X={XH,XL}上運行,而不需要任何額外的計算或內存開銷。

Octave Convolution的設計目標是有效地處理相應張量中的低頻和高頻分量,同時使得Octave特征表示的高頻分量和低頻分量之間能夠有效通信。設X,Y為分解輸入和輸出張量,那么輸出的高頻和低頻信號將由下式給出:

其中H→H,L→L表示自身的更新,L→H,H→L表示高頻與低頻分量之間的通信,如圖3所示綠色箭頭表示信息更新,紅色箭頭表示兩個頻率之間的信息交換。

圖3 Octave Convolution示意圖

同理,我們將卷積核分解為高頻和低頻W={WH,WL},WH=WH→H+WL→H;WL=WL→L+WH→L,如圖4所示:

圖3 Octave Convolution kernel示意圖

對于低頻特征所使用的低頻所占比例a的不同,當a=0時(即沒有低頻成分),OctConv就會退化為普通卷積。經過實驗評估k×k Octave 卷積核與普通卷積核等價,即二者具有完全相同的參數量。

To do—Just do it

論文的實驗部分:研究人員驗證了提出的Octave卷積對于2D和3D網絡的效能和效率,首先展示了ImageNet圖像分類的控制變量研究,然后將其與當前最優的方法進行了比較。之后研究人員使用Kinetics-400和Kinetics-600數據集,展示了提出的OctConv也適用于3D CNN。

圖4 ImageNet上的控制變量結果圖

上表為論文中的表8,視頻中的動作識別、控制變量研究結果統計。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    8

    文章

    1699

    瀏覽量

    46051
  • cnn
    cnn
    +關注

    關注

    3

    文章

    353

    瀏覽量

    22267

原文標題:比CNN表現更好,CV領域全新卷積操作OctConv厲害在哪里?

文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    卷積神經網絡有何用途 卷積神經網絡通常運用在哪里

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理、生物信息學等領域。本文將介紹卷積
    的頭像 發表于 07-11 14:43 ?2634次閱讀

    卷積神經網絡的基本概念、原理及特點

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習算法,它在圖像識別、視頻分析、自然語言處理等領域有著廣泛的應用。本文將詳細介紹卷積
    的頭像 發表于 07-11 14:38 ?1169次閱讀

    卷積神經網絡的卷積操作

    卷積神經網絡(Convolutional Neural Network, CNN)中的卷積操作是其核心組成部分,對于圖像識別、語音識別、自然語言處理等
    的頭像 發表于 07-04 16:10 ?1557次閱讀

    如何利用CNN實現圖像識別

    卷積神經網絡(CNN)是深度學習領域中一種特別適用于圖像識別任務的神經網絡結構。它通過模擬人類視覺系統的處理方式,利用卷積、池化等操作,自動
    的頭像 發表于 07-03 16:16 ?1462次閱讀

    卷積神經網絡實現示例

    分類。 1. 卷積神經網絡的基本概念 1.1 卷積層(Convolutional Layer) 卷積層是CNN中的核心組件,用于提取圖像特征。卷積
    的頭像 發表于 07-03 10:51 ?482次閱讀

    卷積神經網絡的實現原理

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經網絡的
    的頭像 發表于 07-03 10:49 ?592次閱讀

    卷積神經網絡計算過程和步驟

    卷積神經網絡(Convolutional Neural Network, CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。本文將詳細介紹卷積神經網絡的計算
    的頭像 發表于 07-03 09:36 ?667次閱讀

    卷積神經網絡的組成部分有哪些

    卷積層、池化層、激活函數、全連接層、損失函數、優化算法等,并探討它們在CNN中的作用和應用。 卷積層(Convolutional Layer) 卷積層是
    的頭像 發表于 07-03 09:31 ?1143次閱讀

    cnn卷積神經網絡分類有哪些

    卷積神經網絡(CNN)是一種深度學習模型,廣泛應用于圖像分類、目標檢測、語義分割等領域。本文將詳細介紹CNN在分類任務中的應用,包括基本結構、關鍵技術、常見網絡架構以及實際應用案例。
    的頭像 發表于 07-03 09:28 ?670次閱讀

    cnn卷積神經網絡三大特點是什么

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域CNN具有以下三大特點: 局
    的頭像 發表于 07-03 09:26 ?1450次閱讀

    卷積神經網絡可以通過輸出反推到輸入嗎

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域CNN通過
    的頭像 發表于 07-03 09:17 ?732次閱讀

    卷積神經網絡的原理與實現

    1.卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域卷積神經網絡是一種前饋
    的頭像 發表于 07-02 16:47 ?650次閱讀

    CNN模型的基本原理、結構、訓練過程及應用領域

    卷積神經網絡(Convolutional Neural Network,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域CNN模型的核心是
    的頭像 發表于 07-02 15:26 ?3917次閱讀

    卷積神經網絡cnn模型有哪些

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域CNN的基本概念 1.1
    的頭像 發表于 07-02 15:24 ?766次閱讀

    卷積神經網絡cnn中池化層的主要作用

    卷積神經網絡(Convolutional Neural Network,CNN)是深度學習領域中一種重要的神經網絡結構,廣泛應用于圖像識別、語音識別、自然語言處理等領域。在
    的頭像 發表于 07-02 14:50 ?1329次閱讀
    主站蜘蛛池模板: 51视频在线观看免费国产| jlzzjlzzjlzz日本亚洲| 伊人婷婷色香五月综合缴激情| 天天撸视频| 国产专区视频| 国产ar高清视频+视频| 日本bbxx| 天堂在线观看视频| 久热99| 男女视频在线看| 欧美激情在线| 一区二区三区视频在线观看| 婷婷九月| 亚洲第一伊人| 黑色丝袜在丝袜福利国产| 草逼网址| 美女三级黄| 性高清| 欧美mv日韩mv国产mv网站| 色多多在线看| 毛片站| 你懂得在线| 国产精品视频网站你懂得 | 中文字幕视频一区二区| 九九视频热| 四虎成人欧美精品在永久在线| 亚洲free| 天天色影| 免费看污黄视频软件| 老色批软件| 一区二区精品| 国产理论最新国产精品视频| 国产美女一级高清免费观看| 美国三级网| 69日本人xxxx16-18| 好大好硬好深好爽的视频| 久久99热精品免费观看无卡顿| 手机天堂网| 国产伦子一区二区三区| 欧美成人免费网站| 日本aaaa毛片在线看|