在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Adobe研究院的研究者們提出了全新的通用深度網絡架構CPNet

DPVg_AI_era ? 來源:lq ? 2019-05-25 09:41 ? 次閱讀

斯坦福大學和Adobe研究院的研究者們提出了全新的通用深度網絡架構CPNet,用于學習視頻中圖片之間的長程對應關系,來解決現有方法在處理視頻長程運動中的局限性。在三大視頻分類數據集上取得了優于之前結果的性能。相關論文獲CVPR 2019 oral。

這是一款全新的通用深度網絡架構。

現有的視頻深度學習架構通常依賴于三維卷積、自相關、非局部模塊等運算,這些運算難以捕捉視頻中幀間的長程運動/相關性。

近日,來自斯坦福和Adobe的研究人員,受到點云上深度學習方法的啟發,提出了一個通用的深度網絡架構CPNet,用于學習視頻中圖片之間的長程對應關系,來解決上述問題。

arXiv地址:

https://arxiv.org/abs/1905.07853

研究人員們所提出的CPNet是一個全新的通用的視頻深度學習框架。該網絡通過尋找對應的表征來學習視頻中圖片之間稀疏且不規則的對應模式,并且可以融合進現有的卷積神經網絡架構中。

研究人員在三個視頻分類數據集上進行了實驗,結果表明,CPNet在性能上取得了較大的突破。

CPNet:對應提議網絡

視頻是由一串圖片組成。然而,視頻并不是任意圖片隨機的堆砌,其前后幀有強烈的相關性,表現為一幀圖片中的物體通常會在其它幀中出現。

相比于單張靜態的圖片,這樣的對應關系構成了視頻中動態的部分。我們總結視頻中圖片之間的對應關系有如下三大特點:

對應位置有相似的視覺或語義特征。這也是我們人類判定兩幀中的像素是否屬于同一物體的標準之一。

對應位置在空間維和時間維上都可以有任意長的距離。空間維上,物體可以很快從圖片的一端運動到另一端;時間維上,物體可以在視頻中存在任意長的時間。

潛在的對應位置所占比例為少數。對于一個像素/表征,在其它幀中通常只有極少的相似像素/表征是可能的對應,其它明顯不相似的像素/表征則可以忽略掉。換言之,對應關系存在不規則性和稀疏性。

那么什么樣的網絡架構可以滿足上述特點呢?

三維卷積無法檢測相似性;自相關是局部操作,無法勝任長程對應;非局部模塊側重于注意力機制,無法適應稀疏性和不規則性,也無法學到長程運動的方向。因此我們需要全新的網絡架構。

圖1

我們提出了對應提議網絡CPNet(Correspondence Proposal Network),其架構能同時滿足上述三種特點。

核心思想如圖1所示:深度網絡架構中,我們將視頻表征張量視為一個點云,在語義特征空間中(而非一般的時空空間),對于表征張量中的每一個表征即“點”,我們尋找其在其它幀里最近的k個“點”,并將其視為該表征的潛在對應。然后類似于點云上的深度學習,對于這k對“點”中的每一對,我們使用相同且互相獨立的神經網絡處理他們的特征向量和位置,然后用最大池化操作從k個輸出中提取出最強的響應。本質上,我們的網絡架構可以學到從這k對潛在對應中選擇出最有趣的信息。如此一來,最后的輸出表征向量就包含了視頻中的動態信息。

CPNet的架構

我們將網絡的核心命名為”CP模塊“,其結構如下,大致分為兩個部分。輸入和輸出都是一個THW x C的視頻表征張量,我們將這兩者都視為一個THW個點的帶C維特征向量的點云。

第一個部分為語義特征空間k最近鄰算法,如圖2所示。我們先求出所有表征對之間的負L2語義距離得到THW x THW形狀的矩陣;然后將對角線上的T個HW x HW子矩陣的元素置為負無窮,這樣位于同一幀的表征就可以排除在潛在對應表征之外了。之后對每一行進行arg top k操作就可以得到潛在對應表征的下標。

圖2

第二個部分為對應關系的學習。我們用上一步得到的下標從輸入視頻表征張量中提取出表征。對于每一個輸入表征和其k個最近鄰表征組成的k對表征對中的一對,我們將這一對表征的語義特征向量以及其之間的時空相對位置連在一起,得到k個長向量。然后我們將這k個長向量送入相同且互相獨立的多層感知器(MLP),然后再用元素級的最大池化操作(element-wise max-pooling)得到輸出向量,也就是輸出視頻表征張量該表征位置的語義特征向量。

圖3

為了防止訓練時梯度爆炸或消失,類似于ResNet中的跳躍連接,我們將上一步的輸出表征張量加回到了輸入表征張量中。可以看到,該模塊可以無縫銜接進現有的卷積神經網絡架構如ResNet中。在實驗中,所有CP模塊一開始初始化為全等操作,這樣我們就可以使用ImageNet預訓練模型來初始化網絡其它部分的參數

實驗結果

我們在大規模視頻分類數據集上進行了實驗。首先,我們在Kinetics數據集上進行了小規模模型的實驗來研究CP模塊的數量、位置以及k值的大小對視頻分類結果的影響。由結果可知,模型的性能隨CP模塊數量增多而提高并趨于飽和;CP模塊放置的位置對性能有影響;k值在訓練時和推理時保持一致且合適的值可以得到最佳性能。

我們在Kinetics數據集上與其它已發表結果進行了比較。我們同時比較了小規模和大規模模型。CPNet在參數數量更少的情況下取得優于之前結果的性能。

我們也在Something-Something和Jester數據集上與其它已發表結果進行了比較。相比于Kinetics,這兩個數據集更偏重動態信息對分類的影響。CPNet同樣在參數數量更少的情況下取得優于之前結果。

值得注意的是,相比于沒有CP模塊的基準二維卷積ResNet,CPNet僅僅額外加入了極少的參數,就在這兩個數據集上得到了極大的性能提升,進一步證明了其學習視頻中動態信息的強大能力。

模型的可視化

我們對訓練好的模型進行了可視化來理解其工作原理

我們選取了一個表征的位置,然后在圖片中用箭頭標注出其k個最近鄰表征的位置。特別地,我們用紅色箭頭標注出哪些最近鄰表征在最大池化過程中被選中。我們同時用熱圖來顯示表征圖在經過CP模塊后的變化。

可以看到,通過語義特征的距離,CP模塊可以大致找到正確的潛在對應位置,例如上圖中的籃球、易拉罐和大拇指。

在上述例子中,對于錯誤的對應提議,CP模塊也能在最大池化過程中忽略掉它們。同時,熱圖顯示CP模塊對于處于運動狀態的圖片部分更加敏感。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 矩陣
    +關注

    關注

    0

    文章

    423

    瀏覽量

    34596
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24753
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121347

原文標題:斯坦福&Adobe CVPR 19 Oral:全新通用深度網絡架構CPNet

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    創維集團研究院招聘—背光電子設計師

    創維集團研究院是創維的核心研發機構,研究院堅持創新的發展理念,多次推動產業的轉型升級,掀起席卷中華大地的創維彩電“數碼潮”、“健康風”、“純平風暴”、“逐行風暴”、“高清風暴”、“平板風暴”,“液晶
    發表于 11-07 10:00

    西安某500強研究院招聘

    西安某國球500強企業研究院招聘需要大量通信行業研發人員,主要崗位:嵌入式,射頻,軟件測試等要求:統招本科5年以上工作經驗,碩士3年以上,博士應屆畢業薪資面議有意請聯系QQ:2318655563郵箱:maggie.li@up-hr.com
    發表于 08-13 11:07

    中科建筑設計研究院有限公司招聘照明設計師

    研究院(有限公司)隸屬于中國科學院,成立于1951年,具有建筑工程甲級資質、市政熱力專項甲級、城市規劃設計乙級資質。更多招聘詳情可參考:阿拉丁照明人才網 job.alighting.cn
    發表于 10-23 09:56

    珠江水利科學研究院

    珠江水利科學研究院產品研發崗位招聘一、招聘人數:1~2人二、職責描述:1、承擔水利信息化與自動化硬件產品研發工作2、負責產品總體方案的擬定及研發立項報告編寫3、負責系統詳細設計4、參與產品的軟件開發
    發表于 01-14 10:58

    中馬研究院正式掛牌成立

    `  12月30日下午,中馬研究院于園區正式掛牌成立,園區管委會副主任楊健豪、主任助理曹全來出席并為研究院揭牌,園區管委會經濟發展局全體成員見證揭牌。  中馬研究院旨在打造“立足中馬、面向東盟的新型
    發表于 01-07 16:02

    中科海西研究院泉州裝備制造研究所現代電機控制與電力電子實驗室招聘公告

    ,聯歡會等。四、聯系方式有意應聘,請將簡歷發至郵箱:yiying.huang@fjirsm.ac.cn 中國科學院海西研究院泉州裝備制造研究所是中科海西
    發表于 06-30 16:27

    中科蘇州納米所南昌研究院 封裝測試工程師

    芯片加工,MEMS傳感器、光電子器件的研究背景或工作經驗;4.動手能力強,善于學習溝通,吃苦耐勞,有團隊合作精神; 5.有半導體相關工作2年以上工作經驗優先考慮; 崗位待遇:中科蘇州納米所南昌研究院
    發表于 07-12 17:19

    百度深度學習研究院科學家深度講解人工智能

    的研發經驗。在過去的工作中,他發表過論文十余篇,申請中國專利超過100項,其中已經授權的有95項。他曾任職百度深度學習研究院,負責人臉識別方向,曾經多次帶領團隊在主流的人臉檢測、人臉識別競賽上取得
    發表于 07-19 10:01

    基于深度學習的異常檢測的研究方法

    異常檢測的深度學習研究綜述原文:arXiv:1901.03407摘要異常檢測是一個重要的問題,在不同的研究領域和應用領域都得到了很好的研究。本文的
    發表于 07-12 07:10

    英特爾研究院與聯想研究院簽署研究院合作框架協議

    英特爾研究院與聯想研究院日前在北京簽署了《研究院合作框架協議》,宣布雙方將在PC及移動互聯網領域,立足3~5年長遠技術研究,開展協同創新深度
    發表于 04-13 08:42 ?550次閱讀

    機器學習研究者必知的八個神經網絡架構

    本文簡述了機器學習核心結構的歷史發展,并總結了研究者需要熟知的 8 個神經網絡架構
    發表于 02-26 18:40 ?1123次閱讀

    中國電信將上海研究院更名為中國電信網絡與信息安全研究院

    近日,中國電信進行了研究院架構調整,除整合北京、上海、廣州三家研究院外,同時在新設定的名稱上確定了各自的研究方向,其中上海研究院更名為中國電
    發表于 01-10 11:02 ?4348次閱讀

    微軟亞洲研究院視覺計算組提出高分辨率深度神經網絡

    為了彌補空間精度的損失,研究者在分類卷積神經網絡結構的基礎上,通過引入上采樣操作和/或組合空洞卷積減少降采樣次數來提升表征的分辨率,典型的結構包括Hourglass、U-Net等(如圖2)。
    的頭像 發表于 05-25 10:43 ?2691次閱讀

    中國移動研究院提出“3層+4面”的6G網絡邏輯架構

    國移動研究院主辦了6G系列研討會第二次會議。來自肯特大學、浙江大學、東南大學、西安交通大學、中國信息通信研究院、華為、中興通訊、大唐、VIVO、清微智能和中國移動研究院等學術界和產業界的十余位專家做了云上分享,與超過5000名線
    的頭像 發表于 06-29 10:08 ?2778次閱讀

    微軟亞洲研究院研究提出了一種模型壓縮的新思路

    近日,來自微軟亞洲研究院自然語言計算組的研究提出了一種與顯式地利用蒸餾損失函數來最小化教師模型與學生模型距離的知識蒸餾不同的模型壓縮新方法。
    的頭像 發表于 11-24 09:48 ?1672次閱讀
    主站蜘蛛池模板: 色多多视频在线| 999久久久国产精品| 国产美女视频黄a视频全免费网站| 老汉影视永久免费视频| 性中国videosex国产孕妇| 开心激情五月婷婷| 日在线视频| 222www免费观看| 精品玖玖| 欧美在线色视频| 亚洲激情| 一级特黄aaa大片免色| 天天精品视频| 成人午夜性a一级毛片美女| 免费人成观看在线网| 色老头综合| 五月激情久久| 中文三级视频| 欧美成人h精品网站| 欧美色穴| 99精品偷自拍| 亚洲一区在线视频观看| 好大好硬好深好爽的视频| 国产精品久久久久天天影视| japanese色系tube日本护士| 国产性videostv另类极品| 久久久久国产一级毛片高清板| 亚洲激情婷婷| 22sihu国产精品视频影视资讯| 99精品偷自拍| 亚洲区| 亚洲成色在线综合网站| 日欧毛片| 国产91色综合久久免费分享| 丁香六月婷婷在线| 天天操天天摸天天干| 欧美黑粗硬| 日本在线视| 久久久免费精品| 精品精品国产理论在线观看| 久久久久久久久久免观看|