在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何通過深度學習完成計算機視覺中的所有工作?

Dbwd_Imgtec ? 來源:AI科技大本營 ? 作者:George Seif ? 2021-02-05 11:29 ? 次閱讀

你想做計算機視覺嗎?

如今,深度學習是必經之路。大規模數據集以及深層卷積神經網絡(CNN)的表征能力可提供超準確和強大的模型。但目前仍然只有一個挑戰:如何設計模型?像計算機視覺這樣廣泛而復雜的領域,解決方案并不總是清晰明了的。計算機視覺中的許多標準任務都需要特別考慮:分類、檢測、分割、姿態估計、增強和恢復以及動作識別。盡管最先進的網絡呈現出共同的模式,但它們都需要自己獨特的設計。那么,我們如何為所有這些不同的任務建立模型呢?作者在這里向你展示如何通過深度學習完成計算機視覺中的所有工作!

1、分類

計算機視覺中最出名的就是分類。圖像分類網絡從一個固定大小的輸入開始。輸入圖像可以有任意數量的通道,但對于RGB圖像通常為3。在設計網絡時,分辨率在技術上可以是任意大小,只要足夠大到能夠支持在整個網絡中將要進行的向下采樣量即可。例如,如果你對網絡內的4個像素進行向下采樣,則你的輸入大小至少應為42= 16 x 16像素。隨著深入網絡,當我們嘗試壓縮所有信息并降至一維矢量表示形式時,空間分辨率將降低。為了確保網絡始終有能力將其提取的所有信息進行處理,我們根據深度的比例增加特征圖的數量,來適應空間分辨率的降低。也就是說,我們在向下采樣過程中損失了空間信息,為了適應這種損失,我們擴展了特征圖來增加我們的語義信息。在選擇了一定數量的向下采樣后,特征圖被矢量化并輸入到一系列完全連接的圖層中。最后一層的輸出與數據集中的類一樣多。

8046093a-5f45-11eb-8b86-12bb97331649.png

2、目標檢測

目標檢測器分為兩種:一級和二級。他們兩個都以錨框開始。這些是默認的邊界框。我們的檢測器將預測這些框與地面真相之間的差異,而不是直接預測這些框。在二級檢測器中,我們自然有兩個網絡:框提議網絡和分類網絡。框提議網絡在認為很有可能存在物體的情況下為邊界框提供坐標。再次,這些是相對于錨框。然后,分類網絡獲取每個邊界框中的潛在對象進行分類。在一級檢測器中,提議和分類器網絡融合為一個單一階段。網絡直接預測邊界框坐標和該框內的類。由于兩個階段融合在一起,所以一級檢測器往往比二級檢測器更快。但是由于兩個任務的分離,二級檢測器具有更高的精度。

80b06136-5f45-11eb-8b86-12bb97331649.png

快速RCNN二級目標檢測架構

8111944c-5f45-11eb-8b86-12bb97331649.png

SSD一級目標檢測架構

3、分割

分割是計算機視覺中較獨特的任務之一,因為網絡既需要學習低級信息,也需要學習高級信息。低級信息可按像素精確分割圖像中的每個區域和對象,而高級信息可直接對這些像素進行分類。這導致網絡被設計為將來自較早層和高分辨率(低層空間信息)的信息與較深層和低分辨率(高層語義信息)相結合。如下所示,我們首先通過標準分類網絡運行圖像。然后,我們從網絡的每個階段提取特征,從而使用從低到高的范圍內的信息。每個信息級別在依次組合之前都是獨立處理的。當這些信息組合在一起時,我們對特征圖進行向上采樣,最終得到完整的圖像分辨率。

要了解更多關于如何分割與深度學習工作的細節,請查看這篇文章:

https://towardsdatascience.com/semantic-segmentation-with-deep-learning-a-guide-and-code-e52fc8958823

816274f2-5f45-11eb-8b86-12bb97331649.png

GCN細分架構

4、姿態估計

姿態估計模型需要完成兩個任務:(1)檢測圖像中每個身體部位的關鍵點;(2)找出如何正確連接這些關鍵點。這分以下三個階段完成:

使用標準分類網絡從圖像中提取特征。

給定這些特征,就可以訓練一個子網絡來預測一組2D熱圖。每個熱圖都與一個特定的關鍵點相關聯,并包含每個圖像像素關于是否可能存在關鍵點的置信值。

再次給出分類網絡的特征,我們訓練一個子網絡來預測一組2D向量場,其中每個向量場都與關鍵點之間的關聯度進行編碼。然后,具有較高關聯性的關鍵點被稱為已連接。

用這種方法訓練子網絡的模型,可以聯合優化關鍵點的檢測并將它們連接在一起。

81d5d410-5f45-11eb-8b86-12bb97331649.png

OpenPose姿態估計架構

5、增強和恢復

增強和恢復網絡是它們自己獨特的野獸。我們不會對此進行任何向下采樣,因為我們真正關心的是高像素/空間精度。向下采樣會真正抹殺這些信息,因為它將減少我們為空間精度而擁有的像素數。相反,所有處理都是在全圖像分辨率下完成的。我們開始以全分辨率將想要增強/恢復的圖像傳遞到我們的網絡,而無需進行任何修改。網絡僅由許多卷積和激活函數組成。這些塊通常是受啟發的,并且有時直接復制那些最初為圖像分類而開發的塊,例如殘差塊、密集塊、擠壓激勵塊等。最后一層沒有激活函數,即使是sigmoid或softmax也沒有,因為我們想直接預測圖像像素,不需要任何概率或分數。這就是所有這些類型的網絡。在圖像的全分辨率上進行了大量的處理,來達到較高的空間精度,使用了與其他任務相同的卷積。

85206202-5f45-11eb-8b86-12bb97331649.png

EDSR超分辨率架構

6、動作識別

動作識別是少數幾個需要視頻數據才能正常運行的應用程序之一。要對一個動作進行分類,我們需要了解隨著時間推移,場景中發生的變化, 這自然導致我們需要視頻。我們的網絡必須經過訓練來學習時空信息,即時空變化。最完美的網絡是3D-CNN。顧名思義,3D-CNN是使用3D卷積的卷積網絡。它們與常規CNN的不同之處在于,卷積是在3維上應用的:寬度、高度和時間。因此,每個輸出像素都是根據其周圍像素以及相同位置的前一幀和后一幀中的像素進行計算來預測的。

8864e3b6-5f45-11eb-8b86-12bb97331649.png

直接大量傳遞圖像視頻幀可以通過幾種方式傳遞:

直接在大批量中,例如第一個圖。由于我們正在傳遞一系列幀,因此空間和時間信息都是可用的。

891fa250-5f45-11eb-8b86-12bb97331649.png

單幀+光流(左) 視頻+光流(右)

我們還可以在一個流中傳遞單個圖像幀(數據的空間信息),并從視頻中傳遞其相應的光流表示形式(數據的時間信息)。我們將使用常規2D CNN從這兩者中提取特征,然后再將其組合起來傳遞給我們的3D CNN,后者將兩種類型的信息進行合并。

將幀序列傳遞給一個3D CNN,并將視頻的光流表示傳遞給另一個3D CNN。這兩個數據流都具有可用的空間和時間信息。鑒于我們正在對視頻的兩種不同表示(均包含我們的所有信息)進行特定處理,因此這是最慢的選擇,但也可能是最準確的選擇。

所有這些網絡都輸出視頻的動作分類。

原文標題:如何通過深度學習,完成計算機視覺中的所有工作?

文章出處:【微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7496

    瀏覽量

    88002
  • 機器視覺
    +關注

    關注

    162

    文章

    4375

    瀏覽量

    120345
  • 人工智能
    +關注

    關注

    1791

    文章

    47294

    瀏覽量

    238578

原文標題:如何通過深度學習,完成計算機視覺中的所有工作?

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

    一、什么是計算機視覺計算機視覺,其實就是教機器怎么像我們人一樣,用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉換
    的頭像 發表于 10-31 17:00 ?411次閱讀
    【小白入門必看】一文讀懂<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及<b class='flag-5'>學習</b>路線

    計算機視覺有哪些優缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻的信息。這一技術的發展不僅推動了多個行業的變革,也帶來了諸多優勢,但同時也伴隨著一些挑戰和局限
    的頭像 發表于 08-14 09:49 ?979次閱讀

    機器視覺計算機視覺有什么區別

    。機器視覺的研究目標是讓機器具有類似人類的視覺能力,能夠自動、準確地完成各種視覺任務。 計算機視覺
    的頭像 發表于 07-16 10:23 ?541次閱讀

    計算機視覺的五大技術

    計算機視覺作為深度學習領域最熱門的研究方向之一,其技術涵蓋了多個方面,為人工智能的發展開拓了廣闊的道路。以下是對計算機
    的頭像 發表于 07-10 18:26 ?1377次閱讀

    計算機視覺工作原理和應用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學科的研究領域,它利用計算機和數學算法來模擬人類視覺系統對圖像和視頻進行識別、理解、分析和處理。其核心目標在于使
    的頭像 發表于 07-10 18:24 ?2010次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如
    的頭像 發表于 07-09 09:25 ?661次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習
    的頭像 發表于 07-09 09:23 ?947次閱讀

    計算機視覺和機器視覺區別在哪

    計算機視覺和機器視覺是兩個密切相關但又有明顯區別的領域。 一、定義 計算機視覺 計算機
    的頭像 發表于 07-09 09:22 ?456次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發表于 07-09 09:11 ?1317次閱讀

    計算機視覺怎么給圖像分類

    圖像分類是計算機視覺領域中的一項核心任務,其目標是將輸入的圖像自動分配到預定義的類別集合。這一過程涉及圖像的特征提取、特征表示以及分類器的設計與訓練。隨著深度
    的頭像 發表于 07-08 17:06 ?705次閱讀

    深度學習在工業機器視覺檢測的應用

    隨著深度學習技術的快速發展,其在工業機器視覺檢測的應用日益廣泛,并展現出巨大的潛力。工業機器視覺檢測是工業自動化領域的重要組成部分,
    的頭像 發表于 07-08 10:40 ?1073次閱讀

    深度學習計算機視覺領域的應用

    隨著人工智能技術的飛速發展,深度學習作為其中的核心技術之一,已經在計算機視覺領域取得了顯著的成果。計算機
    的頭像 發表于 07-01 11:38 ?818次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻的信息。隨著
    的頭像 發表于 06-06 17:17 ?986次閱讀

    計算機視覺的十大算法

    隨著科技的不斷發展,計算機視覺領域也取得了長足的進步。本文將介紹計算機視覺領域的十大算法,包括它們的基本原理、應用場景和優缺點。這些算法在圖像處理、目標檢測、人臉識別等領域有著廣泛的應
    的頭像 發表于 02-19 13:26 ?1242次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    計算機視覺:AI如何識別與理解圖像

    計算機視覺是人工智能領域的一個重要分支,它致力于讓機器能夠像人類一樣理解和解釋圖像。隨著深度學習和神經網絡的發展,人們對于如何讓AI識別和理解圖像產生了濃厚的興趣。本文將探討
    的頭像 發表于 01-12 08:27 ?1449次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>:AI如何識別與理解圖像
    主站蜘蛛池模板: 二级片在线| 国语自产自拍秒拍在线视频| 男女交性视频播放视频视频| 亚洲欧美在线观看| 久久精品午夜| 黄视频日本| yy8090韩国日本三理论免费| 99久久伊人一区二区yy5099| 日本高清一本视频| 久久天天躁狠狠躁夜夜呲| 大又大又粗又爽女人毛片| 天天搞一搞| 九九热在线视频观看这里只有精品| 国产高清免费在线观看| 成人午夜大片免费7777| 午夜精品久久久久久| 全亚洲最大的777io影院| 4438x成人网全国最大| 欧洲三级网站| 欧美日韩亚洲一区| xxxx69日本| 直接看黄的网站| 国产精品久久久久影视不卡 | 首页 亚洲 欧美 制服 丝腿| 成人免费aaaaa毛片| 五月花综合| 一级毛片成人免费看a| 四虎在线精品| 天堂新版www中文| 香蕉视频vip| 亚洲高清美女一区二区三区| 伊人久久狼人| 一区二区三区电影| 三级在线观看免播放网站| 四虎必出精品亚洲高清| 婷婷久久综合九色综合九七| 欧美一级欧美三级在线观看| 色网址在线| 色图综合网| 精品卡1卡2卡三卡免费网站视频 | 亚洲人成电影在在线观看网色|