在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習在人臉檢測中的應用

WpOh_rgznai100 ? 來源:YXQ ? 2019-07-08 09:54 ? 次閱讀

在目標檢測領域,可以劃分為人臉檢測與通用目標檢測,往往人臉這方面會有專門的算法(包括人臉檢測、人臉識別、人臉其他屬性的識別等),并且和通用目標檢測(識別)會有一定的差別。這主要來源于人臉的特殊性(譬如有時候目標比較小、人臉之間特征不明顯、遮擋問題等),本文將主要從人臉檢測方面來講解目標檢測。

目前主要的人臉檢測方法分類

當前,人臉檢測方法主要包含兩個區域:傳統人臉檢測算法和基于深度學習的人臉檢測算法。傳統人臉檢測算法主要可以分為 4 類:

基于知識的人臉檢測方法;

基于模型的人臉檢測方法;

基于特征的人臉檢測方法;

基于外觀的人臉檢測方法。

2006 年,Hinton 首次提出深度學習(Deep Learning)的概念,它是通過組合低層的特征形成更高層的抽象特征。隨后研究者將深度學習應用在人臉檢測領域,主要集中在基于卷積神經網絡(CNN)的人臉檢測研究,如基于級聯卷積神經網絡的人臉檢測(Cascade CNN)、基于多任務卷積神經網絡的人臉檢測(MTCNN)、Facebox 等,很大程度上提高了人臉檢測的魯棒性。

當然,像Faster RCNN、YOLO、SSD等通用目標檢測算法也有用在人臉檢測領域,也可以實現比較不錯的結果,但是和專門人臉檢測算法比還是有差別。

如何檢測圖片中不同大小的人臉?

傳統人臉檢測算法中針對不同大小人臉主要有兩個策略:

縮放圖片的大小(圖像金字塔如圖 1 所示);

圖1 圖像金字塔

縮放滑動窗的大小(如圖 2 所示)。

圖 2 縮放滑動窗口

基于深度學習的人臉檢測算法中,針對不同大小人臉主要也有兩個策略,但和傳統人臉檢測算法有點區別,主要包括:

縮放圖片大小:不過也可以通過縮放滑動窗的方式,基于深度學習的滑動窗人臉檢測方式效率會很慢存在多次重復卷積,所以要采用全卷積神經網絡(FCN),用 FCN 將不能用滑動窗的方法。

通過 anchor box 的方法:如圖 3 所示,不要和圖 2 混淆,這里是通過特征圖預測原圖的 anchorbox 區域,具體在 Facebox 中有描述。

圖 3 anchor box

如何設定算法檢測最小人臉尺寸?

主要是看滑動窗的最小窗口和 anchorbox 的最小窗口。

滑動窗的方法

假設通過 12×12 的滑動窗,不對原圖做縮放的話,就可以檢測原圖中 12×12 的最小人臉。

但是往往通常給定最小人臉 a=40、或者 a=80,以這么大的輸入訓練 CNN 進行人臉檢測不太現實,速度會很慢,并且下一次需求最小人臉 a=30*30 又要去重新訓練,通常還會是 12×12 的輸入,為滿足最小人臉框 a,只需要在檢測的時候對原圖進行縮放即可:w=w×12/a。

anchorbox 的方法

原理類似,這里主要看 anchorbox 的最小 box,通過可以通過縮放輸入圖片實現最小人臉的設定。

如何定位人臉的位置

滑動窗的方式:

滑動窗的方式是基于分類器識別為人臉的框的位置確定最終的人臉。

圖 4 滑動窗

FCN 的方式:

通過特征圖映射到原圖的方式確定最終識別為人臉的位置,特征圖映射到原圖人臉框是要看特征圖相比較于原圖有多少次縮放(縮放主要查看卷積的步長和池化層)。

假設特征圖上(2,3)的點,可粗略計算縮放比例為 8 倍,原圖中的點應該是(16,24);如果訓練的 FCN 為 12*12 的輸入,對于原圖框位置應該是(16,24,12,12)。

當然這只是估計位置,具體的在構建網絡時要加入回歸框的預測,主要是相對于原圖框的一個平移與縮放。

通過 anchor box 的方式:

通過特征圖映射到圖的窗口,通過特征圖映射到原圖到多個框的方式確定最終識別為人臉的位置。

如何通過一個人臉的多個框確定最終人臉框位置?

圖 5 通過 NMS 得到最終的人臉位置

NMS 改進版本有很多,最原始的 NMS 就是判斷兩個框的交集。如果交集大于設定的閾值,將刪除其中一個框。

那么兩個框應該怎么選擇刪除哪一個呢?因為模型輸出有概率值,一般會優選選擇概率小的框刪除。

基于級聯卷積神經網絡的人臉檢測(Cascade CNN)

Cascade CNN 的框架結構是什么?

級聯結構中有 6 個 CNN,3 個 CNN 用于人臉非人臉二分類,另外 3 個 CNN 用于人臉區域的邊框校正。

給定一幅圖像,12-net 密集掃描整幅圖片,拒絕 90% 以上的窗口。剩余的窗口輸入到 12-calibration-net 中調整大小和位置,以接近真實目標。接著輸入到 NMS 中,消除高度重疊窗口。下面網絡與上面類似。

Cascade CNN 人臉校驗模塊原理是什么?

該網絡用于窗口校正,使用三個偏移變量:

Xn:水平平移量,Yn:垂直平移量,Sn:寬高比縮放。

候選框口(x,y,w,h)中,(x,y)表示左上點坐標,(w,h)表示寬和高。

我們要將窗口的控制坐標調整為:

這項工作中,我們有種模式。偏移向量三個參數包括以下值:

同時對偏移向量三個參數進行校正。

訓練樣本應該如何準備?

人臉樣本;

非人臉樣本。

級聯的好處

最初階段的網絡可以比較簡單,判別閾值可以設得寬松一點,這樣就可以在保持較高召回率的同時排除掉大量的非人臉窗口;

最后階段網絡為了保證足夠的性能,因此一般設計的比較復雜,但由于只需要處理前面剩下的窗口,因此可以保證足夠的效率;

級聯的思想可以幫助我們去組合利用性能較差的分類器,同時又可以獲得一定的效率保證。

基于多任務卷積神經網絡的人臉檢測(MTCNN)

MTCNN 模型有三個子網絡,分別是 P-Net,R-Net,O-Net。

為了檢測不同大小的人臉,開始需要構建圖像金字塔,先經過 PNet 模型,輸出人臉類別和邊界框(邊界框的預測為了對特征圖映射到原圖的框平移和縮放得到更準確的框),將識別為人臉的框映射到原圖框位置可以獲取 patch,之后每一個 patch 通過 resize 的方式輸入到 RNet,識別為人臉的框并且預測更準確的人臉框,最后 RNet 識別為人臉的的每一個 patch 通過 resize 的方式輸入到 ONet,跟 RNet 類似,關鍵點是為了在訓練集有限情況下使模型更魯棒。

還要注意一點:構建圖像金字塔的的縮放比例要保留,為了將邊界框映射到最開始原圖上。

Facebox

(1)Rapidly Digested Convolutional Layers(RDCL)

在網絡前期,使用 RDCL 快速的縮小 feature map 的大小。主要設計原則如下:

Conv1, Pool1, Conv2 和 Pool2 的 stride 分別是 4, 2, 2 和 2。這樣整個 RDCL 的 stride 就是 32,可以很快把 feature map 的尺寸變小。

卷積(或 pooling)核太大速度就慢,太小覆蓋信息又不足。權衡之后,將 Conv1, Pool1, Conv2 和 Pool2 的核大小分別設為 7x7,3x3,5x5,3x3。

使用 CReLU 來保證輸出維度不變的情況下,減少卷積核數量。

(2)Multiple Scale Convolutional Layers(MSCL)

在網絡后期,使用 MSCL 更好地檢測不同尺度的人臉。主要設計原則有:

類似于 SSD,在網絡的不同層進行檢測;

采用 Inception 模塊。由于 Inception 包含多個不同的卷積分支,因此可以進一步使得感受野多樣化。

(3)Anchor densification strategy

為了 anchor 密度均衡,可以對密度不足的 anchor 以中心進行偏移加倍,如下圖所示:

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人臉識別
    +關注

    關注

    76

    文章

    4014

    瀏覽量

    82083
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121336

原文標題:深度學習在人臉檢測中的應用 | CSDN 博文精選

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GPU深度學習的應用 GPUs圖形設計的作用

    隨著人工智能技術的飛速發展,深度學習作為其核心部分,已經成為推動技術進步的重要力量。GPU(圖形處理單元)深度學習
    的頭像 發表于 11-19 10:55 ?613次閱讀

    如何用OpenCV的相機捕捉視頻進行人臉檢測--基于米爾NXP i.MX93開發板

    的是Haar特征人臉檢測,此外OpenCV還集成了深度學習方法來實現人臉
    發表于 11-15 17:58

    NPU深度學習的應用

    設計的硬件加速器,它在深度學習的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的處理器,它與傳統的CPU和G
    的頭像 發表于 11-14 15:17 ?725次閱讀

    GPU深度學習應用案例

    GPU深度學習的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是
    的頭像 發表于 10-27 11:13 ?438次閱讀

    深度識別人臉識別有什么重要作用嗎

    深度學習人臉識別技術是人工智能領域的一個重要分支,它利用深度學習算法來識別和驗證個人身份。這項技術
    的頭像 發表于 09-10 14:55 ?598次閱讀

    深度識別人臉識別在任務為什么有很強大的建模能力

    深度學習人臉識別技術是人工智能領域中的一個重要分支,它利用深度學習算法來識別和驗證人臉。這項技術
    的頭像 發表于 09-10 14:53 ?452次閱讀

    基于Python的深度學習人臉識別方法

    基于Python的深度學習人臉識別方法是一個涉及多個技術領域的復雜話題,包括計算機視覺、深度學習、以及圖像處理等。在這里,我將概述一個基本的
    的頭像 發表于 07-14 11:52 ?1294次閱讀

    深度學習的無監督學習方法綜述

    應用往往難以實現。因此,無監督學習深度學習扮演著越來越重要的角色。本文旨在綜述
    的頭像 發表于 07-09 10:50 ?846次閱讀

    深度學習工業機器視覺檢測的應用

    隨著深度學習技術的快速發展,其工業機器視覺檢測的應用日益廣泛,并展現出巨大的潛力。工業機器視覺檢測
    的頭像 發表于 07-08 10:40 ?1127次閱讀

    基于AI深度學習的缺陷檢測系統

    工業生產中,缺陷檢測是確保產品質量的關鍵環節。傳統的人工檢測方法不僅效率低下,且易受人為因素影響,導致誤檢和漏檢問題頻發。隨著人工智能技術的飛速發展,特別是深度
    的頭像 發表于 07-08 10:30 ?1579次閱讀

    深度學習視覺檢測的應用

    深度學習是機器學習領域中的一個重要分支,其核心在于通過構建具有多層次的神經網絡模型,使計算機能夠從大量數據自動學習并提取特征,進而實現對復
    的頭像 發表于 07-08 10:27 ?796次閱讀

    基于深度學習的小目標檢測

    計算機視覺領域,目標檢測一直是研究的熱點和難點之一。特別是小目標檢測方面,由于小目標圖像中所占比例小、特征不明顯,使得
    的頭像 發表于 07-04 17:25 ?987次閱讀

    人臉檢測模型有哪些

    人臉檢測是計算機視覺領域的一個重要研究方向,它涉及到從圖像或視頻檢測出人臉的位置和大小。隨著深度學習
    的頭像 發表于 07-03 17:05 ?1105次閱讀

    人臉檢測人臉識別的區別是什么

    人臉檢測人臉識別是計算機視覺領域的兩個重要技術,它們許多應用場景中都有廣泛的應用,如安全監控、身份驗證、社交媒體等。盡管它們某些方面有
    的頭像 發表于 07-03 14:49 ?1322次閱讀

    深度學習自動駕駛的關鍵技術

    隨著人工智能技術的飛速發展,自動駕駛技術作為其中的重要分支,正逐漸走向成熟。自動駕駛系統深度學習技術發揮著至關重要的作用。它通過模擬人腦的學習
    的頭像 發表于 07-01 11:40 ?817次閱讀
    主站蜘蛛池模板: 免费国产h视频在线观看| 老湿影院免费体验区| 亚洲高清资源| 亚洲国产美女精品久久| 天天激情综合| 毛片在线不卡| 国产女人水多白浆| 92香蕉视频| 一区二区三区免费精品视频| 婷婷激情在线| 在线天堂中文有限公司| 亚洲美女视频一区二区三区| 视频免费黄色| 精品手机在线| 91久久另类重口变态| 婷婷毛片| 成人午夜网站| 色福利网站| 日本高清黄色| 激情都市亚洲| 午夜视频福利| 成 人网站免费| 亚洲第一区在线| 亚洲高清免费| 欧美色视频日本片高清在线观看 | 久久香蕉综合精品国产| 粉嫩尤物在线456| 亚洲免费观看在线视频| 成人黄色免费网站| 亚洲视频在线一区二区| 亚洲欧美日本综合| 美女黄色在线| 午夜日批| 日本xxxxxx69| 一个色中文字幕| 免费一级毛片无毒不卡| 一级片在线免费| 草久久久久| 在线天堂中文字幕| 欧美成人看片一区二区三区| 99色99|