近日,世界最權(quán)威的人臉檢測公開評測集WIDER FACE公布最新評測結(jié)果,滴滴AI Labs團隊聯(lián)合北京郵電大學PRIS團隊提出的人臉檢測DFS算法,在WIDER FACE的Easy、Medium和Hard三個評測子集的六項評估結(jié)果中, 超過了國內(nèi)外眾多科技公司和高校院所,取得了五項第一、一項第二的好成績,充分彰顯了滴滴在人臉檢測領(lǐng)域的創(chuàng)新能力。
WIDER FACE是目前業(yè)界公開的數(shù)據(jù)規(guī)模最大、檢測難度最高的人臉檢測數(shù)據(jù)集之一,由香港中文大學于2016年建立,共包含32,203張圖像和393,703個人臉標注。其中40%的數(shù)據(jù)為訓練集(Training),10%的數(shù)據(jù)為驗證集(Validation),50%的數(shù)據(jù)為測試集(Testing)。每個集合中的數(shù)據(jù)根據(jù)人臉檢測的難易程度分為“Easy”、“Medium”、“Hard”。
由于匯集了人臉尺寸大小變化、拍照角度引起的人臉姿態(tài)變化、不同程度的人臉遮擋、表情變化、光照強弱差異以及化妝等多種影響因素,該數(shù)據(jù)集在全球人臉檢測領(lǐng)域極具挑戰(zhàn)性,每次評測均會吸引多家國內(nèi)外科技巨頭及高校院所(包含卡耐基梅隆大學、加州大學圣地亞哥分校、北航、浙大、京東、騰訊優(yōu)圖、百度、華為云、IBM沃森研究院等)在這個數(shù)據(jù)集上驗證了自己的算法效果。
最新評測結(jié)果顯示, AI Labs團隊提出的DFS算法在WIDER FACE人臉檢測平臺中,在官方驗證集和測試集的六項評估結(jié)果中取得五項第一、一項第二。其中在“Easy”、“Medium”和“Hard”三個測試子集中,DFS算法性能分別達到96.3% AP,95.4% AP,90.7% AP。
圖1 驗證集性能曲線圖
圖2 測試集性能曲線圖
DFS算法以卷積神經(jīng)網(wǎng)絡中的特征融合為切入點,為了防止高層特征圖上的語義信息覆蓋低層特征圖上的細節(jié)信息,提出了特征融合金字塔(Feature Fusion Pyramid)結(jié)構(gòu),其以空間和通道注意力機制的方式融合高低層特征,在不失細節(jié)信息的同時將語義信息作為上下文線索(contextual cues)增強低層特征;另外,DFS算法提出了一種輔助訓練單階段檢測器的語義分割分支(Semantic Segmentation branch),促使檢測網(wǎng)絡以一種自監(jiān)督的方式實現(xiàn)注意力機制以及學到更好的特征。具體地說,DFS算法獨特的語義分割分支分層地利用更強的語義分割監(jiān)督信息監(jiān)督訓練網(wǎng)絡,使得用于預測人臉的各級特征圖專注于各自最適宜檢測到的不同尺寸的人臉。
圖3 DFS算法網(wǎng)絡框架圖
目前人臉檢測和識別技術(shù)已經(jīng)在滴滴平臺廣泛使用,用于司機人不符檢測、行程中車內(nèi)錄像時的乘客隱私保護等場景,并已形成成熟的技術(shù)解決方案,幫助外部合作伙伴進一步提高效率。
實際上,滴滴已經(jīng)多次在圖像視頻領(lǐng)域相關(guān)競賽或評測中獲得世界級第一。在去年7月的CVPR 2018 WAD自動駕駛挑戰(zhàn)賽中,攬獲了二、三、四名的好成績;而在去年9月ECCV 2018 COCO & Mapillary挑戰(zhàn)賽中,滴滴技術(shù)團隊首次參賽即獲得Mapillary街景檢測單項世界第一。
此次人臉檢測技術(shù)再破世界紀錄,也充分體現(xiàn)了滴滴在計算機視覺領(lǐng)域強大技術(shù)實力,滴滴將持續(xù)進行更多探索,不斷優(yōu)化出行交通感知理解、智能交互等技術(shù),用先進的AI技術(shù)提升用戶體驗、助力行業(yè)轉(zhuǎn)型升級,進而構(gòu)建智能出行新生態(tài)。
-
算法
+關(guān)注
關(guān)注
23文章
4626瀏覽量
93157 -
人臉檢測
+關(guān)注
關(guān)注
0文章
80瀏覽量
16481 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1209瀏覽量
24772
原文標題:滴滴提出人臉檢測DFS算法,在WIDER FACE評測中獲得世界第一
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論