谷歌近日發(fā)布了一款專為移動(dòng)GPU推理量身定制的輕量級(jí)人臉檢測(cè)器——亞毫秒級(jí)的人臉檢測(cè)算法Blaze Face。它能夠在旗艦設(shè)備上以200-1000+fps的速度運(yùn)行,并且可以應(yīng)用在諸多需要快速準(zhǔn)確的識(shí)別出人臉區(qū)域的任務(wù)中,例如:2D/3D面部關(guān)鍵點(diǎn)識(shí)別與幾何評(píng)估、面部特征和表情分類以及面部區(qū)域分割等。
當(dāng)提及“人臉識(shí)別技術(shù)”的時(shí)候,想必大家都不會(huì)覺(jué)得陌生。“人臉識(shí)別技術(shù)”自從二十世紀(jì)六十年代后期研發(fā),再到九十世紀(jì)逐步進(jìn)入市場(chǎng),技術(shù)的準(zhǔn)確率逐步達(dá)到了99%的高精準(zhǔn)度,有的人臉識(shí)別軟件在國(guó)際標(biāo)準(zhǔn)的LFW數(shù)據(jù)庫(kù)中甚至取得了99.15%的準(zhǔn)確率,已然反超了人眼的辨認(rèn)能力。也正因此,各行各業(yè)都將人臉識(shí)別納入到了未來(lái)的規(guī)劃前景中,尤其是AI領(lǐng)域的企業(yè),例如曠視科技,依圖科技,極鏈科技等公司,紛紛對(duì)此躍躍欲試。
在人臉識(shí)別技術(shù)發(fā)展初期,一個(gè)典型的基于視頻圖像的人臉識(shí)別系統(tǒng)一般都是自動(dòng)檢測(cè)人臉區(qū)域,從視頻中提取特征,最后如果人臉存在則識(shí)別出人臉的身份。在視頻監(jiān)控、信息安全和出入控制等應(yīng)用中,基于視頻的人臉識(shí)別是一個(gè)非常重要的問(wèn)題,也是目前人臉識(shí)別的一個(gè)熱點(diǎn)和難點(diǎn)。基于視頻比基于靜態(tài)圖像更具優(yōu)越性,因?yàn)锽ruce和Knight等人已證明,當(dāng)人臉被求反或倒轉(zhuǎn)時(shí),運(yùn)動(dòng)信息有助于人臉的識(shí)別。雖然視頻人臉識(shí)別是基于靜態(tài)圖像的人臉識(shí)別的直接擴(kuò)展,但一般認(rèn)為視頻人臉識(shí)別算法需要同時(shí)用到空間和時(shí)間信息,這類方法直到近幾年才開(kāi)始受到重視并需要進(jìn)一步的研究和發(fā)展。
目前視頻人臉識(shí)別還有很多的困難與挑戰(zhàn),具體來(lái)說(shuō)一是視頻圖像質(zhì)量比較差:視頻圖像一般是在戶外(或室內(nèi),但是采集條件比較差)獲取的,通常沒(méi)有用戶的配合,所以視頻人臉圖像經(jīng)常會(huì)有很大的光照和姿態(tài)變化,還可能會(huì)有遮擋和偽裝。
二是人臉圖像比較小:同樣,由于采集條件比較差,視頻人臉圖像一般會(huì)比基于靜態(tài)圖像的人臉識(shí)別系統(tǒng)的預(yù)設(shè)尺寸小。小尺寸的圖像不但會(huì)影響識(shí)別算法的性能,而且還會(huì)影響人臉檢測(cè),分割和關(guān)鍵點(diǎn)定位的精度,這必然會(huì)導(dǎo)致整個(gè)人臉識(shí)別系統(tǒng)性能的下降。
在這種情況下,提升系統(tǒng)識(shí)別的精度與準(zhǔn)確度顯然成為了人臉識(shí)別領(lǐng)域的當(dāng)務(wù)之急。如何利用AI有效的推動(dòng)人臉識(shí)別的發(fā)展,成為了人工智能視覺(jué)與圖像領(lǐng)域中的重點(diǎn)應(yīng)用。
比如視頻AI領(lǐng)域的獨(dú)角獸極鏈科技,便提出了以四模塊來(lái)對(duì)場(chǎng)景中的人臉進(jìn)行識(shí)別:
模塊一:視頻結(jié)構(gòu)化,將視頻用鏡頭分割
在這一環(huán)節(jié)中,通常采用全局特征和局部特征相結(jié)合的方法。全局特征檢測(cè)全局顏色的分布突變,然后借用局部特征獲得的人臉識(shí)別的跟蹤結(jié)果、跟蹤軌跡的斷續(xù)來(lái)判斷視頻是否具有鏡頭切換。跟蹤來(lái)判斷鏡頭切換有一個(gè)很大的優(yōu)點(diǎn),因?yàn)楹罄m(xù)的步驟也會(huì)采用相似的算法,所以這一步驟所需的算法是可以重復(fù)使用的。
模塊二:人臉軌跡提取
完成了鏡頭分割以后,就可以分割好的單一鏡頭里進(jìn)行人臉軌跡提取。在軌跡提取的算法上,同樣要考慮準(zhǔn)確率和速度的指標(biāo)。要實(shí)現(xiàn)速度和準(zhǔn)確率的平衡,可以有以下兩種途徑:一是間隔采樣or逐幀處理,二是檢測(cè)&跟蹤的配合。
模塊三:人臉識(shí)別
有了人臉軌跡之后,就可以開(kāi)始進(jìn)行人臉的識(shí)別了。但是在將人臉數(shù)據(jù)輸入深度網(wǎng)絡(luò)之前,還需要對(duì)其進(jìn)行必要的變換和處理。其中一部分變換在針對(duì)人臉這一部分非常重要,尤其是在消費(fèi)級(jí)視頻里,那就是人臉的對(duì)齊。人臉對(duì)齊是利用人臉的特征點(diǎn)檢測(cè)定位,將各種姿勢(shì)的人臉圖像還原矯正為正臉的過(guò)程。在算法框架中,需要加入人臉質(zhì)量評(píng)估的算法,以過(guò)濾低質(zhì)量的人臉圖片,保證人臉數(shù)據(jù)的準(zhǔn)確率。
在樣本足夠的前提下,可以利用訓(xùn)練得到的模型對(duì)人臉樣本進(jìn)行特征提取。測(cè)試的時(shí)候,在視頻中檢測(cè)得的人臉后,將其輸入到生成的特征向量里,與人臉互動(dòng)的特征向量進(jìn)行匹配,從而找到在特征空間中最接近的一個(gè)樣本。
模塊四:識(shí)別結(jié)果融合
以上提到的人臉識(shí)別都是針對(duì)單幀識(shí)別的圖片而言的,之前說(shuō)到的系統(tǒng)識(shí)別結(jié)果都是針對(duì)整個(gè)人臉軌跡而言。因此,最后需要將人臉識(shí)別的結(jié)果與整條人臉軌跡融合起來(lái),得到整個(gè)軌跡的識(shí)別結(jié)果。
識(shí)別結(jié)果的融合策略也有很多。簡(jiǎn)單的有投票策略,即將尾幀的識(shí)別結(jié)果是為一票,識(shí)別結(jié)果票數(shù)最高者則為軌跡的最終識(shí)別結(jié)果。也有用神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)這一融合,可以訓(xùn)練一個(gè)時(shí)間維度上的神經(jīng),將每一幀識(shí)別出的特征向量作為網(wǎng)絡(luò)的輸入,經(jīng)過(guò)在時(shí)間維度上的一系列的參數(shù)變換得到最終的特征向量。
如果說(shuō)AI是時(shí)代的浪潮,那人臉識(shí)別就是乘風(fēng)破浪的小舟。在這個(gè)“刷臉”從調(diào)侃變?yōu)楝F(xiàn)實(shí)的今天,借著人工智能的發(fā)展,人臉識(shí)別可以擁有更高的精度,更強(qiáng)的識(shí)別,以及一個(gè)更寬廣的未來(lái)。
-
AI
+關(guān)注
關(guān)注
87文章
30998瀏覽量
269304 -
人臉識(shí)別技
+關(guān)注
關(guān)注
0文章
12瀏覽量
5864 -
人臉識(shí)別技術(shù)
+關(guān)注
關(guān)注
0文章
125瀏覽量
14512
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論