在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從圖像數據角度為人臉識別準確率的提高提出的建議

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-08-05 09:08 ? 次閱讀

編者按:作為目前人工智能界著名的獨角獸,商湯科技在圖像處理和人臉識別技術領域處在世界前沿的位置。近日,該公司在arXiv上發表論文The Devil of Face Recognition is in the Noise,從圖像數據角度為人臉識別準確率的提高提出了建議。

在進行人臉識別的任務時,數據集是其中的關鍵。從早期的FERET數據集到最近的LFW、MegaFace和MS-Celeb-1M,數據集在新技術的發展上有著不可或缺的作用。這些數據集不僅僅提供了更加豐富的資源,而且數據規模也有了非常大的提高例如,MS-Celeb-1M包含大約1000萬張圖片,其中有10萬個人物,遠遠超過只有14126張圖像、1199個人的FERET數據集。大型數據集,再加上深度學習技術,讓人臉識別在這幾年取得了巨大的成功。

然而,大型數據集不可避免地會受到標簽噪聲的影響。這一問題很普遍,因為經過良好標注的大型數據集得來的成本非常高昂,所以這也促使科學家們尋找便宜但并不完美的替代方法。一種常見的方法是根據人名在網絡上查找他們的照片,再用自動或半自動方法對標簽進行清理。另外還有些方法會在社交網站上手機照片。上述方法都是擴大訓練樣本的簡便方法,但同時也會帶來標簽噪聲,給訓練和模型帶來負面效果。圖1就是含有標簽噪聲的一些樣本:

圖1

可以看到,MegaFace和MS-Celeb-1M都含有相當多的錯誤標簽,有些噪聲標簽可以輕易消除,但是大部分想要消除還是很困難的。在MegaFace中還有很多重復的圖像(最后一行)。

所以,本文的首要目標是探究標簽噪聲的來源,以及在深度卷積神經網絡中,這些噪聲會給人臉識別造成何種后果。我們主要考慮的問題有:想要達到清理數據的目的,需要多少噪聲樣本?噪聲和最終的模型性能之間有何種關系?標注人臉的最佳策略是什么?對這些問題的理解將有助于我們設計更好的數據收集和清理方法,同時防止在訓練過程中造成危險,以形成能應對現實問題的強大算法。

其次,本文的第二目標是為社區建立一個干凈的人臉識別數據集。該數據集能幫助研究人員訓練更好的模型,并且進一步了解噪聲和人臉識別性能之間的關系。

現存數據有多少噪音?

這一部分中我們會介紹幾種流行的數據集,之后會分析他們各自的信噪比。目前用于人臉識別研究的數據集大致如下表所示:

了解各數據集所含數據后,我們想大概估計每個數據集中的噪聲分布。但由于數據集體積過大,想計算確切的數字不那么容易,所以我們隨機選擇了數據集的子集,然后手動將它們分為三個類別:“正確識別”、“待定”和“錯誤識別”。

從各數據集中抽取一部分數據后,大概情況如圖2a所示:

圖2a

可以看出,數據規模越大,信噪比越大。

之后,我們又對兩個最大的數據集——MS-Celeb-1M和MegaFace進行噪聲分布分析。我們首先根據圖片數量對數據集中人物進行分類,最終生成了6個類別,通過下圖可以看出每個類別的信噪比。

可以看出,大多數目標只有很少的圖像與之對應,這一情況在MegaFace上更明顯,因為它是用自動方法收集的數據。與MS-Celeb-1M相比,MegaFace的噪聲似乎更少,但是我們發現在MegaFace干凈的數據集中,有很多重復圖像。

打造自己的清潔數據集

通過分析我們得出,一個含有超過一百萬張圖片的數據集,信噪比通常高達30%。為了創建一個干凈的數據集,我們不僅在收集人臉數據時找尋更干凈、更多樣的來源,更重要的是找到一種高效的數據標記方法。

從IMDb中搜集人臉圖像

被大家廣泛使用的ImageNet是直接從谷歌圖片中搜索來圖像的,其他數據集也大多如此,但這樣做的壞處是存在數據偏見。從圖3中我們可以看出,從搜索引擎中搜到的圖片背景都很簡單,光線充足,大都是圖片的前景。而在實際的視頻中,人臉圖像并沒有這么清晰。另外,從搜索引擎中得到的圖片通常查全率很低,經過研究我們發現,在200張照片中,平均查全率只有40%。

圖3

在這項研究中,我們從IMDb網站搜集圖像,因為該網站結構化程度更高,每個人物的照片種類也比較多,包括官方照片、生活照、電影劇照等等。另外,這里的查全率更高達90%。最終我們收集了170萬張名人的照片,其中有5900位明星。

標記處理

我們對數據進行了清洗,但是清洗的方法有以下三種:

第一種,志愿者們在圖片中圈出目標人物;第二步,在三個候選圖像中,志愿者們要選擇對應目標圖像的那張圖片;第三步,直接進行判斷,Yes or No。

最終,三種方法的ROC曲線如圖:

可以看到第一種方法的F1分數最高,誤報率不超過10%。第三種方法的效果最差。另外,我們還發現一個有趣的現象,即當志愿者標注的時間越長,標注的準確性越高。

實驗過程

實驗分為四個部分。首先,我們在提出的數據集上添加模擬噪聲,進行控制變量研究。這有助于我們觀察在由噪音的情況下性能的下降。

之后,我們會在兩個現有數據集上進一步實驗,探索噪音的影響。

第三,將我們的數據集和其他傳統數據集進行對比,驗證其有效性。

最后,將在我們數據集上訓練的模型和其他模型進行對比。最終結果如下表:

我們的模型IMDb-Face得到了目前的最高分數。

結語

與目前流行的專注于復雜損失和CNN結構的研究不同,我們從數據的角度來研究人臉識別問題,尤其是對標記噪聲的來源有了一定認識。最終我們新建的IMDb-Face數據集也成為了打造大型干凈數據集的重要基礎。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1792

    文章

    47514

    瀏覽量

    239240
  • 人臉識別
    +關注

    關注

    76

    文章

    4014

    瀏覽量

    82091
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121345

原文標題:商湯科技:圖片噪聲才是人臉識別背后的惡魔

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于RBM實現手寫數字識別準確率

    DL之RBM:基于RBM實現手寫數字識別準確率
    發表于 12-28 10:19

    請問誰做過蟻群算法選擇圖像特征,使識別準確率最高?

    請問誰做過蟻群算法選擇圖像特征,使識別準確率最高?有學習資料或者matlab代碼可以讓我學習一下嗎
    發表于 02-17 17:20

    如何提高Stm32F746G準確率

    你好帶時鐘的教程 3。如何提高準確率?最好的祝福安杰伊
    發表于 01-12 07:26

    國產工業級RK3568核心板-AI人臉識別產品方案

    ,自動對焦等功能的攝像頭模組,以保證圖像質量和拍攝效果。在圖像采集的過程中,可以使用RK3568內置的ISP圖像處理單元對圖像進行優化,提高人臉
    發表于 05-06 14:30

    最新人臉識別算法不看臉也能準確工作

    德國研究者發明的人臉識別算法無需看到照片中的面部也能實現較高的身份識別準確率
    發表于 08-10 10:36 ?1202次閱讀

    人工智能首次超過人眼準確率 人臉識別準確度已經提升4個數量級

    隨著算法的提升,應用邊界不斷擴大,人工智能(AI)人臉識別技術的準確率首次超過人眼準確率,人工智能如何通過云和端改變生活和未來。
    發表于 02-06 12:42 ?1.4w次閱讀

    人臉識別技術可以達到99.84%的準確率,實現了飛速的發展

    經過40多年的發展,人臉識別技術取得了長足的進步,目前最優的系統識別率在樣本數字比較大的情況下可以達到99.84%的準確率,甚至超過了人類的識別
    發表于 09-07 15:13 ?9953次閱讀

    人臉識別準確率大幅度提升,離不開科技企業的努力

    根據 NIST 2018年發布的成績,目前全球最好人臉識別技術水平為千萬分之一誤報下的識別準確率接近 99%(yitu-001),這意味著受限場景下,在千萬分位誤報上,人類已經將機器的
    發表于 09-30 09:17 ?1898次閱讀

    “抗人臉識別”的 AI 讓準確率100%狂降只剩0.5%

    摘要: 人臉識別的各項應用推陳出新,隱私疑慮卻未曾消除。現在有學者研發“抗人臉識別”的 AI,可以讓人臉
    發表于 03-04 13:31 ?1399次閱讀

    報告指出口罩正在挫敗常規的人臉識別算法,提高錯誤

    7月,NIST發布了一份報告,指出口罩正在挫敗常規的人臉識別算法,錯誤5%到50%不等。NIST被廣泛認為是人臉
    發表于 08-28 14:48 ?532次閱讀

    提高心電信號分類識別準確率的模糊決策樹

    提高心電信號分類識別準確率提出一種基于時頻特征融合與動態模糊決策樹的心電信號分類識別方法。對心電信號依次進行周期分割、小波包分解與重構
    發表于 05-28 10:34 ?14次下載

    人臉識別技術的挑戰和未來發展

    人臉識別技術在實現過程中面臨著一些挑戰和問題。 首先,人臉識別技術需要具備高準確率識別速度,以
    的頭像 發表于 06-28 18:07 ?924次閱讀

    智慧礦山:AI算法為何能提高未戴安全帶識別準確率

    未穿戴安全帶識別AI算法是智慧礦山的重要應用之一,可以提高礦山工作人員的安全意識和降低事故發生的概率。為了提高識別準確率,研究人員可以優化
    的頭像 發表于 10-22 22:01 ?469次閱讀

    ai人工智能回答準確率高嗎

    ,AI可能表現出較高的準確率。例如,在圖像識別、語音識別等領域,經過大量訓練的AI系統通常能夠取得令人滿意的準確率。 然而,在其他領域或場景下,AI的
    的頭像 發表于 10-17 16:30 ?3565次閱讀

    如何提升人臉門禁一體機的識別準確率

    準確率,可以以下幾個方面進行改進。一、優化算法與模型人臉識別的核心在于算法的優化和模型的調整,目前深度學習技術在圖像識別中的應用取得了顯著
    的頭像 發表于 12-10 15:05 ?250次閱讀
    如何提升<b class='flag-5'>人臉</b>門禁一體機的<b class='flag-5'>識別</b><b class='flag-5'>準確率</b>?
    主站蜘蛛池模板: 日本一本在线视频| 亚洲人成影网站~色| 手机在线小视频| 992tv国产精品福利在线| 午夜影院在线视频| 国产女主播在线| 日韩午夜大片| 亚洲伊人tv综合网色| 一区二区三区无码高清视频| 黄色录像日本| 午夜一级成人| 日本加勒比高清一本大道| 日本黄色绿像| 91伊人网| 毛片8| 91po狼人社在线观看| 另类free性欧美护士| 日本在线视频精品| 天堂bt资源www在线| 99 久久99久久精品免观看| 在线 | 一区二区三区四区| 亚洲免费国产| 美国一区二区三区| a级男女性高爱潮高清试| 黄色国产在线视频| tube69xxxxhd日本| 久久国产美女免费观看精品| 亚洲成人aaa| 亚洲一本视频| 在线一区二区三区| 在线观看中文字幕第一页| 成人亚洲欧美综合| 久久99热精品| 四虎精品视频| 黄色免费在线网站| 四虎影院色| 色综合久久久久久久久五月性色| 婷婷久久综合网| 四虎最新网| 久久综合九色综合97婷婷群聊| 爱草免费视频|