在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

哈工大南洋理工提出全球首個「多模態DeepFake檢測定位」模型:讓AIGC偽造無處可藏

OpenCV學堂 ? 來源:新智元 ? 2023-04-11 09:30 ? 次閱讀

【導讀】為了應對多模態假新聞,本文提出檢測并定位多模態媒體篡改任務(DGM)。與現有的單模態DeepFake檢測任務相比,DGM不僅判斷輸入圖像-文本對的真假,也嘗試定位篡改內容(例如圖像篡改區域和文本篡改單詞)。

由于如Stable Diffusion等視覺生成模型的快速發展,高保真度的人臉圖片可以自動化地偽造,制造越來越嚴重的DeepFake問題。

隨著如ChatGPT等大型語言模型的出現,大量假本文也可以容易地生成并惡意地傳播虛假信息

為此,一系列單模態檢測模型被設計出來,去應對以上AIGC技術在圖片和文本模態的偽造。但是這些方法無法較好應對新型偽造場景下的多模態假新聞篡改。

具體而言,在多模態媒體篡改中,各類新聞報道的圖片中重要人物的人臉(如圖 1 中法國總統人臉)被替換,文字中關鍵短語或者單詞被篡改(如圖 1 中正面短語「is welcome to」被篡改為負面短語「is forced to resign」)。

這將改變或掩蓋新聞關鍵人物的身份,以及修改或誤導新聞文字的含義,制造出互聯網上大規模傳播的多模態假新聞。

a8d26e1c-d805-11ed-bfe3-dac502259ad0.png

圖1. 本文提出檢測并定位多模態媒體篡改任務(DGM4)。與現有的單模態DeepFake檢測任務不同,DGM4不僅對輸入圖像-文本對預測真假二分類,也試圖檢測更細粒度的篡改類型和定位圖像篡改區域和文本篡改單詞。除了真假二分類之外,此任務對篡改檢測提供了更全面的解釋和更深入的理解。

a8f31978-d805-11ed-bfe3-dac502259ad0.png

表1: 所提出的DGM4與現有的圖像和文本偽造檢測相關任務的比較

檢測并定位多模態媒體篡改任務

為了解此新挑戰,來自哈工大(深圳)和南洋理工的研究人員提出了檢測并定位多模態媒體篡改任務(DGM4)、構建并開源了DGM4數據集,同時提出了多模態層次化篡改推理模型。目前,該工作已被CVPR 2023收錄。

a907a258-d805-11ed-bfe3-dac502259ad0.png

論文地址:https://arxiv.org/abs/2304.02556

GitHub:https://github.com/rshaojimmy/MultiModal-DeepFake

項目主頁:https://rshaojimmy.github.io/Projects/MultiModal-DeepFake

如圖1和表1所示,檢測并定位多模態媒體篡改任務(Detecting and Grounding Multi-Modal Media Manipulation (DGM4))和現有的單模態篡改檢測的區別在于:

1)不同于現有的DeepFake圖像檢測與偽造文本檢測方法只能檢測單模態偽造信息,DGM4要求同時檢測在圖像-文本對中的多模態篡改;

2)不同于現有DeepFake檢測專注于二分類,DGM4進一步考慮了定位圖像篡改區域和文本篡改單詞。這要求檢測模型對于圖像-文本模態間的篡改進行更全面和深入的推理。

檢測并定位多模態媒體篡改數據集

為了支持對DGM4研究,如圖2所示,本工作貢獻了全球首個檢測并定位多模態媒體篡改(DGM4)數據集。

a91aad1c-d805-11ed-bfe3-dac502259ad0.png

圖2. DGM4數據集

DGM4數據集調查了4種篡改類型,人臉替換篡改(FS)、人臉屬性篡改(FA)、文本替換篡改(TS)、文本屬性篡改(TA)。

圖2展示了 DGM4整體統計信息,包括(a) 篡改類型的數量分布;(b) 大多數圖像的篡改區域是小尺寸的,尤其是對于人臉屬性篡改;(c) 文本屬性篡改的篡改單詞少于文本替換篡改;(d)文本情感分數的分布;(e)每種篡改類型的樣本數。

此數據共生成23萬張圖像-文本對樣本,包含了包括77426個原始圖像-文本對和152574個篡改樣本對。篡改樣本對包含66722個人臉替換篡改,56411個人臉屬性篡改,43546個文本替換篡改和18588個文本屬性篡改。

多模態層次化篡改推理模型

本文認為多模態的篡改會造成模態間細微的語義不一致性。因此通過融合與推理模態間的語義特征,檢測到篡改樣本的跨模態語義不一致性,是本文應對DGM4的主要思路。

a93dddb4-d805-11ed-bfe3-dac502259ad0.png

圖3. 提出的多模態層次化篡改推理模型HierArchical Multi-modal Manipulation rEasoning tRansformer (HAMMER)

基于此想法,如圖3所示,本文提出了多模態層次化篡改推理模型HierArchical Multi-modal Manipulation rEasoning tRansformer (HAMMER)。

此模型建立在基于雙塔結構的多模態語義融合與推理的模型架構上,并將多模態篡改的檢測與定位細粒度層次化地通過淺層與深層篡改推理來實現。

具體而言,如圖3所示,HAMMER模型具有以下兩個特點:

1)在淺層篡改推理中,通過篡改感知的對比學習(Manipulation-Aware Contrastive Learning)來對齊圖像編碼器和文本編碼器提取出的圖像和文本單模態的語義特征。同時將單模態嵌入特征利用交叉注意力機制進行信息交互,并設計局部塊注意力聚合機制(Local Patch Attentional Aggregation)來定位圖像篡改區域;

2)在深層篡改推理中,利用多模態聚合器中的模態感知交叉注意力機制進一步融合多模態語義特征。在此基礎上,進行特殊的多模態序列標記(multi-modal sequence tagging)和多模態多標簽分類(multi-modal multi-label classification)來定位文本篡改單詞并檢測更細粒度的篡改類型。

實驗結果

如下圖,實驗結果表明研究團隊提出的HAMMER與多模態和單模態檢測方法相比,都能更準確地檢測并定位多模態媒體篡改。

a955d14e-d805-11ed-bfe3-dac502259ad0.png

a97996e2-d805-11ed-bfe3-dac502259ad0.png

a990996e-d805-11ed-bfe3-dac502259ad0.png

a9aaddd8-d805-11ed-bfe3-dac502259ad0.png

圖4. 多模態篡改檢測和定位結果可視化

aaa0368e-d805-11ed-bfe3-dac502259ad0.png

圖5. 關于篡改文本的模型篡改檢測注意力可視化

圖4提供了一些多模態篡改檢測和定位的可視化結果,說明了HAMMER可以準確地同時進行篡改檢測與定位任務。圖5提供了關于篡改單詞的模型注意力可視化結果,進一步展示了HAMMER是通過關注與篡改文本語義不一致性的圖像區域來進行多模態篡改檢測和定位。

總結

本工作提出了一個新的研究課題:檢測并定位多模態媒體篡改任務,來應對多模態假新聞。

本工作貢獻了首個大規模的檢測并定位多模態媒體篡改數據集,并提供了詳細豐富的篡改檢測與定位的標注。團隊相信它可以很好地幫助未來多模態假新聞檢測的研究。

本工作提出了一個強大的多模態層次化篡改推理模型作為此新課題很好的起始方案。

本工作的代碼和數據集鏈接都已分享在本項目的GitHub上,歡迎大家Star這個GitHub Repo, 使用DGM4數據集和HAMMER來研究DGM4問題。DeepFake領域不只有圖像單模態檢測,還有更廣闊的多模態篡改檢測問題亟待大家解決!

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 互聯網
    +關注

    關注

    54

    文章

    11158

    瀏覽量

    103339
  • 語言模型
    +關注

    關注

    0

    文章

    525

    瀏覽量

    10277
  • 圖像檢測
    +關注

    關注

    0

    文章

    34

    瀏覽量

    11881

原文標題:CVPR 2023|哈工大南洋理工提出全球首個「多模態DeepFake檢測定位」模型:讓AIGC偽造無處可藏

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    手機設計基本知識哈工大版本(good),非常不錯的!!!

    手機設計基本知識哈工大版本(good),非常不錯的!!!
    發表于 08-10 22:39

    哈工大DSP學習資料

    哈工大DSP學習資料
    發表于 10-16 22:28

    哈工大《軟件工程》全套課件完整版

    哈工大《軟件工程》全套課件完整版
    發表于 11-07 11:40

    單片機課程(來自哈工大

    送單片機課程(哈工大)![hide] 鏈接:http://pan.baidu.com/s/1o81rMQY 密碼:qvh4[/hide]
    發表于 11-07 19:01

    基于邊緣計算的全球定位系統欺騙檢測方法

    “目前GNSS欺騙檢測方法有很多,但是大多數方法需要較強的信號處理能力和附加設備,例如接收器,這些附加設備可能不適用于車輛和智能手機。本文提出了一種新的基于邊緣計算的方法來重建丟失的全球定位系統信號
    發表于 11-09 15:12

    哈工大DSP教程

    哈工大DSP教程
    發表于 07-28 10:36 ?130次下載
    <b class='flag-5'>哈工大</b>DSP教程

    哈工大CERP系統

    哈工大CERP系統  java+weblogic實現,比較有學習價值,嚴禁商業使用。
    發表于 03-16 15:53 ?18次下載

    南洋理工大學嘗試開發一款MEMS芯片來預防心血管疾病

    在新加坡南洋理工大學,醫學研究人員正嘗試利用一款新開發的微電子機械系統(MEMS)微流控芯片,來實現研究心血管疾病的成因和預防。
    的頭像 發表于 01-05 11:50 ?3472次閱讀
    <b class='flag-5'>南洋</b><b class='flag-5'>理工大</b>學嘗試開發一款MEMS芯片來預防心血管疾病

    是德科技為新加坡南洋理工大學提供先進設計和驗證解決方案

    是德科技(NYSE:KEYS)宣布,新加坡南洋理工大學(NTU)選中了該公司以軟件為中心的測試和測量解決方案,用于推進基于太赫茲頻率的 6G 技術。
    的頭像 發表于 06-07 14:44 ?1322次閱讀

    中科大&amp;字節提出UniDoc:統一的面向文字場景的模態模型

    如上圖所示,UniDoc基于預訓練的視覺大模型及大語言模型,將文字的檢測、識別、spotting(圖中未畫出)、模態理解等四個任務,通過多
    的頭像 發表于 08-31 15:29 ?1569次閱讀
    中科大&amp;字節<b class='flag-5'>提出</b>UniDoc:統一的面向文字場景的<b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>

    北大&amp;華為提出模態基礎大模型的高效微調

    深度學習的大模型時代已經來臨,越來越多的大規模預訓練模型在文本、視覺和模態領域展示出杰出的生成和推理能力。然而大模型巨大的參數量有兩個明顯
    的頭像 發表于 11-08 16:20 ?998次閱讀
    北大&amp;華為<b class='flag-5'>提出</b>:<b class='flag-5'>多</b><b class='flag-5'>模態</b>基礎大<b class='flag-5'>模型</b>的高效微調

    哈工大提出Myriad:利用視覺專家進行工業異常檢測的大型模態模型

    最近,大型模態(即視覺和語言)模型(LMM)在圖像描述、視覺理解、視覺推理等多種視覺任務上表現出了卓越的感知能力,使其成為更易于理解的異常檢測的有競爭力的潛在選擇。然而,現有的通用
    的頭像 發表于 11-21 16:08 ?1978次閱讀
    <b class='flag-5'>哈工大提出</b>Myriad:利用視覺專家進行工業異常<b class='flag-5'>檢測</b>的大型<b class='flag-5'>多</b><b class='flag-5'>模態</b><b class='flag-5'>模型</b>

    商湯科技聯合海通證券發布業內首個面向金融行業的模態全棧式大模型

    4月23日,商湯科技正式推出“日日新SenseNova 5.0”大模型體系,并與海通證券聯合發布業內首個面向金融行業的模態全棧式大模型
    的頭像 發表于 04-26 09:48 ?475次閱讀
    商湯科技聯合海通證券發布業內<b class='flag-5'>首個</b>面向金融行業的<b class='flag-5'>多</b><b class='flag-5'>模態</b>全棧式大<b class='flag-5'>模型</b>

    傳音控股旗下TECNO與南洋理工大學ACRC達成戰略合作

    傳音旗下創新科技品牌TECNO宣布與新加坡南洋理工大學亞洲傳播研究中心(Asian Communication Research Centre, ACRC)達成戰略合作 ,通過深入研究東南亞地區膚色
    的頭像 發表于 09-29 16:18 ?597次閱讀

    從新加坡到深圳:南洋理工大學(NTU)與VoiceAI的深度對話

    近日,來自新加坡南洋理工大學的數十名師生到訪聲揚科技深圳總部,與聲揚科技“硬核科研團”展開深度交流。公司聯合創始人、總經理張偉彬博士出席交流會,與新加坡南洋理工大學師生們探討智能語音技
    的頭像 發表于 11-13 14:29 ?366次閱讀
    從新加坡到深圳:<b class='flag-5'>南洋</b><b class='flag-5'>理工大</b>學(NTU)與VoiceAI的深度對話
    主站蜘蛛池模板: 欧美人与禽交| 久久免费特黄毛片| 亚洲 欧美 日韩 综合| kkkbo色综合| 种子在线搜索| 五月婷婷丁香六月| 色批网站www| 免费国产网站| 国产香蕉75在线播放| www.激情.com| 天天槽天天槽天天槽| 九九热精品在线观看| 欧美性69| 国产一区二区中文字幕| 亚洲成人激情电影| 日本黄色免费观看| 激情丁香婷婷| 一夜七次郎久久综合伊人| 日日夜夜2017| 欧美黄免在线播放| 性夜影院爽黄a免费视频| 亚洲天堂999| 欧美午夜影视| 痴女中文字幕在线视频| 天天干天天色综合网| 国产精品久久久久久久久久影院| 欧美xxx69| 在线黄色免费| 人人成人免费公开视频| 国产婷婷高清在线观看免费| 五月天婷婷伊人| jiucao视频在线观看| 日本在线视频不卡| 五月天丁香色| 久久福利青草精品资源| 午夜精品一区二区三区在线视| 狠狠干综合| 日本一区二区免费在线观看 | 天天骑夜夜操| 最近在线观看免费完整视频| 老师办公室高h文小说|