在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

馬毅團(tuán)隊(duì)新作:白盒ViT成功實(shí)現(xiàn)

CVer ? 來(lái)源:新智元 ? 2023-09-14 15:58 ? 次閱讀

【導(dǎo)讀】CRATE模型完全由理論指導(dǎo)設(shè)計(jì),僅用自監(jiān)督學(xué)習(xí)即可實(shí)現(xiàn)分割語(yǔ)義涌現(xiàn)。

基于Transformer的視覺(jué)基礎(chǔ)模型在各種下游任務(wù),如分割和檢測(cè)中都展現(xiàn)出了非常強(qiáng)大的性能,并且DINO等模型經(jīng)過(guò)自監(jiān)督訓(xùn)練后已經(jīng)涌現(xiàn)出了語(yǔ)義的分割屬性。

不過(guò)奇怪的是,類似的涌現(xiàn)能力并沒(méi)有出現(xiàn)在有監(jiān)督分類訓(xùn)練后的視覺(jué)Transformer模型中。

最近,馬毅教授團(tuán)隊(duì)探索了基于Transformer架構(gòu)的模型中涌現(xiàn)分割能力是否僅僅是復(fù)雜的自監(jiān)督學(xué)習(xí)機(jī)制的結(jié)果,或者是否可以通過(guò)模型架構(gòu)的適當(dāng)設(shè)計(jì)在更通用的條件下實(shí)現(xiàn)相同的涌現(xiàn)。

c65f3dc0-52bc-11ee-a25d-92fbcf53809c.png

在CVer微信公眾號(hào)后臺(tái)回復(fù):CRATE,可以下載本論文pdf和代碼

Emergence of Segmentation with Minimalistic White-Box Transformers

代碼:https://github.com/Ma-Lab-Berkeley/CRATE

論文:https://arxiv.org/abs/2308.16271

通過(guò)大量的實(shí)驗(yàn),研究人員證明了當(dāng)采用白盒Transformer模型CRATE時(shí),其設(shè)計(jì)明確地模擬并追求數(shù)據(jù)分布中的低維結(jié)構(gòu),整體和part級(jí)別的分割屬性已經(jīng)以最小化的監(jiān)督訓(xùn)練配方出現(xiàn)。

分層的細(xì)粒度分析表明,涌現(xiàn)屬性有力地證實(shí)了白盒網(wǎng)絡(luò)的設(shè)計(jì)數(shù)學(xué)功能。我們的結(jié)果提出了一條設(shè)計(jì)白盒基礎(chǔ)模型的途徑,該模型同時(shí)具有高性能和數(shù)學(xué)上完全可解釋性。

馬毅教授也表示,深度學(xué)習(xí)的研究將會(huì)逐漸從經(jīng)驗(yàn)設(shè)計(jì)轉(zhuǎn)向理論指導(dǎo)。

c67618e2-52bc-11ee-a25d-92fbcf53809c.png

白盒CRATE的涌現(xiàn)屬性

DINO的分割涌現(xiàn)能力

智能系統(tǒng)中的表征學(xué)習(xí)旨在將世界的高維、多模態(tài)感官數(shù)據(jù)(圖像、語(yǔ)言、語(yǔ)音)轉(zhuǎn)換為更緊湊的形式,同時(shí)保留其基本的低維結(jié)構(gòu),實(shí)現(xiàn)高效的識(shí)別(比如分類)、分組(比如分割)和追蹤。

深度學(xué)習(xí)模型的訓(xùn)練通常采用數(shù)據(jù)驅(qū)動(dòng)的方式,輸入大規(guī)模數(shù)據(jù),以自監(jiān)督的方式進(jìn)行學(xué)習(xí)。

在視覺(jué)基礎(chǔ)模型中,自監(jiān)督Transformer架構(gòu)的DINO模型展現(xiàn)出了令人驚訝的涌現(xiàn)能力,即使沒(méi)有經(jīng)過(guò)有監(jiān)督分割訓(xùn)練,ViTs也能識(shí)別出顯式的語(yǔ)義分割信息

c6ba771c-52bc-11ee-a25d-92fbcf53809c.png

后續(xù)有工作研究了如何在DINO模型中利用這種分割信息,并在下游任務(wù)中,如分割、檢測(cè)等實(shí)現(xiàn)了最先進(jìn)的性能,也有工作證明了用DINO訓(xùn)練的ViTs中的倒數(shù)第二層特征與視覺(jué)輸入中的顯著性信息強(qiáng)烈相關(guān),如區(qū)分前景、背景和物體邊界,從而提升圖像分割和其他任務(wù)的性能。

為了讓分割屬性涌現(xiàn),DINO需要在訓(xùn)練期間將自監(jiān)督學(xué)習(xí)、知識(shí)蒸餾和權(quán)重平均巧妙地結(jié)合起來(lái)。

目前還不清楚DINO中引入的每個(gè)組件是否對(duì)于分割遮罩的涌現(xiàn)來(lái)說(shuō)必不可缺,盡管DINO也采用ViT架構(gòu)作為其主干,但在分類任務(wù)上訓(xùn)練的普通有監(jiān)督ViT模型中,并沒(méi)有觀察到分割涌現(xiàn)行為。

CRATE的涌現(xiàn)

基于DINO的成功案例,研究人員想要探究,復(fù)雜的自監(jiān)督學(xué)習(xí)pipeline對(duì)于獲得類似Transformer的視覺(jué)模型中的涌現(xiàn)屬性是否是必要的。

研究人員認(rèn)為,在Transformer模型中促進(jìn)分割屬性的一種有前途的方法是,在考慮輸入數(shù)據(jù)結(jié)構(gòu)的情況下設(shè)計(jì)Transformer模型架構(gòu),也代表了表征學(xué)習(xí)經(jīng)典方法與現(xiàn)代數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)框架的結(jié)合。

c6ca5cf4-52bc-11ee-a25d-92fbcf53809c.png

與目前主流的Transformer模型對(duì)比,這種設(shè)計(jì)方法也可以叫做白盒Transformer模型。

基于馬毅教授組之前的工作,研究人員對(duì)白盒架構(gòu)的CRATE模型進(jìn)行了廣泛的實(shí)驗(yàn),證明了CRATE的白盒設(shè)計(jì)是自注意力圖中分割屬性涌現(xiàn)的原因。

定性評(píng)估

研究人員采用基于[CLS] token的注意力圖方法對(duì)模型進(jìn)行解釋和可視化,結(jié)果發(fā)現(xiàn)CRATE中的query-key-value矩陣都是相同的。

c6ef23c2-52bc-11ee-a25d-92fbcf53809c.png

可以觀察到CRATE模型的自注意力圖(self-attention map)可以對(duì)應(yīng)到輸入圖像的語(yǔ)義上,模型的內(nèi)部網(wǎng)絡(luò)對(duì)每個(gè)圖像都進(jìn)行了清晰的語(yǔ)義分割,實(shí)現(xiàn)了類似DINO模型的效果。

相比之下,在有監(jiān)督分類任務(wù)上訓(xùn)練的普通ViT卻并沒(méi)有表現(xiàn)出類似的分割屬性。

c6fb9f4e-52bc-11ee-a25d-92fbcf53809c.png

遵循之前關(guān)于可視化圖像學(xué)習(xí)的逐塊深度特征的工作,研究人員對(duì)CRATE和ViT模型的深度token表征進(jìn)行主成分分析(PCA)研究。

c7740da8-52bc-11ee-a25d-92fbcf53809c.png

可以發(fā)現(xiàn),CRATE可以在沒(méi)有分割監(jiān)督訓(xùn)練的情況下,依然可以捕捉到圖像中物體的邊界。

并且,主成分(principal compoenents)也說(shuō)明了token和物體中相似部分的特征對(duì)齊,例如紅色通道對(duì)應(yīng)馬腿。

而有監(jiān)督ViT模型的PCA可視化結(jié)構(gòu)化程度相當(dāng)?shù)汀?/p>

定量評(píng)估

研究人員使用現(xiàn)有的分割和目標(biāo)檢測(cè)技術(shù)對(duì)CRATE涌現(xiàn)的分割屬性進(jìn)行評(píng)估。

從自注意力圖可以看到,CRATE用清晰的邊界顯式地捕獲了對(duì)象級(jí)的語(yǔ)義,為了定量測(cè)量分割的質(zhì)量,研究人員利用自注意力圖生成分割遮罩(segmentation mask),對(duì)比其與真實(shí)掩碼之間的標(biāo)準(zhǔn)mIoU(平均交并比)。

c7e6e6c0-52bc-11ee-a25d-92fbcf53809c.png

從實(shí)驗(yàn)結(jié)果中可以看到,CRATE在視覺(jué)和mIOU評(píng)分上都顯著優(yōu)于ViT,表明CRATE的內(nèi)部表征對(duì)于分割掩碼任務(wù)生成來(lái)說(shuō)要更有效。

對(duì)象檢測(cè)和細(xì)粒度分割

為了進(jìn)一步驗(yàn)證和評(píng)估CRATE捕獲的豐富語(yǔ)義信息,研究人員采用了一種高效的目標(biāo)檢測(cè)和分割方法MaskCut,無(wú)需人工標(biāo)注即可獲得自動(dòng)化評(píng)估模型,可以基于CRATE學(xué)到的token表征從圖像中提取更細(xì)粒度的分割。

c848531a-52bc-11ee-a25d-92fbcf53809c.png

c853d456-52bc-11ee-a25d-92fbcf53809c.png

在COCO val2017上的分割結(jié)果中可以看到,有CRATE的內(nèi)部表征在檢測(cè)和分割指標(biāo)上都要好于有監(jiān)督ViT,有監(jiān)督ViT特征的MaskCut在某些情況下甚至完全不能產(chǎn)生分割掩碼。

CRATE分割能力的白盒分析

深度在CRATE中的作用

CRATE的每一層設(shè)計(jì)都遵循相同的概念目的:優(yōu)化稀疏速率降低,并將token分布轉(zhuǎn)換為緊湊和結(jié)構(gòu)化的形式。

假設(shè)CRATE中語(yǔ)義分割能力的涌現(xiàn)類似于「表征Z中屬于相似語(yǔ)義類別token的聚類」,預(yù)期CRATE的分割性能可以隨著深度的增加而提高。

為了測(cè)試這一點(diǎn),研究人員利用MaskCut來(lái)定量評(píng)估跨不同層的內(nèi)部表征的分割性能;同時(shí)應(yīng)用PCA可視化來(lái)理解分割是如何隨深度加深而涌現(xiàn)的。

c86d04ee-52bc-11ee-a25d-92fbcf53809c.png

從實(shí)驗(yàn)結(jié)果中可以觀察到,當(dāng)使用來(lái)自更深層的表征時(shí),分割分?jǐn)?shù)提高了,與CRATE的增量?jī)?yōu)化設(shè)計(jì)非常一致。

相比之下,即使ViT-B/8的性能在后面的層中略有提高,但其分割分?jǐn)?shù)明顯低于CRATE,PCA結(jié)果顯示,從CRATE深層提取的表征會(huì)逐漸更關(guān)注前景對(duì)象,并且能夠捕捉紋理級(jí)別的細(xì)節(jié)。

CRATE的消融實(shí)驗(yàn)

CRATE中的注意力塊(MSSA)和MLP塊(ISTA)都不同于ViT中的注意力塊。

為了了解每個(gè)組件對(duì)CRATE涌現(xiàn)分割屬性的影響,研究人員選取了三個(gè)CRATE變體:CRATE, CRATE-MHSA, CRATE-MLP,分別表示ViT中的注意塊(MHSA)和MLP塊。

研究人員在ImageNet-21k數(shù)據(jù)集上應(yīng)用相同的預(yù)訓(xùn)練設(shè)置,然后應(yīng)用粗分割評(píng)估和遮罩分割評(píng)估來(lái)定量對(duì)比不同模型的性能。

c8769568-52bc-11ee-a25d-92fbcf53809c.png

實(shí)驗(yàn)結(jié)果顯示,CRATE在所有任務(wù)中都明顯優(yōu)于其他模型架構(gòu),可以發(fā)現(xiàn),盡管MHSA和MSSA之間的架構(gòu)差異很小,但只需要簡(jiǎn)單地用CRATE中的MSSA替換ViT中的MHSA,可以顯著改善ViT的粗分割性能(即VOC Seg),證明了白盒設(shè)計(jì)的有效性。

識(shí)別注意頭的語(yǔ)義屬性

[CLS] token和圖像塊token之間的自注意力圖可以看到清晰的分段掩碼,根據(jù)直覺(jué),每個(gè)注意力頭應(yīng)該都可以捕捉到數(shù)據(jù)的部分特征。

研究人員首先將圖像輸入到CRATE模型,然后由人來(lái)檢查、選擇四個(gè)似乎具有語(yǔ)義含義的注意力頭;然后在其他輸入圖像上在這些注意力頭上進(jìn)行自注意力圖可視化。

c8841ab2-52bc-11ee-a25d-92fbcf53809c.png

可以發(fā)現(xiàn),每個(gè)注意力頭都捕捉到了物體的不同部分,甚至不同的語(yǔ)義:例如第一列中顯示的注意力頭可以捕捉到不同動(dòng)物的腿,最后一列中顯示的注意力頭捕捉的是耳朵和頭部。

自從可形變部件模型(deformable part model)和膠囊網(wǎng)絡(luò)發(fā)布以來(lái),這種將視覺(jué)輸入解析為部分-整體層次結(jié)構(gòu)的能力一直是識(shí)別架構(gòu)的目標(biāo),白盒設(shè)計(jì)的CRATE模型也具有這種能力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3279

    瀏覽量

    48985
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5511

    瀏覽量

    121355
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    145

    瀏覽量

    6026

原文標(biāo)題:馬毅團(tuán)隊(duì)新作:白盒ViT成功實(shí)現(xiàn)"分割涌現(xiàn)"!具有高性能和數(shù)學(xué)可解釋的特性

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    測(cè)試教程ppt

    測(cè)試測(cè)試概念測(cè)試覆蓋標(biāo)準(zhǔn)邏輯驅(qū)動(dòng)測(cè)試基本路徑測(cè)試 測(cè)試也稱結(jié)構(gòu)測(cè)試或邏輯驅(qū)動(dòng)測(cè)試,
    發(fā)表于 09-19 09:39 ?0次下載

    測(cè)試

      測(cè)試的英文全稱:White-box Testing      測(cè)試(White-box Testing,又稱邏
    發(fā)表于 10-22 12:36 ?3668次閱讀

    黑盒測(cè)試與測(cè)試區(qū)別

    黑盒測(cè)試與測(cè)試區(qū)別   黑盒測(cè)試  黑盒測(cè)試也稱功能測(cè)試或數(shù)據(jù)驅(qū)動(dòng)測(cè)試,它是在已知產(chǎn)品所應(yīng)具有的功能,通
    發(fā)表于 10-22 12:40 ?9392次閱讀

    密碼技術(shù)如何打造更安全的物聯(lián)網(wǎng)

    密碼算法是一種新的密碼算法,它與傳統(tǒng)密碼算法的不同點(diǎn)是能夠抵抗攻擊環(huán)境下的攻擊。密碼
    發(fā)表于 11-05 09:54 ?729次閱讀
    <b class='flag-5'>白</b><b class='flag-5'>盒</b>密碼技術(shù)如何打造更安全的物聯(lián)網(wǎng)

    PRQA測(cè)試軟件使用說(shuō)明書

    PRQA測(cè)試軟件使用說(shuō)明書
    發(fā)表于 05-05 11:17 ?7次下載

    基于測(cè)試的自動(dòng)化測(cè)試平臺(tái)實(shí)現(xiàn)

    主要介紹了 Parlay 應(yīng)用服務(wù)器的 API 接口, 提出了一個(gè)簡(jiǎn)單的基于測(cè)試的自動(dòng)化測(cè)試平臺(tái)實(shí)現(xiàn)方案, 并詳細(xì)介紹了該方案的基本設(shè)計(jì)思想、總體結(jié)構(gòu)、測(cè)試用例的實(shí)現(xiàn)方法, 以及該
    發(fā)表于 09-08 15:07 ?7次下載
    基于<b class='flag-5'>白</b><b class='flag-5'>盒</b>測(cè)試的自動(dòng)化測(cè)試平臺(tái)<b class='flag-5'>實(shí)現(xiàn)</b>

    測(cè)試和黑盒測(cè)試的優(yōu)缺點(diǎn)

    測(cè)試和黑盒測(cè)試是軟件測(cè)試的兩種基本方法。 測(cè)試又稱結(jié)構(gòu)測(cè)試、透明測(cè)試、邏輯驅(qū)動(dòng)測(cè)試或基于代碼的測(cè)試。
    發(fā)表于 11-02 11:18 ?1.9w次閱讀
    <b class='flag-5'>白</b><b class='flag-5'>盒</b>測(cè)試和黑盒測(cè)試的優(yōu)缺點(diǎn)

    高級(jí)加密標(biāo)準(zhǔn)的任務(wù)規(guī)劃系統(tǒng)安全傳輸

    針對(duì)任務(wù)規(guī)劃系統(tǒng)中的安全傳輸在攻擊環(huán)境( WABC)下通信密鑰容易被竊取的問(wèn)題,提出基于修改之后的高級(jí)加密標(biāo)準(zhǔn)(
    發(fā)表于 12-06 10:53 ?1次下載
    <b class='flag-5'>白</b><b class='flag-5'>盒</b>高級(jí)加密標(biāo)準(zhǔn)的任務(wù)規(guī)劃系統(tǒng)安全傳輸

    詳談黑盒測(cè)試與測(cè)試的異同及用例

    詳談黑盒測(cè)試與測(cè)試的異同及用例
    的頭像 發(fā)表于 08-19 17:07 ?6911次閱讀
    詳談黑盒測(cè)試與<b class='flag-5'>白</b><b class='flag-5'>盒</b>測(cè)試的異同及用例

    交換機(jī)展趨勢(shì)漸起,新華三坐擁四大優(yōu)勢(shì)有力支撐生態(tài)

    交換機(jī)項(xiàng)目研發(fā)的最新進(jìn)展。新華三目前已經(jīng)成立專門的交換機(jī)研發(fā)團(tuán)隊(duì),并加大了對(duì)SONiC系統(tǒng)的研究投入。面向未來(lái),新華三將積極參與
    的頭像 發(fā)表于 10-09 14:08 ?5060次閱讀

    成阿里應(yīng)對(duì)美團(tuán)、京東、拼多多挑戰(zhàn)的棋子?

    2015年底,在上海世紀(jì)公園旁的一家酒店,一位曾經(jīng)在阿里任職多年的人嚴(yán)肅地說(shuō):不是老菜(侯)的,而是逍遙子(張勇)的,這是理解
    的頭像 發(fā)表于 12-18 16:41 ?3549次閱讀

    VectorCAST/QA如何在LiteOS-A內(nèi)核上實(shí)現(xiàn)系統(tǒng)測(cè)試

    本文將通過(guò)演示實(shí)例介紹VectorCAST/QA如何在LiteOS-A內(nèi)核上實(shí)現(xiàn)系統(tǒng)測(cè)試,獲取被測(cè)程序的代碼覆蓋信息。具體實(shí)現(xiàn)在支持sudo超級(jí)用戶模式的Ubuntu 18.04(
    的頭像 發(fā)表于 06-26 16:21 ?9479次閱讀
    VectorCAST/QA如何在LiteOS-A內(nèi)核上<b class='flag-5'>實(shí)現(xiàn)</b>系統(tǒng)<b class='flag-5'>白</b><b class='flag-5'>盒</b>測(cè)試

    4G終端主板測(cè)試報(bào)告

    4G終端主板測(cè)試報(bào)告
    發(fā)表于 09-30 16:35 ?17次下載

    滲透測(cè)試的優(yōu)勢(shì)是什么

    滲透測(cè)試是一項(xiàng)重要的進(jìn)攻性安全演習(xí)或操作。如果執(zhí)行得當(dāng),它會(huì)極大地提高您組織的安全性。滲透測(cè)試分為三種類型,根據(jù)滲透測(cè)試人員或道德黑客可獲得的信息量分類,其中一種是滲透測(cè)試。 什么是
    的頭像 發(fā)表于 09-19 10:04 ?1247次閱讀

    功能測(cè)試是還是黑盒測(cè)試

    功能測(cè)試是軟件測(cè)試的一種方法,主要用于驗(yàn)證軟件的功能是否滿足需求規(guī)格說(shuō)明書中的要求。功能測(cè)試可以采用測(cè)試或黑盒測(cè)試的方法,具體取決于測(cè)試的目的和需求。本文將詳細(xì)介紹功能測(cè)試的概念、
    的頭像 發(fā)表于 05-30 14:53 ?926次閱讀
    主站蜘蛛池模板: 日本a级影院| 一区二区不卡免费视频| 日本四虎影院| 最新天堂| 亚洲情a成黄在线观看| 可以直接看的黄址| 亚色成人| 日本一区视频| 五月婷婷六月丁香在线| 日本tv欧美tv天堂| 78摸在线| 黄色视屏日本| 欧美两性网| 色婷婷一区二区三区四区成人| 久久精品国产免费高清| 最猛91大神ben与女教师| 2021精品综合久久久久| 天堂在线链接| 一级特黄高清完整大片| 丁香六月纪婷婷激情综合| 韩国三级在线不卡播放| 久青草国产高清在线视频| 国产亚洲综合色就色| 国产主播在线看| 5月色婷婷| 久久久久久夜精品精品免费| 天天操夜夜做| 午夜观看| 天天射网| 天天色天天操天天射| 五月天婷婷社区| 国产自在自线午夜精品视频在| 未满十八18周岁禁止免费国产| 九九国产在线观看| 高清成年美女xx免费网站黄| 国产综合在线观看| 一级a级国产不卡毛片| 午夜视频欧美| 瑟瑟网站免费| 国产欧美日韩综合精品无毒| 广东毛片|