在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

適用于任意數(shù)據(jù)模態(tài)的自監(jiān)督學(xué)習(xí)數(shù)據(jù)增強(qiáng)技術(shù)

OpenCV學(xué)堂 ? 來(lái)源:機(jī)器之心 ? 2023-09-04 10:07 ? 次閱讀

本文提出了一種適用于任意數(shù)據(jù)模態(tài)的自監(jiān)督學(xué)習(xí)數(shù)據(jù)增強(qiáng)技術(shù)。

自監(jiān)督學(xué)習(xí)算法在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域取得了重大進(jìn)展。這些自監(jiān)督學(xué)習(xí)算法盡管在概念上是通用的,但是在具體操作上是基于特定的數(shù)據(jù)模態(tài)的。這意味著需要為不同的數(shù)據(jù)模態(tài)開(kāi)發(fā)不同的自監(jiān)督學(xué)習(xí)算法。為此,本文提出了一種通用的數(shù)據(jù)增強(qiáng)技術(shù),可以應(yīng)用于任意數(shù)據(jù)模態(tài)。相較于已有的通用的自監(jiān)督學(xué)習(xí),該方法能夠取得明顯的性能提升,同時(shí)能夠代替一系列為特定模態(tài)設(shè)計(jì)的復(fù)雜的數(shù)據(jù)增強(qiáng)方式并取得與之類(lèi)似的性能。

簡(jiǎn)介 當(dāng)前 Siamese 表征學(xué)習(xí) / 對(duì)比學(xué)習(xí)需要利用數(shù)據(jù)增強(qiáng)技術(shù)來(lái)構(gòu)建同一個(gè)數(shù)據(jù)的不同樣本,并將其輸入兩個(gè)并行的網(wǎng)絡(luò)結(jié)構(gòu),從而產(chǎn)生足夠強(qiáng)的監(jiān)督信號(hào)。然而這些數(shù)據(jù)增強(qiáng)技術(shù)往往非常依賴(lài)于模態(tài)特定的先驗(yàn)知識(shí),通常需要手動(dòng)設(shè)計(jì)或者搜索適用于當(dāng)前模態(tài)的最佳組合。除了耗時(shí)耗力外,找到的最優(yōu)數(shù)據(jù)增強(qiáng)方式也極難遷移到別的領(lǐng)域。例如,常見(jiàn)的針對(duì)于自然 RGB 圖像的顏色抖動(dòng)(color jittering)無(wú)法應(yīng)用于除了自然圖像以外的其他數(shù)據(jù)模態(tài)。 一般性地,輸入數(shù)據(jù)可以被表征為由序列維度(sequential)和通道維度(channel)組成的二維向量。其中序列維度通常是模態(tài)相關(guān)的,例如圖像上的空間維度、語(yǔ)音的時(shí)間維度以及語(yǔ)言的句法維度。而通道維度是模態(tài)無(wú)關(guān)的。在自監(jiān)督學(xué)習(xí)中,masked modeling [1] 或者以 masking 作為數(shù)據(jù)增強(qiáng) [2] 已經(jīng)成為一種有效的學(xué)習(xí)方式。然而這些操作都作用于序列維度。為了能夠廣泛應(yīng)用于不同數(shù)據(jù)模態(tài),本文提出一種作用于通道維度的數(shù)據(jù)增強(qiáng)手段:隨機(jī)量化(randomized quantization)。每個(gè)通道中的數(shù)據(jù)通過(guò)非均勻量化器進(jìn)行動(dòng)態(tài)量化,量化值是從隨機(jī)劃分的區(qū)間中隨機(jī)采樣的。通過(guò)這種方式,落在同一個(gè)區(qū)間內(nèi)原始輸入的信息差被刪除,同時(shí)不同區(qū)間數(shù)據(jù)的相對(duì)大小被保留,從而達(dá)到 masking 的效果。

18f147e4-4a3f-11ee-97a6-92fbcf53809c.png

該方法在各種不同數(shù)據(jù)模態(tài)上超過(guò)了已有任意模態(tài)自監(jiān)督學(xué)習(xí)方法,包括自然圖像、3D 點(diǎn)云、語(yǔ)音、文本、傳感器數(shù)據(jù)、醫(yī)療圖像等。在多種預(yù)訓(xùn)練學(xué)習(xí)任務(wù)中,例如對(duì)比學(xué)習(xí)(例如 MoCo-v3)和自蒸餾自監(jiān)督學(xué)習(xí)(例如 BYOL)都學(xué)到了比已有方法更優(yōu)的特征。該方法還經(jīng)過(guò)驗(yàn)證,適用于不同的骨干網(wǎng)絡(luò)結(jié)構(gòu),例如 CNN 和 Transformer。 方法 量化(Quantization)指的是利用一組離散的數(shù)值表征連續(xù)數(shù)據(jù),以便于數(shù)據(jù)的高效存儲(chǔ)、運(yùn)算以及傳輸。然而,一般的量化操作的目標(biāo)是在不損失精確度的前提下壓縮數(shù)據(jù),因而該過(guò)程是確定性的,而且是設(shè)計(jì)為與原數(shù)據(jù)盡量接近的。這就限制了其作為增強(qiáng)手段的強(qiáng)度和輸出的數(shù)據(jù)豐富程度。 本文提出一種隨機(jī)量化操作(randomized quantization),將輸入的每個(gè) channel 數(shù)據(jù)獨(dú)立劃分為多個(gè)互不重疊的隨機(jī)區(qū)間(1901cea2-4a3f-11ee-97a6-92fbcf53809c.png),并將落在各個(gè)區(qū)間內(nèi)的原始輸入映射到從該區(qū)間內(nèi)隨機(jī)采樣的一個(gè)常數(shù)190b8244-4a3f-11ee-97a6-92fbcf53809c.png。 ?

19153942-4a3f-11ee-97a6-92fbcf53809c.png

隨機(jī)量化作為自監(jiān)督學(xué)習(xí)任務(wù)中 masking 通道維度數(shù)據(jù)的能力取決于以下三個(gè)方面的設(shè)計(jì):1) 隨機(jī)劃分?jǐn)?shù)值區(qū)間;2) 隨機(jī)采樣輸出值以及 3)劃分的數(shù)值區(qū)間個(gè)數(shù)。 具體而言,隨機(jī)的過(guò)程帶來(lái)了更加豐富的樣本,同一個(gè)數(shù)據(jù)每次執(zhí)行隨機(jī)量化操作都可以生成不同的數(shù)據(jù)樣本。同時(shí),隨機(jī)的過(guò)程也帶來(lái)對(duì)原始數(shù)據(jù)更大的增強(qiáng)力度,例如隨機(jī)劃分出大的數(shù)據(jù)區(qū)間,或者當(dāng)映射點(diǎn)偏離區(qū)間中值點(diǎn)時(shí),都可以導(dǎo)致落在該區(qū)間的原始輸入和輸出之間的更大差異。 除此之外,也可以非常容易地通過(guò)適當(dāng)減少劃分區(qū)間的個(gè)數(shù),提高增強(qiáng)力度。這樣,當(dāng)應(yīng)用于 Siamese 表征學(xué)習(xí)的時(shí)候,兩個(gè)網(wǎng)絡(luò)分支就可以見(jiàn)到有足夠信息差異的輸入數(shù)據(jù),從而構(gòu)建足夠強(qiáng)的學(xué)習(xí)信號(hào),幫助到特征學(xué)習(xí)。 下圖可視化了不同數(shù)據(jù)模態(tài)在使用了該數(shù)據(jù)增強(qiáng)方式之后的效果:

192515d8-4a3f-11ee-97a6-92fbcf53809c.png

實(shí)驗(yàn)結(jié)果模態(tài) 1:圖像 本文在 ImageNet-1K 數(shù)據(jù)集上評(píng)估了 randomized quantization 應(yīng)用于 MoCo-v3 和 BYOL 的效果,評(píng)測(cè)指標(biāo)為 linear evaluation。當(dāng)作為唯一的數(shù)據(jù)增強(qiáng)方式單獨(dú)使用的時(shí)候,即將本文的 augmentation 應(yīng)用于原始圖像的 center crop,以及和常見(jiàn)的 random resized crop(RRC)配合使用的時(shí)候,該方法都取得了比已有通用自監(jiān)督學(xué)習(xí)方法更好的效果。

19cc314c-4a3f-11ee-97a6-92fbcf53809c.png

相比于已有的針對(duì)圖像數(shù)據(jù)開(kāi)發(fā)的數(shù)據(jù)增強(qiáng)方式,例如 color jittering (CJ),本文的方法有著明顯的性能優(yōu)勢(shì)。同時(shí),該方法也可以取代 MoCo-v3/BYOL 中一系列復(fù)雜的數(shù)據(jù)增強(qiáng)方式(Full),包括顏色抖動(dòng)(color jittering)、隨機(jī)灰度化(gray scale)、隨機(jī)高斯模糊(Gaussian blur)、隨機(jī)曝光(solarization),并達(dá)到與復(fù)雜數(shù)據(jù)增強(qiáng)方式類(lèi)似的效果。

1a0d2bd4-4a3f-11ee-97a6-92fbcf53809c.png

模態(tài) 2:3D 點(diǎn)云 本文還在 ModelNet40 數(shù)據(jù)集的分類(lèi)任務(wù)和 ShapeNet Part 數(shù)據(jù)集的分割任務(wù)上驗(yàn)證了 randomized quantization 相對(duì)于已有自監(jiān)督工作的優(yōu)越性。尤其在下游訓(xùn)練集數(shù)據(jù)量較少的情況下,本文的方法顯著超過(guò)已有點(diǎn)云自監(jiān)督算法。

1a27a96e-4a3f-11ee-97a6-92fbcf53809c.png

模態(tài) 3:語(yǔ)音 在語(yǔ)音數(shù)據(jù)集上本文的方法也取得了比已有自監(jiān)督學(xué)習(xí)方法更優(yōu)的性能。本文在六個(gè)下游數(shù)據(jù)集上驗(yàn)證了該方法的優(yōu)越性,其中在最難的數(shù)據(jù)集 VoxCeleb1 上(包含最多且遠(yuǎn)超其他數(shù)據(jù)集的類(lèi)別個(gè)數(shù)),本文方法取得了顯著的性能提升(5.6 個(gè)點(diǎn))。

1a3fdfac-4a3f-11ee-97a6-92fbcf53809c.png

模態(tài) 4:DABS DABS 是一個(gè)模態(tài)通用自監(jiān)督學(xué)習(xí)的基準(zhǔn),涵蓋了多種模態(tài)數(shù)據(jù),包括自然圖像、文本、語(yǔ)音、傳感器數(shù)據(jù)、醫(yī)學(xué)圖像、圖文等。在 DABS 涵蓋的多種不同模態(tài)數(shù)據(jù)上,我們的方法也優(yōu)于已有的任意模態(tài)自監(jiān)督學(xué)習(xí)方式。

1a68cf48-4a3f-11ee-97a6-92fbcf53809c.png

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2551

    文章

    51099

    瀏覽量

    753575
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7030

    瀏覽量

    89036
  • 模態(tài)
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    6260
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    8

    文章

    1698

    瀏覽量

    45993

原文標(biāo)題:ICCV 2023?|?通用數(shù)據(jù)增強(qiáng)技術(shù),隨機(jī)量化適用于任意數(shù)據(jù)模態(tài)

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于transformer和監(jiān)督學(xué)習(xí)的路面異常檢測(cè)方法分享

    鋪設(shè)異常檢測(cè)可以幫助減少數(shù)據(jù)存儲(chǔ)、傳輸、標(biāo)記和處理的壓力。本論文描述了一種基于Transformer和監(jiān)督學(xué)習(xí)的新方法,有助于定位異常區(qū)域。
    的頭像 發(fā)表于 12-06 14:57 ?1569次閱讀
    基于transformer和<b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>的路面異常檢測(cè)方法分享

    你想要的機(jī)器學(xué)習(xí)課程筆記在這:主要討論監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)

    with experience E(一個(gè)程序從經(jīng)驗(yàn)E中學(xué)習(xí)解決任務(wù)T進(jìn)行某一任務(wù)量度P,通過(guò)P測(cè)量在T的表現(xiàn)而提高經(jīng)驗(yàn)E(另一種定義:機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。) 不同類(lèi)型的機(jī)器
    發(fā)表于 12-03 17:12 ?553次閱讀

    如何用Python進(jìn)行無(wú)監(jiān)督學(xué)習(xí)

    無(wú)監(jiān)督學(xué)習(xí)是一種用于數(shù)據(jù)中查找模式的機(jī)器學(xué)習(xí)技術(shù)。無(wú)監(jiān)督算法給出的
    的頭像 發(fā)表于 01-21 17:23 ?4260次閱讀

    機(jī)器學(xué)習(xí)算法中有監(jiān)督和無(wú)監(jiān)督學(xué)習(xí)的區(qū)別

    無(wú)監(jiān)督學(xué)習(xí)的好處之一是,它不需要監(jiān)督學(xué)習(xí)必須經(jīng)歷的費(fèi)力的數(shù)據(jù)標(biāo)記過(guò)程。但是,要權(quán)衡的是,評(píng)估其性能的有效性也非常困難。相反,通過(guò)將監(jiān)督學(xué)習(xí)算法的輸出與測(cè)試
    的頭像 發(fā)表于 07-07 10:18 ?5769次閱讀

    監(jiān)督學(xué)習(xí)與Transformer相關(guān)論文

    將在明年5月4日舉行,目前,本次大會(huì)投稿已經(jīng)結(jié)束,最后共有3013篇論文提交。ICLR 采用公開(kāi)評(píng)審機(jī)制,任何人都可以提前看到這些論文。 為了分析最新研究動(dòng)向,我們精選了涵蓋監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 11-02 15:50 ?2693次閱讀
    <b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>與Transformer相關(guān)論文

    最基礎(chǔ)的半監(jiān)督學(xué)習(xí)

    標(biāo)記數(shù)據(jù)訓(xùn)練的監(jiān)督學(xué)習(xí)技術(shù)得到更好的結(jié)果。這是半監(jiān)督學(xué)習(xí)系列文章的第1部分,對(duì)這個(gè)機(jī)器學(xué)習(xí)的重要子領(lǐng)域進(jìn)行了簡(jiǎn)要的介紹。 區(qū)分半
    的頭像 發(fā)表于 11-02 16:08 ?2655次閱讀

    監(jiān)督學(xué)習(xí)最基礎(chǔ)的3個(gè)概念

    有趣的方法,用來(lái)解決機(jī)器學(xué)習(xí)中缺少標(biāo)簽數(shù)據(jù)的問(wèn)題。SSL利用未標(biāo)記的數(shù)據(jù)和標(biāo)記的數(shù)據(jù)集來(lái)學(xué)習(xí)任務(wù)。SSL的目標(biāo)是得到比單獨(dú)使用標(biāo)記
    的頭像 發(fā)表于 11-02 16:14 ?2969次閱讀
    半<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>最基礎(chǔ)的3個(gè)概念

    為什么半監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的未來(lái)?

    揭示了添加無(wú)監(jiān)督數(shù)據(jù)可以提高模型泛化和性能。事實(shí)上,在非常多的場(chǎng)景中,帶有標(biāo)簽的數(shù)據(jù)并不容易獲得。半監(jiān)督學(xué)習(xí)可以在標(biāo)準(zhǔn)的任務(wù)中實(shí)現(xiàn)SOTA的效果,只需要一小部分的有標(biāo)記
    的頭像 發(fā)表于 11-27 10:42 ?3909次閱讀

    監(jiān)督學(xué)習(xí):比監(jiān)督學(xué)習(xí)做的更好

    監(jiān)督學(xué)習(xí)是人工智能領(lǐng)域的第一種學(xué)習(xí)類(lèi)型。從它的概念開(kāi)始,無(wú)數(shù)的算法,從簡(jiǎn)單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡(luò),都已經(jīng)被研究用來(lái)提高精...
    的頭像 發(fā)表于 12-08 23:32 ?1414次閱讀

    基于人工智能的監(jiān)督學(xué)習(xí)詳解

    監(jiān)督學(xué)習(xí)讓 AI 系統(tǒng)能夠從很少的數(shù)據(jù)學(xué)習(xí)知識(shí),這樣才能識(shí)別和理解世界上更微妙、更不常見(jiàn)的表示形式。
    的頭像 發(fā)表于 03-30 17:09 ?5988次閱讀
    基于人工智能的<b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>詳解

    機(jī)器學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)應(yīng)用在哪些領(lǐng)域

    監(jiān)督學(xué)習(xí)|機(jī)器學(xué)習(xí)| 集成學(xué)習(xí)|進(jìn)化計(jì)算| 非監(jiān)督學(xué)習(xí)| 半監(jiān)督學(xué)習(xí)|
    發(fā)表于 01-20 10:52 ?4970次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>中的無(wú)<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>應(yīng)用在哪些領(lǐng)域

    監(jiān)督學(xué)習(xí)的一些思考

    監(jiān)督學(xué)習(xí)的流行是勢(shì)在必然的。在各種主流有監(jiān)督學(xué)習(xí)任務(wù)都做到很成熟之后,數(shù)據(jù)成了最重要的瓶頸。從無(wú)標(biāo)注數(shù)據(jù)
    發(fā)表于 01-26 18:50 ?1次下載
    <b class='flag-5'>自</b><b class='flag-5'>監(jiān)督學(xué)習(xí)</b>的一些思考

    監(jiān)督學(xué)習(xí)解鎖醫(yī)學(xué)影像洞察力

    數(shù)據(jù),以及機(jī)器可以從中學(xué)習(xí)的復(fù)雜數(shù)據(jù)集標(biāo)簽。 今天,被稱(chēng)為弱監(jiān)督學(xué)習(xí)的深度學(xué)習(xí) (DL) 的一個(gè)分支正在幫助醫(yī)生通過(guò)減少對(duì)完整、準(zhǔn)確和準(zhǔn)確
    的頭像 發(fā)表于 09-30 18:04 ?1444次閱讀
    弱<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>解鎖醫(yī)學(xué)影像洞察力

    監(jiān)督學(xué)習(xí)代碼庫(kù)存在的問(wèn)題與挑戰(zhàn)

    當(dāng)使用監(jiān)督學(xué)習(xí)(Supervised Learning)對(duì)大量高質(zhì)量的標(biāo)記數(shù)據(jù)(Labeled Data)進(jìn)行訓(xùn)練時(shí),神經(jīng)網(wǎng)絡(luò)模型會(huì)產(chǎn)生有競(jìng)爭(zhēng)力的結(jié)果。例如,根據(jù)Paperswithcode網(wǎng)站統(tǒng)計(jì)
    的頭像 發(fā)表于 10-18 16:28 ?1302次閱讀

    通用數(shù)據(jù)增強(qiáng)技術(shù)適用于任意數(shù)據(jù)模態(tài)的隨機(jī)量化

    一般性地,輸入數(shù)據(jù)可以被表征為由序列維度(sequential)和通道維度(channel)組成的二維向量。其中序列維度通常是模態(tài)相關(guān)的,例如圖像上的空間維度、語(yǔ)音的時(shí)間維度以及語(yǔ)言的句法維度。而通道維度是模態(tài)無(wú)關(guān)的。
    的頭像 發(fā)表于 09-12 16:40 ?385次閱讀
    通用<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>增強(qiáng)</b><b class='flag-5'>技術(shù)</b>!<b class='flag-5'>適用于</b><b class='flag-5'>任意</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>模態(tài)</b>的隨機(jī)量化
    主站蜘蛛池模板: 国产资源视频| 亚洲免费小视频| 精品视频日本| 激情福利网| 大片毛片女女女女女女女| www.嫩草影院| 手机在线观看视频你懂的| 国产在线干| 最好免费高清视频观看韩国| 99久久国产免费福利| 国产黄色网| 午夜网站免费| 亚洲成在线观看| 日韩亚| 龙口护士门91午夜国产在线| 国内精品久久久久影| 亚洲综合丁香| 久久草在线视频国产一| 91在线视频观看| 一级毛片q片| 日本大片免费观看视频| 国产精品你懂得| 天天做天天爱天天爽综合区| 九九51精品国产免费看| 成人爽a毛片在线视频网站| 3344在线观看永久免费| 亚洲精品你懂的| 成年在线视频| 国产干美女| 福利片午夜| 日本乱理论片免费看| www.天天色| 一区二区视屏| 四虎海外在线永久免费看| 狠狠色影院| 片黄免费| 亚洲美女视频一区| 日本在线色视频| 日本免费人成黄页在线观看视频 | 男女交性特一级| 色你懂的|