在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于transformer和自監督學習的路面異常檢測方法分享

冬至子 ? 來源:蘇大軌道交通學院研究生 ? 作者:Zijie Lina,b,Hui Wang ? 2023-12-06 14:57 ? 次閱讀

01

文章摘要

鋪設異常檢測可以幫助減少數據存儲、傳輸、標記和處理的壓力。本論文描述了一種基于Transformer和自監督學習的新方法,有助于定位異常區域。實驗結果顯示,自監督學習可以提高在小型未標記圖像數據集上的性能。Transformer被證明在路面損壞檢測領域是適用的。文章構建的類似于人臉識別的框架可以通過將新的補丁放入圖庫中來增強性能,而移除相似的補丁不會影響識別結果。該方法足夠高效和小型化,以支持實時工作,并且可以直接應用于邊緣檢測。

02

主要工作與貢獻

  1. 該論文提出了一種新穎的方法,將Transformer模型和自監督學習相結合,用于路面異常檢測。Transformer是一種強大的神經網絡架構,用于處理序列數據,在該研究中被應用于圖像數據,并取得了顯著的成果。
  2. 監督學習是一種無需人工標注的學習方法,可以從未標記的數據中學習有用的特征。該論文展示了自監督學習在小型未標記圖像數據集上的應用,并證明它能夠顯著提高性能。
  3. 研究人員構建了一個類似于人臉識別的框架,通過將新的圖像補丁加入圖庫中,來增強路面異常檢測的性能。這種方法能夠在不進行訓練的情況下實現性能的提升。
  4. 該方法被證明足夠高效和小型化,能夠支持實時工作,因此可以在實際應用中進行邊緣檢測和路面異常監測。

03

所提方法

Transformer可能比CNN更好,因為Transformer天然具有全局感受野,可以捕捉長距離像素之間的關系。自注意力機制可能有助于解決缺乏數據的問題,因為在類似條件下,MAE(掩碼自編碼器)表現良好。本論文將自監督學習和Transformer應用于路面異常檢測。使用ViT-S的自監督學習來重構未標記的路面圖像,并提出了一種編碼-檢索-匹配的路面異常檢測方法來解決分類重訓練的問題。文章方法的框架如圖1所示。主要由兩個部分組成:圖庫和編碼器。首先,圖像將被劃分為幾個補丁,并且典型的補丁將被添加到圖庫中。這將降低分辨率并減少背景像素。在模型訓練完成后,將提取編碼器部分。所有的補丁都可以被編碼成特征向量。一旦向量被編碼,計算它們之間的距離得到一個距離向量(一列)。最后,將找到與預測類別最接近的補丁。

圖片

圖1 論文方法總體架構

01.編碼器

圖片

圖2 ViT架構

ViT是Transformer在計算機視覺領域的第一個成功應用,它簡單地將圖像劃分為補丁作為輸入序列,以便Transformer能夠處理。參考了BERT,ViT在其中添加了一個[class]標記來融合用于分類的信息。如圖2所示,ViT首先通過平均劃分輸入來獲取圖像補丁,然后進行線性投影以獲取圖像標記。一旦生成了標記,將添加位置嵌入以恢復丟失的位置信息。然后,它們將被輸入到Transformer編碼器中。最后,只有[class]標記將在分類中使用。多頭注意力機制可以用公式(1)來描述。

圖片

其中,n表示嵌入的數量,Zh是第h個注意頭的輸出,dk表示K的維度。嵌入E和可學習權重W進行點積運算,以得到查詢(Query)Q,鍵(Key)K和值(Value)V。

最終輸出是可學習權重和Z(堆疊Zh)的點生成。不同頭部的權重是獨立的,以確保從各種表示子空間中提取特征。整個過程可以大致描述為等式(2)-(5)。

圖片

其中Z0表示輸入向量,Y是用于分類的圖像表示。Z0L是Z的位置0上的標記(也稱為[class]標記)。LN表示層標準化。

02.Drop path

文章采用“drop path” 作為一種規范化方法來防止過擬合。簡單來說,它會根據預先確定的概率隨機地禁用每一層之間的路徑,至少保留一條路徑。在實現中,對于每一層的多個輸入,會隨機丟棄一些輸入。這個效果類似于模型集成,其中不同的路徑組合意味著不同的子網絡,而在預測時不會丟棄路徑來將它們組合起來。

03.監督學習

在實驗中,文章使用圖像補丁作為輸入,輸出為正常或異常。因此,這是一個二元分類任務;輸出值是介于0到1之間的sigmoid輸入得分。數值越接近0,輸入越有可能是異常(類別0)。相反,越接近1,輸入越有可能是正常的(類別1)。在訓練過程中,sigmoid得分(x)與真實值(y)之間的差距越大,二元交叉熵損失就越大。在模型用于推斷時,會設置一個閾值(通常為0.5)。當sigmoid得分低于閾值時,輸入被視為異常,反之亦然。

04.自監督學習

MAE是一種基于部分掩膜圖像的像素級重建任務的方法。編碼器僅對可見的補丁進行編碼。編碼完成后,[mask]標記將添加到相應的位置。解碼器將接收所有標記作為輸入進行重建。

MAE的關鍵方面可以分為四個部分:掩膜策略、編碼器、解碼器和重建目標。掩膜策略通常選擇隨機掩膜,掩膜比例較大。在這種情況下,被掩膜部分占據了圖像的大部分區域,很難找到掩膜周圍的未掩膜區域,迫使模型學習不依賴局部信息。文章選擇純粹的ViT作為編碼器,因為它沒有引入過多的修改,導致對特定領域過擬合,并且重建目標是均方損失。

05.類似面部識別的框架

通常,模型在超出其訓練數據分布范圍的數據上表現較差。不同地區之間存在明顯的道路差異,例如路面分類,將會降低模型的精度。文章從最佳ViT-S模型中提取編碼器作為幀中的編碼器。選擇第11、12、13、10、9、8和6列的圖像塊作為輸入,因為這些位置的異常概率較高。如果Sigmoid輸出低于某個閾值,該類別被認為是異常(類別0)。一旦預測為異常,整個輸入圖像都被視為異常。

04

實驗驗證

1

監督學習結果

表1 ViT-S在不同DA和drop path下的精度比較

圖片

監督學習的結果顯示在表格1和圖3、圖4中。表格1顯示數據增強(DAs)比隨機刪除路徑(drop paths)可以帶來更多的性能提升。從圖3和圖4可以看出,兩個模型在最后幾個周期開始過擬合。Resnet的結果較好,因為它收斂到一個更好的局部最優點。CNN具有局部相關性等先驗知識,當數據較少時會導致這樣的結果。而Transformer沒有這樣的知識,因此需要從更多數據中進行學習。

圖片

圖3 resnet34的學習曲線

圖片

圖4 ViT–S的學習曲線

2

自我監督學習結果

表2證明,在微調中應用DA對于提高性能是必要的,因為最高精度主要取決于微調,使模型適應二進制分類任務。如果微調數據的數量不足,模型仍然會過擬合。根據有監督和自監督學習圖,MAE可以顯著加速收斂并提高精度。

表2 在不同位置應用DA的準確性

圖片

3

可視化視角討論

文章使用GradCAM(梯度加權類激活映射)來直觀地分析文章的路面異常檢測算法。選擇了兩張分別具有兩種類型的明顯遇險的測試圖像。圖5圖6顯示了結果。混合結果意味著所有頭的平均值。圖中的響應越高,它與分類的相關性就越大。圖6與無MAE的ViT相比,有MAE的ViT在遇險周圍有更集中的活動區域。這一事實支持了像MAE這樣的自監督學習可以幫助模型在數據集幾乎沒有標記數據的情況下學習更好的表示。此外,我們可以看到,最后兩個區塊比其他區塊更關注遇險區域。有一些像Block_9這樣的塊具有統一的響應。這一發現在圖5中更為明顯。

圖片

圖5 測試圖像A中ViT w/MAE的單獨結果

圖片

圖6 測試圖像A中ViT w/MAE和ViT w/o MAE的混合結果

05

結論

研究旨在快速檢測道路異常,以減少路面損壞識別、數據存儲和標注的工作量。通過驗證異常檢測任務,自監督學習對這個問題產生了顯著影響,其價值比數據增強(準確率為0.9268 vs 0.9183)更為重要。Transformer在道路領域適用,因為它具有捕捉長距離關系的強大能力。第二個重要發現是,通過定制畫廊,類似于人臉識別的框架可以快速識別不同的損壞類型。基于ViT(Visual Transformer)和MAE,本研究設計了一種新穎的方法來檢測異常的路面部分。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1143

    瀏覽量

    40742
  • 編碼器
    +關注

    關注

    45

    文章

    3643

    瀏覽量

    134519
  • 人臉識別
    +關注

    關注

    76

    文章

    4012

    瀏覽量

    81903
  • 計算機視覺
    +關注

    關注

    8

    文章

    1698

    瀏覽量

    45993
  • Transformer
    +關注

    關注

    0

    文章

    143

    瀏覽量

    6006
收藏 人收藏

    評論

    相關推薦

    適用于任意數據模態的監督學習數據增強技術

    模態的。這意味著需要為不同的數據模態開發不同的監督學習算法。為此,本文提出了一種通用的數據增強技術,可以應用于任意數據模態。相較于已有的通用的監督學習,該
    的頭像 發表于 09-04 10:07 ?1120次閱讀
    適用于任意數據模態的<b class='flag-5'>自</b><b class='flag-5'>監督學習</b>數據增強技術

    如何用卷積神經網絡方法去解決機器監督學習下面的分類問題?

    人工智能下面有哪些機器學習分支?如何用卷積神經網絡(CNN)方法去解決機器學習監督學習下面的分類問題?
    發表于 06-16 08:09

    基于半監督學習的跌倒檢測系統設計_李仲年

    基于半監督學習的跌倒檢測系統設計_李仲年
    發表于 03-19 19:11 ?4次下載

    基于半監督學習框架的識別算法

    人體行為識別是計算機視覺研究的熱點問題,現有的行為識別方法都是基于監督學習框架.為了取得較好的識別效果,通常需要大量的有標記樣本來建模.然而,獲取有標記樣本是一個費時又費力的工作.為了解決這個
    發表于 01-21 10:41 ?1次下載

    機器學習算法中有監督和無監督學習的區別

    監督學習的好處之一是,它不需要監督學習必須經歷的費力的數據標記過程。但是,要權衡的是,評估其性能的有效性也非常困難。相反,通過將監督學習算法的輸出與測試數據的實際標簽進行比較,可以很容易地衡量
    的頭像 發表于 07-07 10:18 ?5770次閱讀

    監督學習Transformer相關論文

    Transformer、圖神經網絡、自然語言處理、模型壓縮等熱點領域,將分多期為大家帶來系列論文解讀。 本期的關注焦點是監督學習
    的頭像 發表于 11-02 15:50 ?2693次閱讀
    <b class='flag-5'>自</b><b class='flag-5'>監督學習</b>與<b class='flag-5'>Transformer</b>相關論文

    最基礎的半監督學習

    導讀 最基礎的半監督學習的概念,給大家一個感性的認識。 半監督學習(SSL)是一種機器學習技術,其中任務是從一個小的帶標簽的數據集和相對較大的未帶標簽的數據中學習得到的。SSL的目標是
    的頭像 發表于 11-02 16:08 ?2655次閱讀

    監督學習最基礎的3個概念

    導讀 今天給大家介紹半監督學習中的3個最基礎的概念:一致性正則化,熵最小化和偽標簽,并介紹了兩個經典的半監督學習方法。 沒看一的點這里哈:半監督學習入門基礎(一) 半監督學習 (SSL
    的頭像 發表于 11-02 16:14 ?2969次閱讀
    半<b class='flag-5'>監督學習</b>最基礎的3個概念

    為什么半監督學習是機器學習的未來?

    為什么半監督學習是機器學習的未來。 監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡,都已經被研究用來提高精確度和預測能力。 然而
    的頭像 發表于 11-27 10:42 ?3909次閱讀

    監督學習:比監督學習做的更好

    監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡,都已經被研究用來提高精...
    的頭像 發表于 12-08 23:32 ?1414次閱讀

    基于人工智能的監督學習詳解

    監督學習讓 AI 系統能夠從很少的數據中學習知識,這樣才能識別和理解世界上更微妙、更不常見的表示形式。
    的頭像 發表于 03-30 17:09 ?5988次閱讀
    基于人工智能的<b class='flag-5'>自</b><b class='flag-5'>監督學習</b>詳解

    機器學習中的無監督學習應用在哪些領域

    解決數據中心、云計算、人工智能和邊緣計算等各個行業的問題,為人們帶來極大便益。 監督學習是什么? 監督學習監督學習和非
    發表于 01-20 10:52 ?4970次閱讀
    機器<b class='flag-5'>學習</b>中的無<b class='flag-5'>監督學習</b>應用在哪些領域

    監督學習的一些思考

    監督學習的流行是勢在必然的。在各種主流有監督學習任務都做到很成熟之后,數據成了最重要的瓶頸。從無標注數據中學習有效信息一直是...
    發表于 01-26 18:50 ?1次下載
    <b class='flag-5'>自</b><b class='flag-5'>監督學習</b>的一些思考

    融合零樣本學習和小樣本學習的弱監督學習方法綜述

    融合零樣本學習和小樣本學習的弱監督學習方法綜述 來源:《系統工程與電子技術》,作者潘崇煜等 摘 要:?深度學習模型嚴重依賴于大量人工標注的數據,使得其在數據缺乏的特殊領域內應用嚴重受限
    發表于 02-09 11:22 ?2314次閱讀
    融合零樣本<b class='flag-5'>學習</b>和小樣本<b class='flag-5'>學習</b>的弱<b class='flag-5'>監督學習方法</b>綜述

    深度學習中的無監督學習方法綜述

    應用中往往難以實現。因此,無監督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的無監督學習方法,包括自編碼器、生成對抗網絡、聚類算法等,并分析它們的原理、應用場景以及優
    的頭像 發表于 07-09 10:50 ?732次閱讀
    主站蜘蛛池模板: 四虎影院中文字幕| 四虎国产精品免费入口| 三级在线国产| 爱爱免费小视频| 国产精品大片天天看片| 在线观看免费视频| 人色网| 亚洲地址一地址二地址三| 国产一区二区三区在线观看影院| 免费一级在线| 99久久精品费精品国产一区二区| 美女网站视频一区| 可以免费看黄色的网站| 国产小福利| 亚洲欧美一区二区三区另类| 色噜噜狠狠成人网| 亚洲第一免费视频| 亚洲精品美女久久久aaa| 欧美三级手机在线| 欧美黄色免费| 在线观看一级毛片| 国产美女流出白浆在线观看| 91操碰| 色.www| 日本污视频| 一级特黄a大片免费| 国产va免费精品高清在线| 成人男女啪啪免费观看网站| 色91在线| 久久午夜免费视频| 五月婷色| 五月天婷婷伊人| 最近2018中文字幕免费看手机| 国产综合久久久久影院| 黄色国产视频| 毛片在线播放网站| 6080午夜| 欧美成人伊人十综合色| 国产精品午夜国产小视频| 色wwwww| 乱码精品一区二区三区|