在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

構建一個移動端友好的SAM方案MobileSAM

CVer ? 來源:CVer ? 2023-06-30 10:59 ? 次閱讀

導讀

本文提出一種"解耦蒸餾"方案對SAM的ViT-H解碼器進行蒸餾,同時所得輕量級編碼器可與SAM的解碼器"無縫兼容"。在推理速度方面,MobileSAM處理一張圖像僅需10ms,比FastSAM的處理速度快4倍。

SAM(Segment Anything Model)是一種提示詞引導感興趣目標分割的視覺基礎模型。自提出之日起,SAM引爆了CV社區,也衍生出了大量相關的應用(如檢測萬物、摳取萬物等等),但是受限于計算量問題,這些應用難以用在移動端。

本文旨在將SAM的"重量級"解碼器替換為"輕量級"以使其可在移動端部署應用。為達成該目標,本文提出一種"解耦蒸餾"方案對SAM的ViT-H解碼器進行蒸餾,同時所得輕量級編碼器可與SAM的解碼器"無縫兼容" 。此外,所提方案,只需一個GPU不到一天時間即可完成訓練,比SAM小60倍且性能相當,所得模型稱之為MobileSAM。在推理速度方面,MobileSAM處理一張圖像僅需10ms(8ms@Encoder,2ms@Decoder),比FastSAM的處理速度快4倍,這就使得MobileSAM非常適合于移動應用。

SAM

b65f4d78-1696-11ee-962d-dac502259ad0.png

上圖給出了SAM架構示意圖,它包含一個"重量級"ViT編碼器與一個提示詞引導Mask解碼器。解碼器以圖像作為輸入,輸出將被送入Mask解碼器的隱特征(embedding);Mask解碼器將基于提示詞(如point、bbox)生成用于目標分割的Mask。此外,SAM可以對同一個提示詞生成多個Mask以緩解"模棱兩可"問題。更多關于SAM及衍生技術可參考文末推薦閱讀材料。

b68e9164-1696-11ee-962d-dac502259ad0.png

延續SAM架構體系:采用輕量級ViT解碼器生成隱特征,然后采用提示詞引導解碼器生成期望的Mask。本文目標:構建一個移動端友好的SAM方案MobileSAM,即比原生SAM更快且具有令人滿意的性能。考慮到SAM不同模塊之間的參數量問題,本文主要聚焦于采用更輕量型的Encoder替換SAM的重量級Encoder

實現方案

b699ec08-1696-11ee-962d-dac502259ad0.png

Coupled Distillation 一種最直接的方式是參考SAM方案重新訓練一個具有更小Encoder的SAM,見Figure2左圖。如SAM一文所提到:SAM-ViT-H的訓練需要256個A100,且訓練時間達68小時;哪怕Encoder為ViT-B也需要128個GPU。這樣多的資源消耗無疑阻礙了研究人員進行復現或改進。此外,需要注意的是SAM所提供數據集的Mask是有預訓練SAM所生成,本質上講,重訓練過程也是一種知識蒸餾過程,即講ViT-H學習到的知識遷移到輕量級Encoder中。

Semi-coupled Distillation 當對原生SAM進行知識蒸餾時,主要困難在于: Encoder與Decoder的耦合優化,兩者存在互依賴。有鑒于此,作者將整個知識蒸餾過程拆解為Encoder蒸餾+Decoder微調,該方案稱之為半耦合蒸餾(Semi-coupled Distillation),見Figure2右圖。也就是說,我們首先對Encoder進行知識蒸餾,然后再與Decoder進行協同微調。

b6a4df28-1696-11ee-962d-dac502259ad0.png

Decoupled Distillation 根據經驗,我們發現這種半耦合蒸餾方案仍然極具挑戰性,這是因為提示詞的選擇具有隨機性,使得Decoder可變,進而導致優化變難。有鑒于此,作者提出直接對原生SAM的編碼器進行蒸餾且無需與Decoder組合,該方案稱之為解耦合蒸餾。該方案的一個優勢在于:僅需使用MSE損失即可,而無需用于Mask預測的Focal與Dice組合損失。

Necessity of Mask Decoder Finetuning 不同于半耦合蒸餾,經解耦合蒸餾訓練得到的輕量級Encoder可能與凍結的Decoder存在不對齊問題。根據經驗,我們發現:該現象并不存在。這是因為學生Encoder生成的隱特征非常接近于原始老師Encoder生成的隱特征,因此并不需要與Decoder進行組合微調。當然,進一步的組合微調可能有助于進一步提升性能。

b6d1c1aa-1696-11ee-962d-dac502259ad0.png

Preliminary Evaluation 上表對比了耦合蒸餾與解耦合蒸餾的初步對比。可以看到:

從指標方面,解耦合蒸餾方案指標稍高,0.75mIoU vs 0.72mIoU;

從訓練GPU方面,解耦合蒸餾方案僅需兩個GPU,遠小于耦合蒸餾方案的128卡,大幅降低了對GPU的依賴;

從迭代次數方面,解耦合蒸餾方案僅需55k次迭代,遠小于耦合蒸餾方案的180K,大幅降低了訓練消耗;

從訓練數據方面,解耦合蒸餾方案僅需11K數據量,遠小于耦合蒸餾方案的11M,大幅降低了數據依賴。

盡管如此,但ViT-B對于移動端部署仍然非常困難。因此,后續實驗主要基于TinyViT進行。

本文實驗

b6ddecd2-1696-11ee-962d-dac502259ad0.png

在具體實現方面,作者基于ViT-Tiny進行本文所提方案的有效性驗證,所得MobileSAM與原生SAM的參數+速度的對比可參考上表。在訓練方面,僅需SA-1B的1%數據量+單卡(RTX3090),合計訓練8個epoch,僅需不到一天即可完成訓練。

b6e865a4-1696-11ee-962d-dac502259ad0.pngb71b3f92-1696-11ee-962d-dac502259ad0.png

上述兩個圖給出了point與bbox提示詞下MobileSAM與原生SAM的結果對比,可以看到:MobileSAM可以取得令人滿意的Mask預測結果

消融實驗

b736499a-1696-11ee-962d-dac502259ad0.png

上表從訓練超參bs、epoch、iter等維度進行了對比分析,可以看到:

在同等迭代次數下,提升bs可以進一步提升模型性能;

在同等bs下,提升iter可以進一步提升模型性能。

b73edc68-1696-11ee-962d-dac502259ad0.png

上報對比了FastSAM與MobileSAM,可以看到:

從參數量方面,MobileSAM只有不到10M的參數量,遠小于FastSAM的68M;

從處理速度方面,MobileSAM僅需10ms,比FastSAM的40ms快4倍.

b751bcf2-1696-11ee-962d-dac502259ad0.png

上圖從Segment everything角度對比了SAM、FastSAM以及MobileSAM三個模型,可以看到:

MobileSAM與原生SAM結果對齊驚人的好,而FastSAM會生成一些無法滿意的結果;

FastSAM通常生成非平滑的邊緣,而SAM與MobileSAM并沒有該問題。

最后,補充一下Segment Anything與Segment Everything之間的區別。

如SAM一文所提到,SAM通過提示詞進行物體分割,也就是說,提示詞的作用是指定想分割哪些物體。理論上講,當給定合適的提示詞后,任何目標都可以被分割,故稱之為Segment Anything。

相反,Segment Everything本質上是物體候選框生成過程,不需要提示詞。故它往往被用來驗證下游任務上的zero-shot遷移能力。

總而言之,Segment Anything解決了任意物體的提示分割基礎任務;Segment Everything則解決了所有物體面向下游任務的候選框生成問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3643

    瀏覽量

    134525
  • 模型
    +關注

    關注

    1

    文章

    3244

    瀏覽量

    48842
  • SAM
    SAM
    +關注

    關注

    0

    文章

    112

    瀏覽量

    33524

原文標題:Faster Segment Anything

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【愛芯派 Pro 開發板試用體驗】+ 圖像分割和填充的Demo測試

    /ChaoningZhang/MobileSAM)是輕量化的框架,它的目標是通過用輕量化圖像編碼器取代復雜的圖像編碼器,使SAM移動
    發表于 12-26 11:22

    移動適配方案

    移動適配方案
    發表于 05-17 17:08

    種在金上生成硫醇封SAM的新方法

    種在金上生成硫醇封SAM的新方法 - 應用簡報
    發表于 10-30 11:05

    基于SAM3S4C器件被動紅外參考設計

    SAM3S運動探測器相機的被動紅外參考設計(PIRRD)。該電路為硬件和軟件工程師提供了詳細的指導和說明,構建了建筑或家庭報警和監控系統中的低成本,功能強大的無源紅外移動探測器攝像頭。參考設計基于
    發表于 05-19 09:14

    SMART SAM4C微控制器有哪些應用?

    愛特梅爾(Atmel)公司的SMART SAM4C微控制器是系統級芯片解決方案,用于智能電源應用,它是基于兩高性能的32位ARM Cortex-M4 RISC處理器構建。這些器件運行
    發表于 11-23 12:19

    法國DREAM方案SAM5504B/SAM5704B音源芯片

    `法國dream芯片系列供應,提供整套開發工具(下載器評估板開發板)SAM5704B /SAM5704BSAM2634B /SAM5504 法國DREAMDSP音頻芯片 應用范圍:電
    發表于 06-22 15:40

    關于Atmel SAM4L方案設計的介紹講解

    Atmel - SAM4L方案設計
    的頭像 發表于 07-10 01:15 ?2346次閱讀

    關于SAM4L方案設計的介紹

    Atmel - SAM4L方案設計簡介
    的頭像 發表于 07-09 00:48 ?2227次閱讀

    如何快速構建移動跨平臺視頻通話應用

    今天我們就來看下如何使用 Agora Flutter SDK 快速構建簡單的移動跨平臺視頻通話應用。
    的頭像 發表于 02-24 06:01 ?2850次閱讀
    如何快速<b class='flag-5'>構建</b><b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>移動</b>跨平臺視頻通話應用

    中興聯手廣州移動實現構建的5G地鐵切片

    5月28日,中興通訊與廣州移動在廣州塔地鐵站率先實現了全球首個5G SA環境的無線PRB(Physical Recourse Block,物理資源塊)硬隔離切片方案,解決方案涵蓋了5G商用終端、5G基站、承載及5G核心網,
    的頭像 發表于 06-03 15:47 ?3276次閱讀

    如何構建完整的物聯網解決方案

    冷鏈物流的復雜性、成本和風險使其成為物聯網的理想使用案例。以下是我們如何構建完整的物聯網解決方案,以應對這些挑戰。
    發表于 06-24 17:46 ?4795次閱讀

    利用GT-SAM的緊耦合激光雷達慣導里程計的框架

    LIO-SAM 提出了利用GT-SAM的緊耦合激光雷達慣導里程計的框架。實現了高精度、實時的移動機器人的軌跡估計和建圖。
    的頭像 發表于 10-31 09:25 ?2411次閱讀

    構建移動RFID閱讀器

    電子發燒友網站提供《構建移動RFID閱讀器.zip》資料免費下載
    發表于 12-05 10:31 ?1次下載
    <b class='flag-5'>構建</b><b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>移動</b>RFID閱讀器

    構建移動應用程序

    電子發燒友網站提供《構建移動應用程序.zip》資料免費下載
    發表于 07-04 14:33 ?0次下載
    <b class='flag-5'>構建</b><b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>移動</b>應用程序

    如何構建演示移動應用

    作為通訊工具,視頻會議幾乎隨處可見,尤其適用于遠程辦公和社交互動。但其使用體驗并非總是簡單直接、即開即用,可能需要進行調整,確保音頻視頻設置良好。其中,照明便是難以把握的因素。在會議中,光線充足
    的頭像 發表于 11-15 11:43 ?219次閱讀
    如何<b class='flag-5'>構建</b><b class='flag-5'>一</b><b class='flag-5'>個</b>演示<b class='flag-5'>移動</b><b class='flag-5'>端</b>應用
    主站蜘蛛池模板: 59日本人xxxxxxxxx69| 自偷自拍亚洲欧美清纯唯美| 欧美成人免费高清网站| 天天综合在线视频| 手机在线免费观看视频| 精品国产一区二区三区成人| 7777奇米| 爽a中文字幕一区| 欧美视频区| 靓装爱神12丝袜在线播放 | 插久久| 中文字幕不卡在线播放| 欧亚色视频| 天天操天天操天天操香蕉| 在线观看视频播放| 99在线国产| 黄色小毛片| 夜夜操夜夜爱| 亚洲网站视频| 免费人成网555www| 玖玖福利| 新天堂在线| 99久久99久久精品免费看子伦 | 俄罗斯女人69xxx| 综合伊人久久| 国产三级精品在线| 欧美黄色精品| 天天怕夜夜怕狠狠怕| www.男人的天堂| 午夜欧美在线| 黄色视屏日本| 性欧美极品| 欧美日韩精品一区二区另类| 欧美日日日| 特级a毛片| 天天狠天天透| 天天躁夜夜躁狠狠躁2024| 久久免费手机视频| 国产午夜影院| 四虎影视在线观看| 手机看片日本|