在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

哈工大提出Myriad:利用視覺專家進行工業異常檢測的大型多模態模型

CVer ? 來源:CVer ? 2023-11-21 16:08 ? 次閱讀

一句話總結

通過應用視覺專家進行工業異常檢測,以實現明確的異常檢測和高質量的異常描述,還可進行多輪對話,性能表現出色!優于AnomalyGPT等網絡,代碼即將開源!

Myriad

81612fa6-8842-11ee-939d-92fbcf53809c.png

Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection

單位:哈工大(左旺孟團隊), 琶洲實驗室

論文:https://arxiv.org/abs/2310.19070

代碼:https://github.com/tzjtatata/Myriad

現有的工業異常檢測(IAD)方法可以預測異常檢測和定位的異常分數。然而,它們很難對異常區域進行多輪對話和詳細描述,例如工業異常的顏色、形狀和類別。

最近,大型多模態(即視覺和語言)模型(LMM)在圖像描述、視覺理解、視覺推理等多種視覺任務上表現出了卓越的感知能力,使其成為更易于理解的異常檢測的有競爭力的潛在選擇。然而,現有的通用 LMM 中缺乏有關異常檢測的知識,而訓練特定的 LMM 進行異常檢測需要大量的注釋數據和大量的計算資源。

本文提出了一種新穎的大型多模態模型,通過應用視覺專家進行工業異常檢測(稱為Myriad),從而實現明確的異常檢測和高質量的異常描述。

8174db1e-8842-11ee-939d-92fbcf53809c.png

具體來說,采用 MiniGPT-4 作為基礎 LMM,并設計一個專家感知模塊,將視覺專家的先驗知識嵌入到大型語言模型(LLM)可以理解的標記中。

817bd270-8842-11ee-939d-92fbcf53809c.png

為了彌補視覺專家的錯誤和困惑,引入了域適配器來彌合通用圖像和工業圖像之間的視覺表示差距。此外,提出了一個視覺專家講師,它使 Q-Former 能夠根據視覺專家先驗生成 IAD 領域視覺語言標記。

實驗結果

在MVTec-AD 和 VisA 基準上的大量實驗表明,本文提出的方法不僅在 1-class 和少樣本設置下比最先進的方法表現更好,而且還提供了明確的異常預測以及 IAD 中的詳細描述領域。

818720f8-8842-11ee-939d-92fbcf53809c.png

8193e388-8842-11ee-939d-92fbcf53809c.png

81d184e0-8842-11ee-939d-92fbcf53809c.png

81ed7236-8842-11ee-939d-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3244

    瀏覽量

    48845
  • 視覺
    +關注

    關注

    1

    文章

    147

    瀏覽量

    23950
  • 大模型
    +關注

    關注

    2

    文章

    2451

    瀏覽量

    2714

原文標題:工業異常檢測大模型來了!哈工大提出Myriad:利用視覺專家進行工業異常檢測的大型多模態模型

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    商湯日日新模態模型權威評測第一

    剛剛,商湯科技日日新SenseNova模態模型,在權威綜合評測權威平臺OpenCompass的模態評測中取得榜單第一。
    的頭像 發表于 12-20 10:39 ?191次閱讀

    一文理解模態大語言模型——下

    /understanding-multimodal-llms ? 《一文理解模態大語言模型 - 上》介紹了什么是模態大語言
    的頭像 發表于 12-03 15:18 ?129次閱讀
    一文理解<b class='flag-5'>多</b><b class='flag-5'>模態</b>大語言<b class='flag-5'>模型</b>——下

    利用OpenVINO部署Qwen2模態模型

    模態模型的核心思想是將不同媒體數據(如文本、圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說
    的頭像 發表于 10-18 09:39 ?440次閱讀

    華工科技聯合哈工大實現國內首臺激光智能除草機器人落地

    華工科技黨委書記、董事長、總裁馬新強一行赴哈爾濱對哈爾濱工業大學機器人技術與系統全國重點實驗室(后簡稱哈工大機器人實驗室)、愛輝區智能激光除草機器人試點基地進行實地調研,代表華工科技中央研究院同
    的頭像 發表于 09-06 10:45 ?806次閱讀

    云知聲推出山海模態模型

    在人工智能技術的浩瀚星海中,模態交互技術正成為引領未來的新航標。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創新之姿,推出了其匠心獨運的山海模態
    的頭像 發表于 08-27 15:20 ?394次閱讀

    依圖模態模型伙伴CTO精研班圓滿舉辦

    模型在不同行業領域的應用前景;7月19日, “依圖科技模態模型伙伴CTO精研班”在杭州圓滿舉辦,讓更多的伙伴們深度體驗了依圖
    的頭像 發表于 07-23 15:16 ?422次閱讀

    聆思CSK6視覺語音大模型AI開發板入門資源合集(硬件資料、大模型語音/模態交互/英語評測SDK合集)

    豐富外設配件 配套模態應用示例,支持快速上手體驗大模型語音交互、智能視覺等 AI 應用 板載 DAPLINK 調試器,外接一條USB 線即可實現燒錄、調試、串口日志查看 板載網絡模組
    發表于 06-18 17:33

    智譜AI發布全新模態開源模型GLM-4-9B

    近日,智譜AI在人工智能領域取得重大突破,成功推出全新開源模型GLM-4-9B。這款模型以其卓越的模態能力,再次刷新了業界對于大型語言
    的頭像 發表于 06-07 09:17 ?746次閱讀

    商湯科技發布5.0模態模型,綜合能力全面對標GPT-4 Turbo

    場景應用需求;升級“日日新SenseNova 5.0”大模型體系,綜合能力全面對標GPT-4 Turbo。 此外對于文生視頻徐立也表示商湯科技很快就會發布相關的平臺產品。 備受矚目的商湯科技“日日新SenseNova” 5.0模態
    的頭像 發表于 04-24 16:49 ?1110次閱讀

    李未可科技正式推出WAKE-AI模態AI大模型

    文本生成、語言理解、圖像識別及視頻生成等模態交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺+語音打造新一代 LLM-Based的自然交互,同時
    發表于 04-18 17:01 ?601次閱讀
    李未可科技正式推出WAKE-AI<b class='flag-5'>多</b><b class='flag-5'>模態</b>AI大<b class='flag-5'>模型</b>

    蘋果發布300億參數MM1模態模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的模態模型研究成果——MM1。這款具有高達300億參數的
    的頭像 發表于 03-19 11:19 ?901次閱讀

    螞蟻推出20億參數模態遙感模型SkySense

    據了解,負責開發的百靈團隊利用自身擁有的19億遙感影像數據集進行了預訓練,從而生成了具有20.6億參數的SkySense大模型。官方稱其為全球范圍內參數規模最大、任務覆蓋最全且識別精度最高的
    的頭像 發表于 02-28 15:53 ?674次閱讀

    韓國Kakao宣布開發模態大語言模型“蜜蜂”

    韓國互聯網巨頭Kakao最近宣布開發了一種名為“蜜蜂”(Honeybee)的模態大型語言模型。這種創新模型能夠同時理解和處理圖像和文本數據
    的頭像 發表于 01-19 16:11 ?699次閱讀

    機器人基于開源的模態語言視覺模型

    ByteDance Research 基于開源的模態語言視覺模型 OpenFlamingo 開發了開源、易用的 RoboFlamingo 機器人操作
    發表于 01-19 11:43 ?422次閱讀
    機器人基于開源的<b class='flag-5'>多</b><b class='flag-5'>模態</b>語言<b class='flag-5'>視覺</b>大<b class='flag-5'>模型</b>

    基于DiAD擴散模型異常檢測工作

    現有的基于計算機視覺工業異常檢測技術包括基于特征的、基于重構的和基于合成的技術。最近,擴散模型因其強大的生成能力而聞名,因此本文作者希望通
    的頭像 發表于 01-08 14:55 ?1401次閱讀
    基于DiAD擴散<b class='flag-5'>模型</b>的<b class='flag-5'>多</b>類<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>工作
    主站蜘蛛池模板: 俺去啦最新网址| 日本久久黄色| 九九热在线观看| 色黄视频网站| 日本黄视频在线观看| 91久久婷婷国产综合精品青草| 国产一区二区三区波多野吉衣| 欧美午夜剧场| 你懂的网址免费国产| 午夜精品视频在线看| videosxxoo18欧美| 色男人网| 在线免费国产| 2345成人高清毛片| 日韩日韩| 天堂最新在线资源| 狠狠色噜噜狠狠狠狠2021天天| 欧美性色欧美a在线观看| 偷操| 久久思re热9一区二区三区| 久久久噜噜噜久久| 黄 色 成 年人在线| 亚洲va久久久噜噜噜久久| 成人做视频免费| baoyu777永久免费视频| 日本免费成人| 美女被免网站在线视频| 一级特一级特色生活片| 成年人网站免费观看| xxxx欧美xxxx黑人| 欧美日本色| 黄网在线免费观看| 天天噜噜噜| 亚洲aa视频| 99热最新网址| 成人性视屏| 婷婷在线免费观看| 黄色短视频免费观看| 黄色欧美网站| 激情五月婷婷综合网| 欧美系列在线播放|