在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

哈工大提出Myriad：利用視覺專家進行工業異常檢測的大型多模態模型

一句話總結

通過應用視覺專家進行工業異常檢測，以實現明確的異常檢測和高質量的異常描述，還可進行多輪對話，性能表現出色！優于AnomalyGPT等網絡，代碼即將開源！

Myriad

Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection

單位：哈工大(左旺孟團隊), 琶洲實驗室

論文：https://arxiv.org/abs/2310.19070

代碼：https://github.com/tzjtatata/Myriad

現有的工業異常檢測（IAD）方法可以預測異常檢測和定位的異常分數。然而，它們很難對異常區域進行多輪對話和詳細描述，例如工業異常的顏色、形狀和類別。

最近，大型多模態（即視覺和語言）模型（LMM）在圖像描述、視覺理解、視覺推理等多種視覺任務上表現出了卓越的感知能力，使其成為更易于理解的異常檢測的有競爭力的潛在選擇。然而，現有的通用 LMM 中缺乏有關異常檢測的知識，而訓練特定的 LMM 進行異常檢測需要大量的注釋數據和大量的計算資源。

本文提出了一種新穎的大型多模態模型，通過應用視覺專家進行工業異常檢測（稱為Myriad），從而實現明確的異常檢測和高質量的異常描述。

具體來說，采用 MiniGPT-4 作為基礎 LMM，并設計一個專家感知模塊，將視覺專家的先驗知識嵌入到大型語言模型（LLM）可以理解的標記中。

為了彌補視覺專家的錯誤和困惑，引入了域適配器來彌合通用圖像和工業圖像之間的視覺表示差距。此外，提出了一個視覺專家講師，它使 Q-Former 能夠根據視覺專家先驗生成 IAD 領域視覺語言標記。

實驗結果

在MVTec-AD 和 VisA 基準上的大量實驗表明，本文提出的方法不僅在 1-class 和少樣本設置下比最先進的方法表現更好，而且還提供了明確的異常預測以及 IAD 中的詳細描述領域。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

模型

模型

+關注

關注
1

文章
3244

瀏覽量
48845
視覺

視覺

+關注

關注
1

文章
147

瀏覽量
23950
大模型

大模型

+關注

關注
2

文章
2451

瀏覽量
2714

原文標題：工業異常檢測大模型來了！哈工大提出Myriad：利用視覺專家進行工業異常檢測的大型多模態模型

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關注！文章轉載請注明出處。

商湯日日新多模態大模型權威評測第一

剛剛，商湯科技日日新SenseNova多模態大模型，在權威綜合評測權威平臺OpenCompass的多模態評測中取得榜單第一。

發表于 12-20 10:39 ?191次閱讀

一文理解多模態大語言模型——下

/understanding-multimodal-llms ? 《一文理解多模態大語言模型 - 上》介紹了什么是多模態大語言

發表于 12-03 15:18 ?129次閱讀

一文理解<b class='flag-5'>多</b><b class='flag-5'>模態</b>大語言<b class='flag-5'>模型</b>——下

利用OpenVINO部署Qwen2多模態模型

多模態大模型的核心思想是將不同媒體數據（如文本、圖像、音頻和視頻等）進行融合，通過學習不同模態之間的關聯，實現更加智能化的信息處理。簡單來說

發表于 10-18 09:39 ?440次閱讀

華工科技聯合哈工大實現國內首臺激光智能除草機器人落地

華工科技黨委書記、董事長、總裁馬新強一行赴哈爾濱對哈爾濱工業大學機器人技術與系統全國重點實驗室（后簡稱哈工大機器人實驗室）、愛輝區智能激光除草機器人試點基地進行實地調研，代表華工科技中央研究院同

發表于 09-06 10:45 ?806次閱讀

云知聲推出山海多模態大模型

在人工智能技術的浩瀚星海中，多模態交互技術正成為引領未來的新航標。繼OpenAI的GPT-4o掀起滔天巨浪后，云知聲以創新之姿，推出了其匠心獨運的山海多模態大

發表于 08-27 15:20 ?394次閱讀

依圖多模態大模型伙伴CTO精研班圓滿舉辦

大模型在不同行業領域的應用前景;7月19日， “依圖科技多模態大模型伙伴CTO精研班”在杭州圓滿舉辦，讓更多的伙伴們深度體驗了依圖多

發表于 07-23 15:16 ?422次閱讀

聆思CSK6視覺語音大模型AI開發板入門資源合集（硬件資料、大模型語音/多模態交互/英語評測SDK合集）

豐富外設配件配套多模態應用示例，支持快速上手體驗大模型語音交互、智能視覺等 AI 應用板載 DAPLINK 調試器，外接一條USB 線即可實現燒錄、調試、串口日志查看板載網絡模組

發表于 06-18 17:33

智譜AI發布全新多模態開源模型GLM-4-9B

近日，智譜AI在人工智能領域取得重大突破，成功推出全新開源模型GLM-4-9B。這款模型以其卓越的多模態能力，再次刷新了業界對于大型語言

發表于 06-07 09:17 ?746次閱讀

商湯科技發布5.0多模態大模型，綜合能力全面對標GPT-4 Turbo

場景應用需求；升級“日日新SenseNova 5.0”大模型體系，綜合能力全面對標GPT-4 Turbo。此外對于文生視頻徐立也表示商湯科技很快就會發布相關的平臺產品。備受矚目的商湯科技“日日新SenseNova” 5.0多模態

發表于 04-24 16:49 ?1110次閱讀

李未可科技正式推出WAKE-AI多模態AI大模型

文本生成、語言理解、圖像識別及視頻生成等多模態交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺+語音打造新一代 LLM-Based的自然交互，同時多

發表于 04-18 17:01 ?601次閱讀

蘋果發布300億參數MM1多模態大模型

近日，科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中，正式公布了其最新的多模態大模型研究成果——MM1。這款具有高達300億參數的多

發表于 03-19 11:19 ?901次閱讀

螞蟻推出20億參數多模態遙感模型SkySense

據了解，負責開發的百靈團隊利用自身擁有的19億遙感影像數據集進行了預訓練，從而生成了具有20.6億參數的SkySense大模型。官方稱其為全球范圍內參數規模最大、任務覆蓋最全且識別精度最高的多

發表于 02-28 15:53 ?674次閱讀

韓國Kakao宣布開發多模態大語言模型“蜜蜂”

韓國互聯網巨頭Kakao最近宣布開發了一種名為“蜜蜂”(Honeybee)的多模態大型語言模型。這種創新模型能夠同時理解和處理圖像和文本數據

發表于 01-19 16:11 ?699次閱讀

機器人基于開源的多模態語言視覺大模型

ByteDance Research 基于開源的多模態語言視覺大模型 OpenFlamingo 開發了開源、易用的 RoboFlamingo 機器人操作

發表于 01-19 11:43 ?422次閱讀

基于DiAD擴散模型的多類異常檢測工作

現有的基于計算機視覺的工業異常檢測技術包括基于特征的、基于重構的和基于合成的技術。最近，擴散模型因其強大的生成能力而聞名，因此本文作者希望通

發表于 01-08 14:55 ?1401次閱讀

CVer
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot DDFM：首個使用擴散模型進行多模態圖像融合的方法
Hot DepGraph：任意架構的結構化剪枝，CNN、Transformer、GNN等都適用！

New SegVG視覺定位方法的各個組件
New 詳解E2E-MFD多模態融合檢測端到端算法

精選推薦
更多

文章

資料

帖子

2024過去了，留下十個科技記憶

腦極體
1天前

705 閱讀

兩款VR頭顯大拆解，都用了哪些芯片？

拍明芯城
1天前

527 閱讀

屏蔽柵MOSFET技術簡介

翠展微電子
1天前

480 閱讀

基于LKS32MC07x系列MCU的超高速清潔電器解決方案

晶豐明源
1天前

521 閱讀

基于瑞薩電子RA6T2 MCU的電機控制讓吸塵器更智能

瑞薩MCU小百科
1天前

417 閱讀

iec標準與gb標準對照表

遠風
165

10積分

66下載

C語言與匯編語言混合編程淺析

yezi888
202 KB

免費

78下載

Tool-Chicken-Chat工具雞聊天室

李娟
3.58 MB

2積分

3下載

lim跨平臺網絡通信框架

李平
4.03 MB

2積分

1下載

電子設計自動化導論

常亮
1.96 MB

1積分

3下載

【飛凌嵌入式OK3588J-C開發板體驗】OK3588J-C開發板的ffmpeg編解碼、HDMI輸入及編碼

dutong0321
2天前

501 閱讀

采集值突然驟降

塵埃sawdsa
1天前

541 閱讀

2024 電機控制年度技術分享會來啦！！！

ElecFans小喇叭
2天前

723 閱讀

[廣東龍芯2K1000/2K500開發板] OpenWRT 使用說明

jf_38522704
10月前

5648 閱讀

使用單片機驅動DAC088S085無反應

jf_68383328
2天前

945 閱讀

推薦專欄
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

哈工大提出Myriad：利用視覺專家進行工業異常檢測的大型多模態模型

評論

商湯日日新多模態大模型權威評測第一

一文理解多模態大語言模型——下

利用OpenVINO部署Qwen2多模態模型

華工科技聯合哈工大實現國內首臺激光智能除草機器人落地

云知聲推出山海多模態大模型

依圖多模態大模型伙伴CTO精研班圓滿舉辦

聆思CSK6視覺語音大模型AI開發板入門資源合集（硬件資料、大模型語音/多模態交互/英語評測SDK合集）

智譜AI發布全新多模態開源模型GLM-4-9B

商湯科技發布5.0多模態大模型，綜合能力全面對標GPT-4 Turbo

李未可科技正式推出WAKE-AI多模態AI大模型

蘋果發布300億參數MM1多模態大模型

螞蟻推出20億參數多模態遙感模型SkySense

韓國Kakao宣布開發多模態大語言模型“蜜蜂”

機器人基于開源的多模態語言視覺大模型

基于DiAD擴散模型的多類異常檢測工作