在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新型transformer模型實現3D醫學圖像分析最新基準

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-08-15 15:01 ? 次閱讀

計算機視覺和模式識別會議( CVPR )上, NVIDIA 研究人員發表了 35 多篇論文。這包括對 移動窗口 UNEt TRansformers ( Swin-UNETR )的研究,這是第一個基于變壓器的預訓練框架,專為 3D 醫學圖像分析中的自我監督任務而設計。這項研究是創建用于數據注釋的預訓練、大規模和自監督三維模型的第一步。

作為一種基于 transformer 的計算機視覺方法, Swin UNETR 采用了 MONAI ,這是一種開源的 PyTorch 框架,用于深入學習醫療成像,包括放射學和病理學。使用這種預訓練方案, Swin UNETR 為各種醫學圖像分割任務設定了新的最先進的基準,并一致證明了其有效性,即使只有少量的標記數據。

Swin UNETR 模型培訓

Swin UNETR 模型在 NVIDIA DGX-1 集群 使用八個 GPUAdamW 優化算法。對 5050 張來自健康和不健康受試者不同身體部位的公開 CT 圖像進行預訓練,以保持數據集的平衡。

對于 3D Swin transformer 編碼器的自我監督預訓練,研究人員使用了各種借口任務。隨機裁剪的標記使用不同的變換(如旋轉和剪切)進行增強。這些標記用于掩蔽體修復、旋轉和對比學習,用于編碼器學習訓練數據的上下文表示,而不會增加數據注釋的負擔。

pYYBAGL571-AKsH1AALchbVmfMI713.png

圖 1 :。預培訓框架概述。輸入的 CT 圖像被隨機裁剪成子體積,并通過隨機內部剪切和旋轉進行增強,然后作為輸入饋送到 Swin-UNETR 編碼器

Swin UNETR 背后的技術

Swin Transformers 采用分層視覺 transformer ( ViT )進行非重疊窗口的局部自我注意計算。這打開了為大型公司創建醫療專用 ImageNet 的機會,消除了創建醫療 AI 模型需要大量高質量注釋數據集的瓶頸。

與 CNN 體系結構相比, ViT 在從未標記數據(數據集越大,預訓練主干越強)進行全局和局部表示的自監督學習方面表現出非凡的能力。用戶可以在下游任務(例如,分割、分類和檢測)中使用極少量的標記數據微調預訓練模型。

這種體系結構在本地窗口中計算自我注意,與 ViT 相比表現出更好的性能。此外, Swin Transformers 的層次性使其非常適合需要多尺度建模的任務。

繼領先的 UNETR 模型成功使用直接使用 3D 補丁嵌入的基于 ViT 的編碼器之后, Swin UNETR 使用了具有金字塔結構的 3D Swin transformer 編碼器。

在 Swin UNETR 的編碼器中,由于計算簡單的全局自我注意對于高分辨率特征地圖是不可行的,因此在本地窗口中計算自我注意。為了增加局部窗口以外的感受野,使用窗口移位來計算不同窗口的區域相互作用。

Swin UNETR 的編碼器通過跳過連接以五種不同的分辨率連接到剩余的類似 UNet 的解碼器。它可以為密集的預測任務(如醫學圖像分割)捕獲多尺度特征表示。

Swin UNETR 模型性能

在對 CT 中的 13 個腹部器官和 醫學分段十項全能( MSD ) 數據集中的分割任務使用 超越顱穹窿( BTCV )分割挑戰 進行微調后,該模型在公共排行榜上達到了最先進的精度。

BTCV

在 BTCV 中, SwinUnetr 的平均骰子數為 0.918 ,優于其他排名靠前的模型。

pYYBAGL572iAYS0KAAFJcNkiNbo915.png

圖 2 :。 BTCV 挑戰多器官分割排行榜骰子結果

對于較小的器官,如脾靜脈和門靜脈( 3.6% )、胰腺( 1.6% )和腎上腺( 3.8% ),與之前的最先進方法相比,有了改進小器官數據標簽分割對于放射科醫生來說是一項極其困難的任務。

通訊簿標簽

在 MSD 中, Swin UNETR 在腦腫瘤、肺、胰腺和結腸方面取得了最先進的表現。心臟、肝臟、海馬、前列腺、肝血管和脾臟的結果具有可比性。總的來說, Swin UNETR 在所有 10 項任務中的平均骰子率為 78.68% ,是最好的,并在 MSD 排行榜上排名第一。

pYYBAGL573OASYJ5AAUqdCVicy0245.png

圖 4 :。使用 MSD 數據集進行肝血管分割任務的定性輸出。你可以看到, Swin UNETR 比 SOTA DiNTS 跑贏了 3% 。這一變化很重要,因為它會導致更準確的分段輸出

與DiNTS(一種用于醫學圖像分割的強大AutoML方法)相比,Swin UNETR使用更少的訓練時間,顯示出更好的分割性能。例如,肝血管分割任務的定性分割輸出證明了Swin UNETR能夠更好地建模長期空間依賴性。

pYYBAGL574GAYNO0AAIuPO-qS8I870.png

圖 5 :。 Swin UNETR 模型體系結構由一個 Swin transformer 編碼器組成,該編碼器使用 3D 補丁,并通過不同分辨率的跳過連接連接到基于 CNN 的解碼器

結論

Swin UNETR 體系結構在使用變壓器的醫療成像方面提供了急需的突破。鑒于醫學成像需要快速構建準確的模型, Swin UNETR 體系結構使數據科學家能夠對大量未標記數據進行預訓練。這減少了放射科醫生、病理學家和其他臨床團隊進行專家注釋的成本和時間。這里我們展示了用于器官檢測和自動體積測量的 SOTA 分割性能。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3646

    瀏覽量

    134657
  • 計算機
    +關注

    關注

    19

    文章

    7511

    瀏覽量

    88078
收藏 人收藏

    評論

    相關推薦

    Google DeepMind發布Genie 2:打造交互式3D虛擬世界

    的交互式體驗。 據了解,Genie 2是一個自回歸潛在擴散模型,它基于大型視頻數據集進行訓練。通過自動編碼器,視頻中的潛在幀被傳遞到大型Transformer動力學模型中。該模型采用與
    的頭像 發表于 12-05 14:16 ?492次閱讀

    安寶特產品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠
    的頭像 發表于 08-07 10:13 ?389次閱讀
    安寶特產品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級<b class='flag-5'>分析</b>工具

    安寶特產品 3D Evolution : 基于特征實現無損CAD格式轉換

    安寶特3D Evolution具有強大的3D CAD模型轉換功能,可在保留模型特征參數、注釋、約束的前提下,完成不同格式3D CAD
    的頭像 發表于 08-06 17:26 ?343次閱讀
    安寶特產品   <b class='flag-5'>3D</b> Evolution : 基于特征<b class='flag-5'>實現</b>無損CAD格式轉換

    裸眼3D筆記本電腦——先進的光場裸眼3D技術

    效果的用戶,這款筆記本電腦都能滿足你的需求。 一、卓越的3D模型設計能力 英倫科技裸眼3D筆記本電腦采用最新的光場裸眼3D技術,使用戶無需佩戴3D
    的頭像 發表于 07-16 10:04 ?561次閱讀

    Transformer語言模型簡介與實現過程

    任務,隨后迅速擴展到其他NLP任務中,如文本生成、語言理解、問答系統等。本文將詳細介紹Transformer語言模型的原理、特點、優勢以及實現過程。
    的頭像 發表于 07-10 11:48 ?1783次閱讀

    使用PyTorch搭建Transformer模型

    Transformer模型自其問世以來,在自然語言處理(NLP)領域取得了巨大的成功,并成為了許多先進模型(如BERT、GPT等)的基礎。本文將深入解讀如何使用PyTorch框架搭建Trans
    的頭像 發表于 07-02 11:41 ?1665次閱讀

    烘焙vs渲染:3D模型制作中的效率與質量之爭

    3D建模和渲染領域,模型烘焙(Baking)和模型渲染(Rendering)是兩個經常被提及的概念。盡管它們都與最終圖像的生成有關,但它們在技術
    的頭像 發表于 05-12 08:27 ?468次閱讀
    烘焙vs渲染:<b class='flag-5'>3D</b><b class='flag-5'>模型</b>制作中的效率與質量之爭

    ad19中3d模型不顯示?

    封裝庫導入3d模型不顯示,但導入3d模型后的封裝庫生成pcb文件時顯示3d模型,這是什么原因導致
    發表于 04-24 13:41

    包含具有多種類型信息的3D模型

    三維視圖。事實上,AE可以在將3D BIM模型元素與時間因素聯系起來后創建4D模型,從而更廣泛地進行產品的可視化預覽,更精確地分析建筑項目的
    發表于 03-28 17:18

    NVIDIA生成式AI研究實現在1秒內生成3D形狀

    NVIDIA 研究人員使 LATTE3D (一款最新文本轉 3D 生成式 AI 模型實現雙倍加速。
    的頭像 發表于 03-27 10:28 ?510次閱讀
    NVIDIA生成式AI研究<b class='flag-5'>實現</b>在1秒內生成<b class='flag-5'>3D</b>形狀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關注。此模型具備從單張圖像
    的頭像 發表于 03-22 10:30 ?864次閱讀

    Adobe提出DMV3D3D生成只需30秒!讓文本、圖像都動起來的新方法!

    因此,本文研究者的目標是實現快速、逼真和通用的 3D 生成。為此,他們提出了 DMV3D。DMV3D 是一種全新的單階段的全類別擴散模型,能
    的頭像 發表于 01-30 16:20 ?873次閱讀
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!讓文本、<b class='flag-5'>圖像</b>都動起來的新方法!

    高分工作!Uni3D3D基礎大模型,刷新多個SOTA!

    我們主要探索了3D視覺中scale up模型參數量和統一模型架構的可能性。在NLP / 2D vision領域,scale up大模型(GP
    的頭像 發表于 01-30 15:56 ?896次閱讀
    高分工作!Uni<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>基礎大<b class='flag-5'>模型</b>,刷新多個SOTA!

    友思特C系列3D相機:實時3D點云圖像

    3D相機
    虹科光電
    發布于 :2024年01月10日 17:39:25

    如何搞定自動駕駛3D目標檢測!

    可用于自動駕駛場景下基于圖像3D目標檢測的數據集總結。其中一些數據集包括多個任務,這里只報告了3D檢測基準(例如KITTI 3D發布了超過
    發表于 01-05 10:43 ?592次閱讀
    如何搞定自動駕駛<b class='flag-5'>3D</b>目標檢測!
    主站蜘蛛池模板: 免费色黄网站| 诱人的老师bd高清日本在线观看 | 久久中文字幕综合婷婷| 中文字幕亚洲综合久久2| 大喷水吹潮magnet| 国产午夜在线视频| 午夜影院a| 国产国产人免费人成免费视频| 国产精品天天爽夜夜欢张柏芝| 在线视频综合网| 欧美成人 色 图| 亚洲第一在线视频| 成人www视频| 黄 色 片 在 线 看| 广东毛片| 天天搞夜夜| 国产成人综合自拍| 亚洲一区二区三区四| 神马影院午夜dy888| 亚洲一区二区三区在线| 在线网站你懂得| 日本永久免费| 特黄特黄视频| 免费看吻胸亲嘴激烈网站| 国产激烈床戏无遮挡在线观看| 亚洲情a成黄在线观看动| 加勒比黑人喝羽月希奶水 | 日日噜噜噜夜夜爽爽狠狠| 老色批在线播放视频网站免费| 成人精品人成网站| 奇米4色| 亚洲人成网站色7799在线观看| 亚洲免费二区三区| 婷婷综合久久中文字幕| 亚洲成在线观看| 欧美色综合网站| 男人的天堂视频网站清风阁| 免费人成在线观看网站| www天堂在线观看| 91一区二区三区四区五区| 欧美黑人换爱交换乱理伦片|