穿越小说完本 ,好看的电视剧,古风小说君子以泽

今天，吳恩達發推公布了斯坦福發布的兩個大型的醫療數據集公開：CheXpert和MIMIC-CXR。其中，CheXpert內含224316X光胸部圖片，MIMIC-CXR內含371,920張帶標簽的圖片。兩個數據集的數據量級和標注精準度都非常高，可以說是造福了一大批相關從業者了。

數據集下載方式

先給出數據集介紹的地址和下載方式。

https://stanfordmlgroup.github.io/competitions/chexpert/

因為是醫學數據集，斯坦福采取了相對謹慎的態度。根據說明，用戶需要遵守下載規則，填寫資料然后通過電子郵件給出的鏈接進行下載。為了保持數據集的完整性以及有效性，嚴禁進行“濫用”分享。

數據集概況

CheXpert數據集里面有224316張胸部X光圖片，共涉及65,240名患者。數據集的時間跨度為2002年10月到2017年7月，都是患者在斯坦福醫院進行胸部X光檢查之后的留存。除此之外，數據集還附有相關的放射學報告。

如何為CheXpert數據集打標簽

每份報告都對14項觀察進行標記，標記可能是陽性，陰性或不確定性。

14項觀察是根據報告中的流行程度和臨床相關性確定的，并在適用的情況下符合Fleischner Society推薦的術語表。

此外，還開發了一種基于規則的自動貼標機，用于從放射學報告中提取觀察結果，用作圖像的結構化標簽。貼標機工作分為三個不同的階段：提及提取，提及分類和提及聚合。

自動貼標機github地址：

https://github.com/stanfordmlgroup/chexpert-labeler

在提及提取階段，貼標機從放射學報告的“印象”部分的觀察列表中提取提及，這一部分總結了放射研究中的關鍵發現。在提及分類，則是用每一個提及來分類，把觀察到的歸類為陰性的，不確定的或陽性的。在提到聚合階段，使用每次提及觀察的分類，就會得到14個觀察的最終標簽。

基準模型

基準模型采用以單視角胸片作為輸入，并輸出14次觀測中每一次的概率。當多個視圖可用的時候，模型給出最大概率。

利用不確定性標簽

數據集中的訓練數據集的標簽分別為0、1或u。其中，0表示負，1表示正，u表示不確定。在模型訓練中，使用了不確定性標簽的不同方法。

U-Ignore：在訓練期間忽略了不確定的標簽。

U-Zeroes：將不確定標簽的所有實例映射到0。

U-Ones：將不確定標簽的所有實例映射到1。

U-SelfTrained：首先使用U-Ignore方法訓練模型進行收斂，然后使用該模型進行預測，利用模型輸出的概率預測重新標記每個不確定性標簽。

U-MultiClass：將不確定性標簽視為自己的類別。

專注于評估5項觀察，進行“競爭任務”，根據臨床經驗和患病率分為：（a）肺不張，（b）心臟擴大，（c）肺實變，（d）水腫（e）胸腔積液。通過比較了不同不確定性方法在200個研究的驗證集上的表現，其中三個放射科醫師的注釋作為基礎事實。基準模型根據驗證集上每個競賽任務的最佳表現方法選擇的：U- Ones用于肺不張和水腫，U-MultiClass用于心臟擴大和胸腔積液，U-SelfTrained用于肺實變。

測試集如何設計

CheXpert中的測試集由來自500“未知”患者的500張X光胸片組成。八名權威認證的放射科醫師分別對測試集中的每張圖片進行了注釋。他們將每張圖片標記為：現存（present）、不確定（uncertain likely）、不可能（uncertain unlikely）和缺失（absent）。

然后將標簽二值化，將現存和不確定病例視為陽性，而缺失和不可能病例視為陰性。根據5位專家的投票確定圖片標簽，然后用剩下的三位專家檢驗五位專家的表現。

基準模型在測試集上表現如何

該模型在胸腔積液（0.97）上達到最佳AUC，在肺不張（0.85）上達到最差。所有其他觀測的AUC至少為0.9。在心臟擴大，水腫和胸腔積液上，該模型比所有3位放射科醫師獲得更高的表現，但卻不是他們的多數投票。在肺實變方面，模型性能超過3位放射科醫師中的2位，而在Atelectasis上，所有3位放射科醫師的表現均優于模型。

與麻省理工學院的聯合發布MIMIC-CXR數據集

此外還有和MIMIC-CXR共同發布包含371,920張胸部X射線圖片的大型數據集。該數據集的時間跨度為2011年~2016年。這些數據與Beth Israel Deaconess醫療中心的227,943個影像學研究相關。每個成像研究可能包含一個或多個圖像，但一般是兩個圖像：正面視圖和側視圖。

相關論文下載地址：https://arxiv.org/pdf/1901.07042.pdf

圖像提供有14個標簽，這些標簽來自放射學報告的自然語言處理工具。CheXpert數據集和MIMIC-CXR共享一個共同的貼標機，CheXpert貼標機，用于從放射學報告中獲取相同的標簽集。

最后展望

阻礙胸部X光片解釋模型發展之一是，缺乏具有強放射學家注釋的地面真實性和專家評分的數據集。研究人員可以根據這些數據對其模型進行比較。希望CheXpert將填平這一溝谷，以便在臨床重要任務中隨時跟蹤模型的進展。

此外，吳恩達團隊本次開發并開源了CheXpert貼標機，這是一種基于規則的自動貼標機，用于從自由文本放射學報告中提取觀察結果，用作圖像的結構化標簽。我們希望這可以幫助其他機構輕松地從報告中提取結構化標簽，并發布其他大型數據庫，以便對醫學成像模型進行跨機構測試。

最后，斯坦福也作出展望，希望該數據集能夠幫助開發和驗證胸部X光片解釋模型，以改善全球醫療服務的獲取和交付。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

MIT

MIT

+關注

關注
3

文章
253

瀏覽量
23440
數據集

數據集

+關注

關注
4

文章
1209

瀏覽量
24789

原文標題：斯坦福聯合MIT，發布兩類巨大量級X光胸片數據集

文章出處：【微信號：BigDataDigest，微信公眾號：大數據文摘】歡迎添加關注！文章轉載請注明出處。

上能電氣助力巴基斯坦綠色發展

近日，上能電氣在巴基斯坦拉合爾成功舉辦交流晚宴。超過260位來自行業內的專業人士和思想領袖出席本次活動，共同探討巴基斯坦光伏市場發展趨勢及其蘊藏的巨大增長機遇。

發表于 12-18 14:36 ?246次閱讀

斯坦福STANFORD FS725銣鐘

斯坦福STANFORD FS725銣鐘 SRS斯坦福FS725 10MHzRb頻率標準 ? SRS斯坦福FS72510MHzRb頻率標準FS725集成了一個銣振蕩器（SRS模型PRS1

發表于 12-13 15:22 ?124次閱讀

斯坦福研究：電動汽車電池實際壽命比預估長得多

。這項研究是由斯坦福大學的普考特能源研究所與美國SLAC國家加速器實驗室共同成立的SLAC-斯坦福電池研究中心的科學家們完成的。經過超過兩年的時間，他們對92種商用鋰離子電池進行了詳盡的充放電測試。結果顯示，當放電模式模擬真

發表于 12-11 17:24 ?314次閱讀

STANFORD斯坦福SR830 鎖相放大器

原裝STANFORD斯坦福SR830 鎖相放大器鎖相放大器是一種對交變信號進行相敏檢波的放大器。鎖相放大器利用和被測信號有相同頻率和相位關系的參考信號作為比較基準，只對被測信號本身和那些與參考信號

發表于 11-23 16:38 ?193次閱讀

國產儀器崛起：斯坦福替代方案來了！

眾所周知，斯坦福的東西一直以來，好用，貴，貨期長動輒幾個月，很苦惱今天，他來了，他的替代來了首先是最經典的型號斯坦福SR830，它的頻率可以達到102.4 kHz ，18位的ADC，采樣率可以

發表于 07-10 17:05 ?417次閱讀

斯坦福團隊抄襲國產大模型，主要責任人失聯

的廣泛關注，也讓大家對于開源大模型的規范使用更加擔憂。 斯坦福Llama3V模型被證實抄襲 5月29日，斯坦福大學的一個AI團隊在Github等平臺發布了一款大模型，名為Llama3V，該模型的亮點是據稱

發表于 06-05 00:10 ?2628次閱讀

斯坦福大學研發全新AI輔助全息成像技術

據最新消息，斯坦福大學的研究人員成功研制出全新AI輔助全息成像技術，其薄度、重量及質量均超過了當前方案，有望推動增強現實（AR）眼鏡領域的發展。

發表于 05-10 14:48 ?613次閱讀

斯坦福發布《2024 AI指數報告》

近日，斯坦福大學以人為本人工智能研究所（StanfordHAI）發布了《2024年人工智能指數報告》（ArtificialIntelligenceIndexReport2024）。據

發表于 04-18 08:28 ?803次閱讀

<b class='flag-5'>斯坦福</b><b class='flag-5'>發布</b>《2024 AI指數報告》

斯坦福、伯克利大神教授創業給機器人造大腦，OpenAI紅杉搶著投5億

還記得曾火遍全網的ALOHA家務機器人嗎？最近該項目導師，斯坦福計算機科學與電氣工程系教授ChelseaFinn在X宣布，正式與其他幾位伯克利大牛學者、谷歌DeepMind科學家共同創業，全力為

發表于 04-14 08:04 ?135次閱讀

<b class='flag-5'>斯坦福</b>、伯克利大神教授創業給機器人造大腦，OpenAI紅杉搶著投5億

廣和通發布基于高通高算力芯片的具身智能機器人開發平臺Fibot

3月29日，為助力機器人廠商客戶快速復現及驗證斯坦福Mobile ALOHA機器人的相關算法，廣和通發布具身智能機器人開發平臺Fibot。

發表于 03-29 11:16 ?741次閱讀

廣和通發布具身智能機器人開發平臺Fibot

為幫助機器人制造商更高效地復現和驗證斯坦福Mobile ALOHA機器人的先進算法，廣和通公司近日發布了全新的具身智能機器人開發平臺——Fibot。這款平臺被視為國內首款Mobile ALOHA機器人的升級版，它在設計和功能上均實現了顯著的提升。

發表于 03-29 09:29 ?830次閱讀

SRS斯坦福850~鎖相放大器維修

放大器示波器儀器儀表

安泰儀器維修

發布于 :2024年03月25日 10:40:48

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

斯坦福攜手MIT發布巨大量級X光胸片數據集

評論