根據PLOS One上發表的一項研究,在對50萬英國生物銀行參與者的研究中,包括深度學習和隨機森林在內的機器學習方法極大地提高了諾丁漢大學團隊預測過早死亡的能力。
該研究由助理教授兼研究科學家Stephen F. Weng博士率先進行,旨在通過開發和報告新穎的預后模型以補充現有技術,將機器學習整合到傳統的流行病學工作中。兩年前,同一團隊報告發現機器學習模型可以將心血管疾病預測的準確性提高約3.6%。
Weng和合著者寫道:“在大數據時代,機器學習可以潛在地改變醫療保健,提供診斷評估方法并個性化與臨床醫生同等或優于臨床醫生的個性化治療決策,這令人非常樂觀?!?“使用機器學習開發的應用程序和算法所面臨的挑戰不僅是增強傳統方法可以實現的目標,而且還要以類似透明和可復制的方式開發和報告它們?!?/p>
對于他們目前的工作,研究人員考慮了502,628名40至69歲的成年人,他們的健康信息已于2006年至2010年期間記錄在UK Biobank中。他們使用人口統計學數據并考慮到生物特征識別,臨床和生活方式因素,開發了預測死亡率模型,學習,隨機森林和Cox回歸。
根據研究小組的結果,將近3%的研究人群在累計隨訪3,508,454人年期間死亡,并且死亡率數據與國家記錄相符?;谀挲g和性別的Cox模型(一種傳統的風險預測方法)具有最小的預測性,曲線下面積(AUC)為0.689,其次是多變量Cox回歸模型,該模型可將6.2%的辨別力提高AUC為0.751。
應用隨機森林進一步將判別力提高了3.2%,AUC達到0.783,深度學習模型最成功,從多元Cox回歸方法獲得的辨別力為0.790,再提高了3.9%的判別力。
兩種機器學習算法(分別是隨機森林和深度學習)與準年齡和性別Cox回歸模型相比,分別提高了9.4%和10.1%的辨別力。雖然兩種機器學習方法都達到了相似的判別水平并進行了很好的校準,但Cox回歸模型始終高估了風險。
“研究表明,使用機器學習來探索各種個體臨床,人口統計學,生活方式和環境風險因素的價值,以產生使用標準方法無法實現的新穎而整體的模型,” Weng等人。說過。“這項工作表明,在開發用于預后或診斷的模型時,應更常規地考慮使用機器學習?!?/p>
這組作者說,下一步包括在更廣泛的人群中驗證這些方法,并將其集成到醫療保健系統中,以及探索其他機器學習模型(例如支持向量機或梯度提升)如何參與風險預測。
他們寫道:“機器學習模型組成的有趣變化可以為潛在的重大風險因素提供新的假設生成,否則這些風險因素將無法被發現?!?“然后,可以專門設計流行病學研究,并相應地進行驗證,以驗證這些信號?!?/p>
-
醫療保健
+關注
關注
4文章
316瀏覽量
30768 -
機器學習
+關注
關注
66文章
8438瀏覽量
132989
發布評論請先 登錄
相關推薦
評論