IgA腎病的長(zhǎng)期預(yù)后風(fēng)險(xiǎn)預(yù)測(cè)一直是醫(yī)學(xué)界的難題。近日,中國(guó)學(xué)者在腎臟病頂級(jí)期刊《美國(guó)腎臟病雜志》(AJKD) 上發(fā)表論文,介紹了如何利用AI技術(shù),改善對(duì)IgA腎病的長(zhǎng)期預(yù)后風(fēng)險(xiǎn)預(yù)測(cè)。這是全球第一篇發(fā)表在腎臟病頂級(jí)期刊上的AI疾病預(yù)測(cè)論文。
中國(guó)大約有1.2億慢性腎病(CKD)患者。其中有一種最常見的腎病,它的病因尚不完全清楚,且其遠(yuǎn)期預(yù)后非常不理想。它就是 IgA 腎?。↖gA nephropathy,IgAN),是全球范圍內(nèi)發(fā)病率最高的原發(fā)性腎小球疾病之一,在亞洲人群中發(fā)病率尤高。
IgA腎病的遠(yuǎn)期預(yù)后不佳,10?25 年內(nèi) 30?40% 的患者會(huì)進(jìn)入終末期腎?。I衰竭)。終末期腎病患者通常需要進(jìn)行透析或腎移植治療,人均治療花費(fèi)10-15萬(wàn)元/年,這給個(gè)人、家庭和社會(huì)帶來(lái)了沉重的負(fù)擔(dān)。因此,如何準(zhǔn)確地對(duì)IgA腎病患者的預(yù)后風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),對(duì)于指導(dǎo)患者的個(gè)體化預(yù)防、治療和管理,以及相關(guān)臨床研究具有重要的意義。
近日,國(guó)家腎臟疾病臨床醫(yī)學(xué)研究中心(東部戰(zhàn)區(qū)總醫(yī)院)、平安醫(yī)療科技、IBM中國(guó)研究院聯(lián)合在腎臟病頂級(jí)期刊《美國(guó)腎臟病雜志》(AJ?D)上發(fā)表論文《IgA腎病的腎臟終點(diǎn)預(yù)測(cè)和風(fēng)險(xiǎn)分層》,介紹了如何利用 AI 技術(shù),改善對(duì)IgA腎病的長(zhǎng)期預(yù)后風(fēng)險(xiǎn)預(yù)測(cè)。陳聽雨、李響、李映雪、夏爾玉、秦勇、梁少姍、徐峰、梁丹丹、曾彩虹、劉志紅等人是論文的貢獻(xiàn)者。
研究人員將 AI 算法與統(tǒng)計(jì)分析方法相結(jié)合,建立了一套精準(zhǔn)、可解釋、臨床實(shí)用的 IgA 腎病患者預(yù)后風(fēng)險(xiǎn)預(yù)測(cè)系統(tǒng)。據(jù)悉,這是全球第一篇發(fā)表在腎臟病頂級(jí)期刊上的 AI 疾病預(yù)測(cè)論文。
長(zhǎng)期隨訪患者數(shù)據(jù),機(jī)?學(xué)習(xí)方法構(gòu)建模型
既往研究發(fā)現(xiàn)影響 IgAN 預(yù)后的多項(xiàng)危險(xiǎn)因素,包括基線尿蛋白 > 1g/d、高血壓、腎功能不全、高尿酸血癥、男性、嚴(yán)重病理評(píng)分等,并在此基礎(chǔ)上建立了多種預(yù)測(cè) IgAN 預(yù)后的評(píng)分系統(tǒng),但這些評(píng)分系統(tǒng)受制于樣本量小,病理評(píng)分標(biāo)準(zhǔn)不一, 納入特征少以及評(píng)分臨床實(shí)用性欠佳等缺點(diǎn)。
本文致力于使用2047 例中國(guó)長(zhǎng)期隨訪 IgAN 患者數(shù)據(jù),借助機(jī)?學(xué)習(xí)方法,建立結(jié)合臨床及腎臟病理的預(yù)后風(fēng)險(xiǎn)預(yù)測(cè)模型及風(fēng)險(xiǎn)分層系統(tǒng),使醫(yī)生可快速準(zhǔn)確地預(yù)估患者的腎臟預(yù)后風(fēng)險(xiǎn)。
數(shù)據(jù)及實(shí)驗(yàn)設(shè)計(jì):
回顧性分析采用來(lái)自中國(guó) 18 個(gè)臨床中心的 1997 年 1 月~2010 年 6 月住院經(jīng)腎活檢確診為 IgAN 患者的臨床及隨訪資料。數(shù)據(jù)涵蓋了患者的人口學(xué)特征、生理指標(biāo)、病理指標(biāo)等36個(gè)變量。臨床結(jié)局定義為 “eGFR 較基線下降≥50% 或 終末期腎?。╡nd-stage kidney disease, ESKD)” 。
根據(jù)以上研究對(duì)象及觀察指標(biāo)建立的預(yù)測(cè)模型,可以在患者活檢時(shí)預(yù)測(cè)以上臨床結(jié)局的風(fēng)險(xiǎn),預(yù)測(cè)時(shí)間窗口為活檢后 5 年。
AI融合統(tǒng)計(jì)模型,兼顧模型精準(zhǔn)度和實(shí)用性
XGBoost精準(zhǔn)預(yù)測(cè):
本文首先使用XGBoost方法進(jìn)行了建模。
目前為止,XGBoost 方法在中小型結(jié)構(gòu) / 表格數(shù)據(jù)上已取得了無(wú)數(shù)卓越的成績(jī)。其作為一種基于決策樹的集成機(jī)?學(xué)習(xí)算法,使用梯度上升框架,適用于分類回歸問(wèn)題,速度快,效果好。
本文選取 XGBoost 作為預(yù)測(cè)模型,除了其精準(zhǔn)的預(yù)測(cè)能力外,還有一個(gè)更重要的原因,即 XGBoost自動(dòng)處理缺失值的能力。缺失值在醫(yī)療數(shù)據(jù)中一直是個(gè)無(wú)法避免又棘手的問(wèn)題。由于大部分機(jī)?學(xué)習(xí)模型都需要較多的變量作為輸入,在實(shí)際臨床應(yīng)用時(shí)很難將所需變量搜集完整。這一點(diǎn)阻撓了機(jī)?學(xué)習(xí)算法在臨床實(shí)踐中的廣泛應(yīng)用。XGBoost 方法自動(dòng)學(xué)習(xí)缺失值的分類方向,從而擺脫了在實(shí)際應(yīng)用時(shí)缺失值造成的束縛。
本文輸出了重要性排名前十的變量(如下表)。在 NJIgAN?RSS 系統(tǒng)中,用戶可以根據(jù)實(shí)際情況填入這些變量的信息,獲取預(yù)測(cè)的風(fēng)險(xiǎn)概率。
Stepwise Cox 簡(jiǎn)化評(píng)分:
為了進(jìn)一步增強(qiáng)系統(tǒng)在臨床實(shí)踐中的實(shí)用性,本文進(jìn)一步構(gòu)建了無(wú)需借助計(jì)算機(jī)便能使用的打分模型。
Stepwise Cox 作為一種傳統(tǒng)的回歸分析模型,每個(gè)被選擇的變量都有一危險(xiǎn)比(hazard ratio,HR),其統(tǒng)計(jì)學(xué)顯著性可用 p 值來(lái)評(píng)估,臨床解釋性能佳,故本文利用該方法建立簡(jiǎn)化評(píng)分模型。
Stepwise Cox 在建模過(guò)程中自動(dòng)進(jìn)行特征選擇,但由于其采用的逐步遞歸特征選擇非常容易陷入局部最優(yōu)解,所以直接基于原始的 36 個(gè)變量進(jìn)行建模所得到的模型效果并不理想。
本文基于了 XGBoost 給出的對(duì)于模型分類效果具有顯著作用的 10 個(gè)變量作為初始變量,在此基礎(chǔ)上進(jìn)行Cox 回歸建模, 從一定程度上減小了局部最優(yōu)帶來(lái)的弊端。
本文通過(guò) CHAID 方法進(jìn)一步將 stepwise Cox 選出的變量進(jìn)行離散化,將 Cox 回歸系數(shù)作為打分模型權(quán)重,得到了最后的打分模型。打分最終納入了 3 個(gè)變量:腎小管萎縮/間質(zhì)性纖維化比例(%) (基于牛津分型分為 T1;T2)、球性硬化比例>25%、尿蛋白>1g/d, 最終將患者 3 個(gè)變量對(duì)應(yīng)的得分相加,即得到患者的風(fēng)險(xiǎn)分層評(píng)分(risk stratification score,RSS),進(jìn)一步將 0?1 分為低危組,2 分為中危組,3?4 分為高危組。
模型評(píng)價(jià)結(jié)果
XGBoost 模型在訓(xùn)練集及驗(yàn)證集上的 C?statistics 分別為 0.89、0.84。本文對(duì)比了 XGBoost 以及其他機(jī)?學(xué)習(xí)、統(tǒng)計(jì)方法的區(qū)分度性能,如下表。
簡(jiǎn)化版評(píng)分模型在訓(xùn)練集上的 C?statistic為 0.81 (95% CI, 0.76?0.86),驗(yàn)證集為 0.80 (95% CI, 0.75?0.84)?,F(xiàn)有評(píng)分模型ARR 在本文訓(xùn)練集上的 C?statistic為 0.71 (95% CI, 0.65?0.77),驗(yàn)證集為 0.74 (95% CI, 0.69? 0.78)。可見,本文所建立的評(píng)分模型與現(xiàn)有模型相比,在預(yù)測(cè)精準(zhǔn)度上具有顯著的提高。
模型一致性結(jié)果如下圖所示,Hosmer?Lemeshow 檢驗(yàn)所得統(tǒng)計(jì)值 1.144,p?value=0.8,說(shuō)明此模型一致性結(jié)果較高。
下圖展示了風(fēng)險(xiǎn)得分為 0?4 分人群的 ?aplan? Meier 曲線(ES?D 及聯(lián)合結(jié)局)。Log?rank test 的結(jié)果(P < 0.001)說(shuō)明發(fā)現(xiàn)利用本文的評(píng)分模型對(duì) IgA 腎病病人的預(yù)后風(fēng)險(xiǎn)進(jìn)行了很好的分層。
結(jié)論
本文建立了 IgAN 患者的腎臟預(yù)后風(fēng)險(xiǎn)預(yù)測(cè)系統(tǒng) NJIgAN?RSS,包含了精準(zhǔn)的 XGBoost 概率預(yù)測(cè)模型以及簡(jiǎn)化版的 SSM打分模型,并對(duì)其進(jìn)行了外部驗(yàn)證。與現(xiàn)有的 ARR 模型相比取得了更加精準(zhǔn)的預(yù)測(cè)性能。該項(xiàng)研究推動(dòng)了 AI 算法在疾病預(yù)測(cè)方面的應(yīng)用。
NJIgAN?RSS 系統(tǒng)已在網(wǎng)上公開發(fā)布(http://njszb. gdpcloud.com/),用戶輸入各項(xiàng)參數(shù)后,便可獲得患者五年內(nèi)的預(yù)后風(fēng)險(xiǎn)概率以及風(fēng)險(xiǎn)等級(jí)。
-
論文
+關(guān)注
關(guān)注
1文章
103瀏覽量
14966 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1279瀏覽量
24332
原文標(biāo)題:中國(guó)學(xué)者頂級(jí)期刊發(fā)文:AI精準(zhǔn)預(yù)測(cè)腎病預(yù)后
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論