心力衰竭是一種嚴重危害人類健康的疾病,已成為全球公共衛生問題。基于醫學影像、臨床等數據進行心力衰竭診斷與預后分析能揭示心力衰竭的病程規律,從而降低患者死亡風險,具有重要研究價值。傳統基于統計學與機器學習的分析方法存在模型能力不足、先驗依賴造成的準確性差、模型適應性不佳等問題。近年來,隨著人工智能技術的發展,深度學習方法逐漸開始在心力衰竭領域的臨床數據分析應用中展現出新的前景。本文綜述深度學習在心力衰竭診斷、心力衰竭生存風險、心力衰竭再入院等方面的主要工作進展、應用方式與主要成果,總結目前存在的問題,提出相關研究展望,以促進深度學習在心力衰竭臨床研究的臨床應用。
引用本文: 雷英鵬, 劉思汝, 吳鈺萱, 李川, 劉加林. 基于深度學習的心力衰竭臨床研究進展. 生物醫學工程學雜志, 2023, 40(2): 373-377, 383. doi: 10.7507/1001-5515.202208060 復制
0 引言
心力衰竭(簡稱:心衰)是各種心血管疾病的終末階段[1]。近年來,心衰發病率和患病率持續上升,已成為全球公共衛生問題[2]。同時,人口老齡化情況的加劇也將導致心衰患者越來越多[3]。心衰患者的住院死亡率為5%~20%,其中有癥狀的患者發作五年后的死亡率高達50%[4]。心衰患者人數持續增長以及心衰治療費用的提高將不斷增加國家衛生機構的壓力以及患者的治療負擔。由于心衰具有普遍性、嚴重性、高治療成本的特點,心衰患者的提前診斷與預后有效分析對降低患者的醫療成本、改善臨床結局非常重要。
盡管目前在心衰的診斷、治療等方面都取得了很大進展,但臨床診療過程中仍然存在許多困難,心衰仍然是全球主要的健康問題之一。隨著人工智能技術的進一步成熟和發展,機器學習及深度學習廣泛應用于心衰臨床診療中,在識別早期心衰患者、預測患者生存風險、患者是否再入院等都有廣泛的研究,并取得了顯著的成果。然而,國內外對其研究綜述主要集中于傳統機器學習在心衰的臨床研究[5],缺乏深度學習在心衰臨床研究方面的全面評價與綜述[6]。本文旨在綜述近年來深度學習在心衰臨床研究的最新進展,為相關領域的學者提供有價值的信息和研究思路。
1 心衰早期診斷挑戰
心衰是由心臟結構和(或)功能異常引起心室充盈和(或)射血功能減退的一組臨床綜合征,主要臨床表現為呼吸困難、乏力、外周水腫、頸靜脈壓升高,以及血漿利鈉肽水平升高[7]。心衰患者的病因復雜,常見病因如圖1所示[8]。目前心衰的檢查包括:心臟生物學標記物檢查、心電圖(electrocardiography,ECG)、胸片、超聲心動圖、肺部超聲與其他輔助檢驗與檢查[7]。近年來,雖然心衰診療指南將血漿B型鈉尿肽(B-type natriuretic peptide,BNP)或N末端B型鈉尿肽前體(N-terminal pro-B-type natriuretic peptide,NT-proBNP)等生物標志物用于心衰嚴重程度和預后的評估[7]。但血清指標受到多種其他非心源性病變影響,其預測預后的敏感度和特異度都有待提高。目前亟需開發方便快捷、非侵入性且能對患者預后做出較為準確判斷的確診手段。

2 深度學習在心衰診斷中的研究
心衰患者的診斷需要對患者病史、體征、實驗室檢查和影像檢查等進行綜合和準確的評估。早期診斷心衰患者是改善患者預后的前提和基礎,能有效降低心衰患者的死亡率和發病率。目前基于醫學影像、ECG數據的深度學習相關研究是主要方向。
2.1 心電圖
ECG信號能有效反映人體心臟狀況,是臨床診斷心血管類疾病的常規檢查項目。Kwon等[9]結合心率、QT波間隔等ECG信號特征與人口統計學信息準確識別心衰,僅基于全連接神經網絡(fully connected neural network,FCNN)模型就獲得了優于傳統機器學習模型的性能。Acharya等[10]通過自定義的11層深度卷積神經網絡(convolution neural network,CNN)提取ECG信號特征,在三個不同數據集上得到較好的心衰辨別泛化性驗證。Lih等[11]開發了CNN和長短期記憶網絡(long short-term memory,LSTM)的組合模型,對ECG信號特征自動提取,判斷冠狀動脈疾病(coronary artery disease,CAD)、心肌梗塞(myocardial infarction,MI)和充血性心衰(congestive heart failure,CHF),其準確率高達98.5%,有助于辨別診斷相似病癥。Lei等[12]針對CHF患者的鑒別任務,利用心率變異率(heart rate variability,HRV)作為辨識指標,融合壓縮激勵模塊(squeeze-and-excitation,SE)與改進的稠密U型網絡(UNet++)提取ECG信號特征,結果證明了HRV在早期診斷CHF患者的有效性。
2.2 心超聲
心超聲是使用聲波來創建心臟的動態圖像。它可提供關于心腔容積、室壁厚度、心室收縮和舒張功能、瓣膜功能、心包積液、肺動脈高壓和心力衰竭病因的有效信息。心超聲是最常用的心臟成像方式,對心衰診斷、治療極為重要[13],通常被認為是診斷心衰時評估心臟結構與功能的主要方法。Ouyang等[14]基于心超聲影像,使用空洞卷積和時空卷積的雙分支CNN方法,分別進行圖像分割任務和射血分數預測。通過逐幀估計方式大大提高患者射血分數預測準確度與評估合理性,提高心臟功能評估及心衰診斷水平,相比專家評估方法具有更優的復現性和準確性。Tromp等[15]采用有監督的CNN和無監督深度聚類CNN模型,開發了自動標注超聲心動圖影像和多普勒模式(doppler modalities)的心衰診斷模型,其準確性與超聲專家的判斷相似。深度學習已證明可充分挖掘心超聲的優勢,使心超聲圖解讀過程更快、更準,并且重復性更好[16]。
2.3 其他醫學影像
深度學習廣泛用于醫學圖像分析,在分割、配準、圖像重建、定性分析等各種應用中取得了明顯的效果,是鑒別心臟磁共振成像(magnetic resonance imaging,MRI)、電子計算機斷層掃描(computed tomography,CT)、射線照片(radiograph)的有效方法。Seah等[17]采用生成模型方法創建生成視覺推理(generative visual rationales,GVR),用于對心衰患者胸片圖像進行特征分類。GVR基于瓦瑟斯坦生成對抗網絡(Wasserstein generative adversarial network,WGAN)進行視覺重建,使放射科醫生能夠更好地識別心衰患者。Matsumoto等[18]結合肺水腫及心胸比預定義心衰患者,結合遷移訓練方法在小樣本集合上訓練CNN網絡,并通過梯度激活圖(gradient-class activation maps,grad-CAMs)的可視化網絡方法,為預測是否為心衰患者提供了良好的診斷可視化依據。Zarvani等[19]提出基于殘差學習(residual learning)的心臟MRI深度學習模型。該方法能更準確地檢測MRI圖像中的左心室,有助于早期診斷心衰。
2.4 電子病歷
隨著電子病歷的廣泛使用,通過電子病歷信息早期診斷心衰的深度學習算法也備受關注。算法利用高維度的患者電子病歷,訓練提取患者多方面特征關聯的編碼器,有助于更好地進行心衰診斷、預后分析等。Choi等[20]使用門控循環單元(gated recurent unit,GRU)模型對患者電子病歷數據建模,進行心衰等病癥的早期診斷,是深度學習在電子病歷數據應用的里程碑,證明了基于電子病歷建模的有效性。Rasmy等[21]通過百萬患者的外部數據驗證了基于電子病歷建模算法泛化的有效性,結果顯示心衰患者的相關驗證任務性能僅平均下降三個點左右,深度模型具有良好的泛化性和特定患者群體的特征抽取能力。Madanan等[22]提出基于優化人工神經網絡(optimized artificial neural network)—人工蜂群(artificial bee colony,ABC)的混合模型,該方法僅通過電子病歷數據就能獲得心衰的準確診斷。Kwon等[23]開發出可視化臨床分析預測模型,該模型不但在預測心衰上有較高準確率,同時具備模型決策的可視化能力以及交互指導模型決策的功能,是同時具備解釋性、高應用價值以及準確性的參考模型。
3 深度學習在心衰相關風險預測的研究
心衰相關風險的預測與判斷對心衰管理具有重要意義,有助于醫療資源分配,確定護理級別,制定有效治療方案。深度學習在預測心衰患者相關風險方面研究廣泛,主要的研究領域包括心衰患者生存預測、再入院預測等。
3.1 心衰患者生存預測
心衰是高發病率和高死亡率的嚴重疾病。準確預測心衰患者生存風險對于改善患者的醫療保健并提升患者臨床結局至關重要。Bello等[24]利用心衰患者心臟MRI影像,采用CNN以及針對患者生存預測任務的降噪自編碼器來自動提取心臟運動特征,并以可視化心臟運動等方式證明了該模型在預測心衰患者生存風險的有效性。Kwon等[25]通過文本挖掘方法提取心超聲報告特征,結合FCNN預測心衰患者的院內死亡率,并在外源數據上驗證了模型的泛化性。Wang等[26]提出基于卷積層特征重排的深度學習模型用于心衰患者生存風險預測,該方法能快速、準確地預測心衰患者的死亡。付健[27]提出基于多頭自注意力機制的CNN模型,引入患者用藥信息、人口統計信息、手術信息、相關疾病信息、實驗室檢測信息、重癥加強護理病房(intensive care unit,ICU)相關信息等多源信息,在預測不同種類心衰患者生存風險任務上達到了較高性能,較為充分地利用了電子病歷數據。
3.2 心衰再入院預測
心衰具有難根治、預后差的特點。心衰患者再次入院的比例非常高,出院后30 d再入院率可達21.7%,61.3%的患者在出院后1年內再次入院[28]。通過深度學習預測心衰患者的再入院風險,能有效降低患者再入院率,減少患者死亡風險,降低醫院治療壓力。Xiao等[29]利用電子病歷數據擬預測心衰患者再入院風險,基于自編碼變分貝葉斯網絡(auto-encoding variational Bayes,AEVB)與GRU提取患者特征,生成式模型緩解了電子病歷數據缺失的影響,算法同時結合多次看病的全局信息與單次看病的局部信息,在再入院預測任務上達到了當時的最高水平。Golas等[30]基于深度統一網絡(deep unified networks,DUNs)提取心衰患者電子病歷中文本及臨床記錄等異質模態信息特征,發掘出與再入院風險強相關的因素,并結合經濟角度評估了預期的再入院節約成本,具有較高實際應用價值。Allam等[31]融合RNN和條件隨機場(conditional random field,CRF)模型進行特征自動提取,是將自然語言處理方法應用到臨床場景中的一次有效性證明。Ashfaq等[32]基于電子病歷數據,納入藥物、診斷、過程編碼,通過段落向量的分布詞袋模型(paragraph vector of distributed bag of words,PV-DBOW)建立患者表示向量,引入代價敏感的交叉熵函數訓練LSTM網絡,并通過金融相關分析了模型在再入院預測上的節約成本,使得臨床模型的應用價值在經濟層面得到了數值上的證明。達婧瑋等[33]提出利用字符級CNN、FCNN分別提取非結構化與結構化信息,通過雙分支特征融合方式進一步提升再入院預測性能。Pishgar等[34]運用流程挖掘(process mining)的思想轉換電子病歷數據,通過三分支的FCNN并行處理時間狀態信息、人口統計信息、危重評分信息,以預測30 d內心衰患者的非計劃再入院情況,是一次工作流管理應用到臨床數據上的嘗試。
4 深度學習模型現存挑戰及問題
4.1 模型解釋性差
人工智能技術已應用在手術機器人、臨床輔助診斷、影像辨別分析、風險預測等場景。在手術機器人或影像辨別中,深度學習算法的精確度十分重要,而在輔助診斷與分析決策中更加關注因果分析,深度學習算法的解釋性要求更高,而可解釋性一直是深度學習研究者們面臨的問題。盡管深度學習在心衰診斷、心衰治療等方面都取得了很大進展,但目前針對治療方案、用藥方案、用藥劑量等的深度學習應用仍然是一大難題。困難主要來源于臨床治療的復雜性,以及深度模型的可解釋性不佳。臨床治療常存在多療程,且治療方案隨患者的體質或病因變化而變化。目前端到端的深度模型解釋性已有一些進展,但仍然難以生成合理治療策略及相應的“為什么這么做”的解釋。可解釋性是其臨床應用的主要障礙[35]。多數深度模型仍停留在發現問題的階段,缺乏提供解決問題的思路。換句話說,目前機器學習的可解釋性大部分是局部解釋性,缺乏全局可解釋性。局部解釋性可理解為解釋當前結果與輸入的關聯,是以輸入樣本為導向的;而全局解釋性則較宏觀,即解釋該種預測應該是什么樣。另外,深度模型的評估指標并不能直接度量模型的好壞,因模型的性能評估指標,如準確率等,與人們實際所感興趣的指標常不匹配。只有當模型的解釋性輸出一定程度滿足人們的先驗知識時,模型才具備實際價值[36]。
4.2 模型泛化性不佳
心衰領域研究方法不斷增加,但由于國家或區域不同,研究者們使用數據集存在差異,不同數據源的模型性能難以比較并且缺乏泛化性驗證,這種泛化性的減弱或來自數據集偏移。基于電子病歷數據研究的模型中,不同于醫學影像等領域較統一的格式,常包含大量的藥物、生化檢驗、生理指標、人口統計、護理紀錄等。由于臨床編碼方式、記錄規范、統計量的不同,不同模型很難進行平行驗證,電子病歷數據獲取同樣也是一大難題。患者數據難做到個人信息去標識化,數據獲取代價高、耗時長,使得目前僅少數開源數據集供研究者使用[37]。
5 總結
深度學習方法的應用有助于臨床研究中特征工程的優化,減少對專家先驗知識的依賴。在心衰診斷以及心衰患者相關風險預測的表現上,深度學習方法性能已經超過基于統計學習和傳統機器學習方法,盡管在臨床管理、心衰患者診斷等方面有了進展,但涉及心衰患者相關風險預測任務上的性能仍然還有很大的提升空間,尤其是在利用電子病歷建模的領域[8]。
臨床研究中應用深度學習的基礎條件,是良好的模型解釋性[38]。目前機器學習領域的解釋性方法已有一些進展。深度沙普(deep shap)[39]是目前機器學習的常用解釋方法,方法論起源于博弈理論。假設模型當前樣本輸出與總體預測期望的偏差由該樣本各個特征貢獻度累和構成,沙普利(shapley)值即度量特征的貢獻程度,且該方法無需考慮深度模型的內在結構。深度沙普框架能發掘模型預測結果與輸入特征的正負關聯,以生成預測結果解釋性的決策路徑。注意力機制同樣是深度模型近年來常用的方法,合理地引入注意力機制有利于發掘特征關聯,也能提升模型準確度。上述解釋性方法在未來應與深度模型更好結合,在決策層面提供更合理、直觀的臨床輔助方法。
本文所提及的深度學習方法證明了未來臨床研究應用的前景。深度學習所帶來的顯著預測性能提升,推動了人工智能在心衰臨床研究的應用。結合深度學習的心衰模型,應該在保證性能的同時,強調其解釋性問題,而非僅僅關注預測準確度和靈敏度等指標。隨著深度學習在心衰領域研究的深入和應用的快速發展,在不久的將來深度學習有望成為臨床醫生的有力助手,讓更多的心衰患者得到及時、準確的診斷與預防。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:雷英鵬主要負責綜述論文的文獻收集、整理、分析、論文撰寫、修改;劉思汝主要負責文獻資料的整理、分析、撰寫和修改;吳鈺萱主要負責資料整理、論文撰寫和修改;李川主要負責文獻分析、論文撰寫、修改、指導和審校。劉加林主要負責文獻分析、論文撰寫、修改、指導和審校。
0 引言
心力衰竭(簡稱:心衰)是各種心血管疾病的終末階段[1]。近年來,心衰發病率和患病率持續上升,已成為全球公共衛生問題[2]。同時,人口老齡化情況的加劇也將導致心衰患者越來越多[3]。心衰患者的住院死亡率為5%~20%,其中有癥狀的患者發作五年后的死亡率高達50%[4]。心衰患者人數持續增長以及心衰治療費用的提高將不斷增加國家衛生機構的壓力以及患者的治療負擔。由于心衰具有普遍性、嚴重性、高治療成本的特點,心衰患者的提前診斷與預后有效分析對降低患者的醫療成本、改善臨床結局非常重要。
盡管目前在心衰的診斷、治療等方面都取得了很大進展,但臨床診療過程中仍然存在許多困難,心衰仍然是全球主要的健康問題之一。隨著人工智能技術的進一步成熟和發展,機器學習及深度學習廣泛應用于心衰臨床診療中,在識別早期心衰患者、預測患者生存風險、患者是否再入院等都有廣泛的研究,并取得了顯著的成果。然而,國內外對其研究綜述主要集中于傳統機器學習在心衰的臨床研究[5],缺乏深度學習在心衰臨床研究方面的全面評價與綜述[6]。本文旨在綜述近年來深度學習在心衰臨床研究的最新進展,為相關領域的學者提供有價值的信息和研究思路。
1 心衰早期診斷挑戰
心衰是由心臟結構和(或)功能異常引起心室充盈和(或)射血功能減退的一組臨床綜合征,主要臨床表現為呼吸困難、乏力、外周水腫、頸靜脈壓升高,以及血漿利鈉肽水平升高[7]。心衰患者的病因復雜,常見病因如圖1所示[8]。目前心衰的檢查包括:心臟生物學標記物檢查、心電圖(electrocardiography,ECG)、胸片、超聲心動圖、肺部超聲與其他輔助檢驗與檢查[7]。近年來,雖然心衰診療指南將血漿B型鈉尿肽(B-type natriuretic peptide,BNP)或N末端B型鈉尿肽前體(N-terminal pro-B-type natriuretic peptide,NT-proBNP)等生物標志物用于心衰嚴重程度和預后的評估[7]。但血清指標受到多種其他非心源性病變影響,其預測預后的敏感度和特異度都有待提高。目前亟需開發方便快捷、非侵入性且能對患者預后做出較為準確判斷的確診手段。

2 深度學習在心衰診斷中的研究
心衰患者的診斷需要對患者病史、體征、實驗室檢查和影像檢查等進行綜合和準確的評估。早期診斷心衰患者是改善患者預后的前提和基礎,能有效降低心衰患者的死亡率和發病率。目前基于醫學影像、ECG數據的深度學習相關研究是主要方向。
2.1 心電圖
ECG信號能有效反映人體心臟狀況,是臨床診斷心血管類疾病的常規檢查項目。Kwon等[9]結合心率、QT波間隔等ECG信號特征與人口統計學信息準確識別心衰,僅基于全連接神經網絡(fully connected neural network,FCNN)模型就獲得了優于傳統機器學習模型的性能。Acharya等[10]通過自定義的11層深度卷積神經網絡(convolution neural network,CNN)提取ECG信號特征,在三個不同數據集上得到較好的心衰辨別泛化性驗證。Lih等[11]開發了CNN和長短期記憶網絡(long short-term memory,LSTM)的組合模型,對ECG信號特征自動提取,判斷冠狀動脈疾病(coronary artery disease,CAD)、心肌梗塞(myocardial infarction,MI)和充血性心衰(congestive heart failure,CHF),其準確率高達98.5%,有助于辨別診斷相似病癥。Lei等[12]針對CHF患者的鑒別任務,利用心率變異率(heart rate variability,HRV)作為辨識指標,融合壓縮激勵模塊(squeeze-and-excitation,SE)與改進的稠密U型網絡(UNet++)提取ECG信號特征,結果證明了HRV在早期診斷CHF患者的有效性。
2.2 心超聲
心超聲是使用聲波來創建心臟的動態圖像。它可提供關于心腔容積、室壁厚度、心室收縮和舒張功能、瓣膜功能、心包積液、肺動脈高壓和心力衰竭病因的有效信息。心超聲是最常用的心臟成像方式,對心衰診斷、治療極為重要[13],通常被認為是診斷心衰時評估心臟結構與功能的主要方法。Ouyang等[14]基于心超聲影像,使用空洞卷積和時空卷積的雙分支CNN方法,分別進行圖像分割任務和射血分數預測。通過逐幀估計方式大大提高患者射血分數預測準確度與評估合理性,提高心臟功能評估及心衰診斷水平,相比專家評估方法具有更優的復現性和準確性。Tromp等[15]采用有監督的CNN和無監督深度聚類CNN模型,開發了自動標注超聲心動圖影像和多普勒模式(doppler modalities)的心衰診斷模型,其準確性與超聲專家的判斷相似。深度學習已證明可充分挖掘心超聲的優勢,使心超聲圖解讀過程更快、更準,并且重復性更好[16]。
2.3 其他醫學影像
深度學習廣泛用于醫學圖像分析,在分割、配準、圖像重建、定性分析等各種應用中取得了明顯的效果,是鑒別心臟磁共振成像(magnetic resonance imaging,MRI)、電子計算機斷層掃描(computed tomography,CT)、射線照片(radiograph)的有效方法。Seah等[17]采用生成模型方法創建生成視覺推理(generative visual rationales,GVR),用于對心衰患者胸片圖像進行特征分類。GVR基于瓦瑟斯坦生成對抗網絡(Wasserstein generative adversarial network,WGAN)進行視覺重建,使放射科醫生能夠更好地識別心衰患者。Matsumoto等[18]結合肺水腫及心胸比預定義心衰患者,結合遷移訓練方法在小樣本集合上訓練CNN網絡,并通過梯度激活圖(gradient-class activation maps,grad-CAMs)的可視化網絡方法,為預測是否為心衰患者提供了良好的診斷可視化依據。Zarvani等[19]提出基于殘差學習(residual learning)的心臟MRI深度學習模型。該方法能更準確地檢測MRI圖像中的左心室,有助于早期診斷心衰。
2.4 電子病歷
隨著電子病歷的廣泛使用,通過電子病歷信息早期診斷心衰的深度學習算法也備受關注。算法利用高維度的患者電子病歷,訓練提取患者多方面特征關聯的編碼器,有助于更好地進行心衰診斷、預后分析等。Choi等[20]使用門控循環單元(gated recurent unit,GRU)模型對患者電子病歷數據建模,進行心衰等病癥的早期診斷,是深度學習在電子病歷數據應用的里程碑,證明了基于電子病歷建模的有效性。Rasmy等[21]通過百萬患者的外部數據驗證了基于電子病歷建模算法泛化的有效性,結果顯示心衰患者的相關驗證任務性能僅平均下降三個點左右,深度模型具有良好的泛化性和特定患者群體的特征抽取能力。Madanan等[22]提出基于優化人工神經網絡(optimized artificial neural network)—人工蜂群(artificial bee colony,ABC)的混合模型,該方法僅通過電子病歷數據就能獲得心衰的準確診斷。Kwon等[23]開發出可視化臨床分析預測模型,該模型不但在預測心衰上有較高準確率,同時具備模型決策的可視化能力以及交互指導模型決策的功能,是同時具備解釋性、高應用價值以及準確性的參考模型。
3 深度學習在心衰相關風險預測的研究
心衰相關風險的預測與判斷對心衰管理具有重要意義,有助于醫療資源分配,確定護理級別,制定有效治療方案。深度學習在預測心衰患者相關風險方面研究廣泛,主要的研究領域包括心衰患者生存預測、再入院預測等。
3.1 心衰患者生存預測
心衰是高發病率和高死亡率的嚴重疾病。準確預測心衰患者生存風險對于改善患者的醫療保健并提升患者臨床結局至關重要。Bello等[24]利用心衰患者心臟MRI影像,采用CNN以及針對患者生存預測任務的降噪自編碼器來自動提取心臟運動特征,并以可視化心臟運動等方式證明了該模型在預測心衰患者生存風險的有效性。Kwon等[25]通過文本挖掘方法提取心超聲報告特征,結合FCNN預測心衰患者的院內死亡率,并在外源數據上驗證了模型的泛化性。Wang等[26]提出基于卷積層特征重排的深度學習模型用于心衰患者生存風險預測,該方法能快速、準確地預測心衰患者的死亡。付健[27]提出基于多頭自注意力機制的CNN模型,引入患者用藥信息、人口統計信息、手術信息、相關疾病信息、實驗室檢測信息、重癥加強護理病房(intensive care unit,ICU)相關信息等多源信息,在預測不同種類心衰患者生存風險任務上達到了較高性能,較為充分地利用了電子病歷數據。
3.2 心衰再入院預測
心衰具有難根治、預后差的特點。心衰患者再次入院的比例非常高,出院后30 d再入院率可達21.7%,61.3%的患者在出院后1年內再次入院[28]。通過深度學習預測心衰患者的再入院風險,能有效降低患者再入院率,減少患者死亡風險,降低醫院治療壓力。Xiao等[29]利用電子病歷數據擬預測心衰患者再入院風險,基于自編碼變分貝葉斯網絡(auto-encoding variational Bayes,AEVB)與GRU提取患者特征,生成式模型緩解了電子病歷數據缺失的影響,算法同時結合多次看病的全局信息與單次看病的局部信息,在再入院預測任務上達到了當時的最高水平。Golas等[30]基于深度統一網絡(deep unified networks,DUNs)提取心衰患者電子病歷中文本及臨床記錄等異質模態信息特征,發掘出與再入院風險強相關的因素,并結合經濟角度評估了預期的再入院節約成本,具有較高實際應用價值。Allam等[31]融合RNN和條件隨機場(conditional random field,CRF)模型進行特征自動提取,是將自然語言處理方法應用到臨床場景中的一次有效性證明。Ashfaq等[32]基于電子病歷數據,納入藥物、診斷、過程編碼,通過段落向量的分布詞袋模型(paragraph vector of distributed bag of words,PV-DBOW)建立患者表示向量,引入代價敏感的交叉熵函數訓練LSTM網絡,并通過金融相關分析了模型在再入院預測上的節約成本,使得臨床模型的應用價值在經濟層面得到了數值上的證明。達婧瑋等[33]提出利用字符級CNN、FCNN分別提取非結構化與結構化信息,通過雙分支特征融合方式進一步提升再入院預測性能。Pishgar等[34]運用流程挖掘(process mining)的思想轉換電子病歷數據,通過三分支的FCNN并行處理時間狀態信息、人口統計信息、危重評分信息,以預測30 d內心衰患者的非計劃再入院情況,是一次工作流管理應用到臨床數據上的嘗試。
4 深度學習模型現存挑戰及問題
4.1 模型解釋性差
人工智能技術已應用在手術機器人、臨床輔助診斷、影像辨別分析、風險預測等場景。在手術機器人或影像辨別中,深度學習算法的精確度十分重要,而在輔助診斷與分析決策中更加關注因果分析,深度學習算法的解釋性要求更高,而可解釋性一直是深度學習研究者們面臨的問題。盡管深度學習在心衰診斷、心衰治療等方面都取得了很大進展,但目前針對治療方案、用藥方案、用藥劑量等的深度學習應用仍然是一大難題。困難主要來源于臨床治療的復雜性,以及深度模型的可解釋性不佳。臨床治療常存在多療程,且治療方案隨患者的體質或病因變化而變化。目前端到端的深度模型解釋性已有一些進展,但仍然難以生成合理治療策略及相應的“為什么這么做”的解釋。可解釋性是其臨床應用的主要障礙[35]。多數深度模型仍停留在發現問題的階段,缺乏提供解決問題的思路。換句話說,目前機器學習的可解釋性大部分是局部解釋性,缺乏全局可解釋性。局部解釋性可理解為解釋當前結果與輸入的關聯,是以輸入樣本為導向的;而全局解釋性則較宏觀,即解釋該種預測應該是什么樣。另外,深度模型的評估指標并不能直接度量模型的好壞,因模型的性能評估指標,如準確率等,與人們實際所感興趣的指標常不匹配。只有當模型的解釋性輸出一定程度滿足人們的先驗知識時,模型才具備實際價值[36]。
4.2 模型泛化性不佳
心衰領域研究方法不斷增加,但由于國家或區域不同,研究者們使用數據集存在差異,不同數據源的模型性能難以比較并且缺乏泛化性驗證,這種泛化性的減弱或來自數據集偏移。基于電子病歷數據研究的模型中,不同于醫學影像等領域較統一的格式,常包含大量的藥物、生化檢驗、生理指標、人口統計、護理紀錄等。由于臨床編碼方式、記錄規范、統計量的不同,不同模型很難進行平行驗證,電子病歷數據獲取同樣也是一大難題。患者數據難做到個人信息去標識化,數據獲取代價高、耗時長,使得目前僅少數開源數據集供研究者使用[37]。
5 總結
深度學習方法的應用有助于臨床研究中特征工程的優化,減少對專家先驗知識的依賴。在心衰診斷以及心衰患者相關風險預測的表現上,深度學習方法性能已經超過基于統計學習和傳統機器學習方法,盡管在臨床管理、心衰患者診斷等方面有了進展,但涉及心衰患者相關風險預測任務上的性能仍然還有很大的提升空間,尤其是在利用電子病歷建模的領域[8]。
臨床研究中應用深度學習的基礎條件,是良好的模型解釋性[38]。目前機器學習領域的解釋性方法已有一些進展。深度沙普(deep shap)[39]是目前機器學習的常用解釋方法,方法論起源于博弈理論。假設模型當前樣本輸出與總體預測期望的偏差由該樣本各個特征貢獻度累和構成,沙普利(shapley)值即度量特征的貢獻程度,且該方法無需考慮深度模型的內在結構。深度沙普框架能發掘模型預測結果與輸入特征的正負關聯,以生成預測結果解釋性的決策路徑。注意力機制同樣是深度模型近年來常用的方法,合理地引入注意力機制有利于發掘特征關聯,也能提升模型準確度。上述解釋性方法在未來應與深度模型更好結合,在決策層面提供更合理、直觀的臨床輔助方法。
本文所提及的深度學習方法證明了未來臨床研究應用的前景。深度學習所帶來的顯著預測性能提升,推動了人工智能在心衰臨床研究的應用。結合深度學習的心衰模型,應該在保證性能的同時,強調其解釋性問題,而非僅僅關注預測準確度和靈敏度等指標。隨著深度學習在心衰領域研究的深入和應用的快速發展,在不久的將來深度學習有望成為臨床醫生的有力助手,讓更多的心衰患者得到及時、準確的診斷與預防。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:雷英鵬主要負責綜述論文的文獻收集、整理、分析、論文撰寫、修改;劉思汝主要負責文獻資料的整理、分析、撰寫和修改;吳鈺萱主要負責資料整理、論文撰寫和修改;李川主要負責文獻分析、論文撰寫、修改、指導和審校。劉加林主要負責文獻分析、論文撰寫、修改、指導和審校。