心血管疾病是全球導致死亡的首要原因,其診治非常依賴各種臨床數據。隨著醫療大數據時代的到來,人工智能在心血管醫學中的影像、診斷和預后預測等多個方面得到廣泛應用,為精準診治提供了新的方法。本文綜述了人工智能在心血管醫學中的應用現狀。
引用本文: 邱海龍, 郭惠明, 姚澤陽, 謝穩, 徐小維, 黃美萍, 岑堅正, 莊建. 人工智能在心血管醫學中的應用. 中國胸心血管外科臨床雜志, 2021, 28(10): 1160-1166. doi: 10.7507/1007-4848.202103107 復制
心血管疾病是全球導致死亡的首要原因[1],在中國,40% 以上的死亡與之相關[2]。為了減少心血管疾病帶來的死亡和不良影響,提升患者的預期壽命和改善患者的生活質量,盡早預測和提升診治水平顯得相同重要。預測方面,過往有研究者基于有限的明確的風險因素,例如高血壓、高血脂、吸煙、糖尿病和年齡等,提出過幾種心血管疾病預測模型[3-6],但是預測效能均顯不足,特異性和敏感性尚有待提高,難以做到個性化精準預測。隨著人們對健康的日益重視、就醫行為的改變,以及各種隨身設備發展和流行,越來越多的相關數據將被記錄下來,形成健康大數據,這些數據都有可能與心血管疾病的發生相關,都應該納入分析。診治方面,一直以來都非常依賴各種檢查,包括心電圖和各種影像檢查等,這些檢查數據量日益劇增,同時,臨床病歷電子化程度越來越高,診治過程中越來越多臨床數據被格式化或者非格式化記錄下來,形成了臨床大數據。不管是基于健康大數據的預測,還是基于臨床大數據的診治,都嚴重依賴于有經驗的醫師。然而,在巨大的病例數和數據量前,醫生的數量、精力、時間和處理數據的能力都嚴重不足。隨著硬件的發展,機器計算力呈指數增長,人工智能(artificial intelligence,AI)興起,為醫療大數據的處理和挖掘提供了新的可能。本文綜述了 AI 在心血管醫學中的應用現狀。
1 人工智能
AI 屬于計算機科學下面的一個分支,旨在模仿人類的認知功能,泛指能夠通過獲取廣泛的知識后,自行獲得推理和思考能力的通用系統。機器學習(machine learning,ML)是目前醫學領域應用最廣泛的 AI 方法,它可以直接分析大型、復雜且不同種類的數據,給出相應的解釋或者預測。ML 通常包含三個步驟—數據的準備、模型的選擇與訓練和模型驗證。按照學習方法,它可以大致分為監督學習(supervised learning)、非監督學習(unsupervised machine learning)和強化學習(reinforcement learning)。監督學習指的是研究者使用帶有標記結果或類別的觀察數據來訓練模型,從而對事物進行分類或對未來的事件進行預測。常用的監督學習算法包括樸素貝葉斯定理(Na?ve Bayes theorem)、K-近鄰算法(K-nearest neighbors,KNN)、支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)、極端梯度提升(extreme gradient boosting,XGBoost)、決策樹(decision tree)等。非監督學習指的是研究者直接利用無標記的原始數據訓練模型,讓算法本身去學習數據的內在結構和規律。常用的非監督學習算法包括均值聚類(K-means clustering)、分層聚類(hierarchical clustering)、主成分分析(principal component analysis)、奇異值分解(singular value decomposition)等。強化學習是基于行為心理學的 ML 的另一個新興分支學科。強化學習不要求預先給定任何數據,而是通過接收環境對動作的獎勵(反饋)獲得學習信息并更新模型參數。
ML 其中一個重要分支是深度學習(deep learning,DL),它由多層深度神經網絡(deep neural network,DNN)組成,輸入相關數據,通過多層 DNN 的處理,最后可以輸出相應的特征圖。同樣的,它也可以分為監督學習、非監督學習和強化學習。目前最具代表性的 DL 模型是卷積神經網絡(convolutional neural network,CNN)。DL 在圖像分類、圖像分割、自然語音處理、語音識別和基因組學中已經得到有效應用。
2 人工智能在心血管醫學中的應用
2.1 影像學
2.1.1 圖像采集和重建
超聲心動圖是心臟病學中應用最廣泛的影像學方法。有公司已經開發出基于 DL 的實時導航軟件,用于指導未經培訓的用戶獲取標準超聲心動圖視圖,通過該軟件,用戶可以不斷優化精確信號,從而不斷地接近標準視圖[7]。這些 DL 模型可以自動分析獲取的圖像數據集來識別和標注心臟解剖結構,然后對標準視圖進行切片顯示。這個程序的加入可以減少操作人員之間的差異,因為最佳視圖是基于數千個代表解剖變異譜的 DL 模型來選擇的。有研究[8]顯示,一個用來識別 8 個標準的三維超聲心動圖視圖的 CNN,與臨床醫生標記的訓練數據相比,準確率達到了 92%。這種圖像采集的自動化可以幫助非心臟病醫生在急性情況下使用超聲心動圖作為一線診斷工具,也有助于年輕心臟超聲醫師的培訓。
對于心臟磁共振成像(magnetic resonance imaging,MRI),高質量的成像需要有經驗的操作者細心地為患者定位和規劃圖像采集平面。有公司已經開發了基于 ML 的心臟解剖定位和采集平面自動規劃軟件,其與人工方法高度一致[9-10]。還有研究者應用 RF[11]和 CNN[12]對成像偽影進行實時檢測和消除。
2.1.2 圖像分割
在超聲心動圖中,左心室一直是大多數 AI 分割研究的焦點。與專家相比,使用 RF 分類器的全自動 ML 算法在二維超聲心動圖上描繪左心室心內膜邊界時表現出了良好的準確性[13]。還有研究者[14]應用 500 例患者的二維超聲圖像標記數據集訓練了一個 DL 模型,其在左心室心內膜和心外膜邊界分割方面均優于最先進的非 DL 方法。
可能是因為近年來心臟 MRI 分割任務所需的開放數據集增加了,心臟 MRI 中基于 AI 的分割算法比其它任何心臟成像方式都要多。目前,大部分研究都集中在心腔分割,在異常心肌組織區域的分割方面有相對較少的研究,如左心室瘢痕和心房纖維化。描繪心室和心肌的邊界是心臟 MRI 后處理的一個必需步驟,然而手工描繪非常耗時,而且存在描繪者偏差[15]。研究[16]表明,AI 算法可以自動完成這項任務,同時有望提高準確性和可重復性。有研究者[17]基于一個來自英國生物樣本庫的 4875 名受試者和 93500 張圖像的數據集,應用全卷積神經網絡(fully convolutional neural network,FCN)的模型對所有4個心腔進行了分割,其表現和臨床專家一樣好。另一個研究[18]證實,CNN 可以準確地分割左心室和描繪出與心臟病理相關的解剖形態變化。然而,目前的 DL 分割模型缺乏可靠性,常常不能與專家達成一致,或者會輸出不符合解剖學的分割結果[16]。
DL 在心臟 CT 中的首次應用是一種使用邊緣空間學習的算法,該算法通過逐步學習較低維的邊緣空間中的分類器來建模,并自動從三維體積中分割出所有4個心腔等[19]。后來,Gurpreet 等[20]將 U-Net(一個專為醫學圖像分割設計的 FCN)應用于心臟 CT 的分割中,獲得更為良好的表現。
2.1.3 自動測量
AI 已在二維和三維超聲心動圖的參數自動測量方面應用較多。早期的軟件使用傳統的 ML,基于二維左心室容積自動快速準確計算出左心室射血分數[21]。此后,ML 和 DL 算法被用于量化其它各種參數,如左心室肥大[22]、心肌運動特征[23]和縱向應變[24]。而目前的腔室定量指南推薦使用準確性和可重復性更好的三維超聲心動圖[25]。但是,三維超聲心動圖需要專門的訓練并費時,這限制了其在常規臨床實踐中的廣泛應用。研究[26-27]證實,基于三維超聲心動圖,ML 技術可以提供整個心動周期內快速、可重復的左心室和左心房容積自動測量,其參考值與心臟 MRI 相當。對這些 ML 算法進一步改進后,目前已經能夠測定左心室質量[28]、右心室容積和射血分數[29]。
DL 也可以用來量化心臟 MRI 上的一些參數。自動檢測心肌邊界的左心室分割算法現在可以全自動測量左心室體積、射血分數和質量,結果與專家高度一致[30-32]。有研究[33-34]已經應用 DL 算法自動分割右心室心內膜,可以得到跟專家測量一樣精確的右心室體積和射血分數。另外,基于 CNN 的算法能夠在特征空間中將左心室瘢痕與正常心肌分離,并準確量化缺血[35]和肥厚型[36]心肌病患者的瘢痕體積。同樣,有研究[37-38]提出全自動測量慢性心房顫動患者左心房瘢痕程度的模型,有利于更好地篩選需要導管消融的患者和選擇合適的消融策略。
冠狀動脈(冠脈)狹窄的檢測和量化可能是冠脈 CT 最重要的臨床應用,目前的報告是基于臨床醫生的主觀視覺評估。Kelm 等[39]使用 ML 算法自動識別、分級和分類鈣化斑塊和非鈣化斑塊引起的冠脈狹窄。通過中心線提取和管腔分割,在 229 個 CT 數據上訓練其 RF 模型,可以準確地進行狹窄識別和管腔橫截面積估計,平均每例處理時間為 1.8 s。同樣,Zreik 等[40]成功訓練出一個 CNN 來準確檢測冠脈斑塊,確定其組成,并可將冠脈狹窄分為阻塞性和非阻塞性。
2.2 心電圖
隨著可穿戴設備的增加,ML 在心電圖異常的自動檢測中可能非常有用。Ali 等[41]使用 DL 算法自動檢測心電心律失常,應用的數據集是超過 4 000 份長期心電動態心電圖記錄,最終該方法判別的平均正確率為 92.4%。Attia 等[42]研究表明,CNN也可以幫助從心電圖中識別無癥狀左心室收縮功能障礙患者。Galloway 等[43]研究基于心電圖的 ML 來篩查慢性腎病患者的高鉀血癥,數據集是來自梅奧診所等 3 個中心的 449 380 例患者的 1 576 581 份心電圖,最終該方法的受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)為 0.853~0.883,敏感性為 88.9%~91.3%。心電圖具有無創、便宜和可重復的特點,是臨床最常用的檢查之一,這些基于心電圖的 AI 篩查模型的研究,有望增加心電圖診斷多種疾病的準確性,同時拓寬心電圖可診斷的病種范圍。
2.3 心血管不良事件預測
利用多種臨床數據訓練 AI 模型來預測心血管不良事件的發生,可以幫助醫生提前辨別出不同風險層的患者,為他們制定個體化診療計劃,以及進行更有針對性的隨訪方案,進一步降低死亡率和不良事件的發生。Johnsson 等[44]應用人工神經網絡(artificial neural network,ANN)建立院外心臟驟停預后的預測模型,數據集來自 36 個中心的 932 例患者,采用 54 個臨床變量作為輸入變量,最終 AUC 為 0.891,表現明顯比邏輯回歸模型好,即使是簡化的 ANN 模型,即只將年齡、恢復自主循環時間和首次監測的心律情況作為輸入變量,其 AUC >0.852,同樣顯示出良好的性能,且更方便臨床使用。
Motwani 等[45]使用 10 030 例冠心病患者的冠脈 CT 數據集進行 ML 模型訓練,對預后進行預測。他們將 44 個 CT 衍生的參數,連同 25 個臨床參數,應用于 ML 算法預測 5 年隨訪的結果。首先根據信息增益排名自動選擇特征,然后使用 LogitBoost 算法構建模型,再進行十折交叉驗證。訓練得到的 ML 模型預測死亡的 AUC 為 0.79,顯著高于單獨使用傳統危險因素或 CT 參數建立的模型。van Rosendael 等[46]通過僅使用心臟 CT 衍生的影像學標記訓練的 ML 模型預測 8 844 例冠心病患者的預后,最終證實其 ML 模型在預測不良事件方面(AUC 為 0.771)明顯優于所有其它冠脈 CT 評分(AUC 為 0.69~0.70)。Johnson 等[47]研究了4種不同的 ML 模型的性能,使用 64 排心臟 CT 衍生的血管特征來預測 6 892 例患者中是否有后續死亡或心血管事件。結果表明,ML 模型對主要心血管不良事件患者的鑒別能力同樣優于所有傳統冠脈 CT 評分。
心臟手術相關性急性腎損傷(CSA-AKI)方面,Lee 等[48]基于 2 010 例心臟手術患者的數據,用 6 種機器學習方法分別建立模型,輸入的參數包括臨床基線資料、術中麻醉和手術數據,最終,XGBoost 模型的 AUC 最高,為 0.78,明顯高于傳統邏輯回歸分析的 0.69,決策樹、RF 和 SVM 與后者性能相當。Tseng 等[49]做了類似的研究,數據量共計 671 例,最終得出集成 RF 和 XGBoost 的 ML 模型的 AUC 最高,為 0.839,比單獨的 RF 模型高。另外,Li 等[50]用貝葉斯網絡做了相應的模型,數據量共計 5 533 例,用來預測 CSA-AKI 和嚴重 CSA-AKI,最終內部驗證 AUC 分別為 0.755 和 0.845,外部驗證 AUC 分別為 0.736 和 0.816,表現較為出色。
有 2 項研究[51-52]基于 ML 的方法對術后死亡風險進行預測,證實 ML 模型效能表現比 EuroSCORE(European System for Cardiac Operative Risk Evaluation)模型更好。Kwon 等[53]將 25 776 例患者的超聲心動圖報告格式化后,輸入 DL 模型訓練,得到了預測住院死亡率的模型,DL 模型在內部驗證、外部驗證、冠心病分組和心力衰竭分組的 AUC 分別為 0.912、0.898、0.958 和 0.913,明顯優于其它模型。Kilic 等[54]基于 XGBoost 算法開發了一個預測心臟手術死亡的模型,數據量共計 11 190 例,與胸外科醫師協會預測死亡風險模型(the Society of Thoracic Surgeons predicted risk of mortality,STS-PROM)相比,AUC 相近,但是模型的其它性能有適當的改善。Fernandes 等[55]比較了 5 種算法在預測心臟手術死亡風險的效能,數據量共計 5 015 例,最終發現 XGBoost 算法效能最佳,AUC 為 0.88。Hernandez-Suarez 等[56]訓練和比較 4 種預測經導管主動脈瓣置換術(TAVR)術后住院死亡率的 ML 模型,數據量為 10 883 例,最終發現邏輯回歸 ML 模型效能為最佳,AUC 為 0.92,其中,急性腎損傷是住院死亡最重要的預測因子(表 1)。

2.4 先天性心臟病相關預測
成人先天性心臟病方面,一項研究[57]納入 10 019 例成年先天性心臟病患者,收集他們的臨床、人口和檢查等數據,輸入原始數據訓練 DL 模型,用來預測診斷、疾病復雜性和心功能分級(NYHA),準確率分別為 91.1%、97.0% 和 90.6%,同時預測 6 個月內是否會進行多學科討論,準確率為 90.2%,而在藥物處理方面的預測準確率為 89.1%~94.3%。
Diller 等[58]利用 DL 對法洛四聯癥患者心臟 MRI 圖像進行自動分割和測量,得到相應的參數用來預測中遠期的死亡,發現自動測得的右心房平均面積和右心室縱向應變是預后的重要預測因子,如果右心房面積增大和右心室縱向應變下降,不良結局風險就會顯著增加。
Ruiz 等[59]利用 93 例單心室患兒臨床數據訓練貝葉斯模型,開發出一套心臟重癥監護預警指數(C-WIN)模型,在危險事件發生前的 1 h、2 h、4 h、6 h 和 8 h 5 個層面進行預測,最終 C-WIN 模型在不同層面的 AUC 在 0.73~0.88 之間,而在危險事件發生前的 1 h,AUC 為 0.88,敏感性為 84%,特異度為 81%,這樣有利于醫生對危重患者進行及時干預。
Chu 等[60]基于利用 7 種 ML 方法建立了先心病孕婦和其胎兒不良事件發生的風險模型,ML 模型的準確率和 AUC 分別接近 0.8 和 0.7,效果良好,有助于臨床醫生對患有先天性心臟病的孕婦進行精準的分層管理和診療。
2.5 高危人群心血管不良事件預測
Alaa 等[61]應用 DL 方法,利用英國生物樣本庫中的 423604 名基線資料無心血管疾病的居民數據,開發了相應的心血管疾病風險預測模型,每例數據均有 473 個參考變量,其中包含常見的風險因素,即年齡、性別、吸煙情況、血壓、糖尿病史、高血壓和體重指數等。最終得出的模型 AUC 為 0.774,比 Framingham 評分和 Cox 比例危險率模型顯著高,證明該自動預測模型具有更好的效能,其中 5 年心血管病發生事件為 4 801 例,自動預測模型成功預測的例數比 Framingham 評分多 368 例。
Dimopoulos 等[62]進行了類似的研究,其研究數據來自希臘一項納入 2 020 名成人的前瞻性研究。應用 KNN、RF 和決策樹3種模型進行訓練,評估 10 年心血管疾病發病率,最后與 HellenicSCORE 模型(即校準過的 EuroSCORE 模型)進行比較。最終結果顯示,HellenicSCORE 總體效能最好,RF 模型效能與之接近,KNN 算法表現最差。
Naushad 等[63]嘗試開發一種冠脈疾病早期預測工具。他們所用的算法包括集成 ML 算法(EMLA),多因素降維(MDR)和遞歸分區(RP),數據庫共有 648 例(364 例患者和 284 名健康人),輸入變量包括 5 個人口統計學特征、3 個常規特征和 14 個遺傳特征,輸出變量為冠脈疾病發生和冠脈狹窄。最終發現 EMLA 模型在疾病發生預測(89.3%)和狹窄預測(82.5%)方面優于其它模型,AUC 為 0.96,也明顯優于其它兩個模型。
3 小結與展望
本文綜述的研究均展示出 AI 在心血管醫學中的適用性和有效性,尤其是數據處理上,相比傳統統計學,AI 往往具有更好的預測性能。然而,心血管疾病相關的 AI 研究也存在一定的門檻,主要的門檻是算力、數據質量和算法適配。算力方面,由于芯片研發的進步、高性能運算設備的普及和云計算的興起,高算力的獲得不是太大的問題。數據質量方面,在國外,診療流程電子化和數據標準化程度比國內高,所以回顧性的數據質量比較高,也比較容易獲得,因此 AI 模型做起來相對簡單,相比之下,為了獲得質量更好的數據,我們還需要加強診療流程電子化和數據標準化程度。算法適配方面,目前國內的 AI 專家團隊其實不少,同時也有不少創業公司,因此只要醫生團隊積極尋求合作,就能獲得相應的技術支持。長遠來說,AI 距離臨床全面應用,還有很長的路要走,中間需要面臨的挑戰包括但不限于:(1)“黑匣子”效應,AI 模型對數據處理的過程和得出的規律很難用人能理解的方式表現出來,因此就像一個“黑匣子”,具有不可解釋性和不確定性,醫生和患者都很難接受;(2)倫理的矛盾,AI 模型做出決策時做不到考慮人文倫理等因素,真正應用一定會面臨倫理的矛盾;(3)各方利益的權衡,AI 模型可能會消滅一部分醫學中的重復性勞動,也可能會新增一些工作和崗位,新舊交替中各方可能存在利益的權衡需要解決;(4)診療方式革新帶來的其它改變,包括醫生工作模式的改變、數據的應用安全、AI 相關項目收費成本核算與分配等。
綜上所述,AI 可以輔助醫護人員更高效地工作,可以幫助醫生做出更全面和精確的決策,同時可以預測患者的預后并提醒醫生盡早干預,未來可能會消除現代臨床實踐中許多乏味的工作,讓醫生有更多的精力放在需要解讀和研究的地方。相比其它專業,心血管疾病的診療更依賴于多種模態的臨床數據,最佳的決策應該是基于所有可能有用的數據而得出的,因此未來的心血管醫生必將使用 AI 模型和軟件作為臨床常規輔助工具。總之,基于大數據的 AI 在心血管醫學的應用研究才剛起步,機遇與挑戰并存,前景廣闊。
利益沖突:無。
作者貢獻:邱海龍負責論文設計與初稿撰寫;郭惠明、姚澤陽、謝穩、徐小維、黃美萍、岑堅正負責論文審閱與部分內容修改;莊建負責論文設計、審閱與修改。
心血管疾病是全球導致死亡的首要原因[1],在中國,40% 以上的死亡與之相關[2]。為了減少心血管疾病帶來的死亡和不良影響,提升患者的預期壽命和改善患者的生活質量,盡早預測和提升診治水平顯得相同重要。預測方面,過往有研究者基于有限的明確的風險因素,例如高血壓、高血脂、吸煙、糖尿病和年齡等,提出過幾種心血管疾病預測模型[3-6],但是預測效能均顯不足,特異性和敏感性尚有待提高,難以做到個性化精準預測。隨著人們對健康的日益重視、就醫行為的改變,以及各種隨身設備發展和流行,越來越多的相關數據將被記錄下來,形成健康大數據,這些數據都有可能與心血管疾病的發生相關,都應該納入分析。診治方面,一直以來都非常依賴各種檢查,包括心電圖和各種影像檢查等,這些檢查數據量日益劇增,同時,臨床病歷電子化程度越來越高,診治過程中越來越多臨床數據被格式化或者非格式化記錄下來,形成了臨床大數據。不管是基于健康大數據的預測,還是基于臨床大數據的診治,都嚴重依賴于有經驗的醫師。然而,在巨大的病例數和數據量前,醫生的數量、精力、時間和處理數據的能力都嚴重不足。隨著硬件的發展,機器計算力呈指數增長,人工智能(artificial intelligence,AI)興起,為醫療大數據的處理和挖掘提供了新的可能。本文綜述了 AI 在心血管醫學中的應用現狀。
1 人工智能
AI 屬于計算機科學下面的一個分支,旨在模仿人類的認知功能,泛指能夠通過獲取廣泛的知識后,自行獲得推理和思考能力的通用系統。機器學習(machine learning,ML)是目前醫學領域應用最廣泛的 AI 方法,它可以直接分析大型、復雜且不同種類的數據,給出相應的解釋或者預測。ML 通常包含三個步驟—數據的準備、模型的選擇與訓練和模型驗證。按照學習方法,它可以大致分為監督學習(supervised learning)、非監督學習(unsupervised machine learning)和強化學習(reinforcement learning)。監督學習指的是研究者使用帶有標記結果或類別的觀察數據來訓練模型,從而對事物進行分類或對未來的事件進行預測。常用的監督學習算法包括樸素貝葉斯定理(Na?ve Bayes theorem)、K-近鄰算法(K-nearest neighbors,KNN)、支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)、極端梯度提升(extreme gradient boosting,XGBoost)、決策樹(decision tree)等。非監督學習指的是研究者直接利用無標記的原始數據訓練模型,讓算法本身去學習數據的內在結構和規律。常用的非監督學習算法包括均值聚類(K-means clustering)、分層聚類(hierarchical clustering)、主成分分析(principal component analysis)、奇異值分解(singular value decomposition)等。強化學習是基于行為心理學的 ML 的另一個新興分支學科。強化學習不要求預先給定任何數據,而是通過接收環境對動作的獎勵(反饋)獲得學習信息并更新模型參數。
ML 其中一個重要分支是深度學習(deep learning,DL),它由多層深度神經網絡(deep neural network,DNN)組成,輸入相關數據,通過多層 DNN 的處理,最后可以輸出相應的特征圖。同樣的,它也可以分為監督學習、非監督學習和強化學習。目前最具代表性的 DL 模型是卷積神經網絡(convolutional neural network,CNN)。DL 在圖像分類、圖像分割、自然語音處理、語音識別和基因組學中已經得到有效應用。
2 人工智能在心血管醫學中的應用
2.1 影像學
2.1.1 圖像采集和重建
超聲心動圖是心臟病學中應用最廣泛的影像學方法。有公司已經開發出基于 DL 的實時導航軟件,用于指導未經培訓的用戶獲取標準超聲心動圖視圖,通過該軟件,用戶可以不斷優化精確信號,從而不斷地接近標準視圖[7]。這些 DL 模型可以自動分析獲取的圖像數據集來識別和標注心臟解剖結構,然后對標準視圖進行切片顯示。這個程序的加入可以減少操作人員之間的差異,因為最佳視圖是基于數千個代表解剖變異譜的 DL 模型來選擇的。有研究[8]顯示,一個用來識別 8 個標準的三維超聲心動圖視圖的 CNN,與臨床醫生標記的訓練數據相比,準確率達到了 92%。這種圖像采集的自動化可以幫助非心臟病醫生在急性情況下使用超聲心動圖作為一線診斷工具,也有助于年輕心臟超聲醫師的培訓。
對于心臟磁共振成像(magnetic resonance imaging,MRI),高質量的成像需要有經驗的操作者細心地為患者定位和規劃圖像采集平面。有公司已經開發了基于 ML 的心臟解剖定位和采集平面自動規劃軟件,其與人工方法高度一致[9-10]。還有研究者應用 RF[11]和 CNN[12]對成像偽影進行實時檢測和消除。
2.1.2 圖像分割
在超聲心動圖中,左心室一直是大多數 AI 分割研究的焦點。與專家相比,使用 RF 分類器的全自動 ML 算法在二維超聲心動圖上描繪左心室心內膜邊界時表現出了良好的準確性[13]。還有研究者[14]應用 500 例患者的二維超聲圖像標記數據集訓練了一個 DL 模型,其在左心室心內膜和心外膜邊界分割方面均優于最先進的非 DL 方法。
可能是因為近年來心臟 MRI 分割任務所需的開放數據集增加了,心臟 MRI 中基于 AI 的分割算法比其它任何心臟成像方式都要多。目前,大部分研究都集中在心腔分割,在異常心肌組織區域的分割方面有相對較少的研究,如左心室瘢痕和心房纖維化。描繪心室和心肌的邊界是心臟 MRI 后處理的一個必需步驟,然而手工描繪非常耗時,而且存在描繪者偏差[15]。研究[16]表明,AI 算法可以自動完成這項任務,同時有望提高準確性和可重復性。有研究者[17]基于一個來自英國生物樣本庫的 4875 名受試者和 93500 張圖像的數據集,應用全卷積神經網絡(fully convolutional neural network,FCN)的模型對所有4個心腔進行了分割,其表現和臨床專家一樣好。另一個研究[18]證實,CNN 可以準確地分割左心室和描繪出與心臟病理相關的解剖形態變化。然而,目前的 DL 分割模型缺乏可靠性,常常不能與專家達成一致,或者會輸出不符合解剖學的分割結果[16]。
DL 在心臟 CT 中的首次應用是一種使用邊緣空間學習的算法,該算法通過逐步學習較低維的邊緣空間中的分類器來建模,并自動從三維體積中分割出所有4個心腔等[19]。后來,Gurpreet 等[20]將 U-Net(一個專為醫學圖像分割設計的 FCN)應用于心臟 CT 的分割中,獲得更為良好的表現。
2.1.3 自動測量
AI 已在二維和三維超聲心動圖的參數自動測量方面應用較多。早期的軟件使用傳統的 ML,基于二維左心室容積自動快速準確計算出左心室射血分數[21]。此后,ML 和 DL 算法被用于量化其它各種參數,如左心室肥大[22]、心肌運動特征[23]和縱向應變[24]。而目前的腔室定量指南推薦使用準確性和可重復性更好的三維超聲心動圖[25]。但是,三維超聲心動圖需要專門的訓練并費時,這限制了其在常規臨床實踐中的廣泛應用。研究[26-27]證實,基于三維超聲心動圖,ML 技術可以提供整個心動周期內快速、可重復的左心室和左心房容積自動測量,其參考值與心臟 MRI 相當。對這些 ML 算法進一步改進后,目前已經能夠測定左心室質量[28]、右心室容積和射血分數[29]。
DL 也可以用來量化心臟 MRI 上的一些參數。自動檢測心肌邊界的左心室分割算法現在可以全自動測量左心室體積、射血分數和質量,結果與專家高度一致[30-32]。有研究[33-34]已經應用 DL 算法自動分割右心室心內膜,可以得到跟專家測量一樣精確的右心室體積和射血分數。另外,基于 CNN 的算法能夠在特征空間中將左心室瘢痕與正常心肌分離,并準確量化缺血[35]和肥厚型[36]心肌病患者的瘢痕體積。同樣,有研究[37-38]提出全自動測量慢性心房顫動患者左心房瘢痕程度的模型,有利于更好地篩選需要導管消融的患者和選擇合適的消融策略。
冠狀動脈(冠脈)狹窄的檢測和量化可能是冠脈 CT 最重要的臨床應用,目前的報告是基于臨床醫生的主觀視覺評估。Kelm 等[39]使用 ML 算法自動識別、分級和分類鈣化斑塊和非鈣化斑塊引起的冠脈狹窄。通過中心線提取和管腔分割,在 229 個 CT 數據上訓練其 RF 模型,可以準確地進行狹窄識別和管腔橫截面積估計,平均每例處理時間為 1.8 s。同樣,Zreik 等[40]成功訓練出一個 CNN 來準確檢測冠脈斑塊,確定其組成,并可將冠脈狹窄分為阻塞性和非阻塞性。
2.2 心電圖
隨著可穿戴設備的增加,ML 在心電圖異常的自動檢測中可能非常有用。Ali 等[41]使用 DL 算法自動檢測心電心律失常,應用的數據集是超過 4 000 份長期心電動態心電圖記錄,最終該方法判別的平均正確率為 92.4%。Attia 等[42]研究表明,CNN也可以幫助從心電圖中識別無癥狀左心室收縮功能障礙患者。Galloway 等[43]研究基于心電圖的 ML 來篩查慢性腎病患者的高鉀血癥,數據集是來自梅奧診所等 3 個中心的 449 380 例患者的 1 576 581 份心電圖,最終該方法的受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)為 0.853~0.883,敏感性為 88.9%~91.3%。心電圖具有無創、便宜和可重復的特點,是臨床最常用的檢查之一,這些基于心電圖的 AI 篩查模型的研究,有望增加心電圖診斷多種疾病的準確性,同時拓寬心電圖可診斷的病種范圍。
2.3 心血管不良事件預測
利用多種臨床數據訓練 AI 模型來預測心血管不良事件的發生,可以幫助醫生提前辨別出不同風險層的患者,為他們制定個體化診療計劃,以及進行更有針對性的隨訪方案,進一步降低死亡率和不良事件的發生。Johnsson 等[44]應用人工神經網絡(artificial neural network,ANN)建立院外心臟驟停預后的預測模型,數據集來自 36 個中心的 932 例患者,采用 54 個臨床變量作為輸入變量,最終 AUC 為 0.891,表現明顯比邏輯回歸模型好,即使是簡化的 ANN 模型,即只將年齡、恢復自主循環時間和首次監測的心律情況作為輸入變量,其 AUC >0.852,同樣顯示出良好的性能,且更方便臨床使用。
Motwani 等[45]使用 10 030 例冠心病患者的冠脈 CT 數據集進行 ML 模型訓練,對預后進行預測。他們將 44 個 CT 衍生的參數,連同 25 個臨床參數,應用于 ML 算法預測 5 年隨訪的結果。首先根據信息增益排名自動選擇特征,然后使用 LogitBoost 算法構建模型,再進行十折交叉驗證。訓練得到的 ML 模型預測死亡的 AUC 為 0.79,顯著高于單獨使用傳統危險因素或 CT 參數建立的模型。van Rosendael 等[46]通過僅使用心臟 CT 衍生的影像學標記訓練的 ML 模型預測 8 844 例冠心病患者的預后,最終證實其 ML 模型在預測不良事件方面(AUC 為 0.771)明顯優于所有其它冠脈 CT 評分(AUC 為 0.69~0.70)。Johnson 等[47]研究了4種不同的 ML 模型的性能,使用 64 排心臟 CT 衍生的血管特征來預測 6 892 例患者中是否有后續死亡或心血管事件。結果表明,ML 模型對主要心血管不良事件患者的鑒別能力同樣優于所有傳統冠脈 CT 評分。
心臟手術相關性急性腎損傷(CSA-AKI)方面,Lee 等[48]基于 2 010 例心臟手術患者的數據,用 6 種機器學習方法分別建立模型,輸入的參數包括臨床基線資料、術中麻醉和手術數據,最終,XGBoost 模型的 AUC 最高,為 0.78,明顯高于傳統邏輯回歸分析的 0.69,決策樹、RF 和 SVM 與后者性能相當。Tseng 等[49]做了類似的研究,數據量共計 671 例,最終得出集成 RF 和 XGBoost 的 ML 模型的 AUC 最高,為 0.839,比單獨的 RF 模型高。另外,Li 等[50]用貝葉斯網絡做了相應的模型,數據量共計 5 533 例,用來預測 CSA-AKI 和嚴重 CSA-AKI,最終內部驗證 AUC 分別為 0.755 和 0.845,外部驗證 AUC 分別為 0.736 和 0.816,表現較為出色。
有 2 項研究[51-52]基于 ML 的方法對術后死亡風險進行預測,證實 ML 模型效能表現比 EuroSCORE(European System for Cardiac Operative Risk Evaluation)模型更好。Kwon 等[53]將 25 776 例患者的超聲心動圖報告格式化后,輸入 DL 模型訓練,得到了預測住院死亡率的模型,DL 模型在內部驗證、外部驗證、冠心病分組和心力衰竭分組的 AUC 分別為 0.912、0.898、0.958 和 0.913,明顯優于其它模型。Kilic 等[54]基于 XGBoost 算法開發了一個預測心臟手術死亡的模型,數據量共計 11 190 例,與胸外科醫師協會預測死亡風險模型(the Society of Thoracic Surgeons predicted risk of mortality,STS-PROM)相比,AUC 相近,但是模型的其它性能有適當的改善。Fernandes 等[55]比較了 5 種算法在預測心臟手術死亡風險的效能,數據量共計 5 015 例,最終發現 XGBoost 算法效能最佳,AUC 為 0.88。Hernandez-Suarez 等[56]訓練和比較 4 種預測經導管主動脈瓣置換術(TAVR)術后住院死亡率的 ML 模型,數據量為 10 883 例,最終發現邏輯回歸 ML 模型效能為最佳,AUC 為 0.92,其中,急性腎損傷是住院死亡最重要的預測因子(表 1)。

2.4 先天性心臟病相關預測
成人先天性心臟病方面,一項研究[57]納入 10 019 例成年先天性心臟病患者,收集他們的臨床、人口和檢查等數據,輸入原始數據訓練 DL 模型,用來預測診斷、疾病復雜性和心功能分級(NYHA),準確率分別為 91.1%、97.0% 和 90.6%,同時預測 6 個月內是否會進行多學科討論,準確率為 90.2%,而在藥物處理方面的預測準確率為 89.1%~94.3%。
Diller 等[58]利用 DL 對法洛四聯癥患者心臟 MRI 圖像進行自動分割和測量,得到相應的參數用來預測中遠期的死亡,發現自動測得的右心房平均面積和右心室縱向應變是預后的重要預測因子,如果右心房面積增大和右心室縱向應變下降,不良結局風險就會顯著增加。
Ruiz 等[59]利用 93 例單心室患兒臨床數據訓練貝葉斯模型,開發出一套心臟重癥監護預警指數(C-WIN)模型,在危險事件發生前的 1 h、2 h、4 h、6 h 和 8 h 5 個層面進行預測,最終 C-WIN 模型在不同層面的 AUC 在 0.73~0.88 之間,而在危險事件發生前的 1 h,AUC 為 0.88,敏感性為 84%,特異度為 81%,這樣有利于醫生對危重患者進行及時干預。
Chu 等[60]基于利用 7 種 ML 方法建立了先心病孕婦和其胎兒不良事件發生的風險模型,ML 模型的準確率和 AUC 分別接近 0.8 和 0.7,效果良好,有助于臨床醫生對患有先天性心臟病的孕婦進行精準的分層管理和診療。
2.5 高危人群心血管不良事件預測
Alaa 等[61]應用 DL 方法,利用英國生物樣本庫中的 423604 名基線資料無心血管疾病的居民數據,開發了相應的心血管疾病風險預測模型,每例數據均有 473 個參考變量,其中包含常見的風險因素,即年齡、性別、吸煙情況、血壓、糖尿病史、高血壓和體重指數等。最終得出的模型 AUC 為 0.774,比 Framingham 評分和 Cox 比例危險率模型顯著高,證明該自動預測模型具有更好的效能,其中 5 年心血管病發生事件為 4 801 例,自動預測模型成功預測的例數比 Framingham 評分多 368 例。
Dimopoulos 等[62]進行了類似的研究,其研究數據來自希臘一項納入 2 020 名成人的前瞻性研究。應用 KNN、RF 和決策樹3種模型進行訓練,評估 10 年心血管疾病發病率,最后與 HellenicSCORE 模型(即校準過的 EuroSCORE 模型)進行比較。最終結果顯示,HellenicSCORE 總體效能最好,RF 模型效能與之接近,KNN 算法表現最差。
Naushad 等[63]嘗試開發一種冠脈疾病早期預測工具。他們所用的算法包括集成 ML 算法(EMLA),多因素降維(MDR)和遞歸分區(RP),數據庫共有 648 例(364 例患者和 284 名健康人),輸入變量包括 5 個人口統計學特征、3 個常規特征和 14 個遺傳特征,輸出變量為冠脈疾病發生和冠脈狹窄。最終發現 EMLA 模型在疾病發生預測(89.3%)和狹窄預測(82.5%)方面優于其它模型,AUC 為 0.96,也明顯優于其它兩個模型。
3 小結與展望
本文綜述的研究均展示出 AI 在心血管醫學中的適用性和有效性,尤其是數據處理上,相比傳統統計學,AI 往往具有更好的預測性能。然而,心血管疾病相關的 AI 研究也存在一定的門檻,主要的門檻是算力、數據質量和算法適配。算力方面,由于芯片研發的進步、高性能運算設備的普及和云計算的興起,高算力的獲得不是太大的問題。數據質量方面,在國外,診療流程電子化和數據標準化程度比國內高,所以回顧性的數據質量比較高,也比較容易獲得,因此 AI 模型做起來相對簡單,相比之下,為了獲得質量更好的數據,我們還需要加強診療流程電子化和數據標準化程度。算法適配方面,目前國內的 AI 專家團隊其實不少,同時也有不少創業公司,因此只要醫生團隊積極尋求合作,就能獲得相應的技術支持。長遠來說,AI 距離臨床全面應用,還有很長的路要走,中間需要面臨的挑戰包括但不限于:(1)“黑匣子”效應,AI 模型對數據處理的過程和得出的規律很難用人能理解的方式表現出來,因此就像一個“黑匣子”,具有不可解釋性和不確定性,醫生和患者都很難接受;(2)倫理的矛盾,AI 模型做出決策時做不到考慮人文倫理等因素,真正應用一定會面臨倫理的矛盾;(3)各方利益的權衡,AI 模型可能會消滅一部分醫學中的重復性勞動,也可能會新增一些工作和崗位,新舊交替中各方可能存在利益的權衡需要解決;(4)診療方式革新帶來的其它改變,包括醫生工作模式的改變、數據的應用安全、AI 相關項目收費成本核算與分配等。
綜上所述,AI 可以輔助醫護人員更高效地工作,可以幫助醫生做出更全面和精確的決策,同時可以預測患者的預后并提醒醫生盡早干預,未來可能會消除現代臨床實踐中許多乏味的工作,讓醫生有更多的精力放在需要解讀和研究的地方。相比其它專業,心血管疾病的診療更依賴于多種模態的臨床數據,最佳的決策應該是基于所有可能有用的數據而得出的,因此未來的心血管醫生必將使用 AI 模型和軟件作為臨床常規輔助工具。總之,基于大數據的 AI 在心血管醫學的應用研究才剛起步,機遇與挑戰并存,前景廣闊。
利益沖突:無。
作者貢獻:邱海龍負責論文設計與初稿撰寫;郭惠明、姚澤陽、謝穩、徐小維、黃美萍、岑堅正負責論文審閱與部分內容修改;莊建負責論文設計、審閱與修改。