心血管疾病(cardiovascular disease, CVD)在全球范圍內造成了巨大的疾病負擔,針對 CVD 實現精確的診斷和評估對于患者預后的改善有著明確的意義。人工智能(artificial intelligence, AI)的出現以及在醫學領域的快速應用,使得各類 CVD 數據的分析和擬合有了新的實現路徑。目前 CVD 領域除了結構化的病歷資料外,還包括大量影像、電生理檢查帶來的非線性數據。如何利用 AI 來處理此類多源數據目前已有大量的研究進行了探索。因此,該文通過匯總現有各類研究,討論現有 AI 技術處理各類多源異構數據的方式,并分析其可能的優勢與不足,以期為未來 AI 在 CVD 中應用的發展方向提供證據支持。
引用本文: 霍暢, 李奕明. 利用人工智能處理心血管疾病多源數據的方法與展望. 華西醫學, 2023, 38(5): 758-764. doi: 10.7507/1002-0179.202302041 復制
心血管疾病(cardiovascular disease, CVD)是全球第一大死亡原因,也是首要的疾病負擔[1-2]。據世界衛生組織估計,每年歸因于 CVD 的死亡患者超過 1700 萬人[3]。中國目前 CVD 現患人數約為 3.3 億人,且在城鄉居民死亡構成比中占據首位[4]。CVD 患者精準早期診斷與風險評估是改善其預后的重要手段。CVD 相關的輔助檢查種類繁多,且進展迅速。然而,大量復雜及非線性的檢查結果可能超出了研究者的認識與經驗,傳統的度量工具以及回歸等手段顯然無法很好地處理這些數據。因此,除這些傳統方法外,還需要新的工具與思路來解決大數據時代下的“老問題”[5]。自 Hinton 在 2006 年再次提出深度學習的概念后,伴隨著計算機算力的提高、大規模公開數據集的建成以及神經網絡理論的更新,人工智能(artificial intelligence, AI)進入了 10 余年的快速暴發期[6-7]。而醫學檢查產生的海量影像、電信號等非線性數據及臨床研究中缺失值等問題的處理,都非常適合應用 AI 。目前已有大量研究利用機器學習建立了準確度較高的評估模型[8]。同時,利用深度神經網絡等技術可實現醫學影像病灶快速分割與自動檢出[9-10]。在 CVD 領域,可穿戴式心電檢測設備已經結合 AI 技術發展多年,已在心房顫動(房顫)的識別以及基于 CT 計算冠狀動脈(冠脈)血流儲備分數(CT-fractional flow reserve, CT-FFR)等方面取得了良好的臨床應用效果[11]。然而,CVD 采集數據特有的周期性與動態演進特點,以及心臟相對于其他系統在解剖層面的復雜性,使得 AI 的早期應用面臨著相當大的困難[12]。這些多種來源及表達類型的輸入數據被稱為多源特征[13]。如何利用 AI 正確理解與處理這些多源特征,是建立準確心血管評估模型的重要實現途徑。本文將對現有 AI 處理 CVD 多源數據的各類方法進行總結,并討論未來可能的發展方向與創新。
1 基于結構化數據建立 CVD 患者的診斷或預后模型
基于數字編碼或文本構建的結構化數據,利用回歸往往是建立模型最為可靠的方式,這樣的方法在既往臨床研究中已經廣泛應用。基于此類工具,可以很容易得到個體的預測值以及各危險因素的效應量[14]。而 AI 中各類更為強大的回歸及分類的方法,針對這一類結構化數據往往能表現出更為杰出的性能。利用各類機器學習算法,可以發掘非線性聯系[15]。這些在更高維空間中處理特征的方法,更為貼近醫學數據本身的特點[16],如隨機森林算法及極限梯度上升算法等[17]。
在急性冠脈綜合征或結構性心臟病領域,利用 AI 算法來擬合結構化數據進行診斷或者預測取得了較好的效果。相較于傳統的評分工具或者擬合方法,這類 AI 算法往往準確率更高。Than 等[18]在 2019 年發表的一項研究顯示,采用梯度遞增算法結合年齡、性別以及肌鈣蛋白 Ⅰ 變化時相開發的 AI 工具在急性心肌梗死預測方面表現出了良好的性能。其受試者操作特征(receiver operator characteristic, ROC)曲線下面積(area under the curve, AUC)達到了 0.96,相比于歐洲心臟病學會 0/3 h 診斷流程,其靈敏度和特異度均更高。而基于自適應提升算法以及 25 項臨床參數開發的 PRAISE(Machine Learning-based Prediction of Adverse Events Following an Acute Coronary Syndrome)評分,對于急性冠脈綜合征患者術后 1 年的心血管事件實現了較為準確的預測,在外部驗證集中 1 年死亡率預測方面的 AUC 為 0.92[19]。對于經導管主動脈瓣置換,一項研究提示機器學習算法對于患者的院內死亡預測 AUC 達到了 0.82,優于現有的其他評分工具[20]。然而,部分國家的大型注冊研究提示,機器學習等 AI 算法相比于傳統方法性能并沒有顯著提升[21-22]。各研究中各類算法的選擇與調整以及納入數據的特征均存在明顯差異,因此某些性能卓越的算法也難以確保其可以推廣于其他人群。此外,深度學習或強化學習等連接方式復雜且性能強大的算法,其可解釋性能往往相對較弱,而各類特征權重是臨床研究中非常關心的問題,如何兼顧“平衡木”的兩側,是數據科學家以及心血管醫生需要共同解決的問題[23]。
2 心血管影像的分割、計算以及評估方法
2.1 基于心臟 CT 影像的分割與評估方法
AI 算法在臨床醫學領域可以快速應用的一大原因在于其對圖像的處理性能有著先天的優勢。其利用大型圖像數據集開發或者驗證的算法,往往可以直接應用于臨床醫學進行圖像分割或者病灶識別[24-25]。AI 算法在 CVD 中的應用涵蓋了各類平掃 CT,以及以 CT 冠脈造影為代表的增強 CT,并在一定程度上實現了影像檢查的功能替代。van Velzen 等[26]的研究表明,利用 2 種連續卷積神經網絡(convolutional neural network, CNN),可以在各類胸部 CT 掃描方案中實現冠脈鈣化和胸部主動脈鈣化的檢測以及定量分割,其一致性良好,組內相關系數接近 0.99。Wolterink 等[27]發現即便在 CT 冠脈造影中,也能利用 CNN 等算法獲得患者的鈣化積分,這將有助于改進冠心病患者影像風險評估的全面性并使得患者減少射線暴露。
心臟局部解剖結構的分割有著明確的臨床價值。這些結構的分割可能有助于對患者進行解剖以及功能評價。由于心臟解剖的復雜性,傳統影像后處理方法難以取得較為精確的分割效果,而以 CNN 為代表的深度學習算法在該領域實現了較為明顯的突破[28]。de Vos 等[29]首先提出了利用 CNN 實現 3D 組織中解剖自動定位的方法,其 F1 值達到了 0.97,基于此類方法建立的左心室自動分割模型效果良好,平均 Dice 值達到了 0.85。此外,算法的更新使得心臟的整體分割快速進步,在一項彩色多普勒超聲公開數據集中實現了各腔室的準確分割,整體 Dice 值達到了 0.90[30-31]。值得一提的是,冠脈的分割與評估是心臟影像中較為特殊的一部分,由于其解剖中幾何形狀的復雜性與變異性,以及管腔病變與周圍結構的毗鄰關系,對其的處理難度較大。其冠脈樹的分割以及病變的檢出有著多種實現方式。其中,利用深度學習進行冠脈分割的前處理較為通用的方式是進行冠脈中心線的自動提取,有學者使用 CNN 算法在公開數據集中達到了冠脈中心線提取準確率為 0.93[32-33]。而較為常用的 U-Net 等算法,無論在冠脈血管直接分割或者病變直接識別中均體現了較好的能力[34]。部分冠脈影像隊列研究提示,使用 3D U-Net 算法或 Transformer 算法對于冠脈分割與冠心病診斷具有良好的效果,AUC 與 Dice 值均超過 0.70[35-36]。此外,對于 CT-FFR 的計算,除流體力學方程外,遞歸神經網絡等深度學習算法也常應用于其中,以獲得快速處理及更為準確的壓力評估結果。Itu 等[37]的研究結果提示,相較于傳統血流儲備分數,使用 AI 算法實現的 CT-FFR 準確率為 0.83。而目前已有數種此類基于 AI 的 CT-FFR 工具在國內外獲得商業化批準[38-39]。
2.2 基于心臟磁共振(cardiac magnetic resonance, CMR)實現患者的功能及預后評估
CMR 相較于 CT,在保留了優秀的空間分辨率的同時,顯著改善了時間分辨率,這使得基于患者心臟整體運動進行更為準確的功能學評估成為了可能。利用 AI 算法在 CMR 圖像上實現各房室分割的方法與 CT 類似,主要集中于全卷積網絡,此部分不再展開討論[40]。Bello 等[41]在肺高壓患者中,首先利用深度神經網絡實現了 CMR 影像中右心室的分割以及右心室運動軌跡的捕捉。而此部分輸出的 3D 運動模型會進一步輸入一個深度生存分析網絡,以實現患者的預后評估及危險分層。該方法顯著優于利用 CMR 右心室測量參數建立的傳統模型,并同時建立了右心室運動可視化模型以及基于患者個體的生存評估。而對于植入心臟復律除顫器患者的惡性心律失常以及心源性猝死的預測。Popescu 等[42]建立了一個混合的深度學習模型,該模型由多個網絡組成,各個網絡分別用于處理影像數據、臨床數據以及健康檢測設備中獲得的報警時間。該模型同樣融合 Cox 模型與神經網絡模型,以深度學習的方式進行患者個體水平的生存分析。該模型對于患者的 10 年心血管事件預測性能良好,外部驗證集中 ROC 曲線的 AUC 為 0.72。此外,該模型兼顧可解釋性,同時實現了影像結構以及臨床參數權重可視化。
此外,對于心肌淀粉樣變的患者,深度學習方法同樣可以結合 CMR 影像實現較為準確的預后評估。在一項 180 例患者的隊列研究中,AI 算法預測的 1 年死亡率較高,其 C-index 為 0.78 [43]。同樣 AI 算法也能結合 CMR 實現延遲強化病灶的檢出,并實現患者的風險評估[44]。然而,由于 CMR 檢查耗費的時間較長,在一定程度上限制了其應用,利用 AI 分析的 CMR 隊列研究規模大多遠小于臨床數據隊列研究或超聲隊列研究。但其較好的表現以及特有的時間優勢,未來或可結合小樣本學習算法在罕見心臟疾病中發揮更為重要的價值[45-46]。
2.3 心臟超聲 AI 的可能實現路徑
心臟超聲不同于放射影像,其兼具對患者心臟結構與功能的快速評估,以及輕量化和易于部署的特點,可廣泛用于患者的心臟健康初篩以及疾病診斷。理想的超聲 AI 模型應當包括自動切面選擇或引導及質量控制、自動化測量及功能評估、自動生成報告、診斷以及輔助的風險評估[47]。目前已有商品化的 AI 超聲引導軟件 Caption Guidance,該軟件的引導與評估主要依賴于一個多層的 CNN,8 位未經訓練的護士應用該軟件進行患者的心臟超聲檢查,其中對于左心室大小、功能以及心包積液檢查的準確率達到 98.8%,對于右心室大小的準確率為 92.5%[48]。超聲中各腔室結構的分割同樣依賴于 CNN 及 U-Net 等,其中對于左心室舒張末容積與專家測值的平均相關系數大多超過 0.90[49]。有多中心研究利用深度神經網絡,實現心臟超聲中結構的自動分割與功能測量,其中對于心臟結構參數診斷的平均準確率超過 0.90[50-51]。這提示采用 AI 引導的自動化流程可以加快診治流程,在保證準確率的同時,可降低心力衰竭(心衰)患者的經濟負擔。
除了對心功能以及心衰的評估,超聲 AI 目前也用于其他結構性心臟病的診斷。Andreassen 等[52]利用 CNN 和經食道超聲實現了對二尖瓣瓣環較為準確的定位,相對于專家評估其標準差僅為 1.9 mm。有研究者基于一款超聲 AI 軟件對患者的心臟瓣膜進行分析,所獲得的二尖瓣相關 6 項解剖參數均與專家測量值高度相關[53]。Ghesu 等[54]使用一種邊緣空間深度學習方法實現了自動化的心臟瓣膜 3D 容積分割,且與評價基準(心臟增強 CT)的一致性良好。此外,AI 心臟超聲也可定性評價各瓣膜反流程度[55]。一項大樣本量研究顯示,基于深度學習分析心臟超聲建立的院內死亡風險評估模型的 AUC 為 0.92,遠優于其他傳統評分工具[56]。Ghorbani 等[57]基于深度學習模型,發現了心臟超聲與患者表型(包括年齡、性別等)的相關性。可見心臟超聲 AI 可以用于 CVD 患者診治的各個階段,并輔助實現全程的風險評估。而此類 AI 工具也最有可能覆蓋我國基層醫院及社區醫院,實現大范圍 CVD 患者的早期篩查與評估。
2.4 AI 驅動的有創冠脈造影(invasive coronary angiography, ICA)及腔內影像學評估方案
ICA 是冠心病、結構性心臟病等 CVD 的重要診斷及治療途徑。臨床醫師主要基于視覺方案對冠脈的狹窄程度進行判斷,但這種基于經驗的方法具有較大的評估者間差異,同時具有較高的陽性預測偏倚[58]。基于 AI 進行 ICA 影像分析,是實現臨床可用的自動化定量冠脈造影的可行方案。Au 等[59]在 ICA 影像的靜態幀中使用 CNN 算法,對右冠脈狹窄的定位準確率為 72.7%,其分割 Dice 值為 0.704。而結合關鍵幀檢測與全卷積網絡類算法,可進一步實現 ICA 影像的動態分析與快速評估。國內外學者合作發表的一項研究顯示,基于改進的 U-Net 算法可以快速準確地實現 ICA 下的冠脈血管樹分割,其 Dice 值為 0.89,靈敏度為 0.87[60]。同時該團隊進一步通過中心線提取、關鍵點檢測,實現了基于動態 ICA 影像的冠脈狹窄評估,其特異度超過 99%[61]。
此外,AI 算法也在腔內影像學中應用廣泛。深度學習算法不僅可以在血管內超聲中對管腔、血管壁、斑塊以及已植入支架進行準確分割[62]。同時可以基于治療前的血管內超聲影像對支架的擴張形態進行預測,準確率達到 94%[63]。基于 2D CNN 算法或其他機器學習算法,ICA 及血管內超聲通常可以提供大量可供訓練的圖像幀。因此,對于此類介入影像可能僅需利用相對較少的患者便可完成分割或預測模型的建立,這對心臟病患者的治療決策優化有積極意義。
3 AI 賦能心電圖的價值
目前心電圖 AI 處理的一類主流方法為使用 CNN 對各導聯心電圖進行卷積與池化,并建立與結果之間的聯系[64]。此外,自然語言處理、強化學習以及無監督算法等 AI 技術也在心電圖處理中有一定應用[65]。其中,對于異常心電圖的 AI 診斷與識別發展較為成熟。Ribeiro 等[66]基于大規模人群,結合類似于殘差網絡的 CNN 算法,實現了包括房顫、房室傳導阻滯等在內的 6 種異常心電圖的自動診斷,其 F1 值為 0.80,而特異度超過了 99%。另一項由美國 Mayo 發表的大型隊列研究顯示,AI 算法對包括心律失常、心肌缺血等在內的 62 種心電圖編碼表現出了極高的準確率,其 AUC 超過 0.98,特異度均超過 0.95[67]。這提示 AI 技術除能節省心電圖的操作時間以外,其強大的診斷性能也能輔助臨床醫生進行更為精確的診治。此外,美國 Mayo 的心電圖隊列研究顯示,使用 CNN 算法分析患者正常的竇性心律心電圖,同樣能診斷出患者是否有房顫,其 AUC 為 0.87,特異度為 0.79,這類技術將有助于無癥狀房顫或陣發性房顫患者的早期識別[68]。對于其他有明顯心電圖異常的臨床疾病,包括肥厚性心肌病、高鉀血癥以及瓣膜疾病等,AI 算法同樣表現出了良好的檢出能力[69-70]。此外,AI 賦能心電圖也能實現對于患者預后的預測,在一項超過 16 萬名患者的隊列研究中,Raghunath 等[71]利用深度神經網絡預測患者 1 年的全因死亡情況,其 AUC 為 0.88;即便在醫生認為是正常心電圖的亞組中,AI 算法的預測 AUC 也達到了 0.85。這表明專家的經驗和認知無法識別出心電圖中可能存在的所有問題,而未來人-機結合的 AI 診斷模式可能帶來更多的額外獲益。
4 CVD 患者多源異構數據的融合
多種來源或者模態的數據的融合任務包括數據的表達、轉換、對齊以及融合[67]。CVD 相關的多種檢查數據應當使用恰當的方式進行全面的匯總,以對患者的健康狀況或疾病風險進行全面的評估。患者的影像、數字、文本等數據的融合有多重的實現路徑與算法,大部分 AI 模型通常在使用子網絡進行各類數據編碼/解碼后,再通過全連接網絡的形式進行融合與學習,前述植入心臟復律除顫器患者的猝死及心律失常等風險模型便使用了這類方式[42]。另一項研究中,Wu 等[72]使用近似網絡融合(similarity network fusion)技術來處理射血分數保留心衰患者的多組學數據,從而判斷患者的心衰情況及遠期預后。其中 AI 判斷出的高危組患者的 5 年死亡率遠高于低危組患者。而圖神經網絡算法的出現使得通過 AI 來處理更為復雜的非歐幾里得心臟數據成為可能[73]。Dalton 等[74]通過 DeepEmulator 及 MeshGraphNets 兩類圖神經網絡算法來融合心臟解剖測量值、血流動力學及心臟幾何結構等數據,以構造心臟力學模型,兩種算法均表現出了較高的準確率。因此,在 AI 相關技術的支持下,無需將各類特征進行嚴格的數值轉化或降維,便能實現盡可能保證模型精度的同時又不損失原有信息,從而實現更為全面、精確的診斷和評估。
5 未來展望
AI 技術在 CVD 領域的應用使得精確的風險評估、快速的影像分析以及基于健康設備的智能化管理成為了可能。多種由 AI 驅動的心血管智能軟件或系統已獲得美國食品藥品監督管理局或中國國家藥品監督管理局批準,如 Caption Guidance、Deepvessel、US2.AI 等[39, 48, 51]。自 2012 年 ImageNet 數據集大規模應用以及深度 CNN 應用以來,AI 已快速發展 10 年。大量 AI 專家以及臨床科學家進行了努力和嘗試,試圖找到 AI 在醫學領域“落地”的窗口。然而,目前大多數臨床工作者僅能從文章及報道中了解這類技術的精準與便捷。即便目前已利用 AI 開發了大量區分度更好的風險評估模型,但美國紐約心臟病協會心功能分級及 STS(Society of Thoracic Surgeons)評分仍是臨床研究中的基石,這其中的問題與矛盾值得我們思考。例如,如何兼顧 AI 性能與臨床應用中重視的可解釋性問題,并完善相關的法律法規監管,進一步促使 AI 指導的隨機對照試驗開展并匯總高質量的證據。這些壁壘的突破依賴于 AI 專家與臨床專家的共同努力和換位思考。其中,關于心臟影像已建立了部分公開數據集,臨床研究的 TRIPOD (Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis)評價指南已逐步更新為適用于 AI 應用的版本[75-76]。對復雜異構數據處理的研究將有助于解決 AI 在醫學應用中的可解釋性、評價標準以及偏倚識別等問題,并推動建設各類具有多源特征(如臨床數值、心臟超聲、CMR 等)的基準數據集以及制定有針對性的倫理及監管法規,最終為 CVD 患者的精準診治提供新的實現路徑[77]。
利益沖突:所有作者聲明不存在利益沖突。
心血管疾病(cardiovascular disease, CVD)是全球第一大死亡原因,也是首要的疾病負擔[1-2]。據世界衛生組織估計,每年歸因于 CVD 的死亡患者超過 1700 萬人[3]。中國目前 CVD 現患人數約為 3.3 億人,且在城鄉居民死亡構成比中占據首位[4]。CVD 患者精準早期診斷與風險評估是改善其預后的重要手段。CVD 相關的輔助檢查種類繁多,且進展迅速。然而,大量復雜及非線性的檢查結果可能超出了研究者的認識與經驗,傳統的度量工具以及回歸等手段顯然無法很好地處理這些數據。因此,除這些傳統方法外,還需要新的工具與思路來解決大數據時代下的“老問題”[5]。自 Hinton 在 2006 年再次提出深度學習的概念后,伴隨著計算機算力的提高、大規模公開數據集的建成以及神經網絡理論的更新,人工智能(artificial intelligence, AI)進入了 10 余年的快速暴發期[6-7]。而醫學檢查產生的海量影像、電信號等非線性數據及臨床研究中缺失值等問題的處理,都非常適合應用 AI 。目前已有大量研究利用機器學習建立了準確度較高的評估模型[8]。同時,利用深度神經網絡等技術可實現醫學影像病灶快速分割與自動檢出[9-10]。在 CVD 領域,可穿戴式心電檢測設備已經結合 AI 技術發展多年,已在心房顫動(房顫)的識別以及基于 CT 計算冠狀動脈(冠脈)血流儲備分數(CT-fractional flow reserve, CT-FFR)等方面取得了良好的臨床應用效果[11]。然而,CVD 采集數據特有的周期性與動態演進特點,以及心臟相對于其他系統在解剖層面的復雜性,使得 AI 的早期應用面臨著相當大的困難[12]。這些多種來源及表達類型的輸入數據被稱為多源特征[13]。如何利用 AI 正確理解與處理這些多源特征,是建立準確心血管評估模型的重要實現途徑。本文將對現有 AI 處理 CVD 多源數據的各類方法進行總結,并討論未來可能的發展方向與創新。
1 基于結構化數據建立 CVD 患者的診斷或預后模型
基于數字編碼或文本構建的結構化數據,利用回歸往往是建立模型最為可靠的方式,這樣的方法在既往臨床研究中已經廣泛應用。基于此類工具,可以很容易得到個體的預測值以及各危險因素的效應量[14]。而 AI 中各類更為強大的回歸及分類的方法,針對這一類結構化數據往往能表現出更為杰出的性能。利用各類機器學習算法,可以發掘非線性聯系[15]。這些在更高維空間中處理特征的方法,更為貼近醫學數據本身的特點[16],如隨機森林算法及極限梯度上升算法等[17]。
在急性冠脈綜合征或結構性心臟病領域,利用 AI 算法來擬合結構化數據進行診斷或者預測取得了較好的效果。相較于傳統的評分工具或者擬合方法,這類 AI 算法往往準確率更高。Than 等[18]在 2019 年發表的一項研究顯示,采用梯度遞增算法結合年齡、性別以及肌鈣蛋白 Ⅰ 變化時相開發的 AI 工具在急性心肌梗死預測方面表現出了良好的性能。其受試者操作特征(receiver operator characteristic, ROC)曲線下面積(area under the curve, AUC)達到了 0.96,相比于歐洲心臟病學會 0/3 h 診斷流程,其靈敏度和特異度均更高。而基于自適應提升算法以及 25 項臨床參數開發的 PRAISE(Machine Learning-based Prediction of Adverse Events Following an Acute Coronary Syndrome)評分,對于急性冠脈綜合征患者術后 1 年的心血管事件實現了較為準確的預測,在外部驗證集中 1 年死亡率預測方面的 AUC 為 0.92[19]。對于經導管主動脈瓣置換,一項研究提示機器學習算法對于患者的院內死亡預測 AUC 達到了 0.82,優于現有的其他評分工具[20]。然而,部分國家的大型注冊研究提示,機器學習等 AI 算法相比于傳統方法性能并沒有顯著提升[21-22]。各研究中各類算法的選擇與調整以及納入數據的特征均存在明顯差異,因此某些性能卓越的算法也難以確保其可以推廣于其他人群。此外,深度學習或強化學習等連接方式復雜且性能強大的算法,其可解釋性能往往相對較弱,而各類特征權重是臨床研究中非常關心的問題,如何兼顧“平衡木”的兩側,是數據科學家以及心血管醫生需要共同解決的問題[23]。
2 心血管影像的分割、計算以及評估方法
2.1 基于心臟 CT 影像的分割與評估方法
AI 算法在臨床醫學領域可以快速應用的一大原因在于其對圖像的處理性能有著先天的優勢。其利用大型圖像數據集開發或者驗證的算法,往往可以直接應用于臨床醫學進行圖像分割或者病灶識別[24-25]。AI 算法在 CVD 中的應用涵蓋了各類平掃 CT,以及以 CT 冠脈造影為代表的增強 CT,并在一定程度上實現了影像檢查的功能替代。van Velzen 等[26]的研究表明,利用 2 種連續卷積神經網絡(convolutional neural network, CNN),可以在各類胸部 CT 掃描方案中實現冠脈鈣化和胸部主動脈鈣化的檢測以及定量分割,其一致性良好,組內相關系數接近 0.99。Wolterink 等[27]發現即便在 CT 冠脈造影中,也能利用 CNN 等算法獲得患者的鈣化積分,這將有助于改進冠心病患者影像風險評估的全面性并使得患者減少射線暴露。
心臟局部解剖結構的分割有著明確的臨床價值。這些結構的分割可能有助于對患者進行解剖以及功能評價。由于心臟解剖的復雜性,傳統影像后處理方法難以取得較為精確的分割效果,而以 CNN 為代表的深度學習算法在該領域實現了較為明顯的突破[28]。de Vos 等[29]首先提出了利用 CNN 實現 3D 組織中解剖自動定位的方法,其 F1 值達到了 0.97,基于此類方法建立的左心室自動分割模型效果良好,平均 Dice 值達到了 0.85。此外,算法的更新使得心臟的整體分割快速進步,在一項彩色多普勒超聲公開數據集中實現了各腔室的準確分割,整體 Dice 值達到了 0.90[30-31]。值得一提的是,冠脈的分割與評估是心臟影像中較為特殊的一部分,由于其解剖中幾何形狀的復雜性與變異性,以及管腔病變與周圍結構的毗鄰關系,對其的處理難度較大。其冠脈樹的分割以及病變的檢出有著多種實現方式。其中,利用深度學習進行冠脈分割的前處理較為通用的方式是進行冠脈中心線的自動提取,有學者使用 CNN 算法在公開數據集中達到了冠脈中心線提取準確率為 0.93[32-33]。而較為常用的 U-Net 等算法,無論在冠脈血管直接分割或者病變直接識別中均體現了較好的能力[34]。部分冠脈影像隊列研究提示,使用 3D U-Net 算法或 Transformer 算法對于冠脈分割與冠心病診斷具有良好的效果,AUC 與 Dice 值均超過 0.70[35-36]。此外,對于 CT-FFR 的計算,除流體力學方程外,遞歸神經網絡等深度學習算法也常應用于其中,以獲得快速處理及更為準確的壓力評估結果。Itu 等[37]的研究結果提示,相較于傳統血流儲備分數,使用 AI 算法實現的 CT-FFR 準確率為 0.83。而目前已有數種此類基于 AI 的 CT-FFR 工具在國內外獲得商業化批準[38-39]。
2.2 基于心臟磁共振(cardiac magnetic resonance, CMR)實現患者的功能及預后評估
CMR 相較于 CT,在保留了優秀的空間分辨率的同時,顯著改善了時間分辨率,這使得基于患者心臟整體運動進行更為準確的功能學評估成為了可能。利用 AI 算法在 CMR 圖像上實現各房室分割的方法與 CT 類似,主要集中于全卷積網絡,此部分不再展開討論[40]。Bello 等[41]在肺高壓患者中,首先利用深度神經網絡實現了 CMR 影像中右心室的分割以及右心室運動軌跡的捕捉。而此部分輸出的 3D 運動模型會進一步輸入一個深度生存分析網絡,以實現患者的預后評估及危險分層。該方法顯著優于利用 CMR 右心室測量參數建立的傳統模型,并同時建立了右心室運動可視化模型以及基于患者個體的生存評估。而對于植入心臟復律除顫器患者的惡性心律失常以及心源性猝死的預測。Popescu 等[42]建立了一個混合的深度學習模型,該模型由多個網絡組成,各個網絡分別用于處理影像數據、臨床數據以及健康檢測設備中獲得的報警時間。該模型同樣融合 Cox 模型與神經網絡模型,以深度學習的方式進行患者個體水平的生存分析。該模型對于患者的 10 年心血管事件預測性能良好,外部驗證集中 ROC 曲線的 AUC 為 0.72。此外,該模型兼顧可解釋性,同時實現了影像結構以及臨床參數權重可視化。
此外,對于心肌淀粉樣變的患者,深度學習方法同樣可以結合 CMR 影像實現較為準確的預后評估。在一項 180 例患者的隊列研究中,AI 算法預測的 1 年死亡率較高,其 C-index 為 0.78 [43]。同樣 AI 算法也能結合 CMR 實現延遲強化病灶的檢出,并實現患者的風險評估[44]。然而,由于 CMR 檢查耗費的時間較長,在一定程度上限制了其應用,利用 AI 分析的 CMR 隊列研究規模大多遠小于臨床數據隊列研究或超聲隊列研究。但其較好的表現以及特有的時間優勢,未來或可結合小樣本學習算法在罕見心臟疾病中發揮更為重要的價值[45-46]。
2.3 心臟超聲 AI 的可能實現路徑
心臟超聲不同于放射影像,其兼具對患者心臟結構與功能的快速評估,以及輕量化和易于部署的特點,可廣泛用于患者的心臟健康初篩以及疾病診斷。理想的超聲 AI 模型應當包括自動切面選擇或引導及質量控制、自動化測量及功能評估、自動生成報告、診斷以及輔助的風險評估[47]。目前已有商品化的 AI 超聲引導軟件 Caption Guidance,該軟件的引導與評估主要依賴于一個多層的 CNN,8 位未經訓練的護士應用該軟件進行患者的心臟超聲檢查,其中對于左心室大小、功能以及心包積液檢查的準確率達到 98.8%,對于右心室大小的準確率為 92.5%[48]。超聲中各腔室結構的分割同樣依賴于 CNN 及 U-Net 等,其中對于左心室舒張末容積與專家測值的平均相關系數大多超過 0.90[49]。有多中心研究利用深度神經網絡,實現心臟超聲中結構的自動分割與功能測量,其中對于心臟結構參數診斷的平均準確率超過 0.90[50-51]。這提示采用 AI 引導的自動化流程可以加快診治流程,在保證準確率的同時,可降低心力衰竭(心衰)患者的經濟負擔。
除了對心功能以及心衰的評估,超聲 AI 目前也用于其他結構性心臟病的診斷。Andreassen 等[52]利用 CNN 和經食道超聲實現了對二尖瓣瓣環較為準確的定位,相對于專家評估其標準差僅為 1.9 mm。有研究者基于一款超聲 AI 軟件對患者的心臟瓣膜進行分析,所獲得的二尖瓣相關 6 項解剖參數均與專家測量值高度相關[53]。Ghesu 等[54]使用一種邊緣空間深度學習方法實現了自動化的心臟瓣膜 3D 容積分割,且與評價基準(心臟增強 CT)的一致性良好。此外,AI 心臟超聲也可定性評價各瓣膜反流程度[55]。一項大樣本量研究顯示,基于深度學習分析心臟超聲建立的院內死亡風險評估模型的 AUC 為 0.92,遠優于其他傳統評分工具[56]。Ghorbani 等[57]基于深度學習模型,發現了心臟超聲與患者表型(包括年齡、性別等)的相關性。可見心臟超聲 AI 可以用于 CVD 患者診治的各個階段,并輔助實現全程的風險評估。而此類 AI 工具也最有可能覆蓋我國基層醫院及社區醫院,實現大范圍 CVD 患者的早期篩查與評估。
2.4 AI 驅動的有創冠脈造影(invasive coronary angiography, ICA)及腔內影像學評估方案
ICA 是冠心病、結構性心臟病等 CVD 的重要診斷及治療途徑。臨床醫師主要基于視覺方案對冠脈的狹窄程度進行判斷,但這種基于經驗的方法具有較大的評估者間差異,同時具有較高的陽性預測偏倚[58]。基于 AI 進行 ICA 影像分析,是實現臨床可用的自動化定量冠脈造影的可行方案。Au 等[59]在 ICA 影像的靜態幀中使用 CNN 算法,對右冠脈狹窄的定位準確率為 72.7%,其分割 Dice 值為 0.704。而結合關鍵幀檢測與全卷積網絡類算法,可進一步實現 ICA 影像的動態分析與快速評估。國內外學者合作發表的一項研究顯示,基于改進的 U-Net 算法可以快速準確地實現 ICA 下的冠脈血管樹分割,其 Dice 值為 0.89,靈敏度為 0.87[60]。同時該團隊進一步通過中心線提取、關鍵點檢測,實現了基于動態 ICA 影像的冠脈狹窄評估,其特異度超過 99%[61]。
此外,AI 算法也在腔內影像學中應用廣泛。深度學習算法不僅可以在血管內超聲中對管腔、血管壁、斑塊以及已植入支架進行準確分割[62]。同時可以基于治療前的血管內超聲影像對支架的擴張形態進行預測,準確率達到 94%[63]。基于 2D CNN 算法或其他機器學習算法,ICA 及血管內超聲通常可以提供大量可供訓練的圖像幀。因此,對于此類介入影像可能僅需利用相對較少的患者便可完成分割或預測模型的建立,這對心臟病患者的治療決策優化有積極意義。
3 AI 賦能心電圖的價值
目前心電圖 AI 處理的一類主流方法為使用 CNN 對各導聯心電圖進行卷積與池化,并建立與結果之間的聯系[64]。此外,自然語言處理、強化學習以及無監督算法等 AI 技術也在心電圖處理中有一定應用[65]。其中,對于異常心電圖的 AI 診斷與識別發展較為成熟。Ribeiro 等[66]基于大規模人群,結合類似于殘差網絡的 CNN 算法,實現了包括房顫、房室傳導阻滯等在內的 6 種異常心電圖的自動診斷,其 F1 值為 0.80,而特異度超過了 99%。另一項由美國 Mayo 發表的大型隊列研究顯示,AI 算法對包括心律失常、心肌缺血等在內的 62 種心電圖編碼表現出了極高的準確率,其 AUC 超過 0.98,特異度均超過 0.95[67]。這提示 AI 技術除能節省心電圖的操作時間以外,其強大的診斷性能也能輔助臨床醫生進行更為精確的診治。此外,美國 Mayo 的心電圖隊列研究顯示,使用 CNN 算法分析患者正常的竇性心律心電圖,同樣能診斷出患者是否有房顫,其 AUC 為 0.87,特異度為 0.79,這類技術將有助于無癥狀房顫或陣發性房顫患者的早期識別[68]。對于其他有明顯心電圖異常的臨床疾病,包括肥厚性心肌病、高鉀血癥以及瓣膜疾病等,AI 算法同樣表現出了良好的檢出能力[69-70]。此外,AI 賦能心電圖也能實現對于患者預后的預測,在一項超過 16 萬名患者的隊列研究中,Raghunath 等[71]利用深度神經網絡預測患者 1 年的全因死亡情況,其 AUC 為 0.88;即便在醫生認為是正常心電圖的亞組中,AI 算法的預測 AUC 也達到了 0.85。這表明專家的經驗和認知無法識別出心電圖中可能存在的所有問題,而未來人-機結合的 AI 診斷模式可能帶來更多的額外獲益。
4 CVD 患者多源異構數據的融合
多種來源或者模態的數據的融合任務包括數據的表達、轉換、對齊以及融合[67]。CVD 相關的多種檢查數據應當使用恰當的方式進行全面的匯總,以對患者的健康狀況或疾病風險進行全面的評估。患者的影像、數字、文本等數據的融合有多重的實現路徑與算法,大部分 AI 模型通常在使用子網絡進行各類數據編碼/解碼后,再通過全連接網絡的形式進行融合與學習,前述植入心臟復律除顫器患者的猝死及心律失常等風險模型便使用了這類方式[42]。另一項研究中,Wu 等[72]使用近似網絡融合(similarity network fusion)技術來處理射血分數保留心衰患者的多組學數據,從而判斷患者的心衰情況及遠期預后。其中 AI 判斷出的高危組患者的 5 年死亡率遠高于低危組患者。而圖神經網絡算法的出現使得通過 AI 來處理更為復雜的非歐幾里得心臟數據成為可能[73]。Dalton 等[74]通過 DeepEmulator 及 MeshGraphNets 兩類圖神經網絡算法來融合心臟解剖測量值、血流動力學及心臟幾何結構等數據,以構造心臟力學模型,兩種算法均表現出了較高的準確率。因此,在 AI 相關技術的支持下,無需將各類特征進行嚴格的數值轉化或降維,便能實現盡可能保證模型精度的同時又不損失原有信息,從而實現更為全面、精確的診斷和評估。
5 未來展望
AI 技術在 CVD 領域的應用使得精確的風險評估、快速的影像分析以及基于健康設備的智能化管理成為了可能。多種由 AI 驅動的心血管智能軟件或系統已獲得美國食品藥品監督管理局或中國國家藥品監督管理局批準,如 Caption Guidance、Deepvessel、US2.AI 等[39, 48, 51]。自 2012 年 ImageNet 數據集大規模應用以及深度 CNN 應用以來,AI 已快速發展 10 年。大量 AI 專家以及臨床科學家進行了努力和嘗試,試圖找到 AI 在醫學領域“落地”的窗口。然而,目前大多數臨床工作者僅能從文章及報道中了解這類技術的精準與便捷。即便目前已利用 AI 開發了大量區分度更好的風險評估模型,但美國紐約心臟病協會心功能分級及 STS(Society of Thoracic Surgeons)評分仍是臨床研究中的基石,這其中的問題與矛盾值得我們思考。例如,如何兼顧 AI 性能與臨床應用中重視的可解釋性問題,并完善相關的法律法規監管,進一步促使 AI 指導的隨機對照試驗開展并匯總高質量的證據。這些壁壘的突破依賴于 AI 專家與臨床專家的共同努力和換位思考。其中,關于心臟影像已建立了部分公開數據集,臨床研究的 TRIPOD (Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis)評價指南已逐步更新為適用于 AI 應用的版本[75-76]。對復雜異構數據處理的研究將有助于解決 AI 在醫學應用中的可解釋性、評價標準以及偏倚識別等問題,并推動建設各類具有多源特征(如臨床數值、心臟超聲、CMR 等)的基準數據集以及制定有針對性的倫理及監管法規,最終為 CVD 患者的精準診治提供新的實現路徑[77]。
利益沖突:所有作者聲明不存在利益沖突。