引用本文: 石桓旭, 何培宇, 童琪, 王政捷, 李濤, 錢永軍, 趙啟軍, 潘帆. 基于機器學習的瓣膜病心房顫動射頻消融術后復發預測及風險因素分析. 中國胸心血管外科臨床雜志, 2022, 29(7): 840-847. doi: 10.7507/1007-4848.202204056 復制
心房顫動(房顫)是臨床上最常見的心律失常,在全球發病率近1%,特別是瓣膜病患者更易伴發[1]。將其恢復和維持至竇性心律是臨床治療策略之一[2]。目前臨床上用于治療房顫的最有效措施為射頻消融術[3]。與一些抗心律失常藥物相比,房顫射頻消融術使患者恢復竇性心律的成功率更高[3]。然而,由于患者的個體和病情差異,射頻消融術仍存在15%~70%的復發概率[3]。考慮到房顫射頻消融術費用昂貴,且伴隨著較少但確定的嚴重并發癥風險,在實施房顫消融治療之前,最好能對結果進行估計和預測[4]。識別出不太可能保持竇性心律的患者是提高治療成功率、減少無效消融帶來的不必要風險和費用的合理方法[5]。另一方面,研究[6]發現,一些患者特征與房顫成功率較低有關,如心房纖維化、左心房大小、高血壓等。因此,分析房顫射頻消融術后復發的風險因素具有十分重要的臨床意義,如果能根據現有臨床資料找到影響消融結果的因素,可能會進一步提高消融成功率。
近年來,機器學習技術因其能高效處理復雜且耗時任務而被廣泛地應用于醫學領域,主要包括疾病診斷、藥物制作、醫療數據分析等[7]。本研究通過機器學習技術對房顫射頻消融后的復發進行預測,并找到一些影響復發的風險因素,期待為房顫射頻消融治療提供參考。
1 資料與方法
1.1 臨床資料和分組
回顧性分析2017年1月—2021年1月期間在四川大學華西醫院及其分院(上錦分院)接受同期射頻消融治療的瓣膜病房顫患者的臨床資料。納入標準:心電圖或24 h動態心電圖確診為房顫;在我院進行射頻消融手術,且術后在門診進行規律復診。排除標準:臨床及隨訪資料不完整或缺失值過多的患者。最終納入了300例符合條件的患者,其中男 129 例、女 171 例,平均年齡 52.56 歲。根據術后房顫是否復發將患者分為復發組(61例)和未復發組(239例)。
1.2 術后隨訪
對每例接受房顫射頻消融手術的患者術后每3個月進行一次隨訪。主要記錄患者的癥狀體征,并進行心臟彩色超聲、心電圖等常規性檢查。如患者因個人原因無法到醫院復診,則進行電話聯系,建議其于當地醫院完善檢查并追蹤結果。當患者出現心悸不適或可疑房顫復發時,需立即行心電圖檢查,并將結果報告隨訪門診醫師。
房顫復發的診斷依據是由心電圖、動態心電圖等記錄的術后3個月發生的持續至少30 s的任何房性心律失常[8]。截至2022年3月,收集并整理300例患者的隨訪結果,所納入患者術后觀察時間均長于3個月。
1.3 數據預處理
本研究舍棄了一些與預測不相關的特征以及一些個人信息特征(如非心律失常藥物的使用等)。另外,由于本研究的目的是在術前進行預測,所以術后的一些臨床數據也沒有包含在我們最終的數據集中(如術后左心房大小、手術方式等)。最終選擇了69個特征進行試驗,并分別對訓練集和測試集的每個特征進行標準化處理。
處理過程中還發現復發組和未復發組樣本量存在不平衡的現象。為防止造成模型預測結果產生偏差,本研究采用了Synthetic Minority Oversampling Technique(SMOTE)算法對訓練集進行處理以平衡數據集[9],使訓練集中復發病例數和非復發患者數一致。
1.4 機器學習模型建立
先建立了5個機器學習預測模型[XGBoost[10],隨機森林[11],支持向量機(support vector machine,SVM)[12],K最鄰近[13]和邏輯回歸(logistic regression,LR)[14]]來預測射頻消融后房顫的復發;見圖1。300例患者的臨床數據集被平均分為5組進行5折交叉驗證,所有數據均在以上機器學習模型中進行訓練和測試。對于每折,取4組數據進行訓練,剩下1組在訓練好的機器學習模型上進行測試。最后選擇3個表現最好的模型,并將其合并為一個投票分類器,重新進行訓練和測試,得到最終結果。

SVM:支持向量機;LR:邏輯回歸
1.5 風險因素分析
為了解釋每個特征如何影響模型預測,我們引入了 SHApley Additive exPlanations(SHAP)方法[15]。SHAP構建了一個加法解釋模型,所有的特征都被視為“貢獻者”[15]。通過SHAP工具包,可以了解各特征如何影響預測結果。
1.6 評估指標
本研究采用多種指標來對模型結果進行評估,包括預測準確率、召回率、精確率、F1分數、特異度等。召回率是我們首要考慮的指標,它代表了模型從患者中檢測出會發生房顫復發患者的能力。此外,還使用受試者工作特征(receiver operating characteristic,ROC)曲線和精確-召回(precision-recall,PR)曲線下面積(area under the curve,AUC)對結果進行評估。
1.7 統計學分析
統計學分析采用IBM SPSS Statistics 26軟件進行。計量資料均采用均數±標準差(±s)描述,組間比較采用獨立樣本t檢驗。計數資料采用例數和百分比(%)表示,組間比較采用χ2檢驗或Fisher確切概率法。檢驗水準α=0.05。
1.8 倫理審查
本研究已通過四川大學華西醫院生物醫學倫理委員會的審批,審批號2018-301。所有患者均簽署病歷資料使用知情同意書。
2 結果
2.1 患者資料對比
兩組患者年齡、性別、左心房內徑、右心房內徑、右心室內徑、射血分數等方面差異有統計學意義(P<0.05);見表1。


2.2 機器學習模型預測結果
各模型參數設置如下:SVM分類器核函數采用rbf徑向基函數,正則化系數設置為1.0;隨機森林樹的數目設置為10;XGBoost決策樹個數設置為40;LR和K最鄰近模型均采用默認值;投票分類器采用軟投票方式。基于以上設置,分別計算各模型準確率、召回率、精確率等;見表2。


其中XGBoost對于射頻消融后房顫復發的預測準確率最高,達80%[95%CI(0.746,0.868)],其特異度也是所有模型中最高的。但其召回率卻是最低的,而召回率反映了模型識別到復發患者的能力。該結果說明該模型傾向于把患者預測為不復發。SVM模型在召回率(0.623)、F1得分(0.502)、AUC/ROC(0.778)3項評估指標中均表現最優,在5個機器學習模型中表現最好。LR作為醫學上常用的分類模型,也有不錯的表現,各項指標的平均值達到了0.603,僅次于SVM(0.605)。總體來看,5種機器學習模型在該數據集上表現最好的3種是SVM、LR、XGBoost。
我們將這3個性能最好的模型組合成一個投票分類器,希望它們能夠優勢互補,在各個指標上取得更好的效果。投票分類器(SVM、LR、XGBoost)最終AUC為0.789[95%CI(0.647,0.931)],F1得分為0.519[95%CI(0.410,0.628)],指標平均值達到了0.623[95%CI(0.483,0.763)],較之前的5個機器學習模型分別提升了0.011、0.017、0.018。雖然有些指標有所下降,但總體來看,平均值提升了0.018,預測能力有所提高。圖2為投票分類器和單一機器學習模型ROC曲線,從圖中也可觀察到ROC的AUC有所提高。

a:XGBoost;b:支持向量機;c:邏輯回歸;d:投票分類器
2.3 影響因素分析
對房顫射頻消融后房顫復發影響比較大的因素包括左心房內徑、右心房內徑、射血分數、紅細胞分布寬度的標準差(red blood cell distribution width-standard deviation,RDW-SD)、紅細胞分布寬度變異系數(red blood cell distribution width-coefficient of variation,RDW-CV)等;見圖3a。圖中每個點代表一個樣本,點的顏色代表了特征值的相對大小,紅色表示特征值高,藍色表示特征值低。以右心房內徑為例,大量的藍色樣本聚集在SHAP值為負的區域,意味著如果右心房內徑的值較低,SHAP值也會偏低,而SHAP值的大小表示了對預測結果的影響程度,SHAP的絕對值越大,說明該特征對房顫復發的影響越大。對所有樣本的同一特征的SHAP值取平均,再進行排序;見圖3b。需要注意的是,有些特征,如吸煙史,對大多數人來說不是重要的特征,但對一小部分人來說可能是非常重要的,即對應樣本在該特征上的SHAP絕對值非常高。我們的結果只是對整體數據集的描述,而不是針對某個人的情況。

a:SHAP 值(對模型輸出的影響),顯示了特征貢獻的總結;密度散點圖顯示了所有的樣本;特征的排名是基于SHAP的平均絕對值的總和;b:均值(|SHAP值|)顯示了對房顫復發預測最重要的15個特征,按其重要性排序,其中變量的重要性是由SHAP絕對值的平均值來定義的;RA:右心房內徑;EF:射血分數;RDW-SD:紅細胞分布寬度的標準差;RDW-CV:紅細胞分布寬度變異系數;LA:左心房內徑;NEUT%:中性粒細胞比例;LYMPH%:淋巴細胞百分數;MCHC:紅細胞平均血紅蛋白濃度;Preoperative Cr:術前血肌酐值;Preoperative coagulation PT:術前凝血酶原時間;APTT:活化部分凝血活酶時間;ESD:收縮末期直徑;FT4:血清游離甲狀腺素;SV:每分鐘搏出量
3 討論
經過多年的研究,已經確定了一些與房顫消融后復發有關的獨立臨床因素,如左心房大小、房顫類型及持續時間、高血壓、擴張型心肌病等[6]。基于這些風險因素,一些風險評分系統被提出用于消融前的復發預測,如CAAP-AF評分、APPLE評分和ATLAS評分等[4-5, 16]。然而,這些預測工具僅限于有限的臨床項目,并且是用統計學方法進行計算的[17]。這些評分系統需要經驗豐富的臨床醫生進行判定,存在很大的局限性,如耗費人力、效率低、存在人為誤差、準確性及泛化性不佳等[18]。因此,我們需要更加準確、有效、便捷的工具用于房顫消融后復發風險分級。
隨著數字化的創新和技術的進步,對大量醫療信息的分析需求也顯著增加,但醫生很難根據這些海量數據快速對患者做出準確的判斷。而機器學習可以像醫生一樣從數據中學習規則,并對患者進行診斷。機器學習在醫療領域的成功應用已經在相關研究[19]中得到了證實。Soffer等[17]通過機器學習技術,用患者進入病房時的臨床數據預測了他們的死亡概率。Ikemura等[20]使用自動機器學習開發的高性能的模型,預測了新型冠狀病毒肺炎患者的生存率。雖然機器學習在醫學預測中應用已十分廣泛,但對于房顫射頻消融后復發的預測并不多。Roney等[21]通過構建患者特異性模型,結合患者病史和心房顫動模擬指標的特征等臨床數據,訓練機器學習模型對100例患者進行了房顫復發預測。Firouznia[22]和Liu等[23]均通過提取CT得到的心臟圖片特征,利用機器學習技術探究這些特征與房顫復發的關系。Budzianowski等[24]結合統計評估和機器學習算法對肺靜脈冷凍球囊消融術后復發進行預測。Alhusseini等[25]將房顫患者的雙心房電信號進行希爾伯特變換得到的圖像送入CNN中進行訓練和測試以預測房顫的復發。Atta-Fosu等[26]利用機器學習技術,從CT圖提取有效特征來預測消融后的復發概率。但其研究對象太少,最后也只給出了預測結果的AUC值,沒有分析準確率、召回率、F1分數等評估指標。如何選擇最合適的特征、如何建立最有效的模型,仍是值得我們研究的問題。
本項研究主要完成了預測房顫射頻消融術后復發的機器學習模型的建立和優化,并在預測準確度和特征重要性排序上取得了不錯的效果。我們證明了:(1)機器學習模型可以用來對房顫的復發進行預測;(2)將幾個模型組合成投票分類器在一定程度上可以提高預測能力;(3)臨床上許多被認為與房顫復發高度相關的特征確實對復發存在影響,且共同作用于最終結果。
本項研究第一個發現是機器學習模型在醫學預后方面能起到一定的參考作用。5個機器學習模型對于射頻消融后房產復發的預測準確率均達到了50%以上,其中,XGBoost甚至達到了80%以上。對于醫學上比較關注的召回率,即把陽性患者(射頻消融后實際復發的患者)預測準確的概率,5個模型中,LR和SVM表現最為突出,評估指標的平均值均達到了0.6以上,說明這兩類模型比較適合于對這一類數據集進行預測和分類,對于其它疾病的預測可以優先考慮這兩種模型。
第二個發現是將多個機器學習模型組合成一個投票分類器,對房顫復發患者的分類更加有效。研究過程中,注意到對于每個模型,如果召回率提高,精確度就會下降,如果精確度提高,召回率又會下降。因此考慮將具有最高準確率、召回率和精確度的模型進行結合,取長補短。具體采取少數服從多數的原則,進行投票預測。雖然投票分類器不能保證在每個指標都是最好,但在綜合考慮所有評價指標時,它的表現是最好的。
此外,本研究進一步探究了影響房顫患者在射頻消融術后復發的風險因素,有些已經在以前的醫學研究中得到證實,有些是本研究中新發現的:右心房內徑、射血分數、RDW-SD、RDW-CV。具體來說,左心房內徑的大小與射頻消融術后復發的關系已經被廣泛認可。眾多研究[27]表明,隨著左心房體積的增加,房顫復發的風險也會增加。而房顫反過來又導致心房容積增加,造成房顫的發生與維持,形成惡性循環。右心房內徑也被認為是房顫復發的一個獨立預測因素,而我們通常考慮的是左心房內徑。不過,我們在相關研究[28-29]中找到了依據。本研究中房顫復發組和非復發組的右心房內徑差異有統計學意義。此外,研究[30]還發現,左心房體積指數與右心房體積指數之比是房顫復發的一個危險因素,在房顫復發研究中最好能夠將左心房和右心房體積結合起來進行考慮。一般來說,射血分數也不被認為是房顫復發的獨立預測因素。但它對房顫復發的影響也是有理論依據的:房顫是由不規則的心房顫動引起的,這影響了心房的舒張和收縮功能,降低了泵血功能,增加了心房內的壓力,從而阻礙了周圍靜脈的血液流動,影響了射血功能,也就導致射血分數下降。表1中房顫復發組的射血分數(59.38%±8.61%)明顯低于未復發組(53.66%±10.07%),差異有統計學意義,與機器分析結果一致。另外,RDW-SD和RDW-CV也是研究中發現的風險因素。一些研究也注意到RDW與消融術后復發之間可能存在關聯。Tse等[31]的研究調查了簡單的心電圖和血液學標志物(如RDW和中性粒細胞-淋巴細胞比值)與房顫消融結果之間可能存在關聯。研究[32]也發現,RDW和消融前中性粒細胞-淋巴細胞比值的升高是房顫復發的預測因素,這與我們的結論一致。
本研究也存在一定的局限性。首先,研究樣本量較小。對于機器學習來說,300例病例樣本可能無法使機器學習模型達到最佳訓練狀態。其次,本研究為單中心研究,只包括華西醫院及其分院的患者。且其中危重癥患者較多,三尖瓣反流現象較為普遍,從而導致右心房肥大、內徑增大,對風險因素的分析產生了一定的影響。這是一次利用機器學習進行射頻消融術后復發預測的探索,與實際臨床應用仍存在一定差距。
綜上,本研究通過機器學習技術對房顫射頻消融后的復發進行了預測,并找到一些影響復發的風險因素。通過對房顫患者在射頻消融術前進行結果預測和風險因素評估,制定個性化的消融策略可以最大限度減少患者承擔的風險。因此,我們應在這個領域進行更深入的研究,使機器學習模型的結果能夠為醫生提供更加可靠的參考,并在將來取代現有的評分系統。
利益沖突:無。
作者貢獻:石桓旭負責數據分析,論文撰寫;童琪、王政捷、李濤負責文獻查閱及數據收集;何培宇、錢永軍、趙啟軍、潘帆負責論文總體設計、文章審閱及修改。
心房顫動(房顫)是臨床上最常見的心律失常,在全球發病率近1%,特別是瓣膜病患者更易伴發[1]。將其恢復和維持至竇性心律是臨床治療策略之一[2]。目前臨床上用于治療房顫的最有效措施為射頻消融術[3]。與一些抗心律失常藥物相比,房顫射頻消融術使患者恢復竇性心律的成功率更高[3]。然而,由于患者的個體和病情差異,射頻消融術仍存在15%~70%的復發概率[3]。考慮到房顫射頻消融術費用昂貴,且伴隨著較少但確定的嚴重并發癥風險,在實施房顫消融治療之前,最好能對結果進行估計和預測[4]。識別出不太可能保持竇性心律的患者是提高治療成功率、減少無效消融帶來的不必要風險和費用的合理方法[5]。另一方面,研究[6]發現,一些患者特征與房顫成功率較低有關,如心房纖維化、左心房大小、高血壓等。因此,分析房顫射頻消融術后復發的風險因素具有十分重要的臨床意義,如果能根據現有臨床資料找到影響消融結果的因素,可能會進一步提高消融成功率。
近年來,機器學習技術因其能高效處理復雜且耗時任務而被廣泛地應用于醫學領域,主要包括疾病診斷、藥物制作、醫療數據分析等[7]。本研究通過機器學習技術對房顫射頻消融后的復發進行預測,并找到一些影響復發的風險因素,期待為房顫射頻消融治療提供參考。
1 資料與方法
1.1 臨床資料和分組
回顧性分析2017年1月—2021年1月期間在四川大學華西醫院及其分院(上錦分院)接受同期射頻消融治療的瓣膜病房顫患者的臨床資料。納入標準:心電圖或24 h動態心電圖確診為房顫;在我院進行射頻消融手術,且術后在門診進行規律復診。排除標準:臨床及隨訪資料不完整或缺失值過多的患者。最終納入了300例符合條件的患者,其中男 129 例、女 171 例,平均年齡 52.56 歲。根據術后房顫是否復發將患者分為復發組(61例)和未復發組(239例)。
1.2 術后隨訪
對每例接受房顫射頻消融手術的患者術后每3個月進行一次隨訪。主要記錄患者的癥狀體征,并進行心臟彩色超聲、心電圖等常規性檢查。如患者因個人原因無法到醫院復診,則進行電話聯系,建議其于當地醫院完善檢查并追蹤結果。當患者出現心悸不適或可疑房顫復發時,需立即行心電圖檢查,并將結果報告隨訪門診醫師。
房顫復發的診斷依據是由心電圖、動態心電圖等記錄的術后3個月發生的持續至少30 s的任何房性心律失常[8]。截至2022年3月,收集并整理300例患者的隨訪結果,所納入患者術后觀察時間均長于3個月。
1.3 數據預處理
本研究舍棄了一些與預測不相關的特征以及一些個人信息特征(如非心律失常藥物的使用等)。另外,由于本研究的目的是在術前進行預測,所以術后的一些臨床數據也沒有包含在我們最終的數據集中(如術后左心房大小、手術方式等)。最終選擇了69個特征進行試驗,并分別對訓練集和測試集的每個特征進行標準化處理。
處理過程中還發現復發組和未復發組樣本量存在不平衡的現象。為防止造成模型預測結果產生偏差,本研究采用了Synthetic Minority Oversampling Technique(SMOTE)算法對訓練集進行處理以平衡數據集[9],使訓練集中復發病例數和非復發患者數一致。
1.4 機器學習模型建立
先建立了5個機器學習預測模型[XGBoost[10],隨機森林[11],支持向量機(support vector machine,SVM)[12],K最鄰近[13]和邏輯回歸(logistic regression,LR)[14]]來預測射頻消融后房顫的復發;見圖1。300例患者的臨床數據集被平均分為5組進行5折交叉驗證,所有數據均在以上機器學習模型中進行訓練和測試。對于每折,取4組數據進行訓練,剩下1組在訓練好的機器學習模型上進行測試。最后選擇3個表現最好的模型,并將其合并為一個投票分類器,重新進行訓練和測試,得到最終結果。

SVM:支持向量機;LR:邏輯回歸
1.5 風險因素分析
為了解釋每個特征如何影響模型預測,我們引入了 SHApley Additive exPlanations(SHAP)方法[15]。SHAP構建了一個加法解釋模型,所有的特征都被視為“貢獻者”[15]。通過SHAP工具包,可以了解各特征如何影響預測結果。
1.6 評估指標
本研究采用多種指標來對模型結果進行評估,包括預測準確率、召回率、精確率、F1分數、特異度等。召回率是我們首要考慮的指標,它代表了模型從患者中檢測出會發生房顫復發患者的能力。此外,還使用受試者工作特征(receiver operating characteristic,ROC)曲線和精確-召回(precision-recall,PR)曲線下面積(area under the curve,AUC)對結果進行評估。
1.7 統計學分析
統計學分析采用IBM SPSS Statistics 26軟件進行。計量資料均采用均數±標準差(±s)描述,組間比較采用獨立樣本t檢驗。計數資料采用例數和百分比(%)表示,組間比較采用χ2檢驗或Fisher確切概率法。檢驗水準α=0.05。
1.8 倫理審查
本研究已通過四川大學華西醫院生物醫學倫理委員會的審批,審批號2018-301。所有患者均簽署病歷資料使用知情同意書。
2 結果
2.1 患者資料對比
兩組患者年齡、性別、左心房內徑、右心房內徑、右心室內徑、射血分數等方面差異有統計學意義(P<0.05);見表1。


2.2 機器學習模型預測結果
各模型參數設置如下:SVM分類器核函數采用rbf徑向基函數,正則化系數設置為1.0;隨機森林樹的數目設置為10;XGBoost決策樹個數設置為40;LR和K最鄰近模型均采用默認值;投票分類器采用軟投票方式。基于以上設置,分別計算各模型準確率、召回率、精確率等;見表2。


其中XGBoost對于射頻消融后房顫復發的預測準確率最高,達80%[95%CI(0.746,0.868)],其特異度也是所有模型中最高的。但其召回率卻是最低的,而召回率反映了模型識別到復發患者的能力。該結果說明該模型傾向于把患者預測為不復發。SVM模型在召回率(0.623)、F1得分(0.502)、AUC/ROC(0.778)3項評估指標中均表現最優,在5個機器學習模型中表現最好。LR作為醫學上常用的分類模型,也有不錯的表現,各項指標的平均值達到了0.603,僅次于SVM(0.605)。總體來看,5種機器學習模型在該數據集上表現最好的3種是SVM、LR、XGBoost。
我們將這3個性能最好的模型組合成一個投票分類器,希望它們能夠優勢互補,在各個指標上取得更好的效果。投票分類器(SVM、LR、XGBoost)最終AUC為0.789[95%CI(0.647,0.931)],F1得分為0.519[95%CI(0.410,0.628)],指標平均值達到了0.623[95%CI(0.483,0.763)],較之前的5個機器學習模型分別提升了0.011、0.017、0.018。雖然有些指標有所下降,但總體來看,平均值提升了0.018,預測能力有所提高。圖2為投票分類器和單一機器學習模型ROC曲線,從圖中也可觀察到ROC的AUC有所提高。

a:XGBoost;b:支持向量機;c:邏輯回歸;d:投票分類器
2.3 影響因素分析
對房顫射頻消融后房顫復發影響比較大的因素包括左心房內徑、右心房內徑、射血分數、紅細胞分布寬度的標準差(red blood cell distribution width-standard deviation,RDW-SD)、紅細胞分布寬度變異系數(red blood cell distribution width-coefficient of variation,RDW-CV)等;見圖3a。圖中每個點代表一個樣本,點的顏色代表了特征值的相對大小,紅色表示特征值高,藍色表示特征值低。以右心房內徑為例,大量的藍色樣本聚集在SHAP值為負的區域,意味著如果右心房內徑的值較低,SHAP值也會偏低,而SHAP值的大小表示了對預測結果的影響程度,SHAP的絕對值越大,說明該特征對房顫復發的影響越大。對所有樣本的同一特征的SHAP值取平均,再進行排序;見圖3b。需要注意的是,有些特征,如吸煙史,對大多數人來說不是重要的特征,但對一小部分人來說可能是非常重要的,即對應樣本在該特征上的SHAP絕對值非常高。我們的結果只是對整體數據集的描述,而不是針對某個人的情況。

a:SHAP 值(對模型輸出的影響),顯示了特征貢獻的總結;密度散點圖顯示了所有的樣本;特征的排名是基于SHAP的平均絕對值的總和;b:均值(|SHAP值|)顯示了對房顫復發預測最重要的15個特征,按其重要性排序,其中變量的重要性是由SHAP絕對值的平均值來定義的;RA:右心房內徑;EF:射血分數;RDW-SD:紅細胞分布寬度的標準差;RDW-CV:紅細胞分布寬度變異系數;LA:左心房內徑;NEUT%:中性粒細胞比例;LYMPH%:淋巴細胞百分數;MCHC:紅細胞平均血紅蛋白濃度;Preoperative Cr:術前血肌酐值;Preoperative coagulation PT:術前凝血酶原時間;APTT:活化部分凝血活酶時間;ESD:收縮末期直徑;FT4:血清游離甲狀腺素;SV:每分鐘搏出量
3 討論
經過多年的研究,已經確定了一些與房顫消融后復發有關的獨立臨床因素,如左心房大小、房顫類型及持續時間、高血壓、擴張型心肌病等[6]。基于這些風險因素,一些風險評分系統被提出用于消融前的復發預測,如CAAP-AF評分、APPLE評分和ATLAS評分等[4-5, 16]。然而,這些預測工具僅限于有限的臨床項目,并且是用統計學方法進行計算的[17]。這些評分系統需要經驗豐富的臨床醫生進行判定,存在很大的局限性,如耗費人力、效率低、存在人為誤差、準確性及泛化性不佳等[18]。因此,我們需要更加準確、有效、便捷的工具用于房顫消融后復發風險分級。
隨著數字化的創新和技術的進步,對大量醫療信息的分析需求也顯著增加,但醫生很難根據這些海量數據快速對患者做出準確的判斷。而機器學習可以像醫生一樣從數據中學習規則,并對患者進行診斷。機器學習在醫療領域的成功應用已經在相關研究[19]中得到了證實。Soffer等[17]通過機器學習技術,用患者進入病房時的臨床數據預測了他們的死亡概率。Ikemura等[20]使用自動機器學習開發的高性能的模型,預測了新型冠狀病毒肺炎患者的生存率。雖然機器學習在醫學預測中應用已十分廣泛,但對于房顫射頻消融后復發的預測并不多。Roney等[21]通過構建患者特異性模型,結合患者病史和心房顫動模擬指標的特征等臨床數據,訓練機器學習模型對100例患者進行了房顫復發預測。Firouznia[22]和Liu等[23]均通過提取CT得到的心臟圖片特征,利用機器學習技術探究這些特征與房顫復發的關系。Budzianowski等[24]結合統計評估和機器學習算法對肺靜脈冷凍球囊消融術后復發進行預測。Alhusseini等[25]將房顫患者的雙心房電信號進行希爾伯特變換得到的圖像送入CNN中進行訓練和測試以預測房顫的復發。Atta-Fosu等[26]利用機器學習技術,從CT圖提取有效特征來預測消融后的復發概率。但其研究對象太少,最后也只給出了預測結果的AUC值,沒有分析準確率、召回率、F1分數等評估指標。如何選擇最合適的特征、如何建立最有效的模型,仍是值得我們研究的問題。
本項研究主要完成了預測房顫射頻消融術后復發的機器學習模型的建立和優化,并在預測準確度和特征重要性排序上取得了不錯的效果。我們證明了:(1)機器學習模型可以用來對房顫的復發進行預測;(2)將幾個模型組合成投票分類器在一定程度上可以提高預測能力;(3)臨床上許多被認為與房顫復發高度相關的特征確實對復發存在影響,且共同作用于最終結果。
本項研究第一個發現是機器學習模型在醫學預后方面能起到一定的參考作用。5個機器學習模型對于射頻消融后房產復發的預測準確率均達到了50%以上,其中,XGBoost甚至達到了80%以上。對于醫學上比較關注的召回率,即把陽性患者(射頻消融后實際復發的患者)預測準確的概率,5個模型中,LR和SVM表現最為突出,評估指標的平均值均達到了0.6以上,說明這兩類模型比較適合于對這一類數據集進行預測和分類,對于其它疾病的預測可以優先考慮這兩種模型。
第二個發現是將多個機器學習模型組合成一個投票分類器,對房顫復發患者的分類更加有效。研究過程中,注意到對于每個模型,如果召回率提高,精確度就會下降,如果精確度提高,召回率又會下降。因此考慮將具有最高準確率、召回率和精確度的模型進行結合,取長補短。具體采取少數服從多數的原則,進行投票預測。雖然投票分類器不能保證在每個指標都是最好,但在綜合考慮所有評價指標時,它的表現是最好的。
此外,本研究進一步探究了影響房顫患者在射頻消融術后復發的風險因素,有些已經在以前的醫學研究中得到證實,有些是本研究中新發現的:右心房內徑、射血分數、RDW-SD、RDW-CV。具體來說,左心房內徑的大小與射頻消融術后復發的關系已經被廣泛認可。眾多研究[27]表明,隨著左心房體積的增加,房顫復發的風險也會增加。而房顫反過來又導致心房容積增加,造成房顫的發生與維持,形成惡性循環。右心房內徑也被認為是房顫復發的一個獨立預測因素,而我們通常考慮的是左心房內徑。不過,我們在相關研究[28-29]中找到了依據。本研究中房顫復發組和非復發組的右心房內徑差異有統計學意義。此外,研究[30]還發現,左心房體積指數與右心房體積指數之比是房顫復發的一個危險因素,在房顫復發研究中最好能夠將左心房和右心房體積結合起來進行考慮。一般來說,射血分數也不被認為是房顫復發的獨立預測因素。但它對房顫復發的影響也是有理論依據的:房顫是由不規則的心房顫動引起的,這影響了心房的舒張和收縮功能,降低了泵血功能,增加了心房內的壓力,從而阻礙了周圍靜脈的血液流動,影響了射血功能,也就導致射血分數下降。表1中房顫復發組的射血分數(59.38%±8.61%)明顯低于未復發組(53.66%±10.07%),差異有統計學意義,與機器分析結果一致。另外,RDW-SD和RDW-CV也是研究中發現的風險因素。一些研究也注意到RDW與消融術后復發之間可能存在關聯。Tse等[31]的研究調查了簡單的心電圖和血液學標志物(如RDW和中性粒細胞-淋巴細胞比值)與房顫消融結果之間可能存在關聯。研究[32]也發現,RDW和消融前中性粒細胞-淋巴細胞比值的升高是房顫復發的預測因素,這與我們的結論一致。
本研究也存在一定的局限性。首先,研究樣本量較小。對于機器學習來說,300例病例樣本可能無法使機器學習模型達到最佳訓練狀態。其次,本研究為單中心研究,只包括華西醫院及其分院的患者。且其中危重癥患者較多,三尖瓣反流現象較為普遍,從而導致右心房肥大、內徑增大,對風險因素的分析產生了一定的影響。這是一次利用機器學習進行射頻消融術后復發預測的探索,與實際臨床應用仍存在一定差距。
綜上,本研究通過機器學習技術對房顫射頻消融后的復發進行了預測,并找到一些影響復發的風險因素。通過對房顫患者在射頻消融術前進行結果預測和風險因素評估,制定個性化的消融策略可以最大限度減少患者承擔的風險。因此,我們應在這個領域進行更深入的研究,使機器學習模型的結果能夠為醫生提供更加可靠的參考,并在將來取代現有的評分系統。
利益沖突:無。
作者貢獻:石桓旭負責數據分析,論文撰寫;童琪、王政捷、李濤負責文獻查閱及數據收集;何培宇、錢永軍、趙啟軍、潘帆負責論文總體設計、文章審閱及修改。