目的評估機器學習算法在心臟瓣膜病心房顫動患者心臟血栓形成的預測和表征中的應用。方法本研究從四川大學華西醫院及其分院收集2016—2021年心臟瓣膜病伴心房顫動患者的臨床數據,從2 515例接受瓣膜手術的患者中篩選出886例瓣膜病伴心房顫動患者納入研究,其中男545例(61.5%)、女341例(38.5%),平均年齡(55.62±9.26)歲,192例患者術中證實有心臟血栓形成。采用5種監督機器學習算法來預測患者的血栓形成。基于患者的臨床數據(特征篩選后的33個特征),采用10折嵌套交叉驗證方法,通過曲線下面積、F1分數以及馬修斯相關系數等評價指標對模型的預測效果進行評價。最后,使用SHAP解釋方法來解釋模型,并以患者為例分析模型的特征。結果隨機森林模型各項綜合評估指標最佳,受試者工作特征曲線下面積為0.748±0.043,準確率79.2%。對模型的解釋和分析表明,每搏輸出量、二尖瓣E波峰值流速和三尖瓣壓力梯度等是影響預測的重要因素。結論隨機森林模型實現了最好的預測性能,有望被臨床醫生用作一種輔助決策工具,用于篩查患有瓣膜病心房顫動的高栓塞風險患者。