徐瑾業 1,2 , 周江暉 1,2 , 劉生偉 3 , 陳良亮 1,2 , 胡俊熙 1,2 , 王霄霖 1,2 , 束余聲 1,2
  • 1. 揚州大學醫學院(江蘇揚州 225000);
  • 2. 揚州大學臨床醫學院 蘇北人民醫院 胸外科(江蘇揚州 225000);
  • 3. 陸軍軍醫大學第一附屬醫院 胸外科(重慶 400038);
導出 下載 收藏 掃碼 引用

目的 探討機器學習模型在預測胸段食管鱗狀細胞癌(鱗癌)患者術后生存風險分層中的應用價值。方法 回顧性分析2014年1月—2015年9月在蘇北人民醫院胸外科行食管癌根治術的369例胸段食管鱗癌患者的臨床資料,其中男279例(75.6%)、女90例(24.4%),年齡41~78歲。將患者按7∶3比例隨機分為訓練集(259例)和測試集(110例)。通過選擇最佳特征子集進行變量篩選。在此基礎上構建6種機器學習模型,并在獨立測試集驗證。通過曲線下面積(area under the curve,AUC)、準確率、對數損失函數值評價模型的預測性能,通過校準曲線反映模型的擬合情況。從中選出最佳模型作為最終模型,利用X-tile進行風險分層,采用Kaplan-Meier法與log-rank檢驗進行生存分析。結果 胸段食管鱗癌患者術后5年生存率為67.5%。訓練集和測試集之間各項臨床病理特征差異均無統計學意義(P均>0.05)。最終納入高血壓、吸煙史、飲酒史、組織分化程度、pN分期、脈管侵犯、神經侵犯共7個變量進行建模,各模型在獨立測試集中的AUC值分別為:決策樹(AUC=0.796)、支持向量機(AUC=0.829)、隨機森林(AUC=0.831)、邏輯回歸(AUC=0.838)、梯度提升機(AUC=0.846)、XGBoost(AUC=0.853)。最終遴選出XGBoost模型作為最佳模型,并分別對訓練集和測試集進行風險分層,其中將訓練集和測試集患者分別分為低危組、中危組和高危組。在訓練集和測試集中,三組患者手術預后情況差異均有統計學意義(P<0.001)。結論 機器學習模型在預測胸段食管鱗癌術后預后方面具有較高價值,XGBoost模型對胸段食管鱗癌患者術后5年生存情況的預測性能優于常見機器學習方法,具有較高的實用性和可靠性。

引用本文: 徐瑾業, 周江暉, 劉生偉, 陳良亮, 胡俊熙, 王霄霖, 束余聲. 機器學習模型在胸段食管鱗狀細胞癌術后生存風險分層中的應用研究. 中國胸心血管外科臨床雜志, 2022, 29(12): 1574-1579. doi: 10.7507/1007-4848.202205057 復制

  • 上一篇

    基于16S rDNA測序分析膽囊結石及膽囊切除對結直腸癌患者腸道菌群的影響
  • 下一篇

    頸段和胸上段食管鱗狀細胞癌術后輔助化療的預后意義