引用本文: 劉展, 劉曉鵬, 劉敏, 甄雅南, 鄭夏, 溫見燕, 葉志東, 劉鵬. 基于機器學習的影像組學模型在重度無癥狀性頸動脈狹窄危險分層中的應用. 中國胸心血管外科臨床雜志, 2022, 29(10): 1270-1276. doi: 10.7507/1007-4848.202205046 復制
腦卒中是中國乃至世界上成人死亡和致殘的主要原因之一[1-2]。來自同側無癥狀性頸動脈狹窄(asymptomatic carotid stenosis,ACS)的血栓栓塞是首次缺血性卒中的主要原因[3]。但是目前重度ACS患者的最佳治療方案仍然存在爭議。2017年歐洲血管外科學會臨床實踐指南[4]也指出有必要開發臨床/影像學算法來識別需要血管重建治療的高危ACS患者。影像組學可以從醫學圖像中提取海量定量特征,挖掘肉眼難以識別的信息,廣泛應用于腫瘤學研究中[5-7]。近年來,影像組學逐漸應用于頸動脈斑塊的分析。研究[8-10]報道,基于核磁和超聲的影像組學預測模型在識別高危斑塊中具有良好的診斷效能。但是基于CT的影像組學分析僅有2項小樣本的初步研究[11-12],也提示基于CT的影像組學在識別癥狀性斑塊中具有良好的應用潛力。此外,具有監督學習的機器學習算法是一種新興的基于計算機的方法,可以通過已有的樣本訓練得到一個具有對未知數據進行分類能力的最優模型[13]。目前尚無針對頸動脈斑塊的基于機器學習的CT影像組學研究。因此,本研究旨在利用頸動脈斑塊的CT影像組學特征,構建基于機器學習的影像組學預測模型來識別高危重度ACS患者,為其臨床決策提供一定的參考。
1 資料與方法
1.1 臨床資料
回顧性收集2017—2021年中日友好醫院心臟血管外科重度頸動脈狹窄患者的病例資料。納入標準:(1)頭頸CT血管造影(CT angiography,CTA)證實為頸動脈重度狹窄(70%~99%);(2)有可用的頭頸CTA圖像。排除標準:(1)非動脈粥樣硬化性頸動脈狹窄;(2)雙側頸動脈重度狹窄;(3)圖像質量不佳;(4)缺乏完整的臨床資料。頸動脈狹窄程度依據北美癥狀性頸動脈內膜切除試驗[14]標準在頭頸CTA圖像上進行測量。根據既往6個月內有無頸動脈狹窄所致的短暫性腦缺血發作、卒中或其它相關神經癥狀將患者分為癥狀性患者和無癥狀性患者[15]。最終納入重度頸動脈狹窄患者188例,采用隨機數字表法將納入患者隨機分為訓練集(n=131)和驗證集(n=57)。
1.2 CT血管造影圖像采集
使用256層螺旋CT(Brilliance iCT,美國飛利浦公司)進行掃描。患者取仰臥位,掃描范圍從主動脈弓到顱骨頂點。采用高壓注射器經肘靜脈團注對比劑碘克沙醇,碘濃度為320 mg/mL,注射流率為3~4 mL/s。采用觸發掃描,監測平面位于主動脈弓,閾值為100 HU,系統觸發后延遲5 s自動啟動掃描。
1.3 影像組學分析
1.3.1 圖像感興趣區的勾畫
為確保斑塊分割和影像組學特征提取的可重復性,由1名血管外科醫生和1名影像科醫生在不知臨床信息的情況下使用3D slicer軟件(Version 4.13.0,https://www.slicer.org)對斑塊進行分割,在橫斷面上沿斑塊的邊緣逐層手動勾畫感興趣體積(volume of interest,VOI);見圖1。1個月后,由同一位血管外科醫生對所有圖像再次進行手動分割。

a:頭頸動脈CT血管造影橫斷面圖像;b:在橫斷面圖像上沿斑塊的邊緣勾畫感興趣區
1.3.2 影像組學特征的提取和篩選
使用Python軟件(Version 3.7,https://www.python.org)的Pyradiomics包(Version 3.0.1,https://github.com/Radiomics/pyradiomicsand)從每個VOI中提取了1 218個影像組學特征。提取的影像組學特征包括一階特征(252個)、形態特征(14個)及紋理特征(952個)。紋理特征包括灰度共生矩陣(308個)、灰度游程矩陣(224個)、灰度大小區域矩陣(224個)及灰度依賴矩陣(196個)。其中一階特征及紋理特征在原始圖像、高斯拉普拉斯濾波圖像(sigma=1.0,2.0,3.0,4.0,5.0)及小波變換圖像[3個維度中每個維度使用高通(H)和低通(L)濾波器的所有組合,包括LLH、LHL、LHH、HLL、HLH、HHL、HHH、LLL,組距為10]上分別提取。使用組間及組內相關系數(intraclass correlation coefficient,ICC)對2名觀察者提取的影像組學特征進行一致性評價,保留穩定性較好(ICC>0.75)的影像組學特征用于后續分析。影像組學特征的篩選在訓練集中進行。首先對訓練集的影像組學特征進行Z評分標準化,然后使用訓練集的平均值及標準差對驗證集進行標準化。使用Pearson或Spearman相關性檢驗進行冗余性分析,剔除相關系數>0.9的冗余性特征。最后進行最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸分析,通過10折交叉驗證選擇誤差最小的超參數λ,進而選擇最佳特征子集。
1.3.3 機器學習模型的構建與驗證
使用邏輯回歸、決策樹、隨機森林、支持向量機、樸素貝葉斯和K最鄰近6種不同的有監督機器學習算法將篩選出的影像組學特征用于構建預測模型。為避免過擬合,使用5折交叉驗證。采用受試者工作特征(receiver operating characteristic,ROC)曲線和ROC曲線下面積(area under the curve,AUC)來評價預測模型的診斷效能。使用校準曲線和Hosmer-Lemeshow擬合優度檢驗評價預測模型的校準度。通過量化不同閾值概率下患者的凈收益進行決策曲線分析,閾值概率是當治療的預期收益等于避免治療的預期收益時的概率,在不同閾值概率下通過凈收益評估預測模型的臨床應用價值。在驗證集中對各預測模型進行驗證。
1.4 統計學分析
使用R軟件(Version 3.5.1,https://www.r-project.org)進行統計學分析。使用單變量K-S檢驗對連續變量進行正態性檢驗,符合正態分布的變量用均數±標準差(±s)描述,組間比較采用獨立樣本t檢驗;非正態分布的變量使用中位數及上下四分位數[M(P25,P75)]描述,組間比較采用Mann-Whitney U檢驗。計數資料用頻數和百分比(%)描述,組間比較采用χ2檢驗或Fisher確切概率法。對正態分布的影像組學特征進行Pearson相關性分析,對非正態分布的特征進行Spearman相關性分析。所有統計分析采用雙側檢驗,檢驗水準α=0.05。
1.5 倫理審查
本研究已通過中日友好醫院倫理委員會審核,批準號:2019-142-K98。
2 結果
2.1 患者一般資料
本研究共納入重度頸動脈狹窄患者188例,其中男157例、女31例。訓練集131例,其中男107例、女24例,平均年齡(68±8)歲,癥狀性患者54例。驗證集57例,其中男50例、女7例,平均年齡(67±8)歲,癥狀性患者24例。性別、年齡、病變位置、狹窄程度以及有無臨床癥狀在訓練集和驗證集間差異均無統計學意義(P>0.05);見表1。


2.2 影像組學模型的構建
在提取的1 218個影像組學特征中,1 068個特征具有良好的穩定性(ICC>0.75)。隨后使用冗余性分析將相關系數>0.9的冗余性特征剔除,剩余116個特征納入LASSO回歸分析;見圖2。最后篩選出4個影像組學特征用于構建預測模型,分別為:高斯拉普拉斯濾波圖像中的灰度共生矩陣相關性信息度量1(log.sigma.5.0.mm.3D_glcm_Imc1)、高斯拉普拉斯濾波圖像中的一階特征最大特征值(log.sigma.5.0.mm.3D_firstorder_Maximum)、小波變換圖像中的一階特征峰度(wavelet.LLH_firstorder_Kurtosis)和小波變換圖像中的灰度依賴矩陣灰度非均勻性(wavelet.LLL_gldm_GrayLevelNonUniformity)。使用邏輯回歸、決策樹、隨機森林、支持向量機、樸素貝葉斯和K最鄰近6種不同的有監督機器學習算法將篩選出的影像組學特征用于構建預測模型,并使用5折交叉驗證避免過擬合。

a:二項式偏差隨參數λ變化的曲線圖;b:影像組學特征系數分布圖
2.3 影像組學模型的評價及驗證
不同預測模型在訓練集和驗證集中的AUC、靈敏度和特異性見表2。在訓練集中,隨機森林模型具有最高的AUC(0.906),其靈敏度為90.7%,特異性高達96.1%。其次邏輯回歸、決策樹、樸素貝葉斯也表現出較好的診斷效能(AUC>0.87)。而在驗證集中,邏輯回歸模型表現出最佳的診斷效能,AUC為0.867,靈敏度為83.3%,特異性為78.8%。而隨機森林模型在驗證集中的AUC僅為0.710;見圖3。因此,邏輯回歸模型在訓練集和驗證集中表現出較高的診斷效能且較為穩定;見圖4。校準曲線顯示邏輯回歸模型在訓練集和驗證集中均表現出良好的校準度,預測曲線與理想曲線間沒有明顯偏差。而Hosmer-Lemeshow擬合優度檢驗顯示邏輯回歸模型在訓練集和驗證集中差異均無統計學意義(P>0.05),表明預測概率與實際概率之間具有較好的一致性,校準曲線沒有偏離擬合;圖5。決策曲線分析顯示,邏輯回歸模型在訓練集和驗證集中均表現出良好的臨床應用價值,在絕大部分概率閾值下,與全部識別為癥狀性患者和全部識別為無癥狀患者相比,預測模型均可獲得臨床收益;見圖6。


a:訓練集;b:驗證集


a:訓練集;b:驗證集;預測概率與實際概率具有良好的一致性

a:訓練集;b:驗證集;在較寬的概率閾值范圍下使用邏輯回歸預測模型對重度無癥狀性頸動脈狹窄患者進行危險分層均可獲得臨床凈收益
3 討論
目前重度ACS患者的治療方案仍不明確,因此對這類患者進行危險分層和個體化治療是非常重要的。對于高危患者,在嚴格最佳藥物治療(best medical therapy,BMT)的基礎上,積極接受血管重建治療可以避免腦缺血事件的發生。而對于低危患者,單純BMT可能是更好的選擇,同時也可以避免圍手術期卒中和死亡風險。因此2017年歐洲血管外科學會臨床實踐指南[4]指出,需要開發臨床/影像學算法來識別需要血管重建治療的高危ACS患者。本研究基于頸動脈斑塊的CT影像組學特征構建了6種基于機器學習的影像組學預測模型。結果顯示,邏輯回歸模型在識別高危重度ACS患者中表現出穩定、良好的診斷效能、校準度以及臨床實用性。
影像組學可以從醫學圖像中提取海量的定量特征,挖掘肉眼難以識別的信息。近年來,影像組學逐漸應用于頸動脈斑塊的分析。Zhang等[8]建立的基于核磁的影像組學預測模型可以顯著區分癥狀性斑塊和無癥狀性斑塊。其在訓練集和驗證集中的AUC分別為0.988和0.989,要顯著高于由斑塊內出血和富含脂質壞死核心構成的臨床預測模型(AUC分別為0.825和0.804)。Chen等[9]的研究也得到了相似的結果。在超聲方面,Huang等[10]的研究也表明,基于超聲的影像組學預測模型同樣優于臨床和傳統的超聲模型。超聲檢查具有無創、便捷、無輻射等優點,是臨床上頸動脈斑塊評估的首選檢查方式,但是操作者主觀性較強,圖像噪聲高然、分辨率較差。而核磁檢查無輻射,可以進行多參數、多序列成像,提供了更為詳細的斑塊信息,且可以識別斑塊內出血、富含脂質壞死核心等成分,在不穩定斑塊評估中具有重要作用,但是其費用高,成像時間長,臨床應用相對較少。而CTA是評估頸動脈狹窄和斑塊形態的穩健方法,除了提供關于管腔狹窄程度的準確信息之外,它還可以提供關于斑塊形態和特征的豐富細節[16]。但是其具有輻射性,需要注射含碘造影劑,腎功能不全患者受到一定限制。與核磁和超聲檢查相比,CTA具有廣泛的臨床應用性及操作者獨立性,非常適合于頸動脈斑塊影像組學分析。但是目前缺乏大樣本的基于CT的頸動脈斑塊影像組學研究。因此本研究對頸動脈斑塊進行了影像組學分析,經過特征篩選最終得到4個組學特征,分別為高斯拉普拉斯濾波圖像中的灰度共生矩陣相關性信息度量1、高斯拉普拉斯濾波圖像中的一階特征最大特征值、小波變換圖像中的一階特征峰度、小波變換圖像中的灰度依賴矩陣灰度非均勻性。這4項組學特征均在一定程度上反映了像素的分布情況[17-18],可能反映了斑塊的潛在組織病理學改變。但是目前尚無有關斑塊組學與組織病理學的對照研究,因此斑塊組學特征的生物學意義仍需進一步研究。此外,我們發現篩選出的4項組學特征與之前的2項初步研究[11-12]的結果并不相同,這可能與納入標準的差異相關。本研究納入患者均為單側重度狹窄患者,而既往研究[11-12]納入的患者頸動脈狹窄程度異質性較大。此外,各研究間組學特征提取方法各不相同,因此尚需標準、統一的研究進一步予以驗證。
本研究基于上述4項組學特征構建了基于CT的影像組學模型,結果顯示,邏輯回歸模型在識別高危重度ACS患者中表現出較高的、穩定的診斷效能,訓練集AUC為0.872,95%CI(0.813,0.931),驗證集AUC為0.867,95%CI(0.776,0.959)。校準曲線及Hosmer-Lemeshow擬合優度檢驗顯示預測概率與實際概率之間具有較好的一致性。決策曲線分析顯示邏輯回歸模型具有良好的臨床應用價值。因此對于預測模型識別的傾向于發生臨床癥狀的高危ACS患者而言,在嚴格BMT的基礎上,積極接受血管重建治療可能是更好的選擇,但是仍然需要前瞻性研究進一步予以證實。
此外,機器學習可以綜合大數據影像資料,深度挖掘多維影像學信息,實現精準診斷及預測[19]。而選擇適當的機器學習算法可提高模型的穩定性和預測效能。因此使用邏輯回歸、決策樹、隨機森林、支持向量機、樸素貝葉斯和K最鄰近6種不同的有監督機器學習算法將篩選出的影像組學特征用于構建預測模型。結果顯示,在訓練集中,隨機森林模型表現出最高的診斷效能(AUC為0.906),但是在驗證集中AUC僅為0.710,存在過擬合。而綜合6種算法,發現邏輯回歸模型具有較高的且更為穩定的診斷效能。同時,邏輯回歸模型也是目前臨床最為常用的機器學習算法,并且易于操作,適合二分類變量的模型構建。此外,一項系統綜述[20]也表明,在結局為二分類變量的臨床預測模型中,其它較為新穎的機器學習算法的預測能力并不優于傳統的邏輯回歸算法。
本研究存在以下局限性:(1)本研究為回顧性研究,部分缺乏CTA圖像的患者被排除,選擇偏倚無法避免;(2)大部分患者接受了手術治療,術者基于臨床經驗的篩選可能會對研究結果產生影響;(3)本研究為單中心研究,缺乏外部驗證;(4)為了最大程度地反映斑塊信息,我們對整個斑塊進行了勾畫,這也導致部分特征的穩定性欠佳;(5)本研究未對相關臨床特征進行分析,因此影像組學預測模型的診斷效能是否優于臨床特征仍需進一步研究。
總之,基于機器學習的影像組學預測模型在識別高危重度ACS患者中具有良好的診斷效能、校準度和臨床應用價值,有望作為臨床決策的輔助工具。
利益沖突:無。
作者貢獻:劉展負責數據分析和論文初稿撰寫;劉曉鵬負責數據收集和論文初稿撰寫;劉敏負責數據收集;甄雅南、鄭夏、溫見燕負責數據收集和整理;葉志東負責研究指導和論文修改;劉鵬負責論文設計、審閱與修改。
腦卒中是中國乃至世界上成人死亡和致殘的主要原因之一[1-2]。來自同側無癥狀性頸動脈狹窄(asymptomatic carotid stenosis,ACS)的血栓栓塞是首次缺血性卒中的主要原因[3]。但是目前重度ACS患者的最佳治療方案仍然存在爭議。2017年歐洲血管外科學會臨床實踐指南[4]也指出有必要開發臨床/影像學算法來識別需要血管重建治療的高危ACS患者。影像組學可以從醫學圖像中提取海量定量特征,挖掘肉眼難以識別的信息,廣泛應用于腫瘤學研究中[5-7]。近年來,影像組學逐漸應用于頸動脈斑塊的分析。研究[8-10]報道,基于核磁和超聲的影像組學預測模型在識別高危斑塊中具有良好的診斷效能。但是基于CT的影像組學分析僅有2項小樣本的初步研究[11-12],也提示基于CT的影像組學在識別癥狀性斑塊中具有良好的應用潛力。此外,具有監督學習的機器學習算法是一種新興的基于計算機的方法,可以通過已有的樣本訓練得到一個具有對未知數據進行分類能力的最優模型[13]。目前尚無針對頸動脈斑塊的基于機器學習的CT影像組學研究。因此,本研究旨在利用頸動脈斑塊的CT影像組學特征,構建基于機器學習的影像組學預測模型來識別高危重度ACS患者,為其臨床決策提供一定的參考。
1 資料與方法
1.1 臨床資料
回顧性收集2017—2021年中日友好醫院心臟血管外科重度頸動脈狹窄患者的病例資料。納入標準:(1)頭頸CT血管造影(CT angiography,CTA)證實為頸動脈重度狹窄(70%~99%);(2)有可用的頭頸CTA圖像。排除標準:(1)非動脈粥樣硬化性頸動脈狹窄;(2)雙側頸動脈重度狹窄;(3)圖像質量不佳;(4)缺乏完整的臨床資料。頸動脈狹窄程度依據北美癥狀性頸動脈內膜切除試驗[14]標準在頭頸CTA圖像上進行測量。根據既往6個月內有無頸動脈狹窄所致的短暫性腦缺血發作、卒中或其它相關神經癥狀將患者分為癥狀性患者和無癥狀性患者[15]。最終納入重度頸動脈狹窄患者188例,采用隨機數字表法將納入患者隨機分為訓練集(n=131)和驗證集(n=57)。
1.2 CT血管造影圖像采集
使用256層螺旋CT(Brilliance iCT,美國飛利浦公司)進行掃描。患者取仰臥位,掃描范圍從主動脈弓到顱骨頂點。采用高壓注射器經肘靜脈團注對比劑碘克沙醇,碘濃度為320 mg/mL,注射流率為3~4 mL/s。采用觸發掃描,監測平面位于主動脈弓,閾值為100 HU,系統觸發后延遲5 s自動啟動掃描。
1.3 影像組學分析
1.3.1 圖像感興趣區的勾畫
為確保斑塊分割和影像組學特征提取的可重復性,由1名血管外科醫生和1名影像科醫生在不知臨床信息的情況下使用3D slicer軟件(Version 4.13.0,https://www.slicer.org)對斑塊進行分割,在橫斷面上沿斑塊的邊緣逐層手動勾畫感興趣體積(volume of interest,VOI);見圖1。1個月后,由同一位血管外科醫生對所有圖像再次進行手動分割。

a:頭頸動脈CT血管造影橫斷面圖像;b:在橫斷面圖像上沿斑塊的邊緣勾畫感興趣區
1.3.2 影像組學特征的提取和篩選
使用Python軟件(Version 3.7,https://www.python.org)的Pyradiomics包(Version 3.0.1,https://github.com/Radiomics/pyradiomicsand)從每個VOI中提取了1 218個影像組學特征。提取的影像組學特征包括一階特征(252個)、形態特征(14個)及紋理特征(952個)。紋理特征包括灰度共生矩陣(308個)、灰度游程矩陣(224個)、灰度大小區域矩陣(224個)及灰度依賴矩陣(196個)。其中一階特征及紋理特征在原始圖像、高斯拉普拉斯濾波圖像(sigma=1.0,2.0,3.0,4.0,5.0)及小波變換圖像[3個維度中每個維度使用高通(H)和低通(L)濾波器的所有組合,包括LLH、LHL、LHH、HLL、HLH、HHL、HHH、LLL,組距為10]上分別提取。使用組間及組內相關系數(intraclass correlation coefficient,ICC)對2名觀察者提取的影像組學特征進行一致性評價,保留穩定性較好(ICC>0.75)的影像組學特征用于后續分析。影像組學特征的篩選在訓練集中進行。首先對訓練集的影像組學特征進行Z評分標準化,然后使用訓練集的平均值及標準差對驗證集進行標準化。使用Pearson或Spearman相關性檢驗進行冗余性分析,剔除相關系數>0.9的冗余性特征。最后進行最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸分析,通過10折交叉驗證選擇誤差最小的超參數λ,進而選擇最佳特征子集。
1.3.3 機器學習模型的構建與驗證
使用邏輯回歸、決策樹、隨機森林、支持向量機、樸素貝葉斯和K最鄰近6種不同的有監督機器學習算法將篩選出的影像組學特征用于構建預測模型。為避免過擬合,使用5折交叉驗證。采用受試者工作特征(receiver operating characteristic,ROC)曲線和ROC曲線下面積(area under the curve,AUC)來評價預測模型的診斷效能。使用校準曲線和Hosmer-Lemeshow擬合優度檢驗評價預測模型的校準度。通過量化不同閾值概率下患者的凈收益進行決策曲線分析,閾值概率是當治療的預期收益等于避免治療的預期收益時的概率,在不同閾值概率下通過凈收益評估預測模型的臨床應用價值。在驗證集中對各預測模型進行驗證。
1.4 統計學分析
使用R軟件(Version 3.5.1,https://www.r-project.org)進行統計學分析。使用單變量K-S檢驗對連續變量進行正態性檢驗,符合正態分布的變量用均數±標準差(±s)描述,組間比較采用獨立樣本t檢驗;非正態分布的變量使用中位數及上下四分位數[M(P25,P75)]描述,組間比較采用Mann-Whitney U檢驗。計數資料用頻數和百分比(%)描述,組間比較采用χ2檢驗或Fisher確切概率法。對正態分布的影像組學特征進行Pearson相關性分析,對非正態分布的特征進行Spearman相關性分析。所有統計分析采用雙側檢驗,檢驗水準α=0.05。
1.5 倫理審查
本研究已通過中日友好醫院倫理委員會審核,批準號:2019-142-K98。
2 結果
2.1 患者一般資料
本研究共納入重度頸動脈狹窄患者188例,其中男157例、女31例。訓練集131例,其中男107例、女24例,平均年齡(68±8)歲,癥狀性患者54例。驗證集57例,其中男50例、女7例,平均年齡(67±8)歲,癥狀性患者24例。性別、年齡、病變位置、狹窄程度以及有無臨床癥狀在訓練集和驗證集間差異均無統計學意義(P>0.05);見表1。


2.2 影像組學模型的構建
在提取的1 218個影像組學特征中,1 068個特征具有良好的穩定性(ICC>0.75)。隨后使用冗余性分析將相關系數>0.9的冗余性特征剔除,剩余116個特征納入LASSO回歸分析;見圖2。最后篩選出4個影像組學特征用于構建預測模型,分別為:高斯拉普拉斯濾波圖像中的灰度共生矩陣相關性信息度量1(log.sigma.5.0.mm.3D_glcm_Imc1)、高斯拉普拉斯濾波圖像中的一階特征最大特征值(log.sigma.5.0.mm.3D_firstorder_Maximum)、小波變換圖像中的一階特征峰度(wavelet.LLH_firstorder_Kurtosis)和小波變換圖像中的灰度依賴矩陣灰度非均勻性(wavelet.LLL_gldm_GrayLevelNonUniformity)。使用邏輯回歸、決策樹、隨機森林、支持向量機、樸素貝葉斯和K最鄰近6種不同的有監督機器學習算法將篩選出的影像組學特征用于構建預測模型,并使用5折交叉驗證避免過擬合。

a:二項式偏差隨參數λ變化的曲線圖;b:影像組學特征系數分布圖
2.3 影像組學模型的評價及驗證
不同預測模型在訓練集和驗證集中的AUC、靈敏度和特異性見表2。在訓練集中,隨機森林模型具有最高的AUC(0.906),其靈敏度為90.7%,特異性高達96.1%。其次邏輯回歸、決策樹、樸素貝葉斯也表現出較好的診斷效能(AUC>0.87)。而在驗證集中,邏輯回歸模型表現出最佳的診斷效能,AUC為0.867,靈敏度為83.3%,特異性為78.8%。而隨機森林模型在驗證集中的AUC僅為0.710;見圖3。因此,邏輯回歸模型在訓練集和驗證集中表現出較高的診斷效能且較為穩定;見圖4。校準曲線顯示邏輯回歸模型在訓練集和驗證集中均表現出良好的校準度,預測曲線與理想曲線間沒有明顯偏差。而Hosmer-Lemeshow擬合優度檢驗顯示邏輯回歸模型在訓練集和驗證集中差異均無統計學意義(P>0.05),表明預測概率與實際概率之間具有較好的一致性,校準曲線沒有偏離擬合;圖5。決策曲線分析顯示,邏輯回歸模型在訓練集和驗證集中均表現出良好的臨床應用價值,在絕大部分概率閾值下,與全部識別為癥狀性患者和全部識別為無癥狀患者相比,預測模型均可獲得臨床收益;見圖6。


a:訓練集;b:驗證集


a:訓練集;b:驗證集;預測概率與實際概率具有良好的一致性

a:訓練集;b:驗證集;在較寬的概率閾值范圍下使用邏輯回歸預測模型對重度無癥狀性頸動脈狹窄患者進行危險分層均可獲得臨床凈收益
3 討論
目前重度ACS患者的治療方案仍不明確,因此對這類患者進行危險分層和個體化治療是非常重要的。對于高危患者,在嚴格最佳藥物治療(best medical therapy,BMT)的基礎上,積極接受血管重建治療可以避免腦缺血事件的發生。而對于低危患者,單純BMT可能是更好的選擇,同時也可以避免圍手術期卒中和死亡風險。因此2017年歐洲血管外科學會臨床實踐指南[4]指出,需要開發臨床/影像學算法來識別需要血管重建治療的高危ACS患者。本研究基于頸動脈斑塊的CT影像組學特征構建了6種基于機器學習的影像組學預測模型。結果顯示,邏輯回歸模型在識別高危重度ACS患者中表現出穩定、良好的診斷效能、校準度以及臨床實用性。
影像組學可以從醫學圖像中提取海量的定量特征,挖掘肉眼難以識別的信息。近年來,影像組學逐漸應用于頸動脈斑塊的分析。Zhang等[8]建立的基于核磁的影像組學預測模型可以顯著區分癥狀性斑塊和無癥狀性斑塊。其在訓練集和驗證集中的AUC分別為0.988和0.989,要顯著高于由斑塊內出血和富含脂質壞死核心構成的臨床預測模型(AUC分別為0.825和0.804)。Chen等[9]的研究也得到了相似的結果。在超聲方面,Huang等[10]的研究也表明,基于超聲的影像組學預測模型同樣優于臨床和傳統的超聲模型。超聲檢查具有無創、便捷、無輻射等優點,是臨床上頸動脈斑塊評估的首選檢查方式,但是操作者主觀性較強,圖像噪聲高然、分辨率較差。而核磁檢查無輻射,可以進行多參數、多序列成像,提供了更為詳細的斑塊信息,且可以識別斑塊內出血、富含脂質壞死核心等成分,在不穩定斑塊評估中具有重要作用,但是其費用高,成像時間長,臨床應用相對較少。而CTA是評估頸動脈狹窄和斑塊形態的穩健方法,除了提供關于管腔狹窄程度的準確信息之外,它還可以提供關于斑塊形態和特征的豐富細節[16]。但是其具有輻射性,需要注射含碘造影劑,腎功能不全患者受到一定限制。與核磁和超聲檢查相比,CTA具有廣泛的臨床應用性及操作者獨立性,非常適合于頸動脈斑塊影像組學分析。但是目前缺乏大樣本的基于CT的頸動脈斑塊影像組學研究。因此本研究對頸動脈斑塊進行了影像組學分析,經過特征篩選最終得到4個組學特征,分別為高斯拉普拉斯濾波圖像中的灰度共生矩陣相關性信息度量1、高斯拉普拉斯濾波圖像中的一階特征最大特征值、小波變換圖像中的一階特征峰度、小波變換圖像中的灰度依賴矩陣灰度非均勻性。這4項組學特征均在一定程度上反映了像素的分布情況[17-18],可能反映了斑塊的潛在組織病理學改變。但是目前尚無有關斑塊組學與組織病理學的對照研究,因此斑塊組學特征的生物學意義仍需進一步研究。此外,我們發現篩選出的4項組學特征與之前的2項初步研究[11-12]的結果并不相同,這可能與納入標準的差異相關。本研究納入患者均為單側重度狹窄患者,而既往研究[11-12]納入的患者頸動脈狹窄程度異質性較大。此外,各研究間組學特征提取方法各不相同,因此尚需標準、統一的研究進一步予以驗證。
本研究基于上述4項組學特征構建了基于CT的影像組學模型,結果顯示,邏輯回歸模型在識別高危重度ACS患者中表現出較高的、穩定的診斷效能,訓練集AUC為0.872,95%CI(0.813,0.931),驗證集AUC為0.867,95%CI(0.776,0.959)。校準曲線及Hosmer-Lemeshow擬合優度檢驗顯示預測概率與實際概率之間具有較好的一致性。決策曲線分析顯示邏輯回歸模型具有良好的臨床應用價值。因此對于預測模型識別的傾向于發生臨床癥狀的高危ACS患者而言,在嚴格BMT的基礎上,積極接受血管重建治療可能是更好的選擇,但是仍然需要前瞻性研究進一步予以證實。
此外,機器學習可以綜合大數據影像資料,深度挖掘多維影像學信息,實現精準診斷及預測[19]。而選擇適當的機器學習算法可提高模型的穩定性和預測效能。因此使用邏輯回歸、決策樹、隨機森林、支持向量機、樸素貝葉斯和K最鄰近6種不同的有監督機器學習算法將篩選出的影像組學特征用于構建預測模型。結果顯示,在訓練集中,隨機森林模型表現出最高的診斷效能(AUC為0.906),但是在驗證集中AUC僅為0.710,存在過擬合。而綜合6種算法,發現邏輯回歸模型具有較高的且更為穩定的診斷效能。同時,邏輯回歸模型也是目前臨床最為常用的機器學習算法,并且易于操作,適合二分類變量的模型構建。此外,一項系統綜述[20]也表明,在結局為二分類變量的臨床預測模型中,其它較為新穎的機器學習算法的預測能力并不優于傳統的邏輯回歸算法。
本研究存在以下局限性:(1)本研究為回顧性研究,部分缺乏CTA圖像的患者被排除,選擇偏倚無法避免;(2)大部分患者接受了手術治療,術者基于臨床經驗的篩選可能會對研究結果產生影響;(3)本研究為單中心研究,缺乏外部驗證;(4)為了最大程度地反映斑塊信息,我們對整個斑塊進行了勾畫,這也導致部分特征的穩定性欠佳;(5)本研究未對相關臨床特征進行分析,因此影像組學預測模型的診斷效能是否優于臨床特征仍需進一步研究。
總之,基于機器學習的影像組學預測模型在識別高危重度ACS患者中具有良好的診斷效能、校準度和臨床應用價值,有望作為臨床決策的輔助工具。
利益沖突:無。
作者貢獻:劉展負責數據分析和論文初稿撰寫;劉曉鵬負責數據收集和論文初稿撰寫;劉敏負責數據收集;甄雅南、鄭夏、溫見燕負責數據收集和整理;葉志東負責研究指導和論文修改;劉鵬負責論文設計、審閱與修改。