引用本文: 李芊, 周逸菲, 李崢艷, 汪曉東, 高紹兵, 李立. 基于 CT 的直腸癌新輔助化療后病理完全緩解預測模型的初步探索—DACCA數據庫的聯合研究. 中國普外基礎與臨床雜志, 2020, 27(5): 606-611. doi: 10.7507/1007-9424.202003073 復制
有文獻[1-4]報道 13.0%~22.2% 接受新輔助放化療的局部進展期直腸癌患者可以獲得病理完全緩解(pathological complete response,pCR)。對于在根治性手術前已經達到 pCR 的患者,因其局部無腫瘤細胞殘留,故可能可以在嚴格隨訪下采取“觀察等待(wait and see)”的治療策略,從而避免根治性手術帶來的吻合口漏、永久性造口、排尿障礙、性功能障礙等風險[5-8]。因此,直腸癌新輔助治療后 pCR 相關因素的探究及精準預測則成為近年來直腸癌領域研究的熱門話題。目前 CT 或 MRI 影像學檢查結果是新輔助治療效果判斷的重要依據。已有研究[9-16]表明,基于人工智能和醫療大數據的影像組學技術可以較好地提高 pCR 的預測效能。但是目前絕大部分 pCR 影像組學預測模型的建立是基于 MRI 檢查結果,基于 CT 建立的預測模型研究少有報道,本研究通過對基于 CT 檢查結果評估直腸癌新輔助化療后效果預測的模型做一報道。
1 資料與方法
1.1 臨床數據來源
本次研究中臨床數據來源于四川大學華西醫院腸癌數據庫(Database from Colorectal Cancer,DACCA)2019 年 2 月 20 日版本。
1.2 研究對象
從 DACCA 數據庫中篩選四川大學華西醫院 2016 年 10 月至 2019 年 3 月期間收治的經活檢及臨床綜合診斷為局部進展期直腸癌且經過單純新輔助化療后行根治性手術患者的臨床病理資料。手術方式根據手術規范流程進行。病例納入標準:① 經腸鏡活檢證實為原發直腸腺癌、黏液腺癌或印戒細胞癌;② 根治性手術前進行 2~4 周輔助治療;③ 手術后經病理檢查且報告有明確腫瘤退縮分級(tumor regression grade,TGR)記錄;④ 新輔助治療前后均接受全腹增強 CT。排除標準:① 臨床或影像資料不齊全;② CT 圖像質量差或 DICOM格式缺失而致無法提取影像組學特征。
1.3 CT 檢查
應用德國 Siemens 公司生產的 Somantom Definition AS/Flash 128 排 CT 機,層厚 2 mm。造影劑為碘 300 mgI/mL,按 1.5 mL/kg 體質量計算給藥量。高壓注射器肘前靜脈注射,速率 2.5 mL/s,腹部于造影劑注射后 30 s、60 s 分別行屏氣動脈期、門靜脈期掃描,掃描范圍包括所有病變區域。所有圖像傳輸至圖像存檔和通訊系統(picture archiving and communication system,PACS)。
1.4 單純新輔助化療方案
同中心同期研究[17-18]表明,本研究團隊所采用的多周期單純新輔助化療聯合阿帕替尼方案在臨床上針對局部進展期直腸癌患者進行手術具有較滿意的轉化切除率。具體化療方案如下:入組患者主要接受 2~4 周期的化療聯合阿帕替尼方案(至少 1 個周期同時聯合使用阿帕替尼:阿帕替尼 250 mg,1 次/d,連續 10 d),2 個周期之間休息 3 周。化療方案有 3 種:① FOLFOX 方案:奧沙利鉑 85 mg/m2 靜脈滴注、第 1 天,亞葉酸鈣 200 mg/m2 靜脈滴注、第 1 天,5-氟尿嘧啶 400 mg/m2 靜脈推注、第 1 天,5-氟尿嘧啶 600 mg/m2 持續靜脈滴注 22 h、第 1~2 天;② FOLFIRI 方案:伊立替康 180 mg/m3+亞葉酸鈣 400 mg/m2 靜脈滴注 30~90 min、第 1 天,5-氟尿嘧啶 400 mg/m2 靜脈推注、第 1 天,5-氟尿嘧啶 2 400 mg/m2 持續靜脈滴注 46~48 h、第 1~2 天;③ CapeOX 方案:奧沙利鉑 130 mg/m2 靜脈滴注、第 1 天,卡培他濱 1 000 mg/m2、2 次/d、口服、共 14 d。
1.5 病理學評估
根據第 7 版美國癌癥聯合委員會(AJCC)分期標準,將 pCR 定義為直腸癌新輔助治療后手術切除標本(包括清掃的淋巴結)在顯微鏡下腫瘤細胞完全消失。采用腫瘤退縮分級(tumor regression grading,TRG)對新輔助治療的療效進行評估:TRG0 為無腫瘤細胞殘留,TRG1 為腫瘤病灶殘留<10%,TRG2 為腫瘤病灶殘留 10%~50%,TRG3 為腫瘤病灶殘留>50%。根據 TRG 將患者分為 pCR 組(TRG0)和非 pCR 組(TRG1~TRG3)。
1.6 影像組學特征提取與篩選
從 PACS 中導出 DICOM 格式圖像,通過 ITK-SNAP 軟件手動選擇并勾畫腫瘤最大層面的影像感興趣區(region of interest,ROI)。將勾畫好的 ROI 以 DICOM 格式導入 MATLAB 軟件進行處理,通過軟件自動計算提取并篩選出多個影像組學特征,主要包括灰度特征、紋理特征、形狀特征 3 大類。
1.6.1 灰度特征提取
通過對醫學圖像進行灰度分析,可得到圖像的灰度直方圖,從中可以提取出許多有效的灰度特征,主要包括:① 均值:反映了一幅圖像的灰度平均值;② 方差:反映了一幅圖像的灰度在數值上的離散分布情況;③ 標準差:是方差的平方根;④ 偏離度:反映了圖像直方圖分布的不對稱程度,偏離度越大表示直方圖分布越不對稱,反之越對稱;⑤ 峰態:反映了圖像的灰度分布與平均值的相近度,用以判斷圖像的灰度分布是否集中于均值,越小表示越集中;⑥ 能量:反映了灰度分布的均勻程度,能量越大分布越均勻;⑦ 熵:反映了直方圖分布的均勻性。
1.6.2 紋理特征提取
基于灰度共生矩陣,從中可以提取出很多統計量作為紋理特征,主要包括:① 能量:反映了圖像區域的均勻性或平滑性;② 對比度,又稱非相似性:反映了圖像的清晰度,即紋理的清晰度;③ 相關系數:在一定程度上反映了矩陣行與列的線性相關程度,相關系數較大時,圖像區域灰度分布比較均勻;④ 同質化:反映灰度共生矩陣中元素的分布到對角線緊密程度。
1.6.3 形狀特征提取
基于區域的形狀特征描述方法,將整個區域作為一個整體,利用區域內所有像素來提取一系列形狀特征。主要包括:① 邊界長度:即周長,也就是區域的輪廓長度;② 直徑:是邊界上相隔最遠的兩點之間的距離,即這兩點之間的直連線段長度;③ 面積:描述了區域大小的基本特征,假設以像素為單位,則面積就是區域內像素數;④ 重心:一種全局描述符;⑤ 形狀參數:根據周長和面積計算得到,一定程度上這個參數可以描述區域緊湊性,對尺度變換和旋轉變換不敏感。
1.6.4 影像組學特征篩選
通過線性回歸系數 w*=(XTX)–1XTy(X 為特征矩陣,XT為特征矩陣的轉置,y 為真實值)對影像組學特征進行降維,調用 MATLAB 庫中提供的“corrcoef()函數”計算 2 個序列的相關性,從經過數據歸一化的原始影像組學特征中選出相關系數非零的影像組學特征。
1.7 模型建立
采用美國 MATLAB 軟件的分類回歸樹(classification and regression tree,CART)模型[19-21]將影像組學特征值標簽和患者臨床信息標簽用于直腸癌單純新輔助化療后 pCR 預測模型的建立,其中自變量為影像組學特征值,因變量為直腸癌單純新輔助化療后 pCR 情況。影像組學特征值為數值型變量;直腸癌單純新輔助化療后 pCR 情況為類別型變量,定義為 pCR 情況(0=pCR 組;1=非 pCR 組)。為減少抽樣對分類性能帶來的偏差,以 20% 的隨機樣本作為測試集(訓練集和驗證集的比例為 4∶1),通過五折交叉驗證法確定最優模型。在實驗過程中,CART 采用 Boot-strapping 法訓練子分類器,通過調整 CART 決策樹分類器的參數對提取的特征進行分類。
1.8 統計學方法
使用 SPSS 22.0 軟件對預測結果進行統計學分析。以病理結果為金標準,計算決策樹模型的敏感度和特異度,繪制受試者操作特征(ROC)曲線并計算其曲線下面積(area under the ROC curve,AUC),從而評估模型預測效能,當 AUC 為 (0.85~1.00) 時則表示預測效果很好,當 AUC 為(0.70~0.85)時則表示預測效果效果一般,當 AUC 為(0.50~0.70)時則表示預測效果較低,當 AUC 為 0.50,認為模型沒有預測價值。
2 結果
2.1 一般資料
根據本研究的病例納入和排除標準共納入符合條件的局部進展期直腸癌患者 244 例,年齡 28~90 歲、(58±11)歲;男 159 例,年齡(58±11)歲;女 85 例,年齡(59±12)歲。根據術后病理 TRG 分級得出 pCR 組 28 例,非 pCR 組 216 例。患者的具體臨床資料見表 1。
2.2 影像組學數據預處理和特征篩選結果
CT 圖像勾畫的 ROI 及提取的相應圖像標簽見圖 1。針對分割后的 ROI 區域,采用 MATLAB 軟件提取 ROI 圖像標簽并通過對每幅 CT 圖像的 ROI 區域進行計算,最終獲得 13 個相關系數非零的影像組學特征,見表 2。
圖1
示 ITK-SNAP 勾畫 ROI(紅色)示意圖(a)及對應的圖像標簽(b)
2.3 模型預測效能評價
基于 CT 的決策樹模型預測局部進展期直腸癌患者新輔助療效果的 ROC 曲線見圖 2,模型預測結果見表 3。本模型的 AUC 值為 0.772 [95% CI(0.656,0.888)],AUC 值>0.70,說明本模型有較好的預測效能,尤其是對于非 pCR 的預測準確度較高(97.2%),但敏感度即對于 pCR 的預測準確度較低(57.1%)。
圖2
基于 CT 的決策樹模型預測局部進展期直腸癌患者新輔助治療效果的 ROC 曲線
3 討論
3.1 本研究的優勢與創新
目前,在臨床實踐中常通過臨床完全緩解來對 pCR 進行預測,但近年來的研究顯示,因受影像學特征挖掘不充分、主觀因素等的限制,臨床完全緩解和 pCR 關聯性較差;此外,迄今為止,國內外影像組學研究關注的對象均為術前接受同步放化療的患者,針對接受單純新輔助化療患者的影像組學研究還未見報道;另外,除了在 2018 年報道的 1 篇文獻[13]中采用了 CT 影像學特征進行建模之外,目前國內外研究多采用 MRI 影像學特征進行建模。考慮到相較于 MRI,CT 成像具有費用便宜、檢查時間段、普及地區更廣等優點,本研究所建立的基于 CT 的 pCR 預測模型可能具有更迫切、更廣闊的臨床應用需求。本研究基于 CT 影像組學建立的預測模型,通過灰度共生矩陣等算法,挖掘出了包括紋理特征、灰度特征等肉眼無法辨識的定量化信息[22],在一定程度上展現出高于常規臨床方法的預測潛能。由于考慮到與術前接受同步放化療患者相比,新輔助化療患者可以在無較大總生存率差異的基礎上[23]顯著降低放療所帶來的毒副反應,從而提高患者生活質量[24-25],故本研究此次在新輔助化療患者中初步探索的臨床意義則更重大。
3.2 本研究的局限性分析
本研究為回顧性研究,缺少交叉驗證;同時為單中心研究,存在病例的選擇偏倚,下一步的研究中考慮前瞻性納入病例進行模型效能的驗證。
本研究中 ROI 為選取腫瘤最大層面勾畫的 2D 結果,若能勾畫腫瘤所在全部圖層的 3D 結果則可以提供包括體積、重心等更多影像組學信息,從而可能篩選出相關性更強的影像組學特征。
本研究所采用的特征篩選和建模方法均與文獻已報道的同質性研究有所不同,文獻[9-16]報道中多采用 LASSO 回歸進行影像組學特征的篩選,通過支持向量機或人工神經網絡建立預測模型,研究結果顯示其預測效能較高(68%~95%)。雖然本研究建模過程中所用決策樹模型在其他相關直腸癌術前預測模型研究[26-27]中已展現出了較滿意的分類效能,即基于 CT 的決策樹模型在結直腸癌術前 T、N 分期上效能(敏感度)良好(79.2%~97.1%),但在本研究中的預測效能即敏感度相對較低(57.1%),分析其原因可能是影像組學特征篩選方法不佳所致;另外,有文獻[28-29]報道,決策樹聯合 SMOTE 算法可以改善數據平衡問題,且平衡后的數據可以更加有效地緩解數據不平衡的影響,因此,針對本研究中 pCR 和非 pCR 預測準確率有較大差異的問題,還可以從進一步優化分類算法的角度來解決。
本研究尚未結合其他可能的參數進行建模。目前部分文獻[30-32]中報道同時結合了其他預測因子聯合建模,這些預測因子主要為臨床因素(性別、年齡、生活習慣等)、血液及腫瘤分子標志物(治療前癌胚抗原水平、環氧化酶-2、血管內皮生長因子等)、相關腫瘤基因(KRAS、NRAS、BRAF、PIK3CA 等)。2018 年報道的基于 MRI 的研究[33]表明,影像組學特征同時結合腫瘤標志物等臨床信息構建的預測模型,其預測效能高于單純影像組學特征的預測模型。
本研究中納入的患者,新輔助治療周期數不穩定,為 2~4 周,因此不穩定的周期數也可能是導致模型可重復性較低的重要影響因子。
以上證據表明,本研究還應充分考慮局部進展期直腸癌患者多方面的異質性,即綜合臨床、影像等多方面的因素,進一步優化基于 CT 的單純新輔助化療后 pCR 預測模型。
總之,本研究是針對接受單純新輔助化療的局部進展期直腸癌患者治療后基于 CT 影像組學特征建立 pCR 預測模型的一次初步探索,CART 預測模型在判斷非 pCR 中表現出了較理想的效能,故有理由相信,在克服上述研究局限性后,可以實現基于 CT 影像組學的 pCR 精準預測。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:李芊主要負責數據提取、統計分析、文章主體撰寫以及投稿工作;周逸菲主要負責模型構建以及相應部分的撰寫工作;李崢艷主要負責影像數據庫提供、文章修改以及部分文章撰寫;高紹兵主要負責模型構建的修正、文章修改;汪曉東和李立主要負責 DACCA 數據庫提供、文章修改以及部分文章撰寫。
倫理聲明:本研究通過了四川大學華西醫院倫理委員會審批(批文編號:2019-140 號)。
有文獻[1-4]報道 13.0%~22.2% 接受新輔助放化療的局部進展期直腸癌患者可以獲得病理完全緩解(pathological complete response,pCR)。對于在根治性手術前已經達到 pCR 的患者,因其局部無腫瘤細胞殘留,故可能可以在嚴格隨訪下采取“觀察等待(wait and see)”的治療策略,從而避免根治性手術帶來的吻合口漏、永久性造口、排尿障礙、性功能障礙等風險[5-8]。因此,直腸癌新輔助治療后 pCR 相關因素的探究及精準預測則成為近年來直腸癌領域研究的熱門話題。目前 CT 或 MRI 影像學檢查結果是新輔助治療效果判斷的重要依據。已有研究[9-16]表明,基于人工智能和醫療大數據的影像組學技術可以較好地提高 pCR 的預測效能。但是目前絕大部分 pCR 影像組學預測模型的建立是基于 MRI 檢查結果,基于 CT 建立的預測模型研究少有報道,本研究通過對基于 CT 檢查結果評估直腸癌新輔助化療后效果預測的模型做一報道。
1 資料與方法
1.1 臨床數據來源
本次研究中臨床數據來源于四川大學華西醫院腸癌數據庫(Database from Colorectal Cancer,DACCA)2019 年 2 月 20 日版本。
1.2 研究對象
從 DACCA 數據庫中篩選四川大學華西醫院 2016 年 10 月至 2019 年 3 月期間收治的經活檢及臨床綜合診斷為局部進展期直腸癌且經過單純新輔助化療后行根治性手術患者的臨床病理資料。手術方式根據手術規范流程進行。病例納入標準:① 經腸鏡活檢證實為原發直腸腺癌、黏液腺癌或印戒細胞癌;② 根治性手術前進行 2~4 周輔助治療;③ 手術后經病理檢查且報告有明確腫瘤退縮分級(tumor regression grade,TGR)記錄;④ 新輔助治療前后均接受全腹增強 CT。排除標準:① 臨床或影像資料不齊全;② CT 圖像質量差或 DICOM格式缺失而致無法提取影像組學特征。
1.3 CT 檢查
應用德國 Siemens 公司生產的 Somantom Definition AS/Flash 128 排 CT 機,層厚 2 mm。造影劑為碘 300 mgI/mL,按 1.5 mL/kg 體質量計算給藥量。高壓注射器肘前靜脈注射,速率 2.5 mL/s,腹部于造影劑注射后 30 s、60 s 分別行屏氣動脈期、門靜脈期掃描,掃描范圍包括所有病變區域。所有圖像傳輸至圖像存檔和通訊系統(picture archiving and communication system,PACS)。
1.4 單純新輔助化療方案
同中心同期研究[17-18]表明,本研究團隊所采用的多周期單純新輔助化療聯合阿帕替尼方案在臨床上針對局部進展期直腸癌患者進行手術具有較滿意的轉化切除率。具體化療方案如下:入組患者主要接受 2~4 周期的化療聯合阿帕替尼方案(至少 1 個周期同時聯合使用阿帕替尼:阿帕替尼 250 mg,1 次/d,連續 10 d),2 個周期之間休息 3 周。化療方案有 3 種:① FOLFOX 方案:奧沙利鉑 85 mg/m2 靜脈滴注、第 1 天,亞葉酸鈣 200 mg/m2 靜脈滴注、第 1 天,5-氟尿嘧啶 400 mg/m2 靜脈推注、第 1 天,5-氟尿嘧啶 600 mg/m2 持續靜脈滴注 22 h、第 1~2 天;② FOLFIRI 方案:伊立替康 180 mg/m3+亞葉酸鈣 400 mg/m2 靜脈滴注 30~90 min、第 1 天,5-氟尿嘧啶 400 mg/m2 靜脈推注、第 1 天,5-氟尿嘧啶 2 400 mg/m2 持續靜脈滴注 46~48 h、第 1~2 天;③ CapeOX 方案:奧沙利鉑 130 mg/m2 靜脈滴注、第 1 天,卡培他濱 1 000 mg/m2、2 次/d、口服、共 14 d。
1.5 病理學評估
根據第 7 版美國癌癥聯合委員會(AJCC)分期標準,將 pCR 定義為直腸癌新輔助治療后手術切除標本(包括清掃的淋巴結)在顯微鏡下腫瘤細胞完全消失。采用腫瘤退縮分級(tumor regression grading,TRG)對新輔助治療的療效進行評估:TRG0 為無腫瘤細胞殘留,TRG1 為腫瘤病灶殘留<10%,TRG2 為腫瘤病灶殘留 10%~50%,TRG3 為腫瘤病灶殘留>50%。根據 TRG 將患者分為 pCR 組(TRG0)和非 pCR 組(TRG1~TRG3)。
1.6 影像組學特征提取與篩選
從 PACS 中導出 DICOM 格式圖像,通過 ITK-SNAP 軟件手動選擇并勾畫腫瘤最大層面的影像感興趣區(region of interest,ROI)。將勾畫好的 ROI 以 DICOM 格式導入 MATLAB 軟件進行處理,通過軟件自動計算提取并篩選出多個影像組學特征,主要包括灰度特征、紋理特征、形狀特征 3 大類。
1.6.1 灰度特征提取
通過對醫學圖像進行灰度分析,可得到圖像的灰度直方圖,從中可以提取出許多有效的灰度特征,主要包括:① 均值:反映了一幅圖像的灰度平均值;② 方差:反映了一幅圖像的灰度在數值上的離散分布情況;③ 標準差:是方差的平方根;④ 偏離度:反映了圖像直方圖分布的不對稱程度,偏離度越大表示直方圖分布越不對稱,反之越對稱;⑤ 峰態:反映了圖像的灰度分布與平均值的相近度,用以判斷圖像的灰度分布是否集中于均值,越小表示越集中;⑥ 能量:反映了灰度分布的均勻程度,能量越大分布越均勻;⑦ 熵:反映了直方圖分布的均勻性。
1.6.2 紋理特征提取
基于灰度共生矩陣,從中可以提取出很多統計量作為紋理特征,主要包括:① 能量:反映了圖像區域的均勻性或平滑性;② 對比度,又稱非相似性:反映了圖像的清晰度,即紋理的清晰度;③ 相關系數:在一定程度上反映了矩陣行與列的線性相關程度,相關系數較大時,圖像區域灰度分布比較均勻;④ 同質化:反映灰度共生矩陣中元素的分布到對角線緊密程度。
1.6.3 形狀特征提取
基于區域的形狀特征描述方法,將整個區域作為一個整體,利用區域內所有像素來提取一系列形狀特征。主要包括:① 邊界長度:即周長,也就是區域的輪廓長度;② 直徑:是邊界上相隔最遠的兩點之間的距離,即這兩點之間的直連線段長度;③ 面積:描述了區域大小的基本特征,假設以像素為單位,則面積就是區域內像素數;④ 重心:一種全局描述符;⑤ 形狀參數:根據周長和面積計算得到,一定程度上這個參數可以描述區域緊湊性,對尺度變換和旋轉變換不敏感。
1.6.4 影像組學特征篩選
通過線性回歸系數 w*=(XTX)–1XTy(X 為特征矩陣,XT為特征矩陣的轉置,y 為真實值)對影像組學特征進行降維,調用 MATLAB 庫中提供的“corrcoef()函數”計算 2 個序列的相關性,從經過數據歸一化的原始影像組學特征中選出相關系數非零的影像組學特征。
1.7 模型建立
采用美國 MATLAB 軟件的分類回歸樹(classification and regression tree,CART)模型[19-21]將影像組學特征值標簽和患者臨床信息標簽用于直腸癌單純新輔助化療后 pCR 預測模型的建立,其中自變量為影像組學特征值,因變量為直腸癌單純新輔助化療后 pCR 情況。影像組學特征值為數值型變量;直腸癌單純新輔助化療后 pCR 情況為類別型變量,定義為 pCR 情況(0=pCR 組;1=非 pCR 組)。為減少抽樣對分類性能帶來的偏差,以 20% 的隨機樣本作為測試集(訓練集和驗證集的比例為 4∶1),通過五折交叉驗證法確定最優模型。在實驗過程中,CART 采用 Boot-strapping 法訓練子分類器,通過調整 CART 決策樹分類器的參數對提取的特征進行分類。
1.8 統計學方法
使用 SPSS 22.0 軟件對預測結果進行統計學分析。以病理結果為金標準,計算決策樹模型的敏感度和特異度,繪制受試者操作特征(ROC)曲線并計算其曲線下面積(area under the ROC curve,AUC),從而評估模型預測效能,當 AUC 為 (0.85~1.00) 時則表示預測效果很好,當 AUC 為(0.70~0.85)時則表示預測效果效果一般,當 AUC 為(0.50~0.70)時則表示預測效果較低,當 AUC 為 0.50,認為模型沒有預測價值。
2 結果
2.1 一般資料
根據本研究的病例納入和排除標準共納入符合條件的局部進展期直腸癌患者 244 例,年齡 28~90 歲、(58±11)歲;男 159 例,年齡(58±11)歲;女 85 例,年齡(59±12)歲。根據術后病理 TRG 分級得出 pCR 組 28 例,非 pCR 組 216 例。患者的具體臨床資料見表 1。
2.2 影像組學數據預處理和特征篩選結果
CT 圖像勾畫的 ROI 及提取的相應圖像標簽見圖 1。針對分割后的 ROI 區域,采用 MATLAB 軟件提取 ROI 圖像標簽并通過對每幅 CT 圖像的 ROI 區域進行計算,最終獲得 13 個相關系數非零的影像組學特征,見表 2。
圖1
示 ITK-SNAP 勾畫 ROI(紅色)示意圖(a)及對應的圖像標簽(b)
2.3 模型預測效能評價
基于 CT 的決策樹模型預測局部進展期直腸癌患者新輔助療效果的 ROC 曲線見圖 2,模型預測結果見表 3。本模型的 AUC 值為 0.772 [95% CI(0.656,0.888)],AUC 值>0.70,說明本模型有較好的預測效能,尤其是對于非 pCR 的預測準確度較高(97.2%),但敏感度即對于 pCR 的預測準確度較低(57.1%)。
圖2
基于 CT 的決策樹模型預測局部進展期直腸癌患者新輔助治療效果的 ROC 曲線
3 討論
3.1 本研究的優勢與創新
目前,在臨床實踐中常通過臨床完全緩解來對 pCR 進行預測,但近年來的研究顯示,因受影像學特征挖掘不充分、主觀因素等的限制,臨床完全緩解和 pCR 關聯性較差;此外,迄今為止,國內外影像組學研究關注的對象均為術前接受同步放化療的患者,針對接受單純新輔助化療患者的影像組學研究還未見報道;另外,除了在 2018 年報道的 1 篇文獻[13]中采用了 CT 影像學特征進行建模之外,目前國內外研究多采用 MRI 影像學特征進行建模。考慮到相較于 MRI,CT 成像具有費用便宜、檢查時間段、普及地區更廣等優點,本研究所建立的基于 CT 的 pCR 預測模型可能具有更迫切、更廣闊的臨床應用需求。本研究基于 CT 影像組學建立的預測模型,通過灰度共生矩陣等算法,挖掘出了包括紋理特征、灰度特征等肉眼無法辨識的定量化信息[22],在一定程度上展現出高于常規臨床方法的預測潛能。由于考慮到與術前接受同步放化療患者相比,新輔助化療患者可以在無較大總生存率差異的基礎上[23]顯著降低放療所帶來的毒副反應,從而提高患者生活質量[24-25],故本研究此次在新輔助化療患者中初步探索的臨床意義則更重大。
3.2 本研究的局限性分析
本研究為回顧性研究,缺少交叉驗證;同時為單中心研究,存在病例的選擇偏倚,下一步的研究中考慮前瞻性納入病例進行模型效能的驗證。
本研究中 ROI 為選取腫瘤最大層面勾畫的 2D 結果,若能勾畫腫瘤所在全部圖層的 3D 結果則可以提供包括體積、重心等更多影像組學信息,從而可能篩選出相關性更強的影像組學特征。
本研究所采用的特征篩選和建模方法均與文獻已報道的同質性研究有所不同,文獻[9-16]報道中多采用 LASSO 回歸進行影像組學特征的篩選,通過支持向量機或人工神經網絡建立預測模型,研究結果顯示其預測效能較高(68%~95%)。雖然本研究建模過程中所用決策樹模型在其他相關直腸癌術前預測模型研究[26-27]中已展現出了較滿意的分類效能,即基于 CT 的決策樹模型在結直腸癌術前 T、N 分期上效能(敏感度)良好(79.2%~97.1%),但在本研究中的預測效能即敏感度相對較低(57.1%),分析其原因可能是影像組學特征篩選方法不佳所致;另外,有文獻[28-29]報道,決策樹聯合 SMOTE 算法可以改善數據平衡問題,且平衡后的數據可以更加有效地緩解數據不平衡的影響,因此,針對本研究中 pCR 和非 pCR 預測準確率有較大差異的問題,還可以從進一步優化分類算法的角度來解決。
本研究尚未結合其他可能的參數進行建模。目前部分文獻[30-32]中報道同時結合了其他預測因子聯合建模,這些預測因子主要為臨床因素(性別、年齡、生活習慣等)、血液及腫瘤分子標志物(治療前癌胚抗原水平、環氧化酶-2、血管內皮生長因子等)、相關腫瘤基因(KRAS、NRAS、BRAF、PIK3CA 等)。2018 年報道的基于 MRI 的研究[33]表明,影像組學特征同時結合腫瘤標志物等臨床信息構建的預測模型,其預測效能高于單純影像組學特征的預測模型。
本研究中納入的患者,新輔助治療周期數不穩定,為 2~4 周,因此不穩定的周期數也可能是導致模型可重復性較低的重要影響因子。
以上證據表明,本研究還應充分考慮局部進展期直腸癌患者多方面的異質性,即綜合臨床、影像等多方面的因素,進一步優化基于 CT 的單純新輔助化療后 pCR 預測模型。
總之,本研究是針對接受單純新輔助化療的局部進展期直腸癌患者治療后基于 CT 影像組學特征建立 pCR 預測模型的一次初步探索,CART 預測模型在判斷非 pCR 中表現出了較理想的效能,故有理由相信,在克服上述研究局限性后,可以實現基于 CT 影像組學的 pCR 精準預測。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:李芊主要負責數據提取、統計分析、文章主體撰寫以及投稿工作;周逸菲主要負責模型構建以及相應部分的撰寫工作;李崢艷主要負責影像數據庫提供、文章修改以及部分文章撰寫;高紹兵主要負責模型構建的修正、文章修改;汪曉東和李立主要負責 DACCA 數據庫提供、文章修改以及部分文章撰寫。
倫理聲明:本研究通過了四川大學華西醫院倫理委員會審批(批文編號:2019-140 號)。



