肺癌是全球癌癥死亡的主要原因之一,現有治療手段包括手術、放射治療、化學治療、靶向治療及免疫治療等。如何為患者找到最佳的治療方案以及準確判斷患者的預后情況,是臨床上十分棘手的問題。近年來,影像組學作為一種新興的醫學影像分析方法,逐漸受到研究者的關注。它的基本假設是醫學影像蘊藏著患者海量的生物信息,而這些信息很難通過肉眼識別,卻可以通過計算機獲取。影像組學最常見的應用之一是在非小細胞肺癌(non-small cell lung cancer,NSCLC)診療中的應用。本文回顧了目前基于胸部CT的影像組學在NSCLC診療中的研究,對該領域的研究現狀作了簡單的小結,涉及到肺癌的定性診斷、療效預測及預后分析等多個方面。本文還簡要闡述了目前該技術主要的技術限制,以期更廣泛地了解該技術在NSCLC診療中的潛在作用,并推進其作為NSCLC患者個體化診療工具的發展。
引用本文: 趙珂, 饒可, 李單青. 基于胸部CT的影像組學技術在非小細胞肺癌個體化診療中應用的研究進展. 中國胸心血管外科臨床雜志, 2022, 29(6): 782-787. doi: 10.7507/1007-4848.202106109 復制
肺癌是臨床上最常見的惡性腫瘤之一,通常被認為是一組異質性很強的疾病,其中80%~85%的肺癌屬于非小細胞肺癌(non-small cell lung cancer,NSCLC),其發病率在我國男性惡性腫瘤發病率中位列第一,在女性中位列第二,其病死率則在男性和女性中均位列第一[1],嚴重威脅著我國人民的生命健康。經過多年的努力,NSCLC的診斷與治療方式都有了長足的進步,但約1/3的患者首次被診斷為NSCLC時已是晚期,包括我國在內的全球大多數國家的NSCLC患者總體5年生存率在10%~20%之間[1-2],這提示我們目前對NSCLC患者的臨床管理仍然有非常大的進步空間,例如如何在疾病發現的早期就判斷疾病的病理學性質、基因突變情況、適宜的療法以及預后情況等。
影像組學是指通過借助計算機軟件高通量地從醫學影像中提取定量特征,然后利用統計學或計算機學習的方法,篩選出最有價值的影像學特征來協助臨床疾病診治的影像分析方法,這一概念最早由Kumar等[3]在2012年提出。其基本研究流程為:(1)確定研究問題和患者隊列;(2)分割患者圖像中的感興趣區域(region of interest,ROI);(3)提取圖像特征;(4)統計分析及建模[4]。影像組學技術可以最大程度地挖掘常規影像學檢查中所蘊含的信息,并且以此為基礎分析不同患者的臨床特點,進而實現針對患者特點的精準診療。它一經提出便在多種疾病的研究中廣泛應用,目前已經應用在腦膠質瘤、乳腺癌及阿爾茨海默病的診療實踐中[5-7]。鑒于影像組學在其它研究領域取得的可喜結果,也有很多研究者利用這一方法對NSCLC進行研究,以期在不增加患者創傷和經濟負擔的情況下,最大程度地精準分析患者病情并指導其個體化診療。
1 以CT為基礎的影像組學技術在非小細胞肺癌診療中的應用進展
1.1 預測肺結節的良惡性
通過CT來判斷肺內結節的良惡性是診斷NSCLC的重要手段,在既往單純依靠醫生經驗的情況下,通常憑借結節實性成分比例、結節長徑、鈣化征、血管集束征、空泡征、胸膜凹陷征、毛刺征及分葉征等影像學特征進行判斷,并且有研究者[8]據此構建了預測模型,但是臨床上并不是所有結節都有典型特征,這部分結節具有較高的診斷難度,因此針對肺部結節的良惡性鑒別是影像組學在NSCLC中最初的應用方向,目前已有多項研究顯示影像組學有超越傳統預測模型的優勢。
Kamiya等[9]在這方面較早地進行了探究,他們納入了93個肺結節,包括72個惡性結節和21個良性結節,根據密度直方圖計算峰度和偏度發現,相比于良性結節,惡性肺結節的CT圖像密度直方圖具有更大的峰度以及更小的偏度。Choi等[10]則利用支持向量機(support vector machine,SVM)和套索算法(least absolute shrinkage and selection operator,LASSO)開發了一個SVM-LASSO模型來預測肺內結節的惡性程度。該模型的主要參數為邊界框前后尺寸(bounding box anterior-posterior dimension,BB_AP)和反差矩的標準差(standard deviation of inverse difference moment,SD_IDM),其準確度為84.6%,比美國放射學會開發的肺癌早期篩查報告和數據系統高出12.4%。
近年還有學者嘗試使用多分類器融合模型對原發性肺實性結節的良惡性進行預測。Shen等[11]在完成特征選擇后,分別利用SVM、隨機森林(random forest,RF)、邏輯回歸(logistic regression,LR)、極限學習機(extreme learning machine,ELM)和K最近鄰(K-nearest neighbor,KNN)算法構建了5個分類器模型,然后將所有預測結果融合以預測結節性質,該研究共納入342例患者的CT圖像,按照7∶2∶1的比例劃分為訓練集、測試集和驗證集,最終發現紋理特征、小波特征和灰度特征等特征構成的預測模型對肺內實性結節的良惡性鑒別非常有意義,其精確度達92%,顯著優于各單項分類器的預測結果。
1.2 預測NSCLC的病理亞型及分子亞型
如前所述,肺癌是一組異質性很強的疾病,因此單純預測結節的良惡性是遠遠不夠的,尤其是在當今精準醫學的背景下,肺癌的治療非常依賴腫瘤的組織學以及分子學亞型[12]。在目前常規的臨床實踐中,對腫瘤組織學及分子學進行分類的最常見方法是對腫瘤組織進行組織病理學分析及基因檢測,但這種方式是有創的而且受到時間和成本限制[12]。因此,影像組學技術無創性、低成本、高效以及可重復的特點為我們帶來了希望,也有部分學者在這一領域做出了探索和努力。
Liu等[13]提出一種SLS模型,其特征篩選方法包括合成少數類過采樣技術(synthetic minority oversampling technique)、?2,1-范數最小化(?2,1-norm minimization)和SVM,研究者再通過一階統計、灰度共生矩陣和灰度大小區域矩陣進行降維分析,得到一個多特征的預測模型,它在訓練組中的精度為0.89[95%CI(0.846,0.912)],在測試組中的精度為0.86[95%CI(0.779,0.941)]。該模型用于預測NSCLC的4種主要亞型:鱗狀細胞癌(squamous cell carcinoma,SCC)、腺癌(adenocarcinoma,ADC)、大細胞癌(large cell carcinoma,LCC)及其它NSCLC。它有可能在臨床實踐中為肺癌治療提供有價值的信息。
還有研究者試圖應用影像組學技術區分非浸潤性肺腺癌(原位腺癌和微浸潤性腺癌)和浸潤性肺腺癌以指導外科手術方案。由于非浸潤性肺腺癌的預后良好,即使進行亞肺葉切除也有很高的5年無病生存率[14],因此如果能在術前判斷這一性質,對于患者的治療有重要的指示意義。Luo等[15]通過提取100個部分實性肺結節的CT影像特征構建了一個列線圖模型,這一模型是由CT特征聯合影像組學特征得到的,比單純應用CT特征或影像組學特征模型的效果均更佳,其中有意義的影像組學特征為集群陰影(ClusterShade_angle45_offset7)、和熵(sumEntropy)及球形比例(spherical disproportion),其意義為區分非浸潤性和浸潤性肺腺癌,其受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)為0.903。She等[16]也進行了類似的研究,且納入了更多的患者,該研究在進行影像組學建模的基礎上,加入了性別因素,研究者將患者分為訓練組(207例)和驗證組(195例),AUC分別為0.95[95%CI(0.91,0.98)]和0.89[95%CI(0.84,0.93)],顯著高于單純影像組學模型的數據,其訓練組和驗證組AUC為0.80[95%CI(0.73,0.87)]和0.77[95%CI(0.60,0.85)]。從目前的研究結果來看,微浸潤腺癌的預后顯著優于浸潤性腺癌,而且亞肺葉切除也可以達到與肺葉切除類似的治療效果,上述研究可能有助于指導肺結節患者的手術選擇。
眾所周知,部分肺腺癌致癌的核心機制為體細胞基因的突變,包括表皮生長因子受體(epidermal growth factor receptor,EGFR)、kirsten鼠類肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)、間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)、原癌基因1(C-ros oncogene 1,ROS1),其中EGFR突變在中國肺癌患者中尤為常見[1]。如果能無創識別肺癌患者以上基因突變情況,將為患者的靶向治療提供精準指導。有多項研究指出,影像組學構建的預測模型可以靈敏地識別EGFR突變的存在。
在一項針對亞實性結節的研究[17]中,在訓練隊列中使用RF方法構建基于CT的放射組學特征(共43個特征),用于區分EGFR突變狀態,然后在驗證隊列中進行測試,其訓練組和驗證組的AUC值分別為0.831和0.789;該研究同時還設計了一個影像組學特征聯合臨床特征的預測模型,但是其預測效果不優于前者。還有研究指出,影像組學模型甚至可以區分肺腺癌患者EGFR突變的具體類型。Liu等[18]設計的模型提取了1 672個影像組學特征,并選定前10個最相關的特征,輔以年齡、性別和吸煙史等臨床特征共同構建預測模型。該預測模型不僅能識別EGFR突變,還可以區分突變是EGFR外顯子19缺失還是EGFR外顯子21 L858R突變,假如這一模型的精度可以得到進一步提高,那么它可能會成為一種對EGFR突變患者有用的非侵入性生物標記。針對其它驅動基因的研究相對較少,但仍有研究[19-20]提示影像組學衍生而來的機器學習模型可以潛在地用作識別肺腺癌ALK、ROS1等突變的非侵入性工具。
1.3 預測NSCLC的淋巴結轉移情況
影像組學研究對肺癌的手術治療也能提供一定幫助。如前所述,有研究者應用影像組學技術區分非浸潤性肺腺癌(原位腺癌和微浸潤性腺癌)和浸潤性肺腺癌以指導外科手術方案,而有研究者則致力于對淋巴結清掃范圍的探究。根據美國國家綜合癌癥網絡(National Comprehensive Cancer Network,NCCN)指南[21]的建議,對于可切除的NSCLC患者,至少要接受肺門及肺內淋巴結(N1)和縱隔淋巴結(N2)的切除,其中N2至少要進行3組清掃或者采樣。有研究[22]指出,對于術后病理證實淋巴結陰性的患者,與接受縱隔淋巴結采樣術相比,接受了縱隔淋巴結清掃術的患者生存率并沒有提高,反而帶來了更高的術后并發癥發生率,因此在術前判斷淋巴結轉移狀態也是一個非常值得研究的問題。
He等[23]構建了一個包含13個影像學特征的評分模型,隨著患者評分的增高,其淋巴結轉移的概率也就越大,評分為0~3、4~5、6、7~8和9分的患者其淋巴結轉移概率分別為0%~20%、21%~40%、41%~60%、61%~80%和81%~100%。該模型精準度為0.785[95%CI(0.780,0.790)],超越了臨床病理預測模型。Cong等[24]則將臨床ⅠA期患者作為目標患者,共納入649例ⅠA期患者,應用LASSO提取影像學特征,然后應用RF方法構建模型,設計了3種模型并進行了比較,包括單純臨床病理特征模型、單純影像組學模型(7個特征)以及聯合模型,結果發現,其驗證組AUC依次為0.614、0.851及0.860,后兩者的預測效果均優于前者。該研究樣本量較大,而且聯合模型和單純影像組學模型都在驗證組中得到了較好的結果,說明它們將會是有希望的設計。
1.4 預測NSCLC的系統治療效果
對于晚期或無法接受靶向治療的NSCLC患者,化學治療(化療)仍是非常重要的治療手段,但遺憾的是并非所有患者均對化療敏感,因此能在治療開始前識別患者對于化療的敏感性是至關重要的。Dercle等[25]對此問題進行了探究,該研究收集了CheckMate 063研究[26]中的50例患者資料,從每個可測量的最大肺部病變中,為每例患者提取了1 160個放射學特征,針對患者對多西他賽治療是否敏感,構建了預測模型。結果顯示該模型AUC為0.67[95%CI(0.37,0.96)],從數值上看該模型的預測效果并不十分出色,有待進一步改善,這可能與其納入樣本量較少有關。不過該模型也有其值得借鑒之處,它收集了每例患者基線CT數據和評估首次治療反應的CT數據,比較了患者治療前后影像學特征的變化情況,而不是單純分析治療前的特征,這在一定程度上可以幫助我們校正預測模型,實現更加精準的預測。
近年來,腫瘤的免疫治療方興未艾,為肺癌的治療提供了新思路,程序性死亡分子1(programmed death-1,PD-1)及其配體(PD-1 ligand,PD-L1)為靶點的免疫治療策略便是其中的典型代表,而在腫瘤細胞上的PD-L1表達被認為可以作為預測免疫治療療效的生物標記物[27]。有研究[28]指出,晚期肺癌患者的CT影像學特征有預測腫瘤組織中PD-L1表達的潛力,而且由臨床變量和CT影像學特征組成的預測模型可能有助于PD-L1表達的無創評估。
Trebeschi等[29]對影像組學預測免疫治療的療效進行了研究。該研究的研究對象是晚期NSCLC和黑色素瘤患者,結果發現具有不均勻密度模式和緊密邊界更加多樣化的病變更容易對免疫療法產生反應,且與癌癥種類無關,這一模型在肺癌亞組中的AUC值為0.83(P<0.001)。為了進一步揭示影像學特征的生物學意義,該研究創新性地在獨立的驗證組中將NSCLC患者的基因表達數據與影像組學特征進行匹配,結果發現與免疫療效相關的影像組學特征同時也與控制細胞周期和有絲分裂的基因表達相關,這表明高腫瘤增殖與免疫治療反應改善之間可能存在聯系,這有助于我們更加深入地理解免疫治療,并指導NSCLC的臨床實踐。
1.5 預測NSCLC的預后及結局
一直以來,肺癌的TNM分期是指導患者預后的重要工具,患者的無病生存期(disease-free survival,DFS)和總體生存期(overall survival,OS)都與其明確相關,但仍然有部分患者的DFS和OS難以準確預測[30],因此有研究者試圖尋找新的預后預測工具。Huang等[31]通過LASSO和Cox回歸模型生成影像組學模型,共納入了282例Ⅰ期和Ⅱ期NSCLC患者,最終發現由CE_kurtosis_0、CE_uniformity_0_0、CE_homogeneity_45_0、UE_uniformity_45_1.0和CE_uniformity_0_1.5構成的模型可以作為預測DFS的獨立生物標志物,其準確性超過了傳統的分期系統,這可能使精準醫學向前邁進一步。當然,該研究的研究對象僅為Ⅰ期和Ⅱ期NSCLC患者,對于晚期肺癌患者,該模型是否有效仍需進一步探索。
van Timmeren等[32]針對NSCLC患者的OS和局部復發進行了探究,該回顧性研究包括1個訓練組(141例Ⅰ~Ⅳ期NSCLC患者)和3個外部驗證組(患者數分別為94例、61例和41例),所有患者均有4次治療過程中的CT數據,但令人遺憾的是,它對于OS的預測能力只在第1個驗證組中得到了驗證,而對于局部復發的預測,研究者并沒有開發出能成功驗證的預測模型,這很有可能是由較小的隊列規模導致的。
Kadoya等[33]也對影像組學技術對OS的預測做出了探究,他們共構建了3個具有潛力的預測模型,分別以同源性影像學特征、標準影像學特征和腫瘤大小為基礎,結果顯示其C指數值分別為0.625、0.603和0.607,這說明基于同源性的放射學特征可能具有預測NSCLC患者OS的巨大潛力,關鍵在于找準合適的特征和模型構建方法。
2 以CT為基礎的影像組學技術在非小細胞肺癌患者診療中應用的局限性
雖然影像組學指導NSCLC患者個性化治療的潛力已被廣泛認可,但是目前在研究的各個環節仍存在諸多問題,較為常見的有納入患者數量較少、只采取結節的最大截面進行分析、沒有在獨立隊列中進行再驗證等[9-10,23,25,32],還有一些影像組學研究方法固有的限制,這些限制也是阻止該技術在臨床上應用的最大障礙。
首先,大部分的影像組學研究都是對CT圖像的回顧性評估,沒有統一的多中心前瞻性的隨機對照研究,而不同的醫療機構和CT機通常采用不同的圖像采集和重建協議,這本身就帶來了影像學特征的變異性,部分特征甚至因此無法重新提取到[9, 34],有研究[34]采用統一協議或者深度學習的方法以期解決這一問題。此外,ROI的確定是影像組學研究流程中特別敏感且關鍵的一步,這一步直接影響到后續的其它步驟,因此非常依賴專業的工作人員來進行人工分割,但這樣做耗時很多且具有一定變異性[15,35]。目前有研究者[36]通過機器自動或半自動分割ROI,以保證其可重復性,但是目前精確性也較差。還有一個非常關鍵的問題是,目前在研究中提取到的大量特征缺乏合理的臨床或生物學解釋。僅有少量研究[37]努力將放射學特征與生物學特征聯系起來,但嚴重缺乏臨床適用性的證據。
本文中涉及到的主要研究模型有兩個主要特點。第一,LASSO和RF是目前比較常用的特征篩選方法,通常,研究在數據中可以導出成千上萬條影像學特征,用于建模的統計學方法存在許多不同,而建模和統計學方法的選擇也會影響研究的結果。目前有研究[11,24]認為,與其它方法相比,RF在進行分類任務時性能更高,奈夫貝葉斯和SVM也表現良好。而在進行時間-事件分析時,一項研究[38]發現,帶有梯度提升的Cox回歸比傳統的Cox回歸表現更好。目前關于這一問題尚無最佳共識,仍需要研究者因研究特點而選擇。第二,大部分研究的預測模型都涉及到了多個影像組學特征,這在一定程度上體現了影像組學的優勢,它突破了人工能力的限制,最大程度地挖掘了CT影像背后的信息,但是正如前文所述,這些特征變異性大,且很難用現有的知識解釋,這也是我們未來研究中所面臨的重要問題。
3 小結
本文將目前基于胸部CT的影像組學技術與NSCLC相結合的研究做了一個簡單的綜述,可以看出影像組學廣闊的應用空間,比如腫瘤的診斷、治療反應和預后預測,其無創、可重復評估、可動態評估、經濟成本低等優勢也是顯而易見的。因為前文所述的諸多局限性,目前的研究結果與臨床實際應用還有著不小的距離,但這不代表這些結論是錯誤的,只是尚未找到更好的解決辦法。這需要更多的科研工作者進一步探索,例如通過圖像數據的標準化、人工智能深度學習的進步、結合基因組學等其它技術以及多中心前瞻性隨機研究來實現。將來建立可重復和可解釋的影像學標記對NSCLC的治療具有重要意義。鑒于目前相關研究爆發式增長,未來的影像組學研究應該從假設生成轉向對有前途的預測模型行假設檢驗,通過證明可重復性和臨床實用性以建立臨床獲益。只有這樣,這一技術才能真正為NSCLC患者的臨床管理帶來嶄新的改變。
利益沖突:無。
作者貢獻:趙珂負責相關文獻查閱、文章撰寫與修改;饒可負責相關文獻查閱及文章修改;李單青對文章的相關內容進行指導和修正。
肺癌是臨床上最常見的惡性腫瘤之一,通常被認為是一組異質性很強的疾病,其中80%~85%的肺癌屬于非小細胞肺癌(non-small cell lung cancer,NSCLC),其發病率在我國男性惡性腫瘤發病率中位列第一,在女性中位列第二,其病死率則在男性和女性中均位列第一[1],嚴重威脅著我國人民的生命健康。經過多年的努力,NSCLC的診斷與治療方式都有了長足的進步,但約1/3的患者首次被診斷為NSCLC時已是晚期,包括我國在內的全球大多數國家的NSCLC患者總體5年生存率在10%~20%之間[1-2],這提示我們目前對NSCLC患者的臨床管理仍然有非常大的進步空間,例如如何在疾病發現的早期就判斷疾病的病理學性質、基因突變情況、適宜的療法以及預后情況等。
影像組學是指通過借助計算機軟件高通量地從醫學影像中提取定量特征,然后利用統計學或計算機學習的方法,篩選出最有價值的影像學特征來協助臨床疾病診治的影像分析方法,這一概念最早由Kumar等[3]在2012年提出。其基本研究流程為:(1)確定研究問題和患者隊列;(2)分割患者圖像中的感興趣區域(region of interest,ROI);(3)提取圖像特征;(4)統計分析及建模[4]。影像組學技術可以最大程度地挖掘常規影像學檢查中所蘊含的信息,并且以此為基礎分析不同患者的臨床特點,進而實現針對患者特點的精準診療。它一經提出便在多種疾病的研究中廣泛應用,目前已經應用在腦膠質瘤、乳腺癌及阿爾茨海默病的診療實踐中[5-7]。鑒于影像組學在其它研究領域取得的可喜結果,也有很多研究者利用這一方法對NSCLC進行研究,以期在不增加患者創傷和經濟負擔的情況下,最大程度地精準分析患者病情并指導其個體化診療。
1 以CT為基礎的影像組學技術在非小細胞肺癌診療中的應用進展
1.1 預測肺結節的良惡性
通過CT來判斷肺內結節的良惡性是診斷NSCLC的重要手段,在既往單純依靠醫生經驗的情況下,通常憑借結節實性成分比例、結節長徑、鈣化征、血管集束征、空泡征、胸膜凹陷征、毛刺征及分葉征等影像學特征進行判斷,并且有研究者[8]據此構建了預測模型,但是臨床上并不是所有結節都有典型特征,這部分結節具有較高的診斷難度,因此針對肺部結節的良惡性鑒別是影像組學在NSCLC中最初的應用方向,目前已有多項研究顯示影像組學有超越傳統預測模型的優勢。
Kamiya等[9]在這方面較早地進行了探究,他們納入了93個肺結節,包括72個惡性結節和21個良性結節,根據密度直方圖計算峰度和偏度發現,相比于良性結節,惡性肺結節的CT圖像密度直方圖具有更大的峰度以及更小的偏度。Choi等[10]則利用支持向量機(support vector machine,SVM)和套索算法(least absolute shrinkage and selection operator,LASSO)開發了一個SVM-LASSO模型來預測肺內結節的惡性程度。該模型的主要參數為邊界框前后尺寸(bounding box anterior-posterior dimension,BB_AP)和反差矩的標準差(standard deviation of inverse difference moment,SD_IDM),其準確度為84.6%,比美國放射學會開發的肺癌早期篩查報告和數據系統高出12.4%。
近年還有學者嘗試使用多分類器融合模型對原發性肺實性結節的良惡性進行預測。Shen等[11]在完成特征選擇后,分別利用SVM、隨機森林(random forest,RF)、邏輯回歸(logistic regression,LR)、極限學習機(extreme learning machine,ELM)和K最近鄰(K-nearest neighbor,KNN)算法構建了5個分類器模型,然后將所有預測結果融合以預測結節性質,該研究共納入342例患者的CT圖像,按照7∶2∶1的比例劃分為訓練集、測試集和驗證集,最終發現紋理特征、小波特征和灰度特征等特征構成的預測模型對肺內實性結節的良惡性鑒別非常有意義,其精確度達92%,顯著優于各單項分類器的預測結果。
1.2 預測NSCLC的病理亞型及分子亞型
如前所述,肺癌是一組異質性很強的疾病,因此單純預測結節的良惡性是遠遠不夠的,尤其是在當今精準醫學的背景下,肺癌的治療非常依賴腫瘤的組織學以及分子學亞型[12]。在目前常規的臨床實踐中,對腫瘤組織學及分子學進行分類的最常見方法是對腫瘤組織進行組織病理學分析及基因檢測,但這種方式是有創的而且受到時間和成本限制[12]。因此,影像組學技術無創性、低成本、高效以及可重復的特點為我們帶來了希望,也有部分學者在這一領域做出了探索和努力。
Liu等[13]提出一種SLS模型,其特征篩選方法包括合成少數類過采樣技術(synthetic minority oversampling technique)、?2,1-范數最小化(?2,1-norm minimization)和SVM,研究者再通過一階統計、灰度共生矩陣和灰度大小區域矩陣進行降維分析,得到一個多特征的預測模型,它在訓練組中的精度為0.89[95%CI(0.846,0.912)],在測試組中的精度為0.86[95%CI(0.779,0.941)]。該模型用于預測NSCLC的4種主要亞型:鱗狀細胞癌(squamous cell carcinoma,SCC)、腺癌(adenocarcinoma,ADC)、大細胞癌(large cell carcinoma,LCC)及其它NSCLC。它有可能在臨床實踐中為肺癌治療提供有價值的信息。
還有研究者試圖應用影像組學技術區分非浸潤性肺腺癌(原位腺癌和微浸潤性腺癌)和浸潤性肺腺癌以指導外科手術方案。由于非浸潤性肺腺癌的預后良好,即使進行亞肺葉切除也有很高的5年無病生存率[14],因此如果能在術前判斷這一性質,對于患者的治療有重要的指示意義。Luo等[15]通過提取100個部分實性肺結節的CT影像特征構建了一個列線圖模型,這一模型是由CT特征聯合影像組學特征得到的,比單純應用CT特征或影像組學特征模型的效果均更佳,其中有意義的影像組學特征為集群陰影(ClusterShade_angle45_offset7)、和熵(sumEntropy)及球形比例(spherical disproportion),其意義為區分非浸潤性和浸潤性肺腺癌,其受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)為0.903。She等[16]也進行了類似的研究,且納入了更多的患者,該研究在進行影像組學建模的基礎上,加入了性別因素,研究者將患者分為訓練組(207例)和驗證組(195例),AUC分別為0.95[95%CI(0.91,0.98)]和0.89[95%CI(0.84,0.93)],顯著高于單純影像組學模型的數據,其訓練組和驗證組AUC為0.80[95%CI(0.73,0.87)]和0.77[95%CI(0.60,0.85)]。從目前的研究結果來看,微浸潤腺癌的預后顯著優于浸潤性腺癌,而且亞肺葉切除也可以達到與肺葉切除類似的治療效果,上述研究可能有助于指導肺結節患者的手術選擇。
眾所周知,部分肺腺癌致癌的核心機制為體細胞基因的突變,包括表皮生長因子受體(epidermal growth factor receptor,EGFR)、kirsten鼠類肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)、間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)、原癌基因1(C-ros oncogene 1,ROS1),其中EGFR突變在中國肺癌患者中尤為常見[1]。如果能無創識別肺癌患者以上基因突變情況,將為患者的靶向治療提供精準指導。有多項研究指出,影像組學構建的預測模型可以靈敏地識別EGFR突變的存在。
在一項針對亞實性結節的研究[17]中,在訓練隊列中使用RF方法構建基于CT的放射組學特征(共43個特征),用于區分EGFR突變狀態,然后在驗證隊列中進行測試,其訓練組和驗證組的AUC值分別為0.831和0.789;該研究同時還設計了一個影像組學特征聯合臨床特征的預測模型,但是其預測效果不優于前者。還有研究指出,影像組學模型甚至可以區分肺腺癌患者EGFR突變的具體類型。Liu等[18]設計的模型提取了1 672個影像組學特征,并選定前10個最相關的特征,輔以年齡、性別和吸煙史等臨床特征共同構建預測模型。該預測模型不僅能識別EGFR突變,還可以區分突變是EGFR外顯子19缺失還是EGFR外顯子21 L858R突變,假如這一模型的精度可以得到進一步提高,那么它可能會成為一種對EGFR突變患者有用的非侵入性生物標記。針對其它驅動基因的研究相對較少,但仍有研究[19-20]提示影像組學衍生而來的機器學習模型可以潛在地用作識別肺腺癌ALK、ROS1等突變的非侵入性工具。
1.3 預測NSCLC的淋巴結轉移情況
影像組學研究對肺癌的手術治療也能提供一定幫助。如前所述,有研究者應用影像組學技術區分非浸潤性肺腺癌(原位腺癌和微浸潤性腺癌)和浸潤性肺腺癌以指導外科手術方案,而有研究者則致力于對淋巴結清掃范圍的探究。根據美國國家綜合癌癥網絡(National Comprehensive Cancer Network,NCCN)指南[21]的建議,對于可切除的NSCLC患者,至少要接受肺門及肺內淋巴結(N1)和縱隔淋巴結(N2)的切除,其中N2至少要進行3組清掃或者采樣。有研究[22]指出,對于術后病理證實淋巴結陰性的患者,與接受縱隔淋巴結采樣術相比,接受了縱隔淋巴結清掃術的患者生存率并沒有提高,反而帶來了更高的術后并發癥發生率,因此在術前判斷淋巴結轉移狀態也是一個非常值得研究的問題。
He等[23]構建了一個包含13個影像學特征的評分模型,隨著患者評分的增高,其淋巴結轉移的概率也就越大,評分為0~3、4~5、6、7~8和9分的患者其淋巴結轉移概率分別為0%~20%、21%~40%、41%~60%、61%~80%和81%~100%。該模型精準度為0.785[95%CI(0.780,0.790)],超越了臨床病理預測模型。Cong等[24]則將臨床ⅠA期患者作為目標患者,共納入649例ⅠA期患者,應用LASSO提取影像學特征,然后應用RF方法構建模型,設計了3種模型并進行了比較,包括單純臨床病理特征模型、單純影像組學模型(7個特征)以及聯合模型,結果發現,其驗證組AUC依次為0.614、0.851及0.860,后兩者的預測效果均優于前者。該研究樣本量較大,而且聯合模型和單純影像組學模型都在驗證組中得到了較好的結果,說明它們將會是有希望的設計。
1.4 預測NSCLC的系統治療效果
對于晚期或無法接受靶向治療的NSCLC患者,化學治療(化療)仍是非常重要的治療手段,但遺憾的是并非所有患者均對化療敏感,因此能在治療開始前識別患者對于化療的敏感性是至關重要的。Dercle等[25]對此問題進行了探究,該研究收集了CheckMate 063研究[26]中的50例患者資料,從每個可測量的最大肺部病變中,為每例患者提取了1 160個放射學特征,針對患者對多西他賽治療是否敏感,構建了預測模型。結果顯示該模型AUC為0.67[95%CI(0.37,0.96)],從數值上看該模型的預測效果并不十分出色,有待進一步改善,這可能與其納入樣本量較少有關。不過該模型也有其值得借鑒之處,它收集了每例患者基線CT數據和評估首次治療反應的CT數據,比較了患者治療前后影像學特征的變化情況,而不是單純分析治療前的特征,這在一定程度上可以幫助我們校正預測模型,實現更加精準的預測。
近年來,腫瘤的免疫治療方興未艾,為肺癌的治療提供了新思路,程序性死亡分子1(programmed death-1,PD-1)及其配體(PD-1 ligand,PD-L1)為靶點的免疫治療策略便是其中的典型代表,而在腫瘤細胞上的PD-L1表達被認為可以作為預測免疫治療療效的生物標記物[27]。有研究[28]指出,晚期肺癌患者的CT影像學特征有預測腫瘤組織中PD-L1表達的潛力,而且由臨床變量和CT影像學特征組成的預測模型可能有助于PD-L1表達的無創評估。
Trebeschi等[29]對影像組學預測免疫治療的療效進行了研究。該研究的研究對象是晚期NSCLC和黑色素瘤患者,結果發現具有不均勻密度模式和緊密邊界更加多樣化的病變更容易對免疫療法產生反應,且與癌癥種類無關,這一模型在肺癌亞組中的AUC值為0.83(P<0.001)。為了進一步揭示影像學特征的生物學意義,該研究創新性地在獨立的驗證組中將NSCLC患者的基因表達數據與影像組學特征進行匹配,結果發現與免疫療效相關的影像組學特征同時也與控制細胞周期和有絲分裂的基因表達相關,這表明高腫瘤增殖與免疫治療反應改善之間可能存在聯系,這有助于我們更加深入地理解免疫治療,并指導NSCLC的臨床實踐。
1.5 預測NSCLC的預后及結局
一直以來,肺癌的TNM分期是指導患者預后的重要工具,患者的無病生存期(disease-free survival,DFS)和總體生存期(overall survival,OS)都與其明確相關,但仍然有部分患者的DFS和OS難以準確預測[30],因此有研究者試圖尋找新的預后預測工具。Huang等[31]通過LASSO和Cox回歸模型生成影像組學模型,共納入了282例Ⅰ期和Ⅱ期NSCLC患者,最終發現由CE_kurtosis_0、CE_uniformity_0_0、CE_homogeneity_45_0、UE_uniformity_45_1.0和CE_uniformity_0_1.5構成的模型可以作為預測DFS的獨立生物標志物,其準確性超過了傳統的分期系統,這可能使精準醫學向前邁進一步。當然,該研究的研究對象僅為Ⅰ期和Ⅱ期NSCLC患者,對于晚期肺癌患者,該模型是否有效仍需進一步探索。
van Timmeren等[32]針對NSCLC患者的OS和局部復發進行了探究,該回顧性研究包括1個訓練組(141例Ⅰ~Ⅳ期NSCLC患者)和3個外部驗證組(患者數分別為94例、61例和41例),所有患者均有4次治療過程中的CT數據,但令人遺憾的是,它對于OS的預測能力只在第1個驗證組中得到了驗證,而對于局部復發的預測,研究者并沒有開發出能成功驗證的預測模型,這很有可能是由較小的隊列規模導致的。
Kadoya等[33]也對影像組學技術對OS的預測做出了探究,他們共構建了3個具有潛力的預測模型,分別以同源性影像學特征、標準影像學特征和腫瘤大小為基礎,結果顯示其C指數值分別為0.625、0.603和0.607,這說明基于同源性的放射學特征可能具有預測NSCLC患者OS的巨大潛力,關鍵在于找準合適的特征和模型構建方法。
2 以CT為基礎的影像組學技術在非小細胞肺癌患者診療中應用的局限性
雖然影像組學指導NSCLC患者個性化治療的潛力已被廣泛認可,但是目前在研究的各個環節仍存在諸多問題,較為常見的有納入患者數量較少、只采取結節的最大截面進行分析、沒有在獨立隊列中進行再驗證等[9-10,23,25,32],還有一些影像組學研究方法固有的限制,這些限制也是阻止該技術在臨床上應用的最大障礙。
首先,大部分的影像組學研究都是對CT圖像的回顧性評估,沒有統一的多中心前瞻性的隨機對照研究,而不同的醫療機構和CT機通常采用不同的圖像采集和重建協議,這本身就帶來了影像學特征的變異性,部分特征甚至因此無法重新提取到[9, 34],有研究[34]采用統一協議或者深度學習的方法以期解決這一問題。此外,ROI的確定是影像組學研究流程中特別敏感且關鍵的一步,這一步直接影響到后續的其它步驟,因此非常依賴專業的工作人員來進行人工分割,但這樣做耗時很多且具有一定變異性[15,35]。目前有研究者[36]通過機器自動或半自動分割ROI,以保證其可重復性,但是目前精確性也較差。還有一個非常關鍵的問題是,目前在研究中提取到的大量特征缺乏合理的臨床或生物學解釋。僅有少量研究[37]努力將放射學特征與生物學特征聯系起來,但嚴重缺乏臨床適用性的證據。
本文中涉及到的主要研究模型有兩個主要特點。第一,LASSO和RF是目前比較常用的特征篩選方法,通常,研究在數據中可以導出成千上萬條影像學特征,用于建模的統計學方法存在許多不同,而建模和統計學方法的選擇也會影響研究的結果。目前有研究[11,24]認為,與其它方法相比,RF在進行分類任務時性能更高,奈夫貝葉斯和SVM也表現良好。而在進行時間-事件分析時,一項研究[38]發現,帶有梯度提升的Cox回歸比傳統的Cox回歸表現更好。目前關于這一問題尚無最佳共識,仍需要研究者因研究特點而選擇。第二,大部分研究的預測模型都涉及到了多個影像組學特征,這在一定程度上體現了影像組學的優勢,它突破了人工能力的限制,最大程度地挖掘了CT影像背后的信息,但是正如前文所述,這些特征變異性大,且很難用現有的知識解釋,這也是我們未來研究中所面臨的重要問題。
3 小結
本文將目前基于胸部CT的影像組學技術與NSCLC相結合的研究做了一個簡單的綜述,可以看出影像組學廣闊的應用空間,比如腫瘤的診斷、治療反應和預后預測,其無創、可重復評估、可動態評估、經濟成本低等優勢也是顯而易見的。因為前文所述的諸多局限性,目前的研究結果與臨床實際應用還有著不小的距離,但這不代表這些結論是錯誤的,只是尚未找到更好的解決辦法。這需要更多的科研工作者進一步探索,例如通過圖像數據的標準化、人工智能深度學習的進步、結合基因組學等其它技術以及多中心前瞻性隨機研究來實現。將來建立可重復和可解釋的影像學標記對NSCLC的治療具有重要意義。鑒于目前相關研究爆發式增長,未來的影像組學研究應該從假設生成轉向對有前途的預測模型行假設檢驗,通過證明可重復性和臨床實用性以建立臨床獲益。只有這樣,這一技術才能真正為NSCLC患者的臨床管理帶來嶄新的改變。
利益沖突:無。
作者貢獻:趙珂負責相關文獻查閱、文章撰寫與修改;饒可負責相關文獻查閱及文章修改;李單青對文章的相關內容進行指導和修正。