引用本文: 孔德志, 劉傲, 崔健, 冷曉亮, 沃楊, 董燕亭, 矯文捷. 臨床Ⅰ期非小細胞肺癌診斷模型構建:基于臨床影像學特征聯合葉酸受體陽性循環腫瘤細胞檢測的研究. 中國胸心血管外科臨床雜志, 2021, 28(10): 1192-1201. doi: 10.7507/1007-4848.202101072 復制
在全球范圍內,肺癌是對人類健康和生命威脅最大的惡性腫瘤之一,2018 年估計有 210 萬肺癌新發病例和 180 萬死亡病例,占與癌癥相關死亡人數的近 1/5(18.4%)[1]。我國約 75% 的肺癌患者在診斷時已屬晚期,5 年生存率為 15.6%,而早期肺癌患者的 5 年生存率為 80%[2]。這一現狀不但與缺乏篩查有關,更與缺乏科學鑒別肺結節的方法有關。
目前針對肺癌高發人群篩查常通過低劑量螺旋計算機斷層掃描(low-dose computed tomography,LDCT)。然而,有研究[3]表明,LDCT 假陽性率較高(18.5%),且存在輻射暴露、隨訪成本高以及發現中央型病灶肺癌患者的效果較差等問題,并不能完全達到有效地早期診斷和預防的目的[4]。傳統的腫瘤相關抗原在肺癌早期診斷中的敏感性和特異性均不理想。其它侵入性診斷方法,如針吸活檢或支氣管鏡刷檢,并發癥發生率高,給患者帶來極大的不適[5]。
隨著精準醫學的發展和技術的進步,液體活檢憑借其無創性、敏感性、動態性等特質,被寄予厚望[6-7]。外周血標本易獲得、侵入性小、可反復采集,是臨床上常規檢測較為理想的標本來源。循環腫瘤細胞(circulating tumor cell,CTC)是指從原發或轉移病灶脫落到血液循環中的腫瘤細胞。CTC 作為新一代的腫瘤標志物,大量研究[8-10]已經證實 CTC 檢測將有助于腫瘤早期診斷、復發轉移監測、判斷患者預后及指導術后輔助治療。葉酸受體(folate receptor,FR)是一種細胞表面受體糖蛋白,在許多上皮來源的惡性腫瘤細胞中高度表達,在 75.7% 的非小細胞肺癌(NSCLC)患者中顯著上調[11]。
因此,我們致力于研究分析葉酸受體陽性循環腫瘤細胞(folate receptor-positive circulating tumor cells,FR+CTC)在臨床Ⅰ期 NSCLC 患者中的表達,并建立一個基于 FR+CTC 的臨床Ⅰ期 NSCLC 診斷模型,為可疑肺結節的早期診斷提供新的依據。
1 資料與方法
1.1 臨床資料和分組
回顧性分析青島大學附屬醫院 2018 年 9 月至 2019 年 12 月入院的 1 520 例進行了 CTC 檢測的患者的臨床資料。這些患者均接受了胸部 CT 掃描和手術治療,并進行了病理檢查。篩選出臨床Ⅰ期 NSCLC 患者及肺部良性疾病患者 1 277 例,其中男 518 例、女 759 例,中位年齡為 57(29~85)歲。納入標準:(1)NSCLC 或良性疾病患者術前胸部 CT 檢查有肺結節。檢查無淋巴結、區域或遠處轉移;(2)術前采集血液樣本進行 FR+CTC 檢測;(3)CT 上病灶直徑≤4 cm;(4)病理組織學檢查有明確的病理診斷結果;(5)患者有完整的臨床病例資料。隨后,為保證有足夠數量的患者建立準確的模型,將符合標準的 1 277 例患者采用隨機數字表法按 4∶1 的比例隨機分為兩組,其中試驗組 1038 例、驗證組 239 例。
1.2 血液樣本中 FR+CTC 的定量檢測
臨床檢測樣本為全血樣本,每次采血時用加有 EDTA 抗凝劑的真空采血管抽取患者靜脈血 3 mL,上下顛倒 7~8 次。樣本采用“葉酸受體細胞檢測試劑盒”檢測樣本中 FR+CTC 的數量。根據試劑盒說明書,CTC 是通過紅細胞的裂解和血液中白細胞的免疫磁性去除(通過抗 CD45 和抗 CD14 涂層的磁珠)來富集的。然后用腫瘤特異性配體葉酸和人工合成的寡核苷酸的結合物標記它,收集 CTC 進行定量 PCR 分析。免疫熒光染色后,CTC 被定義為表達葉酸配體和細胞角蛋白(8、18 和 19)的細胞。在本研究中,我們定義 1 個 CTC 單位為在 3 mL 血液中檢測到的 CTC 數量[12]。
樣本一經采集,則盡快送至檢測實驗室。如若不能馬上送檢樣本,則于 4℃~8℃ 暫存,并在 24 h 之內進行檢測。如超出保存時間,則丟棄該血樣,重新采集。樣本如需運輸,用 4℃~8℃ 冰袋保持低溫運輸。FR+CTC 值>8.7 FU/3 mL 定義為陽性。
1.3 數據收集
收集患者的臨床資料、FR+CTC 值、影像學特征及腫瘤標志物。其中,臨床資料包括年齡、性別、吸煙史、臨床癥狀。影像學特征包括結節位置、結節直徑、結節中實性成分直徑比值(consolidation/tumor ratio,CTR)、胸膜牽拉征、毛刺征、肺氣腫。腫瘤標志物包括癌胚抗原(carcinoembryonic antigen,CEA)、鱗狀上皮細胞癌抗原(squamous cell carcinoma antigen,SCC)、神經元特異性烯醇化酶(neuron-specific enolase,NSE)、糖類抗原 199(carbohydrate antigen 199,CA199)和糖類抗原 125(carbohydrate antigen 125,CA125)。
1.4 統計學分析
正態分布的連續變量采用均數±標準差(±s)表示,非正態分布的連續變量采用中位數(上下四分位數)[M(P25,P75)]表示,組間比較采用t檢驗、Mann-Whitney U檢驗或 Kruskal-Wallis 檢驗。分類變量以例(%)表示,組間比較采用χ2檢驗和 Fisher 確切概率法。將數據進行單因素分析,將單因素分析結果中有統計學意義的因素進行 logistic 回歸分析,找出獨立危險因素,建立預測模型,繪制列線圖(Nomogram),對模型進行內部及外部驗證,檢測模型的預測性能。繪制受試者工作特征(receiver operating characteristic,ROC)曲線,計算曲線下面積(area under the curve,AUC)檢驗模型的區分度,校準曲線檢驗模型的一致性。在所有分析中,雙側P≤0.05 為差異有統計學意義。采用 SPSS 25.0 軟件、Med-Calc 19.1 軟件、GraphPad Prism 8 軟件和 R 3.6.1 軟件及 RMS 包執行所有分析。
1.5 倫理審查
本研究已通過青島大學附屬醫院倫理委員會批準,批準號為:QYFYWZLL 26169。
2 結果
2.1 研究人群的臨床特征及 FR+CTC 分布
共 925 例經病理證實的 NSCLC 患者和 113 例良性結節患者納入試驗組。其中,907 例 NSCLC 患者病理證實為腺癌,良性結節包括 50 例錯構瘤、27 例炎性假瘤、25 例結核、11 例硬化性肺泡細胞瘤。試驗組患者的平均年齡為 59.15 歲,其中 NSCLC 患者的平均年齡為 60.00 歲,良性結節患者的平均年齡為 57.00 歲;驗證組 NSCLC 患者 219 例,良性結節患者 20 例,患者的平均年齡為 59.29 歲,其中 NSCLC 患者的平均年齡為 59.71 歲,良性結節患者的平均年齡為 54.35 歲。
試驗組中,NSCLC 的女性患者比例明顯高于男性(62.1% vs. 37.9%),沒有吸煙史的患者占大多數(77.2%),有癥狀患者多于沒有癥狀(多為查體發現)患者(63.9% vs. 36.1%);見表 1;外周血中 FR+CTC 陽性(>8.7 FU/3 mL)的 NSCLC 患者顯著多于 FR+CTC 陰性患者(78.8% vs. 21.2%,P<0.001);同時,在肺良性結節的患者中,FR+CTC 陰性患者比例則明顯高于 FR+CTC 陽性患者(76.1% vs. 23.9%)。影像學特征方面,惡性結節位于右肺的比例明顯高于左肺(60.4% vs. 39.6%)。肺惡性結節直徑的中位值為 17 mm,良性結節直徑的中位值為 13 mm,良惡性結節直徑大小多為 10~<20 mm(45.2% vs. 54.9%),惡性結節其次為 20~<30 mm(25.9%),而良性結節其次為 <10 mm(27.4%)。胸部 CT 中惡性結節胸膜牽拉征和毛刺征出現的頻率顯著高于良性結節,分別為 40.2% vs. 19.5%,62.9% vs. 23.9%。根據結節的 CTR 值,將結節分為實性結節、亞實性結節和純磨玻璃樣結節(pure-ground glass opacity,pGGO),良性結節多數為實性結節(78.8%),而超過一半的惡性結節含有磨玻璃結節成分(53.2%)。CEA 在肺惡性結節的陽性率高于良性結節(23.1% vs. 14.2%),其余的腫瘤標志物如 SCC、CA 199、NSE 則沒有太大差異。以上結果在驗證組也得到了近似的分布趨勢。

另外,我們也對全組患者的 FR+CTC 值進行了分析;見表 2。NSCLC 患者組的 FR+CTC 值中位數為 11.50 個單位,而肺良性結節患者組的 FR+CTC 值中位數為 7.60 個單位,Mann-Whitney U檢驗結果顯示,差異有統計學意義(P<0.001);見圖 1;而 FR+CTC 值在年齡、性別、吸煙史的分布上,差異均無統計學意義。值得注意的是,雖然結節直徑沒有檢驗出差異,但是可以看出,隨著結節直徑逐漸增大,FR+CTC 值表現出來逐漸增多的趨勢。


2.2 試驗組的單因素和多因素分析
將試驗組上述因素進行 logistic 單因素分析,結果顯示,試驗組患者中,NSCLC 患者和肺良性結節患者在年齡(P<0.001)、性別(P<0.001)、結節直徑(P<0.001)、臨床癥狀(P=0.030)、FR+CTC 值(P<0.001)、胸膜牽拉征(P<0.001)、毛刺征(P<0.001)、CTR(P<0.001)及 CEA(P=0.032)方面差異均有統計學意義;見表 3。

將年齡、性別、結節直徑、臨床癥狀、FR+CTC 值、胸膜牽拉征、毛刺征、CTR 及 CEA 共 9 項因素納入 logistic 多因素分析,結果顯示,年齡≥60 歲(OR=1.700,95%CI 1.002~2.884,P=0.049)、女性(OR=2.617,95%CI 1.541~4.442,P<0.001)、FR+CTC 值>8.7 FU/3 mL(OR=16.992,95%CI 9.728~29.682,P<0.001)、胸膜牽拉征陽性(OR=2.199,95%CI 1.195~4.405,P=0.011)、結節直徑(OR=1.728,95%CI 1.244~2.402,P=0.001)、毛刺征陽性(OR=6.322,95%CI 3.561~11.225,P<0.001)、CTR<1(OR=3.172,95%CI 2.264~4.446,P<0.001)是病灶直徑≤4 cm 肺部腫物良惡性病變的獨立危險因素;見表 3。
2.3 建立 Nomogram 預測模型
將 logistic 回歸分析的結果納入 Nomogram 預測模型,即與病灶直徑≤4 cm 肺部腫物良惡性病變的獨立危險因素年齡、性別、結節直徑、胸膜牽拉征、毛刺征、CTR、FR+CTC 值納入預測模型,繪出 Nomogram;見圖 2。

2.4 Nomogram 預測模型的內部驗證和外部驗證
首先,對建立的 Nomogram 預測模型進行內部驗證,ROC 曲線用于驗證模型的區分度,試驗組 AUC 值為 0.918(95%CI 0.900~0.934)。當截斷點 T=0.6955 時,約登指數最大,此時模型敏感性為 86.36%,特異性為 83.19%;見圖 3a。校準曲線用于驗證 Nomogram 模型的預測一致性,顯示了肺結節良惡性的預測精度;見圖 3b。預測概率的校準曲線圖表明,Nomogram 預測模型估計的預測值與實際觀測結果有很大的一致性。

a:試驗組 ROC 曲線評價 Nomogram 模型的診斷價值;b:內部驗證 Nomogram 模型的校準曲線;c:驗證組 ROC 曲線評價 Nomogram 模型的診斷價值;d:外部驗證 Nomogram 模型的校準曲線
同時,我們在驗證隊列評估了包括年齡、性別、結節直徑、胸膜牽拉征、毛刺征、CTR、FR+CTC 值在內的 Nomogram 預測模型的預測價值,即 Nomogram 預測模型的外部驗證。在驗證隊列中,同樣通過 ROC 曲線驗證模型的區分度,驗證組 AUC 值為 0.903(95%CI 0.859~0.938),模型敏感性為 79.45%,特異性為 90.00%;見圖 3c。校準曲線驗證 Nomogram 預測模型的預測一致性,預測肺結節良惡性的校準曲線表明 Nomogram 預測模型一致性良好;見圖 3d。
3 討論
我國肺惡性腫瘤發病率和死亡率高居全國首位,其中 NSCLC 約占 85%。與之前相比,肺腺癌發病率顯著升高,女性發病率和死亡率上升,青年發病率顯著上升[13]。NSCLC 患者的預后主要取決于病理分期,Ⅰ/Ⅱ期患者的 5 年生存率為 68%~92%,而晚期患者的 5 年生存率只有 1%~13%。然而,由于缺乏有效的方法,只有 16% 的肺癌患者在早期被診斷出來[8]。目前一般應用 LDCT 進行早期肺癌的篩查,但是存在診斷小結節的假陽性率較高等缺陷,對 LDCT 在肺癌篩查及指導治療中的有效性存在一些爭議[14]。目前世界上常用對肺結節進行良惡性預測的模型,包括 Mayo 模型[15]、VA 模型[16]和 Brock 模型[17]等,都包括一定時效性、地域性、人群分布等局限,且大多只納入了可疑肺結節的影像學特征,并未將腫瘤標記物等資料納入聯合診斷模型。隨著近年來高分辨率 CT 的發展,越來越多的肺結節,特別是磨玻璃結節被發現,毛刺征、胸膜牽拉征等影像學特征也較 LDCT 更為清晰。因此,迫切需要尋找新的聯合診斷因素,結合新的技術,建立 NSCLC 的早期診斷預測模型,以提高總體生存率。
1869 年,澳大利亞醫生 Thomas Ashworth 解剖了 1 例晚期癌癥患者,意外地在他的外周血液中發現了與原發腫瘤大小和形狀相似的細胞,隨后提出了 CTC 的概念[18]。基于 Ashworth 的發現,英國病理學家 Stephen Paget 于 1889 年提出了著名的種子和土壤假說,成功地解釋了腫瘤復發和轉移的機制[19]。2010 年,CTC 分析被寫入美國癌癥聯合委員會(AJCC)癌癥分期手冊,作為補充病理分期的新指標,作為 cM0(i+)出現在 M0 和 M1 之間[20],CTC 和循環腫瘤 DNA(CtDNA)是主要的候選標志物[9]。在先前的研究[21]中,CTC 和血清標志物被用作早期 NSCLC 的預后和預測生物標志物。CTC 在肺癌進展和預后中的作用,以及評估療效、開發靶向藥物和個體化治療也是一個普遍的研究方向[22-24]。FR 是一種跨膜單鏈糖蛋白,含有 α、β 和 γ 三種亞型,在人體大部分的腫瘤細胞中都有特異性的高表達,如卵巢癌、肺癌和泌尿系統癌,而在正常器官中很少表達。研究[25]發現 72%~83%的肺腫瘤細胞表面高表達 FR,因此 FR 被選為一種理想的肺腫瘤細胞篩選靶標。FR 還可用于識別活的 CTC,其豐度不受上皮間質轉化(epithelial-mesenchymal transition,EMT)的影響[25-26],因此被選為 CTC 特異性標記物。一項“葉酸受體細胞檢測試劑盒”多中心、隨機、單盲上市前臨床驗證試驗結果證明試劑盒檢測的 FR+CTC 作為肺癌的輔助診斷手段具有高敏感性(79.6%)和特異性(88.2%),對肺癌的診斷效能優于目前臨床常用的其它血液標志物[12, 27-28]。綜上所述,我們選擇納入 FR+CTC 值,探討結合臨床資料和影像學特征,構建臨床Ⅰ期 NSCLC 的診斷預測模型的可能性。
本研究結果顯示,年齡(≥60 歲)、性別(女)、FR+CTC 值(>8.7 FU/3 mL)、胸膜牽拉征(陽性)、病灶直徑(越大)、毛刺征(陽性)、CTR(<1)是判斷≤4 cm 肺病灶良惡性的獨立危險因素。與之前的研究[12, 29]結果一致,我們發現早期 NSCLC 患者的外周血中 CTC 數量明顯高于肺部良性疾病患者。其原因可能是盡管高分辨率 CT 未見明顯異常,但早期肺癌可能存在腫瘤細胞從病灶中脫落并進入血液循環。在逃避免疫清除的情況下,腫瘤細胞通常通過外周血聚集并定植于其它器官,形成轉移灶(12~15 個)。研究[30]表明,即使是從原發灶脫落的少量 CTC 在沒有被免疫系統識別和清除的情況下存活下來,也可能在某個時間或其它時候發生遠處轉移。此外,FR+CTC 在年齡較高的人群中也稍高,這可能是因為老年人長期葉酸缺乏導致腫瘤組織中 FR 的過度表達,從而促使 FR+CTC 水平升高[31]。結節直徑的大小與 CTC 值關系密切,這與之前 Ding 等[32]的研究結果一致,需要我們進一步挖掘 CTC 與肺癌診斷、預后的關系[33]。考慮到亞洲地區空氣污染狀況、亞洲非吸煙女性腺癌的高患病率[34],與基于歐美人群為樣本研究建立 Mayo 模型、VA 模型和 Brock 模型等相比,我們的預測模型更適用于我國患者可疑肺部腫物良惡性的診斷。
至于此 Nomogram 診斷模型的應用,假如胸部 CT 上有 1 個 15 mm 可疑肺結節的 55 歲男性患者,胸部 CT 顯示結節有胸膜牽拉征,無毛刺征,CTR 為 0.5,外周血中 FR+CTC 值為陽性,則利用 Nomogram 診斷模型計算該患者的肺結節惡性概率是 95%,如圖 2 所示,Nomogram 圖中計算如下:年齡<60 歲、男性、無毛刺征,對應于 0 分;結節直徑位于 10~20 區間,對應于 22 分;存在胸膜牽拉,對應于 27 分;CTR=0.5,相當于 41 分;外周血中 FR+CTC 值為陽性,相當于 100 分;最后總分等于 190 分,對應肺結節惡性概率為 95%。模型區分度由 ROC 曲線來檢驗。在試驗隊列中,Nomogram 診斷模型的 ROC 曲線的 AUC 值為 0.918(95%CI 0.900~0.934),而驗證隊列的 AUC 值為 0.903(95%CI 0.859~0.938)。這表明,此 Nomogram 診斷模型可以從沒有事件發生的患者中分辨出有事件發生的患者,其診斷效能大約是 91.9%。因此,我們可以認為,包含年齡、性別、結節直徑、胸膜牽拉征、毛刺征、CTR、FR+CTC 值的診斷模型可以診斷臨床Ⅰ期 NSCLC。
我們的預測模型的敏感性為 82.91%(86.36% vs. 79.45%),特異性為 86.60%(83.19% vs. 90.00%),均高于或者近似于此前應用 CTC 診斷肺癌的模型的結果[12, 32, 35-36]。Moon 等[35]建立了一個基于 CTC 和 CtDNA 的肺癌聯合診斷模型,敏感性為 95%,特異性為 16.7%,與之相比我們納入了影像學特征及其它臨床因素,盡可能地提高了模型的穩定性,較其模型的特異性顯著提高。Chen 等[12]建立了一個基于 FR+CTC 聯合 CEA、NSE 和 Cyfra21-1 診斷肺癌的預測模型,AUC 值為 0.883(0.841~0.925),敏感性為 84.21%,特異性為 83.91%。與之相比,我們的研究對象為早期肺癌患者,且絕大多數為肺腺癌[37],CEA 在單因素分析中被認為與 NSCLC 有關,其它腫瘤標志物在分析中沒有被驗證為獨立危險因素,有必要進一步研究 FR+CTC 與腫瘤標志物表達在肺癌聯合診斷中的作用。
本研究應用了 FR+CTC 聯合影像學特征診斷臨床Ⅰ期 NSCLC,并開發了 Nomogram 模型。目前這項研究的優勢在于,它專門調查了早期 NSCLC 患者,并驗證了結合 CTC 和影像學特征的診斷準確性。結合液體活檢的非侵入性等特點,可以更好地優化個人的預測準確性,幫助臨床醫生診斷肺結節,有助于減少低危疾病的誤診和過度治療。一些不能進行病理活檢的患者,將直接從本研究中獲益。
本研究存在一些局限性。首先,本研究為單中心、回顧性研究,樣本量較少,模型需經過前瞻性、多中心、大樣本研究進一步檢驗;其次,在本研究中,研究對象人群為可疑惡性結節且有外科手術治療傾向的患者,存在一定的選擇偏倚。同時,經本模型診斷的惡性概率低的結節同樣需要隨訪,尤其是 CEA 高的患者,要根據結節的動態變化由有經驗的胸外科醫師制定下一步診療計劃[38]。
綜上所述,我們研究了 FR+CTC 在臨床Ⅰ期 NSCLC 患者和肺良性結節患者血液中表達的差異,發現 NSCLC 患者外周血中 FR+CTC 明顯高于肺部良性疾病患者,年齡、性別、結節直徑、胸膜牽拉征、毛刺征、CTR、FR+CTC 值是臨床Ⅰ期 NSCLC 的獨立危險因素,并建立了一個由此組成的新的可疑肺部腫物診斷預測模型,并且我們證實此預測模型是有意義的,可以為臨床診斷提供依據。
利益沖突:無。
作者貢獻:孔德志完善研究設計、查閱資料、數據整理與分析及論文初稿撰寫與修改等;劉傲指導數據的統計學分析等;崔健、冷曉亮負責細化寫作思路、對文章中圖表進一步完善加工;沃楊、董燕亭負責收集數據、文章潤色;矯文捷負責論文設計、指導、審閱與修改等。
在全球范圍內,肺癌是對人類健康和生命威脅最大的惡性腫瘤之一,2018 年估計有 210 萬肺癌新發病例和 180 萬死亡病例,占與癌癥相關死亡人數的近 1/5(18.4%)[1]。我國約 75% 的肺癌患者在診斷時已屬晚期,5 年生存率為 15.6%,而早期肺癌患者的 5 年生存率為 80%[2]。這一現狀不但與缺乏篩查有關,更與缺乏科學鑒別肺結節的方法有關。
目前針對肺癌高發人群篩查常通過低劑量螺旋計算機斷層掃描(low-dose computed tomography,LDCT)。然而,有研究[3]表明,LDCT 假陽性率較高(18.5%),且存在輻射暴露、隨訪成本高以及發現中央型病灶肺癌患者的效果較差等問題,并不能完全達到有效地早期診斷和預防的目的[4]。傳統的腫瘤相關抗原在肺癌早期診斷中的敏感性和特異性均不理想。其它侵入性診斷方法,如針吸活檢或支氣管鏡刷檢,并發癥發生率高,給患者帶來極大的不適[5]。
隨著精準醫學的發展和技術的進步,液體活檢憑借其無創性、敏感性、動態性等特質,被寄予厚望[6-7]。外周血標本易獲得、侵入性小、可反復采集,是臨床上常規檢測較為理想的標本來源。循環腫瘤細胞(circulating tumor cell,CTC)是指從原發或轉移病灶脫落到血液循環中的腫瘤細胞。CTC 作為新一代的腫瘤標志物,大量研究[8-10]已經證實 CTC 檢測將有助于腫瘤早期診斷、復發轉移監測、判斷患者預后及指導術后輔助治療。葉酸受體(folate receptor,FR)是一種細胞表面受體糖蛋白,在許多上皮來源的惡性腫瘤細胞中高度表達,在 75.7% 的非小細胞肺癌(NSCLC)患者中顯著上調[11]。
因此,我們致力于研究分析葉酸受體陽性循環腫瘤細胞(folate receptor-positive circulating tumor cells,FR+CTC)在臨床Ⅰ期 NSCLC 患者中的表達,并建立一個基于 FR+CTC 的臨床Ⅰ期 NSCLC 診斷模型,為可疑肺結節的早期診斷提供新的依據。
1 資料與方法
1.1 臨床資料和分組
回顧性分析青島大學附屬醫院 2018 年 9 月至 2019 年 12 月入院的 1 520 例進行了 CTC 檢測的患者的臨床資料。這些患者均接受了胸部 CT 掃描和手術治療,并進行了病理檢查。篩選出臨床Ⅰ期 NSCLC 患者及肺部良性疾病患者 1 277 例,其中男 518 例、女 759 例,中位年齡為 57(29~85)歲。納入標準:(1)NSCLC 或良性疾病患者術前胸部 CT 檢查有肺結節。檢查無淋巴結、區域或遠處轉移;(2)術前采集血液樣本進行 FR+CTC 檢測;(3)CT 上病灶直徑≤4 cm;(4)病理組織學檢查有明確的病理診斷結果;(5)患者有完整的臨床病例資料。隨后,為保證有足夠數量的患者建立準確的模型,將符合標準的 1 277 例患者采用隨機數字表法按 4∶1 的比例隨機分為兩組,其中試驗組 1038 例、驗證組 239 例。
1.2 血液樣本中 FR+CTC 的定量檢測
臨床檢測樣本為全血樣本,每次采血時用加有 EDTA 抗凝劑的真空采血管抽取患者靜脈血 3 mL,上下顛倒 7~8 次。樣本采用“葉酸受體細胞檢測試劑盒”檢測樣本中 FR+CTC 的數量。根據試劑盒說明書,CTC 是通過紅細胞的裂解和血液中白細胞的免疫磁性去除(通過抗 CD45 和抗 CD14 涂層的磁珠)來富集的。然后用腫瘤特異性配體葉酸和人工合成的寡核苷酸的結合物標記它,收集 CTC 進行定量 PCR 分析。免疫熒光染色后,CTC 被定義為表達葉酸配體和細胞角蛋白(8、18 和 19)的細胞。在本研究中,我們定義 1 個 CTC 單位為在 3 mL 血液中檢測到的 CTC 數量[12]。
樣本一經采集,則盡快送至檢測實驗室。如若不能馬上送檢樣本,則于 4℃~8℃ 暫存,并在 24 h 之內進行檢測。如超出保存時間,則丟棄該血樣,重新采集。樣本如需運輸,用 4℃~8℃ 冰袋保持低溫運輸。FR+CTC 值>8.7 FU/3 mL 定義為陽性。
1.3 數據收集
收集患者的臨床資料、FR+CTC 值、影像學特征及腫瘤標志物。其中,臨床資料包括年齡、性別、吸煙史、臨床癥狀。影像學特征包括結節位置、結節直徑、結節中實性成分直徑比值(consolidation/tumor ratio,CTR)、胸膜牽拉征、毛刺征、肺氣腫。腫瘤標志物包括癌胚抗原(carcinoembryonic antigen,CEA)、鱗狀上皮細胞癌抗原(squamous cell carcinoma antigen,SCC)、神經元特異性烯醇化酶(neuron-specific enolase,NSE)、糖類抗原 199(carbohydrate antigen 199,CA199)和糖類抗原 125(carbohydrate antigen 125,CA125)。
1.4 統計學分析
正態分布的連續變量采用均數±標準差(±s)表示,非正態分布的連續變量采用中位數(上下四分位數)[M(P25,P75)]表示,組間比較采用t檢驗、Mann-Whitney U檢驗或 Kruskal-Wallis 檢驗。分類變量以例(%)表示,組間比較采用χ2檢驗和 Fisher 確切概率法。將數據進行單因素分析,將單因素分析結果中有統計學意義的因素進行 logistic 回歸分析,找出獨立危險因素,建立預測模型,繪制列線圖(Nomogram),對模型進行內部及外部驗證,檢測模型的預測性能。繪制受試者工作特征(receiver operating characteristic,ROC)曲線,計算曲線下面積(area under the curve,AUC)檢驗模型的區分度,校準曲線檢驗模型的一致性。在所有分析中,雙側P≤0.05 為差異有統計學意義。采用 SPSS 25.0 軟件、Med-Calc 19.1 軟件、GraphPad Prism 8 軟件和 R 3.6.1 軟件及 RMS 包執行所有分析。
1.5 倫理審查
本研究已通過青島大學附屬醫院倫理委員會批準,批準號為:QYFYWZLL 26169。
2 結果
2.1 研究人群的臨床特征及 FR+CTC 分布
共 925 例經病理證實的 NSCLC 患者和 113 例良性結節患者納入試驗組。其中,907 例 NSCLC 患者病理證實為腺癌,良性結節包括 50 例錯構瘤、27 例炎性假瘤、25 例結核、11 例硬化性肺泡細胞瘤。試驗組患者的平均年齡為 59.15 歲,其中 NSCLC 患者的平均年齡為 60.00 歲,良性結節患者的平均年齡為 57.00 歲;驗證組 NSCLC 患者 219 例,良性結節患者 20 例,患者的平均年齡為 59.29 歲,其中 NSCLC 患者的平均年齡為 59.71 歲,良性結節患者的平均年齡為 54.35 歲。
試驗組中,NSCLC 的女性患者比例明顯高于男性(62.1% vs. 37.9%),沒有吸煙史的患者占大多數(77.2%),有癥狀患者多于沒有癥狀(多為查體發現)患者(63.9% vs. 36.1%);見表 1;外周血中 FR+CTC 陽性(>8.7 FU/3 mL)的 NSCLC 患者顯著多于 FR+CTC 陰性患者(78.8% vs. 21.2%,P<0.001);同時,在肺良性結節的患者中,FR+CTC 陰性患者比例則明顯高于 FR+CTC 陽性患者(76.1% vs. 23.9%)。影像學特征方面,惡性結節位于右肺的比例明顯高于左肺(60.4% vs. 39.6%)。肺惡性結節直徑的中位值為 17 mm,良性結節直徑的中位值為 13 mm,良惡性結節直徑大小多為 10~<20 mm(45.2% vs. 54.9%),惡性結節其次為 20~<30 mm(25.9%),而良性結節其次為 <10 mm(27.4%)。胸部 CT 中惡性結節胸膜牽拉征和毛刺征出現的頻率顯著高于良性結節,分別為 40.2% vs. 19.5%,62.9% vs. 23.9%。根據結節的 CTR 值,將結節分為實性結節、亞實性結節和純磨玻璃樣結節(pure-ground glass opacity,pGGO),良性結節多數為實性結節(78.8%),而超過一半的惡性結節含有磨玻璃結節成分(53.2%)。CEA 在肺惡性結節的陽性率高于良性結節(23.1% vs. 14.2%),其余的腫瘤標志物如 SCC、CA 199、NSE 則沒有太大差異。以上結果在驗證組也得到了近似的分布趨勢。

另外,我們也對全組患者的 FR+CTC 值進行了分析;見表 2。NSCLC 患者組的 FR+CTC 值中位數為 11.50 個單位,而肺良性結節患者組的 FR+CTC 值中位數為 7.60 個單位,Mann-Whitney U檢驗結果顯示,差異有統計學意義(P<0.001);見圖 1;而 FR+CTC 值在年齡、性別、吸煙史的分布上,差異均無統計學意義。值得注意的是,雖然結節直徑沒有檢驗出差異,但是可以看出,隨著結節直徑逐漸增大,FR+CTC 值表現出來逐漸增多的趨勢。


2.2 試驗組的單因素和多因素分析
將試驗組上述因素進行 logistic 單因素分析,結果顯示,試驗組患者中,NSCLC 患者和肺良性結節患者在年齡(P<0.001)、性別(P<0.001)、結節直徑(P<0.001)、臨床癥狀(P=0.030)、FR+CTC 值(P<0.001)、胸膜牽拉征(P<0.001)、毛刺征(P<0.001)、CTR(P<0.001)及 CEA(P=0.032)方面差異均有統計學意義;見表 3。

將年齡、性別、結節直徑、臨床癥狀、FR+CTC 值、胸膜牽拉征、毛刺征、CTR 及 CEA 共 9 項因素納入 logistic 多因素分析,結果顯示,年齡≥60 歲(OR=1.700,95%CI 1.002~2.884,P=0.049)、女性(OR=2.617,95%CI 1.541~4.442,P<0.001)、FR+CTC 值>8.7 FU/3 mL(OR=16.992,95%CI 9.728~29.682,P<0.001)、胸膜牽拉征陽性(OR=2.199,95%CI 1.195~4.405,P=0.011)、結節直徑(OR=1.728,95%CI 1.244~2.402,P=0.001)、毛刺征陽性(OR=6.322,95%CI 3.561~11.225,P<0.001)、CTR<1(OR=3.172,95%CI 2.264~4.446,P<0.001)是病灶直徑≤4 cm 肺部腫物良惡性病變的獨立危險因素;見表 3。
2.3 建立 Nomogram 預測模型
將 logistic 回歸分析的結果納入 Nomogram 預測模型,即與病灶直徑≤4 cm 肺部腫物良惡性病變的獨立危險因素年齡、性別、結節直徑、胸膜牽拉征、毛刺征、CTR、FR+CTC 值納入預測模型,繪出 Nomogram;見圖 2。

2.4 Nomogram 預測模型的內部驗證和外部驗證
首先,對建立的 Nomogram 預測模型進行內部驗證,ROC 曲線用于驗證模型的區分度,試驗組 AUC 值為 0.918(95%CI 0.900~0.934)。當截斷點 T=0.6955 時,約登指數最大,此時模型敏感性為 86.36%,特異性為 83.19%;見圖 3a。校準曲線用于驗證 Nomogram 模型的預測一致性,顯示了肺結節良惡性的預測精度;見圖 3b。預測概率的校準曲線圖表明,Nomogram 預測模型估計的預測值與實際觀測結果有很大的一致性。

a:試驗組 ROC 曲線評價 Nomogram 模型的診斷價值;b:內部驗證 Nomogram 模型的校準曲線;c:驗證組 ROC 曲線評價 Nomogram 模型的診斷價值;d:外部驗證 Nomogram 模型的校準曲線
同時,我們在驗證隊列評估了包括年齡、性別、結節直徑、胸膜牽拉征、毛刺征、CTR、FR+CTC 值在內的 Nomogram 預測模型的預測價值,即 Nomogram 預測模型的外部驗證。在驗證隊列中,同樣通過 ROC 曲線驗證模型的區分度,驗證組 AUC 值為 0.903(95%CI 0.859~0.938),模型敏感性為 79.45%,特異性為 90.00%;見圖 3c。校準曲線驗證 Nomogram 預測模型的預測一致性,預測肺結節良惡性的校準曲線表明 Nomogram 預測模型一致性良好;見圖 3d。
3 討論
我國肺惡性腫瘤發病率和死亡率高居全國首位,其中 NSCLC 約占 85%。與之前相比,肺腺癌發病率顯著升高,女性發病率和死亡率上升,青年發病率顯著上升[13]。NSCLC 患者的預后主要取決于病理分期,Ⅰ/Ⅱ期患者的 5 年生存率為 68%~92%,而晚期患者的 5 年生存率只有 1%~13%。然而,由于缺乏有效的方法,只有 16% 的肺癌患者在早期被診斷出來[8]。目前一般應用 LDCT 進行早期肺癌的篩查,但是存在診斷小結節的假陽性率較高等缺陷,對 LDCT 在肺癌篩查及指導治療中的有效性存在一些爭議[14]。目前世界上常用對肺結節進行良惡性預測的模型,包括 Mayo 模型[15]、VA 模型[16]和 Brock 模型[17]等,都包括一定時效性、地域性、人群分布等局限,且大多只納入了可疑肺結節的影像學特征,并未將腫瘤標記物等資料納入聯合診斷模型。隨著近年來高分辨率 CT 的發展,越來越多的肺結節,特別是磨玻璃結節被發現,毛刺征、胸膜牽拉征等影像學特征也較 LDCT 更為清晰。因此,迫切需要尋找新的聯合診斷因素,結合新的技術,建立 NSCLC 的早期診斷預測模型,以提高總體生存率。
1869 年,澳大利亞醫生 Thomas Ashworth 解剖了 1 例晚期癌癥患者,意外地在他的外周血液中發現了與原發腫瘤大小和形狀相似的細胞,隨后提出了 CTC 的概念[18]。基于 Ashworth 的發現,英國病理學家 Stephen Paget 于 1889 年提出了著名的種子和土壤假說,成功地解釋了腫瘤復發和轉移的機制[19]。2010 年,CTC 分析被寫入美國癌癥聯合委員會(AJCC)癌癥分期手冊,作為補充病理分期的新指標,作為 cM0(i+)出現在 M0 和 M1 之間[20],CTC 和循環腫瘤 DNA(CtDNA)是主要的候選標志物[9]。在先前的研究[21]中,CTC 和血清標志物被用作早期 NSCLC 的預后和預測生物標志物。CTC 在肺癌進展和預后中的作用,以及評估療效、開發靶向藥物和個體化治療也是一個普遍的研究方向[22-24]。FR 是一種跨膜單鏈糖蛋白,含有 α、β 和 γ 三種亞型,在人體大部分的腫瘤細胞中都有特異性的高表達,如卵巢癌、肺癌和泌尿系統癌,而在正常器官中很少表達。研究[25]發現 72%~83%的肺腫瘤細胞表面高表達 FR,因此 FR 被選為一種理想的肺腫瘤細胞篩選靶標。FR 還可用于識別活的 CTC,其豐度不受上皮間質轉化(epithelial-mesenchymal transition,EMT)的影響[25-26],因此被選為 CTC 特異性標記物。一項“葉酸受體細胞檢測試劑盒”多中心、隨機、單盲上市前臨床驗證試驗結果證明試劑盒檢測的 FR+CTC 作為肺癌的輔助診斷手段具有高敏感性(79.6%)和特異性(88.2%),對肺癌的診斷效能優于目前臨床常用的其它血液標志物[12, 27-28]。綜上所述,我們選擇納入 FR+CTC 值,探討結合臨床資料和影像學特征,構建臨床Ⅰ期 NSCLC 的診斷預測模型的可能性。
本研究結果顯示,年齡(≥60 歲)、性別(女)、FR+CTC 值(>8.7 FU/3 mL)、胸膜牽拉征(陽性)、病灶直徑(越大)、毛刺征(陽性)、CTR(<1)是判斷≤4 cm 肺病灶良惡性的獨立危險因素。與之前的研究[12, 29]結果一致,我們發現早期 NSCLC 患者的外周血中 CTC 數量明顯高于肺部良性疾病患者。其原因可能是盡管高分辨率 CT 未見明顯異常,但早期肺癌可能存在腫瘤細胞從病灶中脫落并進入血液循環。在逃避免疫清除的情況下,腫瘤細胞通常通過外周血聚集并定植于其它器官,形成轉移灶(12~15 個)。研究[30]表明,即使是從原發灶脫落的少量 CTC 在沒有被免疫系統識別和清除的情況下存活下來,也可能在某個時間或其它時候發生遠處轉移。此外,FR+CTC 在年齡較高的人群中也稍高,這可能是因為老年人長期葉酸缺乏導致腫瘤組織中 FR 的過度表達,從而促使 FR+CTC 水平升高[31]。結節直徑的大小與 CTC 值關系密切,這與之前 Ding 等[32]的研究結果一致,需要我們進一步挖掘 CTC 與肺癌診斷、預后的關系[33]。考慮到亞洲地區空氣污染狀況、亞洲非吸煙女性腺癌的高患病率[34],與基于歐美人群為樣本研究建立 Mayo 模型、VA 模型和 Brock 模型等相比,我們的預測模型更適用于我國患者可疑肺部腫物良惡性的診斷。
至于此 Nomogram 診斷模型的應用,假如胸部 CT 上有 1 個 15 mm 可疑肺結節的 55 歲男性患者,胸部 CT 顯示結節有胸膜牽拉征,無毛刺征,CTR 為 0.5,外周血中 FR+CTC 值為陽性,則利用 Nomogram 診斷模型計算該患者的肺結節惡性概率是 95%,如圖 2 所示,Nomogram 圖中計算如下:年齡<60 歲、男性、無毛刺征,對應于 0 分;結節直徑位于 10~20 區間,對應于 22 分;存在胸膜牽拉,對應于 27 分;CTR=0.5,相當于 41 分;外周血中 FR+CTC 值為陽性,相當于 100 分;最后總分等于 190 分,對應肺結節惡性概率為 95%。模型區分度由 ROC 曲線來檢驗。在試驗隊列中,Nomogram 診斷模型的 ROC 曲線的 AUC 值為 0.918(95%CI 0.900~0.934),而驗證隊列的 AUC 值為 0.903(95%CI 0.859~0.938)。這表明,此 Nomogram 診斷模型可以從沒有事件發生的患者中分辨出有事件發生的患者,其診斷效能大約是 91.9%。因此,我們可以認為,包含年齡、性別、結節直徑、胸膜牽拉征、毛刺征、CTR、FR+CTC 值的診斷模型可以診斷臨床Ⅰ期 NSCLC。
我們的預測模型的敏感性為 82.91%(86.36% vs. 79.45%),特異性為 86.60%(83.19% vs. 90.00%),均高于或者近似于此前應用 CTC 診斷肺癌的模型的結果[12, 32, 35-36]。Moon 等[35]建立了一個基于 CTC 和 CtDNA 的肺癌聯合診斷模型,敏感性為 95%,特異性為 16.7%,與之相比我們納入了影像學特征及其它臨床因素,盡可能地提高了模型的穩定性,較其模型的特異性顯著提高。Chen 等[12]建立了一個基于 FR+CTC 聯合 CEA、NSE 和 Cyfra21-1 診斷肺癌的預測模型,AUC 值為 0.883(0.841~0.925),敏感性為 84.21%,特異性為 83.91%。與之相比,我們的研究對象為早期肺癌患者,且絕大多數為肺腺癌[37],CEA 在單因素分析中被認為與 NSCLC 有關,其它腫瘤標志物在分析中沒有被驗證為獨立危險因素,有必要進一步研究 FR+CTC 與腫瘤標志物表達在肺癌聯合診斷中的作用。
本研究應用了 FR+CTC 聯合影像學特征診斷臨床Ⅰ期 NSCLC,并開發了 Nomogram 模型。目前這項研究的優勢在于,它專門調查了早期 NSCLC 患者,并驗證了結合 CTC 和影像學特征的診斷準確性。結合液體活檢的非侵入性等特點,可以更好地優化個人的預測準確性,幫助臨床醫生診斷肺結節,有助于減少低危疾病的誤診和過度治療。一些不能進行病理活檢的患者,將直接從本研究中獲益。
本研究存在一些局限性。首先,本研究為單中心、回顧性研究,樣本量較少,模型需經過前瞻性、多中心、大樣本研究進一步檢驗;其次,在本研究中,研究對象人群為可疑惡性結節且有外科手術治療傾向的患者,存在一定的選擇偏倚。同時,經本模型診斷的惡性概率低的結節同樣需要隨訪,尤其是 CEA 高的患者,要根據結節的動態變化由有經驗的胸外科醫師制定下一步診療計劃[38]。
綜上所述,我們研究了 FR+CTC 在臨床Ⅰ期 NSCLC 患者和肺良性結節患者血液中表達的差異,發現 NSCLC 患者外周血中 FR+CTC 明顯高于肺部良性疾病患者,年齡、性別、結節直徑、胸膜牽拉征、毛刺征、CTR、FR+CTC 值是臨床Ⅰ期 NSCLC 的獨立危險因素,并建立了一個由此組成的新的可疑肺部腫物診斷預測模型,并且我們證實此預測模型是有意義的,可以為臨床診斷提供依據。
利益沖突:無。
作者貢獻:孔德志完善研究設計、查閱資料、數據整理與分析及論文初稿撰寫與修改等;劉傲指導數據的統計學分析等;崔健、冷曉亮負責細化寫作思路、對文章中圖表進一步完善加工;沃楊、董燕亭負責收集數據、文章潤色;矯文捷負責論文設計、指導、審閱與修改等。