肺癌是我國發病率和病死率最高的惡性腫瘤,早診早治是提高肺癌患者生存率和改善預后的關鍵。近年來有較多研究聚焦于肺癌的生物標志物,新興的生物標志物檢測在肺癌的篩查中顯示出一定的潛力。將生物標志物、影像組學和人工智能相結合,建立肺癌篩查預測綜合模型,可能是未來提升肺癌篩查能力的發展方向。該文概述了生物標志物在肺癌篩查中的應用,介紹了新興的生物標志物和新技術,探討了生物標志物在肺癌篩查中的應用前景,旨在為提升肺癌篩查能力和實現肺癌早診早治提供一定的理論依據。
引用本文: 劉利, 田攀文. 生物標志物在肺癌篩查中的研究進展. 華西醫學, 2020, 35(1): 78-83. doi: 10.7507/1002-0179.201905065 復制
肺癌是我國發病率和病死率最高的惡性腫瘤[1],早診早治是提高肺癌患者生存率和改善預后的關鍵。低劑量 CT(low-dose computed tomography,LDCT)是在高風險人群(根據年齡和吸煙史定義)中篩查肺癌的一種方法,其對肺癌篩查的價值已得到美國肺癌篩查試驗[2]、國際早期肺癌行動計劃[3]、歐洲 NELSON 試驗[4]、意大利多中心肺癌篩查試驗[5]等的證實。盡管對高風險人群采用 LDCT 篩查肺癌在全球廣為應用,但仍存在不少爭議,包括高風險人群界定標準不一、CT 篩查周期差異大、假陽性率高和效益成本比低等。近年來肺癌的生物標志物是研究熱點,新興的生物標志物檢測在肺癌的篩查中顯示出一定的潛力,將生物標志物、影像組學和人工智能相結合,建立肺癌篩查預測綜合模型,可能是未來提升肺癌篩查能力的發展方向。本文概述了生物標志物在肺癌篩查中的應用,介紹了新興的生物標志物和新技術,探討了生物標志物在肺癌篩查中的應用前景,旨在為提升肺癌篩查能力和實現肺癌早診早治提供一定的理論依據。
1 生物標志物在肺癌篩查中的應用
1.1 自身抗體
針對肺癌抗原的自身抗體通常出現在臨床前階段,可能遠早于臨床癥狀或影像學表現。單一自身抗體診斷肺癌的特異性高,但敏感性低。結合多種自身抗體則可提高診斷的特異性和敏感性。Boyle 等[6]研究發現,使用 6 種肺癌自身抗體[抑癌基因 p53、紐約食管鱗狀細胞癌 1(New York esophageal squamous cell carcinoma 1,NY-ESO-1)、腫瘤相關基因(cancer-associated gene,CAGE)、三磷酸腺苷(adenosine triphosphate,ATP)結合 RNA 解旋酶 GBU4-5、膜聯蛋白-1(annexin-1)和性別決定區 Y 框蛋白(sex determining region Y-box protein,SOX)2 的抗體]診斷肺癌的特異度為 89%,而靈敏度為 39%。另一項研究納入了 1 987 例肺結節患者(結節直徑為 4~20 mm),在 CT 篩查風險模型中加入了 7 種肺癌自身抗體[p53、NY-ESO-1、CAGE、GBU4-5、SOX2、人抗原 R(human antigen R,HuD)和黑色素瘤抗原(melanoma antigen,MAGE)-A4 的抗體],使肺癌診斷的特異度顯著提高(>92%),陽性預測值達 70% 以上[7]。Chapman 等[8]在 154 例患者(104 例肺癌和 50 例正常對照)中檢測了 7 種自身抗體[p53、c-myc、人表皮生長因子受體-2(human epidermal growth factor receptor-2,HER2)、NY-ESO-1、CAGE、黏蛋白 1(mucin,MUC1)和 GBU4-5 的抗體],其靈敏度為 61%,特異度為 90%。上述研究結果提示,肺癌自身抗體和其他肺癌篩查方式相結合,其臨床價值可能會進一步提高。
1.2 補體片段
肺癌可通過經典補體途徑激活補體級聯效應,該途徑下游分裂產物補體片段 4d(complement fragment 4d,C4d)的濃度在肺癌患者的血液和體液中增加[9]。有研究在 190 例無癥狀肺結節患者中檢測血漿 C4d 水平,結果發現血漿 C4d 水平與肺癌風險具有相關性[比值比=4.38,95% 置信區間(1.61,11.93)],且肺氣腫和慢性阻塞性肺疾病等潛在的混雜因素并不影響 C4d 水平,惡性肺結節患者的血漿 C4d 水平顯著高于良性肺結節患者[9]。Ajona 等[10]分析了 67 例肺結節患者(肺結節直徑 8~30 mm),發現血漿 C4d 診斷良性肺結節的陰性預測值為 84%,陽性預測值為 54%,其特異度為 89%,而靈敏度僅有 44%。
1.3 微 RNA(microRNA,miRNA)
循環 miRNA 是非編碼 RNA,具有調控功能,能反映腫瘤和宿主之間的相互作用,已成為腫瘤診斷和預后判斷的潛在生物標志物,且 miRNA 與腫瘤分期和基因突變無關[11]。Sozzi 等[12]進行的多中心臨床研究評估了血漿 miRNA 識別分類器(microRNA signature classifier,MSC)對肺癌高風險人群的診斷價值。該研究采集了 939 例受試者(肺癌患者 69 例、LDCT 篩查的肺癌風險人群 652 例、對照組 287 例)的血漿,通過熒光定量聚合酶鏈反應檢測 miRNA。結果顯示,MSC 診斷肺癌的靈敏度為 87%,特異度為 81%;LDCT 篩查肺癌的靈敏度為 79%,特異度為 81%,假陽性率高達 19.4%;MSC 和 LDCT 聯合應用可使 LDCT 的假陽性率降至 3.7%。而在肺癌術后患者中,血漿 MSC 還能監控腫瘤復發[13]。此外,正在進行的 3 項獨立的大型肺癌篩查研究共納入 16 000 例肺癌高危患者,或許將進一步驗證 miRNA 對良惡性肺結節的診斷價值。
1.4 循環腫瘤 DNA
循環腫瘤 DNA 指導晚期腫瘤精準治療的價值已被相關研究證實[14],但在早期肺癌診斷中的作用仍不確定。Abbosh 等[15]在 96 例Ⅰ~Ⅲ期非小細胞肺癌患者中檢測血液循環腫瘤 DNA,靈敏度從Ⅰ期肺腺癌的 15% 到Ⅱ期或Ⅲ期鱗狀細胞癌的 100% 不等,總體靈敏度為 48%。近期一項研究整合了血液循環腫瘤 DNA 和血清蛋白質譜技術,納入了 1 005 例Ⅰ~Ⅲ期多種腫瘤患者和 812 名非腫瘤對照者,雖然總體特異度高于 99%,但靈敏度總體偏低,肺癌中靈敏度為 59%,乳腺癌中靈敏度 33%,而在卵巢癌中靈敏度高達 98%[16]。
1.5 循環腫瘤細胞(circulating tumor cell,CTC)
CTC 是原發腫瘤或轉移瘤脫落進入血液循環的腫瘤細胞。CTC 數量少,且呈異質性,因此檢測技術要求較高,目前仍在探索中。CTC 作為液體活檢的一種方法也有一定優勢,如可用于早期肺癌的篩查[17]和肺癌進展的動態檢測,也可監測腫瘤的異質性,而且通過對 CTC 的基因檢測,可以發現基因突變,從而指導治療。Ilie 等[18]早期研究了肺癌的風險因素,檢測了 245 例無癌癥患者的 CTC 情況,包括 168 例慢性阻塞性肺疾病患者和 77 例無慢性阻塞性肺疾病患者,每年對 CTC 陽性慢性阻塞性肺疾病患者進行 CT 篩查,發現 CTC 檢測相比 CT 篩查能早 1~4 年發現肺病病灶。Chen 等[19]通過檢測 CTC 對肺癌或肺部良性結節患者以及健康者進行研究,其中肺癌或肺部良性結節患者中 CTC 陽性率為 84%,而后者中僅 4.2%。推測隨著新技術的發展,CTC 聯合影像等相關輔助檢查,對肺癌的診斷或許能有更大提高。
1.6 外泌體
外泌體是 50~150 nm 直徑的分泌膜包裹的囊泡(細胞外囊泡)[20]。目前學術界對外泌體能否指導診斷及治療比較感興趣[21],但相關研究卻很少。近來 Zhang 等[22]對肺惡性結節和良性結節患者血漿中的外泌體進行了研究,通過對外泌體 miRNA 特征圖譜的探索,發現其對肺癌早期診斷有著重要的意義。目前也有文獻對外泌體蛋白調控腫瘤進展的機制進行了研究,并總結了其作為腫瘤標志物對肺癌篩查的可行性[23]。
1.7 DNA 甲基化
腫瘤組織以抑癌基因啟動子區 DNA 的低甲基化和特定胞嘧啶-磷酸-鳥嘌呤(cytidine-phosphate-guanine,CpG)位點的高甲基化為特征。Esteller 等[24]進行了一項血清循環腫瘤 DNA 甲基化的研究,發現 22 例非小細胞肺癌中有 15 例(68%)檢測到 DNA 甲基化異常,但在正常肺組織樣本中未檢測到甲基化異常。在組織甲基化異常的原發性腫瘤中,15 個樣本中有 11 個(73%)在血清樣本中也存在甲基化 DNA 異常。Wielscher 等[25]采用熒光定量聚合酶鏈反應檢測 143 例肺部疾病患者(肺癌 33 例、肺間質纖維化 68 例和慢性阻塞性肺疾病 42 例)和 61 例健康對照者的血清樣本,發現甲基化診斷肺癌的靈敏度為 88%,特異度為 90%。Hulbert 等[26]研究了 2 種 DNA 甲基化模型對肺癌的診斷價值,分析了 150 例Ⅰ期或Ⅱ期非小細胞肺癌患者和 60 例對照者,其中一種三基因模型[短暫擴充細胞基因(transit amplifying cells,TAC)1、同源框基因(homeobox,HOX)A17 和 SOX17 基因]相關痰液 DNA 甲基化診斷肺癌的靈敏度為 98%,特異度為 71%;另外一種三基因模型[半胱氨酸雙加氧酶 1(cysteine dioxygenase 1,CDO1)、TAC1 和 SOX17]相關血漿 DNA 甲基化診斷肺癌的靈敏度為 93%,特異度為 62%。
1.8 血清蛋白質譜
多種血清腫瘤抗原試劑盒已開發用于肺癌的診斷。血清蛋白(癌胚抗原、腫瘤抗原 125、細胞角蛋白片段 21-1)和自身抗體 NY-ESO-1 抗體在肺癌高風險人群中診斷靈敏度為 74%,特異度為 80%[27]。一項研究發現,在肺癌高風險人群中,聯合多種血清腫瘤蛋白標志物(癌胚抗原、細胞角蛋白片段 21-1、腫瘤抗原 125、肝細胞生長因子和 NY-ESO-1)診斷肺癌的靈敏度僅有 49%,但特異度高達 96%,納入臨床變量可使診斷的準確性提高[28]。Molina 等[29]進行的一項研究納入了 3 144 例肺結節患者(其中 1 828 例為肺癌),根據肺結節大小、年齡和吸煙狀況的臨床預測模型診斷肺癌的曲線下面積為 0.85,聯合了 6 種腫瘤抗原(癌胚抗原、腫瘤抗原 153、鱗狀細胞癌抗原、細胞角蛋白片段 21-1、特異性神經元烯醇酶和促胃泌素原釋放肽)后曲線下面積增加到 0.93。另一項研究納入 178 例疑似肺結節患者,顯示半乳糖凝集素-3 結合蛋白和清道夫受體富半胱氨酸蛋白 1 型蛋白 M130 聯合臨床風險預測模型診斷肺癌的靈敏度為 97%,特異度為 44%;通過多種血清腫瘤抗原檢測,可使 40% 的良性肺結節患者避免侵入性檢查,但假陰性結果可能使 3% 的惡性肺結節延誤治療[30]。
2 新興的生物標志物和新技術
2.1 痰細胞的圖像分析
傳統意義上,痰細胞學檢查不能產生足夠或有用的肺癌篩查樣本,但隨著細胞學技術的發展,結合人工智能的圖像分析算法,痰標本的診斷價值得以提高。三維流式細胞儀可以篩查痰標本中的異常細胞[31],這是一種新的檢測方法。有研究對 91 例患者行痰細胞學檢查,結果顯示,與 LDCT 相結合,診斷肺癌的靈敏度和特異度分別為 91.8% 和 95.2%,特異度不足 100%,因為有 2 例痰標本已通過 Cell-CT 檢測方式發現異常細胞,但截至最后一次隨訪,這 2 例患者均未發現惡性腫瘤。該研究還發現在肺癌風險人群中,運用 Cell-CT 建立肺癌風險預測模型,其陽性預測值為 95.4%,陰性預測值為 99.9%[32]。因此,將臨床、痰細胞學與影像學相結合可以提高肺癌診斷的準確性。
2.2 代謝組學
代謝組學是 20 世紀 90 年代發展起來的一門學科,展現的是腫瘤發生發展過程中的代謝過程,以及腫瘤微環境相關的表型變化。代謝組學不僅應用于肺癌方向,而且應用于乳腺癌、卵巢癌、胃癌和前列腺癌等腫瘤的研究。其優點是代謝產物數量少,而可獲取的生物樣本廣泛。肺癌代謝產物的變化包括糖酵解、檸檬酸循環、氨基酸代謝和細胞膜合成[33]。關于尿液中排泄的一些代謝產物,即肌酸核糖體和 N-乙酰神經氨酸,在臨床發現疾病之前與肺癌高風險具有相關性[34]。2016 年 Puchades-Carrasco 等[33]發現,在肺癌患者中,鼠類肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)/Kelch 樣環氧氯丙烷相關蛋白-1(Kelch-like ECH-associated protein 1,KEAP1)基因或 KRAS/核呼吸因子 2(nuclear respiratory factor2,NRF2)突變可導致谷氨酰胺的分解,這又為運用代謝組學篩查肺癌提供了理論依據。不僅是血液樣本,痰液或呼出氣冷凝物也可用于肺癌高危人群篩查或鑒別孤立性肺結節的良惡性。此外,代謝組學還可以區分腫瘤組織學亞型和遺傳學基礎[35-36]。
2.3 肺癌的遺傳易感性
全基因組關聯研究發現,染色體 15q25.1 位點是肺癌的主要易感區,為肺癌群體提供了遺傳學證據,這在肺癌風險預測模型中也很重要[37]。2017 年 Wang 等[38]分析了 1 000 多個候選基因,確定了 21 個基因[脫嘌呤/脫嘧啶核酸內切酶 1(apurinic/apyrimidinic endonuclease 1,APEX1)、共濟失調毛細血管擴張癥突變(ataxia-telangiectasia mutated,ATM)、軸抑制蛋白 2(axis inhibition protein 2,AXIN2)、尼古丁乙酰膽堿受體 α3 亞基(cholinergic receptor nicotinic alpha 3 subunit,CHRNA3)、尼古丁乙酰膽堿受體 α5 亞基(cholinergic receptor nicotinic alpha 5 subunit,CHRNA5)、唇腭裂跨膜1 樣蛋白(cleft lip and palate transmembrane 1 like,CLPTM1L)、CXC 型趨化因子受體 2(C-X-C motif receptor2,CXCR2)、細胞色素 P450(cytochrome P450,CYP)1A1、CYP2E1、切除修復交叉互補基因(excision repair cross complement,ERCC)1、ERCC2、成纖維細胞生長因子受體(fibroblast growth factor receptor,FGFR)4、羥賴氨酸激酶(hydroxylysine kinase,HYKK)、miR146a、miR-196a2、8-羥基鳥嘌呤 DNA 糖苷酶(8-Oxoguanine DNA glycosylase,OGG)1、對氧磷酶(paraoxonase,PON)1、REV3L(protein reversionless 3-like)、超氧化物歧化酶 2(superoxide dismutase 2,SOD2)、端粒酶逆轉錄酶(telomerase reverse transcriptase,TERT)和腫瘤蛋白 p53(tumor protein p53,TP53)]中的 22 種變異形式與肺癌易感性有顯著的相關性。而腫瘤陣列聯盟研究計劃(OncoArray Consortium)發現了新的肺癌易感基因[39],但這些新的肺癌易感基因在肺癌篩查中的價值尚待證實。綜上,基于全基因組關聯研究的大量基因信息開展研究,利用最先進的數學和統計學方法,將單核苷酸多態性與風險模型、人工智能和機器監督學習相結合[40-41],大量疑難病例的遺傳易感性將可能被揭示,從而推動個體化的精準治療。
2.4 分子生物標志物與影像組學和人工智能的結合
影像組學是荷蘭研究人員 Philippe Lambin 在 2012 年首次提出。它是傳統影像學與分子生物學、分子病理學、信息學于一體的新興影像診斷方法。這是一個新的研究領域,是在肺癌影像表型和腫瘤微環境相關的海量數據中尋找生物標志物[42-43]。在人工智能時代,豐富的影像數據為這一領域的進步奠定了基礎。通過肺影像數據庫聯盟和圖像數據庫資源計劃,CT 圖像的機器自我學習可以鑒別肺結節的良惡性[44]。目前該領域的研究主要集中在實時識別興趣區域病灶;腫瘤微環境的直接時空表型特征;在局部(結節)、區域(葉)和器官層面上整合多維度信息;在端到端學習中整合成像、臨床和組學數據。
通過影像的深度學習,影像組學可以識別表皮生長因子受體(epidermal growth factor receptor,EGFR)和 KRAS 突變的腫瘤[45]。基于影像數據的定量分析也可以預測腫瘤患者的生存率[46]。血漿生物標志物與影像組學特征的結合可更好地甄別肺結節的良惡性[47]。將血清生物標志物、肺結節的臨床特征和影像學特征整合的預測模型在幾項研究中準確識別了惡性肺結節[48-50]。
3 生物標志物在肺癌篩查中的應用前景
盡管生物標志物在肺癌篩查中頗具潛力,但多數尚在研究階段,并未在臨床實踐中推廣應用。現有的生物標志物研究主要集中在血液樣本,而其他生物樣本如痰液、支氣管灌洗液、呼出氣、尿液和唾液等則鮮有涉及。分析不同來源的生物標志物(如 DNA/RNA、蛋白質、脂質、代謝物等),多組學的生物標志物可使肺癌診斷能力進一步提升。總體而言,綜合模型優于單獨使用血清生物標志物,尤其是將生物標志物、影像組學和人工智能相結合,建立肺癌篩查預測綜合模型,將是未來提升肺癌篩查能力,實現肺癌早診早治的發展方向。
肺癌是我國發病率和病死率最高的惡性腫瘤[1],早診早治是提高肺癌患者生存率和改善預后的關鍵。低劑量 CT(low-dose computed tomography,LDCT)是在高風險人群(根據年齡和吸煙史定義)中篩查肺癌的一種方法,其對肺癌篩查的價值已得到美國肺癌篩查試驗[2]、國際早期肺癌行動計劃[3]、歐洲 NELSON 試驗[4]、意大利多中心肺癌篩查試驗[5]等的證實。盡管對高風險人群采用 LDCT 篩查肺癌在全球廣為應用,但仍存在不少爭議,包括高風險人群界定標準不一、CT 篩查周期差異大、假陽性率高和效益成本比低等。近年來肺癌的生物標志物是研究熱點,新興的生物標志物檢測在肺癌的篩查中顯示出一定的潛力,將生物標志物、影像組學和人工智能相結合,建立肺癌篩查預測綜合模型,可能是未來提升肺癌篩查能力的發展方向。本文概述了生物標志物在肺癌篩查中的應用,介紹了新興的生物標志物和新技術,探討了生物標志物在肺癌篩查中的應用前景,旨在為提升肺癌篩查能力和實現肺癌早診早治提供一定的理論依據。
1 生物標志物在肺癌篩查中的應用
1.1 自身抗體
針對肺癌抗原的自身抗體通常出現在臨床前階段,可能遠早于臨床癥狀或影像學表現。單一自身抗體診斷肺癌的特異性高,但敏感性低。結合多種自身抗體則可提高診斷的特異性和敏感性。Boyle 等[6]研究發現,使用 6 種肺癌自身抗體[抑癌基因 p53、紐約食管鱗狀細胞癌 1(New York esophageal squamous cell carcinoma 1,NY-ESO-1)、腫瘤相關基因(cancer-associated gene,CAGE)、三磷酸腺苷(adenosine triphosphate,ATP)結合 RNA 解旋酶 GBU4-5、膜聯蛋白-1(annexin-1)和性別決定區 Y 框蛋白(sex determining region Y-box protein,SOX)2 的抗體]診斷肺癌的特異度為 89%,而靈敏度為 39%。另一項研究納入了 1 987 例肺結節患者(結節直徑為 4~20 mm),在 CT 篩查風險模型中加入了 7 種肺癌自身抗體[p53、NY-ESO-1、CAGE、GBU4-5、SOX2、人抗原 R(human antigen R,HuD)和黑色素瘤抗原(melanoma antigen,MAGE)-A4 的抗體],使肺癌診斷的特異度顯著提高(>92%),陽性預測值達 70% 以上[7]。Chapman 等[8]在 154 例患者(104 例肺癌和 50 例正常對照)中檢測了 7 種自身抗體[p53、c-myc、人表皮生長因子受體-2(human epidermal growth factor receptor-2,HER2)、NY-ESO-1、CAGE、黏蛋白 1(mucin,MUC1)和 GBU4-5 的抗體],其靈敏度為 61%,特異度為 90%。上述研究結果提示,肺癌自身抗體和其他肺癌篩查方式相結合,其臨床價值可能會進一步提高。
1.2 補體片段
肺癌可通過經典補體途徑激活補體級聯效應,該途徑下游分裂產物補體片段 4d(complement fragment 4d,C4d)的濃度在肺癌患者的血液和體液中增加[9]。有研究在 190 例無癥狀肺結節患者中檢測血漿 C4d 水平,結果發現血漿 C4d 水平與肺癌風險具有相關性[比值比=4.38,95% 置信區間(1.61,11.93)],且肺氣腫和慢性阻塞性肺疾病等潛在的混雜因素并不影響 C4d 水平,惡性肺結節患者的血漿 C4d 水平顯著高于良性肺結節患者[9]。Ajona 等[10]分析了 67 例肺結節患者(肺結節直徑 8~30 mm),發現血漿 C4d 診斷良性肺結節的陰性預測值為 84%,陽性預測值為 54%,其特異度為 89%,而靈敏度僅有 44%。
1.3 微 RNA(microRNA,miRNA)
循環 miRNA 是非編碼 RNA,具有調控功能,能反映腫瘤和宿主之間的相互作用,已成為腫瘤診斷和預后判斷的潛在生物標志物,且 miRNA 與腫瘤分期和基因突變無關[11]。Sozzi 等[12]進行的多中心臨床研究評估了血漿 miRNA 識別分類器(microRNA signature classifier,MSC)對肺癌高風險人群的診斷價值。該研究采集了 939 例受試者(肺癌患者 69 例、LDCT 篩查的肺癌風險人群 652 例、對照組 287 例)的血漿,通過熒光定量聚合酶鏈反應檢測 miRNA。結果顯示,MSC 診斷肺癌的靈敏度為 87%,特異度為 81%;LDCT 篩查肺癌的靈敏度為 79%,特異度為 81%,假陽性率高達 19.4%;MSC 和 LDCT 聯合應用可使 LDCT 的假陽性率降至 3.7%。而在肺癌術后患者中,血漿 MSC 還能監控腫瘤復發[13]。此外,正在進行的 3 項獨立的大型肺癌篩查研究共納入 16 000 例肺癌高危患者,或許將進一步驗證 miRNA 對良惡性肺結節的診斷價值。
1.4 循環腫瘤 DNA
循環腫瘤 DNA 指導晚期腫瘤精準治療的價值已被相關研究證實[14],但在早期肺癌診斷中的作用仍不確定。Abbosh 等[15]在 96 例Ⅰ~Ⅲ期非小細胞肺癌患者中檢測血液循環腫瘤 DNA,靈敏度從Ⅰ期肺腺癌的 15% 到Ⅱ期或Ⅲ期鱗狀細胞癌的 100% 不等,總體靈敏度為 48%。近期一項研究整合了血液循環腫瘤 DNA 和血清蛋白質譜技術,納入了 1 005 例Ⅰ~Ⅲ期多種腫瘤患者和 812 名非腫瘤對照者,雖然總體特異度高于 99%,但靈敏度總體偏低,肺癌中靈敏度為 59%,乳腺癌中靈敏度 33%,而在卵巢癌中靈敏度高達 98%[16]。
1.5 循環腫瘤細胞(circulating tumor cell,CTC)
CTC 是原發腫瘤或轉移瘤脫落進入血液循環的腫瘤細胞。CTC 數量少,且呈異質性,因此檢測技術要求較高,目前仍在探索中。CTC 作為液體活檢的一種方法也有一定優勢,如可用于早期肺癌的篩查[17]和肺癌進展的動態檢測,也可監測腫瘤的異質性,而且通過對 CTC 的基因檢測,可以發現基因突變,從而指導治療。Ilie 等[18]早期研究了肺癌的風險因素,檢測了 245 例無癌癥患者的 CTC 情況,包括 168 例慢性阻塞性肺疾病患者和 77 例無慢性阻塞性肺疾病患者,每年對 CTC 陽性慢性阻塞性肺疾病患者進行 CT 篩查,發現 CTC 檢測相比 CT 篩查能早 1~4 年發現肺病病灶。Chen 等[19]通過檢測 CTC 對肺癌或肺部良性結節患者以及健康者進行研究,其中肺癌或肺部良性結節患者中 CTC 陽性率為 84%,而后者中僅 4.2%。推測隨著新技術的發展,CTC 聯合影像等相關輔助檢查,對肺癌的診斷或許能有更大提高。
1.6 外泌體
外泌體是 50~150 nm 直徑的分泌膜包裹的囊泡(細胞外囊泡)[20]。目前學術界對外泌體能否指導診斷及治療比較感興趣[21],但相關研究卻很少。近來 Zhang 等[22]對肺惡性結節和良性結節患者血漿中的外泌體進行了研究,通過對外泌體 miRNA 特征圖譜的探索,發現其對肺癌早期診斷有著重要的意義。目前也有文獻對外泌體蛋白調控腫瘤進展的機制進行了研究,并總結了其作為腫瘤標志物對肺癌篩查的可行性[23]。
1.7 DNA 甲基化
腫瘤組織以抑癌基因啟動子區 DNA 的低甲基化和特定胞嘧啶-磷酸-鳥嘌呤(cytidine-phosphate-guanine,CpG)位點的高甲基化為特征。Esteller 等[24]進行了一項血清循環腫瘤 DNA 甲基化的研究,發現 22 例非小細胞肺癌中有 15 例(68%)檢測到 DNA 甲基化異常,但在正常肺組織樣本中未檢測到甲基化異常。在組織甲基化異常的原發性腫瘤中,15 個樣本中有 11 個(73%)在血清樣本中也存在甲基化 DNA 異常。Wielscher 等[25]采用熒光定量聚合酶鏈反應檢測 143 例肺部疾病患者(肺癌 33 例、肺間質纖維化 68 例和慢性阻塞性肺疾病 42 例)和 61 例健康對照者的血清樣本,發現甲基化診斷肺癌的靈敏度為 88%,特異度為 90%。Hulbert 等[26]研究了 2 種 DNA 甲基化模型對肺癌的診斷價值,分析了 150 例Ⅰ期或Ⅱ期非小細胞肺癌患者和 60 例對照者,其中一種三基因模型[短暫擴充細胞基因(transit amplifying cells,TAC)1、同源框基因(homeobox,HOX)A17 和 SOX17 基因]相關痰液 DNA 甲基化診斷肺癌的靈敏度為 98%,特異度為 71%;另外一種三基因模型[半胱氨酸雙加氧酶 1(cysteine dioxygenase 1,CDO1)、TAC1 和 SOX17]相關血漿 DNA 甲基化診斷肺癌的靈敏度為 93%,特異度為 62%。
1.8 血清蛋白質譜
多種血清腫瘤抗原試劑盒已開發用于肺癌的診斷。血清蛋白(癌胚抗原、腫瘤抗原 125、細胞角蛋白片段 21-1)和自身抗體 NY-ESO-1 抗體在肺癌高風險人群中診斷靈敏度為 74%,特異度為 80%[27]。一項研究發現,在肺癌高風險人群中,聯合多種血清腫瘤蛋白標志物(癌胚抗原、細胞角蛋白片段 21-1、腫瘤抗原 125、肝細胞生長因子和 NY-ESO-1)診斷肺癌的靈敏度僅有 49%,但特異度高達 96%,納入臨床變量可使診斷的準確性提高[28]。Molina 等[29]進行的一項研究納入了 3 144 例肺結節患者(其中 1 828 例為肺癌),根據肺結節大小、年齡和吸煙狀況的臨床預測模型診斷肺癌的曲線下面積為 0.85,聯合了 6 種腫瘤抗原(癌胚抗原、腫瘤抗原 153、鱗狀細胞癌抗原、細胞角蛋白片段 21-1、特異性神經元烯醇酶和促胃泌素原釋放肽)后曲線下面積增加到 0.93。另一項研究納入 178 例疑似肺結節患者,顯示半乳糖凝集素-3 結合蛋白和清道夫受體富半胱氨酸蛋白 1 型蛋白 M130 聯合臨床風險預測模型診斷肺癌的靈敏度為 97%,特異度為 44%;通過多種血清腫瘤抗原檢測,可使 40% 的良性肺結節患者避免侵入性檢查,但假陰性結果可能使 3% 的惡性肺結節延誤治療[30]。
2 新興的生物標志物和新技術
2.1 痰細胞的圖像分析
傳統意義上,痰細胞學檢查不能產生足夠或有用的肺癌篩查樣本,但隨著細胞學技術的發展,結合人工智能的圖像分析算法,痰標本的診斷價值得以提高。三維流式細胞儀可以篩查痰標本中的異常細胞[31],這是一種新的檢測方法。有研究對 91 例患者行痰細胞學檢查,結果顯示,與 LDCT 相結合,診斷肺癌的靈敏度和特異度分別為 91.8% 和 95.2%,特異度不足 100%,因為有 2 例痰標本已通過 Cell-CT 檢測方式發現異常細胞,但截至最后一次隨訪,這 2 例患者均未發現惡性腫瘤。該研究還發現在肺癌風險人群中,運用 Cell-CT 建立肺癌風險預測模型,其陽性預測值為 95.4%,陰性預測值為 99.9%[32]。因此,將臨床、痰細胞學與影像學相結合可以提高肺癌診斷的準確性。
2.2 代謝組學
代謝組學是 20 世紀 90 年代發展起來的一門學科,展現的是腫瘤發生發展過程中的代謝過程,以及腫瘤微環境相關的表型變化。代謝組學不僅應用于肺癌方向,而且應用于乳腺癌、卵巢癌、胃癌和前列腺癌等腫瘤的研究。其優點是代謝產物數量少,而可獲取的生物樣本廣泛。肺癌代謝產物的變化包括糖酵解、檸檬酸循環、氨基酸代謝和細胞膜合成[33]。關于尿液中排泄的一些代謝產物,即肌酸核糖體和 N-乙酰神經氨酸,在臨床發現疾病之前與肺癌高風險具有相關性[34]。2016 年 Puchades-Carrasco 等[33]發現,在肺癌患者中,鼠類肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)/Kelch 樣環氧氯丙烷相關蛋白-1(Kelch-like ECH-associated protein 1,KEAP1)基因或 KRAS/核呼吸因子 2(nuclear respiratory factor2,NRF2)突變可導致谷氨酰胺的分解,這又為運用代謝組學篩查肺癌提供了理論依據。不僅是血液樣本,痰液或呼出氣冷凝物也可用于肺癌高危人群篩查或鑒別孤立性肺結節的良惡性。此外,代謝組學還可以區分腫瘤組織學亞型和遺傳學基礎[35-36]。
2.3 肺癌的遺傳易感性
全基因組關聯研究發現,染色體 15q25.1 位點是肺癌的主要易感區,為肺癌群體提供了遺傳學證據,這在肺癌風險預測模型中也很重要[37]。2017 年 Wang 等[38]分析了 1 000 多個候選基因,確定了 21 個基因[脫嘌呤/脫嘧啶核酸內切酶 1(apurinic/apyrimidinic endonuclease 1,APEX1)、共濟失調毛細血管擴張癥突變(ataxia-telangiectasia mutated,ATM)、軸抑制蛋白 2(axis inhibition protein 2,AXIN2)、尼古丁乙酰膽堿受體 α3 亞基(cholinergic receptor nicotinic alpha 3 subunit,CHRNA3)、尼古丁乙酰膽堿受體 α5 亞基(cholinergic receptor nicotinic alpha 5 subunit,CHRNA5)、唇腭裂跨膜1 樣蛋白(cleft lip and palate transmembrane 1 like,CLPTM1L)、CXC 型趨化因子受體 2(C-X-C motif receptor2,CXCR2)、細胞色素 P450(cytochrome P450,CYP)1A1、CYP2E1、切除修復交叉互補基因(excision repair cross complement,ERCC)1、ERCC2、成纖維細胞生長因子受體(fibroblast growth factor receptor,FGFR)4、羥賴氨酸激酶(hydroxylysine kinase,HYKK)、miR146a、miR-196a2、8-羥基鳥嘌呤 DNA 糖苷酶(8-Oxoguanine DNA glycosylase,OGG)1、對氧磷酶(paraoxonase,PON)1、REV3L(protein reversionless 3-like)、超氧化物歧化酶 2(superoxide dismutase 2,SOD2)、端粒酶逆轉錄酶(telomerase reverse transcriptase,TERT)和腫瘤蛋白 p53(tumor protein p53,TP53)]中的 22 種變異形式與肺癌易感性有顯著的相關性。而腫瘤陣列聯盟研究計劃(OncoArray Consortium)發現了新的肺癌易感基因[39],但這些新的肺癌易感基因在肺癌篩查中的價值尚待證實。綜上,基于全基因組關聯研究的大量基因信息開展研究,利用最先進的數學和統計學方法,將單核苷酸多態性與風險模型、人工智能和機器監督學習相結合[40-41],大量疑難病例的遺傳易感性將可能被揭示,從而推動個體化的精準治療。
2.4 分子生物標志物與影像組學和人工智能的結合
影像組學是荷蘭研究人員 Philippe Lambin 在 2012 年首次提出。它是傳統影像學與分子生物學、分子病理學、信息學于一體的新興影像診斷方法。這是一個新的研究領域,是在肺癌影像表型和腫瘤微環境相關的海量數據中尋找生物標志物[42-43]。在人工智能時代,豐富的影像數據為這一領域的進步奠定了基礎。通過肺影像數據庫聯盟和圖像數據庫資源計劃,CT 圖像的機器自我學習可以鑒別肺結節的良惡性[44]。目前該領域的研究主要集中在實時識別興趣區域病灶;腫瘤微環境的直接時空表型特征;在局部(結節)、區域(葉)和器官層面上整合多維度信息;在端到端學習中整合成像、臨床和組學數據。
通過影像的深度學習,影像組學可以識別表皮生長因子受體(epidermal growth factor receptor,EGFR)和 KRAS 突變的腫瘤[45]。基于影像數據的定量分析也可以預測腫瘤患者的生存率[46]。血漿生物標志物與影像組學特征的結合可更好地甄別肺結節的良惡性[47]。將血清生物標志物、肺結節的臨床特征和影像學特征整合的預測模型在幾項研究中準確識別了惡性肺結節[48-50]。
3 生物標志物在肺癌篩查中的應用前景
盡管生物標志物在肺癌篩查中頗具潛力,但多數尚在研究階段,并未在臨床實踐中推廣應用。現有的生物標志物研究主要集中在血液樣本,而其他生物樣本如痰液、支氣管灌洗液、呼出氣、尿液和唾液等則鮮有涉及。分析不同來源的生物標志物(如 DNA/RNA、蛋白質、脂質、代謝物等),多組學的生物標志物可使肺癌診斷能力進一步提升。總體而言,綜合模型優于單獨使用血清生物標志物,尤其是將生物標志物、影像組學和人工智能相結合,建立肺癌篩查預測綜合模型,將是未來提升肺癌篩查能力,實現肺癌早診早治的發展方向。