肺癌的早期診斷和相應的治療措施是降低死亡率至關重要的因素。人工智能作為新興的科學技術飛速發展,與醫療領域相結合,為肺癌的早期診斷提供了新思路,并取得了顯著的成效。人工智能極大地緩解了臨床工作壓力,改變了當前醫療模式,有望使醫生作為一個決策者的身份工作。本文主要闡述人工智能在肺結節良惡性鑒定、病理分型、標志物測定、血漿循環腫瘤 DNA 檢測等方面的研究進展。
引用本文: 楊寧, 金大成, 陳猛, 王兵, 賀曉陽, 張斯淵, 茍云久. 人工智能在肺癌診斷中的研究進展. 中國胸心血管外科臨床雜志, 2020, 27(12): 1466-1471. doi: 10.7507/1007-4848.202005014 復制
肺癌是目前發病率最高的癌癥,也是癌癥性死亡的主要病因,每年近 180 多萬人因肺癌死亡。隨著我國人口規模和人口老齡化的增加,肺癌的患病率將不斷上升[1-2]。雖然各種各樣新的肺癌診治方式不斷應用于臨床,但是目前肺癌患者的生存結果仍不樂觀。歸根結底是肺癌的早期診斷率低,大多數患者確診時已到達晚期(晚期 5 年生存率為 18%),對肺癌早期有效診斷并給予相應的治療措施,患者生存率可以提高 20%[3-5]。醫學影像組學和生物分子標志物診斷等技術進步有望解決目前肺癌診斷中面臨的挑戰,但同時也伴隨著大量數據的產生,如何深度解讀數據信息以及應對繁重的臨床工作任務又是一大難題。近年來人工智能(artificial intelligence,AI)科學技術突飛猛進,廣泛應用于物流、家居、交通、醫療衛生等行業,深刻改變著人類的生活。AI 與醫療衛生行業的相互結合極大地克服了目前醫學面臨的難題,AI 在肺癌的檢測、診斷和治療方面取得了突破性的進展[6]。本文旨在闡述 AI 在肺癌診斷中的應用現狀和發展趨勢。
1 人工智能應用現狀和進展
1.1 人工智能鑒別肺結節的良惡性
肺部體檢篩查經常發現許多不確定的實性結節、部分實性結節和純磨玻璃密度結節,這些早期病變中只有一小部分最終被診斷為惡性。結節良惡性的確定是指導治療的基礎,可以有效防止惡性結節的進一步發展和減少良性結節的過度醫療[7]。臨床醫生通過使用 CT、正電子發射計算機斷層顯像(PET-CT)、X 線片和穿刺活檢等方法診斷結節的良惡性。由于穿刺活檢具有侵入性,可能會造成嚴重并發癥,放射組學檢查是最合適的肺結節輔助診斷方法。隨著影像學成像技術的不斷革新,更薄層的 CT 成像能提高肺結節的檢出靈敏度,但同時生成的影像學切片圖像數量會使得影像科醫生的工作任務翻倍,增加漏診、誤診以及降低工作效率。計算機輔助診斷系統(computer-aided diagnosis,CAD)是一種可被用來檢測肺結節并能區分良惡性的醫學影像 AI 系統,具有不疲勞性和高效性。CAD系統是基于數據紋理提取、預處理、分割,結節檢測和良惡性判斷這幾個基本步驟來實現肺結節的診斷[8]。
CAD 系統在結節檢測和定位方面具有一定的優勢,但由于某些良惡性結節在形態上極為相似,不同的研究人員發現傳統 CAD 對于肺結節的診斷率為 38%~100%,肺結節良惡性的診斷仍是一個具有挑戰性的難題[9]。概率神經網絡(probabilistic neural network,PNN)能夠將神經網絡與統計相關理論結合,其在 CAD 系統中的應用極大改善了這一現況。有研究者[10]使用了一種改進的烏鴉搜索算法(crow-search algorithm,CSA)的 PNN 模型檢測肺結節,改進后的混沌烏鴉算法(chaotic crow-search algorithm,CCSA)通過提取 CT 圖像中最優特征子集及改變子集長度并用于當前最流行的紋理特征分析工具灰度共生矩陣(gray-level co-occurrence matrix,GLCM)分析,減少了 GLCM 分析特征的數量[11]。研究對比發現,使用包含所有分析特征的 GLCM 分析系統檢測肺結節準確率為 82.5%,而使用 CCSA 的 GLCM 特征分析系統檢測準確率提高到了 90%,通過提取顯著的圖像特征可以提高診斷率。在卷積神經網絡(convolutional neural network,CNN)對影像學圖像分析方面取得的最新成果的基礎上,Nasrullah 等[12]對之前研究中使用過的深度學習肺結節檢測模型進行了大量的修改,使用多種策略的深度學習模型對肺結節進行自動檢測和分類,該系統分別使用兩種深度三維(3D)自定義混合鏈接網絡(customized mixed link network,CMixNet)架構進行肺結節檢測和分類,通過快速區域-卷積神經網絡(region convolutional neural network,R-CNN)進行檢測,并通過 U-Net 編解碼結構的 CMixNet 學習結節特征,結節的分類是通過梯度增強機(gradient boosting machine,GBM)對從檢測的 3D CMixNet 結構中學習到的特征進行的,并結合生理癥狀和臨床生物標志物進行最終判定。此系統還可以通過無線身體區域網絡(wireless body area networks,WBAN)對患者進行持續監測,有助于診斷慢性疾病,特別是肺癌的轉移情況。使用該系統在肺部圖像數據庫聯盟和圖像數據庫資源計劃(Lung Image Database Consortium and Image Database Resource Initiative,LIDC-IDRI)[13]中訓練,敏感度和特異度分別為 94%、91%。
X 線片是基層醫療衛生單位應用最廣泛的影像學檢查,也是肺部疾病初篩的檢查方式,但是傳統的胸部 X 線片(CXR)對于早期肺結節檢出率極低。研究[14]指出 CAD 應用于 CXR 輔助診斷肺結節檢出,敏感度和特異度分別為 62%、58%,特異度低的 CAD 會產生較多的假陽性肺結節。隨后 Cha 等[15]設計了一種基于深度卷積神經網絡(deep convolutional neural networks,DCNNs)的深度學習模型,這種系統在 ResNet-50 和 ResNet-101 的深殘留網絡基礎上,又插入了一個新的全卷積網絡(FCN-16S)。在 LIDC-IDRI 數據庫中和當地醫療機構選取了經手術確診的 1483 張癌性肺結節 X 線片作為測試集,對比 6 名放射科醫師和深度學習模型對于結節的檢出率,結果顯示人工檢出的平均曲線下面積(AUC)為 82%(75%~86%),深度學習模型的 AUC 為 90%,具有較好的檢測效能。
1.2 人工智能預測肺癌病理分型
實施精準化治療的基礎是正確區分肺癌的病理分型。當前治療方案的選擇,包括常規手術治療、放化療以及最新的靶向治療和免疫治療,均根據組織學分類選定[16]。臨床上肺癌分為小細胞肺癌和非小細胞肺癌(non-small cell lung cancer,NSCLC),NSCLC 占肺癌絕大多數,也是肺癌死亡的主要病理類型,NSCLC 主要包括肺鱗癌(lung squamous cell carcinoma,LUSC)和肺腺癌(lung adenocarcinoma,LUAD)[17]。活檢是確定肺癌病理分期分型的金標準,同時也是一種有創操作,可能會造成嚴重的并發癥。一項研究[18]探索基于 CT 圖像特征分析的機器學習方法對 NSCLC 進行病理分型,運算過程中使用隨機森林算法減少基尼雜質并選擇最優圖像特征分析肺癌的分型,結果顯示該模型對 LUAD 和 LUSC 具有較高的分類精度,且 LUAD 的預測精度大于 LUSC。研究發現氟代脫氧葡萄糖(18F-FDG)代謝在 LUSC 和 LUAD 之間具有差異性。Hyun 等[19]根據 PET-CT 影像學特征設計開發機器學習預測模型鑒別 LUSC 和 LUAD,該研究運用基尼系數從 4 個臨床特征和 40 種圖像特征中確定了 9 個最優特征子集。在 396 例患者中回顧性地評估了隨機森林、神經網絡、樸素貝葉斯方法、邏輯回歸和支持向量機 5 種分類器的性能,當特征選擇數量大小為 15 時,AUC 分別為 79%、85%、76%、86% 和 77%,并應用邏輯回歸分類器獲得性別、最大標準攝取值(SUVmax)、灰度長度不均勻性、灰度不均勻性和全病變糖降解為 LUAD 最佳預測因子。
若癌變發生在支氣管時,常規的支氣管鏡活檢是高效獲取病理信息的方法,由于同一腫瘤內部不同區域存在異質性,鏡檢只能顯示局部的病理信息,不能全面顯示整塊病變的情況[20]。傳統的 CAD 可以通過白光支氣管鏡獲得的圖像進行黏膜和腫瘤分類,并取得了成功。Feng 等[21]提出了一種用于鑒別肺癌類型的新型 CAD 系統,將白光支氣管鏡圖像中的直觀紅-綠-藍(RGB)轉化為色調-飽和度-值(HSV),提取 HSV 每個彩色通道中的 14 個 GLCM 紋理特征對腫瘤分型進行定量分析,對納入的 22 例 LUSC 和 LUAD 患者圖像進行分析,準確率、靈敏度、特異度和 AUC 分別為 86%、90%、83% 和 82%。
1.3 人工智能對肺癌標志物測定
除了利用影像組學檢出肺部惡性病變外,腫瘤標志物在癌癥檢測中也有至關重要的作用。標志物檢測的陽性結果能夠提示腫瘤可能發生,可作為早期檢測肺癌的指標之一。目前臨床用來診斷肺癌的腫瘤標志物并不是很多,且大多數都不具有特異度。新的證據表明肺癌患者體內某些長鏈非編碼 RNA(long non-coding RNA,lncRNA)是異常的,一些 lncRNA 可以促進或抑制癌癥的進展,并且可以作為診斷標志物[22]。Wang 等[23]將機器學習和加權基因共表達網絡(weighted gene co-expression network analysis,WGCNA)、Lasso 算法、隨機森林算法、支持向量機等技術用于癌癥基因組圖譜(the cancer genome atlas,TCGA)數據庫1 364 個 lncRNA 中篩查 LUAD 最佳生物學標志物。TCGA 數據庫是國家癌癥研究所和國家人類基因組研究所的一個聯合項目[24]。最終 LANCL1-AS1、MIR3945HG、LINC01270、RP5-1061H20.4、BLACAT1、LINC01703、CTD-2227E11.1 和 RP1-244F24.1 被確定為 LUAD 標志物,MIR3945HG 同時也是 LUSC 診斷價值最高的生物學標志物且與生存期密切相關[25]。
免疫組織化學(immunohistochemical,IHC)生物標志物已經越來越多應用于腫瘤診斷、轉移、治療規劃和療效評估等方面。Ki67(也稱 MKi-67)染色在腫瘤學中常被用來估計腫瘤的增殖指數,通過采取組織活檢并進行 IHC 分析,將陽性和陰性作為診斷結果來判斷腫瘤是否增殖[26]。有研究[27]表明,Ki67 水平不僅是二元的,在一個細胞周期,Ki67 在 S、G2、M 期增高,在 G0、G1 期降解,定量分析 Ki67 水平可推斷細胞最后一次分裂的時間以及對細胞增殖進行分類。肺癌內部的異質性可能是晚期肺癌低生存率的主要原因,理論上可通過量化分析影像圖像特征和灰度空間分布來動態監測 Ki67 表達引起全腫瘤內部生物行為學特征,從而避免活檢的有創性和局限性[28-29]。最近一項研究[30]通過機器學習放射組學分類器來預測 NSCLC 中 Ki67 表達水平,該研究基于圖像攝取、腫瘤分割、特征提取和建立分類器工作流程共納入 245 例 NSCLC 患者進行分析。在紋理特征提取之前,使用灰度歸一化盡量減少對比度和亮度變化的影響[31],并用隨機森林法選出最優特征子集,分別測試放射組學分類器、主觀成像特征分類器和組合分類器性能,綜合比較發現放射組學分類器性能優于其它兩種分類器,其檢測敏感度、特異度和 AUC 分別為 73%、66% 和 78%。這是第一項利用 CT 影像資料無創預測 Ki67 表達水平的研究,同時也為腫瘤標志物的檢測提供了更加快捷、安全、全面、準確的思路。
1.4 人工智能對早期肺癌血液檢測
癌癥液體活檢作為一種新型非侵入性診斷手段,通過檢測血漿中的循環腫瘤細胞(circulating tumor cells,CTCs)和循環腫瘤 DNA(circulating tumor DNA,ctDNA)等獲取患者體內腫瘤異常生長信息并用于腫瘤的診斷。ctDNA 是游離 DNA(cell-free DNA,cfDNA)的一種,目前對 cfDNA 的起源和分子特征了解很少。Cristiano 等[32]開發了一種可以評估整個基因組中 cfDNA 裂解方式的模型,發現健康個體和癌癥患者在基因圖譜發生不同的改變,分別為白細胞的核小體改變和片段性改變,并用此方法分析了包含 6 種癌癥的 236 例患者和 245 名健康個體的 cfDNA 片段特征,這些分析結果為以后癌癥的篩查檢測提供了原理方法。
來自斯坦福大學的研究團隊 Chabon 等[33]研發并前瞻性地驗證了一種稱為“血漿中肺癌可能性”(lung-CLIP)的機器學習模型用于早期 NSCLC 的篩查(表1)。研究發現克隆性造血細胞與腫瘤細胞均可以產生 ctDNA,但兩者在變異等位基因頻率(VAF)、cfDNA 片段堿基取代譜、分子片段長短和 TP53 基因突變方面存在不同。在確定了不同來源 cfDNA 片段的差異性特征后,將血漿分子靶向測序、單核苷酸變體(SNV)模型和深度測序(CAPP-Seq)的全基因組拷貝數分析與機器學習模型整合在一起設計出 Lung-CLIP,并設計了更具有優點的被稱為靈活的糾錯雙工適配器(“FLEX Adaptors”)用于該模型中,增加了 Lung-CLIP 的魯棒性。該團隊早期使用包含 104 例早期 NSCLC 患者和 56 例風險匹配對照患者對 Lung-CLIP 進行了訓練,在 80% 特異度下,Ⅰ期 NSCLC 敏感度為 63%,且 Lung-CLIP 可以根據臨床不同的需要調整檢測的特異度。隨后又前瞻性地驗證了獨立機構招募的 46 例早期 NSCLC 患者和 48 例風險匹配對照患者中 Lung-CLIP 的表現,其結果與訓練中的表現相似,這種驗證方法降低了模型過度擬合的風險,從而避免較高的假陽性結果。這種篩查方式可能使美國肺癌患者被救治的生命數量從目前的每年約 600 例增加到接近預期的最大值約 12 000 例。此外,研究結果發現 ctDNA 水平與早期 NSCLC 的預后密切相關,未來可以將治療前的 ctDNA 測量結果納入 NSCLC 分期,并啟用結合治療前和治療后變量的實時風險模型,以個性化預測患者預后。

2 人工智能應用的不足與局限性
人民生活水平的逐步提高對醫療健康的需求與日俱增,加劇了醫療資源的緊缺,需要有新的技術解決這一挑戰。隨著神經網絡、深度學習算法等關鍵技術的突破和應用,AI 應用于醫療衛生行業的潛力不斷被挖掘,在疾病的診斷與監測、療效評價、生存預測、藥物試驗和健康管理等方面發揮重要作用,并得到了醫學專家的認可[34-36]。目前雖有大量 AI 醫療產品問世,但是 AI 仍處于起步階段,在肺癌的診斷中存在較多問題。首先是 AI 在醫學上的應用正在超越法律的監管和限制。由于 AI 在醫療運用中的有效性和可靠性仍未被明確證明,現行的法律沒有清晰規定 AI 應當承擔的責任范圍,AI 在醫療服務中出現的失誤需要醫生來承擔責任,但醫生并不是這方面的專家,不能鑒定產品的好壞,再加上內部處理器存在“黑匣子”問題,使得 AI 責任評估更加困難[37]。當下急需建立 AI 責任歸屬相關的法律,從法律層面劃分醫生、患者與 AI 企業應當承擔的責任,這樣才能督促企業完善產品的性能并保護患者隱私。其次,目前所有診斷的 AI 技術都是基于回顧性研究分析來確定診斷效能,且樣本量小,用來訓練的數據庫一般都是 LIDC-IDRI 等公開數據庫,存在一定的取樣偏倚。有報道發現在診斷皮膚癌方面勝過臨床醫生的 AI 技術產品主要接受了高加索人種患者的數據培訓,當將相同類型的診斷算法應用于其他人種時,準確性會急劇下降,目前應當建立屬于我們自己的高質量數據庫,用來進行 AI 產品的訓練。最后,絕大多數醫療 AI 產品均是檢測單一病種,在實際應用環境中,患者可能患有多種肺部疾病,如何區分并且辨別病種是 AI 發展的另一挑戰。AI 技術檢測小結節的準確度低,可以進一步提高 AI 技術檢測的精度。AI 技術同時應該投入臨床中開展大規模的前瞻性隊列研究,也需要培訓臨床醫生與患者溝通有關 AI 在診斷和治療中的作用,以進行有效的信息傳遞交流,并將 AI 使用過程中的缺點反饋給 AI 企業,在實踐運用中發現問題并解決問題才能設計出更符合當前需求的產品。
3 小結與展望
綜上所述,AI 檢測肺癌研究模型被廣泛開發,這些模型將具有客觀性、高效性、多角度性且可重復性的技術手段應用于肺癌診斷中,能很大程度緩解臨床醫生的工作壓力,減少醫生由于疲勞導致的誤診,可能會改變當前的醫療模式,有望使醫生作為一個決策者的身份工作。AI 技術已經越來越多應用于臨床診療實踐中,在 2020 年抗擊新型冠狀病毒疫情工作中,如 AI 天眼 CT 等影像學 AI 產品已應用于火神山、瑞金等多家醫院進行新型冠狀病毒肺炎的初步篩查,有效減少患者之間的接觸,且診斷率可以達到 90% 以上。在未來的發展過程中,將放射圖像、基因組學、病理學、電子健康記錄等多個數據流聚集到強大的綜合診斷系統中并結合 5G 可以是 AI 發展的一個方向,使得弱 AI 時代邁向真正的 AI 時代,并進一步縮小我國醫療資源發展的不均衡。
利益沖突:無。
作者貢獻:楊寧負責論文設計、數據整理與分析、論文初稿撰寫與修改;金大成、陳猛、王兵、賀曉陽、張斯淵負責論文審閱與修改;茍云久負責論文設計。
肺癌是目前發病率最高的癌癥,也是癌癥性死亡的主要病因,每年近 180 多萬人因肺癌死亡。隨著我國人口規模和人口老齡化的增加,肺癌的患病率將不斷上升[1-2]。雖然各種各樣新的肺癌診治方式不斷應用于臨床,但是目前肺癌患者的生存結果仍不樂觀。歸根結底是肺癌的早期診斷率低,大多數患者確診時已到達晚期(晚期 5 年生存率為 18%),對肺癌早期有效診斷并給予相應的治療措施,患者生存率可以提高 20%[3-5]。醫學影像組學和生物分子標志物診斷等技術進步有望解決目前肺癌診斷中面臨的挑戰,但同時也伴隨著大量數據的產生,如何深度解讀數據信息以及應對繁重的臨床工作任務又是一大難題。近年來人工智能(artificial intelligence,AI)科學技術突飛猛進,廣泛應用于物流、家居、交通、醫療衛生等行業,深刻改變著人類的生活。AI 與醫療衛生行業的相互結合極大地克服了目前醫學面臨的難題,AI 在肺癌的檢測、診斷和治療方面取得了突破性的進展[6]。本文旨在闡述 AI 在肺癌診斷中的應用現狀和發展趨勢。
1 人工智能應用現狀和進展
1.1 人工智能鑒別肺結節的良惡性
肺部體檢篩查經常發現許多不確定的實性結節、部分實性結節和純磨玻璃密度結節,這些早期病變中只有一小部分最終被診斷為惡性。結節良惡性的確定是指導治療的基礎,可以有效防止惡性結節的進一步發展和減少良性結節的過度醫療[7]。臨床醫生通過使用 CT、正電子發射計算機斷層顯像(PET-CT)、X 線片和穿刺活檢等方法診斷結節的良惡性。由于穿刺活檢具有侵入性,可能會造成嚴重并發癥,放射組學檢查是最合適的肺結節輔助診斷方法。隨著影像學成像技術的不斷革新,更薄層的 CT 成像能提高肺結節的檢出靈敏度,但同時生成的影像學切片圖像數量會使得影像科醫生的工作任務翻倍,增加漏診、誤診以及降低工作效率。計算機輔助診斷系統(computer-aided diagnosis,CAD)是一種可被用來檢測肺結節并能區分良惡性的醫學影像 AI 系統,具有不疲勞性和高效性。CAD系統是基于數據紋理提取、預處理、分割,結節檢測和良惡性判斷這幾個基本步驟來實現肺結節的診斷[8]。
CAD 系統在結節檢測和定位方面具有一定的優勢,但由于某些良惡性結節在形態上極為相似,不同的研究人員發現傳統 CAD 對于肺結節的診斷率為 38%~100%,肺結節良惡性的診斷仍是一個具有挑戰性的難題[9]。概率神經網絡(probabilistic neural network,PNN)能夠將神經網絡與統計相關理論結合,其在 CAD 系統中的應用極大改善了這一現況。有研究者[10]使用了一種改進的烏鴉搜索算法(crow-search algorithm,CSA)的 PNN 模型檢測肺結節,改進后的混沌烏鴉算法(chaotic crow-search algorithm,CCSA)通過提取 CT 圖像中最優特征子集及改變子集長度并用于當前最流行的紋理特征分析工具灰度共生矩陣(gray-level co-occurrence matrix,GLCM)分析,減少了 GLCM 分析特征的數量[11]。研究對比發現,使用包含所有分析特征的 GLCM 分析系統檢測肺結節準確率為 82.5%,而使用 CCSA 的 GLCM 特征分析系統檢測準確率提高到了 90%,通過提取顯著的圖像特征可以提高診斷率。在卷積神經網絡(convolutional neural network,CNN)對影像學圖像分析方面取得的最新成果的基礎上,Nasrullah 等[12]對之前研究中使用過的深度學習肺結節檢測模型進行了大量的修改,使用多種策略的深度學習模型對肺結節進行自動檢測和分類,該系統分別使用兩種深度三維(3D)自定義混合鏈接網絡(customized mixed link network,CMixNet)架構進行肺結節檢測和分類,通過快速區域-卷積神經網絡(region convolutional neural network,R-CNN)進行檢測,并通過 U-Net 編解碼結構的 CMixNet 學習結節特征,結節的分類是通過梯度增強機(gradient boosting machine,GBM)對從檢測的 3D CMixNet 結構中學習到的特征進行的,并結合生理癥狀和臨床生物標志物進行最終判定。此系統還可以通過無線身體區域網絡(wireless body area networks,WBAN)對患者進行持續監測,有助于診斷慢性疾病,特別是肺癌的轉移情況。使用該系統在肺部圖像數據庫聯盟和圖像數據庫資源計劃(Lung Image Database Consortium and Image Database Resource Initiative,LIDC-IDRI)[13]中訓練,敏感度和特異度分別為 94%、91%。
X 線片是基層醫療衛生單位應用最廣泛的影像學檢查,也是肺部疾病初篩的檢查方式,但是傳統的胸部 X 線片(CXR)對于早期肺結節檢出率極低。研究[14]指出 CAD 應用于 CXR 輔助診斷肺結節檢出,敏感度和特異度分別為 62%、58%,特異度低的 CAD 會產生較多的假陽性肺結節。隨后 Cha 等[15]設計了一種基于深度卷積神經網絡(deep convolutional neural networks,DCNNs)的深度學習模型,這種系統在 ResNet-50 和 ResNet-101 的深殘留網絡基礎上,又插入了一個新的全卷積網絡(FCN-16S)。在 LIDC-IDRI 數據庫中和當地醫療機構選取了經手術確診的 1483 張癌性肺結節 X 線片作為測試集,對比 6 名放射科醫師和深度學習模型對于結節的檢出率,結果顯示人工檢出的平均曲線下面積(AUC)為 82%(75%~86%),深度學習模型的 AUC 為 90%,具有較好的檢測效能。
1.2 人工智能預測肺癌病理分型
實施精準化治療的基礎是正確區分肺癌的病理分型。當前治療方案的選擇,包括常規手術治療、放化療以及最新的靶向治療和免疫治療,均根據組織學分類選定[16]。臨床上肺癌分為小細胞肺癌和非小細胞肺癌(non-small cell lung cancer,NSCLC),NSCLC 占肺癌絕大多數,也是肺癌死亡的主要病理類型,NSCLC 主要包括肺鱗癌(lung squamous cell carcinoma,LUSC)和肺腺癌(lung adenocarcinoma,LUAD)[17]。活檢是確定肺癌病理分期分型的金標準,同時也是一種有創操作,可能會造成嚴重的并發癥。一項研究[18]探索基于 CT 圖像特征分析的機器學習方法對 NSCLC 進行病理分型,運算過程中使用隨機森林算法減少基尼雜質并選擇最優圖像特征分析肺癌的分型,結果顯示該模型對 LUAD 和 LUSC 具有較高的分類精度,且 LUAD 的預測精度大于 LUSC。研究發現氟代脫氧葡萄糖(18F-FDG)代謝在 LUSC 和 LUAD 之間具有差異性。Hyun 等[19]根據 PET-CT 影像學特征設計開發機器學習預測模型鑒別 LUSC 和 LUAD,該研究運用基尼系數從 4 個臨床特征和 40 種圖像特征中確定了 9 個最優特征子集。在 396 例患者中回顧性地評估了隨機森林、神經網絡、樸素貝葉斯方法、邏輯回歸和支持向量機 5 種分類器的性能,當特征選擇數量大小為 15 時,AUC 分別為 79%、85%、76%、86% 和 77%,并應用邏輯回歸分類器獲得性別、最大標準攝取值(SUVmax)、灰度長度不均勻性、灰度不均勻性和全病變糖降解為 LUAD 最佳預測因子。
若癌變發生在支氣管時,常規的支氣管鏡活檢是高效獲取病理信息的方法,由于同一腫瘤內部不同區域存在異質性,鏡檢只能顯示局部的病理信息,不能全面顯示整塊病變的情況[20]。傳統的 CAD 可以通過白光支氣管鏡獲得的圖像進行黏膜和腫瘤分類,并取得了成功。Feng 等[21]提出了一種用于鑒別肺癌類型的新型 CAD 系統,將白光支氣管鏡圖像中的直觀紅-綠-藍(RGB)轉化為色調-飽和度-值(HSV),提取 HSV 每個彩色通道中的 14 個 GLCM 紋理特征對腫瘤分型進行定量分析,對納入的 22 例 LUSC 和 LUAD 患者圖像進行分析,準確率、靈敏度、特異度和 AUC 分別為 86%、90%、83% 和 82%。
1.3 人工智能對肺癌標志物測定
除了利用影像組學檢出肺部惡性病變外,腫瘤標志物在癌癥檢測中也有至關重要的作用。標志物檢測的陽性結果能夠提示腫瘤可能發生,可作為早期檢測肺癌的指標之一。目前臨床用來診斷肺癌的腫瘤標志物并不是很多,且大多數都不具有特異度。新的證據表明肺癌患者體內某些長鏈非編碼 RNA(long non-coding RNA,lncRNA)是異常的,一些 lncRNA 可以促進或抑制癌癥的進展,并且可以作為診斷標志物[22]。Wang 等[23]將機器學習和加權基因共表達網絡(weighted gene co-expression network analysis,WGCNA)、Lasso 算法、隨機森林算法、支持向量機等技術用于癌癥基因組圖譜(the cancer genome atlas,TCGA)數據庫1 364 個 lncRNA 中篩查 LUAD 最佳生物學標志物。TCGA 數據庫是國家癌癥研究所和國家人類基因組研究所的一個聯合項目[24]。最終 LANCL1-AS1、MIR3945HG、LINC01270、RP5-1061H20.4、BLACAT1、LINC01703、CTD-2227E11.1 和 RP1-244F24.1 被確定為 LUAD 標志物,MIR3945HG 同時也是 LUSC 診斷價值最高的生物學標志物且與生存期密切相關[25]。
免疫組織化學(immunohistochemical,IHC)生物標志物已經越來越多應用于腫瘤診斷、轉移、治療規劃和療效評估等方面。Ki67(也稱 MKi-67)染色在腫瘤學中常被用來估計腫瘤的增殖指數,通過采取組織活檢并進行 IHC 分析,將陽性和陰性作為診斷結果來判斷腫瘤是否增殖[26]。有研究[27]表明,Ki67 水平不僅是二元的,在一個細胞周期,Ki67 在 S、G2、M 期增高,在 G0、G1 期降解,定量分析 Ki67 水平可推斷細胞最后一次分裂的時間以及對細胞增殖進行分類。肺癌內部的異質性可能是晚期肺癌低生存率的主要原因,理論上可通過量化分析影像圖像特征和灰度空間分布來動態監測 Ki67 表達引起全腫瘤內部生物行為學特征,從而避免活檢的有創性和局限性[28-29]。最近一項研究[30]通過機器學習放射組學分類器來預測 NSCLC 中 Ki67 表達水平,該研究基于圖像攝取、腫瘤分割、特征提取和建立分類器工作流程共納入 245 例 NSCLC 患者進行分析。在紋理特征提取之前,使用灰度歸一化盡量減少對比度和亮度變化的影響[31],并用隨機森林法選出最優特征子集,分別測試放射組學分類器、主觀成像特征分類器和組合分類器性能,綜合比較發現放射組學分類器性能優于其它兩種分類器,其檢測敏感度、特異度和 AUC 分別為 73%、66% 和 78%。這是第一項利用 CT 影像資料無創預測 Ki67 表達水平的研究,同時也為腫瘤標志物的檢測提供了更加快捷、安全、全面、準確的思路。
1.4 人工智能對早期肺癌血液檢測
癌癥液體活檢作為一種新型非侵入性診斷手段,通過檢測血漿中的循環腫瘤細胞(circulating tumor cells,CTCs)和循環腫瘤 DNA(circulating tumor DNA,ctDNA)等獲取患者體內腫瘤異常生長信息并用于腫瘤的診斷。ctDNA 是游離 DNA(cell-free DNA,cfDNA)的一種,目前對 cfDNA 的起源和分子特征了解很少。Cristiano 等[32]開發了一種可以評估整個基因組中 cfDNA 裂解方式的模型,發現健康個體和癌癥患者在基因圖譜發生不同的改變,分別為白細胞的核小體改變和片段性改變,并用此方法分析了包含 6 種癌癥的 236 例患者和 245 名健康個體的 cfDNA 片段特征,這些分析結果為以后癌癥的篩查檢測提供了原理方法。
來自斯坦福大學的研究團隊 Chabon 等[33]研發并前瞻性地驗證了一種稱為“血漿中肺癌可能性”(lung-CLIP)的機器學習模型用于早期 NSCLC 的篩查(表1)。研究發現克隆性造血細胞與腫瘤細胞均可以產生 ctDNA,但兩者在變異等位基因頻率(VAF)、cfDNA 片段堿基取代譜、分子片段長短和 TP53 基因突變方面存在不同。在確定了不同來源 cfDNA 片段的差異性特征后,將血漿分子靶向測序、單核苷酸變體(SNV)模型和深度測序(CAPP-Seq)的全基因組拷貝數分析與機器學習模型整合在一起設計出 Lung-CLIP,并設計了更具有優點的被稱為靈活的糾錯雙工適配器(“FLEX Adaptors”)用于該模型中,增加了 Lung-CLIP 的魯棒性。該團隊早期使用包含 104 例早期 NSCLC 患者和 56 例風險匹配對照患者對 Lung-CLIP 進行了訓練,在 80% 特異度下,Ⅰ期 NSCLC 敏感度為 63%,且 Lung-CLIP 可以根據臨床不同的需要調整檢測的特異度。隨后又前瞻性地驗證了獨立機構招募的 46 例早期 NSCLC 患者和 48 例風險匹配對照患者中 Lung-CLIP 的表現,其結果與訓練中的表現相似,這種驗證方法降低了模型過度擬合的風險,從而避免較高的假陽性結果。這種篩查方式可能使美國肺癌患者被救治的生命數量從目前的每年約 600 例增加到接近預期的最大值約 12 000 例。此外,研究結果發現 ctDNA 水平與早期 NSCLC 的預后密切相關,未來可以將治療前的 ctDNA 測量結果納入 NSCLC 分期,并啟用結合治療前和治療后變量的實時風險模型,以個性化預測患者預后。

2 人工智能應用的不足與局限性
人民生活水平的逐步提高對醫療健康的需求與日俱增,加劇了醫療資源的緊缺,需要有新的技術解決這一挑戰。隨著神經網絡、深度學習算法等關鍵技術的突破和應用,AI 應用于醫療衛生行業的潛力不斷被挖掘,在疾病的診斷與監測、療效評價、生存預測、藥物試驗和健康管理等方面發揮重要作用,并得到了醫學專家的認可[34-36]。目前雖有大量 AI 醫療產品問世,但是 AI 仍處于起步階段,在肺癌的診斷中存在較多問題。首先是 AI 在醫學上的應用正在超越法律的監管和限制。由于 AI 在醫療運用中的有效性和可靠性仍未被明確證明,現行的法律沒有清晰規定 AI 應當承擔的責任范圍,AI 在醫療服務中出現的失誤需要醫生來承擔責任,但醫生并不是這方面的專家,不能鑒定產品的好壞,再加上內部處理器存在“黑匣子”問題,使得 AI 責任評估更加困難[37]。當下急需建立 AI 責任歸屬相關的法律,從法律層面劃分醫生、患者與 AI 企業應當承擔的責任,這樣才能督促企業完善產品的性能并保護患者隱私。其次,目前所有診斷的 AI 技術都是基于回顧性研究分析來確定診斷效能,且樣本量小,用來訓練的數據庫一般都是 LIDC-IDRI 等公開數據庫,存在一定的取樣偏倚。有報道發現在診斷皮膚癌方面勝過臨床醫生的 AI 技術產品主要接受了高加索人種患者的數據培訓,當將相同類型的診斷算法應用于其他人種時,準確性會急劇下降,目前應當建立屬于我們自己的高質量數據庫,用來進行 AI 產品的訓練。最后,絕大多數醫療 AI 產品均是檢測單一病種,在實際應用環境中,患者可能患有多種肺部疾病,如何區分并且辨別病種是 AI 發展的另一挑戰。AI 技術檢測小結節的準確度低,可以進一步提高 AI 技術檢測的精度。AI 技術同時應該投入臨床中開展大規模的前瞻性隊列研究,也需要培訓臨床醫生與患者溝通有關 AI 在診斷和治療中的作用,以進行有效的信息傳遞交流,并將 AI 使用過程中的缺點反饋給 AI 企業,在實踐運用中發現問題并解決問題才能設計出更符合當前需求的產品。
3 小結與展望
綜上所述,AI 檢測肺癌研究模型被廣泛開發,這些模型將具有客觀性、高效性、多角度性且可重復性的技術手段應用于肺癌診斷中,能很大程度緩解臨床醫生的工作壓力,減少醫生由于疲勞導致的誤診,可能會改變當前的醫療模式,有望使醫生作為一個決策者的身份工作。AI 技術已經越來越多應用于臨床診療實踐中,在 2020 年抗擊新型冠狀病毒疫情工作中,如 AI 天眼 CT 等影像學 AI 產品已應用于火神山、瑞金等多家醫院進行新型冠狀病毒肺炎的初步篩查,有效減少患者之間的接觸,且診斷率可以達到 90% 以上。在未來的發展過程中,將放射圖像、基因組學、病理學、電子健康記錄等多個數據流聚集到強大的綜合診斷系統中并結合 5G 可以是 AI 發展的一個方向,使得弱 AI 時代邁向真正的 AI 時代,并進一步縮小我國醫療資源發展的不均衡。
利益沖突:無。
作者貢獻:楊寧負責論文設計、數據整理與分析、論文初稿撰寫與修改;金大成、陳猛、王兵、賀曉陽、張斯淵負責論文審閱與修改;茍云久負責論文設計。