肺癌的發病率逐年升高,病理診斷是明確病變和指導臨床選擇相應治療方案的“金標準”。近年來隨著人工智能和數字病理的發展和應用,使人工智能在肺癌病理圖像分析中的研究取得了顯著成績。本文介紹了人工智能在肺癌病理分型、基因突變預測和預后方面的研究進展。顯示人工智能有望進一步加快精準病理學的步伐。
引用本文: 馮時, 滕曉東. 人工智能在肺癌病理精準診斷中的研究進展. 中國胸心血管外科臨床雜志, 2021, 28(5): 592-596. doi: 10.7507/1007-4848.202101013 復制
肺癌是世界范圍內致人死亡的主要疾病,對個人、家庭乃至社會,都帶來了沉重的心理負擔及經濟負擔。最新公布的全球癌癥數據(GLOBOCAN 2018)顯示,肺癌的發病率很高,全球新增肺癌病例 209.4 萬例,占所有新發癌癥的 11.6 %。同時有 180 萬例死亡,占所有癌癥病例的 18.4 %[1]。盡管在診斷和治療方面取得了很大進展,5 年腫瘤相關死亡率為 17.7%[2]。而且肺癌的病情進展和治療反應在不同的患者中差異很大,準確診斷對肺癌患者的治療選擇至關重要,是實現精準醫療的關鍵。組織病理學圖像是肺癌診斷的金標準,也是其治療的基石。隨著個體化精準治療的需求,對肺癌組織病理診斷準確性的要求日益提高。然而病理診斷需要病理學家在高度復雜的組織圖像中識別細微的病理學改變,這一過程耗時并且相對主觀,容易產生觀察者之間的差異性;目前世界大多數國家和地區都面臨著病理學家人數短缺的問題。隨著數字化全切片成像(whole slide imaging,WSI)技術的應用,使病理圖像數字化得以在計算機視覺和人工智能中應用,病理診斷進入了數字病理時代。本文綜述了人工智能在病理圖像分析技術中的最新進展和在診斷病理學中的應用。
1 深度學習的基本概念和發展
人工智能(artificial intelligence,AI)是一個總括術語,是一種計算機模擬人類某些思維過程和智能行為(如學習、推理、思考、計劃等)的方法[3]。機器學習是人工智能的一個分支,它應用統計方法為特定任務優化模型,而不依賴于特定的人為指導來定義模型中的所有規則或參數。機器學習的發展經歷了兩個階段,分別是早期的人工神經網絡(artificial neural network,ANN)和新興的深度學習(deep learning)[4]。早期的 ANN 圖像分析算法分類依賴于:(1)手工的圖像分割;(2)多名熟練的專業診斷人員和大量的時間對圖像手工標注;(3)使用專門為每類對象設計的統計分類器或淺神經計算機器學習分類器識別每個分割的對象;傳統的 ANN 圖像分類效率及準確度較低。深度學習是一種非線性的多層特征學習模型,通過自動檢測原始數據(如像素、字符等)的特征信息并進行分類,然后按照非線性模塊化的方式學習到多個層次上的特征,再進行逐步簡化及整合并產生最終結果[5]。卷積神經網絡(convolutional neural network,CNN)是深度學習在圖像處理領域最突出的技術。CNN 的發展使得圖像分類和檢測圖像中對象的能力顯著提高。CNN 應用圖像分析過濾器或卷積的多個處理層,每層圖像的抽象表示是通過在圖像上系統的卷積多個過濾器來構建的,生成一個用作下一層輸入的特征映射。這種體系結構使得以像素形式處理圖像作為輸入并將所需分類作為輸出成為可能[6]。與傳統的特征提取方法相比,CNN 具有兩個優點:(1)使用 CNN 圖像分類對于不同照明條件、不同形態、存在部分遮擋、水平和垂直偏倚等畸變圖像因素具有魯棒性;(2)相對于傳統的特征提取 CNN 的計算成本較低,準確度較高。
隨著人工智能的發展,使圖像信息轉變為數據進行量化和客觀分析測量成為可能。人工智能有潛力快速分析大量圖像數據,對人類病理學專家診斷困難的病例進行分類,徹底改變傳統的診斷方式和疾病管理。病理圖像是人工智能的絕佳應用場景。基于 CNN 的研究在圖像識別上已顯示出其優勢,在許多病理圖像識別分類任務中達到接近甚至超越病理學家診斷的水平。美國斯坦福大學的學者用 CNN 對皮膚癌進行了分類,直接從圖像進行端-端訓練,只用像素和疾病標簽作為輸入,研究了皮膚癌的人工智能檢測模型,通過與皮膚科病理學專家的診斷比較,其特異度和靈敏度均得到了認可[7]。另外許多學者用深度學習技術開展基因組學、蛋白質組學、組織病理學及預后風險評估等。通過對癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數據庫中乳腺癌患者 RNA 測序結果的研究發現深度學習可用于處理腫瘤基因檢測復雜的數據[8]。Litjens 等[9]的研究驗證了深度學習在前列腺癌診斷和乳腺癌轉移檢測中的出色表現。Ertosun 等[10]研究了一種使用深度學習對膠質瘤進行自動分級的系統。深度學習逐漸被應用到新的領域,包括肺癌病理學。傳統肺癌的病理診斷主要由臨床病理學家承擔。由于有許多機械性的重復性任務,所以閱片既費時又低效,圖像信息具有很強的主觀性,難以量化。目前的研究表明,基于深度學習的肺癌病理學圖像分析通過定性或定量分析病理切片的細胞形態、組織學紋理特征、分布特征和特異分子的免疫組化染色強度等腫瘤信息,克服了這些缺點。它具有巨大的應用潛力,有望改變未來肺癌病理診斷的臨床工作流程。
2 深度學習在肺癌病理分型中的應用
肺癌主要分為非小細胞肺癌(non-small cell lung cancer,NSCLC)和小細胞肺癌(small cell lung cancer,SCLC),大約 80%~85% 的肺癌類型是NSCLC[11]。NSCLC 可分為三種主要的組織學類型:鱗狀細胞癌、腺癌和大細胞癌。由于兩種肺癌的治療方法有很大的差異,準確劃分肺癌的病例類型在臨床工作中非常重要。深度學習可以幫助病理學家檢測肺癌的類型。
氣管鏡脫落細胞學檢查有助于肺癌的早期診斷,而且能區分肺癌的病理類型。Teramoto 等[12]分析了 76 例肺癌(包括鱗狀細胞癌、腺癌和小細胞癌)的細胞學圖像,利用訓練后的 CNN 模型進行特征提取判斷腫瘤類型獲得了 71.1% 的準確度,與細胞病理學家的分類結果相當。Khosravi 等[13]設計了一種新型的微調預訓練 CNN 模型,可以在 100% 高分辨率局部放大圖像中區分鱗狀細胞癌和腺癌,準確度為 75%~90%。Coudray 等[14]將癌癥基因組圖譜 TCGA 數據庫 1 634 張切片圖像(1 176 例腫瘤組織和 459 例正常組織)隨機分為訓練集(70%)、驗證集(15%)和測試集(15%),用大量的圖像分割數據 訓練 inception-v3,采用了遷移學習并在獨立的數據集中進行了驗證和測試,根據圖像形態特征輸出正常組織、鱗狀細胞癌和腺癌三種結果,表現出了與病理學家的診斷相當的高性能,準確度達 97%。Wang 等[15]在 EfcientNet-B3 結構的基礎上利用遷移學習和弱監督學習訓練了 CNN,區別肺癌和非腫瘤的準確度達到了 97.4% 以上。
肺腺癌在臨床、放射學、分子學和病理學特征上具有顯著的異質性[16]。根據生長模式和形態,肺腺癌可進一步分為原位腺癌、微浸潤性腺癌、貼壁生長腺癌、腺泡性腺癌、乳頭狀腺癌、微乳頭狀腺癌、實性腺癌等[17]。這些亞型的肺腺癌具有不同的預后結果[18]和治療反應[19]。雖然對肺腺癌的亞型進行了廣泛的研究,但是由于病理學家之間缺乏一致性以及同一患者在一張或多張切片中存在多種形態亞型,所以亞型的分類對病理學家來說仍然是一個挑戰。為了準確診斷需要量化每種類型的比例,這項任務耗時而且缺乏準確性。目前深度學習在肺癌病理分型中的研究多集中于鱗狀細胞癌和腺癌的分類,對于肺腺癌亞型的分型研究較少。Wei 等[20]首次嘗試了深度學習技術在肺腺癌切片上對組織學亞型進行自動分類,他們使用 CNN 來識別腫瘤區域,然后聚集這些分類推斷整張圖像的主要和次要組織學模式,并在一組獨立的數據集(143 例)中評估了模型的效能,其結果和三位病理學家的判讀結果相當。
3 深度學習對肺癌突變基因的預測
在臨床實踐中,統一病理亞型的腫瘤在分子水平上可能有很大的差異,因此對治療的反應也不同。在 NSCLC 中具有預后/預測意義的基因改變包括 EGFR 基因突變或 ALK 基因重排等。EGFR 的突變狀態是選擇相應靶向治療的關鍵[21]。Coudray 等[14]在另一組實驗中使用深度學習技術區分肺腺癌標本中的基因突變。他們使用 TCGA 肺腺癌組織病理學圖像中的大量圖像數據訓練 inception-v3,根據基因測序結果,輸入模型提取突變相關的形態學特征。并在驗證集和測試集對模型進行驗證和測試,然后輸入測試圖像。對模型進行自動分析后,根據圖像的形態特征,成功地預測了肺腺癌 6 個常見突變基因:STK11、EGFR、FAT1、SETBP1、KRAS 和 TP53。預測 EGFR 突變的工作特征曲線下面積(AUC) 達到 0.83。在獨立的數據集中驗證了模型的通用性,AUC 可能達到 0.75。使用該模型只需輸入 HE 染色圖像即可初步預測基因突變,具有成本低、效率高的優點。
4 深度學習在肺癌預后中的應用
數字病理學最重要的應用之一是根據病理組織形態學表型來預測患者的預后和對治療的反應,以促進精準的醫學治療。雖然特定的病理特征,如上述的肺癌分類和亞型已經被報道為重要的預后因素,但直接將病理圖像與生存結局聯系起來仍然是一個很大的挑戰。計算機輔助診斷(computer aided diagnosis,CAD)可以對肺癌的 TNM 分期做出補充,提供預后信息,具有簡便、快速的優點,對肺癌的臨床診斷和治療具有重要的意義。深度學習可以獲得對肺癌患者預后有用的定量信息。
Li 等[22]利用訓練好的 CNN 將 205 例 NSCLC 患者的病理圖像轉化為淋巴細胞、腫瘤細胞和間質細胞的分布圖,然后用 Bayesian hidden Potts 混合模型有效地融合和觀察多個特征信息。當模型輸入到細胞分布圖中時,可以輸出代表細胞間相互作用強度的參數,并可以量化腫瘤細胞、間質細胞和淋巴細胞之間的相互作用。Cox 回歸模型分析顯示腫瘤細胞與間質細胞相互作用的強度與患者的良好預后顯著相關(P=0.005)。Choi 等[23]對 510 例肺腺癌患者的臨床病理資料進行基因表達綜合訓練,驗證基因共表達網絡。根據輸出的基因譜,選擇與患者生存最密切相關的 20 個代表性基因輸入 CNN 模型。根據提取的各種基因的表達模式,導出風險分層模型,比傳統的 Cox 比例風險模型更具預測性,有助于識別需要新輔助化療的患者。
Mezheyeuski 等[24]采用基于深度學習的多種成像系統對 57 例 NSCLC 患者免疫細胞的重要亞型進行定量定位,定量分析與預后相關的免疫細胞浸潤模式。結果表明,淋巴細胞類型越豐富,腫瘤巢中細胞毒性 T 細胞占其基質的比例越高,同一區域內調節性 T 細胞與效應性 T 細胞的比例越大,CD8 陽性調節性 T 細胞聚集在腫瘤周圍的數量較少,腫瘤患者預后越好。但由于數據量小,缺乏代表性,這一結論還需進一步驗證。微血管密度(microvessel density,MVD)通常作為血管生成的替代指標。MVD 是NSCLC的重要預后因素[25]。Yi 等[26]將病理學家在組織病理學 HE 染色圖像中手工標記的微血管相關特征作為訓練集。訓練好的 FCN 經過微調后,生成最終的 FCN 模型,量化了微血管的特性。通過輸入病理 HE 染色圖像,可以輸出微血管總面積和微血管周圍腫瘤細胞的百分比,應用微血管染色抗體勾畫微血管,可顯著提高模型的自動化程度。Wang 等[27]開發了一個名為 ConvPath 自動細胞分類的模型,在訓練數據集和獨立測試數據集中對肺腺癌的腫瘤細胞、間質細胞和淋巴細胞進行分類,準確率分別高達 92.9% 和 90.1%。ConvPath 根據不同類型細胞的空間分布特征,輸出腫瘤的微環境特征,被證明是肺腺癌的獨立預后因素。他們的另一項基于深度學習的分析方法可以通過分析 48 個肺腺癌 HE 染色圖像的空間組織來預測患者的生存率。高危組的晚期生存率明顯低于低危組[28]。Yu 等[29] 的研究將 Cox 比例危險模型用于分析與 TCGA 患者生存結局相關的肺腺癌和鱗狀細胞癌的 HE 染色特征。
5 結語
綜上所述,基于人工智能的肺癌病理形態學分析已顯示出良好的性能和巨大的潛力。人工智能是邁向精準病理學的橋梁。在一些任務中,人工智能的某些表現可以與病理學專家相媲美,但目前人工智能在病理學中的應用還處于起步階段,仍然存在局限性和很多挑戰。這些局限性主要體現在:(1)圖像數據的質量問題,由于標本處理和切片染色的異質性,缺少權威的肺癌病理學圖像數據庫可能會影響人工智能系統的診斷性能;(2)人工智能系統目前還無法解決一些復雜的病理診斷問題,尤其是良性與惡性的鑒別,其它如病理的分級,脈管內癌栓的識別,周圍組織的累犯情況等,基于病理圖像數據預測腫瘤的基因突變狀態與臨床分子檢測相比,其敏感性和特異性仍然相對較低;(3)數字病理切片掃描儀、圖像存儲、圖像分析軟件和支持系統的成本很高,目前難以普遍應用。目前基于人工智能的肺癌病理診斷還不能直接用于臨床工作,但是隨著人工智能技術和圖像識別技術的發展,隨著科學研究的不斷深入和完善,相信人工智能可以輔助病理醫生精準診斷,輔助臨床醫生做出精準治療決策,精準病理學時代的大門即將打開。
利益沖突:無。
作者貢獻:馮時負責查閱文獻、數據整理與分析、論文初稿撰寫與修改;滕曉東負責論文設計與審校。
肺癌是世界范圍內致人死亡的主要疾病,對個人、家庭乃至社會,都帶來了沉重的心理負擔及經濟負擔。最新公布的全球癌癥數據(GLOBOCAN 2018)顯示,肺癌的發病率很高,全球新增肺癌病例 209.4 萬例,占所有新發癌癥的 11.6 %。同時有 180 萬例死亡,占所有癌癥病例的 18.4 %[1]。盡管在診斷和治療方面取得了很大進展,5 年腫瘤相關死亡率為 17.7%[2]。而且肺癌的病情進展和治療反應在不同的患者中差異很大,準確診斷對肺癌患者的治療選擇至關重要,是實現精準醫療的關鍵。組織病理學圖像是肺癌診斷的金標準,也是其治療的基石。隨著個體化精準治療的需求,對肺癌組織病理診斷準確性的要求日益提高。然而病理診斷需要病理學家在高度復雜的組織圖像中識別細微的病理學改變,這一過程耗時并且相對主觀,容易產生觀察者之間的差異性;目前世界大多數國家和地區都面臨著病理學家人數短缺的問題。隨著數字化全切片成像(whole slide imaging,WSI)技術的應用,使病理圖像數字化得以在計算機視覺和人工智能中應用,病理診斷進入了數字病理時代。本文綜述了人工智能在病理圖像分析技術中的最新進展和在診斷病理學中的應用。
1 深度學習的基本概念和發展
人工智能(artificial intelligence,AI)是一個總括術語,是一種計算機模擬人類某些思維過程和智能行為(如學習、推理、思考、計劃等)的方法[3]。機器學習是人工智能的一個分支,它應用統計方法為特定任務優化模型,而不依賴于特定的人為指導來定義模型中的所有規則或參數。機器學習的發展經歷了兩個階段,分別是早期的人工神經網絡(artificial neural network,ANN)和新興的深度學習(deep learning)[4]。早期的 ANN 圖像分析算法分類依賴于:(1)手工的圖像分割;(2)多名熟練的專業診斷人員和大量的時間對圖像手工標注;(3)使用專門為每類對象設計的統計分類器或淺神經計算機器學習分類器識別每個分割的對象;傳統的 ANN 圖像分類效率及準確度較低。深度學習是一種非線性的多層特征學習模型,通過自動檢測原始數據(如像素、字符等)的特征信息并進行分類,然后按照非線性模塊化的方式學習到多個層次上的特征,再進行逐步簡化及整合并產生最終結果[5]。卷積神經網絡(convolutional neural network,CNN)是深度學習在圖像處理領域最突出的技術。CNN 的發展使得圖像分類和檢測圖像中對象的能力顯著提高。CNN 應用圖像分析過濾器或卷積的多個處理層,每層圖像的抽象表示是通過在圖像上系統的卷積多個過濾器來構建的,生成一個用作下一層輸入的特征映射。這種體系結構使得以像素形式處理圖像作為輸入并將所需分類作為輸出成為可能[6]。與傳統的特征提取方法相比,CNN 具有兩個優點:(1)使用 CNN 圖像分類對于不同照明條件、不同形態、存在部分遮擋、水平和垂直偏倚等畸變圖像因素具有魯棒性;(2)相對于傳統的特征提取 CNN 的計算成本較低,準確度較高。
隨著人工智能的發展,使圖像信息轉變為數據進行量化和客觀分析測量成為可能。人工智能有潛力快速分析大量圖像數據,對人類病理學專家診斷困難的病例進行分類,徹底改變傳統的診斷方式和疾病管理。病理圖像是人工智能的絕佳應用場景。基于 CNN 的研究在圖像識別上已顯示出其優勢,在許多病理圖像識別分類任務中達到接近甚至超越病理學家診斷的水平。美國斯坦福大學的學者用 CNN 對皮膚癌進行了分類,直接從圖像進行端-端訓練,只用像素和疾病標簽作為輸入,研究了皮膚癌的人工智能檢測模型,通過與皮膚科病理學專家的診斷比較,其特異度和靈敏度均得到了認可[7]。另外許多學者用深度學習技術開展基因組學、蛋白質組學、組織病理學及預后風險評估等。通過對癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數據庫中乳腺癌患者 RNA 測序結果的研究發現深度學習可用于處理腫瘤基因檢測復雜的數據[8]。Litjens 等[9]的研究驗證了深度學習在前列腺癌診斷和乳腺癌轉移檢測中的出色表現。Ertosun 等[10]研究了一種使用深度學習對膠質瘤進行自動分級的系統。深度學習逐漸被應用到新的領域,包括肺癌病理學。傳統肺癌的病理診斷主要由臨床病理學家承擔。由于有許多機械性的重復性任務,所以閱片既費時又低效,圖像信息具有很強的主觀性,難以量化。目前的研究表明,基于深度學習的肺癌病理學圖像分析通過定性或定量分析病理切片的細胞形態、組織學紋理特征、分布特征和特異分子的免疫組化染色強度等腫瘤信息,克服了這些缺點。它具有巨大的應用潛力,有望改變未來肺癌病理診斷的臨床工作流程。
2 深度學習在肺癌病理分型中的應用
肺癌主要分為非小細胞肺癌(non-small cell lung cancer,NSCLC)和小細胞肺癌(small cell lung cancer,SCLC),大約 80%~85% 的肺癌類型是NSCLC[11]。NSCLC 可分為三種主要的組織學類型:鱗狀細胞癌、腺癌和大細胞癌。由于兩種肺癌的治療方法有很大的差異,準確劃分肺癌的病例類型在臨床工作中非常重要。深度學習可以幫助病理學家檢測肺癌的類型。
氣管鏡脫落細胞學檢查有助于肺癌的早期診斷,而且能區分肺癌的病理類型。Teramoto 等[12]分析了 76 例肺癌(包括鱗狀細胞癌、腺癌和小細胞癌)的細胞學圖像,利用訓練后的 CNN 模型進行特征提取判斷腫瘤類型獲得了 71.1% 的準確度,與細胞病理學家的分類結果相當。Khosravi 等[13]設計了一種新型的微調預訓練 CNN 模型,可以在 100% 高分辨率局部放大圖像中區分鱗狀細胞癌和腺癌,準確度為 75%~90%。Coudray 等[14]將癌癥基因組圖譜 TCGA 數據庫 1 634 張切片圖像(1 176 例腫瘤組織和 459 例正常組織)隨機分為訓練集(70%)、驗證集(15%)和測試集(15%),用大量的圖像分割數據 訓練 inception-v3,采用了遷移學習并在獨立的數據集中進行了驗證和測試,根據圖像形態特征輸出正常組織、鱗狀細胞癌和腺癌三種結果,表現出了與病理學家的診斷相當的高性能,準確度達 97%。Wang 等[15]在 EfcientNet-B3 結構的基礎上利用遷移學習和弱監督學習訓練了 CNN,區別肺癌和非腫瘤的準確度達到了 97.4% 以上。
肺腺癌在臨床、放射學、分子學和病理學特征上具有顯著的異質性[16]。根據生長模式和形態,肺腺癌可進一步分為原位腺癌、微浸潤性腺癌、貼壁生長腺癌、腺泡性腺癌、乳頭狀腺癌、微乳頭狀腺癌、實性腺癌等[17]。這些亞型的肺腺癌具有不同的預后結果[18]和治療反應[19]。雖然對肺腺癌的亞型進行了廣泛的研究,但是由于病理學家之間缺乏一致性以及同一患者在一張或多張切片中存在多種形態亞型,所以亞型的分類對病理學家來說仍然是一個挑戰。為了準確診斷需要量化每種類型的比例,這項任務耗時而且缺乏準確性。目前深度學習在肺癌病理分型中的研究多集中于鱗狀細胞癌和腺癌的分類,對于肺腺癌亞型的分型研究較少。Wei 等[20]首次嘗試了深度學習技術在肺腺癌切片上對組織學亞型進行自動分類,他們使用 CNN 來識別腫瘤區域,然后聚集這些分類推斷整張圖像的主要和次要組織學模式,并在一組獨立的數據集(143 例)中評估了模型的效能,其結果和三位病理學家的判讀結果相當。
3 深度學習對肺癌突變基因的預測
在臨床實踐中,統一病理亞型的腫瘤在分子水平上可能有很大的差異,因此對治療的反應也不同。在 NSCLC 中具有預后/預測意義的基因改變包括 EGFR 基因突變或 ALK 基因重排等。EGFR 的突變狀態是選擇相應靶向治療的關鍵[21]。Coudray 等[14]在另一組實驗中使用深度學習技術區分肺腺癌標本中的基因突變。他們使用 TCGA 肺腺癌組織病理學圖像中的大量圖像數據訓練 inception-v3,根據基因測序結果,輸入模型提取突變相關的形態學特征。并在驗證集和測試集對模型進行驗證和測試,然后輸入測試圖像。對模型進行自動分析后,根據圖像的形態特征,成功地預測了肺腺癌 6 個常見突變基因:STK11、EGFR、FAT1、SETBP1、KRAS 和 TP53。預測 EGFR 突變的工作特征曲線下面積(AUC) 達到 0.83。在獨立的數據集中驗證了模型的通用性,AUC 可能達到 0.75。使用該模型只需輸入 HE 染色圖像即可初步預測基因突變,具有成本低、效率高的優點。
4 深度學習在肺癌預后中的應用
數字病理學最重要的應用之一是根據病理組織形態學表型來預測患者的預后和對治療的反應,以促進精準的醫學治療。雖然特定的病理特征,如上述的肺癌分類和亞型已經被報道為重要的預后因素,但直接將病理圖像與生存結局聯系起來仍然是一個很大的挑戰。計算機輔助診斷(computer aided diagnosis,CAD)可以對肺癌的 TNM 分期做出補充,提供預后信息,具有簡便、快速的優點,對肺癌的臨床診斷和治療具有重要的意義。深度學習可以獲得對肺癌患者預后有用的定量信息。
Li 等[22]利用訓練好的 CNN 將 205 例 NSCLC 患者的病理圖像轉化為淋巴細胞、腫瘤細胞和間質細胞的分布圖,然后用 Bayesian hidden Potts 混合模型有效地融合和觀察多個特征信息。當模型輸入到細胞分布圖中時,可以輸出代表細胞間相互作用強度的參數,并可以量化腫瘤細胞、間質細胞和淋巴細胞之間的相互作用。Cox 回歸模型分析顯示腫瘤細胞與間質細胞相互作用的強度與患者的良好預后顯著相關(P=0.005)。Choi 等[23]對 510 例肺腺癌患者的臨床病理資料進行基因表達綜合訓練,驗證基因共表達網絡。根據輸出的基因譜,選擇與患者生存最密切相關的 20 個代表性基因輸入 CNN 模型。根據提取的各種基因的表達模式,導出風險分層模型,比傳統的 Cox 比例風險模型更具預測性,有助于識別需要新輔助化療的患者。
Mezheyeuski 等[24]采用基于深度學習的多種成像系統對 57 例 NSCLC 患者免疫細胞的重要亞型進行定量定位,定量分析與預后相關的免疫細胞浸潤模式。結果表明,淋巴細胞類型越豐富,腫瘤巢中細胞毒性 T 細胞占其基質的比例越高,同一區域內調節性 T 細胞與效應性 T 細胞的比例越大,CD8 陽性調節性 T 細胞聚集在腫瘤周圍的數量較少,腫瘤患者預后越好。但由于數據量小,缺乏代表性,這一結論還需進一步驗證。微血管密度(microvessel density,MVD)通常作為血管生成的替代指標。MVD 是NSCLC的重要預后因素[25]。Yi 等[26]將病理學家在組織病理學 HE 染色圖像中手工標記的微血管相關特征作為訓練集。訓練好的 FCN 經過微調后,生成最終的 FCN 模型,量化了微血管的特性。通過輸入病理 HE 染色圖像,可以輸出微血管總面積和微血管周圍腫瘤細胞的百分比,應用微血管染色抗體勾畫微血管,可顯著提高模型的自動化程度。Wang 等[27]開發了一個名為 ConvPath 自動細胞分類的模型,在訓練數據集和獨立測試數據集中對肺腺癌的腫瘤細胞、間質細胞和淋巴細胞進行分類,準確率分別高達 92.9% 和 90.1%。ConvPath 根據不同類型細胞的空間分布特征,輸出腫瘤的微環境特征,被證明是肺腺癌的獨立預后因素。他們的另一項基于深度學習的分析方法可以通過分析 48 個肺腺癌 HE 染色圖像的空間組織來預測患者的生存率。高危組的晚期生存率明顯低于低危組[28]。Yu 等[29] 的研究將 Cox 比例危險模型用于分析與 TCGA 患者生存結局相關的肺腺癌和鱗狀細胞癌的 HE 染色特征。
5 結語
綜上所述,基于人工智能的肺癌病理形態學分析已顯示出良好的性能和巨大的潛力。人工智能是邁向精準病理學的橋梁。在一些任務中,人工智能的某些表現可以與病理學專家相媲美,但目前人工智能在病理學中的應用還處于起步階段,仍然存在局限性和很多挑戰。這些局限性主要體現在:(1)圖像數據的質量問題,由于標本處理和切片染色的異質性,缺少權威的肺癌病理學圖像數據庫可能會影響人工智能系統的診斷性能;(2)人工智能系統目前還無法解決一些復雜的病理診斷問題,尤其是良性與惡性的鑒別,其它如病理的分級,脈管內癌栓的識別,周圍組織的累犯情況等,基于病理圖像數據預測腫瘤的基因突變狀態與臨床分子檢測相比,其敏感性和特異性仍然相對較低;(3)數字病理切片掃描儀、圖像存儲、圖像分析軟件和支持系統的成本很高,目前難以普遍應用。目前基于人工智能的肺癌病理診斷還不能直接用于臨床工作,但是隨著人工智能技術和圖像識別技術的發展,隨著科學研究的不斷深入和完善,相信人工智能可以輔助病理醫生精準診斷,輔助臨床醫生做出精準治療決策,精準病理學時代的大門即將打開。
利益沖突:無。
作者貢獻:馮時負責查閱文獻、數據整理與分析、論文初稿撰寫與修改;滕曉東負責論文設計與審校。