組織學病理是臨床疾病診斷的金標準。全視野數字切片(whole slide image,WSI)的出現,雖彌補了傳統的玻璃切片易損壞、檢索困難以及診斷可重復性差的不足,但同時也帶來了巨大的工作量。人工智能(artificial intelligence,AI)輔助病理醫師的 WSI 分析,可解決工作效率低,提高診斷的一致性。其中,以深度學習卷積神經網絡(convolution neural network,CNN)算法的應用最為廣泛。本文綜述目前已報道的 CNN 在 WSI 圖像分析中的應用情況,總結 CNN 在病理學領域中的發展趨勢并作出展望。
引用本文: 趙蒙蒙, 汪洋, 鄧家駿, 佘云浪, 陳昶. 人工智能卷積神經網絡在全視野數字切片圖像分析中的應用進展. 中國胸心血管外科臨床雜志, 2019, 26(11): 1063-1068. doi: 10.7507/1007-4848.201908034 復制
目前組織病理學診斷依舊是臨床腫瘤診斷的金標準。但由于疾病譜系和腫瘤治療手段的不斷更新,傳統玻璃切片由于易損壞、難復制等因素已經無法滿足臨床需求。隨著計算機設備和數字化影像設備的飛速發展,全視野數字切片(whole slide image,WSI)迅速出現在醫學領域中,彌補傳統玻璃切片缺陷同時也帶來了巨大工作量。基于此,人工智能(artificial intelligence,AI)輔助病理醫師進行 WSI 分析不僅可以提高診斷一致性,還大大減少了臨床病理醫生工作量的優勢引來了臨床醫生的關注,其中以深度學習卷積神經網絡(convolution neural network,CNN)算法應用最為廣泛。
1 全視野數字切片
WSI 是利用數字掃描儀對傳統的病理片掃描,采集具有高分辨率的數字圖像,再通過計算機將得到的碎片化圖像進行無縫拼接整合,制作可視化數字圖像的一項技術[1]。應用特定瀏覽器對數字圖像進行任意比例下放大縮小、任意方向的移動瀏覽,并做進一步分析,所以 WSI 也被稱為“虛擬顯微鏡”[2]。與傳統載玻片相比,WSI 在切片的保存管理、教學、遠程診斷、圖像可重復性等方面具有諸多優勢[3-6],很好地解決了傳統的玻璃切片易損壞、易褪色、易丟片、檢索困難的問題。利用 WSI 也可創建大數據病理庫,輕松實現任何時間、任何地點、任何病理醫師的共同讀片,為切片的定量分析、后期標注提供條件。有研究[7-8]顯示,利用數字病理切片進行的遠程診斷和傳統顯微鏡讀片診斷一致性很高。Massone 等[9]利用虛擬幻燈片系統掃描了 46 例患者的炎癥性皮膚病活檢標本,邀請來自 6 個國家 12 位遠程讀片人員共同診斷。結果表明,與常規的病理診斷相比,利用數字病理切片遠程診斷有 73% 的一致性。
但掃描圖像信息量巨大,WSI 也具有一定的局限性[4, 10-13]。若缺乏足夠高標準的識別系統支持,圖像模糊失真導致細節無法檢測識別,會影響診斷的準確性,因此需要不斷改進掃描儀器獲取精細全面的圖像;另外在數字病理切片中,具有診斷價值的細胞分布廣泛,其精細形態需要花費更多的時間和精力去確認,增加了臨床工作負擔。因此,WSI 在臨床工作中并沒有得到病理醫師們的青睞。如何克服 WSI 的局限性,利用其攜帶的數據信息,推動病理學領域的發展,是目前很多專家學者關心的熱點問題
2 人工智能深度學習CNN在 WSI 圖像分析中的應用
CNN 是 AI 機器學習分支之一,它是利用多層處理網絡對需要分析的圖片進行特征提取和轉換,將前一層的輸出信息作為下一層的輸入信息,逐層分析并以有或無監督的方式學習,最終輸出精準識別的結果[14]。近期有研究指出:人工智能深度學習 CNN 可直接提取圖像深層特征信息,并自動學習訓練模型[15]。現已廣泛應用于臨床醫學圖像分析中,包括甲狀腺癌篩查[16]、皮膚癌診斷[17]、眼底圖像的異常篩查[18]、基因突變的預測[19-20]等。訓練后的 CNN 模型可以不受專業因素的限制,全面而準確地獲取病理切片的特征,適合大數據的 WSI 圖像分析[21],應用范圍包括腫瘤組織病理學分型區分、淋巴結轉移細胞檢測、腫瘤患者預后預測等。
2.1 腫癌組織病理學分型區分
對癌癥的組織病理學分型做出準確的判斷是決策患者個體化治療方案、術后隨訪策略的重要前提。國內外很多回顧性研究表明利用 CNN 模型可以鑒別 WSI 中病灶的良惡性。Campanella 等[22]將 12 160 張前列腺穿刺活檢標本切片分為訓練集(70%)、驗證集(15%)和測試集(15%),訓練并測試 CNN 模型鑒別前列腺病灶良惡性,準確度達到 0.98;Kwak 等[23]利用 5 個組織微陣列共 875 張 WSI,包括 365 個良性組織切片和 507 張腫瘤組織切片訓練 CNN 模型,發現利用 CNN 模型鑒別 5 組前列腺病灶良惡性的準確率分別是≥0.97、0.98、0.97、0.98、0.97;Triki 等[24]利用深度神經網絡模型對 4 921 例乳腺癌冰凍切片切緣陽性率鑒別準確率可達到 0.95;另外,Garud 等[25]通過 175 張 WSI 訓練測試 CNN 模型鑒別乳腺癌良惡性的可靠性,研究結論顯示,準確率可達 0.89。2019 年 3 月 Ha 等[26]通過收集 149 例患者的 298 幅乳腺鉬靶圖像,隨機分為訓練和驗證組(80% 患者)和測試組(20% 患者),測試 CNN 鑒別分單純不典型導管增生和導管原位癌,結果表明測試集的受試者工作特征曲線下面積(AUC)值為 0.86,總敏感性和特異性分別為 84.6% 和 88.2%,而總的診斷準確率為 86.7%,說明利用 CNN 模型鑒別乳腺癌中不典型導管增生和導管原位腺癌是可行的。同年 8 月 Mercan 等[27]研究證明以計算機為基礎的乳腺病理診斷方法顯示了良好的應用前景,特別是在鑒別導管原位癌與不典型增生的診斷上。
在肺癌領域,CNN 模型也受到廣泛的關注和應用。2018 年 Coudray 等[19]利用來自國際 TCGA 數據庫中有關肺癌共 1 635 個樣本,訓練測試 CNN 模型鑒別腺癌、鱗癌以及識別基因突變的準確率,結果顯示,經訓練的 CNN 模型鑒別肺腺癌、鱗癌的 AUC 為 0.97,識別 STK11 突變的 AUC 為 0.85;2019 年 Gertych 等[28]同樣利用 CNN 模型成功鑒別肺腺癌亞型,包括實性成分為主、微乳頭成分為主、腺泡樣成分為主、篩狀以及非瘤組織,表現最好的 CNN 模型 F1 得分分別為 0.91、0.76、0.74、0.6 和 0.96。同年 Wei 等[29]將 422 張 WSI 隨機分為訓練集(245)、發展集(34)及測試集(143)訓練測試 CNN 算法模型識別肺腺癌的 5 種亞型:貼壁型、腺泡樣、乳頭狀、微乳頭狀、實性成分為主以及良性組織的能力,結果顯示經訓練的 CNN 模型識別貼壁型、腺泡樣、乳頭狀、微乳頭狀、實性成分為主肺腺癌以及良性組織的 AUC 分別為 0.988、0.970、0.993、0.981、0.997 及 0.988;同時本研究將訓練后的 CNN 算法模型診斷能力和 3 位病理學家診斷結果進行對比,結果顯示,兩者之間診斷一致性為 66.6%;有文獻報道了病理學家之間對于良性痣和惡性黑色素瘤有 25%~26% 的診斷不一致性[30],Hekler等[31]利用 695 張 WSI 訓練測試 CNN 算法模型,證明利用人工智能輔助工具,可以將良性痣診斷誤差降到 20%,惡性黑色素瘤診斷誤差降到 18%。除此之外,有報道顯示 CNN 模型在腦部腫瘤、宮頸癌、神經母細胞瘤以及食管癌前病變病灶良惡性鑒別任務中,也擁有較高的可信度。另外值得注意的是 2019 年 7 月 Campanella 等[32]為了克服傳統的深度學習技術分析病理切片需要人工標注的缺點,開發了由 CNN、MIL(multiple instance learning)和 RNN(recurrent neural network)組成的復合性神經網絡,收集關于前列腺癌、皮膚癌數據集測試這種模型鑒別病灶良惡性的性能,結果證明這種新型神經網絡模型可以在弱監督的條件下準確區分前列腺癌、基底細胞癌,準確性可以達到 0.989、0.990;見表 1。

2.2 淋巴結轉移細胞檢測
淋巴結轉移是影響腫瘤患者總生存期(OS)、無病生存期(DFS)和復發率(RR)的因素之一。準確檢測淋巴結轉移細胞可以為癌癥分期、手術方案的制訂以及預后分析提供重要依據。目前有文獻報道利用深度學習 CNN 輔助技術已經可以較好地輔助病理醫師提高數字切片中淋巴結轉移細胞的檢出率。Litjens 等[38]將 CNN 模型應用于兩個任務:前列腺活檢標本中腫瘤細胞的檢測、手術切除前哨淋巴結中乳腺癌轉移細胞的檢測,以此探討 CNN 模型在提高 WSI 中腫瘤病灶的診斷效率。研究共納入了 254 例患者前列腺穿刺活檢標本、271 例患者的術后前哨淋巴結標本,隨機分為測試集、驗證集、訓練集,結果顯示經訓練的 CNN 模型識別前列腺腫瘤細胞、鑒別前哨淋巴結中乳腺癌微轉移和轉移細胞的準確度可分別達到 0.99、0.90。
2015 年 11 月至 2016 年 11 月舉行的國際 CAMELYON16 大賽收集來自兩個臨床中心的電子病理切片數據共 399 張 WSI,分為測試集(270)、訓練集(129),測試 CNN 模型識別乳腺癌標本中淋巴結轉移細胞存在的準確率,同時邀請了 12 位病理學家,分為時間限制組(2 h,11 位)、無時間限制組(1 位)進行對照[39]。來自 23 個團隊共 32 種 CNN 模型參賽,大賽結果顯示,表現最好的 CNN 模型識別淋巴結轉移細胞的 AUC 達 0.994,顯著優于時間限制組的病理醫師(0.810);Li 等[40]提出一個由 CNN 和 CRF(conditional random field)組成的神經條件隨機場(NCRF),在 CAMELYON16數據集基礎上納入 400 張 WSI 供其訓練并測試,結果顯示,NCRF 識別乳腺癌淋巴結轉移細胞準確度可以達到 0.938;David 等[41]研究顯示,比起單獨算法診斷或獨立病理學家,CNN 算法輔助下的病理學家識別淋巴結乳腺癌轉移細胞準確度更高,時間更短;另外算法輔助下還可以提高淋巴結微轉移的靈敏度(0.91,算法輔助;0.83,無算法輔助)。Campanella 等[32]也證明利用 CNN、MIL 和 RNN 組成的復合神經網絡模型可以在弱監督情況下準確識別乳腺癌淋巴結轉移細胞,準確率可達 0.965;見表 2。

2.3 腫瘤患者預后的預測
病理診斷明確預后因子是指導腫瘤患者個體化治療的關鍵。表 3 中我們歸納了近年來利用人工智能技術預測腫瘤預后的實踐進展。Kather 等[42]利用經訓練的 CNN 模型對來自 TCGA 數據庫中 500 例Ⅰ~Ⅳ 期結直腸癌(CRC)患者的 862 張 WSI 圖像進行自動識別,提出“deep stroma score”是 CRC 患者一個獨立的預后預測因子;并在來自德國 DACHS 隊列中 409 例Ⅰ~Ⅳ期 CRC 患者研究中進行驗證,證明“deep stroma score”是結直腸癌患者 OS、CRC 特異性 OS 和無復發生存率(RFS)的獨立預后因素,結果提示 CNN 算法可直接從組織病理學圖像評價腫瘤微環境并預測預后。Veta 等[43]組織 TUPAC16 比賽(tumor proliferation assessment challenge 2016),利用 821 張乳腺癌 WSI 測試 CNN 算法模型完成自動檢測細胞有絲分裂、預測基于 PAM50 增殖評分的基因表達兩個任務,以此評估乳腺癌增殖情況判斷患者預后,12 個隊伍提交了第一個任務的結果、6 個隊伍提交了第二個任務的結果,最終結果顯示表現最好的 CNN 算法模型完成以上兩個任務的 Kappa 值分別為 0.567、0.617。

Harder 等[44]研究納入 31 例患有Ⅳ期惡性黑色素瘤的患者,利用 CNN 算法識別病理圖像特征,預測可以從 ipilimumab(抗 CTLA-4 抗體)免疫治療中獲益的患者人群,研究結果顯示 CNN 算法模型區分病理切片中 CD3+、黑色素及非特異性染色的準確率可以分別達到 99.4%、96.0% 和 99%;Zhou 等[45]利用 TCGA 數據庫中 368 張 WSI 測試 CNN 算法性能,證明經訓練后的 CNN 模型可通過區分前列腺癌分級預測患者預后,可靠度達 75%;Yu 等[46]的研究中納入從 TCGA 數據庫中獲得的 2 186 張肺癌 WSI 圖像和 TMA 數據庫中的 294 張附加圖像,利用機器學習算法提取圖像特征,有效地將短期幸存者與Ⅰ期腺癌或鱗狀細胞癌的長期幸存者區分開,研究結果表明,利用機器學習算法自動獲得的圖像特征可以預測肺癌患者的預后,從而有助于精確的腫瘤診斷。Beck 等[39]開發并利用 C-Path(computational pathologist)系統收集乳腺癌上皮和基質的定量特征集(6 642 個特征),構建乳腺癌預后預測模型。該模型應用于兩個乳腺癌患者獨立隊列,共 576 例患者的病理圖像分析,證明 C-Path 生成的預后模型評分與隊列中患者 OS 密切相關,顯微基質結構是乳腺癌的一個獨立的預后因素。除此之外,CNN 算法在腦部腫瘤、濾泡性淋巴瘤等腫瘤患者預后方面也可以進行有效預測;見表 3。
3 總結和展望
組織病理學診斷仍然是目前腫瘤診斷的“金標準”。利用數字病理切片建立大容量病理數據庫,可以方便更多的遠程診斷人員共同讀片,降低誤診率也提高了工作效率。目前的臨床實踐證明,利用 WSI,深度學習 CNN 模型可以有效地區分腫瘤組織病理學分型、檢測淋巴結轉移細胞,并預測腫瘤患者預后情況。但由于腫瘤異質性、病理圖像可視化特征難尋、數據集有限等限制,CNN 模型輔助病理診斷在臨床上的應用還十分有限。如何開拓 CNN 模型在腫瘤領域更多層次的利用,挖掘其更大的潛力,提高其臨床適用性還有待探究。我們堅信,在人工智能算法的幫助下,病理切片的計算機輔助診斷知識體系將不斷完善,最終能夠為患者提供精準的治療指導和預后信息。
利益沖突:無。
目前組織病理學診斷依舊是臨床腫瘤診斷的金標準。但由于疾病譜系和腫瘤治療手段的不斷更新,傳統玻璃切片由于易損壞、難復制等因素已經無法滿足臨床需求。隨著計算機設備和數字化影像設備的飛速發展,全視野數字切片(whole slide image,WSI)迅速出現在醫學領域中,彌補傳統玻璃切片缺陷同時也帶來了巨大工作量。基于此,人工智能(artificial intelligence,AI)輔助病理醫師進行 WSI 分析不僅可以提高診斷一致性,還大大減少了臨床病理醫生工作量的優勢引來了臨床醫生的關注,其中以深度學習卷積神經網絡(convolution neural network,CNN)算法應用最為廣泛。
1 全視野數字切片
WSI 是利用數字掃描儀對傳統的病理片掃描,采集具有高分辨率的數字圖像,再通過計算機將得到的碎片化圖像進行無縫拼接整合,制作可視化數字圖像的一項技術[1]。應用特定瀏覽器對數字圖像進行任意比例下放大縮小、任意方向的移動瀏覽,并做進一步分析,所以 WSI 也被稱為“虛擬顯微鏡”[2]。與傳統載玻片相比,WSI 在切片的保存管理、教學、遠程診斷、圖像可重復性等方面具有諸多優勢[3-6],很好地解決了傳統的玻璃切片易損壞、易褪色、易丟片、檢索困難的問題。利用 WSI 也可創建大數據病理庫,輕松實現任何時間、任何地點、任何病理醫師的共同讀片,為切片的定量分析、后期標注提供條件。有研究[7-8]顯示,利用數字病理切片進行的遠程診斷和傳統顯微鏡讀片診斷一致性很高。Massone 等[9]利用虛擬幻燈片系統掃描了 46 例患者的炎癥性皮膚病活檢標本,邀請來自 6 個國家 12 位遠程讀片人員共同診斷。結果表明,與常規的病理診斷相比,利用數字病理切片遠程診斷有 73% 的一致性。
但掃描圖像信息量巨大,WSI 也具有一定的局限性[4, 10-13]。若缺乏足夠高標準的識別系統支持,圖像模糊失真導致細節無法檢測識別,會影響診斷的準確性,因此需要不斷改進掃描儀器獲取精細全面的圖像;另外在數字病理切片中,具有診斷價值的細胞分布廣泛,其精細形態需要花費更多的時間和精力去確認,增加了臨床工作負擔。因此,WSI 在臨床工作中并沒有得到病理醫師們的青睞。如何克服 WSI 的局限性,利用其攜帶的數據信息,推動病理學領域的發展,是目前很多專家學者關心的熱點問題
2 人工智能深度學習CNN在 WSI 圖像分析中的應用
CNN 是 AI 機器學習分支之一,它是利用多層處理網絡對需要分析的圖片進行特征提取和轉換,將前一層的輸出信息作為下一層的輸入信息,逐層分析并以有或無監督的方式學習,最終輸出精準識別的結果[14]。近期有研究指出:人工智能深度學習 CNN 可直接提取圖像深層特征信息,并自動學習訓練模型[15]。現已廣泛應用于臨床醫學圖像分析中,包括甲狀腺癌篩查[16]、皮膚癌診斷[17]、眼底圖像的異常篩查[18]、基因突變的預測[19-20]等。訓練后的 CNN 模型可以不受專業因素的限制,全面而準確地獲取病理切片的特征,適合大數據的 WSI 圖像分析[21],應用范圍包括腫瘤組織病理學分型區分、淋巴結轉移細胞檢測、腫瘤患者預后預測等。
2.1 腫癌組織病理學分型區分
對癌癥的組織病理學分型做出準確的判斷是決策患者個體化治療方案、術后隨訪策略的重要前提。國內外很多回顧性研究表明利用 CNN 模型可以鑒別 WSI 中病灶的良惡性。Campanella 等[22]將 12 160 張前列腺穿刺活檢標本切片分為訓練集(70%)、驗證集(15%)和測試集(15%),訓練并測試 CNN 模型鑒別前列腺病灶良惡性,準確度達到 0.98;Kwak 等[23]利用 5 個組織微陣列共 875 張 WSI,包括 365 個良性組織切片和 507 張腫瘤組織切片訓練 CNN 模型,發現利用 CNN 模型鑒別 5 組前列腺病灶良惡性的準確率分別是≥0.97、0.98、0.97、0.98、0.97;Triki 等[24]利用深度神經網絡模型對 4 921 例乳腺癌冰凍切片切緣陽性率鑒別準確率可達到 0.95;另外,Garud 等[25]通過 175 張 WSI 訓練測試 CNN 模型鑒別乳腺癌良惡性的可靠性,研究結論顯示,準確率可達 0.89。2019 年 3 月 Ha 等[26]通過收集 149 例患者的 298 幅乳腺鉬靶圖像,隨機分為訓練和驗證組(80% 患者)和測試組(20% 患者),測試 CNN 鑒別分單純不典型導管增生和導管原位癌,結果表明測試集的受試者工作特征曲線下面積(AUC)值為 0.86,總敏感性和特異性分別為 84.6% 和 88.2%,而總的診斷準確率為 86.7%,說明利用 CNN 模型鑒別乳腺癌中不典型導管增生和導管原位腺癌是可行的。同年 8 月 Mercan 等[27]研究證明以計算機為基礎的乳腺病理診斷方法顯示了良好的應用前景,特別是在鑒別導管原位癌與不典型增生的診斷上。
在肺癌領域,CNN 模型也受到廣泛的關注和應用。2018 年 Coudray 等[19]利用來自國際 TCGA 數據庫中有關肺癌共 1 635 個樣本,訓練測試 CNN 模型鑒別腺癌、鱗癌以及識別基因突變的準確率,結果顯示,經訓練的 CNN 模型鑒別肺腺癌、鱗癌的 AUC 為 0.97,識別 STK11 突變的 AUC 為 0.85;2019 年 Gertych 等[28]同樣利用 CNN 模型成功鑒別肺腺癌亞型,包括實性成分為主、微乳頭成分為主、腺泡樣成分為主、篩狀以及非瘤組織,表現最好的 CNN 模型 F1 得分分別為 0.91、0.76、0.74、0.6 和 0.96。同年 Wei 等[29]將 422 張 WSI 隨機分為訓練集(245)、發展集(34)及測試集(143)訓練測試 CNN 算法模型識別肺腺癌的 5 種亞型:貼壁型、腺泡樣、乳頭狀、微乳頭狀、實性成分為主以及良性組織的能力,結果顯示經訓練的 CNN 模型識別貼壁型、腺泡樣、乳頭狀、微乳頭狀、實性成分為主肺腺癌以及良性組織的 AUC 分別為 0.988、0.970、0.993、0.981、0.997 及 0.988;同時本研究將訓練后的 CNN 算法模型診斷能力和 3 位病理學家診斷結果進行對比,結果顯示,兩者之間診斷一致性為 66.6%;有文獻報道了病理學家之間對于良性痣和惡性黑色素瘤有 25%~26% 的診斷不一致性[30],Hekler等[31]利用 695 張 WSI 訓練測試 CNN 算法模型,證明利用人工智能輔助工具,可以將良性痣診斷誤差降到 20%,惡性黑色素瘤診斷誤差降到 18%。除此之外,有報道顯示 CNN 模型在腦部腫瘤、宮頸癌、神經母細胞瘤以及食管癌前病變病灶良惡性鑒別任務中,也擁有較高的可信度。另外值得注意的是 2019 年 7 月 Campanella 等[32]為了克服傳統的深度學習技術分析病理切片需要人工標注的缺點,開發了由 CNN、MIL(multiple instance learning)和 RNN(recurrent neural network)組成的復合性神經網絡,收集關于前列腺癌、皮膚癌數據集測試這種模型鑒別病灶良惡性的性能,結果證明這種新型神經網絡模型可以在弱監督的條件下準確區分前列腺癌、基底細胞癌,準確性可以達到 0.989、0.990;見表 1。

2.2 淋巴結轉移細胞檢測
淋巴結轉移是影響腫瘤患者總生存期(OS)、無病生存期(DFS)和復發率(RR)的因素之一。準確檢測淋巴結轉移細胞可以為癌癥分期、手術方案的制訂以及預后分析提供重要依據。目前有文獻報道利用深度學習 CNN 輔助技術已經可以較好地輔助病理醫師提高數字切片中淋巴結轉移細胞的檢出率。Litjens 等[38]將 CNN 模型應用于兩個任務:前列腺活檢標本中腫瘤細胞的檢測、手術切除前哨淋巴結中乳腺癌轉移細胞的檢測,以此探討 CNN 模型在提高 WSI 中腫瘤病灶的診斷效率。研究共納入了 254 例患者前列腺穿刺活檢標本、271 例患者的術后前哨淋巴結標本,隨機分為測試集、驗證集、訓練集,結果顯示經訓練的 CNN 模型識別前列腺腫瘤細胞、鑒別前哨淋巴結中乳腺癌微轉移和轉移細胞的準確度可分別達到 0.99、0.90。
2015 年 11 月至 2016 年 11 月舉行的國際 CAMELYON16 大賽收集來自兩個臨床中心的電子病理切片數據共 399 張 WSI,分為測試集(270)、訓練集(129),測試 CNN 模型識別乳腺癌標本中淋巴結轉移細胞存在的準確率,同時邀請了 12 位病理學家,分為時間限制組(2 h,11 位)、無時間限制組(1 位)進行對照[39]。來自 23 個團隊共 32 種 CNN 模型參賽,大賽結果顯示,表現最好的 CNN 模型識別淋巴結轉移細胞的 AUC 達 0.994,顯著優于時間限制組的病理醫師(0.810);Li 等[40]提出一個由 CNN 和 CRF(conditional random field)組成的神經條件隨機場(NCRF),在 CAMELYON16數據集基礎上納入 400 張 WSI 供其訓練并測試,結果顯示,NCRF 識別乳腺癌淋巴結轉移細胞準確度可以達到 0.938;David 等[41]研究顯示,比起單獨算法診斷或獨立病理學家,CNN 算法輔助下的病理學家識別淋巴結乳腺癌轉移細胞準確度更高,時間更短;另外算法輔助下還可以提高淋巴結微轉移的靈敏度(0.91,算法輔助;0.83,無算法輔助)。Campanella 等[32]也證明利用 CNN、MIL 和 RNN 組成的復合神經網絡模型可以在弱監督情況下準確識別乳腺癌淋巴結轉移細胞,準確率可達 0.965;見表 2。

2.3 腫瘤患者預后的預測
病理診斷明確預后因子是指導腫瘤患者個體化治療的關鍵。表 3 中我們歸納了近年來利用人工智能技術預測腫瘤預后的實踐進展。Kather 等[42]利用經訓練的 CNN 模型對來自 TCGA 數據庫中 500 例Ⅰ~Ⅳ 期結直腸癌(CRC)患者的 862 張 WSI 圖像進行自動識別,提出“deep stroma score”是 CRC 患者一個獨立的預后預測因子;并在來自德國 DACHS 隊列中 409 例Ⅰ~Ⅳ期 CRC 患者研究中進行驗證,證明“deep stroma score”是結直腸癌患者 OS、CRC 特異性 OS 和無復發生存率(RFS)的獨立預后因素,結果提示 CNN 算法可直接從組織病理學圖像評價腫瘤微環境并預測預后。Veta 等[43]組織 TUPAC16 比賽(tumor proliferation assessment challenge 2016),利用 821 張乳腺癌 WSI 測試 CNN 算法模型完成自動檢測細胞有絲分裂、預測基于 PAM50 增殖評分的基因表達兩個任務,以此評估乳腺癌增殖情況判斷患者預后,12 個隊伍提交了第一個任務的結果、6 個隊伍提交了第二個任務的結果,最終結果顯示表現最好的 CNN 算法模型完成以上兩個任務的 Kappa 值分別為 0.567、0.617。

Harder 等[44]研究納入 31 例患有Ⅳ期惡性黑色素瘤的患者,利用 CNN 算法識別病理圖像特征,預測可以從 ipilimumab(抗 CTLA-4 抗體)免疫治療中獲益的患者人群,研究結果顯示 CNN 算法模型區分病理切片中 CD3+、黑色素及非特異性染色的準確率可以分別達到 99.4%、96.0% 和 99%;Zhou 等[45]利用 TCGA 數據庫中 368 張 WSI 測試 CNN 算法性能,證明經訓練后的 CNN 模型可通過區分前列腺癌分級預測患者預后,可靠度達 75%;Yu 等[46]的研究中納入從 TCGA 數據庫中獲得的 2 186 張肺癌 WSI 圖像和 TMA 數據庫中的 294 張附加圖像,利用機器學習算法提取圖像特征,有效地將短期幸存者與Ⅰ期腺癌或鱗狀細胞癌的長期幸存者區分開,研究結果表明,利用機器學習算法自動獲得的圖像特征可以預測肺癌患者的預后,從而有助于精確的腫瘤診斷。Beck 等[39]開發并利用 C-Path(computational pathologist)系統收集乳腺癌上皮和基質的定量特征集(6 642 個特征),構建乳腺癌預后預測模型。該模型應用于兩個乳腺癌患者獨立隊列,共 576 例患者的病理圖像分析,證明 C-Path 生成的預后模型評分與隊列中患者 OS 密切相關,顯微基質結構是乳腺癌的一個獨立的預后因素。除此之外,CNN 算法在腦部腫瘤、濾泡性淋巴瘤等腫瘤患者預后方面也可以進行有效預測;見表 3。
3 總結和展望
組織病理學診斷仍然是目前腫瘤診斷的“金標準”。利用數字病理切片建立大容量病理數據庫,可以方便更多的遠程診斷人員共同讀片,降低誤診率也提高了工作效率。目前的臨床實踐證明,利用 WSI,深度學習 CNN 模型可以有效地區分腫瘤組織病理學分型、檢測淋巴結轉移細胞,并預測腫瘤患者預后情況。但由于腫瘤異質性、病理圖像可視化特征難尋、數據集有限等限制,CNN 模型輔助病理診斷在臨床上的應用還十分有限。如何開拓 CNN 模型在腫瘤領域更多層次的利用,挖掘其更大的潛力,提高其臨床適用性還有待探究。我們堅信,在人工智能算法的幫助下,病理切片的計算機輔助診斷知識體系將不斷完善,最終能夠為患者提供精準的治療指導和預后信息。
利益沖突:無。