引用本文: 李少東, 洪森, 李世權, 董睿智, 梁斌, 康振華. 人工智能利用圖像深度學習診療消化道腫瘤的現狀及展望. 中國普外基礎與臨床雜志, 2021, 28(11): 1524-1529. doi: 10.7507/1007-9424.202012127 復制
人工智能(artificial intelligence,AI)在醫療領域得到了快速發展,以深度學習為代表的 AI 技術使得消化道腫瘤的診療向著更加精準的方向發展。AI深度學習系統的工作原理如圖 1 所示,圖中所示的訓練數據是指經過高年資醫師標注的內鏡圖像、CT 圖像、病理圖像等。消化道內鏡檢查、影像學檢查和病理診斷在 AI 技術的輔助下均表現出很高的特異度和靈敏度,AI 技術能輔助醫生作出更加全面精準的診斷意見,使更多的消化道腫瘤患者受益。下面就國內外對此研究的現狀及相關研究進展作一綜述。

1 AI 與消化道疾病的內鏡篩查
中國是世界上消化道腫瘤高發的國家之一,患病率和病死率均較高。消化道內鏡檢查是食管、胃和結直腸病變篩查的首選手段。
1.1 AI 與食管癌的內鏡篩查
日本過去幾年利用消化道內鏡來篩查食管病變,發現病變檢出效果比較顯著。一項在中國食管癌高發區磁縣進行的研究[1]顯示,通過消化道內鏡篩查,發現有食管病變的患者經過積極治療后,10 年后該地食管癌人群患病率及病死率分別下降了 29.47% 及 33.56%。然而內鏡醫生的操作技術及經驗水平、內鏡本身分辨率等都會對最終的診斷結果造成一定影響。AI 深度學習技術通過學習訓練建立的模型可以輔助經驗較少的低年資醫生作出更加精確的診斷,針對內鏡分辨率低及經驗不足導致的漏診問題,模型可起到提示作用從而提高診斷精確度,模型也能輔助醫生縮短診斷時間,減輕醫生工作量。蔡世倫等[2]利用 AI 深度學習技術構建了一個用于食管早癌的輔助診斷模型,收集過去2 400 張內鏡食管圖像,經過加工整理后將其放到深度學習模型進行訓練和驗證,該模型的診斷準確率非常接近經驗豐富的臨床內鏡醫師的診斷水平,受試者工作特征曲線下面積(AUC)值為 0.996 1。Horie 等[3]利用日本癌癥研究所過去 384 例食管癌患者 8 428 張經過訓練的圖像,開發了一款 AI 深度學習卷積神經網絡(convolutional neural networks,CNN),利用食管癌患者的 1 118 張檢測圖像評估診斷的準確性,發現該模型可以非常準確地檢測出 98% 的食管癌圖像。傅劍華教授團隊對大量內鏡下食管檢查圖像進行分類,然后由不同級別醫生利用雙盲隨機方法進行循環評分標注,最后騰訊AI團隊應用這些圖像通過深度學習技術研發出騰訊覓影,騰訊覓影對早期食管癌的檢出準確率高達 90%[4]。石善江等[5]利用 288 張早期食管癌內鏡圖像、1 832 張良性病變及正常圖像,首先通過騰訊覓影模型對 2120 張圖像進行驗證,同時再交給 4 名內鏡醫師進行診斷,最后統計結果顯示 CNN 模型用于早期食管癌診斷的準確率為 88.4%、靈敏度為 89.6%、特異度為 88.3%,每張圖像的診斷時間均優于 4 名內鏡醫師,可在臨床白光內鏡中輔助內鏡醫師作出更加精準的診斷。
1.2 AI 與胃癌的內鏡篩查
胃癌在全球范圍發病率高、預后差。研究數據[6-7]表明,2018 年全球胃癌新發病例約 103.3 萬例,死亡病例約 78.3 萬例;而我國 2015 年胃癌死亡病例約 49.8 萬例,患病人數和死亡人數均居所有惡性腫瘤的第 2 位。研究[8]發現,傳統的消化道內鏡篩查早癌其假陰性率可達 4.6%~25.8%,而早期診斷胃癌患者的 5 年生存率可到 90% 以上,AI 深度學習技術的出現可以提高胃癌的檢出率和準確率。李夏等[9]分析了實時胃鏡監控系統(胃鏡精靈)在胃鏡檢查中的盲區監測功能與圖像自主采集功能,利用武漢大學人民醫院消化內鏡中心 38 522 張胃鏡圖像進行訓練和驗證,對比胃鏡精靈采圖與人工采圖的胃鏡檢查部位覆蓋個數及覆蓋率,結果胃鏡精靈采圖部位覆蓋個數與覆蓋率均高于人工采圖,胃鏡精靈可提高胃鏡檢查部位覆蓋率及覆蓋個數,可改善傳統胃鏡檢查時檢查部位覆蓋不全及采圖不全面的情況。AI深度學習過程中以視頻為訓練數據的準確性和效率高于以靜態圖像作為訓練數據的準確性和效率。Ishioka 等[10]利用訓練后的 CNN 模型對 68 例已確診胃癌患者的消化內鏡視頻動態圖像進行辨認,1 s 內確診率可高達 94.1%;Hirasawa 等[8]利用經過訓練的 CNN 模型對胃癌患者的 2 296 張胃鏡圖像進行識別,陽性預測值只有 30.6%,對小于 5 mm 的病灶診斷率更低,遠低于以視頻為訓練數據的預測值。幽門螺桿菌感染與胃癌的發生有密切關系,Itoh 等[11]利用感染幽門螺桿菌患者內鏡圖像研發出一款 CNN 模型,該模型能有效識別胃幽門螺桿菌感染,靈敏度和特異度可高達 85% 以上,AUC 為 0.956。
1.3 AI 與結直腸癌的內鏡篩查
結直腸癌是世界上發病率和病死率最高的惡性腫瘤之一,近年來結直腸癌發病率呈現出上升趨勢。定期的結腸鏡檢查可以有效降低結直腸癌的發病率和病死率[12-13],但是結腸鏡檢查的不完全性可能會導致結腸鏡檢查后出現結直腸癌的漏診,據報道[14]結腸鏡檢查后漏診結直腸癌占所有手術切除結直腸癌患者的 3%~10%。結腸鏡不能全覆蓋的篩查、內鏡醫師經驗水平的不同、結腸鏡分辨率等問題都是影響結直腸癌早期篩查及預后的重要因素。AI 技術輔助下的結腸鏡檢查系統讓這些問題的解決看到了希望。Yamada 等[14]利用 AI 深度學習技術開發了一種 AI 自動檢測系統,可在結腸鏡檢查時自動識別早期結直腸癌患者的腸道表征,其靈敏度和特異度分別為 97.3% 和 99.0%,該 AI 自動檢測系統能夠做到實時提示醫生在內鏡檢查過程中遺漏的非息肉樣病變,從而能夠較好地保證非息肉樣病變的檢出率,而普通光學息肉檢查有時可能會漏掉這些病變。研究[15-18]表明,AI 輔助下的結腸鏡系統可以全面分析整個內鏡圖像,可提供高達 330° 的視野,從而彌補了人類視野上的局限性,降低了息肉漏診的風險,可將高達 34%的腺瘤漏診率有效降低。Wang 等[19-20]利用其所在中心 1 290 例患者的結腸鏡檢查報告中的 5 545 張結腸鏡圖像開發了一種深度學習算法,證明了一種機器學習算法可以在臨床結腸鏡檢查中實時、高靈敏度和高特異度地檢查息肉,應用該算法的機器軟件可以幫助內鏡醫師進行結腸鏡檢查,并幫助評估內鏡醫師診斷息肉和腺瘤的能力;同時他們還選取 1 058 例患者,536 例隨機進行標準結腸鏡檢查,522 例隨機進行 AI 技術輔助的結腸鏡檢查,AI 輔助下的結腸鏡檢查顯著增加了腺瘤的檢出率(adenoma detection rate,ADR)和每例患者腺瘤的檢出數量,同時增生性息肉檢出數量也顯著增加。Vinsard 等[21]發現,AI 技術輔助下的計算機輔助檢測(computer aided detection,CADe)可以降低息肉的漏檢率,有助于提高ADR,降低結直腸癌發生的概率;而計算機輔助診斷(computer aided diagnosis,CADx)則可以提高結腸息肉診斷的準確性,減少非腫瘤性病變不必要的息肉切除術。Misawa 等[22]回顧性收集了 546 例患者接受結腸鏡檢查的視頻資料并開發了 CADe 系統,這些視頻資料被隨機分為 2 組:學習樣本(105 個陽性和 306 個陰性)和測試樣本(50 個陽性和 85 個陰性),最終證實他們開發的 AI 技術輔助下的 CADe 系統有潛力實行結直腸息肉的自動檢測,同時有望填補評估不同經驗水平內鏡醫師之間差距的空白。陳肖等[23]收集其所在醫院內鏡中心結腸鏡圖像 60 余萬幅,收集高質量的結腸鏡手術操作視頻,全部經過權威專家篩選和標注,采用 Google 公司 TensorFlow 平臺,對其深度學習算法進行二次開發,最終模型對結腸息肉檢測的靈敏度為 98.30%、特異度為 88.10%,結腸息肉診斷的總體準確率為 92.92%,對潰瘍性結腸炎檢測的靈敏度為 78.32%、特異度為 67.06%;單張圖像的診斷時長為(0.5±0.03)s,AI 輔助診斷模型可以使內鏡中心整體的運行效率得以提升,有利于結腸鏡檢查的質量控制。新英格蘭雜志上一項大規模研究[24]顯示,退鏡時間會影響ADR,以 6 min 作為分界線,低于6 min 退鏡時間的ADR為 11.8%,而退鏡時間為6 min 以上的ADR為 28.3%,部分醫師內鏡觀察時間不夠,達不到應有的標準,導致沒能查全完整的消化道腔道。AI 可應用于結腸退鏡時間的智能質控,通過圖像數據訓練,系統自動判定退鏡起止點。潰瘍性結腸炎會增加結直腸癌的患病風險,所以針對潰瘍性結腸炎患者早期診斷以及及時的干預治療很重要,傳統內鏡評估結直腸腸道黏膜狀態的靈敏度和特異度仍不理想,Mayo 內鏡評分為 0 時仍然有 30% 左右的患者具有不同程度的腸道黏膜損害[25]。Maeda 等[26]利用 AI 輔助系統可以做到早期識別腸道黏膜病變,準確率高達 91%,這樣可以對黏膜病變實現早期識別并盡早干預。
2 AI 與影像學技術
影像學檢查在消化道腫瘤診斷中也扮演著重要角色,AI 技術能夠顯著提高醫學影像的可讀性,客觀地提供診斷參考意見。AI 技術輔助下的影像學檢查可以變得更加準確和高效。劉書豪等[27]利用我國 7 家醫院行直腸高分辨 MRI 檢查的 500 例患者圖像建立 AI 輔助診斷平臺,發現 AI 輔助下的影像診斷平臺對診斷識別直腸癌壁外血管侵犯(extramural vascular invasion,EMVI)的準確率、靈敏度、特異度、陽性預測值和陰性預測值分別為 93.4%、97.3%、89.5%、0.90 和 0.97,AUC 為 0.98,自動識別單張圖像所需時間為 0.2 s,而影像學專家判讀時間約為 10 s,該輔助平臺具有高效性和可行性,可輔助影像科醫生進行成像診斷。周云朋等[28]利用 MRI 明確盆腔淋巴結轉移的 301 例直腸癌患者圖像建立了直腸癌淋巴結轉移的AI自動識別系統,該系統的效率和準確率均較高,可輔助臨床診斷。Lu 等[29]研發了區域卷積神經網絡(快速R-CNN),收集多個醫學中心的 MRI 圖像數據進行臨床驗證,驗證結果表明,快速 R-CNN 的 AUC 值為 0.912,與診斷時間為 20 s/人的高年資放射科醫師水平相當。因此,快速 R-CNN 具有良好的臨床應用價值和可行性,該方法比傳統的診斷方法準確、高效。直腸癌環周切緣(circumferential resection margin,CRM)是影響患者預后的重要因素。Wang 等[30]通過對 12 258 張高分辨 MRI 的 CRM 圖片的深度學習,建立了識別直腸癌 CRM 的 AI 模型,該模型識別效率較高,AUC 為 0.953。徐吉華[31]利用12 258 張直腸癌CRM陽性高分辨率 MRI 圖像構建了一個AI輔助診斷的評估平臺,發現應用快速R-CNN 分割CRM具有較高的準確性和可行性。王蘭等[32]研究發現,分別使用全手動模式以及AI輔助的半自動模式,對 32 例患者共 81 個胃癌肝轉移灶的 CT 圖像進行分割,相對于手動分割病灶,AI 輔助的肝轉移自動分割軟件大大縮短進行半自動病灶分割所需的時間,使用 AI 輔助的肝轉移自動分割軟件進行半自動病灶分割,可提高肝轉移病灶分割的效率,有望成為臨床隨訪及療效評估的定量工具。Huang 等[33]開發和驗證了一種包含放射組學特征和臨床病理危險因素的放射組學列線圖,可方便地用于結直腸癌患者術前的個體化淋巴結轉移預測。Li 等[34]開發和驗證了一種基于術前 CT 數據的無創 AI 模型,可以較好地預測結腸癌肝轉移的存在,靈敏度可以達到 85.50%。李芊等[35]對基于 CT 的直腸癌新輔助化療后病理完全緩解預測模型進行了初步探索,預測模型在判斷非病理完全緩解中表現出了較理想的效能。
3 AI 與病理技術
實踐證明,AI 能夠輔助病理科醫生更加高效地工作[36],減少醫生工作量,同時能輔助醫生作出更精準的判斷,最終達到降低誤診率和漏診率的目的[37-38]。Xu 等[39]以 ImageNet 為基礎訓練出一款深度學習CNN模型,該模型對結腸癌組織病理學圖像的分類和分割明顯優于手動分類和分割的效果。王順正等[40]利用訓練組中 21 352 個帶有癌區的圖像區塊和 14 997 個沒有癌區的區塊對預訓練的CNN架構 Resnet50 進行訓練和微調,建立卷積神經網絡計算機輔助系統(CNN-CAD),最終發現 CNN-CAD 系統對胃癌轉移淋巴結病理學切片具有較高的分類能力,可以輔助病理科醫師對轉移淋巴結切片進行初步篩選。Kather 等[41]運用 AI 系統對結直腸癌病理切片的輔助診斷進行研究,在對大量蘇木精?伊紅染色切片的深度學習后,識別準確率可以超過 94%。Reichling 等[42]基于一項大型前瞻性研究獲得的病理切片生成了一個 AI 軟件,該軟件用于研究Ⅲ期結直腸癌的預后與 CD3、CD8 免疫浸潤的關系,使用自動程序可以幫助病理學家更好地確定Ⅲ期結腸癌患者的預后。Gupta 等[43]利用最具影響力的組織病理學參數預測結腸癌的 TNM 分期,并利用臨床研究中的機器學習可以預測 5 年無病生存期;他們還發現,隨機森林算法的預測效果優于其他算法,隨機森林算法預測 5 年內無病生存期的準確率可達 84%,同時機器學習監督的方法比標準的 TNM 分期系統準確性高。AI 技術可以輔助提高病理學診斷的質量和效率。
4 不足與展望
4.1 不足
AI 的快速發展使醫學不斷地向前發展,發展的同時我們也面臨著挑戰。① AI 輔助系統為醫生提供了一定的安全感,過度依賴 AI 輔助系統可能會使新一代醫師的診斷及判斷能力下降。② AI 的學習數據多基于一個地區特定醫療機構,各個醫療機構采用的設備生產廠家和參考標準不同,AI 學習的醫學數據人群地域不同,這種情況下建立的模型可能不能在大范圍使用,存在一定的局限性,須進一步完善算法,將數據進行統一化處理,進一步健全統一的標準化評價體系。③ 現階段 AI 相關技術的特異度和靈敏度都已經很高了,但現有 AI 輔助系統均依賴于臨床專家提供的經過標注的胃腸鏡、影像學等靜態圖像為依據進行學習訓練后再作出診斷,無法診斷訓練組中未包含的疾病亞型而導致漏診,并有可能將訓練組中少見的疾病亞型作為疾病常態導致誤診,更無法依靠 AI 來發現新的病種;同時 AI 輔助系統只能識別高質量的圖像,對于有出血灶等低質量圖像無法有效識別。目前仍需進一步擴大胃腸鏡圖片及視頻的訓練集和測試集來獲得更高的靈敏度與特異度,減少漏診和誤診,同時當出現漏診和誤診時會面臨責任分配和法律上的挑戰,應該完善 AI 在醫療方面的法律法規。④ 醫療信息數據還涉及到患者隱私和倫理的問題,患者信息泄露會造成很多社會問題,所以 AI 快速發展的同時醫療信息安全問題也必須得到高度重視。⑤ 一項調查研究[41]表明,公眾對 AI 在醫療領域的影響感覺很明顯的占 16.68%,AI 對醫療的影響能感受到一點的比重最高,為 71.44%,這說明 AI 已經開始逐漸應用到醫療領域當中,但應用的范圍還不夠廣泛,我國 AI 在醫療領域的應用才剛剛開始,還需長時間進行普及。⑥ 目前利用 AI 輔助系統篩查早癌研究及應用僅能在具備豐富經驗的內鏡醫師與病理醫師的大型醫療中心得以實現,而基層醫院由于各方面條件的不足、限制了該技術的發展。⑦ AI 輔助系統在人文關懷上無法代替臨床醫護人員,可能會在當前醫療環境下使醫患關系更加緊張,倡導人性化關懷是每位醫護人員必須牢記在心的基本修養。⑧ AI 深度學習技術和 CNN 在炎癥性腸病、胃腸超聲內鏡、內鏡逆行胰膽管造影等領域探索較少,未來的探索性研究值得期待。
4.2 展望
① AI 深度學習技術能否將內鏡或影像學實時檢查的信息同步到腹腔鏡成像系統,進而指導醫生作出更加準確的手術切除范圍方案;AI 深度學習可以使腹腔鏡成像系統更加準確地同步癌腫周圍組織器官、脈管、淋巴結等受累情況,可以更加準確地指導術者手術過程中對腫瘤及周圍組織、脈管、淋巴結等作出更加全面準確的清掃。② 未來 AI 系統能否綜合評估每例患者情況,為消化道腫瘤患者提供個性化的治療方案;未來 AI 系統能否做到療效預估,預估每例患者的最適用藥劑量和最佳藥物種類,預估最適的手術方案。③ 隨著 5G 技術的到來以及與 AI、大數據的結合,未來有可能解決目前我國醫療資源發展不平衡的難題,使基層醫院能夠實時共享頂級醫院的醫療技術,解決看病難的問題,AI 將不斷驅動醫療行業創新和發展,不斷解決更多醫學難題。
5 結語
隨著以深度學習技術為代表的 AI 技術在消化道腫瘤領域研究的不斷深入,AI 輔助下的消化道內鏡、影像學和病理學系統對消化道腫瘤的診斷效率和準確率變得更高,相信 AI 能更好地推動消化道腫瘤及整個醫學領域的進步,使更多的患者受益。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:李少東,查閱文獻和撰寫文章;董睿智和梁斌協助查閱文獻;洪森和李世權修改論文;康振華對文章進行校對和修正。
人工智能(artificial intelligence,AI)在醫療領域得到了快速發展,以深度學習為代表的 AI 技術使得消化道腫瘤的診療向著更加精準的方向發展。AI深度學習系統的工作原理如圖 1 所示,圖中所示的訓練數據是指經過高年資醫師標注的內鏡圖像、CT 圖像、病理圖像等。消化道內鏡檢查、影像學檢查和病理診斷在 AI 技術的輔助下均表現出很高的特異度和靈敏度,AI 技術能輔助醫生作出更加全面精準的診斷意見,使更多的消化道腫瘤患者受益。下面就國內外對此研究的現狀及相關研究進展作一綜述。

1 AI 與消化道疾病的內鏡篩查
中國是世界上消化道腫瘤高發的國家之一,患病率和病死率均較高。消化道內鏡檢查是食管、胃和結直腸病變篩查的首選手段。
1.1 AI 與食管癌的內鏡篩查
日本過去幾年利用消化道內鏡來篩查食管病變,發現病變檢出效果比較顯著。一項在中國食管癌高發區磁縣進行的研究[1]顯示,通過消化道內鏡篩查,發現有食管病變的患者經過積極治療后,10 年后該地食管癌人群患病率及病死率分別下降了 29.47% 及 33.56%。然而內鏡醫生的操作技術及經驗水平、內鏡本身分辨率等都會對最終的診斷結果造成一定影響。AI 深度學習技術通過學習訓練建立的模型可以輔助經驗較少的低年資醫生作出更加精確的診斷,針對內鏡分辨率低及經驗不足導致的漏診問題,模型可起到提示作用從而提高診斷精確度,模型也能輔助醫生縮短診斷時間,減輕醫生工作量。蔡世倫等[2]利用 AI 深度學習技術構建了一個用于食管早癌的輔助診斷模型,收集過去2 400 張內鏡食管圖像,經過加工整理后將其放到深度學習模型進行訓練和驗證,該模型的診斷準確率非常接近經驗豐富的臨床內鏡醫師的診斷水平,受試者工作特征曲線下面積(AUC)值為 0.996 1。Horie 等[3]利用日本癌癥研究所過去 384 例食管癌患者 8 428 張經過訓練的圖像,開發了一款 AI 深度學習卷積神經網絡(convolutional neural networks,CNN),利用食管癌患者的 1 118 張檢測圖像評估診斷的準確性,發現該模型可以非常準確地檢測出 98% 的食管癌圖像。傅劍華教授團隊對大量內鏡下食管檢查圖像進行分類,然后由不同級別醫生利用雙盲隨機方法進行循環評分標注,最后騰訊AI團隊應用這些圖像通過深度學習技術研發出騰訊覓影,騰訊覓影對早期食管癌的檢出準確率高達 90%[4]。石善江等[5]利用 288 張早期食管癌內鏡圖像、1 832 張良性病變及正常圖像,首先通過騰訊覓影模型對 2120 張圖像進行驗證,同時再交給 4 名內鏡醫師進行診斷,最后統計結果顯示 CNN 模型用于早期食管癌診斷的準確率為 88.4%、靈敏度為 89.6%、特異度為 88.3%,每張圖像的診斷時間均優于 4 名內鏡醫師,可在臨床白光內鏡中輔助內鏡醫師作出更加精準的診斷。
1.2 AI 與胃癌的內鏡篩查
胃癌在全球范圍發病率高、預后差。研究數據[6-7]表明,2018 年全球胃癌新發病例約 103.3 萬例,死亡病例約 78.3 萬例;而我國 2015 年胃癌死亡病例約 49.8 萬例,患病人數和死亡人數均居所有惡性腫瘤的第 2 位。研究[8]發現,傳統的消化道內鏡篩查早癌其假陰性率可達 4.6%~25.8%,而早期診斷胃癌患者的 5 年生存率可到 90% 以上,AI 深度學習技術的出現可以提高胃癌的檢出率和準確率。李夏等[9]分析了實時胃鏡監控系統(胃鏡精靈)在胃鏡檢查中的盲區監測功能與圖像自主采集功能,利用武漢大學人民醫院消化內鏡中心 38 522 張胃鏡圖像進行訓練和驗證,對比胃鏡精靈采圖與人工采圖的胃鏡檢查部位覆蓋個數及覆蓋率,結果胃鏡精靈采圖部位覆蓋個數與覆蓋率均高于人工采圖,胃鏡精靈可提高胃鏡檢查部位覆蓋率及覆蓋個數,可改善傳統胃鏡檢查時檢查部位覆蓋不全及采圖不全面的情況。AI深度學習過程中以視頻為訓練數據的準確性和效率高于以靜態圖像作為訓練數據的準確性和效率。Ishioka 等[10]利用訓練后的 CNN 模型對 68 例已確診胃癌患者的消化內鏡視頻動態圖像進行辨認,1 s 內確診率可高達 94.1%;Hirasawa 等[8]利用經過訓練的 CNN 模型對胃癌患者的 2 296 張胃鏡圖像進行識別,陽性預測值只有 30.6%,對小于 5 mm 的病灶診斷率更低,遠低于以視頻為訓練數據的預測值。幽門螺桿菌感染與胃癌的發生有密切關系,Itoh 等[11]利用感染幽門螺桿菌患者內鏡圖像研發出一款 CNN 模型,該模型能有效識別胃幽門螺桿菌感染,靈敏度和特異度可高達 85% 以上,AUC 為 0.956。
1.3 AI 與結直腸癌的內鏡篩查
結直腸癌是世界上發病率和病死率最高的惡性腫瘤之一,近年來結直腸癌發病率呈現出上升趨勢。定期的結腸鏡檢查可以有效降低結直腸癌的發病率和病死率[12-13],但是結腸鏡檢查的不完全性可能會導致結腸鏡檢查后出現結直腸癌的漏診,據報道[14]結腸鏡檢查后漏診結直腸癌占所有手術切除結直腸癌患者的 3%~10%。結腸鏡不能全覆蓋的篩查、內鏡醫師經驗水平的不同、結腸鏡分辨率等問題都是影響結直腸癌早期篩查及預后的重要因素。AI 技術輔助下的結腸鏡檢查系統讓這些問題的解決看到了希望。Yamada 等[14]利用 AI 深度學習技術開發了一種 AI 自動檢測系統,可在結腸鏡檢查時自動識別早期結直腸癌患者的腸道表征,其靈敏度和特異度分別為 97.3% 和 99.0%,該 AI 自動檢測系統能夠做到實時提示醫生在內鏡檢查過程中遺漏的非息肉樣病變,從而能夠較好地保證非息肉樣病變的檢出率,而普通光學息肉檢查有時可能會漏掉這些病變。研究[15-18]表明,AI 輔助下的結腸鏡系統可以全面分析整個內鏡圖像,可提供高達 330° 的視野,從而彌補了人類視野上的局限性,降低了息肉漏診的風險,可將高達 34%的腺瘤漏診率有效降低。Wang 等[19-20]利用其所在中心 1 290 例患者的結腸鏡檢查報告中的 5 545 張結腸鏡圖像開發了一種深度學習算法,證明了一種機器學習算法可以在臨床結腸鏡檢查中實時、高靈敏度和高特異度地檢查息肉,應用該算法的機器軟件可以幫助內鏡醫師進行結腸鏡檢查,并幫助評估內鏡醫師診斷息肉和腺瘤的能力;同時他們還選取 1 058 例患者,536 例隨機進行標準結腸鏡檢查,522 例隨機進行 AI 技術輔助的結腸鏡檢查,AI 輔助下的結腸鏡檢查顯著增加了腺瘤的檢出率(adenoma detection rate,ADR)和每例患者腺瘤的檢出數量,同時增生性息肉檢出數量也顯著增加。Vinsard 等[21]發現,AI 技術輔助下的計算機輔助檢測(computer aided detection,CADe)可以降低息肉的漏檢率,有助于提高ADR,降低結直腸癌發生的概率;而計算機輔助診斷(computer aided diagnosis,CADx)則可以提高結腸息肉診斷的準確性,減少非腫瘤性病變不必要的息肉切除術。Misawa 等[22]回顧性收集了 546 例患者接受結腸鏡檢查的視頻資料并開發了 CADe 系統,這些視頻資料被隨機分為 2 組:學習樣本(105 個陽性和 306 個陰性)和測試樣本(50 個陽性和 85 個陰性),最終證實他們開發的 AI 技術輔助下的 CADe 系統有潛力實行結直腸息肉的自動檢測,同時有望填補評估不同經驗水平內鏡醫師之間差距的空白。陳肖等[23]收集其所在醫院內鏡中心結腸鏡圖像 60 余萬幅,收集高質量的結腸鏡手術操作視頻,全部經過權威專家篩選和標注,采用 Google 公司 TensorFlow 平臺,對其深度學習算法進行二次開發,最終模型對結腸息肉檢測的靈敏度為 98.30%、特異度為 88.10%,結腸息肉診斷的總體準確率為 92.92%,對潰瘍性結腸炎檢測的靈敏度為 78.32%、特異度為 67.06%;單張圖像的診斷時長為(0.5±0.03)s,AI 輔助診斷模型可以使內鏡中心整體的運行效率得以提升,有利于結腸鏡檢查的質量控制。新英格蘭雜志上一項大規模研究[24]顯示,退鏡時間會影響ADR,以 6 min 作為分界線,低于6 min 退鏡時間的ADR為 11.8%,而退鏡時間為6 min 以上的ADR為 28.3%,部分醫師內鏡觀察時間不夠,達不到應有的標準,導致沒能查全完整的消化道腔道。AI 可應用于結腸退鏡時間的智能質控,通過圖像數據訓練,系統自動判定退鏡起止點。潰瘍性結腸炎會增加結直腸癌的患病風險,所以針對潰瘍性結腸炎患者早期診斷以及及時的干預治療很重要,傳統內鏡評估結直腸腸道黏膜狀態的靈敏度和特異度仍不理想,Mayo 內鏡評分為 0 時仍然有 30% 左右的患者具有不同程度的腸道黏膜損害[25]。Maeda 等[26]利用 AI 輔助系統可以做到早期識別腸道黏膜病變,準確率高達 91%,這樣可以對黏膜病變實現早期識別并盡早干預。
2 AI 與影像學技術
影像學檢查在消化道腫瘤診斷中也扮演著重要角色,AI 技術能夠顯著提高醫學影像的可讀性,客觀地提供診斷參考意見。AI 技術輔助下的影像學檢查可以變得更加準確和高效。劉書豪等[27]利用我國 7 家醫院行直腸高分辨 MRI 檢查的 500 例患者圖像建立 AI 輔助診斷平臺,發現 AI 輔助下的影像診斷平臺對診斷識別直腸癌壁外血管侵犯(extramural vascular invasion,EMVI)的準確率、靈敏度、特異度、陽性預測值和陰性預測值分別為 93.4%、97.3%、89.5%、0.90 和 0.97,AUC 為 0.98,自動識別單張圖像所需時間為 0.2 s,而影像學專家判讀時間約為 10 s,該輔助平臺具有高效性和可行性,可輔助影像科醫生進行成像診斷。周云朋等[28]利用 MRI 明確盆腔淋巴結轉移的 301 例直腸癌患者圖像建立了直腸癌淋巴結轉移的AI自動識別系統,該系統的效率和準確率均較高,可輔助臨床診斷。Lu 等[29]研發了區域卷積神經網絡(快速R-CNN),收集多個醫學中心的 MRI 圖像數據進行臨床驗證,驗證結果表明,快速 R-CNN 的 AUC 值為 0.912,與診斷時間為 20 s/人的高年資放射科醫師水平相當。因此,快速 R-CNN 具有良好的臨床應用價值和可行性,該方法比傳統的診斷方法準確、高效。直腸癌環周切緣(circumferential resection margin,CRM)是影響患者預后的重要因素。Wang 等[30]通過對 12 258 張高分辨 MRI 的 CRM 圖片的深度學習,建立了識別直腸癌 CRM 的 AI 模型,該模型識別效率較高,AUC 為 0.953。徐吉華[31]利用12 258 張直腸癌CRM陽性高分辨率 MRI 圖像構建了一個AI輔助診斷的評估平臺,發現應用快速R-CNN 分割CRM具有較高的準確性和可行性。王蘭等[32]研究發現,分別使用全手動模式以及AI輔助的半自動模式,對 32 例患者共 81 個胃癌肝轉移灶的 CT 圖像進行分割,相對于手動分割病灶,AI 輔助的肝轉移自動分割軟件大大縮短進行半自動病灶分割所需的時間,使用 AI 輔助的肝轉移自動分割軟件進行半自動病灶分割,可提高肝轉移病灶分割的效率,有望成為臨床隨訪及療效評估的定量工具。Huang 等[33]開發和驗證了一種包含放射組學特征和臨床病理危險因素的放射組學列線圖,可方便地用于結直腸癌患者術前的個體化淋巴結轉移預測。Li 等[34]開發和驗證了一種基于術前 CT 數據的無創 AI 模型,可以較好地預測結腸癌肝轉移的存在,靈敏度可以達到 85.50%。李芊等[35]對基于 CT 的直腸癌新輔助化療后病理完全緩解預測模型進行了初步探索,預測模型在判斷非病理完全緩解中表現出了較理想的效能。
3 AI 與病理技術
實踐證明,AI 能夠輔助病理科醫生更加高效地工作[36],減少醫生工作量,同時能輔助醫生作出更精準的判斷,最終達到降低誤診率和漏診率的目的[37-38]。Xu 等[39]以 ImageNet 為基礎訓練出一款深度學習CNN模型,該模型對結腸癌組織病理學圖像的分類和分割明顯優于手動分類和分割的效果。王順正等[40]利用訓練組中 21 352 個帶有癌區的圖像區塊和 14 997 個沒有癌區的區塊對預訓練的CNN架構 Resnet50 進行訓練和微調,建立卷積神經網絡計算機輔助系統(CNN-CAD),最終發現 CNN-CAD 系統對胃癌轉移淋巴結病理學切片具有較高的分類能力,可以輔助病理科醫師對轉移淋巴結切片進行初步篩選。Kather 等[41]運用 AI 系統對結直腸癌病理切片的輔助診斷進行研究,在對大量蘇木精?伊紅染色切片的深度學習后,識別準確率可以超過 94%。Reichling 等[42]基于一項大型前瞻性研究獲得的病理切片生成了一個 AI 軟件,該軟件用于研究Ⅲ期結直腸癌的預后與 CD3、CD8 免疫浸潤的關系,使用自動程序可以幫助病理學家更好地確定Ⅲ期結腸癌患者的預后。Gupta 等[43]利用最具影響力的組織病理學參數預測結腸癌的 TNM 分期,并利用臨床研究中的機器學習可以預測 5 年無病生存期;他們還發現,隨機森林算法的預測效果優于其他算法,隨機森林算法預測 5 年內無病生存期的準確率可達 84%,同時機器學習監督的方法比標準的 TNM 分期系統準確性高。AI 技術可以輔助提高病理學診斷的質量和效率。
4 不足與展望
4.1 不足
AI 的快速發展使醫學不斷地向前發展,發展的同時我們也面臨著挑戰。① AI 輔助系統為醫生提供了一定的安全感,過度依賴 AI 輔助系統可能會使新一代醫師的診斷及判斷能力下降。② AI 的學習數據多基于一個地區特定醫療機構,各個醫療機構采用的設備生產廠家和參考標準不同,AI 學習的醫學數據人群地域不同,這種情況下建立的模型可能不能在大范圍使用,存在一定的局限性,須進一步完善算法,將數據進行統一化處理,進一步健全統一的標準化評價體系。③ 現階段 AI 相關技術的特異度和靈敏度都已經很高了,但現有 AI 輔助系統均依賴于臨床專家提供的經過標注的胃腸鏡、影像學等靜態圖像為依據進行學習訓練后再作出診斷,無法診斷訓練組中未包含的疾病亞型而導致漏診,并有可能將訓練組中少見的疾病亞型作為疾病常態導致誤診,更無法依靠 AI 來發現新的病種;同時 AI 輔助系統只能識別高質量的圖像,對于有出血灶等低質量圖像無法有效識別。目前仍需進一步擴大胃腸鏡圖片及視頻的訓練集和測試集來獲得更高的靈敏度與特異度,減少漏診和誤診,同時當出現漏診和誤診時會面臨責任分配和法律上的挑戰,應該完善 AI 在醫療方面的法律法規。④ 醫療信息數據還涉及到患者隱私和倫理的問題,患者信息泄露會造成很多社會問題,所以 AI 快速發展的同時醫療信息安全問題也必須得到高度重視。⑤ 一項調查研究[41]表明,公眾對 AI 在醫療領域的影響感覺很明顯的占 16.68%,AI 對醫療的影響能感受到一點的比重最高,為 71.44%,這說明 AI 已經開始逐漸應用到醫療領域當中,但應用的范圍還不夠廣泛,我國 AI 在醫療領域的應用才剛剛開始,還需長時間進行普及。⑥ 目前利用 AI 輔助系統篩查早癌研究及應用僅能在具備豐富經驗的內鏡醫師與病理醫師的大型醫療中心得以實現,而基層醫院由于各方面條件的不足、限制了該技術的發展。⑦ AI 輔助系統在人文關懷上無法代替臨床醫護人員,可能會在當前醫療環境下使醫患關系更加緊張,倡導人性化關懷是每位醫護人員必須牢記在心的基本修養。⑧ AI 深度學習技術和 CNN 在炎癥性腸病、胃腸超聲內鏡、內鏡逆行胰膽管造影等領域探索較少,未來的探索性研究值得期待。
4.2 展望
① AI 深度學習技術能否將內鏡或影像學實時檢查的信息同步到腹腔鏡成像系統,進而指導醫生作出更加準確的手術切除范圍方案;AI 深度學習可以使腹腔鏡成像系統更加準確地同步癌腫周圍組織器官、脈管、淋巴結等受累情況,可以更加準確地指導術者手術過程中對腫瘤及周圍組織、脈管、淋巴結等作出更加全面準確的清掃。② 未來 AI 系統能否綜合評估每例患者情況,為消化道腫瘤患者提供個性化的治療方案;未來 AI 系統能否做到療效預估,預估每例患者的最適用藥劑量和最佳藥物種類,預估最適的手術方案。③ 隨著 5G 技術的到來以及與 AI、大數據的結合,未來有可能解決目前我國醫療資源發展不平衡的難題,使基層醫院能夠實時共享頂級醫院的醫療技術,解決看病難的問題,AI 將不斷驅動醫療行業創新和發展,不斷解決更多醫學難題。
5 結語
隨著以深度學習技術為代表的 AI 技術在消化道腫瘤領域研究的不斷深入,AI 輔助下的消化道內鏡、影像學和病理學系統對消化道腫瘤的診斷效率和準確率變得更高,相信 AI 能更好地推動消化道腫瘤及整個醫學領域的進步,使更多的患者受益。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:李少東,查閱文獻和撰寫文章;董睿智和梁斌協助查閱文獻;洪森和李世權修改論文;康振華對文章進行校對和修正。