引用本文: 韓偉, 魏延, 趙麗, 張哲, 周金池, 趙曙光. 人工智能輔助窄帶成像內鏡診斷系統對結直腸腺瘤性息肉診斷價值的 meta 分析. 華西醫學, 2023, 38(1): 72-78. doi: 10.7507/1002-0179.202007314 復制
中晚期結直腸癌患者的 5 年生存率不足 10%,早期發現并治療可將其提升至 90%以上,而腺瘤性息肉作為結直腸癌的癌前病變之一,其早期切除可使癌變率降低 80%以上,可見早期診斷與治療的重要價值[1]。目前,有研究發現篩查腸鏡的腺瘤檢出率每提高 1%,結腸癌發生風險即降低 3%,而窄帶成像內鏡突出顯示病變細微結構的優勢可明顯提高篩查腸鏡的腺瘤檢出率,大大降低癌變風險,但由于部分息肉過于微小或扁平,內鏡醫師經驗不足也可能使漏診與誤診的幾率增加,有研究發現其鏡檢漏診率為 22%~26%[2-4]。因此,有必要尋找新的輔助診斷方法,以提高篩查腸鏡的腺瘤檢出率并準確分辨息肉性質。大量研究顯示人工智能輔助診斷技術與內鏡技術的結合可明顯提高結直腸腺瘤的診斷準確性[5-8],但仍需要循證醫學證據來進一步證實。本meta 分析探討了國內外文獻資料中人工智能輔助窄帶成像內鏡診斷系統診斷結直腸腺瘤性息肉的價值,以期為其臨床應用提供循證醫學依據。
1 資料與方法
1.1 文獻納入與排除標準
納入標準:① 有關人工智能輔助窄帶成像內鏡診斷系統提高對結直腸腺瘤性息肉檢出率的研究;② 受試者均以組織病理學檢查結果作為金標準;③ 研究有完整的結局,并且能夠提取真陽性值、真陰性值、假陽性值、假陰性值等診斷試驗四格表數據。排除標準:① 綜述、簡訊、動物實驗、個案報道及會議論文等;② 試驗未以活體組織病理學作為金標準;③ 試驗的相關數據不完整或者無法提取診斷試驗四格表數據。
1.2 文獻檢索策略
本研究使用主題詞聯合自由詞的方式構建檢索式,通過計算機智能檢索英文數據庫(包括Cochrane Library、Embase、PubMed和Web of Science),以及中文數據庫(中國生物醫學文獻數據庫、中國知網、維普、萬方),并且以手工檢索相關參考文獻作為補充,檢索的時限為 2000 年 1 月 1 日-2022 年 10 月 31 日。中文檢索詞為:“窄帶成像內鏡”“腺瘤性息肉”“大腸”“結腸”“直腸”“結直腸”“人工智能”“深度學習”“卷積神經網絡”等;英文檢索詞為:“narrow-banging imaging”“NBI”“adenomatous polyps”“neoplastic polyps”“intestinal”“bowel”“colon”“rectum”“colorectal”“artificial intelligence”“deep learning”“convolutional neural networks”等。中國生物醫學文獻數據庫的檢索式為:(窄帶成像技術或者 NBI)并且(結直腸腺瘤性息肉)并且(人工智能或者深度學習或者卷積神經網絡)并且(診斷),PubMed 的檢索式為:(narrow-banding imaging OR NBI) AND (adenomatous polyps OR neoplastic polyps) AND (intestinal OR colon OR rectum OR colorectal) AND (artificial intelligence OR deep learning OR convolutional neural networks OR AI) AND (diagnos*)。
1.3 文獻質量評價及數據提取
由兩人分別使用診斷準確性研究質量評價工具 2標準[9]對納入文獻進行全面質量評價,包括患者選擇、待評價試驗、金標準、病例流程及進展情況等風險偏移相關內容,及患者選擇、待評價試驗、金標準等臨床適用性評價相關內容。之后由第三人進行核對,存在分歧的部分經共同討論決定最終結果。對納入文獻提取研究的作者姓名、國別、類型、金標準、樣本量、病灶數、內鏡型號、智能診斷系統類別及必要的四格表結局指標等原始數據。
1.4 統計學方法
用 RevMan 5.3 軟件對納入文獻進行質量評估并制作圖片。用 Meta-Disc 1.4 軟件對 Spearman 相關系數進行計算,以評估各項研究間是否存在閾值效應異質性,并且計算診斷比值比的 Cochran’s Q 檢驗以及 I2 檢驗,以評估各項研究間的非閾值效應引起的異質性。若 P≥0.10 且 I2≤50%,則提示各項研究間無明顯異質性,使用固定效應模型進行合并分析,若 P<0.10 或 I2>50%,則提示各項研究間異質性明顯,用隨機效應模型進行分析,并分別計算合并靈敏度、合并特異度、合并陽性似然比、合并陰性似然比、合并診斷比值比及其 95%置信區間(confidence interval,CI),繪制綜合受試者操作特征曲線(summary receiver operating characteristic curve,SROC),并計算曲線下面積(area under the curve,AUC)。若 AUC 值越接近 1,則說明診斷的準確性越高。用 Stata 13.0 統計軟件來繪制 Deeks 漏斗圖,以判斷納入研究的發表偏倚。
2 結果
2.1 文獻檢索及篩選結果
共初步檢索到文獻 107 篇,去除重復文獻后,根據納入與排除標準,閱讀文題及摘要再次剔除 72 篇,之后由 2 名人員仔細閱讀全文,最終納入 11 篇文章。文獻篩選具體過程見圖1。

*具體包括:PubMed(
2.2 文獻基本特征及質量評價
納入的 11 篇文獻[10-20]數據完整,共計 2178 例患者,3017 個病灶。納入研究的基本特征匯總在表1。根據風險偏倚及臨床適用性評價標準,對納入的研究進行質量評價,具體文獻質量評價結果見圖2。


a. 質量評價總體圖;b. 各文獻質量評價圖。①:病例選擇;②:待評價試驗;③:金標準;④:病例流程和進展情況。綠色代表偏倚低風險,黃色代表偏倚風險不清楚,紅色代表偏倚高風險
2.3 Meta 分析結果
2.3.1 人工智能輔助窄帶成像內鏡診斷系統診斷結直腸腺瘤性息肉準確性的 meta 分析
對納入的 11 項研究[10-20]進行異質性檢驗,結果顯示,閾值效應 Spearman 相關系數=?0.041(P=0.905),表明無閾值效應引起的異質性。診斷比值比的 Cochran’s Q=31.98(P<0.001),I2=68.7%,表明存在非閾值效應引起的異質性,采用隨機效應模型對人工智能輔助窄帶成像內鏡診斷系統對結直腸腺瘤性息肉的診斷準確度進行合并分析,結果顯示,合并靈敏度、合并特異度、合并陽性似然比、合并陰性似然比及合并診斷比值比分別為 0.91、0.88、7.41、0.10 及 76.45,SROC 的 AUC 值為 0.957,詳見表2 及圖3。


2.3.2 人工智能輔助窄帶成像內鏡診斷系統診斷微小型腺瘤性息肉準確性的 meta 分析
納入的研究中,5 篇文獻[10-12, 14-15]的研究結果涉及人工智能輔助窄帶成像內鏡診斷系統診斷微小型腺瘤性息肉(直徑<5 mm),其合并診斷比值比異質性檢驗結果顯示,各項研究間無異質性(Cochran’s Q=1.63,P=0.803,I2=0%),采用固定效應模型進行 meta 分析,結果顯示,人工智能輔助窄帶成像內鏡診斷系統診斷微小型結直腸腺瘤性息肉的合并靈敏度及合并特異度分別為 0.93、0.91,SROC 的 AUC 值為 0.971,詳見表3。

2.3.3 人工智能輔助窄帶成像內鏡診斷系統與內鏡經驗不足者診斷結直腸腺瘤性息肉準確性的比較
納入的研究中,5 篇文獻[10-11, 13, 16, 19]的研究結果涉及內鏡經驗不足者診斷結直腸腺瘤性息肉,其合并診斷比值比異質性檢驗結果顯示,各項研究間存在明顯異質性(Cochran’s Q=38.69,P<0.001,I2=89.7%),考慮與各研究對內鏡經驗不足者定義不統一有關,采用隨機效應模型進行 meta 分析,結果顯示,內鏡經驗不足者診斷結直腸腺瘤性息肉的合并靈敏度及合并特異度分別為 0.84 及 0.76,SROC 的 AUC 值為 0.848(詳見表4 及圖4)。人工智能輔助窄帶成像內鏡診斷系統與內鏡經驗不足者的 AUC 分別為 0.958、0.848,標準誤分別為 0.008、0.055,二者比較差異有統計學意義(Z=1.979,P=0.048),說明人工智能輔助窄帶成像內鏡診斷系統較內鏡經驗不足者對腺瘤性息肉具有較高的診斷準確度。


2.4 研究異質性來源及發表偏倚分析
各項研究間的合并診斷比值比的異質性檢驗結果顯示,研究間存在明顯異質性,為探討其來源,對研究者種群(亞洲及歐美)、病灶數(是否多于 300)、研究類型(前瞻性與回顧性)及智能系統類型(卷積神經網絡或者深度學習網絡)4 個變量進行單因素 meta 回歸分析,結果顯示研究納入的病灶數目差異可能是研究間異質性的主要來源,詳見表5。使用 Deeks 漏斗圖評估研究的發表偏倚情況(P=0.440),通過觀察可發現研究間對稱性尚可,說明納入文獻不存在明顯的發表偏倚,見圖5。


ESS:有效樣本量
3 討論
臨床上,結直腸癌患者往往因早期癥狀不典型而忽視病情,導致很多患者就診時已處于結直腸癌中晚期,治療效果欠佳,因此提前積極篩查尤為重要。腺瘤性息肉作為結直腸癌的獨立危險因素之一,及早診斷及鏡下治療對阻斷其癌變意義重大。普通白光內鏡顯示病變表面細微結構的能力較差,對息肉組織學性質的判斷能力不足,而窄帶成像內鏡利用窄帶濾波器過濾寬帶紅光,僅保留窄帶藍綠光譜,形成窄帶成像內鏡圖像,無需使用化學染色劑即可清晰顯示黏膜表面細微腺體結構及微血管形態,能較為準確地顯示黏膜細微變化以及異常血管分布情況,可使內鏡醫生實時獲得準確的光學診斷信息,極大提高了結直腸腺瘤性息肉早期診斷的準確性,臨床應用效果良好[21-23]。Yaacob 等[24]研究發現窄帶成像內鏡在判斷結直腸可疑病變的組織學變化方面優勢明顯,能夠準確區分腫瘤和非腫瘤性病變;Atkinson 等[25]通過 meta 分析發現窄帶成像內鏡較白光內鏡能顯著提高篩查腸鏡的腺瘤檢出率,腸道準備良好使優勢更為明顯,但由于部分息肉過于微小淺表等原因,加上內鏡醫師經驗不足,導致結腸鏡檢中息肉漏診率高達 20%以上,嚴重影響鏡檢準確率、患者的后續治療和預后,如何有效解決這一問題已成為臨床研究熱點之一。
近年來,計算機模擬人類思維方式的人工智能技術飛速發展,使得多種臨床疾病的診斷準確性有了明顯提高,人工智能在腫瘤及帕金森病等疾病診斷中有較好的表現,在消化系統疾病的臨床診療中也表現突出[23-26]。若人工智能技術能與光學診斷技術結合,則不僅能有效彌補內鏡醫師經驗不足造成的不利影響,還能大大提高腺瘤性息肉的診斷效率和診斷準確率,便于醫師快速準確地作出臨床決策,積極指導患者進行鏡下治療,使患者受益,同時可節約醫療成本[26-30]。本 meta 分析結果顯示,人工智能輔助窄帶成像內鏡診斷系統診斷結直腸腺瘤性息肉的靈敏度、特異度及診斷比值比分別為 0.91、0.88 及 76.45,AUC 值為 0.957,似然比點狀圖顯示合并值位于左下象限(陽性似然比為 7.41,陰性似然比為 0.10),提示人工智能輔助窄帶成像內鏡診斷系統診斷結果陰性即可排除腺瘤性息肉可能,說明其具有極高的診斷準確性和臨床應用價值;在微小型息肉識別與診斷方面,人工智能輔助窄帶成像內鏡診斷系統與內鏡經驗不足醫師的診斷準確度差異顯著,也說明在臨床鏡檢中應用人工智能輔助診斷技術可有效克服醫師經驗不足導致的不利影響,提高篩查腸鏡的腺瘤檢出率及診斷準確度。Bang 等[31]的 meta 分析探討了人工智能在結直腸息肉組織學預測和檢測方面的診斷準確性優勢,結果顯示靈敏度及特異度分別為 0.93 和 0.87,AUC 為 0.96,同樣顯示出明顯的組織學預測及檢測優勢,與本文分析結果一致。
本研究對可能影響異質性的多個變量進行單因素及多因素 meta 回歸分析,發現各研究間病灶數目差異可能是研究異質性的主要來源,但由于試驗方案設計、樣本量大小、研究者選擇、內鏡參數及人工智能類型等因素在研究間存在差異,加上一些陰性研究結果可能存在未被發表的現象,meta 分析中各研究間難免存在不同程度的異質性和發表偏倚。除此之外,本研究仍存在一定的不足:① 研究納入文獻較少,樣本量較小,結果缺乏有力的臨床證據;② 研究納入的文獻多為回顧性研究,研究者選擇、病例資料收集等因素均對結果有一定程度的影響;③ 納入的研究多以亞洲人群作為研究對象,對歐美等其他人群研究較少,使研究結果不能代表所有人群。考慮到上述不足,未來仍需要大樣本量、高質量的多中心臨床應用試驗來證實并優化人工智能輔助窄帶成像內鏡診斷系統在結直腸腺瘤性息肉中的應用。
綜上所述,人工智能輔助窄帶成像內鏡診斷系統對結直腸腺瘤性息肉具有較高的診斷準確率,可在一定程度上彌補內鏡醫師經驗水平差異對診斷結果造成的不利影響,提高內鏡經驗不足者對結直腸腺瘤性息肉的診斷準確性,且更加便利快捷,臨床應用前景良好。
利益沖突:所有作者聲明不存在利益沖突。
中晚期結直腸癌患者的 5 年生存率不足 10%,早期發現并治療可將其提升至 90%以上,而腺瘤性息肉作為結直腸癌的癌前病變之一,其早期切除可使癌變率降低 80%以上,可見早期診斷與治療的重要價值[1]。目前,有研究發現篩查腸鏡的腺瘤檢出率每提高 1%,結腸癌發生風險即降低 3%,而窄帶成像內鏡突出顯示病變細微結構的優勢可明顯提高篩查腸鏡的腺瘤檢出率,大大降低癌變風險,但由于部分息肉過于微小或扁平,內鏡醫師經驗不足也可能使漏診與誤診的幾率增加,有研究發現其鏡檢漏診率為 22%~26%[2-4]。因此,有必要尋找新的輔助診斷方法,以提高篩查腸鏡的腺瘤檢出率并準確分辨息肉性質。大量研究顯示人工智能輔助診斷技術與內鏡技術的結合可明顯提高結直腸腺瘤的診斷準確性[5-8],但仍需要循證醫學證據來進一步證實。本meta 分析探討了國內外文獻資料中人工智能輔助窄帶成像內鏡診斷系統診斷結直腸腺瘤性息肉的價值,以期為其臨床應用提供循證醫學依據。
1 資料與方法
1.1 文獻納入與排除標準
納入標準:① 有關人工智能輔助窄帶成像內鏡診斷系統提高對結直腸腺瘤性息肉檢出率的研究;② 受試者均以組織病理學檢查結果作為金標準;③ 研究有完整的結局,并且能夠提取真陽性值、真陰性值、假陽性值、假陰性值等診斷試驗四格表數據。排除標準:① 綜述、簡訊、動物實驗、個案報道及會議論文等;② 試驗未以活體組織病理學作為金標準;③ 試驗的相關數據不完整或者無法提取診斷試驗四格表數據。
1.2 文獻檢索策略
本研究使用主題詞聯合自由詞的方式構建檢索式,通過計算機智能檢索英文數據庫(包括Cochrane Library、Embase、PubMed和Web of Science),以及中文數據庫(中國生物醫學文獻數據庫、中國知網、維普、萬方),并且以手工檢索相關參考文獻作為補充,檢索的時限為 2000 年 1 月 1 日-2022 年 10 月 31 日。中文檢索詞為:“窄帶成像內鏡”“腺瘤性息肉”“大腸”“結腸”“直腸”“結直腸”“人工智能”“深度學習”“卷積神經網絡”等;英文檢索詞為:“narrow-banging imaging”“NBI”“adenomatous polyps”“neoplastic polyps”“intestinal”“bowel”“colon”“rectum”“colorectal”“artificial intelligence”“deep learning”“convolutional neural networks”等。中國生物醫學文獻數據庫的檢索式為:(窄帶成像技術或者 NBI)并且(結直腸腺瘤性息肉)并且(人工智能或者深度學習或者卷積神經網絡)并且(診斷),PubMed 的檢索式為:(narrow-banding imaging OR NBI) AND (adenomatous polyps OR neoplastic polyps) AND (intestinal OR colon OR rectum OR colorectal) AND (artificial intelligence OR deep learning OR convolutional neural networks OR AI) AND (diagnos*)。
1.3 文獻質量評價及數據提取
由兩人分別使用診斷準確性研究質量評價工具 2標準[9]對納入文獻進行全面質量評價,包括患者選擇、待評價試驗、金標準、病例流程及進展情況等風險偏移相關內容,及患者選擇、待評價試驗、金標準等臨床適用性評價相關內容。之后由第三人進行核對,存在分歧的部分經共同討論決定最終結果。對納入文獻提取研究的作者姓名、國別、類型、金標準、樣本量、病灶數、內鏡型號、智能診斷系統類別及必要的四格表結局指標等原始數據。
1.4 統計學方法
用 RevMan 5.3 軟件對納入文獻進行質量評估并制作圖片。用 Meta-Disc 1.4 軟件對 Spearman 相關系數進行計算,以評估各項研究間是否存在閾值效應異質性,并且計算診斷比值比的 Cochran’s Q 檢驗以及 I2 檢驗,以評估各項研究間的非閾值效應引起的異質性。若 P≥0.10 且 I2≤50%,則提示各項研究間無明顯異質性,使用固定效應模型進行合并分析,若 P<0.10 或 I2>50%,則提示各項研究間異質性明顯,用隨機效應模型進行分析,并分別計算合并靈敏度、合并特異度、合并陽性似然比、合并陰性似然比、合并診斷比值比及其 95%置信區間(confidence interval,CI),繪制綜合受試者操作特征曲線(summary receiver operating characteristic curve,SROC),并計算曲線下面積(area under the curve,AUC)。若 AUC 值越接近 1,則說明診斷的準確性越高。用 Stata 13.0 統計軟件來繪制 Deeks 漏斗圖,以判斷納入研究的發表偏倚。
2 結果
2.1 文獻檢索及篩選結果
共初步檢索到文獻 107 篇,去除重復文獻后,根據納入與排除標準,閱讀文題及摘要再次剔除 72 篇,之后由 2 名人員仔細閱讀全文,最終納入 11 篇文章。文獻篩選具體過程見圖1。

*具體包括:PubMed(
2.2 文獻基本特征及質量評價
納入的 11 篇文獻[10-20]數據完整,共計 2178 例患者,3017 個病灶。納入研究的基本特征匯總在表1。根據風險偏倚及臨床適用性評價標準,對納入的研究進行質量評價,具體文獻質量評價結果見圖2。


a. 質量評價總體圖;b. 各文獻質量評價圖。①:病例選擇;②:待評價試驗;③:金標準;④:病例流程和進展情況。綠色代表偏倚低風險,黃色代表偏倚風險不清楚,紅色代表偏倚高風險
2.3 Meta 分析結果
2.3.1 人工智能輔助窄帶成像內鏡診斷系統診斷結直腸腺瘤性息肉準確性的 meta 分析
對納入的 11 項研究[10-20]進行異質性檢驗,結果顯示,閾值效應 Spearman 相關系數=?0.041(P=0.905),表明無閾值效應引起的異質性。診斷比值比的 Cochran’s Q=31.98(P<0.001),I2=68.7%,表明存在非閾值效應引起的異質性,采用隨機效應模型對人工智能輔助窄帶成像內鏡診斷系統對結直腸腺瘤性息肉的診斷準確度進行合并分析,結果顯示,合并靈敏度、合并特異度、合并陽性似然比、合并陰性似然比及合并診斷比值比分別為 0.91、0.88、7.41、0.10 及 76.45,SROC 的 AUC 值為 0.957,詳見表2 及圖3。


2.3.2 人工智能輔助窄帶成像內鏡診斷系統診斷微小型腺瘤性息肉準確性的 meta 分析
納入的研究中,5 篇文獻[10-12, 14-15]的研究結果涉及人工智能輔助窄帶成像內鏡診斷系統診斷微小型腺瘤性息肉(直徑<5 mm),其合并診斷比值比異質性檢驗結果顯示,各項研究間無異質性(Cochran’s Q=1.63,P=0.803,I2=0%),采用固定效應模型進行 meta 分析,結果顯示,人工智能輔助窄帶成像內鏡診斷系統診斷微小型結直腸腺瘤性息肉的合并靈敏度及合并特異度分別為 0.93、0.91,SROC 的 AUC 值為 0.971,詳見表3。

2.3.3 人工智能輔助窄帶成像內鏡診斷系統與內鏡經驗不足者診斷結直腸腺瘤性息肉準確性的比較
納入的研究中,5 篇文獻[10-11, 13, 16, 19]的研究結果涉及內鏡經驗不足者診斷結直腸腺瘤性息肉,其合并診斷比值比異質性檢驗結果顯示,各項研究間存在明顯異質性(Cochran’s Q=38.69,P<0.001,I2=89.7%),考慮與各研究對內鏡經驗不足者定義不統一有關,采用隨機效應模型進行 meta 分析,結果顯示,內鏡經驗不足者診斷結直腸腺瘤性息肉的合并靈敏度及合并特異度分別為 0.84 及 0.76,SROC 的 AUC 值為 0.848(詳見表4 及圖4)。人工智能輔助窄帶成像內鏡診斷系統與內鏡經驗不足者的 AUC 分別為 0.958、0.848,標準誤分別為 0.008、0.055,二者比較差異有統計學意義(Z=1.979,P=0.048),說明人工智能輔助窄帶成像內鏡診斷系統較內鏡經驗不足者對腺瘤性息肉具有較高的診斷準確度。


2.4 研究異質性來源及發表偏倚分析
各項研究間的合并診斷比值比的異質性檢驗結果顯示,研究間存在明顯異質性,為探討其來源,對研究者種群(亞洲及歐美)、病灶數(是否多于 300)、研究類型(前瞻性與回顧性)及智能系統類型(卷積神經網絡或者深度學習網絡)4 個變量進行單因素 meta 回歸分析,結果顯示研究納入的病灶數目差異可能是研究間異質性的主要來源,詳見表5。使用 Deeks 漏斗圖評估研究的發表偏倚情況(P=0.440),通過觀察可發現研究間對稱性尚可,說明納入文獻不存在明顯的發表偏倚,見圖5。


ESS:有效樣本量
3 討論
臨床上,結直腸癌患者往往因早期癥狀不典型而忽視病情,導致很多患者就診時已處于結直腸癌中晚期,治療效果欠佳,因此提前積極篩查尤為重要。腺瘤性息肉作為結直腸癌的獨立危險因素之一,及早診斷及鏡下治療對阻斷其癌變意義重大。普通白光內鏡顯示病變表面細微結構的能力較差,對息肉組織學性質的判斷能力不足,而窄帶成像內鏡利用窄帶濾波器過濾寬帶紅光,僅保留窄帶藍綠光譜,形成窄帶成像內鏡圖像,無需使用化學染色劑即可清晰顯示黏膜表面細微腺體結構及微血管形態,能較為準確地顯示黏膜細微變化以及異常血管分布情況,可使內鏡醫生實時獲得準確的光學診斷信息,極大提高了結直腸腺瘤性息肉早期診斷的準確性,臨床應用效果良好[21-23]。Yaacob 等[24]研究發現窄帶成像內鏡在判斷結直腸可疑病變的組織學變化方面優勢明顯,能夠準確區分腫瘤和非腫瘤性病變;Atkinson 等[25]通過 meta 分析發現窄帶成像內鏡較白光內鏡能顯著提高篩查腸鏡的腺瘤檢出率,腸道準備良好使優勢更為明顯,但由于部分息肉過于微小淺表等原因,加上內鏡醫師經驗不足,導致結腸鏡檢中息肉漏診率高達 20%以上,嚴重影響鏡檢準確率、患者的后續治療和預后,如何有效解決這一問題已成為臨床研究熱點之一。
近年來,計算機模擬人類思維方式的人工智能技術飛速發展,使得多種臨床疾病的診斷準確性有了明顯提高,人工智能在腫瘤及帕金森病等疾病診斷中有較好的表現,在消化系統疾病的臨床診療中也表現突出[23-26]。若人工智能技術能與光學診斷技術結合,則不僅能有效彌補內鏡醫師經驗不足造成的不利影響,還能大大提高腺瘤性息肉的診斷效率和診斷準確率,便于醫師快速準確地作出臨床決策,積極指導患者進行鏡下治療,使患者受益,同時可節約醫療成本[26-30]。本 meta 分析結果顯示,人工智能輔助窄帶成像內鏡診斷系統診斷結直腸腺瘤性息肉的靈敏度、特異度及診斷比值比分別為 0.91、0.88 及 76.45,AUC 值為 0.957,似然比點狀圖顯示合并值位于左下象限(陽性似然比為 7.41,陰性似然比為 0.10),提示人工智能輔助窄帶成像內鏡診斷系統診斷結果陰性即可排除腺瘤性息肉可能,說明其具有極高的診斷準確性和臨床應用價值;在微小型息肉識別與診斷方面,人工智能輔助窄帶成像內鏡診斷系統與內鏡經驗不足醫師的診斷準確度差異顯著,也說明在臨床鏡檢中應用人工智能輔助診斷技術可有效克服醫師經驗不足導致的不利影響,提高篩查腸鏡的腺瘤檢出率及診斷準確度。Bang 等[31]的 meta 分析探討了人工智能在結直腸息肉組織學預測和檢測方面的診斷準確性優勢,結果顯示靈敏度及特異度分別為 0.93 和 0.87,AUC 為 0.96,同樣顯示出明顯的組織學預測及檢測優勢,與本文分析結果一致。
本研究對可能影響異質性的多個變量進行單因素及多因素 meta 回歸分析,發現各研究間病灶數目差異可能是研究異質性的主要來源,但由于試驗方案設計、樣本量大小、研究者選擇、內鏡參數及人工智能類型等因素在研究間存在差異,加上一些陰性研究結果可能存在未被發表的現象,meta 分析中各研究間難免存在不同程度的異質性和發表偏倚。除此之外,本研究仍存在一定的不足:① 研究納入文獻較少,樣本量較小,結果缺乏有力的臨床證據;② 研究納入的文獻多為回顧性研究,研究者選擇、病例資料收集等因素均對結果有一定程度的影響;③ 納入的研究多以亞洲人群作為研究對象,對歐美等其他人群研究較少,使研究結果不能代表所有人群。考慮到上述不足,未來仍需要大樣本量、高質量的多中心臨床應用試驗來證實并優化人工智能輔助窄帶成像內鏡診斷系統在結直腸腺瘤性息肉中的應用。
綜上所述,人工智能輔助窄帶成像內鏡診斷系統對結直腸腺瘤性息肉具有較高的診斷準確率,可在一定程度上彌補內鏡醫師經驗水平差異對診斷結果造成的不利影響,提高內鏡經驗不足者對結直腸腺瘤性息肉的診斷準確性,且更加便利快捷,臨床應用前景良好。
利益沖突:所有作者聲明不存在利益沖突。