引用本文: 洪子強, 金大成, 李宏超, 成濤, 白向豆, 吳旭升, 崔百強, 茍云久. 基于內鏡的人工智能輔助診斷系統在早期食管癌診斷中準確性的系統評價與Meta分析. 中國胸心血管外科臨床雜志, 2023, 30(9): 1329-1336. doi: 10.7507/1007-4848.202204033 復制
在過去的20年里,食管癌的發病率上升了44%,并且仍在逐步上升[1]。食管癌在組織學上主要分為食管鱗狀細胞癌(鱗癌)和食管腺癌,在我國食管鱗癌占所有食管癌病例的90%[2]。早期食管癌患者5年生存率可達85%以上;然而,大多數患者被診斷時已為晚期,5年生存率降至20%以下[3]。因此,早期診斷、早期治療是提高食管癌治愈率、降低死亡率的有效方法[4]。
隨著人工智能(artificial intelligence,AI)技術的快速發展,通過深度學習建立的AI輔助診斷系統已廣泛應用于胃腸道內鏡圖像的分析[5]。AI輔助診斷系統通過采集大量圖像,將圖像分為用于構建模型的訓練數據集和用于驗證其有效性的測試數據集[6]。據文獻[5]報道,AI輔助診斷系統在早期胃腸道腫瘤和胃黏膜層幽門螺桿菌感染的識別方面具有較高的診斷價值。目前,AI輔助系統的應用已逐漸擴展到食管疾病的內鏡評估,有多項研究報道AI輔助內鏡診斷早期食管癌的準確性較高。然而,這些研究中的內鏡類型不同、研究質量不同且樣本量較小。因此,本文進行了系統回顧和Meta分析,旨在研究AI輔助系統在早期食管癌診斷中的準確性,以期為臨床實踐提供循證醫學證據。
1 資料與方法
1.1 文獻納入和排除標準
1.1.1 納入標準
① 隊列研究;② 采用AI輔助內鏡診斷系統檢測食管良性病變和早期食管癌,同時通過內窺鏡檢測病變的浸潤深度;③ 可獲得整體真陽性率、假陽性率、假陰性率和真陰性率的研究。
1.1.2 排除標準
① 非中英文文獻,重復發表的文獻;② 綜述、個案報道、經驗總結等;③ 不能提取有用數據或不能獲取全文。
1.2 文獻檢索
采用主題詞加自由詞相結合的檢索方式,計算機檢索PubMed、EMbase、The Cochrane Library、Web of Science及萬方數據庫、維普數據庫、中國知網數據庫,搜索建庫至2022年3月公開發表的基于內鏡的AI輔助診斷系統診斷早期食管癌的相關文獻。英文檢索詞:artificial intelligence、artificial intelligence-assisted diagnostic system、endoscopy、early esophageal neoplasms、esophageal cancer、esophageal neoplasm、diagnostic。中文檢索詞:人工智能、人工智能輔助診斷系統、內窺鏡檢查、早期食管癌、食管腫瘤、診斷。
1.3 文獻篩查與資料提取
由兩位胸外科醫生獨立篩選文獻、提取數據,然后進行交叉核對。如果出現分歧,則由第三位胸外科醫生決定或通過集體討論來解決。每項研究提取的數據如下:第一作者姓名、文獻發表年份和類型、研究設計(前瞻性隊列研究或回顧性隊列研究)、患者數量、內窺鏡圖像數量、內窺鏡醫生數量、AI輔助診斷模型和內窺鏡醫生診斷同一數據集的數據(真陽性率、假陽性率、假陰性率和真陰性率)、病變的組織學類型、使用的內窺鏡類型和算法。
1.4 納入研究的質量評價
兩位胸外科醫生根據QUADAS-2評價工具對納入的研究進行評估[7]。如果出現分歧,則由第三位胸外科醫生決定或通過集體討論來解決。該工具包括4個領域:患者選擇、指標測試、參考標準以及流程和時間[7]。前3個領域也被評估為適用性方面的問題。每個部分都被劃分為具有高、低或不明確的偏倚風險。
1.5 統計學分析
統計分析主要使用Stata 16軟件、Meta-Disc 1.4和RevMan 5.4軟件。隨機效應模型之后的雙變量混合效應回歸模型用于以下指標:合并靈敏性、特異性、陽性似然比、陰性似然比、診斷比值比(diagnostic odds ratio,DOR)和曲線下面積(area under the curve,AUC)。首先通過目視檢查合并的綜合受試者工作特征(SROC)曲線來評估納入研究的異質性,不對稱形狀表明存在顯著的異質性[8]。以Spearman相關性分析檢驗有無閾值效應引起的異質性;采用Cochran’s Q檢驗及I2值檢驗非閾值效應引起的異質性,若I2<50%,可認為研究結果間有較低異質性,此時采用固定效應模型進行合并;若I2≥50%,則可認為存在高度異質性,采用隨機效應模型進行合并[9]。通過亞組分析和Meta回歸分析探討異質性的來源。使用Deek’s 漏斗圖評估發表偏倚,P<0.1表示漏斗圖不對稱。P≤0.05為差異有統計學意義。同時使用Fagan’s列線圖評價AI輔助系統在食管癌診斷中的作用及臨床價值。
2 結果
2.1 文獻檢索結果
通過數據庫檢索,共得到1 752篇文獻,經Endnote X9剔除重復文獻后,再經閱讀文題和摘要初篩后排除不相關文獻,最終閱讀全文后保留17篇文獻[10-26],其中13篇為回顧性研究[10-11, 13, 16-21, 23-26]、4篇為前瞻性研究[12, 14-15, 22]。文獻篩選流程及結果見圖1。入選文獻的基本信息見表1。


*:PubMed(
2.2 納入文獻的質量評價
根據QUADAS-2量表,使用RevMan 5.4軟件對納入的文獻進行質量評價,評價結果見圖2。

2.3 Meta分析結果
2.3.1 閾值效應分析
運用Meta-Disc 1.4軟件計算本研究的Spearman,結果顯示相關系數ρ=–0.083(P=0.751),說明不存在閾值效應。
2.3.2 AI輔助系統診斷早期食管癌的效能分析
AI輔助系統診斷早期食管癌的合并靈敏性為0.94[95%CI(0.91,0.96)],特異性為0.85[95%CI(0.74,0.92)],陽性似然比為6.28[95%CI(3.48,11.33)],陰性似然比為0.07[95%CI(0.05,0.11)],DOR為89[95%CI(38,208)],AUC為0.96[95%CI(0.94,0.98)];見圖3~4。

a:靈敏性;b:特異性;c:陽性似然比;d:陰性似然比

2.3.3 AI輔助系統診斷早期食管癌的亞組分析和Meta回歸分析
亞組分析結果表明,西方AI輔助系統診斷早期食管癌的準確性[DOR=96,95%CI(43,217)]高于亞洲[DOR=80,95%CI(25,260)];納入的文獻中回顧性研究[DOR=102,95%CI(35,298)]的診斷準確性高于前瞻性研究[DOR=67,95%CI(47,96)];見表2。Meta回歸分析表明,樣本量大小(P=0.02)和內窺鏡類型(P=0.001)差異具有統計學意義,可能是異質性的來源;見圖5。


2.3.4 靈敏性分析和發表偏倚
通過依次對納入的研究進行逐一排除再進行合并分析,發現結果變化不明顯,說明納入的各項研究對結果無顯著影響。繪制的Deek’s定量漏斗圖顯示,納入研究分布在回歸線的兩側(P=0.11),說明本研究不存在潛在發表偏倚;見圖6。

2.3.5 臨床應用價值
通過繪制Fagan’s 列線圖對臨床應用價值進行評價,當設定驗前概率為50%時,陽性似然比為6,所得驗后概率為86%;當設定驗前概率為50%時,陰性似然比為0.07,所得驗后概率為7%。結果表明應用AI輔助系統診斷早期食管癌具有重要的臨床意義;見圖7。

3 討論
一項在中國食管癌高發區磁縣進行的研究[27]顯示,通過消化道內鏡篩查,發現有食管病變的患者經過積極治療后,10年后該地食管癌人群患病率及病死率分別下降了29.47%和33.56%。然而內鏡醫生的診斷經驗及操作水平存在差異,這對食管癌的早期診斷產生了重要影響。AI輔助系統的出現有望解決這一問題,AI具有強大的數據處理能力,適用于醫學圖像的識別和復雜臨床數據的分析,其與消化內鏡成像技術結合后,可以對大量內鏡圖像進行學習、訓練并可以分析內鏡圖像與疾病診斷之間的關聯,從而達到模仿人類認知的水平,幫助醫師完成快速、精準的診斷[28-29]。近年來,AI輔助系統與消化內鏡技術的聯合應用在早期食管癌診斷中發揮著越來越重要的作用。
長海醫院的王智杰等[30]回顧性選取5 159張胃鏡圖像進行AI深度學習模型的訓練及驗證發現,其診斷早期胃癌的靈敏性達88.8%,特異性為89.7%,準確率為89.4%,大大提高了早期胃癌的診斷水平。本研究對AI輔助系統在早期食管癌的診斷價值方面進行了系統評價和Meta分析,共納入17篇文獻。Meta分析結果顯示,AI輔助系統診斷食管癌的合并靈敏性為94%、特異性為85%,說明漏診率和誤診率分別為6%和15%,表明AI輔助系統精確識別和診斷食管癌患者與非食管癌患者的能力都很強。本研究的陽性似然比為6.28,表明正確診斷食管癌患者的可能性是錯誤診斷食管癌患者的6.28倍;陰性似然比為0.07,表明錯誤診斷非食管癌患者的可能性是正確診斷非食管癌患者的0.07倍。DOR表示診斷試驗的結果與疾病的聯系強度,數值越大表明判別效果越好[31]。本研究的DOR為89,表明AI輔助系統診斷食管癌的判別效果較好。本研究的AUC值為0.96,也表明AI輔助系統診斷食管癌具有較高的診斷價值。上述這些結果表明內鏡醫生應用AI輔助系統會提高食管癌的早期檢出率,從而提高患者的長期生存率。
由于我國每年食管癌新發病例數較多,故食管鱗癌及癌前病變的早期診斷對提高患者治療效果和預后至關重要[32]。內鏡檢查為早期食管癌的常規檢查手段,AI輔助系統的應用在提高內鏡篩查的靈敏性與診斷準確率上起到了積極的作用。最近發表的關于AI輔助診斷系統的研究[24]可能為內鏡醫生識別和診斷食管癌提供更多的幫助。在AI輔助系統的幫助下,缺乏經驗的內鏡醫生的診斷能力得到了顯著提高,這表明AI輔助系統是一種實用的方法,可以提高食管癌的診斷率,并可以幫助內鏡醫生準確識別病變的浸潤深度。對于食管癌的SM1期病變,由于其淋巴結轉移風險相對較低(<10%),建議行內鏡下切除[33]。而SM2~3期病變具有較高的淋巴結轉移風險(>25%),應采用食管切除術或聯合放化療進行治療[34]。因此,準確識別病變的浸潤深度非常重要。有研究[19]報道,基于AI的診斷系統在食管癌浸潤深度方面的診斷準確率高于內鏡醫生,尤其是在SM1期病變方面。此外,AI輔助系統還可以通過識別毛細血管內環路對病變的浸潤深度進行間接分類,這是早期食管癌的一個特殊形態學特征[35]。
本Meta分析結果表明,AI輔助診斷早期食管癌具有較高的診斷價值。然而AI輔助診斷系統在早期食管癌的內鏡診斷中也存在一些問題。首先,幾乎所有的早期食管癌內鏡AI輔助診斷系統都存在一定的假陰性,例如Horie等[11]報道的47例食管癌患者中有1例被遺漏,假陰性率為2%,在臨床上較易被遺漏的是小的病變(≤5 mm),因此提高這些病變的檢測準確率是關鍵。除此之外,AI診斷會出現假陽性,造成過度診療,在Horie等[11]的研究中,有188張圖片被誤診為陽性,假陽性率達19.7%,陰影、正常解剖結構(食管胃結合部、左主支氣管、錐體壓迫處)以及良性病變(瘢痕、局部萎縮、巴雷特食管、炎癥、食管胃黏膜異位、上皮下腫物)是造成假陽性的原因。其次,目前的早期食管癌內鏡AI輔助診斷系統主要是基于靜態數據的處理,而不是基于動態視頻建模,靜態圖像缺少動態視頻中因黏膜環境準備欠佳和內鏡運動造成的環境影響,導致信息量缺失,AI訓練集與實際內鏡工作環境間存在較大差距,因此在一定程度上也影響其臨床適用性[23]。雖然AI輔助診斷早期食管癌仍存在一些問題,但是隨著AI技術的快速發展,相信在未來這些問題都可以解決,AI輔助診斷系統可以為更多的食管癌患者帶來福音。
本Meta分析的局限性:(1)納入的研究大都是回顧性研究,只有4篇前瞻性研究,選擇偏倚是不可避免的,需要更大樣本的前瞻性研究進行驗證;(2)納入的部分研究樣本量偏少,可能會引起分析結果的偏倚;(3)由于數據不足,我們無法基于卷積神經網絡和支持向量機算法對AUC進行亞組分析;(4)由于缺乏數據,我們無法評估SM1期和SM2~3期病變的靈敏性、特異性、陽性似然比、陰性似然比、DOR和AUC。因此,需要進行更多的研究,以區分食管癌的浸潤深度。盡管存在這些局限性,但我們的研究還是為AI輔助系統在早期食管癌診斷中的準確性提供了新見解。
綜上所述,通過對納入文獻進行Meta分析,我們發現AI輔助系統在診斷早期食管癌方面顯示出較高的準確性。然而,由于本文納入的研究大多數為回顧性研究,因此上述結論還需要進一步開展高質量的前瞻性研究來進行驗證。
利益沖突:無。
作者貢獻:洪子強負責論文的設計、撰寫與修改,研究開展,數據處理與分析;金大成、李宏超負責論文的審核和修改;白向豆、吳旭升負責實施研究;崔百強、成濤負責數據整理與分析;茍云久負責論文設計。
在過去的20年里,食管癌的發病率上升了44%,并且仍在逐步上升[1]。食管癌在組織學上主要分為食管鱗狀細胞癌(鱗癌)和食管腺癌,在我國食管鱗癌占所有食管癌病例的90%[2]。早期食管癌患者5年生存率可達85%以上;然而,大多數患者被診斷時已為晚期,5年生存率降至20%以下[3]。因此,早期診斷、早期治療是提高食管癌治愈率、降低死亡率的有效方法[4]。
隨著人工智能(artificial intelligence,AI)技術的快速發展,通過深度學習建立的AI輔助診斷系統已廣泛應用于胃腸道內鏡圖像的分析[5]。AI輔助診斷系統通過采集大量圖像,將圖像分為用于構建模型的訓練數據集和用于驗證其有效性的測試數據集[6]。據文獻[5]報道,AI輔助診斷系統在早期胃腸道腫瘤和胃黏膜層幽門螺桿菌感染的識別方面具有較高的診斷價值。目前,AI輔助系統的應用已逐漸擴展到食管疾病的內鏡評估,有多項研究報道AI輔助內鏡診斷早期食管癌的準確性較高。然而,這些研究中的內鏡類型不同、研究質量不同且樣本量較小。因此,本文進行了系統回顧和Meta分析,旨在研究AI輔助系統在早期食管癌診斷中的準確性,以期為臨床實踐提供循證醫學證據。
1 資料與方法
1.1 文獻納入和排除標準
1.1.1 納入標準
① 隊列研究;② 采用AI輔助內鏡診斷系統檢測食管良性病變和早期食管癌,同時通過內窺鏡檢測病變的浸潤深度;③ 可獲得整體真陽性率、假陽性率、假陰性率和真陰性率的研究。
1.1.2 排除標準
① 非中英文文獻,重復發表的文獻;② 綜述、個案報道、經驗總結等;③ 不能提取有用數據或不能獲取全文。
1.2 文獻檢索
采用主題詞加自由詞相結合的檢索方式,計算機檢索PubMed、EMbase、The Cochrane Library、Web of Science及萬方數據庫、維普數據庫、中國知網數據庫,搜索建庫至2022年3月公開發表的基于內鏡的AI輔助診斷系統診斷早期食管癌的相關文獻。英文檢索詞:artificial intelligence、artificial intelligence-assisted diagnostic system、endoscopy、early esophageal neoplasms、esophageal cancer、esophageal neoplasm、diagnostic。中文檢索詞:人工智能、人工智能輔助診斷系統、內窺鏡檢查、早期食管癌、食管腫瘤、診斷。
1.3 文獻篩查與資料提取
由兩位胸外科醫生獨立篩選文獻、提取數據,然后進行交叉核對。如果出現分歧,則由第三位胸外科醫生決定或通過集體討論來解決。每項研究提取的數據如下:第一作者姓名、文獻發表年份和類型、研究設計(前瞻性隊列研究或回顧性隊列研究)、患者數量、內窺鏡圖像數量、內窺鏡醫生數量、AI輔助診斷模型和內窺鏡醫生診斷同一數據集的數據(真陽性率、假陽性率、假陰性率和真陰性率)、病變的組織學類型、使用的內窺鏡類型和算法。
1.4 納入研究的質量評價
兩位胸外科醫生根據QUADAS-2評價工具對納入的研究進行評估[7]。如果出現分歧,則由第三位胸外科醫生決定或通過集體討論來解決。該工具包括4個領域:患者選擇、指標測試、參考標準以及流程和時間[7]。前3個領域也被評估為適用性方面的問題。每個部分都被劃分為具有高、低或不明確的偏倚風險。
1.5 統計學分析
統計分析主要使用Stata 16軟件、Meta-Disc 1.4和RevMan 5.4軟件。隨機效應模型之后的雙變量混合效應回歸模型用于以下指標:合并靈敏性、特異性、陽性似然比、陰性似然比、診斷比值比(diagnostic odds ratio,DOR)和曲線下面積(area under the curve,AUC)。首先通過目視檢查合并的綜合受試者工作特征(SROC)曲線來評估納入研究的異質性,不對稱形狀表明存在顯著的異質性[8]。以Spearman相關性分析檢驗有無閾值效應引起的異質性;采用Cochran’s Q檢驗及I2值檢驗非閾值效應引起的異質性,若I2<50%,可認為研究結果間有較低異質性,此時采用固定效應模型進行合并;若I2≥50%,則可認為存在高度異質性,采用隨機效應模型進行合并[9]。通過亞組分析和Meta回歸分析探討異質性的來源。使用Deek’s 漏斗圖評估發表偏倚,P<0.1表示漏斗圖不對稱。P≤0.05為差異有統計學意義。同時使用Fagan’s列線圖評價AI輔助系統在食管癌診斷中的作用及臨床價值。
2 結果
2.1 文獻檢索結果
通過數據庫檢索,共得到1 752篇文獻,經Endnote X9剔除重復文獻后,再經閱讀文題和摘要初篩后排除不相關文獻,最終閱讀全文后保留17篇文獻[10-26],其中13篇為回顧性研究[10-11, 13, 16-21, 23-26]、4篇為前瞻性研究[12, 14-15, 22]。文獻篩選流程及結果見圖1。入選文獻的基本信息見表1。


*:PubMed(
2.2 納入文獻的質量評價
根據QUADAS-2量表,使用RevMan 5.4軟件對納入的文獻進行質量評價,評價結果見圖2。

2.3 Meta分析結果
2.3.1 閾值效應分析
運用Meta-Disc 1.4軟件計算本研究的Spearman,結果顯示相關系數ρ=–0.083(P=0.751),說明不存在閾值效應。
2.3.2 AI輔助系統診斷早期食管癌的效能分析
AI輔助系統診斷早期食管癌的合并靈敏性為0.94[95%CI(0.91,0.96)],特異性為0.85[95%CI(0.74,0.92)],陽性似然比為6.28[95%CI(3.48,11.33)],陰性似然比為0.07[95%CI(0.05,0.11)],DOR為89[95%CI(38,208)],AUC為0.96[95%CI(0.94,0.98)];見圖3~4。

a:靈敏性;b:特異性;c:陽性似然比;d:陰性似然比

2.3.3 AI輔助系統診斷早期食管癌的亞組分析和Meta回歸分析
亞組分析結果表明,西方AI輔助系統診斷早期食管癌的準確性[DOR=96,95%CI(43,217)]高于亞洲[DOR=80,95%CI(25,260)];納入的文獻中回顧性研究[DOR=102,95%CI(35,298)]的診斷準確性高于前瞻性研究[DOR=67,95%CI(47,96)];見表2。Meta回歸分析表明,樣本量大小(P=0.02)和內窺鏡類型(P=0.001)差異具有統計學意義,可能是異質性的來源;見圖5。


2.3.4 靈敏性分析和發表偏倚
通過依次對納入的研究進行逐一排除再進行合并分析,發現結果變化不明顯,說明納入的各項研究對結果無顯著影響。繪制的Deek’s定量漏斗圖顯示,納入研究分布在回歸線的兩側(P=0.11),說明本研究不存在潛在發表偏倚;見圖6。

2.3.5 臨床應用價值
通過繪制Fagan’s 列線圖對臨床應用價值進行評價,當設定驗前概率為50%時,陽性似然比為6,所得驗后概率為86%;當設定驗前概率為50%時,陰性似然比為0.07,所得驗后概率為7%。結果表明應用AI輔助系統診斷早期食管癌具有重要的臨床意義;見圖7。

3 討論
一項在中國食管癌高發區磁縣進行的研究[27]顯示,通過消化道內鏡篩查,發現有食管病變的患者經過積極治療后,10年后該地食管癌人群患病率及病死率分別下降了29.47%和33.56%。然而內鏡醫生的診斷經驗及操作水平存在差異,這對食管癌的早期診斷產生了重要影響。AI輔助系統的出現有望解決這一問題,AI具有強大的數據處理能力,適用于醫學圖像的識別和復雜臨床數據的分析,其與消化內鏡成像技術結合后,可以對大量內鏡圖像進行學習、訓練并可以分析內鏡圖像與疾病診斷之間的關聯,從而達到模仿人類認知的水平,幫助醫師完成快速、精準的診斷[28-29]。近年來,AI輔助系統與消化內鏡技術的聯合應用在早期食管癌診斷中發揮著越來越重要的作用。
長海醫院的王智杰等[30]回顧性選取5 159張胃鏡圖像進行AI深度學習模型的訓練及驗證發現,其診斷早期胃癌的靈敏性達88.8%,特異性為89.7%,準確率為89.4%,大大提高了早期胃癌的診斷水平。本研究對AI輔助系統在早期食管癌的診斷價值方面進行了系統評價和Meta分析,共納入17篇文獻。Meta分析結果顯示,AI輔助系統診斷食管癌的合并靈敏性為94%、特異性為85%,說明漏診率和誤診率分別為6%和15%,表明AI輔助系統精確識別和診斷食管癌患者與非食管癌患者的能力都很強。本研究的陽性似然比為6.28,表明正確診斷食管癌患者的可能性是錯誤診斷食管癌患者的6.28倍;陰性似然比為0.07,表明錯誤診斷非食管癌患者的可能性是正確診斷非食管癌患者的0.07倍。DOR表示診斷試驗的結果與疾病的聯系強度,數值越大表明判別效果越好[31]。本研究的DOR為89,表明AI輔助系統診斷食管癌的判別效果較好。本研究的AUC值為0.96,也表明AI輔助系統診斷食管癌具有較高的診斷價值。上述這些結果表明內鏡醫生應用AI輔助系統會提高食管癌的早期檢出率,從而提高患者的長期生存率。
由于我國每年食管癌新發病例數較多,故食管鱗癌及癌前病變的早期診斷對提高患者治療效果和預后至關重要[32]。內鏡檢查為早期食管癌的常規檢查手段,AI輔助系統的應用在提高內鏡篩查的靈敏性與診斷準確率上起到了積極的作用。最近發表的關于AI輔助診斷系統的研究[24]可能為內鏡醫生識別和診斷食管癌提供更多的幫助。在AI輔助系統的幫助下,缺乏經驗的內鏡醫生的診斷能力得到了顯著提高,這表明AI輔助系統是一種實用的方法,可以提高食管癌的診斷率,并可以幫助內鏡醫生準確識別病變的浸潤深度。對于食管癌的SM1期病變,由于其淋巴結轉移風險相對較低(<10%),建議行內鏡下切除[33]。而SM2~3期病變具有較高的淋巴結轉移風險(>25%),應采用食管切除術或聯合放化療進行治療[34]。因此,準確識別病變的浸潤深度非常重要。有研究[19]報道,基于AI的診斷系統在食管癌浸潤深度方面的診斷準確率高于內鏡醫生,尤其是在SM1期病變方面。此外,AI輔助系統還可以通過識別毛細血管內環路對病變的浸潤深度進行間接分類,這是早期食管癌的一個特殊形態學特征[35]。
本Meta分析結果表明,AI輔助診斷早期食管癌具有較高的診斷價值。然而AI輔助診斷系統在早期食管癌的內鏡診斷中也存在一些問題。首先,幾乎所有的早期食管癌內鏡AI輔助診斷系統都存在一定的假陰性,例如Horie等[11]報道的47例食管癌患者中有1例被遺漏,假陰性率為2%,在臨床上較易被遺漏的是小的病變(≤5 mm),因此提高這些病變的檢測準確率是關鍵。除此之外,AI診斷會出現假陽性,造成過度診療,在Horie等[11]的研究中,有188張圖片被誤診為陽性,假陽性率達19.7%,陰影、正常解剖結構(食管胃結合部、左主支氣管、錐體壓迫處)以及良性病變(瘢痕、局部萎縮、巴雷特食管、炎癥、食管胃黏膜異位、上皮下腫物)是造成假陽性的原因。其次,目前的早期食管癌內鏡AI輔助診斷系統主要是基于靜態數據的處理,而不是基于動態視頻建模,靜態圖像缺少動態視頻中因黏膜環境準備欠佳和內鏡運動造成的環境影響,導致信息量缺失,AI訓練集與實際內鏡工作環境間存在較大差距,因此在一定程度上也影響其臨床適用性[23]。雖然AI輔助診斷早期食管癌仍存在一些問題,但是隨著AI技術的快速發展,相信在未來這些問題都可以解決,AI輔助診斷系統可以為更多的食管癌患者帶來福音。
本Meta分析的局限性:(1)納入的研究大都是回顧性研究,只有4篇前瞻性研究,選擇偏倚是不可避免的,需要更大樣本的前瞻性研究進行驗證;(2)納入的部分研究樣本量偏少,可能會引起分析結果的偏倚;(3)由于數據不足,我們無法基于卷積神經網絡和支持向量機算法對AUC進行亞組分析;(4)由于缺乏數據,我們無法評估SM1期和SM2~3期病變的靈敏性、特異性、陽性似然比、陰性似然比、DOR和AUC。因此,需要進行更多的研究,以區分食管癌的浸潤深度。盡管存在這些局限性,但我們的研究還是為AI輔助系統在早期食管癌診斷中的準確性提供了新見解。
綜上所述,通過對納入文獻進行Meta分析,我們發現AI輔助系統在診斷早期食管癌方面顯示出較高的準確性。然而,由于本文納入的研究大多數為回顧性研究,因此上述結論還需要進一步開展高質量的前瞻性研究來進行驗證。
利益沖突:無。
作者貢獻:洪子強負責論文的設計、撰寫與修改,研究開展,數據處理與分析;金大成、李宏超負責論文的審核和修改;白向豆、吳旭升負責實施研究;崔百強、成濤負責數據整理與分析;茍云久負責論文設計。