人工智能(AI)是研究、開發用于模擬、拓展人類智能的理論、方法、技術及應用系統的一門新興科學技術,目前已在智能醫療方面取得了重大突破,且其在糖尿病視網膜病變(DR)、早產兒視網膜病變等眼底疾病的診療中展現出了巨大潛力。國內外已開展多項AI技術應用于DR篩查的臨床試驗,其不僅具有較高的準確率,而且可為醫生節省閱片時間,降低社會、醫療工作及患者的負擔。但目前由于缺乏針對DR智能診斷技術的評估系統,AI系統的準確性尚缺乏大數據的驗證。其次,大部分研究的彩色眼底照片拍攝范圍為后極部45°,僅顯示了最容易發病的區域,使得有些病變無法被檢測。此外,目前DR篩查系統尚未應用于臨床,大多數處于前瞻性研究試驗階段,從研發環境到臨床仍存在諸多障礙,醫生無法使用真實的患者數據來評估AI系統,因此在臨床中并未普及。未來可進一步完善和建立DR篩查的算法以及診斷模型,使DR的AI篩查更加準確。
引用本文: 鄔艷蓉, 夏桂媚, 高清月, 袁自由, 郝少峰. 人工智能在糖尿病視網膜病變篩查中的應用進展. 中華眼底病雜志, 2021, 37(6): 491-494. doi: 10.3760/cma.j.cn511434-20200808-00384 復制
人工智能(AI)是計算機科學的一個分支,是研究、開發用于模擬、拓展人類智能的理論、方法、技術及應用系統的一門新興科學技術。隨著計算機科技的快速發展,AI逐漸成為各科學領域研究與開發相結合的主流技術[1]。20世紀70年代AI就被應用于醫療領域,且大批醫療領域AI系統隨之產生。隨著硬件計算能力的提升、數據量的不斷積累以及深度學習(DL)理論的提出及發展,AI技術在智能醫療方面取得了重大突破[2]。此外,AI在眼科方面也取得了巨大進展,2016年,谷歌公司開發了一款機器學習(ML)系統,其可以自動識別糖尿病視網膜病變(DR)眼底彩色照片[3]。通過AI對糖尿病患者進行DR篩查,可早發現、早診斷,從而提高篩查效率,提高資源利用率,降低社會、醫療工作及患者的負擔,具有重要的臨床意義和社會價值。現就AI在DR篩查中的應用進展作一綜述。
1 DR
DR是進展期糖尿病諸多的并發癥之一,是處于工作年齡的人群視力喪失的主要原因之一[4]。糖尿病的危險因素包括缺乏鍛煉、體重超重、衰老、城市化和人口規模等,其發病率較高,呈逐年增長趨勢,并成為一個巨大且日益增加的全球健康負擔[5]。2017年全球約有4.25億糖尿病患者,預計到2045年將增至6.29億,其中80%以上的糖尿病患者生活在中等收入國家[6]。全世界糖尿病患者的DR患病率為34.6%,其中10.2%患有視力障礙性視網膜病變[7]。糖尿病患者DR的患病率在60~69歲之間達到高峰,并隨著原發疾病病程的延長而增加[4]。值得注意的是,DR的發展相對來說是隱匿的,而且癥狀較少;所以,當糖尿病患者首次到醫院檢查眼底病變時,其大多處于中晚期[8]。此外,受經濟條件、醫療資源分布不均衡以及受教育水平的影響,中國農村地區糖尿病患病率高于城市地區[4]。因此,在我國,對所有糖尿病患者進行初步篩查,可盡早發現DR,延緩疾病進展,對其診斷和治療有至關重要的作用[8]。
2 AI用于DR篩查的原理
目前存在多種DR的AI診斷技術,這些技術通常采用AI的ML技術,主要是通過DL技術實現。ML是AI的一個子領域,它不需要程序執行特定任務,就可以識別模型并通過學習從而自動預測結果[9]。DL是ML技術在AI領域的一個新的分支,DL能夠識別數據中的復雜結構,而無需指定規則。DL算法中涉及多種函數,可同時處理多維數據,其中一種架構為卷積神經網絡(CNN),這種網絡的靈感來源于大腦可以通過改變神經元之間突觸連接的強度來學習復雜的數據模式。DL在輸入與輸出之間有許多中間層的人工神經元,這些人工神經元像視覺皮層一樣,學習一個逐漸復雜的特征來檢測病變的結構,從而識別病變[10]。
3 AI應用于DR篩查
目前,DR篩查公開的國際數據集有Messidor-2和EyePACs,通過對數據集的不斷訓練,可以提高AI篩查DR的準確性。2013年,Abràmoff等[11]公布的法國愛荷華州的DR篩查計劃(IDP項目)在識別及時轉診的DR(RDR,定義為中度非增生型DR及以上或存在黃斑水腫)的靈敏度為96.8%,特異性為59.4%,曲線下面積低于0.937。2016年,Abràmoff等[12]將CNN與現有的DR檢測算法結合起來,提高了RDR的檢測水平,并采用Messidor-2公共數據集進行AI系統DR篩查,具有較高的靈敏度(97.0%)和特異性(87.0%)。由此可以看出,將CNN用于DR篩查,提高了檢測RDR的特異性。Gulshan等[2]采用CNN的DL算法將專家標記的128 175張彩色眼底照片作為訓練集進行訓練,其發現,EyePACs數據集對RDR診斷的靈敏度、特異性分別為97.5%、93.4%,Messidor-2數據集對RDR診斷的靈敏度、特異性分別為96.1%、93.9%。這提示,通過DL的DR篩查系統,不管是用未經公開的篩查數據還是公共的數據集,都具有良好的篩查效果(表1)。

此外,DL的進步使得多種AI篩查DR的算法得以開發,例如Google AI、EyeArt和IDx-DR等用于檢測DR。其中IDx-DR設備是世界上第一個被美國食品和藥物管理局批準用于檢測DR的AI設備[19]。
國內也進行了相關的研究。2019年,He等[8]一項臨床試驗納入889例在社區醫院就診的糖尿病患者,所有患者均拍攝了彩色眼底照片,根據DR的國際分類標準,對比眼科醫生和AI自動分級的靈敏度和特異性。彩色眼底照片由非散瞳眼底照相機進行攝取,分別拍攝了以黃斑和視盤為中心的45°眼底像,將其交由社區醫生和AI系統進行獨立閱片,結果顯示,AI輔助DR篩查在檢測DR、RDR方面具有較高的靈敏度和特異性;AI檢測DR的靈敏度、特異性和曲線下面積分別為90.79%、98.50%、0.946,檢測RDR時,AI的靈敏度、特異性和曲線下面積分別為91.18%、98.79%、0.950。該研究表明,在社區醫院進行DR篩查是可行的。此外,在拍攝彩色眼底照片時無需散瞳即可迅速得出報告,社區醫生可根據病情需要決定是否轉診到上級醫院。該技術不僅推動了社區醫院的發展,也減少了上級醫院的就診壓力,為AI篩查DR提供了有用的數據。但該研究存在樣本量少的局限性,其結論需要更大篩查樣本的數據加以驗證。高韶暉等[20]應用了AI機器人輔助診斷DR,即“崇岳”機器人,這是第一個基于CNN的DR篩查機器人,使得DR篩查更加全面和廣泛,且該機器人篩查DR具有較高的靈敏度和特異性,其中是否患有DR模型的靈敏度為96.0%、特異性為87.9%,是否患有RDR模型的靈敏度為90.4%,特異性為95.2%。該研究表明,基于CNN的DR篩查具有較強的診斷DR的能力。但值得注意的是,該研究中的AI模型只能獨立篩查單純的DR眼底病變,缺乏篩查DR與老年性黃斑病變、視網膜動靜脈阻塞等其他病變的能力。李萌等[21]使用由2~3名眼科高級職稱醫生精確標注病變且確診的1000張彩色眼底照片作為數據集,分別由AI系統組和醫生組(包括初級、中級和高級職稱的眼科醫生組和內分泌醫生組)進行診斷,記錄AI系統組和醫生組讀取單張彩色眼底照片所消耗的時間和總時間,比較AI系統和不同級別醫生讀片的準確性和效率。結果表明,眼科醫生組不同職稱醫生單張閱片時間分別為(7.25±6.58)、(5.18±5.01)、(5.18±3.47)s,總耗時分別為2.02、1.44、1.44 h;內分泌不同職稱醫生組單張閱片的時間分別為(4.63±1.87)、(3.74±3.47)、(5.71±3.47)s,總耗時分別為1.29、1.04、1.58 h;AI系統單張閱片的平均時間為(1.62±0.67)s,總耗時為0.45 h,且該AI系統診斷DR的符合率可達95.2%。由此可以看出DR篩查AI系統符合率可達高級職稱專業醫生水平,且大大縮短了閱片時間,其可為大規模的糖尿病患者進行DR篩查提供可靠的方法和平臺。此外,篩查DR的AI系統除了可對DR進行分級,使患者了解DR的分級情況以及嚴重程度,以便及時得到治療以外,還可標注病變部位及特征,更有利于發現病變;同時由于眼科醫生數量缺乏,該技術也有助于非眼科醫生準確識別DR,對于需及時轉診的患者可提供有效診斷,降低致盲率,減輕玻璃體視網膜外科醫生篩查負擔以及患者的經濟負擔。
此外,所有基于云的軟件程序都需要高計算能力,需通過與網絡連接才能實現實時報告,而最新的關于篩查DR的AI系統Medios,是來自印度用于診斷DR的基于智能手機的離線AI算法[22]。該研究證實了基于AI的軟件在檢測RDR方面具有較高的靈敏度和特異性。試驗對象為在印度某三級糖尿病護理和研究中心門診部就診的304例糖尿病患者,所有患者均采用基于智能手機(iPhone 6)的Remidio手機相機上的非散瞳眼底照相機(Remidio NM FOP)捕捉雙眼視網膜圖像,每只眼均拍攝后極部3個視野(以黃斑為中心的視野、鼻側視野和顳側視野),將該軟件診斷的結果與兩名有20年視網膜手術經驗的眼科醫生對比,該算法在檢測RDR、任何DR以及威脅視力的DR(VTDR,定義為重度非增生型DR及以上或存在黃斑水腫)具有很高的靈敏度和特異性。其檢測RDR的靈敏度為98.84%,特異性為86.73%。這一新算法與智能手機的成像設備結合起來,使得操作更為簡單便捷。Medios軟件與Remidio NM-FOP應用程序集成在智能手機上,用于獲取視網膜圖像,由于利用了CoreML和OpenGL智能手機的高性能,圖像處理可以直接在圖形處理器上完成,而不需要依賴互聯網。此外,與以前使用的DL算法相比,離線自動分析的主要優勢可能在于它可以在智能手機上離線使用,并且不需要互聯網訪問即可實現實時傳輸圖像,從而可以將結果提供給患者以指導醫護人員并對患者進行宣教[23]。因此,智能手機檢眼鏡可能是資源受限國家進行DR大規模篩查的一種理想選擇。但與其他研究相比,進行離線自動化分析的測試人群樣本量較少,需要高質量的圖像才可實現對病變的學習以及分類,且當前版本的離線AI并沒有根據國際臨床DR嚴重程度進行分級,因此無法評估各個級別DR的靈敏度以及特異性。
4 不足與展望
目前缺乏針對DR智能診斷技術的評估系統[19],AI系統的準確性尚缺乏大數據的驗證。其次,大部分研究的彩色眼底照片拍攝范圍為后極部45°,僅顯示了最容易發病的區域,而整個視網膜可以從230°的角度觀察,如新生血管通常位于眼底45°以外[24],這使得有些病變無法被檢測。在未來的研究中,可通過采集更大范圍的彩色眼底照片以減少漏診率。而且,目前所研究的DR篩查中大多使用的是2D非立體數字眼底照相,缺乏對眼底立體結構的展示,限制了對某些疾病的診斷,未來可以著眼于AI在DR多維模式成像中的應用。此外,目前DR篩查系統尚未應用于臨床,大多數處于前瞻性研究試驗階段,從研發環境到臨床仍存在諸多障礙,醫生無法使用真實的患者數據來評估AI系統,因此在臨床中并未普及[25]。未來可進一步完善和建立DR篩查的算法以及診斷模型,使DR的AI篩查更加準確[20]。
人工智能(AI)是計算機科學的一個分支,是研究、開發用于模擬、拓展人類智能的理論、方法、技術及應用系統的一門新興科學技術。隨著計算機科技的快速發展,AI逐漸成為各科學領域研究與開發相結合的主流技術[1]。20世紀70年代AI就被應用于醫療領域,且大批醫療領域AI系統隨之產生。隨著硬件計算能力的提升、數據量的不斷積累以及深度學習(DL)理論的提出及發展,AI技術在智能醫療方面取得了重大突破[2]。此外,AI在眼科方面也取得了巨大進展,2016年,谷歌公司開發了一款機器學習(ML)系統,其可以自動識別糖尿病視網膜病變(DR)眼底彩色照片[3]。通過AI對糖尿病患者進行DR篩查,可早發現、早診斷,從而提高篩查效率,提高資源利用率,降低社會、醫療工作及患者的負擔,具有重要的臨床意義和社會價值。現就AI在DR篩查中的應用進展作一綜述。
1 DR
DR是進展期糖尿病諸多的并發癥之一,是處于工作年齡的人群視力喪失的主要原因之一[4]。糖尿病的危險因素包括缺乏鍛煉、體重超重、衰老、城市化和人口規模等,其發病率較高,呈逐年增長趨勢,并成為一個巨大且日益增加的全球健康負擔[5]。2017年全球約有4.25億糖尿病患者,預計到2045年將增至6.29億,其中80%以上的糖尿病患者生活在中等收入國家[6]。全世界糖尿病患者的DR患病率為34.6%,其中10.2%患有視力障礙性視網膜病變[7]。糖尿病患者DR的患病率在60~69歲之間達到高峰,并隨著原發疾病病程的延長而增加[4]。值得注意的是,DR的發展相對來說是隱匿的,而且癥狀較少;所以,當糖尿病患者首次到醫院檢查眼底病變時,其大多處于中晚期[8]。此外,受經濟條件、醫療資源分布不均衡以及受教育水平的影響,中國農村地區糖尿病患病率高于城市地區[4]。因此,在我國,對所有糖尿病患者進行初步篩查,可盡早發現DR,延緩疾病進展,對其診斷和治療有至關重要的作用[8]。
2 AI用于DR篩查的原理
目前存在多種DR的AI診斷技術,這些技術通常采用AI的ML技術,主要是通過DL技術實現。ML是AI的一個子領域,它不需要程序執行特定任務,就可以識別模型并通過學習從而自動預測結果[9]。DL是ML技術在AI領域的一個新的分支,DL能夠識別數據中的復雜結構,而無需指定規則。DL算法中涉及多種函數,可同時處理多維數據,其中一種架構為卷積神經網絡(CNN),這種網絡的靈感來源于大腦可以通過改變神經元之間突觸連接的強度來學習復雜的數據模式。DL在輸入與輸出之間有許多中間層的人工神經元,這些人工神經元像視覺皮層一樣,學習一個逐漸復雜的特征來檢測病變的結構,從而識別病變[10]。
3 AI應用于DR篩查
目前,DR篩查公開的國際數據集有Messidor-2和EyePACs,通過對數據集的不斷訓練,可以提高AI篩查DR的準確性。2013年,Abràmoff等[11]公布的法國愛荷華州的DR篩查計劃(IDP項目)在識別及時轉診的DR(RDR,定義為中度非增生型DR及以上或存在黃斑水腫)的靈敏度為96.8%,特異性為59.4%,曲線下面積低于0.937。2016年,Abràmoff等[12]將CNN與現有的DR檢測算法結合起來,提高了RDR的檢測水平,并采用Messidor-2公共數據集進行AI系統DR篩查,具有較高的靈敏度(97.0%)和特異性(87.0%)。由此可以看出,將CNN用于DR篩查,提高了檢測RDR的特異性。Gulshan等[2]采用CNN的DL算法將專家標記的128 175張彩色眼底照片作為訓練集進行訓練,其發現,EyePACs數據集對RDR診斷的靈敏度、特異性分別為97.5%、93.4%,Messidor-2數據集對RDR診斷的靈敏度、特異性分別為96.1%、93.9%。這提示,通過DL的DR篩查系統,不管是用未經公開的篩查數據還是公共的數據集,都具有良好的篩查效果(表1)。

此外,DL的進步使得多種AI篩查DR的算法得以開發,例如Google AI、EyeArt和IDx-DR等用于檢測DR。其中IDx-DR設備是世界上第一個被美國食品和藥物管理局批準用于檢測DR的AI設備[19]。
國內也進行了相關的研究。2019年,He等[8]一項臨床試驗納入889例在社區醫院就診的糖尿病患者,所有患者均拍攝了彩色眼底照片,根據DR的國際分類標準,對比眼科醫生和AI自動分級的靈敏度和特異性。彩色眼底照片由非散瞳眼底照相機進行攝取,分別拍攝了以黃斑和視盤為中心的45°眼底像,將其交由社區醫生和AI系統進行獨立閱片,結果顯示,AI輔助DR篩查在檢測DR、RDR方面具有較高的靈敏度和特異性;AI檢測DR的靈敏度、特異性和曲線下面積分別為90.79%、98.50%、0.946,檢測RDR時,AI的靈敏度、特異性和曲線下面積分別為91.18%、98.79%、0.950。該研究表明,在社區醫院進行DR篩查是可行的。此外,在拍攝彩色眼底照片時無需散瞳即可迅速得出報告,社區醫生可根據病情需要決定是否轉診到上級醫院。該技術不僅推動了社區醫院的發展,也減少了上級醫院的就診壓力,為AI篩查DR提供了有用的數據。但該研究存在樣本量少的局限性,其結論需要更大篩查樣本的數據加以驗證。高韶暉等[20]應用了AI機器人輔助診斷DR,即“崇岳”機器人,這是第一個基于CNN的DR篩查機器人,使得DR篩查更加全面和廣泛,且該機器人篩查DR具有較高的靈敏度和特異性,其中是否患有DR模型的靈敏度為96.0%、特異性為87.9%,是否患有RDR模型的靈敏度為90.4%,特異性為95.2%。該研究表明,基于CNN的DR篩查具有較強的診斷DR的能力。但值得注意的是,該研究中的AI模型只能獨立篩查單純的DR眼底病變,缺乏篩查DR與老年性黃斑病變、視網膜動靜脈阻塞等其他病變的能力。李萌等[21]使用由2~3名眼科高級職稱醫生精確標注病變且確診的1000張彩色眼底照片作為數據集,分別由AI系統組和醫生組(包括初級、中級和高級職稱的眼科醫生組和內分泌醫生組)進行診斷,記錄AI系統組和醫生組讀取單張彩色眼底照片所消耗的時間和總時間,比較AI系統和不同級別醫生讀片的準確性和效率。結果表明,眼科醫生組不同職稱醫生單張閱片時間分別為(7.25±6.58)、(5.18±5.01)、(5.18±3.47)s,總耗時分別為2.02、1.44、1.44 h;內分泌不同職稱醫生組單張閱片的時間分別為(4.63±1.87)、(3.74±3.47)、(5.71±3.47)s,總耗時分別為1.29、1.04、1.58 h;AI系統單張閱片的平均時間為(1.62±0.67)s,總耗時為0.45 h,且該AI系統診斷DR的符合率可達95.2%。由此可以看出DR篩查AI系統符合率可達高級職稱專業醫生水平,且大大縮短了閱片時間,其可為大規模的糖尿病患者進行DR篩查提供可靠的方法和平臺。此外,篩查DR的AI系統除了可對DR進行分級,使患者了解DR的分級情況以及嚴重程度,以便及時得到治療以外,還可標注病變部位及特征,更有利于發現病變;同時由于眼科醫生數量缺乏,該技術也有助于非眼科醫生準確識別DR,對于需及時轉診的患者可提供有效診斷,降低致盲率,減輕玻璃體視網膜外科醫生篩查負擔以及患者的經濟負擔。
此外,所有基于云的軟件程序都需要高計算能力,需通過與網絡連接才能實現實時報告,而最新的關于篩查DR的AI系統Medios,是來自印度用于診斷DR的基于智能手機的離線AI算法[22]。該研究證實了基于AI的軟件在檢測RDR方面具有較高的靈敏度和特異性。試驗對象為在印度某三級糖尿病護理和研究中心門診部就診的304例糖尿病患者,所有患者均采用基于智能手機(iPhone 6)的Remidio手機相機上的非散瞳眼底照相機(Remidio NM FOP)捕捉雙眼視網膜圖像,每只眼均拍攝后極部3個視野(以黃斑為中心的視野、鼻側視野和顳側視野),將該軟件診斷的結果與兩名有20年視網膜手術經驗的眼科醫生對比,該算法在檢測RDR、任何DR以及威脅視力的DR(VTDR,定義為重度非增生型DR及以上或存在黃斑水腫)具有很高的靈敏度和特異性。其檢測RDR的靈敏度為98.84%,特異性為86.73%。這一新算法與智能手機的成像設備結合起來,使得操作更為簡單便捷。Medios軟件與Remidio NM-FOP應用程序集成在智能手機上,用于獲取視網膜圖像,由于利用了CoreML和OpenGL智能手機的高性能,圖像處理可以直接在圖形處理器上完成,而不需要依賴互聯網。此外,與以前使用的DL算法相比,離線自動分析的主要優勢可能在于它可以在智能手機上離線使用,并且不需要互聯網訪問即可實現實時傳輸圖像,從而可以將結果提供給患者以指導醫護人員并對患者進行宣教[23]。因此,智能手機檢眼鏡可能是資源受限國家進行DR大規模篩查的一種理想選擇。但與其他研究相比,進行離線自動化分析的測試人群樣本量較少,需要高質量的圖像才可實現對病變的學習以及分類,且當前版本的離線AI并沒有根據國際臨床DR嚴重程度進行分級,因此無法評估各個級別DR的靈敏度以及特異性。
4 不足與展望
目前缺乏針對DR智能診斷技術的評估系統[19],AI系統的準確性尚缺乏大數據的驗證。其次,大部分研究的彩色眼底照片拍攝范圍為后極部45°,僅顯示了最容易發病的區域,而整個視網膜可以從230°的角度觀察,如新生血管通常位于眼底45°以外[24],這使得有些病變無法被檢測。在未來的研究中,可通過采集更大范圍的彩色眼底照片以減少漏診率。而且,目前所研究的DR篩查中大多使用的是2D非立體數字眼底照相,缺乏對眼底立體結構的展示,限制了對某些疾病的診斷,未來可以著眼于AI在DR多維模式成像中的應用。此外,目前DR篩查系統尚未應用于臨床,大多數處于前瞻性研究試驗階段,從研發環境到臨床仍存在諸多障礙,醫生無法使用真實的患者數據來評估AI系統,因此在臨床中并未普及[25]。未來可進一步完善和建立DR篩查的算法以及診斷模型,使DR的AI篩查更加準確[20]。