引用本文: 明帥, 姚溪, 謝坤鵬, 楊瀅瑞, 金學民, 雷博. 糖尿病視網膜病變人工智能自動診斷系統在社區和醫院老年糖尿病患者中的應用效果分析. 中華眼底病雜志, 2022, 38(2): 120-125. doi: 10.3760/cma.j.cn511434-20210429-00224 復制
將基于深度學習的人工智能(AI)技術應用于眼部疾病的自動識別是近年研究和關注的熱點[1]。糖尿病視網膜病變(DR)是糖尿病患者眼部最常見嚴重并發癥[2]。經過深度學習后的AI系統可準確識別DR患者彩色眼底像中微動脈瘤、視網膜出血等表現,對其進行診斷和分級,并且實驗室和真實場景下均已驗證AI篩查DR的靈敏度和特異性已達到美國食品藥品監督管理局(FDA)對DR篩查工具的要求[3-6]。同時,已有研究發現,AI對DR的分級與人工分級一致性較高[7-9]。2018年美國批準世界上第一臺DR篩查AI產品IDx-DR,其后國內部分地區逐漸應用AI于實際診療工作中。本研究分別在社區和醫院對50歲以上的老年糖尿病患者開展DR的AI自動輔助診斷,比較兩種場景下診斷結果的差異。現將結果報道如下。
1 對象和方法
回顧性和前瞻性相結合研究。回顧性收集2018年7月至2021年3月于河南省眼科研究所連續就診的老年糖尿病患者1 608例的臨床資料。其中,男性659例,女性949例;年齡50~79歲,中位數64歲。前瞻性收集2018年12月至2019年4月以社區為來源的老年糖尿病患者496例的臨床資料。其中,男性202例,女性294例;年齡50~81歲,中位數62歲。受檢者均獲知情并簽署書面知情同意書,均為以AI機器人DR篩查為目的,河南省省直機關第2門診部所覆蓋社區管片醫生/護士主動招募者。
納入標準:(1)年齡≥50歲;(2)有符合糖尿病診斷的依據,如病歷、病案系統記錄、最近一次高血糖結果等。排除標準:(1)患者眼球震顫、眼瞼下垂及其他原因導致的無法配合拍照;(2)自述有滲出型老年性黃斑變性、視網膜動/靜脈阻塞及視網膜色素變性等病史。
由眼科或經培訓的內分泌科醫生對患者行雙眼免散瞳眼底彩色照相檢查,拍攝以黃斑中心凹為中心后極部45°正位片[10]。拍攝完畢時,拍攝者對采集圖像進行初步評估,若模糊不清或過度曝光面積>1/3,則進行重新拍攝至AI軟件可識別且過度曝光面積<1/10,重拍次數≤3次。拍攝者同時記錄彩色眼底像質量評估低分原因。所有圖像通過4G網絡即時傳輸至AI自動診斷系統。醫院患者參考眼壓并根據需要決定是否散瞳拍攝。
AI自動診斷系統是基于深度學習的YOLO源碼研發的“嵩岳”機器人,底層軟件由包括河南省人民醫院、北京協和醫院等8家醫院聯合北京致遠慧圖科技有限公司合作研發[11]。實驗室條件下累計病變標注次數1 003 996次,涉及數據集為25 297張DR彩色眼底像。對需轉診的DR(≥2級)靈敏度和特異性均>90%[12],真實世界數據驗證結果均符合美國FDA對DR篩查工具的要求(>80%)[4, 6]。圖像自動分析管理界面為EyeWisdom平臺(北京致遠慧圖科技有限公司),自動診斷結果可在機器人界面呈現給患者。因前期真實世界驗證的特異性>97%[4],若AI診斷DR陰性,則直接出結果告知患者并建議定期隨訪;若AI診斷DR陽性,采用最符合衛生經濟學收益[13]的“AI +人工復核”分級模式,即由中級以上職稱眼科專業醫生進行二次審核和分級,對AI診斷結果進行修正后,形成最終報告和治療建議。
依據DR的國際臨床分級標準[14],將DR分為0~4期,分別為無DR、輕度非增生型DR(NPDR)、中度NPDR、重度NPDR、PDR,不包含糖尿病黃斑水腫。因少數患者既往已診斷DR并接受視網膜激光光凝治療,故將DR分期增加5、6期,分別代表光凝治療后不穩定和光凝治療后穩定。1期為不需轉診DR,2~4期為需轉診DR。單眼存在多張彩色眼底像時,以較嚴重分期為準;雙眼患者診斷結果以較重分級眼為準。
采用SPSS19.0軟件進行數據管理和統計分析。對比分析醫院、社區場景下AI讀片率、直接產生報告率(即DR陰性率)、需轉診DR陽性率和眼底病灶順位等主要觀察指標;兩組率的比較采用χ2檢驗或Fisher's精確概率法。檢驗水準α=0.05,P<0.05為差異有統計學意義。
2 結果
AI總讀片1 989例(94.5%,1 989/2 104),其中社區、醫院來源患者分別為437(88.1%,437/496)、1 552(96.5%,1 552/1 608)例。社區來源AI讀片率低于醫院來源,差異有統計學意義(χ2=51.612,P<0.001)。社區496例中,拍攝者評估圖像質量差者51例(10.3%,51/496)。其中,小瞳孔24例(47.1%,24/51),白內障10例(19.6%,10/51),白內障合并小瞳孔11例(21.6%,11/51),玻璃體混濁5例(9.8%,5/51),角膜云翳1例(2.0%,1/51)。既往未行過眼底檢查者427例(86.1%,427/496)。
社區來源437例中,男性173例,女性264例;年齡50~59歲、≥60歲者分別為39、398例。年齡50~59歲39例中,男性10例,女性29例;≥60歲398例中,男性163例,女性235例。醫院來源1 552例中,男性637例,女性915例;年齡50~59歲、≥60歲者分別為439、1 113例。年齡50~59歲439例中,男性180例,女性259例;≥60歲1 113例中,男性457例,女性656例。
AI診斷DR陰性1 241例(62.4%,1 241/1 989),其中社區、醫院來源患者分別為368(84.2%,368/437)、873(56.3%,873/1 552)例。社區來源AI診斷DR陰性率高于醫院,差異有統計學意義(χ2=113.108,P<0.001)。AI診斷DR陽性748例(37.6%,748/1 989),其中社區、醫院來源患者分別為69(15.8%,69/437)、679(43.8%,679/1 552)。社區來源AI診斷DR陽性率低于醫院,差異有統計學意義(χ2=113.826,P<0.001)。
AI診斷DR陽性748例中,無需轉診DR 245例(12.3%,245/1 989),其中社區、醫院來源分別為36(8.2%,36/437)、209(13.5%,209/1 552)例;需轉診DR 401例(20.2%,401/1 989),其中社區、醫院來源分別為28(6.4%,28/437)、373(24.0%,373/1 552)例。不同來源AI診斷無需轉診、需轉診DR率比較,差異均有統計學意義(χ2=8.853、65.655,P=0.003、<0.001)(表1)。

不同來源AI診斷DR不同分期患者構成中,社區來源患者以無需轉診DR為主(52.2%,36/69);醫院來源DR患者以需轉診DR為主(54.9%,373/679),且已治療DR占比更高(14.3%)。兩組DR的構成差異有統計學意義(χ2=13.435,P=0.001)。
社區來源患者437例和醫院來源患者1 552例中,AI診斷DR 0~4期和激光治療者分別為368、36、11、6、11、5例和873、209、126、90、157、97例。各分期DR患者性別構成比比較,差異無統計學意義(P>0.05)(表2)。

AI自動識別眼底病灶數9 518個,涉及眼次數為2 880次。社區來源患者病灶數前3位分別為玻璃膜疣(68.4%)、視網膜內出血(8.2%)、硬性滲出(4.4%);醫院來源患者前3位分別為視網膜內出血(48.5%)、微動脈瘤(15.9%)和硬性滲出(12.4%)(表3)。

3 討論
AI自動診斷DR產品在國內外均有獲批,且北京、山東等已批準對AI自動診斷醫療服務進行定價收費,使得AI診斷合法應用于臨床,提高醫療工作效率。本研究使用的AI軟件診斷DR的高特異性已被前期真實世界驗證[4],因此僅對AI陽性患者做人工核實的診斷模式具有可行性。國內有關AI診斷DR研究主要集中于AI軟件建立[12,15]、與人工診斷的一致性[7-8,16]、AI篩查分診能力[17]方面。而本研究將AI作為成熟診斷工具,在社區和醫院兩種場景下,開展50歲以上糖尿病患者DR診斷,發現兩種場景下應用結果存在差異,研究側重點更偏向實際應用,而此類研究在國內較少。
AI軟件對彩色眼底像的識別直接影響其應用范圍。本研究結果顯示,社區來源患者彩色眼底像未被AI識別比例為11.9%,顯著高于醫院來源患者,其原因為社區患者采用免散瞳眼底照相模式,老年人小瞳孔普遍,而小瞳孔是本研究中50歲以上老年人成像質量差的主要原因。假設小瞳孔社區患者經散瞳后彩色眼底像均能被AI識別,則兩種場景下AI未識別率則無差異。該結果提示以診斷分級為目的的醫院場景下,散瞳對AI自動診斷很有必要;而以篩查為目的的社區場景下,散瞳將大大提高彩色眼底像質量。
李治璽等[17]對一組糖尿病患者進行免散瞳DR篩查,結果顯示,65.8%的患者不需人工分級直接由AI產生報告,并認為在不遺漏需轉診DR情況下,AI可減少約60.0%的圖像分級工作量,與本研究結果(62.4%)較為一致。本研究進一步提示,AI應用于社區場景下的優勢可能更加明顯,將解放80.0%的醫生工作量。AI應用于基層社區篩查,可部分解決眼科衛生資源匱乏難題,提高社區居民眼科診療服務的可及性。Zhang等[7]對全國155個糖尿病中心共15 805例糖尿病患者的大樣本進行AI篩查,其DR患病率為28.8%,低于本研究結果。其原因可能為本研究對象為50歲以上老年糖尿病患者,該年齡段DR患病率較一般人群高[2];另一方面,本研究樣本選取醫院來源患者比例高,醫院來源的患者各級DR檢出率偏高,使得總體DR患病率高于既往報道。
AI在社區和醫院兩種場景的推廣應用可能是完全不同的收益。本研究結果顯示,社區DR以不需要轉診的1期早期患者為主,AI作為篩查手段擴大基層眼科服務的可及性,對早期病例早發現、早隨訪具有重要的公共衛生意義;而醫院55.0%的DR陽性患者均需轉診開展治療和護理工作,且已治療DR患者百分比也高,此時AI可作為醫生的輔助診斷分級助手,提高診療效率。此外,社區和醫院來源患者眼底病灶類型順位也存在差異。醫院來源患者眼底病灶數最多的是視網膜內出血和微動脈瘤等與DR相關病灶,而社區來源患者則以非DR相關病灶(玻璃膜疣)為主,說明醫院來源患者主動就醫時可能已經存在DR相關視力問題,某種程度上解釋了醫院來源患者DR檢出率高、需轉診DR比例高的現象。
本研究存在的不足為選取的社區來源患者偏少,其原因主要是由于社區篩查組織難度大,短時間內難以納入大量糖尿病患者,但對社區老年人篩查意義重大,有必要進一步擴大篩查范圍。另外,作為應用性研究,未收集患者病程、生活習慣、糖化血紅蛋白水平等實驗室檢查指標數據,無法進行更詳細的分析比較,有待以后進一步探索和研究。
本研究分析了DR自動診斷在50歲以上糖尿病人群中的推廣應用情況。通過比較社區和醫院兩種場景下AI對彩色眼底像的識別率、直接產生報告率、DR陽性率差異及病灶數量的順位,我們認為AI對彩色眼底像識別能力強,基于社區的糖尿病患者DR陽性率顯著低于醫院,在DR陽性率低的社區場景可作為初篩分流,代替醫生排除陰性患者,極大減少圖像分級工作量,對社區老年糖尿病患者DR早期診斷和眼健康的公共衛生意義大。AI識別和標記病灶能力強,在DR患病率高的醫院場景輔助醫生分級,提高診斷效率,有望改變未來醫院DR的診斷模式。
將基于深度學習的人工智能(AI)技術應用于眼部疾病的自動識別是近年研究和關注的熱點[1]。糖尿病視網膜病變(DR)是糖尿病患者眼部最常見嚴重并發癥[2]。經過深度學習后的AI系統可準確識別DR患者彩色眼底像中微動脈瘤、視網膜出血等表現,對其進行診斷和分級,并且實驗室和真實場景下均已驗證AI篩查DR的靈敏度和特異性已達到美國食品藥品監督管理局(FDA)對DR篩查工具的要求[3-6]。同時,已有研究發現,AI對DR的分級與人工分級一致性較高[7-9]。2018年美國批準世界上第一臺DR篩查AI產品IDx-DR,其后國內部分地區逐漸應用AI于實際診療工作中。本研究分別在社區和醫院對50歲以上的老年糖尿病患者開展DR的AI自動輔助診斷,比較兩種場景下診斷結果的差異。現將結果報道如下。
1 對象和方法
回顧性和前瞻性相結合研究。回顧性收集2018年7月至2021年3月于河南省眼科研究所連續就診的老年糖尿病患者1 608例的臨床資料。其中,男性659例,女性949例;年齡50~79歲,中位數64歲。前瞻性收集2018年12月至2019年4月以社區為來源的老年糖尿病患者496例的臨床資料。其中,男性202例,女性294例;年齡50~81歲,中位數62歲。受檢者均獲知情并簽署書面知情同意書,均為以AI機器人DR篩查為目的,河南省省直機關第2門診部所覆蓋社區管片醫生/護士主動招募者。
納入標準:(1)年齡≥50歲;(2)有符合糖尿病診斷的依據,如病歷、病案系統記錄、最近一次高血糖結果等。排除標準:(1)患者眼球震顫、眼瞼下垂及其他原因導致的無法配合拍照;(2)自述有滲出型老年性黃斑變性、視網膜動/靜脈阻塞及視網膜色素變性等病史。
由眼科或經培訓的內分泌科醫生對患者行雙眼免散瞳眼底彩色照相檢查,拍攝以黃斑中心凹為中心后極部45°正位片[10]。拍攝完畢時,拍攝者對采集圖像進行初步評估,若模糊不清或過度曝光面積>1/3,則進行重新拍攝至AI軟件可識別且過度曝光面積<1/10,重拍次數≤3次。拍攝者同時記錄彩色眼底像質量評估低分原因。所有圖像通過4G網絡即時傳輸至AI自動診斷系統。醫院患者參考眼壓并根據需要決定是否散瞳拍攝。
AI自動診斷系統是基于深度學習的YOLO源碼研發的“嵩岳”機器人,底層軟件由包括河南省人民醫院、北京協和醫院等8家醫院聯合北京致遠慧圖科技有限公司合作研發[11]。實驗室條件下累計病變標注次數1 003 996次,涉及數據集為25 297張DR彩色眼底像。對需轉診的DR(≥2級)靈敏度和特異性均>90%[12],真實世界數據驗證結果均符合美國FDA對DR篩查工具的要求(>80%)[4, 6]。圖像自動分析管理界面為EyeWisdom平臺(北京致遠慧圖科技有限公司),自動診斷結果可在機器人界面呈現給患者。因前期真實世界驗證的特異性>97%[4],若AI診斷DR陰性,則直接出結果告知患者并建議定期隨訪;若AI診斷DR陽性,采用最符合衛生經濟學收益[13]的“AI +人工復核”分級模式,即由中級以上職稱眼科專業醫生進行二次審核和分級,對AI診斷結果進行修正后,形成最終報告和治療建議。
依據DR的國際臨床分級標準[14],將DR分為0~4期,分別為無DR、輕度非增生型DR(NPDR)、中度NPDR、重度NPDR、PDR,不包含糖尿病黃斑水腫。因少數患者既往已診斷DR并接受視網膜激光光凝治療,故將DR分期增加5、6期,分別代表光凝治療后不穩定和光凝治療后穩定。1期為不需轉診DR,2~4期為需轉診DR。單眼存在多張彩色眼底像時,以較嚴重分期為準;雙眼患者診斷結果以較重分級眼為準。
采用SPSS19.0軟件進行數據管理和統計分析。對比分析醫院、社區場景下AI讀片率、直接產生報告率(即DR陰性率)、需轉診DR陽性率和眼底病灶順位等主要觀察指標;兩組率的比較采用χ2檢驗或Fisher's精確概率法。檢驗水準α=0.05,P<0.05為差異有統計學意義。
2 結果
AI總讀片1 989例(94.5%,1 989/2 104),其中社區、醫院來源患者分別為437(88.1%,437/496)、1 552(96.5%,1 552/1 608)例。社區來源AI讀片率低于醫院來源,差異有統計學意義(χ2=51.612,P<0.001)。社區496例中,拍攝者評估圖像質量差者51例(10.3%,51/496)。其中,小瞳孔24例(47.1%,24/51),白內障10例(19.6%,10/51),白內障合并小瞳孔11例(21.6%,11/51),玻璃體混濁5例(9.8%,5/51),角膜云翳1例(2.0%,1/51)。既往未行過眼底檢查者427例(86.1%,427/496)。
社區來源437例中,男性173例,女性264例;年齡50~59歲、≥60歲者分別為39、398例。年齡50~59歲39例中,男性10例,女性29例;≥60歲398例中,男性163例,女性235例。醫院來源1 552例中,男性637例,女性915例;年齡50~59歲、≥60歲者分別為439、1 113例。年齡50~59歲439例中,男性180例,女性259例;≥60歲1 113例中,男性457例,女性656例。
AI診斷DR陰性1 241例(62.4%,1 241/1 989),其中社區、醫院來源患者分別為368(84.2%,368/437)、873(56.3%,873/1 552)例。社區來源AI診斷DR陰性率高于醫院,差異有統計學意義(χ2=113.108,P<0.001)。AI診斷DR陽性748例(37.6%,748/1 989),其中社區、醫院來源患者分別為69(15.8%,69/437)、679(43.8%,679/1 552)。社區來源AI診斷DR陽性率低于醫院,差異有統計學意義(χ2=113.826,P<0.001)。
AI診斷DR陽性748例中,無需轉診DR 245例(12.3%,245/1 989),其中社區、醫院來源分別為36(8.2%,36/437)、209(13.5%,209/1 552)例;需轉診DR 401例(20.2%,401/1 989),其中社區、醫院來源分別為28(6.4%,28/437)、373(24.0%,373/1 552)例。不同來源AI診斷無需轉診、需轉診DR率比較,差異均有統計學意義(χ2=8.853、65.655,P=0.003、<0.001)(表1)。

不同來源AI診斷DR不同分期患者構成中,社區來源患者以無需轉診DR為主(52.2%,36/69);醫院來源DR患者以需轉診DR為主(54.9%,373/679),且已治療DR占比更高(14.3%)。兩組DR的構成差異有統計學意義(χ2=13.435,P=0.001)。
社區來源患者437例和醫院來源患者1 552例中,AI診斷DR 0~4期和激光治療者分別為368、36、11、6、11、5例和873、209、126、90、157、97例。各分期DR患者性別構成比比較,差異無統計學意義(P>0.05)(表2)。

AI自動識別眼底病灶數9 518個,涉及眼次數為2 880次。社區來源患者病灶數前3位分別為玻璃膜疣(68.4%)、視網膜內出血(8.2%)、硬性滲出(4.4%);醫院來源患者前3位分別為視網膜內出血(48.5%)、微動脈瘤(15.9%)和硬性滲出(12.4%)(表3)。

3 討論
AI自動診斷DR產品在國內外均有獲批,且北京、山東等已批準對AI自動診斷醫療服務進行定價收費,使得AI診斷合法應用于臨床,提高醫療工作效率。本研究使用的AI軟件診斷DR的高特異性已被前期真實世界驗證[4],因此僅對AI陽性患者做人工核實的診斷模式具有可行性。國內有關AI診斷DR研究主要集中于AI軟件建立[12,15]、與人工診斷的一致性[7-8,16]、AI篩查分診能力[17]方面。而本研究將AI作為成熟診斷工具,在社區和醫院兩種場景下,開展50歲以上糖尿病患者DR診斷,發現兩種場景下應用結果存在差異,研究側重點更偏向實際應用,而此類研究在國內較少。
AI軟件對彩色眼底像的識別直接影響其應用范圍。本研究結果顯示,社區來源患者彩色眼底像未被AI識別比例為11.9%,顯著高于醫院來源患者,其原因為社區患者采用免散瞳眼底照相模式,老年人小瞳孔普遍,而小瞳孔是本研究中50歲以上老年人成像質量差的主要原因。假設小瞳孔社區患者經散瞳后彩色眼底像均能被AI識別,則兩種場景下AI未識別率則無差異。該結果提示以診斷分級為目的的醫院場景下,散瞳對AI自動診斷很有必要;而以篩查為目的的社區場景下,散瞳將大大提高彩色眼底像質量。
李治璽等[17]對一組糖尿病患者進行免散瞳DR篩查,結果顯示,65.8%的患者不需人工分級直接由AI產生報告,并認為在不遺漏需轉診DR情況下,AI可減少約60.0%的圖像分級工作量,與本研究結果(62.4%)較為一致。本研究進一步提示,AI應用于社區場景下的優勢可能更加明顯,將解放80.0%的醫生工作量。AI應用于基層社區篩查,可部分解決眼科衛生資源匱乏難題,提高社區居民眼科診療服務的可及性。Zhang等[7]對全國155個糖尿病中心共15 805例糖尿病患者的大樣本進行AI篩查,其DR患病率為28.8%,低于本研究結果。其原因可能為本研究對象為50歲以上老年糖尿病患者,該年齡段DR患病率較一般人群高[2];另一方面,本研究樣本選取醫院來源患者比例高,醫院來源的患者各級DR檢出率偏高,使得總體DR患病率高于既往報道。
AI在社區和醫院兩種場景的推廣應用可能是完全不同的收益。本研究結果顯示,社區DR以不需要轉診的1期早期患者為主,AI作為篩查手段擴大基層眼科服務的可及性,對早期病例早發現、早隨訪具有重要的公共衛生意義;而醫院55.0%的DR陽性患者均需轉診開展治療和護理工作,且已治療DR患者百分比也高,此時AI可作為醫生的輔助診斷分級助手,提高診療效率。此外,社區和醫院來源患者眼底病灶類型順位也存在差異。醫院來源患者眼底病灶數最多的是視網膜內出血和微動脈瘤等與DR相關病灶,而社區來源患者則以非DR相關病灶(玻璃膜疣)為主,說明醫院來源患者主動就醫時可能已經存在DR相關視力問題,某種程度上解釋了醫院來源患者DR檢出率高、需轉診DR比例高的現象。
本研究存在的不足為選取的社區來源患者偏少,其原因主要是由于社區篩查組織難度大,短時間內難以納入大量糖尿病患者,但對社區老年人篩查意義重大,有必要進一步擴大篩查范圍。另外,作為應用性研究,未收集患者病程、生活習慣、糖化血紅蛋白水平等實驗室檢查指標數據,無法進行更詳細的分析比較,有待以后進一步探索和研究。
本研究分析了DR自動診斷在50歲以上糖尿病人群中的推廣應用情況。通過比較社區和醫院兩種場景下AI對彩色眼底像的識別率、直接產生報告率、DR陽性率差異及病灶數量的順位,我們認為AI對彩色眼底像識別能力強,基于社區的糖尿病患者DR陽性率顯著低于醫院,在DR陽性率低的社區場景可作為初篩分流,代替醫生排除陰性患者,極大減少圖像分級工作量,對社區老年糖尿病患者DR早期診斷和眼健康的公共衛生意義大。AI識別和標記病灶能力強,在DR患病率高的醫院場景輔助醫生分級,提高診斷效率,有望改變未來醫院DR的診斷模式。