引用本文: 劉開群, 劉少鵬, 譚笑, 林浩添, 楊暉. 基于彩色眼底像和深度學習的視神經炎及非動脈炎性前部缺血性視神經病變的篩查診斷系統的構建. 中華眼底病雜志, 2023, 39(1): 51-58. doi: 10.3760/cma.j.cn511434-20220505-00265 復制
視神經疾病是指各種致病因素累及視神經,導致視功能嚴重受損的一組疾病,通常有異常視盤表現[1]。其視力下降特點往往呈現無痛性進展,因此當單眼受累時易被忽略而延誤就醫時機。視神經炎(ON)、非動脈炎性前部缺血性視神經病變(NAION)為國內最常見的嚴重危害視功能的視神經疾病,且所致的視力下降往往不可逆,早期篩查對于把握治療時機及方案選擇具有重要意義。ON、NAION早期診斷依賴于神經眼科、醫學影像科、風濕免疫科、神經內科及腦外科等多學科專業知識的聯合應用。然而,完善的整套檢查往往為患者帶來巨大經濟負擔,且國內醫療資源分布不平衡,部分醫療單位常無法做到充分的眼科影像學檢查和檢驗。目前人工智能(AI)特別是機器學習和深度學習逐漸興起并應用于基于眼科彩色照相的輔助診斷[2-5],其準確率甚至可超過眼科專家。視神經疾病發生時病變主要累及視神經,如視神經乳頭炎典型表現為視盤早期可呈輕中度水腫,球后ON早期視盤多無明顯改變,晚期可出現彌漫性蒼白萎縮[6-7];NAION的典型視盤改變多呈節段性,可出現水平半側視盤水腫或萎縮,急性發作時可見彌漫性水腫,或伴線性出血和滲出[8-9]。然而針對臨床中非典型病例,當視盤在水腫和萎縮狀態下,二者難以從彩色眼底像上進行準確區分。因此,本研究構建并評估基于彩色眼底像進行異常視盤篩查和對ON、NAION進行輔助診斷的AI系統。現將結果報道如下。
1 對象和方法
診斷性試驗研究。本研究經中山大學中山眼科中心倫理委員會審核(批準號:2021KYPJ002);遵循《赫爾辛基宣言》原則,參與者均獲知情并簽署書面知情同意書;每張彩色眼底像上已排除任何身份信息。
2016年至2020年于中山大學中山眼科中心檢查確診的NAION患者178例267只眼(NAION組)、ON患者204例346只眼(ON組),以及2018年至2020年于中山大學中山眼科中心檢查為眼底正常的健康者513名1 160只眼(正常對照組)的2 909張彩色眼底像作為異常視盤篩查診斷系統的數據集,其中NAION組(圖1A~1C)、ON組(圖1D,1E)、正常對照組(圖1F)分別為730、805、1 374張。

ON診斷標準[10]:(1)急性視力下降,伴或不伴眼痛及視盤水腫。(2)視神經損害相關性視野異常。(3)存在相對性傳入性瞳孔功能障礙(RAPD)、視覺誘發電位(VEP)異常2項中至少1項。(4)除外缺血性、壓迫性及浸潤性、外傷性、中毒性及營養代謝性遺傳性視神經病變等其他視神經疾病。(5)除外視交叉及交叉后的視路和視中樞病變。(6)除外眼前節病變、視網膜病變、黃斑病變、屈光不正、青光眼等其他眼科疾病。(7)除外非器質性視力下降。NAION診斷標準[11]:(1)突然出現視野缺損和(或)無痛性視力下降。(2)視野檢查顯示與生理盲點相連的繞過中心注視點的象限性視野缺損,多位于鼻側和下方。(3)局限性或彌漫性視盤水腫,常伴有周圍線狀出血。(4)存在RAPD和(或)VEP異常。(5)有全身或眼局部的危險因素。(6)除外其他視神經病變。正常對照者納入標準:視力、眼壓、光相干斷層掃描(OCT)檢查均無明顯異常。排除標準:(1)合并白內障、青光眼、高度近視、糖尿病視網膜病變等其他眼部疾病;(2)無彩色眼底像或OCT、視野檢查像等病史資料不全者;(3)拍攝或成像質量差,如無完整視盤結構、存在偽影或屈光間質混濁導致視盤窺不清的彩色眼底像。
患者均行視力、眼底彩色照相、視野、OCT、VEP、視網膜電圖(ERG)、色覺以及核磁共振成像(MRI)、全身免疫抗體檢測。視力檢查采用Snellen對數視力表進行;眼底彩色照相采用日本Topcon公司TRC-50DX眼底照相機或德國Carl Zeiss公司FF 450plus眼底照相機進行;視野檢查采用美國Carl Zeiss公司Humphrey視野分析儀進行;OCT檢查采用德國Carl Zeiss公司Cirrus HD-OCT儀或德國Heidelberg公司Spectral OCT儀進行;VEP、ERG檢查采用德國Roland公司RETI-Port/Scan 21眼電生理診斷系統進行。納入臨床資料包括患者病史、彩色眼底像、視野、OCT、圖形VEP、ERG、色覺及對比敏感度,以及全身檢測結果如免疫學抗原抗體檢測、手術前4項;ON患者還包括頭顱及視神經MRI等檢查結果。
NAION、ON患者臨床最終診斷由兩名經驗豐富的神經眼科醫生基于患者詳細的病史、臨床表現、輔助檢查、免疫抗體檢測、治療效果以及6個月的隨訪預后情況進行判定。
數據標簽處理。將異常視盤(NAION、ON)患者進行編號,若同一患者進行多次檢查,將檢查次數進行依次編號,對每次檢查的彩色眼底像進行分類。彩色眼底像,包括同一只眼多張不同方位的圖像和同一患者隨訪過程中的所有圖像分別進行標簽處理。所有臨床診斷標準均來源于同一神經眼科醫生標注。將所有匿名數據以Microsoft Excel格式錄入,圖片以對應文件夾形式保存,收集的數據包括:(1)患者人口統計學數據(編號、年齡、性別、發病眼別、發病次數、發病時間、檢查時間、檢查次序等)。(2)彩色眼底像(匿名)。(3)臨床診斷(正常、異常視盤、ON和NAION)。
數據集分組。根據臨床診斷,將納入的彩色眼底像分為正常對照組、異常視盤組(ON組+NAION組)、ON組、NAION組(圖2)。根據不同應用場景構建3個篩查系統,分別為是否存在異常視盤、是否存在ON、是否存在NAION。根據不同系統訓練需求,將彩色眼底像以相應隨機分為訓練數據集、驗證數據集和內部測試數據集(表1)。同一系統訓練過程中,3個數據集彩色眼底像相互獨立無重疊,即來自同一患者的所有彩色眼底像均被分配到相同的數據集中。


AI系統訓練。以EfficientNet-B0算法系統為基礎(表2),其優勢是通過對網絡的所有維度,即寬度、深度和分辨率進行復合縮放,以提高系統效率和準確性。寬度是指任何一層中的通道數;深度是指卷積神經網絡(CNN)中的層數;分辨率與圖像的大小相關[12]。工作流程為:(1)輸入1張彩色眼底像,經過第一個卷積(Conv)3×3層轉化為移動反轉瓶頸卷積塊(MBConv)模塊需要的輸入維度。(2)圖像經過一系列MBConv模塊提取特征圖;各個MBConv模塊的參數進行了精細化調整以適應當前使用環境;組合式的規模優化方法可以使網絡獲得更好感受野。(3)使用Conv1×1網絡適應各種不同尺寸的特征圖,并在全連接層將其統一為需要的維度。(4)最終歸一化的輸出端是一個二維的輸出向量,即對輸入的彩色眼底像進行二分類預測(圖3)。


3個篩查系統均利用相應的訓練數據集對其參數進行優化,生成候選系統;在系統訓練過程中,批大小設置為16;焦點損失函數設置為0.5,訓練迭代次數設置為50,最終選擇當前參數、環境等設置下得到的一個較優結果系統,驗證過程中主要對較優系統進行超參數調整;最后利用相應的測試數據集評價最終系統性能。
系統特征提取可視化。為了解系統進行特征提取的過程,采用熱力圖(CAM)對系統做出分類決策的依據進行顯示。CAM形成原理:采用遷移學習方式,卷積層凍結固定,對于同一張圖像,卷積層的輸出特征始終不變,系統的分類概率僅隨全連接層的權重矩陣W發生變化。權重矩陣W可以理解為對長度為512的特征向量的加權,由于特征向量是由特征圖全局平局池化層池化所得,因此權重矩陣W是對特征圖集合的加權(圖4)[13]。CAM的主要特點是利用最后一個卷積層的特征圖,并反向傳播找出每個通道對應的權重,這個權重表示該特征圖對分為當前類別的重要性,權重越大說明對應的特征圖越重要。然后,將對應的權重和特征圖相乘就得到最終的CAM 。

采用SPSS23.0軟件進行統計學分析。評價效能指標包括受試者工作特征(ROC)曲線、曲線下面積(AUC)、準確度、靈敏度和特異性。ROC曲線和AUC用于評價二分類系統分類效果的優劣,AUC 0.50~0.70為診斷價值較低,>0.70為診斷價值較高;準確度即正確分類的彩色眼底像占總測試彩色眼底像的比例;靈敏度和特異性及系統分類的真陽性、真陰性彩色眼底像占總測試彩色眼底像的比例。熱力圖可將系統識別的分類依據體現在彩色眼底像的特定區域。這種技術在視覺上突出了彩色眼底像決策過程中的激活區域,顏色“越暖”,權重越高,如顏色越紅,該特定區域的激活程度越高。使用Adobe Illustrator CS6軟件24.0.1版本進行ROC曲線組合構建。
2 結果
NAION組178例267只眼中,男性121例(67.98%,121/178),女性57例(32.02%,57/178);雙眼、單眼各89例(50.0%,89/178)。年齡(53.67±9.15)(31~83)歲。ON組204例346只眼中,男性72例(35.29%,72/204),女性132例(64.71%,132/204);雙眼142例(69.61%,142/204),單眼62例(30.39%,62/204)。年齡(31.55±17.08)(4~84)歲。正常對照組513名1 160只眼中,男性271名(52.82%,271/513),女性242名(47.17%,242/513)。年齡(21.00±15.32)(7~77)歲。同一患者隨訪過程中均有彩色眼底像納入者89例(9.94%,89/895),其中NAION組、ON組分別為41(23.03%,41/178)、48(23.53%,48/204)例。
構建的3個系統在驗證集和測試集中總體表現出良好的分類性能,AUC值為0.938~0.992;3個系統之間進行比較,是否存在NAION的各指標均優于是否存在ON、是否存在異常視盤(圖5)。在是否存在ON中,驗證集中各指標均優于測試集;測試集中,從正常視盤中篩查出ON視盤的準確度和靈敏度分別為0.911[95%可信區間(CI)0.875~0.937]和0.875(95%CI 0.835~0.906),較是否存在異常視盤和是否存在NAION低(表3)。對于熱力圖,不同拍攝角度的彩色眼底像,AI決策的激活區域均位于視盤區域,并且在不同病理狀態下,激活區域的顏色根據病理改變存在相應變化顏色(圖6)。




3 討論
本研究首次應用AI深度學習建立基于彩色眼底像的對ON或NAION導致的異常視盤和正常視盤之間進行二分類的篩查系統,其在測試數據集中AUC值達0.967。同時,本研究從ON和NAION出發,分別訓練出可以從正常視盤中篩選和診斷為ON和NAION的彩色眼底像系統(是否存在ON、NAION),AUC值分別達0.964和0.979。
既往AI在神經眼科的應用主要針對異常視盤和由顱內高壓導致視盤水腫的篩查[14-16]。Ahn等[17]使用異常視盤、假性視盤水腫和正常視盤共1 369張彩色眼底像,應用數據增強和遷移學習技術訓練異常視盤分類系統,準確率達0.959。Liu等[18]使用正常和異常視盤共1 095張彩色眼底像,應用遷移學習技術訓練出區分異常視盤的系統,其外部測試數據集中AUC值為0.87,靈敏度為0.90,特異性為0.69。本研究共納入2 909張彩色眼底像,其中由ON和NAION組成的異常視盤共1 535張,訓練出區分是否存在異常視盤的系統,其分類性能可與Ahn等[17]、Liu等[18]的系統媲美,測試集中AUC值為0.967,靈敏度為0.934,特異性為0.908。但本系統的特異性較既往分類系統低,原因在于本系統的異常視盤僅由ON和NAION組成,而Liu等[18]所納入的異常視盤包括缺血性視神經病變、視神經萎縮以及壓縮性、遺傳性、外傷性視神經病變和先天性異常、視盤水腫等多種視神經病變。本系統靈敏度高于Milea等[14]對異常視盤的檢測,但AUC值和特異性相比后者稍低(AUC值為0.990,靈敏度、特異性分別為0.935、0.962)。原因在于Milea等[14]異常視盤的彩色眼底像樣本量相對較大(3 037張),并包含多種異常視盤,除缺血性視神經病變和ON外,還包括玻璃膜疣和先天性異常等。因此,本研究主要針對ON和NAION所導致的異常視盤進行篩查,彩色眼底像均來源于中國,結果顯示,針對亞裔人群,AI系統亦可對ON和NAION所致的異常視盤進行篩查,并具有高效的分類性能。
本研究進一步分別訓練出可以從正常視盤中篩選和診斷為ON、NAION的彩色眼底像的系統(是否存在ON、NAION),測試集中兩個篩查系統的AUC值分別為0.964、0.979,靈敏度分別為0.875、0.976,特異性分別為0.935、0.957。兩個系統中是否存在NAION的各指標均優于是否存在ON。其原因在于NAION作為眼底血管源性視神經病變,視盤表現相對典型[8-9],視盤病變早期可有彌散性或節段性水腫,或伴有“火焰狀”出血、硬性滲出或棉絨斑,晚期可存在視盤節段性萎縮或神經纖維層變薄,而這些均有助于深度學習特征提取。ON早期視盤可能表現正常,如球后視神經炎,而晚期視盤蒼白萎縮[6-7],因此對于病變部位尚未累及視盤者,即使AI亦難以分辨,而晚期視盤病變易于從正常視盤中進行區分。正因如此,在本研究是否存在ON的系統中,驗證集的篩查性能稍高于測試集,提示該AI系統對ON的篩查能力存在波動性。但就總體而言,驗證集和測試集的AUC值均高于0.950,展現出該系統的可靠性。迄今為止,尚無針對ON或NAION等視神經疾病的AI篩查研究報道,本研究是迄今國內外以ON和NAION為代表的AI研究中納入病例數和彩色眼底像數據量最大的研究,對ON、NAION的篩查具有一定代表性。
本研究為AI在視神經疾病的篩查和輔助診斷系統研發進行了初步探索,同時也為AI在神經眼科的應用增加了一份數據支持。然而,本研究仍存在一定不足:(1)異常視盤數據量仍較小。遷移學習技術和數據增強技術的使用,有可能增加小樣本系統診斷準確率。(2)目前系統主要訓練用于篩查診斷臨床常見的ON、NAION,但臨床工作中還可見其他視神經疾病,如遺傳性視神經病變、壓迫性視神經病變和中毒性視神經病變等,因此,進一步應該增加其他異常的視神經疾病納入訓練有助于增強系統泛化能力,從而促進系統更快在真實世界的應用。(3)單中心研究,測試數據集來源于單一眼科中心,因此系統的臨床應用能力尚需外部測試進行驗證。因此,應進一步加強AI在視神經疾病方向的研究,完善深度學習系統模型構建,以推動AI技術在視神經疾病上的應用。
視神經疾病是指各種致病因素累及視神經,導致視功能嚴重受損的一組疾病,通常有異常視盤表現[1]。其視力下降特點往往呈現無痛性進展,因此當單眼受累時易被忽略而延誤就醫時機。視神經炎(ON)、非動脈炎性前部缺血性視神經病變(NAION)為國內最常見的嚴重危害視功能的視神經疾病,且所致的視力下降往往不可逆,早期篩查對于把握治療時機及方案選擇具有重要意義。ON、NAION早期診斷依賴于神經眼科、醫學影像科、風濕免疫科、神經內科及腦外科等多學科專業知識的聯合應用。然而,完善的整套檢查往往為患者帶來巨大經濟負擔,且國內醫療資源分布不平衡,部分醫療單位常無法做到充分的眼科影像學檢查和檢驗。目前人工智能(AI)特別是機器學習和深度學習逐漸興起并應用于基于眼科彩色照相的輔助診斷[2-5],其準確率甚至可超過眼科專家。視神經疾病發生時病變主要累及視神經,如視神經乳頭炎典型表現為視盤早期可呈輕中度水腫,球后ON早期視盤多無明顯改變,晚期可出現彌漫性蒼白萎縮[6-7];NAION的典型視盤改變多呈節段性,可出現水平半側視盤水腫或萎縮,急性發作時可見彌漫性水腫,或伴線性出血和滲出[8-9]。然而針對臨床中非典型病例,當視盤在水腫和萎縮狀態下,二者難以從彩色眼底像上進行準確區分。因此,本研究構建并評估基于彩色眼底像進行異常視盤篩查和對ON、NAION進行輔助診斷的AI系統。現將結果報道如下。
1 對象和方法
診斷性試驗研究。本研究經中山大學中山眼科中心倫理委員會審核(批準號:2021KYPJ002);遵循《赫爾辛基宣言》原則,參與者均獲知情并簽署書面知情同意書;每張彩色眼底像上已排除任何身份信息。
2016年至2020年于中山大學中山眼科中心檢查確診的NAION患者178例267只眼(NAION組)、ON患者204例346只眼(ON組),以及2018年至2020年于中山大學中山眼科中心檢查為眼底正常的健康者513名1 160只眼(正常對照組)的2 909張彩色眼底像作為異常視盤篩查診斷系統的數據集,其中NAION組(圖1A~1C)、ON組(圖1D,1E)、正常對照組(圖1F)分別為730、805、1 374張。

ON診斷標準[10]:(1)急性視力下降,伴或不伴眼痛及視盤水腫。(2)視神經損害相關性視野異常。(3)存在相對性傳入性瞳孔功能障礙(RAPD)、視覺誘發電位(VEP)異常2項中至少1項。(4)除外缺血性、壓迫性及浸潤性、外傷性、中毒性及營養代謝性遺傳性視神經病變等其他視神經疾病。(5)除外視交叉及交叉后的視路和視中樞病變。(6)除外眼前節病變、視網膜病變、黃斑病變、屈光不正、青光眼等其他眼科疾病。(7)除外非器質性視力下降。NAION診斷標準[11]:(1)突然出現視野缺損和(或)無痛性視力下降。(2)視野檢查顯示與生理盲點相連的繞過中心注視點的象限性視野缺損,多位于鼻側和下方。(3)局限性或彌漫性視盤水腫,常伴有周圍線狀出血。(4)存在RAPD和(或)VEP異常。(5)有全身或眼局部的危險因素。(6)除外其他視神經病變。正常對照者納入標準:視力、眼壓、光相干斷層掃描(OCT)檢查均無明顯異常。排除標準:(1)合并白內障、青光眼、高度近視、糖尿病視網膜病變等其他眼部疾病;(2)無彩色眼底像或OCT、視野檢查像等病史資料不全者;(3)拍攝或成像質量差,如無完整視盤結構、存在偽影或屈光間質混濁導致視盤窺不清的彩色眼底像。
患者均行視力、眼底彩色照相、視野、OCT、VEP、視網膜電圖(ERG)、色覺以及核磁共振成像(MRI)、全身免疫抗體檢測。視力檢查采用Snellen對數視力表進行;眼底彩色照相采用日本Topcon公司TRC-50DX眼底照相機或德國Carl Zeiss公司FF 450plus眼底照相機進行;視野檢查采用美國Carl Zeiss公司Humphrey視野分析儀進行;OCT檢查采用德國Carl Zeiss公司Cirrus HD-OCT儀或德國Heidelberg公司Spectral OCT儀進行;VEP、ERG檢查采用德國Roland公司RETI-Port/Scan 21眼電生理診斷系統進行。納入臨床資料包括患者病史、彩色眼底像、視野、OCT、圖形VEP、ERG、色覺及對比敏感度,以及全身檢測結果如免疫學抗原抗體檢測、手術前4項;ON患者還包括頭顱及視神經MRI等檢查結果。
NAION、ON患者臨床最終診斷由兩名經驗豐富的神經眼科醫生基于患者詳細的病史、臨床表現、輔助檢查、免疫抗體檢測、治療效果以及6個月的隨訪預后情況進行判定。
數據標簽處理。將異常視盤(NAION、ON)患者進行編號,若同一患者進行多次檢查,將檢查次數進行依次編號,對每次檢查的彩色眼底像進行分類。彩色眼底像,包括同一只眼多張不同方位的圖像和同一患者隨訪過程中的所有圖像分別進行標簽處理。所有臨床診斷標準均來源于同一神經眼科醫生標注。將所有匿名數據以Microsoft Excel格式錄入,圖片以對應文件夾形式保存,收集的數據包括:(1)患者人口統計學數據(編號、年齡、性別、發病眼別、發病次數、發病時間、檢查時間、檢查次序等)。(2)彩色眼底像(匿名)。(3)臨床診斷(正常、異常視盤、ON和NAION)。
數據集分組。根據臨床診斷,將納入的彩色眼底像分為正常對照組、異常視盤組(ON組+NAION組)、ON組、NAION組(圖2)。根據不同應用場景構建3個篩查系統,分別為是否存在異常視盤、是否存在ON、是否存在NAION。根據不同系統訓練需求,將彩色眼底像以相應隨機分為訓練數據集、驗證數據集和內部測試數據集(表1)。同一系統訓練過程中,3個數據集彩色眼底像相互獨立無重疊,即來自同一患者的所有彩色眼底像均被分配到相同的數據集中。


AI系統訓練。以EfficientNet-B0算法系統為基礎(表2),其優勢是通過對網絡的所有維度,即寬度、深度和分辨率進行復合縮放,以提高系統效率和準確性。寬度是指任何一層中的通道數;深度是指卷積神經網絡(CNN)中的層數;分辨率與圖像的大小相關[12]。工作流程為:(1)輸入1張彩色眼底像,經過第一個卷積(Conv)3×3層轉化為移動反轉瓶頸卷積塊(MBConv)模塊需要的輸入維度。(2)圖像經過一系列MBConv模塊提取特征圖;各個MBConv模塊的參數進行了精細化調整以適應當前使用環境;組合式的規模優化方法可以使網絡獲得更好感受野。(3)使用Conv1×1網絡適應各種不同尺寸的特征圖,并在全連接層將其統一為需要的維度。(4)最終歸一化的輸出端是一個二維的輸出向量,即對輸入的彩色眼底像進行二分類預測(圖3)。


3個篩查系統均利用相應的訓練數據集對其參數進行優化,生成候選系統;在系統訓練過程中,批大小設置為16;焦點損失函數設置為0.5,訓練迭代次數設置為50,最終選擇當前參數、環境等設置下得到的一個較優結果系統,驗證過程中主要對較優系統進行超參數調整;最后利用相應的測試數據集評價最終系統性能。
系統特征提取可視化。為了解系統進行特征提取的過程,采用熱力圖(CAM)對系統做出分類決策的依據進行顯示。CAM形成原理:采用遷移學習方式,卷積層凍結固定,對于同一張圖像,卷積層的輸出特征始終不變,系統的分類概率僅隨全連接層的權重矩陣W發生變化。權重矩陣W可以理解為對長度為512的特征向量的加權,由于特征向量是由特征圖全局平局池化層池化所得,因此權重矩陣W是對特征圖集合的加權(圖4)[13]。CAM的主要特點是利用最后一個卷積層的特征圖,并反向傳播找出每個通道對應的權重,這個權重表示該特征圖對分為當前類別的重要性,權重越大說明對應的特征圖越重要。然后,將對應的權重和特征圖相乘就得到最終的CAM 。

采用SPSS23.0軟件進行統計學分析。評價效能指標包括受試者工作特征(ROC)曲線、曲線下面積(AUC)、準確度、靈敏度和特異性。ROC曲線和AUC用于評價二分類系統分類效果的優劣,AUC 0.50~0.70為診斷價值較低,>0.70為診斷價值較高;準確度即正確分類的彩色眼底像占總測試彩色眼底像的比例;靈敏度和特異性及系統分類的真陽性、真陰性彩色眼底像占總測試彩色眼底像的比例。熱力圖可將系統識別的分類依據體現在彩色眼底像的特定區域。這種技術在視覺上突出了彩色眼底像決策過程中的激活區域,顏色“越暖”,權重越高,如顏色越紅,該特定區域的激活程度越高。使用Adobe Illustrator CS6軟件24.0.1版本進行ROC曲線組合構建。
2 結果
NAION組178例267只眼中,男性121例(67.98%,121/178),女性57例(32.02%,57/178);雙眼、單眼各89例(50.0%,89/178)。年齡(53.67±9.15)(31~83)歲。ON組204例346只眼中,男性72例(35.29%,72/204),女性132例(64.71%,132/204);雙眼142例(69.61%,142/204),單眼62例(30.39%,62/204)。年齡(31.55±17.08)(4~84)歲。正常對照組513名1 160只眼中,男性271名(52.82%,271/513),女性242名(47.17%,242/513)。年齡(21.00±15.32)(7~77)歲。同一患者隨訪過程中均有彩色眼底像納入者89例(9.94%,89/895),其中NAION組、ON組分別為41(23.03%,41/178)、48(23.53%,48/204)例。
構建的3個系統在驗證集和測試集中總體表現出良好的分類性能,AUC值為0.938~0.992;3個系統之間進行比較,是否存在NAION的各指標均優于是否存在ON、是否存在異常視盤(圖5)。在是否存在ON中,驗證集中各指標均優于測試集;測試集中,從正常視盤中篩查出ON視盤的準確度和靈敏度分別為0.911[95%可信區間(CI)0.875~0.937]和0.875(95%CI 0.835~0.906),較是否存在異常視盤和是否存在NAION低(表3)。對于熱力圖,不同拍攝角度的彩色眼底像,AI決策的激活區域均位于視盤區域,并且在不同病理狀態下,激活區域的顏色根據病理改變存在相應變化顏色(圖6)。




3 討論
本研究首次應用AI深度學習建立基于彩色眼底像的對ON或NAION導致的異常視盤和正常視盤之間進行二分類的篩查系統,其在測試數據集中AUC值達0.967。同時,本研究從ON和NAION出發,分別訓練出可以從正常視盤中篩選和診斷為ON和NAION的彩色眼底像系統(是否存在ON、NAION),AUC值分別達0.964和0.979。
既往AI在神經眼科的應用主要針對異常視盤和由顱內高壓導致視盤水腫的篩查[14-16]。Ahn等[17]使用異常視盤、假性視盤水腫和正常視盤共1 369張彩色眼底像,應用數據增強和遷移學習技術訓練異常視盤分類系統,準確率達0.959。Liu等[18]使用正常和異常視盤共1 095張彩色眼底像,應用遷移學習技術訓練出區分異常視盤的系統,其外部測試數據集中AUC值為0.87,靈敏度為0.90,特異性為0.69。本研究共納入2 909張彩色眼底像,其中由ON和NAION組成的異常視盤共1 535張,訓練出區分是否存在異常視盤的系統,其分類性能可與Ahn等[17]、Liu等[18]的系統媲美,測試集中AUC值為0.967,靈敏度為0.934,特異性為0.908。但本系統的特異性較既往分類系統低,原因在于本系統的異常視盤僅由ON和NAION組成,而Liu等[18]所納入的異常視盤包括缺血性視神經病變、視神經萎縮以及壓縮性、遺傳性、外傷性視神經病變和先天性異常、視盤水腫等多種視神經病變。本系統靈敏度高于Milea等[14]對異常視盤的檢測,但AUC值和特異性相比后者稍低(AUC值為0.990,靈敏度、特異性分別為0.935、0.962)。原因在于Milea等[14]異常視盤的彩色眼底像樣本量相對較大(3 037張),并包含多種異常視盤,除缺血性視神經病變和ON外,還包括玻璃膜疣和先天性異常等。因此,本研究主要針對ON和NAION所導致的異常視盤進行篩查,彩色眼底像均來源于中國,結果顯示,針對亞裔人群,AI系統亦可對ON和NAION所致的異常視盤進行篩查,并具有高效的分類性能。
本研究進一步分別訓練出可以從正常視盤中篩選和診斷為ON、NAION的彩色眼底像的系統(是否存在ON、NAION),測試集中兩個篩查系統的AUC值分別為0.964、0.979,靈敏度分別為0.875、0.976,特異性分別為0.935、0.957。兩個系統中是否存在NAION的各指標均優于是否存在ON。其原因在于NAION作為眼底血管源性視神經病變,視盤表現相對典型[8-9],視盤病變早期可有彌散性或節段性水腫,或伴有“火焰狀”出血、硬性滲出或棉絨斑,晚期可存在視盤節段性萎縮或神經纖維層變薄,而這些均有助于深度學習特征提取。ON早期視盤可能表現正常,如球后視神經炎,而晚期視盤蒼白萎縮[6-7],因此對于病變部位尚未累及視盤者,即使AI亦難以分辨,而晚期視盤病變易于從正常視盤中進行區分。正因如此,在本研究是否存在ON的系統中,驗證集的篩查性能稍高于測試集,提示該AI系統對ON的篩查能力存在波動性。但就總體而言,驗證集和測試集的AUC值均高于0.950,展現出該系統的可靠性。迄今為止,尚無針對ON或NAION等視神經疾病的AI篩查研究報道,本研究是迄今國內外以ON和NAION為代表的AI研究中納入病例數和彩色眼底像數據量最大的研究,對ON、NAION的篩查具有一定代表性。
本研究為AI在視神經疾病的篩查和輔助診斷系統研發進行了初步探索,同時也為AI在神經眼科的應用增加了一份數據支持。然而,本研究仍存在一定不足:(1)異常視盤數據量仍較小。遷移學習技術和數據增強技術的使用,有可能增加小樣本系統診斷準確率。(2)目前系統主要訓練用于篩查診斷臨床常見的ON、NAION,但臨床工作中還可見其他視神經疾病,如遺傳性視神經病變、壓迫性視神經病變和中毒性視神經病變等,因此,進一步應該增加其他異常的視神經疾病納入訓練有助于增強系統泛化能力,從而促進系統更快在真實世界的應用。(3)單中心研究,測試數據集來源于單一眼科中心,因此系統的臨床應用能力尚需外部測試進行驗證。因此,應進一步加強AI在視神經疾病方向的研究,完善深度學習系統模型構建,以推動AI技術在視神經疾病上的應用。