腦電信號是腦神經電生理活動的總體反映,具有安全、高效、實時、動態等優點。隨著機器學習相關研究的開展與推進,基于神經網絡的阿爾茨海默病自動診斷正成為腦電分析研究熱點。本文從前饋神經網絡入手,比較分析了循環神經網絡、卷積神經網絡和深度信念網絡等神經網絡模型的結構特性及其在阿爾茨海默病診斷中的性能表現,并探討了該研究在未來可能面臨的挑戰和研究趨勢,期望為神經網絡在阿爾茨海默病腦電診斷的臨床應用提供有價值的參考。
引用本文: 劉毅, 李振陽, 危志偉, 徐永紅, 謝平, 王玉琳, 劉沁爽, 李昕. 基于神經網絡的阿爾茨海默病腦電診斷應用現狀. 生物醫學工程學雜志, 2022, 39(6): 1233-1239, 1246. doi: 10.7507/1001-5515.202201001 復制
引言
世界衛生組織將癡呆癥定義為一種影響記憶力、思維能力和日常活動能力的神經退行性疾病[1],癡呆癥病例中60%~70%是由阿爾茨海默病(Alzheimer’s disease,AD)引起。AD于1906年由德國內科醫生阿洛伊斯·阿爾茨海默首次發現,該疾病是由蛋白質異常沉積(p-tau和β淀粉樣蛋白42)引起的老年斑和神經原纖維纏結、神經元連接失活、腦部炎癥、氧化應激和細胞死亡所致[2]。目前AD發病機制尚不明確,常見癥狀包括近期記憶喪失、判斷力差和失語癥。國際阿爾茨海默病協會的報告顯示:截止2019年1月,全球AD患者達5 000萬人[3];世界衛生組織預估,2050年患者數量將達到1.52億[4]。2021年5月11日《第七次全國人口普查公報》數據顯示:我國60歲及以上人口為2.64億人,占總人口的18.70%;65歲及以上人口為1.9億,占總人口的13.50%。預計到2050年我國AD患病人數為3 003萬[5]。從治療成本方面來看,2018年花費了1萬億美元用于治療認知疾病的患者;到2030年,這一支出預計將達到2萬億美元[6]。輕度認知障礙(mild cognitive impairment,MCI)是介于認知正常和AD的中間階段,其轉歸為AD的可能性更高[7]。因此,能夠準確地診斷出MCI患者并給予必要的干預措施,可在一定程度上延緩病情惡化,有利于患者早日康復,從而有效降低AD患者數量及護理成本,顯著提升患者及家屬的生活質量。
目前,AD臨床診斷方法主要包括神經成像技術[8-11]、生物標記物[12]、遺傳分析[13]和腦電圖(electroencephalogram,EEG)分析[14]等。EEG檢測作為一種非侵入性檢測手段,不僅信號采集技術相對成熟(已廣泛用于臨床診斷、狀態監測、腦機接口等場景中[15-16]),而且在設備的購置和維護上也較核磁共振成像設備經濟實用,這使得基于EEG的對認知障礙患者的低成本、大規模篩查成為可能,特別是在偏遠或欠發達地區。與正常人相比,神經元死亡所引發的連接性喪失在AD患者腦電信號中表現的異常特征是θ和δ活性的增加、α和β活性的降低[17-18],以及不同腦區之間的同步性、連通性喪失[19],所以腦電信號可以作為表征患者狀態、認知水平等信息或特征的載體。
基于機器學習的自動診斷技術在一定程度上可以輔助臨床醫師做出更好的臨床決策,有著廣泛的前景與發展空間。本文綜述了近年來將EEG結合神經網絡算法用于AD診斷的研究成果,主要包括前饋神經網絡(feedforward neural network,FNN)、循環神經網絡(recurrent neural network,RNN)、卷積神經網絡(convolutional neural network,CNN)、深度信念網絡(deep belief network,DBN)等模型的結構及其對認知障礙患者的診斷性能,并進一步展望了未來工作熱點與研究趨勢。
1 神經網絡模型及其AD診斷應用現狀
1943年,心理學家Warren McCulloch和數理邏輯學家Walter Pitts在生物神經網絡結構和功能啟發下首次提出了人工神經網絡概念及人工神經元的數學模型。隨后人工神經網絡在信息處理、模式識別、人工智能等領域得到了廣泛應用,這也促使其神經元類型、層數及拓撲結構更加復雜多樣[20]。兩者相互交融、相得益彰,因而使得神經網絡更加適用于以腦電診斷為代表的臨床應用。神經網絡用于AD診斷研究的成果可視化分析如圖1所示,可以看出基于EEG的AD診斷研究集中在近五年,主要以FNN和CNN為主。四種網絡對應的結構示意如圖2所示。


a. 前饋神經網絡;b. 循環神經網絡;c. 卷積神經網絡;d. 深度信念網絡
Figure2. Neural network structure diagrama. feedforward neural network; b. recurrent neural network; c. convolutional neural network; d. deep belief network
1.1 前饋神經網絡
FNN是神經網絡中最經典也是應用最為廣泛的模型,對應網絡結構如圖2a所示。如果隱含層不止一層,則稱為“深度”神經網絡。通常每一層中的每個神經元都與下一層的神經元存在直接連接,但同一層的神經元之間沒有連接或相互作用。隱藏層與外界沒有直接聯系,這也是稱之為隱藏層的原因。在進行認知障礙模式識別時,FNN通常僅包含一個隱層,但隱層中神經元的個數往往隨模型輸入、輸出的不同而不同;與此同時也有研究在構建診斷模型時使用兩層及以上的隱層[21-22]。在以FNN為判別方法的相關研究中,常用的分類特征及其模型性能如表1[21-29]所示。

從表1列舉的文獻清單可以看出腦電信號特征量主要分為時頻、統計、非線性和區域連通性等。針對不同的認知障礙患者和健康對照(healthy control,HC)受試者,可以采用時頻分析、獨立成分分析和多向陣列分解等方法從腦電節律中提取時頻量化特征,并結合FNN實現患者類別診斷。而將絕對、相對頻譜功率[21, 29]和小波相關性等時頻特征附加空間連通性、同步性度量[24]用于描述腦電信號間差異時,FNN進行模式識別的準確率和性能相對更出色。此外,由于腦電信號存在非線性、非平穩特性,不少研究綜合考慮時頻、統計、非線性特征(諸如常規頻段的相對功率、中值頻率、譜熵[26, 29]、樣本熵[27]、Tsallis熵[23]、排序熵、模糊熵、Lempel-Ziv復雜度、分形維數[25, 28]和自互信息[22]等)并將其用于腦電信號的分析中,根據特征矢量的維度構建復雜度相匹配的網絡模型,從而取得了不錯的效果。總的來說在這些研究中,相對于線性判別分析(linear discriminant analysis,LDA)、邏輯回歸、隨機森林、支持向量機(support vector machine,SVM)等傳統機器學習算法,FNN數據擬合能力更強,性能表現最佳。
1.2 循環神經網絡
RNN是在FNN的基礎上引入反饋結構的一類網絡模型,如圖2b所示:網絡中神經元的輸出值不僅可以傳遞給下一個神經元,還可以作用于自身,這意味著當前時刻的輸出由當前時刻的數據和歷史數據共同構成,即RNN模型中存在閉環結構。這不僅可以降低網絡復雜度,還可以實現數據流的循環、遞歸等。RNN所具有的記憶能力就是通過閉環結構中的參量來存儲過去的輸入狀態,從而在下一次輸入時產生影響。可以肯定的是這種結構使之能夠很好地挖掘腦電信號中隱含的復雜時間次序關系信息。迄今為止,以RNN為模型主體的AD診斷研究如表2[30-35]所示。

Elman神經網絡是最早應用于AD診斷研究的循環神經網絡結構。Goli等[30]依據腦電信號特定通道的時頻和統計等特征量化患者與健康人之間的差異時,發現Elman神經網絡在AD診斷方面比LDA和SVM更有效。與之相對的是Alvi等[33]采用長短時記憶網絡(long short-term memory,LSTM)處理降采樣后的EEG信號,研究表明具有2~3個LSTM層時,模型的性能(準確性、靈敏度和特異性)可以保持在90%以上,當增加隱藏層和神經元的數量時,性能開始下降。此外,對信號降采樣可使模型訓練/測試時間大幅降低。針對模型的穩定性,Alessandrini等[31]嘗試將RNN和主成分分析相結合,提出了一種較為魯棒的診斷系統,在面對不完整、損壞或其他丟失的數據時依然可以保持良好的準確性。
1.3 卷積神經網絡
CNN是將卷積運算引入神經網絡的一類網絡模型,如圖2c所示:卷積運算作為CNN的核心在網絡中以卷積層的形式存在,模型通常由多個卷積、池化、激活層和末端的全連接層(即傳統的神經網絡)組成,這一經典結構最早由Kunihiko Fukushima提出并沿用至今。對于二維圖像數據而言,卷積層的本質是使用一個帶權重的二維濾波器和圖像數據做卷積運算,并將運算所得數據經由激活、池化層排列組合結果作為潛在特征量,如此多次重復處理后得到圖像的高度抽象編碼,最終由全連接層進行模式識別。這種數據處理方式使得CNN具有很好的特征提取能力,近年來在醫療圖像處理任務中表現出很好的性能。相應的,CNN在AD分類任務的相關研究如表3[36-44]所示。

腦電信號這種特殊的圖像可以直接作為CNN的輸入數據進行模式識別[37, 45],避免了特征選取、計算等工作環節;與此同時對腦電信號處理所得的功率譜密度也可以作為表征認知障礙信息的圖像數據[36]。此外不少研究為提升診斷性能將腦電信號同步似然、功能連通性、小波熵值[42]以及能量分布的平均值、標準差和偏斜度等頻譜特征[39-41]經過特定的變換映射為RGB圖像,結合CNN完成認知障礙患者的篩查與診斷。與其他神經網絡不同的是CNN網絡構建可以采用諸如AlexNet等經典模型進行遷移學習[43],即以該經典網絡為起點,由新數據集對網絡進行訓練、微調網絡參數,從而更快、更容易地構建高精度模型,這對神經網絡模型在AD的臨床應用具有重要意義。
1.4 深度信念網絡
DBN是一種能夠建立輸入數據和輸出類別之間聯合概率分布的網絡模型,如圖2d所示,它包括輸入、輸出層以及隱藏層。除頂層外每兩層之間有兩個方向的權重,且同一層中的節點是獨立的,所以從結構上看DBN是由受限玻爾茲曼機(restricted Boltzmann machine,RBM)堆疊組成。該模型由Geoffery Hinton于2006年首次提出,與傳統神經網絡的訓練方式不同,DBN采用逐層訓練的方式,包括兩個步驟:第一步是用受試者的腦電數據對深度學習網絡進行無監督訓練,第二步是用腦電信號的標簽微調深度學習網絡。其典型的研究成果匯總于表4[46-48]中。

Zhao等[46]將RBM作為網絡的基本單元構建了三層DBN網絡對15名AD患者和15名HC受試者的腦電信號進行無監督學習,并結合支持向量機對網絡輸出特征進行分類,取得了92%的準確率。Jiang等[47]將腦電特征結合DBN實現了MCI患者與HC受試者的雙模態檢測,其識別準確率為89.87%。Bi等[48]在DBN中引入卷積層,提出了一種以深度脈沖卷積信念網絡為核心的多任務學習框架,可以完成患者腦電頻譜圖像全自動特征提取及模式識別。這一網絡框架增加了受試者間差異,減小了受試者內差異,有望用于醫療輔助系統并擴展到諸如癲癇等神經系統疾病的早期診斷中。
綜上所述,神經網絡在AD診斷中的應用主要是分為兩類,如圖3所示:分支a是以FNN為代表的,需要特征提取與特征選擇來確定最小冗余度和最大相關性的特征矢量,結合淺層神經網絡完成AD診斷分類;分支b是以CNN、DBN為代表的深度學習模型,采用特殊的網絡層代替人為選取特征的環節,對EEG數據信息進行表征學習,結合半監督式的特征學習和分層特征提取的網絡訓練方式加快模型構建時間及成本。區別于淺層學習,深度學習強調了模型結構的深度及特征學習的重要性,已有學者[43, 45]針對EEG應用深度學習展開研究。但由于EEG數據的特性,如何在沒有大量數據的情況下改進模型和混合傳統算法以獲得更好的診斷性能并減少模型計算時間,將成為當前和未來的新課題之一。

2 總結與展望
神經網絡在AD腦電診斷中取得了一定的研究進展,但是由于EEG的異質性、樣本量等影響,使得同類網絡結構的模型性能差異較大,在未來的研究中還有許多問題亟待解決。
2.1 建設共享數據平臺
數據是影響診斷效果的重要制約因素之一,研究者們通常是針對特定數據集進行模式識別方案設計、優化,導致網絡模型的泛化能力往往較差。為了探索認知障礙不同階段的診斷、評估干預效果,需要大量數據優化診斷模型。因此,建立統一、規范的在線共享數據平臺,將為認知障礙診斷任務中構建神經網絡模型提供先決條件;如果更多的研究人員將診斷模型、框架、代碼和匿名數據樣本開源,可以預期這對認知障礙相關的研究具有相當大的推動作用,在一定程度上降低了算法研發的時間和資金成本;且規范一致的數據集可以確保各模型運算性能具有可比性。
2.2 融合多模態數據
在提高模型可靠性方面可以嘗試多模態數據融合。例如,單純依賴步態數據很難鑒別MCI和AD患者,You等[38]創新性地利用步態數據和腦電信號數據結合CNN實現了患者快速、準確的分類。此外,已有研究將EEG和功能近紅外光譜用于AD的診斷研究中[49-50]。相較于單模態,多模態能獲得更多的輔助信息以及更豐富的表示,進而獲得更好的診斷效果。可以肯定的是不同模態的數據結合神經網絡算法有望更加穩定、可靠地實現神經疾病診斷與康復應用系統。
2.3 完善診斷標簽
目前研究多針對于AD/MCI/HC三分類,且分類精度及可靠性尚不足以滿足形形色色的臨床應用需求。AD患者的腦電信號通常表現出較高的個體差異性,特別是當考慮到不同階段的認知障礙和綜合征的患者時,確定來自同一地區不同醫院的AD患者的一般特征仍具有一定的挑戰,許多研究工作也表明區分MCI和HC相對于AD和HC困難得多。此外,在實際應用場景中,可以根據后續臨床治療的需求細化認知障礙等級的分類,如對阿爾茨海默型老年性癡呆、血管性癡呆和額顳葉癡呆等患者類型的確診。這可以通過機器學習研究人員與臨床醫師加強交叉融合來實現,保證更好地完善數據標簽。
2.4 優化診斷模型
構建深層神經網絡模型通常需要大量樣本才能取得較為理想的效果,但是獲取大量、高質量、帶標簽的EEG數據往往比較困難、昂貴且耗時。在算法層面,生成性對抗網絡模型可以在短期內生成人工腦電數據;而不帶標簽EEG數據獲取相對容易,且數據中同樣蘊含對應類別的EEG信息分布。DBN等半監督學習算法可以利用這一點,通過少量帶標簽EEG數據和大量不帶標簽的EEG數據構建診斷系統,這在未來研究中是極具潛力的。
可以肯定的是結構單一的診斷模型擬合能力存在局限性,不同神經網絡架構融合是一種必然趨勢。構建深層神經網絡時引入殘差結構,不僅能解決梯度消失問題,還能有效提升網絡性能。Bi等[48]和Gkenios等[32]分別在DBN和LSTM中創新性地引入卷積層,構建了較為新穎的高性能診斷模型。除此之外,脈沖神經網絡也是極具潛力的網絡架構[51]。
總之,神經網絡在AD腦電診斷中已經取得了一定研究進展,如果能夠在優化數據標簽與模型架構的基礎上融合多模態數據,將為臨床應用提供更好的支持,從而為實施AD早期患者的認知能力檢測以及認知障礙患者的大范圍篩查提供可能。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:李振陽完成了相關文獻搜集、整理工作,危志偉完成了文獻信息提取、文章圖像繪制,劉毅完成了文獻綜述、分析及文章的撰寫,徐永紅和謝平制定了文章的寫作思路,李昕完成了文章的審閱及校對,王玉琳和劉沁爽協助了稿件的修訂。
引言
世界衛生組織將癡呆癥定義為一種影響記憶力、思維能力和日常活動能力的神經退行性疾病[1],癡呆癥病例中60%~70%是由阿爾茨海默病(Alzheimer’s disease,AD)引起。AD于1906年由德國內科醫生阿洛伊斯·阿爾茨海默首次發現,該疾病是由蛋白質異常沉積(p-tau和β淀粉樣蛋白42)引起的老年斑和神經原纖維纏結、神經元連接失活、腦部炎癥、氧化應激和細胞死亡所致[2]。目前AD發病機制尚不明確,常見癥狀包括近期記憶喪失、判斷力差和失語癥。國際阿爾茨海默病協會的報告顯示:截止2019年1月,全球AD患者達5 000萬人[3];世界衛生組織預估,2050年患者數量將達到1.52億[4]。2021年5月11日《第七次全國人口普查公報》數據顯示:我國60歲及以上人口為2.64億人,占總人口的18.70%;65歲及以上人口為1.9億,占總人口的13.50%。預計到2050年我國AD患病人數為3 003萬[5]。從治療成本方面來看,2018年花費了1萬億美元用于治療認知疾病的患者;到2030年,這一支出預計將達到2萬億美元[6]。輕度認知障礙(mild cognitive impairment,MCI)是介于認知正常和AD的中間階段,其轉歸為AD的可能性更高[7]。因此,能夠準確地診斷出MCI患者并給予必要的干預措施,可在一定程度上延緩病情惡化,有利于患者早日康復,從而有效降低AD患者數量及護理成本,顯著提升患者及家屬的生活質量。
目前,AD臨床診斷方法主要包括神經成像技術[8-11]、生物標記物[12]、遺傳分析[13]和腦電圖(electroencephalogram,EEG)分析[14]等。EEG檢測作為一種非侵入性檢測手段,不僅信號采集技術相對成熟(已廣泛用于臨床診斷、狀態監測、腦機接口等場景中[15-16]),而且在設備的購置和維護上也較核磁共振成像設備經濟實用,這使得基于EEG的對認知障礙患者的低成本、大規模篩查成為可能,特別是在偏遠或欠發達地區。與正常人相比,神經元死亡所引發的連接性喪失在AD患者腦電信號中表現的異常特征是θ和δ活性的增加、α和β活性的降低[17-18],以及不同腦區之間的同步性、連通性喪失[19],所以腦電信號可以作為表征患者狀態、認知水平等信息或特征的載體。
基于機器學習的自動診斷技術在一定程度上可以輔助臨床醫師做出更好的臨床決策,有著廣泛的前景與發展空間。本文綜述了近年來將EEG結合神經網絡算法用于AD診斷的研究成果,主要包括前饋神經網絡(feedforward neural network,FNN)、循環神經網絡(recurrent neural network,RNN)、卷積神經網絡(convolutional neural network,CNN)、深度信念網絡(deep belief network,DBN)等模型的結構及其對認知障礙患者的診斷性能,并進一步展望了未來工作熱點與研究趨勢。
1 神經網絡模型及其AD診斷應用現狀
1943年,心理學家Warren McCulloch和數理邏輯學家Walter Pitts在生物神經網絡結構和功能啟發下首次提出了人工神經網絡概念及人工神經元的數學模型。隨后人工神經網絡在信息處理、模式識別、人工智能等領域得到了廣泛應用,這也促使其神經元類型、層數及拓撲結構更加復雜多樣[20]。兩者相互交融、相得益彰,因而使得神經網絡更加適用于以腦電診斷為代表的臨床應用。神經網絡用于AD診斷研究的成果可視化分析如圖1所示,可以看出基于EEG的AD診斷研究集中在近五年,主要以FNN和CNN為主。四種網絡對應的結構示意如圖2所示。


a. 前饋神經網絡;b. 循環神經網絡;c. 卷積神經網絡;d. 深度信念網絡
Figure2. Neural network structure diagrama. feedforward neural network; b. recurrent neural network; c. convolutional neural network; d. deep belief network
1.1 前饋神經網絡
FNN是神經網絡中最經典也是應用最為廣泛的模型,對應網絡結構如圖2a所示。如果隱含層不止一層,則稱為“深度”神經網絡。通常每一層中的每個神經元都與下一層的神經元存在直接連接,但同一層的神經元之間沒有連接或相互作用。隱藏層與外界沒有直接聯系,這也是稱之為隱藏層的原因。在進行認知障礙模式識別時,FNN通常僅包含一個隱層,但隱層中神經元的個數往往隨模型輸入、輸出的不同而不同;與此同時也有研究在構建診斷模型時使用兩層及以上的隱層[21-22]。在以FNN為判別方法的相關研究中,常用的分類特征及其模型性能如表1[21-29]所示。

從表1列舉的文獻清單可以看出腦電信號特征量主要分為時頻、統計、非線性和區域連通性等。針對不同的認知障礙患者和健康對照(healthy control,HC)受試者,可以采用時頻分析、獨立成分分析和多向陣列分解等方法從腦電節律中提取時頻量化特征,并結合FNN實現患者類別診斷。而將絕對、相對頻譜功率[21, 29]和小波相關性等時頻特征附加空間連通性、同步性度量[24]用于描述腦電信號間差異時,FNN進行模式識別的準確率和性能相對更出色。此外,由于腦電信號存在非線性、非平穩特性,不少研究綜合考慮時頻、統計、非線性特征(諸如常規頻段的相對功率、中值頻率、譜熵[26, 29]、樣本熵[27]、Tsallis熵[23]、排序熵、模糊熵、Lempel-Ziv復雜度、分形維數[25, 28]和自互信息[22]等)并將其用于腦電信號的分析中,根據特征矢量的維度構建復雜度相匹配的網絡模型,從而取得了不錯的效果。總的來說在這些研究中,相對于線性判別分析(linear discriminant analysis,LDA)、邏輯回歸、隨機森林、支持向量機(support vector machine,SVM)等傳統機器學習算法,FNN數據擬合能力更強,性能表現最佳。
1.2 循環神經網絡
RNN是在FNN的基礎上引入反饋結構的一類網絡模型,如圖2b所示:網絡中神經元的輸出值不僅可以傳遞給下一個神經元,還可以作用于自身,這意味著當前時刻的輸出由當前時刻的數據和歷史數據共同構成,即RNN模型中存在閉環結構。這不僅可以降低網絡復雜度,還可以實現數據流的循環、遞歸等。RNN所具有的記憶能力就是通過閉環結構中的參量來存儲過去的輸入狀態,從而在下一次輸入時產生影響。可以肯定的是這種結構使之能夠很好地挖掘腦電信號中隱含的復雜時間次序關系信息。迄今為止,以RNN為模型主體的AD診斷研究如表2[30-35]所示。

Elman神經網絡是最早應用于AD診斷研究的循環神經網絡結構。Goli等[30]依據腦電信號特定通道的時頻和統計等特征量化患者與健康人之間的差異時,發現Elman神經網絡在AD診斷方面比LDA和SVM更有效。與之相對的是Alvi等[33]采用長短時記憶網絡(long short-term memory,LSTM)處理降采樣后的EEG信號,研究表明具有2~3個LSTM層時,模型的性能(準確性、靈敏度和特異性)可以保持在90%以上,當增加隱藏層和神經元的數量時,性能開始下降。此外,對信號降采樣可使模型訓練/測試時間大幅降低。針對模型的穩定性,Alessandrini等[31]嘗試將RNN和主成分分析相結合,提出了一種較為魯棒的診斷系統,在面對不完整、損壞或其他丟失的數據時依然可以保持良好的準確性。
1.3 卷積神經網絡
CNN是將卷積運算引入神經網絡的一類網絡模型,如圖2c所示:卷積運算作為CNN的核心在網絡中以卷積層的形式存在,模型通常由多個卷積、池化、激活層和末端的全連接層(即傳統的神經網絡)組成,這一經典結構最早由Kunihiko Fukushima提出并沿用至今。對于二維圖像數據而言,卷積層的本質是使用一個帶權重的二維濾波器和圖像數據做卷積運算,并將運算所得數據經由激活、池化層排列組合結果作為潛在特征量,如此多次重復處理后得到圖像的高度抽象編碼,最終由全連接層進行模式識別。這種數據處理方式使得CNN具有很好的特征提取能力,近年來在醫療圖像處理任務中表現出很好的性能。相應的,CNN在AD分類任務的相關研究如表3[36-44]所示。

腦電信號這種特殊的圖像可以直接作為CNN的輸入數據進行模式識別[37, 45],避免了特征選取、計算等工作環節;與此同時對腦電信號處理所得的功率譜密度也可以作為表征認知障礙信息的圖像數據[36]。此外不少研究為提升診斷性能將腦電信號同步似然、功能連通性、小波熵值[42]以及能量分布的平均值、標準差和偏斜度等頻譜特征[39-41]經過特定的變換映射為RGB圖像,結合CNN完成認知障礙患者的篩查與診斷。與其他神經網絡不同的是CNN網絡構建可以采用諸如AlexNet等經典模型進行遷移學習[43],即以該經典網絡為起點,由新數據集對網絡進行訓練、微調網絡參數,從而更快、更容易地構建高精度模型,這對神經網絡模型在AD的臨床應用具有重要意義。
1.4 深度信念網絡
DBN是一種能夠建立輸入數據和輸出類別之間聯合概率分布的網絡模型,如圖2d所示,它包括輸入、輸出層以及隱藏層。除頂層外每兩層之間有兩個方向的權重,且同一層中的節點是獨立的,所以從結構上看DBN是由受限玻爾茲曼機(restricted Boltzmann machine,RBM)堆疊組成。該模型由Geoffery Hinton于2006年首次提出,與傳統神經網絡的訓練方式不同,DBN采用逐層訓練的方式,包括兩個步驟:第一步是用受試者的腦電數據對深度學習網絡進行無監督訓練,第二步是用腦電信號的標簽微調深度學習網絡。其典型的研究成果匯總于表4[46-48]中。

Zhao等[46]將RBM作為網絡的基本單元構建了三層DBN網絡對15名AD患者和15名HC受試者的腦電信號進行無監督學習,并結合支持向量機對網絡輸出特征進行分類,取得了92%的準確率。Jiang等[47]將腦電特征結合DBN實現了MCI患者與HC受試者的雙模態檢測,其識別準確率為89.87%。Bi等[48]在DBN中引入卷積層,提出了一種以深度脈沖卷積信念網絡為核心的多任務學習框架,可以完成患者腦電頻譜圖像全自動特征提取及模式識別。這一網絡框架增加了受試者間差異,減小了受試者內差異,有望用于醫療輔助系統并擴展到諸如癲癇等神經系統疾病的早期診斷中。
綜上所述,神經網絡在AD診斷中的應用主要是分為兩類,如圖3所示:分支a是以FNN為代表的,需要特征提取與特征選擇來確定最小冗余度和最大相關性的特征矢量,結合淺層神經網絡完成AD診斷分類;分支b是以CNN、DBN為代表的深度學習模型,采用特殊的網絡層代替人為選取特征的環節,對EEG數據信息進行表征學習,結合半監督式的特征學習和分層特征提取的網絡訓練方式加快模型構建時間及成本。區別于淺層學習,深度學習強調了模型結構的深度及特征學習的重要性,已有學者[43, 45]針對EEG應用深度學習展開研究。但由于EEG數據的特性,如何在沒有大量數據的情況下改進模型和混合傳統算法以獲得更好的診斷性能并減少模型計算時間,將成為當前和未來的新課題之一。

2 總結與展望
神經網絡在AD腦電診斷中取得了一定的研究進展,但是由于EEG的異質性、樣本量等影響,使得同類網絡結構的模型性能差異較大,在未來的研究中還有許多問題亟待解決。
2.1 建設共享數據平臺
數據是影響診斷效果的重要制約因素之一,研究者們通常是針對特定數據集進行模式識別方案設計、優化,導致網絡模型的泛化能力往往較差。為了探索認知障礙不同階段的診斷、評估干預效果,需要大量數據優化診斷模型。因此,建立統一、規范的在線共享數據平臺,將為認知障礙診斷任務中構建神經網絡模型提供先決條件;如果更多的研究人員將診斷模型、框架、代碼和匿名數據樣本開源,可以預期這對認知障礙相關的研究具有相當大的推動作用,在一定程度上降低了算法研發的時間和資金成本;且規范一致的數據集可以確保各模型運算性能具有可比性。
2.2 融合多模態數據
在提高模型可靠性方面可以嘗試多模態數據融合。例如,單純依賴步態數據很難鑒別MCI和AD患者,You等[38]創新性地利用步態數據和腦電信號數據結合CNN實現了患者快速、準確的分類。此外,已有研究將EEG和功能近紅外光譜用于AD的診斷研究中[49-50]。相較于單模態,多模態能獲得更多的輔助信息以及更豐富的表示,進而獲得更好的診斷效果。可以肯定的是不同模態的數據結合神經網絡算法有望更加穩定、可靠地實現神經疾病診斷與康復應用系統。
2.3 完善診斷標簽
目前研究多針對于AD/MCI/HC三分類,且分類精度及可靠性尚不足以滿足形形色色的臨床應用需求。AD患者的腦電信號通常表現出較高的個體差異性,特別是當考慮到不同階段的認知障礙和綜合征的患者時,確定來自同一地區不同醫院的AD患者的一般特征仍具有一定的挑戰,許多研究工作也表明區分MCI和HC相對于AD和HC困難得多。此外,在實際應用場景中,可以根據后續臨床治療的需求細化認知障礙等級的分類,如對阿爾茨海默型老年性癡呆、血管性癡呆和額顳葉癡呆等患者類型的確診。這可以通過機器學習研究人員與臨床醫師加強交叉融合來實現,保證更好地完善數據標簽。
2.4 優化診斷模型
構建深層神經網絡模型通常需要大量樣本才能取得較為理想的效果,但是獲取大量、高質量、帶標簽的EEG數據往往比較困難、昂貴且耗時。在算法層面,生成性對抗網絡模型可以在短期內生成人工腦電數據;而不帶標簽EEG數據獲取相對容易,且數據中同樣蘊含對應類別的EEG信息分布。DBN等半監督學習算法可以利用這一點,通過少量帶標簽EEG數據和大量不帶標簽的EEG數據構建診斷系統,這在未來研究中是極具潛力的。
可以肯定的是結構單一的診斷模型擬合能力存在局限性,不同神經網絡架構融合是一種必然趨勢。構建深層神經網絡時引入殘差結構,不僅能解決梯度消失問題,還能有效提升網絡性能。Bi等[48]和Gkenios等[32]分別在DBN和LSTM中創新性地引入卷積層,構建了較為新穎的高性能診斷模型。除此之外,脈沖神經網絡也是極具潛力的網絡架構[51]。
總之,神經網絡在AD腦電診斷中已經取得了一定研究進展,如果能夠在優化數據標簽與模型架構的基礎上融合多模態數據,將為臨床應用提供更好的支持,從而為實施AD早期患者的認知能力檢測以及認知障礙患者的大范圍篩查提供可能。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:李振陽完成了相關文獻搜集、整理工作,危志偉完成了文獻信息提取、文章圖像繪制,劉毅完成了文獻綜述、分析及文章的撰寫,徐永紅和謝平制定了文章的寫作思路,李昕完成了文章的審閱及校對,王玉琳和劉沁爽協助了稿件的修訂。