循環神經網絡結構極大地優化了時間序列數據的處理能力,但是其網絡梯度爆炸以及特征提取能力較差等問題,影響了它在輕度認知障礙(MCI)自動診斷中的應用。針對這一問題,本文提出貝葉斯優化雙向長短時神經網絡(BO-BiLSTM)構建MCI診斷模型的研究思路。診斷模型基于貝葉斯算法,結合先驗分布與后驗概率結果共同作用尋優BO-BiLSTM網絡超參數,并采用功率譜密度、模糊熵以及多重分形譜等能夠充分反映MCI腦認知狀態的多角度特征量作為診斷模型的輸入,實現MCI自動診斷。結果表明:基于特征融合的貝葉斯優化BiLSTM網絡模型,MCI診斷正確率可達到98.64%,能夠有效地完成MCI的診斷評估。綜上,基于此優化的長短時神經網絡模型,實現了MCI的自動診斷評估,為MCI智能診斷提供了一種新的模型。
引用本文: 李昕, 李振陽, 劉毅, 蘇芮, 徐永紅, 景軍, 尹立勇. 基于貝葉斯優化長短時神經網絡模型的輕度認知障礙診斷方法研究. 生物醫學工程學雜志, 2023, 40(3): 450-457. doi: 10.7507/1001-5515.202205005 復制
0 引言
輕度認知障礙(mild cognitive impairment,MCI)是阿爾茨海默病(Alzheimer’s disease,AD)診療的關鍵階段[1-5],針對這一特殊階段,如何構建診斷模型,在實現MCI有效診斷的同時,保證診斷特征量物理意義具有一定的可解釋性,正越來越引起該領域學者的關注。
傳統的機器學習算法基于特征提取與選擇,挖掘能夠反映腦功能狀態的特征量,實現MCI診斷識別[6-9]。如Yin等[10]研究了一種基于頻譜分析的綜合方案,通過把平穩小波變換和描述性統計分析引入三維離散特征空間,并基于支持向量機(support vector machine,SVM)實現MCI診斷,診斷正確率最高可達96.94%。Siuly等[11]通過提取排列熵和自回歸模型特征,比較了極限學習機、SVM和K最鄰近的診斷效果,其中基于極限學習機獲得了98.78%的MCI診斷正確率。傳統機器學習算法依賴特征提取效果,容易出現過擬合現象。而循環神經網絡(recurrent neural network,RNN)因其分析序列信息的優勢在AD診斷得以應用[12-17]。長短時神經網絡(long short-term memory networks,LSTM)作為一種優化的RNN模型,采用多個門來控制信息流,有效地解決了梯度爆炸或消失的問題[18-22],在MCI診斷中更具優勢。
Michielli等[21]通過提取EEG的時頻特征并進行特征選擇,運用LSTM網絡進行睡眠周期分類,對五種睡眠狀態的分類正確率達到86.7%。Tsiouris等[22]通過提取時域、頻域、相關性和圖論等特征,基于LSTM網絡進行癲癇預測,結果表明與傳統機器學習和卷積神經網絡相比,所提出的基于LSTM的方法具有顯著性能提升。而雙向LSTM(bi-directional LSTM,BiLSTM)更是能在兩個方向[23-24]上獲取信息,如Yan等[25]運用靜息態功能磁共振成像(magnetic resonance imaging,MRI)數據,運用動態功能連接結合BiLSTM的方法進行MCI分類,準確率達到73.6%。Feng等[26]利用MRI和PET數據,通過3D-CNN結合BiLSTM方法進行AD、MCI與正常對照(normal control,NC)之間的兩兩分類,其中AD與MCI、MCI和NC分類的準確率分別達到94.82%和86.36%。
本文基于貝葉斯優化算法(Bayesian optimization,BO)尋優BiLSTM的超參數,構建MCI診斷模型(BO-BiLSTM模型),提取功率譜密度(power spectral density,PSD)、腦電復雜度[27]和多重分形譜[28]等多角度特征作為診斷模型輸入,實現MCI診斷。
1 基本方法
1.1 MCI特征
1.1.1 功率譜密度
功率譜密度描述了一個信號或時間序列的功率隨頻率的分布,能有效地反映信號在頻域的特征。本文的頻譜分析選取了δ頻段(0.1~4 Hz)、θ頻段(4~8 Hz)、α頻段(8~12 Hz)、β頻段(12~30 Hz)4個頻段。設腦電信號為 ,其中功率譜密度計算公式見式(1):
![]() |
式中為腦電信號的能量信號,則頻域特征
為式(2):
![]() |
1.1.2 模糊熵
模糊熵(fuzzy entropy,FuzzyEn)衡量的是新模式產生的概率大小,測度值越大,新模式產生的概率越大,即序列復雜度越大。以為窗,將腦電信號
分為
個序列
之后,計算每個序列與所有
序列的距離得出
,根據距離計算模糊隸屬度如式(3)所示:
![]() |
對除自身以外的所有隸屬度求平均得到式(4):
![]() |
將窗由m變為m+1,重復上述過程,則模糊熵為式(5):
![]() |
1.1.3 多重分形
基于奇異維度分析MCI的多重分形去趨勢波動(multifractal detrended fluctuation analyses,MFDFA)特性。首先將腦電信號歸一化得到序列
,以相同長度
分成不重疊的
段并進行多項式擬合得到
。
階波動函數的平均值如式(6)所示:
![]() |
其中為擬合后的多項式趨勢
與
的方差。
根據和時間尺度之間存在冪律關系得到廣義的Hurst指數
,奇異指數
和
階奇異維度
如式(7)(8)所示:
![]() |
![]() |
選擇最優的階數范圍為[?5, 5][29],將分形譜圖中最小值和最大值點以及
的最大值點合并得到需要提取的多重分形特征
。
1.2 BO-BiLSTM模型
LSTM單元結構如圖1所示,LSTM通過遺忘門和記憶單元保證在每一次更新時,門機制選擇是否更新上一次的記憶,從而避免傳統RNN的梯度消失問題[30]。LSTM中可學習權重包括輸入權重W、循環權重R以及偏置b。

矩陣串聯如下:
![]() |
i、f、g、o分別表示輸入門、遺忘門、候選單元和輸出門。其中輸入門要將新的信息選擇性地記錄到單元狀態中;遺忘門主要作用為將單元狀態中的信息進行選擇性遺忘,去除冗余數據;候選單元是通過遺忘門更新單元信息;輸出門則是將更新后的單元狀態進行判斷并輸出。
對于腦電時間序列特征,其中LSTM中的各單元具體計算如下:
![]() |
![]() |
![]() |
![]() |
![]() |
其中表示狀態激活函數,為雙曲正切函數(tanh)計算狀態激活函數。
表示門激活函數。
BiLSTM由兩個結構相同、方向相反的LSTM組成,時刻正向LSTM的輸出為
,反向的輸出為
,則BiLSTM的隱層狀態
為式(14):
![]() |
為矩陣拼接。
目前在超參數優化的方法中,被廣泛使用的有網格搜索算法、隨機搜索算法、啟發式搜索算法。但是,網格搜索算法結構復雜,非常耗時;隨機搜索算法與網格算法相比效率有所提高但訓練結果不穩定;啟發式搜索算法包括遺傳算法和粒子群優化算法,遺傳算法雖然能得到有效的最優解,但是編碼和解碼工作比較復雜,粒子群優化算法則容易陷入局部最優。貝葉斯優化算法基于貝葉斯定理,對于目標函數表達式未知、搜索代價高昂問題,貝葉斯優化通過不斷更新概率模型并進行目標函數評估來更新優化函數的后驗概率,得到最優的模型超參數組合,能夠有效解決LSTM模型超參數優化的速度和最優解問題。貝葉斯優化算法模型的超參數組合選擇如公式(15):
![]() |
其中為目標函數,
為函數最小值,
為需要的最優超參數組合。
更新后驗概率進行優化如式(16)所示:
![]() |
其中為高斯分布,
為高斯回歸過程。可由式(17)的核矩陣Σ來確定:
![]() |
貝葉斯超參數的目的就是通過不斷迭代得到一個最優的超參數組合,使模型誤差最小。其中各參數傳遞過程如圖2所示。

經過特征提取分別得到
、
、
以及融合特征F后作為BO-BiLSTM網絡輸入。
1.3 診斷模型
整體流程如圖3所示。基于獨立成分分析(independent components analysis,ICA)去除眼電等干擾,完成腦電信號預處理。為了更好地提取腦電信號的時間特性并且擴充數據,預處理后以15 s進行分段來構成每一個樣本,通過加1 s的時間窗以50%為重疊采樣率將15 s的數據分為29段,計算每一段的功率譜特征、模糊熵以及多重分形特征,進行特征融合后運用BO-BiLSTM模型實現MCI診斷。

2 實驗及結果分析
2.1 腦電數據
49名右利手受試者參與本研究,分為MCI組和NC組。MCI組受試28例平均年齡65.1歲(60 ~ 70歲),NC受試者平均年齡63.4歲(60 ~ 70歲),均來自秦皇島市第一醫院。所有參與者在醫院接受了視覺和聽覺測試,均在正常范圍內。通過MRI或者計算機斷層掃描檢查排除腦局灶性病變。受試者的劍橋認知測試都在60分以上,所有參與者都使用簡易心理狀態測試(Mini-Mental State Examination,MMSE)、蒙特利爾認知評估(Montreal Cognitive Assessment Scale,MoCA)和日常生活能力(Activities of Daily Living,ADL)評定,并且均以書面形式向秦皇島市第一醫院神經內科醫生提供知情同意書。實驗依據《赫爾辛基宣言》進行,并得到秦皇島市第一醫院醫學倫理審查委員會的批準。
受試者信息如表1所示,MCI和NC受試者在年齡和受教育程度上組間差異無統計學意義(P>0.05),而三個量表得分的組間差異具有統計學意義(P<0.05)。腦電信號采集使用北京中科新拓儀器有限公司的數字腦電圖儀NT9200。該設備共16導通道,電極按照國際標準10/20系統放置,分別為FP1、FP2、F3、F4、C3、C4、P3、P4、O1、O2、F7、F8、T3、T4、T5、T6,采樣率為1 000 Hz。在腦電圖信號記錄過程中,受試者保持清醒,坐在安靜房間里舒適的椅子上,處于放松地閉上眼睛的狀態,不進行其他活動(如搖頭、咬牙或面部運動)。記錄所有受試者腦電圖信號5 min。

2.2 腦電信號特征分析
ICA是一種由盲信號源分解技術發展而來的多通道信號處理方法,該方法特點是將多通道的腦電觀察信號按統計獨立的原則,通過優化算法分解成若干相互獨立的部分,來進一步實現信號的增強和分析。通過人為選擇來消除噪聲,以得到較好的腦電信號。運用ICA方法排除眼電、心電、肌電等干擾,基于EEGLAB完成腦電預處理。
2.2.1 功率譜密度
功率譜密度結果如圖4所示。MCI受試者的平均功率譜密度在低頻部分(3 ~ 5 Hz)高于對照組,而其他頻段明顯低于相應對照組。

2.2.2 模糊熵
16通道模糊熵如圖5所示,MCI受試者各通道的模糊熵平均值均小于對照組。

2.2.3 多重分形
多重分形結果如圖6所示,MCI和NC受試者的多重分形譜圖均為單峰拱形,說明兩者都具有多重分形特征。奇異譜寬度如表2所示,MCI的奇異譜寬度平均值比NC高0.081,表明MCI的時間序列分布相對不均勻,分形特征更顯著。


使用獨立樣本t檢驗對NC和MCI兩組特征進行比較。結果如表3所示,MCI和NC受試者在功率譜密度特征指標上組間差異無統計學意義(P>0.05),而其余特征指標組間差異具有統計學意義(P<0.01)。

2.3 基于多特征的MCI診斷
BiLSTM默認隱層單元為16個,學習速率為0.001,選擇迭代次數為1 600次,其中優化器和損失函數運用常規的Adam以及平均平方損失函數。融合功率譜密度、模糊熵以及多重分形特征作為診斷模型輸入,采用10倍交叉驗證完成MCI診斷。
MCI診斷性能評估采用受試者操作特征(receiver operating characteristic,ROC)曲線和曲線下面積(area under curve,AUC)、準確率(accuracy,ACC)、靈敏度(sensitivity,SENS)、特異度(spcificity,SPEC)、F1值(f1-score,F1)等評估參數。
基于貝葉斯優化算法進行參數尋優,首先將超參數的分布利用高斯過程構建一個目標函數,通過計算目標函數的均值和方差計算采集函數,再通過采集函數的極值確定下一個采樣點。通過逐漸增加采樣點,使得模型逐漸逼近真實的目標函數,從而獲得最優超參數值。本文選擇隱含層神經元數量和學習速率作為優化的超參數,根據訓練集的大小將隱含層神經元的數量設置為5~30,BiLSTM的收斂速度和訓練精度對網絡學習速率比較敏感,學習速率的搜索范圍設為[1e-5,1e-1]。
基于貝葉斯優化超參數結果如圖7所示,可以發現設置最大隱含層且學習速率適中以及設置最小隱含層且學習速率最小時結果都不理想,當隱層個數在10到20之間時誤差較小,優化分析選擇最優隱含層神經元為20,最優學習速率為9.3e-4。為了更好地與傳統機器學習進行對比,本文采用SVM作為對比方法,診斷結果如表4所示,其中、
、
以及F分別表示運用功率譜密度、模糊熵、多重分形特征以及融合特征作為輸入。


結果表明:運用單特征進行分類診斷時,功率譜密度特征的分類效果較好,達到93.95%的平均分類準確率。融合多特征后的分類結果優于單特征分類結果,其中BiLSTM的平均準確率達到97.46%,而BO-BiLSTM平均準確率達到98.64%,且其SENS、SPEC、F1值都最高,分別達到98.70%、98.60%、98.69%。圖8為LSTM、BiLSTM、BO-BiLSTM網絡在多特征下的ROC曲線,圖9為ACC和LOSS曲線。


圖8中實線為平均ROC曲線,陰影部分為對應誤差范圍,其中BO-BiLSTM模型ROC曲線結果最好,誤差范圍也較小,且平均AUC達到0.984 2。
通過圖9對比三者的LOSS曲線以及ACC曲線圖,BO-BiLSTM網絡的收斂速度快于其余兩者且損失更少,準確率更高,明顯優于優化前。
3 結論
本文基于多特征融合和BO-BiLSTM優化模型實現MCI診斷,分別從不同角度提取了功率譜密度、腦電復雜度和多重分形譜圖三類腦電診斷特征,基于貝葉斯優化尋優網絡的局部超參數,以此進一步提高了模型的診斷性能。基于此模型,MCI的診斷平均準確率達到98.64%,平均靈敏度為98.70%,平均特異度為98.60%,平均F1值為98.69%,平均AUC為98.42%。結果表明BO-BiLSTM優化模型可以有效地實現MCI的診斷。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:李振陽完成了特征提取分析、網絡搭建及文章的撰寫,劉毅完成了相關文獻搜集、整理工作,蘇芮對特征提取提供了指導意見,徐永紅和景軍制定了文章的寫作思路,李昕完成了文章的審閱及校對,尹立勇對數據的提取處理提供了指導意見。
倫理聲明:本研究已通過秦皇島市第一醫院醫學倫理審查委員會的審批(倫理審查編號:UY202201)。
0 引言
輕度認知障礙(mild cognitive impairment,MCI)是阿爾茨海默病(Alzheimer’s disease,AD)診療的關鍵階段[1-5],針對這一特殊階段,如何構建診斷模型,在實現MCI有效診斷的同時,保證診斷特征量物理意義具有一定的可解釋性,正越來越引起該領域學者的關注。
傳統的機器學習算法基于特征提取與選擇,挖掘能夠反映腦功能狀態的特征量,實現MCI診斷識別[6-9]。如Yin等[10]研究了一種基于頻譜分析的綜合方案,通過把平穩小波變換和描述性統計分析引入三維離散特征空間,并基于支持向量機(support vector machine,SVM)實現MCI診斷,診斷正確率最高可達96.94%。Siuly等[11]通過提取排列熵和自回歸模型特征,比較了極限學習機、SVM和K最鄰近的診斷效果,其中基于極限學習機獲得了98.78%的MCI診斷正確率。傳統機器學習算法依賴特征提取效果,容易出現過擬合現象。而循環神經網絡(recurrent neural network,RNN)因其分析序列信息的優勢在AD診斷得以應用[12-17]。長短時神經網絡(long short-term memory networks,LSTM)作為一種優化的RNN模型,采用多個門來控制信息流,有效地解決了梯度爆炸或消失的問題[18-22],在MCI診斷中更具優勢。
Michielli等[21]通過提取EEG的時頻特征并進行特征選擇,運用LSTM網絡進行睡眠周期分類,對五種睡眠狀態的分類正確率達到86.7%。Tsiouris等[22]通過提取時域、頻域、相關性和圖論等特征,基于LSTM網絡進行癲癇預測,結果表明與傳統機器學習和卷積神經網絡相比,所提出的基于LSTM的方法具有顯著性能提升。而雙向LSTM(bi-directional LSTM,BiLSTM)更是能在兩個方向[23-24]上獲取信息,如Yan等[25]運用靜息態功能磁共振成像(magnetic resonance imaging,MRI)數據,運用動態功能連接結合BiLSTM的方法進行MCI分類,準確率達到73.6%。Feng等[26]利用MRI和PET數據,通過3D-CNN結合BiLSTM方法進行AD、MCI與正常對照(normal control,NC)之間的兩兩分類,其中AD與MCI、MCI和NC分類的準確率分別達到94.82%和86.36%。
本文基于貝葉斯優化算法(Bayesian optimization,BO)尋優BiLSTM的超參數,構建MCI診斷模型(BO-BiLSTM模型),提取功率譜密度(power spectral density,PSD)、腦電復雜度[27]和多重分形譜[28]等多角度特征作為診斷模型輸入,實現MCI診斷。
1 基本方法
1.1 MCI特征
1.1.1 功率譜密度
功率譜密度描述了一個信號或時間序列的功率隨頻率的分布,能有效地反映信號在頻域的特征。本文的頻譜分析選取了δ頻段(0.1~4 Hz)、θ頻段(4~8 Hz)、α頻段(8~12 Hz)、β頻段(12~30 Hz)4個頻段。設腦電信號為 ,其中功率譜密度計算公式見式(1):
![]() |
式中為腦電信號的能量信號,則頻域特征
為式(2):
![]() |
1.1.2 模糊熵
模糊熵(fuzzy entropy,FuzzyEn)衡量的是新模式產生的概率大小,測度值越大,新模式產生的概率越大,即序列復雜度越大。以為窗,將腦電信號
分為
個序列
之后,計算每個序列與所有
序列的距離得出
,根據距離計算模糊隸屬度如式(3)所示:
![]() |
對除自身以外的所有隸屬度求平均得到式(4):
![]() |
將窗由m變為m+1,重復上述過程,則模糊熵為式(5):
![]() |
1.1.3 多重分形
基于奇異維度分析MCI的多重分形去趨勢波動(multifractal detrended fluctuation analyses,MFDFA)特性。首先將腦電信號歸一化得到序列
,以相同長度
分成不重疊的
段并進行多項式擬合得到
。
階波動函數的平均值如式(6)所示:
![]() |
其中為擬合后的多項式趨勢
與
的方差。
根據和時間尺度之間存在冪律關系得到廣義的Hurst指數
,奇異指數
和
階奇異維度
如式(7)(8)所示:
![]() |
![]() |
選擇最優的階數范圍為[?5, 5][29],將分形譜圖中最小值和最大值點以及
的最大值點合并得到需要提取的多重分形特征
。
1.2 BO-BiLSTM模型
LSTM單元結構如圖1所示,LSTM通過遺忘門和記憶單元保證在每一次更新時,門機制選擇是否更新上一次的記憶,從而避免傳統RNN的梯度消失問題[30]。LSTM中可學習權重包括輸入權重W、循環權重R以及偏置b。

矩陣串聯如下:
![]() |
i、f、g、o分別表示輸入門、遺忘門、候選單元和輸出門。其中輸入門要將新的信息選擇性地記錄到單元狀態中;遺忘門主要作用為將單元狀態中的信息進行選擇性遺忘,去除冗余數據;候選單元是通過遺忘門更新單元信息;輸出門則是將更新后的單元狀態進行判斷并輸出。
對于腦電時間序列特征,其中LSTM中的各單元具體計算如下:
![]() |
![]() |
![]() |
![]() |
![]() |
其中表示狀態激活函數,為雙曲正切函數(tanh)計算狀態激活函數。
表示門激活函數。
BiLSTM由兩個結構相同、方向相反的LSTM組成,時刻正向LSTM的輸出為
,反向的輸出為
,則BiLSTM的隱層狀態
為式(14):
![]() |
為矩陣拼接。
目前在超參數優化的方法中,被廣泛使用的有網格搜索算法、隨機搜索算法、啟發式搜索算法。但是,網格搜索算法結構復雜,非常耗時;隨機搜索算法與網格算法相比效率有所提高但訓練結果不穩定;啟發式搜索算法包括遺傳算法和粒子群優化算法,遺傳算法雖然能得到有效的最優解,但是編碼和解碼工作比較復雜,粒子群優化算法則容易陷入局部最優。貝葉斯優化算法基于貝葉斯定理,對于目標函數表達式未知、搜索代價高昂問題,貝葉斯優化通過不斷更新概率模型并進行目標函數評估來更新優化函數的后驗概率,得到最優的模型超參數組合,能夠有效解決LSTM模型超參數優化的速度和最優解問題。貝葉斯優化算法模型的超參數組合選擇如公式(15):
![]() |
其中為目標函數,
為函數最小值,
為需要的最優超參數組合。
更新后驗概率進行優化如式(16)所示:
![]() |
其中為高斯分布,
為高斯回歸過程。可由式(17)的核矩陣Σ來確定:
![]() |
貝葉斯超參數的目的就是通過不斷迭代得到一個最優的超參數組合,使模型誤差最小。其中各參數傳遞過程如圖2所示。

經過特征提取分別得到
、
、
以及融合特征F后作為BO-BiLSTM網絡輸入。
1.3 診斷模型
整體流程如圖3所示。基于獨立成分分析(independent components analysis,ICA)去除眼電等干擾,完成腦電信號預處理。為了更好地提取腦電信號的時間特性并且擴充數據,預處理后以15 s進行分段來構成每一個樣本,通過加1 s的時間窗以50%為重疊采樣率將15 s的數據分為29段,計算每一段的功率譜特征、模糊熵以及多重分形特征,進行特征融合后運用BO-BiLSTM模型實現MCI診斷。

2 實驗及結果分析
2.1 腦電數據
49名右利手受試者參與本研究,分為MCI組和NC組。MCI組受試28例平均年齡65.1歲(60 ~ 70歲),NC受試者平均年齡63.4歲(60 ~ 70歲),均來自秦皇島市第一醫院。所有參與者在醫院接受了視覺和聽覺測試,均在正常范圍內。通過MRI或者計算機斷層掃描檢查排除腦局灶性病變。受試者的劍橋認知測試都在60分以上,所有參與者都使用簡易心理狀態測試(Mini-Mental State Examination,MMSE)、蒙特利爾認知評估(Montreal Cognitive Assessment Scale,MoCA)和日常生活能力(Activities of Daily Living,ADL)評定,并且均以書面形式向秦皇島市第一醫院神經內科醫生提供知情同意書。實驗依據《赫爾辛基宣言》進行,并得到秦皇島市第一醫院醫學倫理審查委員會的批準。
受試者信息如表1所示,MCI和NC受試者在年齡和受教育程度上組間差異無統計學意義(P>0.05),而三個量表得分的組間差異具有統計學意義(P<0.05)。腦電信號采集使用北京中科新拓儀器有限公司的數字腦電圖儀NT9200。該設備共16導通道,電極按照國際標準10/20系統放置,分別為FP1、FP2、F3、F4、C3、C4、P3、P4、O1、O2、F7、F8、T3、T4、T5、T6,采樣率為1 000 Hz。在腦電圖信號記錄過程中,受試者保持清醒,坐在安靜房間里舒適的椅子上,處于放松地閉上眼睛的狀態,不進行其他活動(如搖頭、咬牙或面部運動)。記錄所有受試者腦電圖信號5 min。

2.2 腦電信號特征分析
ICA是一種由盲信號源分解技術發展而來的多通道信號處理方法,該方法特點是將多通道的腦電觀察信號按統計獨立的原則,通過優化算法分解成若干相互獨立的部分,來進一步實現信號的增強和分析。通過人為選擇來消除噪聲,以得到較好的腦電信號。運用ICA方法排除眼電、心電、肌電等干擾,基于EEGLAB完成腦電預處理。
2.2.1 功率譜密度
功率譜密度結果如圖4所示。MCI受試者的平均功率譜密度在低頻部分(3 ~ 5 Hz)高于對照組,而其他頻段明顯低于相應對照組。

2.2.2 模糊熵
16通道模糊熵如圖5所示,MCI受試者各通道的模糊熵平均值均小于對照組。

2.2.3 多重分形
多重分形結果如圖6所示,MCI和NC受試者的多重分形譜圖均為單峰拱形,說明兩者都具有多重分形特征。奇異譜寬度如表2所示,MCI的奇異譜寬度平均值比NC高0.081,表明MCI的時間序列分布相對不均勻,分形特征更顯著。


使用獨立樣本t檢驗對NC和MCI兩組特征進行比較。結果如表3所示,MCI和NC受試者在功率譜密度特征指標上組間差異無統計學意義(P>0.05),而其余特征指標組間差異具有統計學意義(P<0.01)。

2.3 基于多特征的MCI診斷
BiLSTM默認隱層單元為16個,學習速率為0.001,選擇迭代次數為1 600次,其中優化器和損失函數運用常規的Adam以及平均平方損失函數。融合功率譜密度、模糊熵以及多重分形特征作為診斷模型輸入,采用10倍交叉驗證完成MCI診斷。
MCI診斷性能評估采用受試者操作特征(receiver operating characteristic,ROC)曲線和曲線下面積(area under curve,AUC)、準確率(accuracy,ACC)、靈敏度(sensitivity,SENS)、特異度(spcificity,SPEC)、F1值(f1-score,F1)等評估參數。
基于貝葉斯優化算法進行參數尋優,首先將超參數的分布利用高斯過程構建一個目標函數,通過計算目標函數的均值和方差計算采集函數,再通過采集函數的極值確定下一個采樣點。通過逐漸增加采樣點,使得模型逐漸逼近真實的目標函數,從而獲得最優超參數值。本文選擇隱含層神經元數量和學習速率作為優化的超參數,根據訓練集的大小將隱含層神經元的數量設置為5~30,BiLSTM的收斂速度和訓練精度對網絡學習速率比較敏感,學習速率的搜索范圍設為[1e-5,1e-1]。
基于貝葉斯優化超參數結果如圖7所示,可以發現設置最大隱含層且學習速率適中以及設置最小隱含層且學習速率最小時結果都不理想,當隱層個數在10到20之間時誤差較小,優化分析選擇最優隱含層神經元為20,最優學習速率為9.3e-4。為了更好地與傳統機器學習進行對比,本文采用SVM作為對比方法,診斷結果如表4所示,其中、
、
以及F分別表示運用功率譜密度、模糊熵、多重分形特征以及融合特征作為輸入。


結果表明:運用單特征進行分類診斷時,功率譜密度特征的分類效果較好,達到93.95%的平均分類準確率。融合多特征后的分類結果優于單特征分類結果,其中BiLSTM的平均準確率達到97.46%,而BO-BiLSTM平均準確率達到98.64%,且其SENS、SPEC、F1值都最高,分別達到98.70%、98.60%、98.69%。圖8為LSTM、BiLSTM、BO-BiLSTM網絡在多特征下的ROC曲線,圖9為ACC和LOSS曲線。


圖8中實線為平均ROC曲線,陰影部分為對應誤差范圍,其中BO-BiLSTM模型ROC曲線結果最好,誤差范圍也較小,且平均AUC達到0.984 2。
通過圖9對比三者的LOSS曲線以及ACC曲線圖,BO-BiLSTM網絡的收斂速度快于其余兩者且損失更少,準確率更高,明顯優于優化前。
3 結論
本文基于多特征融合和BO-BiLSTM優化模型實現MCI診斷,分別從不同角度提取了功率譜密度、腦電復雜度和多重分形譜圖三類腦電診斷特征,基于貝葉斯優化尋優網絡的局部超參數,以此進一步提高了模型的診斷性能。基于此模型,MCI的診斷平均準確率達到98.64%,平均靈敏度為98.70%,平均特異度為98.60%,平均F1值為98.69%,平均AUC為98.42%。結果表明BO-BiLSTM優化模型可以有效地實現MCI的診斷。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:李振陽完成了特征提取分析、網絡搭建及文章的撰寫,劉毅完成了相關文獻搜集、整理工作,蘇芮對特征提取提供了指導意見,徐永紅和景軍制定了文章的寫作思路,李昕完成了文章的審閱及校對,尹立勇對數據的提取處理提供了指導意見。
倫理聲明:本研究已通過秦皇島市第一醫院醫學倫理審查委員會的審批(倫理審查編號:UY202201)。