針對臨床帕金森病(PD)伴快速眼動睡眠行為障礙(RBD)診斷方法的局限性,為了提高診斷準確率,提出基于少導聯腦電和時頻深度網絡的智能輔助診斷方法。首先,為提高運算速度及算法魯棒性,對各被試者的6導聯頭皮腦電數據進行等長的時間窗提取;然后,基于時間窗腦電數據構建時頻深度網絡,并得到基于時間窗的分類結果;最后,對各被試者所有時間窗腦電數據的分類結果進行綜合決策,實現基于被試者的PD伴RBD輔助診斷。本文以南京醫科大學附屬腦科醫院采集的PD伴和不伴RBD患者的多導睡眠圖(PSG)為研究對象,兩類數據各30例,以醫生診斷結果作為金標準進行算法性能驗證。本文方法基于時間窗的分類準確率為0.902 4,基于被試者的分類準確率為0.933 3,比RBD臨床篩查問卷效果更好。
引用本文: 仲偉峰, 李志, 劉燕, 程晨晨, 王悅, 張麗, 徐淑蘭, 蔣旭, 朱駿, 戴亞康. 基于少導聯腦電和時頻深度網絡的帕金森病伴快速眼動睡眠行為障礙智能輔助診斷方法. 生物醫學工程學雜志, 2021, 38(6): 1043-1053. doi: 10.7507/1001-5515.202009067 復制
引言
帕金森病(Parkinson’s disease,PD)是僅次于阿爾茨海默病的第二常見神經退行性疾病,其運動癥狀表現為靜止性震顫、運動遲緩、肌強直和姿勢平衡障礙等。睡眠障礙是PD常見的非運動癥狀之一,約三分之一的PD患者同時伴有快速眼動睡眠行為障礙(rapid eye movement sleep behavior disorder,RBD)[1]。臨床定義RBD為PD的亞型[2],其病癥為快速眼動(rapid eye movement,REM)睡眠期肌肉弛緩現象消失并伴有與夢境相關的復雜運動[3]。PD伴RBD患者相比原發性PD患者的帕金森病程持續時間更長,運動障礙及運動并發癥更重,睡眠質量更差,自主神經障礙更加突出[4-5],且臨床認為RBD是PD患者出現認知功能障礙的獨立因素[6]。研究表明RBD是PD患者神經退行性過程的突出標志,與PD的臨床惡性表型相關,故正確診斷PD伴RBD具有改善治療和預后的價值[7]。
目前,多導睡眠圖(polysomnography,PSG)是RBD診斷的金標準,臨床專家基于經驗觀察PSG數據,分析患者是否喪失正常REM睡眠期伴有的肌張力抑制[8-9],實現RBD的診斷。PSG是一種新興的資源密集型設備,只有少部分醫院擁有,不能全面用于疑似PD伴RBD患者的睡眠監測;另外,PSG包括腦電圖、眼電圖和肌電圖等十余種生理信號的幾十個采集電極,電極分布全身,易干擾患者的睡眠,且監測地點位于醫院,導致部分患者無法入睡。當缺少PSG或PSG不適用時,RBD篩查問卷(RBD screening questionnaire,RBDSQ)是臨床對RBD患者診斷的重要工具。RBDSQ對非PD患者的RBD診斷效果相對理想,但對PD伴RBD患者的診斷特異性較低,整體上不能適用于PD患者是否伴RBD的診斷[10]。由此可見,臨床現有PD伴RBD診斷方法具有局限性,迫切需要設備舒適度高、診斷準確率高的智能輔助診斷方法。
腦電通過放置在頭皮上的電極直接測量并記錄了大腦皮層和皮下神經元的放電情況,具有時間分辨率高、無損傷、無輻射和成本低等特點[11],被廣泛用于神經系統疾病和腦機接口研究[12-15]。在RBD診斷研究中,Koch等[16]提出采用主題建模方法對腦電信號進行睡眠分期,計算睡眠分期特征并使用k均值聚類算法實現PD或RBD的輔助診斷。該方法把PD和RBD視為一類,區別于正常對照組,且依賴被試者的睡眠分期情況。已有研究表明RBD患者的非REM期腦電有θ波活躍和β2波抑制現象,同時睡眠結構和睡眠穩定性也會發生改變[17]。因此,對RBD的診斷研究可以不局限于睡眠分期或REM期腦電提取。Bisgaard等[18]提取睡眠腦電信號的三種時域特征,使用離群點檢測算法實現RBD的輔助診斷。該方法肯定了睡眠腦電對區分RBD和正常對照組的作用,但分類準確率只有78%,并不理想。據調研,PD伴RBD的智能輔助診斷研究相對較少,PD患者中的RBD診斷也比正常人中的RBD診斷更具挑戰性[7]。以上RBD輔助診斷的研究均是先對腦電信號進行特征提取,再利用機器學習算法實現RBD患者和正常人的分類,同類方法有望用于PD伴RBD的研究。另外,對患者而言,腦電導聯數量會在一定程度上影響佩戴舒適度,在保證輔助診斷準確率的同時,應盡量減少研究中使用的導聯數量。因此,本文基于少導聯頭皮腦電開展不依賴睡眠分期的PD伴RBD輔助診斷方法研究。
腦電信號的特征提取和分類是PD伴RBD輔助診斷研究最重要的兩個階段。特征提取方法主要分為三類:時域、頻域和時頻域的方法[19]。時域特征和頻域特征局限于信號的區域特征,忽視了腦電信號的動態特性。時頻域特征提取了時域和頻域的聯合特征,增加了分類結果的可信度,是腦電信號分析的有效方法。分類方法包括傳統機器學習方法和深度學習方法,其中深度學習是數據分析的發展趨勢,在模式識別和計算機視覺領域領先于其他機器學習方法[20]。在睡眠腦電研究中,Wei等[21]和Jadhav等[22]使用腦電時頻特征和深度學習方法實現睡眠分期,比Fraiwan等[23]使用傳統分類算法的睡眠分期方法表現出更好的分期效果。上述研究體現了深度學習方法在分析睡眠腦電時頻特征的優勢。卷積神經網絡(convolutional neural networks,CNN)是深度學習的代表算法之一[24],會自動學習從原始圖像獲取的高層次和高抽象特征,在醫學圖像的識別和分割方面非常有效[20,25-26]。結合腦電時頻譜圖和CNN的方法在癲癇預警、睡意檢測和準腦死亡診斷等研究中得到良好的應用[27-30]。因此,本文在處理相同的腦電時頻特征時,基于CNN構建時頻深度網絡,實現基于少導聯腦電的PD伴或不伴RBD的分類。
本文提出一種基于少導聯頭皮腦電和時頻深度網絡的PD伴RBD的智能輔助診斷方法。該方法通過對被試者整晚的睡眠腦電信號進行時間窗提取,并以時間窗腦電數據為樣本訓練時頻深度網絡,以期實現基于被試者的PD伴RBD輔助診斷。
1 方法
本文提出一種基于少導聯頭皮腦電和時頻深度網絡的PD伴RBD的智能輔助診斷方法。該方法將PD伴RBD的輔助診斷問題轉化成PD伴RBD(PD with RBD,PD + RBD)和PD不伴RBD(PD without RBD,PD-RBD)的分類問題,定義PD + RBD腦電信號為正類,標記為1;定義PD-RBD腦電信號為負類,標記為0。該方法的架構圖如圖1所示,共分為四個步驟:① 數據采集;② 數據預處理;③ 訓練過程;④ 測試過程。

1.1 數據采集
臨床診斷RBD的金標準是對PSG數據的綜合分析[8-9],本文數據源是由南京醫科大學附屬腦科醫院老年醫學中心提供的PSG數據。本項研究得到了南京醫科大學附屬腦科醫院的批準,并獲得了所有參與者的知情同意。原始數據集為2018年1月至2019年10月之間在南京醫科大學附屬腦科醫院睡眠醫學中心采集的PSG數據和多導睡眠監測報告。所使用的PSG設備包括64個導聯,分別用于測量被試者睡眠期間的腦電圖、心電圖、腿部肌電圖以及胸式呼吸張力圖等多種生理電信號。PSG的記錄時間固定(21時到次日7時),多導睡眠檢測報告記錄了被試者的PSG記錄時間、入睡時間以及睡眠情況。
受實驗設備以及實驗數據影響,本文所使用的腦電數據來自于被試者的PSG記錄,且帶有醫生對被試者PSG的診斷結果。PSG設備的腦電電極使用AgCl電極片,按國際10-20系統固定在頭皮上,參考電極為同側乳突電極。采集過程中電極阻抗保持在5 kΩ以下,連續腦電數據以256 Hz的采樣頻率記錄。本文使用6導聯腦電進行實驗,包括F3、F4、C3、C4、O1和O2導聯,圖2展示了所使用導聯的頭部位置分布。數據集包含60例被試者的腦電數據,其中男性44例,女性16例,年齡為(63.38 ± 11.02)歲;PD-RBD被試者30例,腦電記錄時間為(634.35 ± 28.30)min,PD+RBD被試者30例,腦電記錄時間為(645.17 ± 42.35)min;且所選被試者從入睡到覺醒的時間都在360 min以上。

1.2 數據預處理
1.2.1 數據準備
數據源存在多種變量,如每位被試者的入睡時間、睡眠時間和腦電記錄時間都不相同。為保證研究數據的平衡,需要為每位被試者截取相同長度的睡眠腦電信號。本文根據被試者多導睡眠檢測報告中的睡眠信息,截取每例被試者從入睡到覺醒期間的360 min腦電信號。
1.2.2 頻域濾波
為了提取感興趣的腦電信號波段,本文使用帶寬為0.3~90 Hz的四階巴特沃斯雙向帶通濾波器對原始腦電信號進行濾波處理,保留δ~γ3波段的腦電信號。由于腦電信號采集裝置工頻干噪聲在50 Hz左右,為了抑制工頻噪聲對實驗結果的影響,本文對腦電信號進行50 Hz的陷波處理。
1.2.3 時間窗提取
為了降低實驗計算復雜度,提高運算效率和算法魯棒性,并為時頻特征提取提供相同時間長度的基本數據單元,本文對腦電信號進行時間窗提取。時間窗長度和相鄰窗的數據重疊率是時間窗的兩個重要參數。當時間窗長度為270 s時,計算的腦電時頻譜圖(時頻特征)滿足深度網絡對輸入圖像的像素長寬比為1的要求。由于腦電信號具有非線性和非平穩性,當時間窗長度足夠長且相鄰窗無數據重疊率時,可認為每個時間窗數據之間相互獨立。因此,本文使用長度為270 s且無重疊的時間窗提取被試者的腦電信號,故每例被試者的腦電信號被分割成80個時間窗,且每個時間窗數據之間相互獨立。
1.3 時頻深度網絡
本文通過構建時頻深度網絡,對時間窗腦電進行時頻特征提取和深度網絡分類,從而實現PD ? RBD和PD + RBD的腦電信號分類。
1.3.1 時頻特征提取
本文采用短時傅里葉變換(short time Fourier transform,STFT)將時間窗腦電數據轉換成時頻譜圖,并以此作為深度網絡的分類特征。腦電信號具有非線性和非平穩性,STFT通過加窗處理,實現腦電的短時平穩化。每例被試的腦電信號經過預處理被分割成80個時間窗,每個時間窗包含6個導聯的腦電數據,每個導聯的腦電時長為270 s,頻段為0.3~90 Hz。給定一個時間窗數據,其中,i表示時間窗編號(
),n表示導聯編號(
),模型中的STFT使用時間長度為1 s且數據重疊率為50%的漢寧窗,以頻率分辨率為1計算時間窗內單導聯腦電的時頻譜圖,計算過程如下:
![]() |
式中,w(t)是漢寧窗,隨著τ的移動,對漢寧窗內的腦電信號使用傅里葉變換。
每個時間窗數據經過STFT得到6個導聯的時頻譜圖 ,再將
按照導聯順序F3、F4、C3、C4、O1和O2拼成單位時間窗的時頻譜圖
,由此每例被試的腦電數據將生成80幅時頻譜圖。
1.3.2 深度網絡模型
卷積神經網絡是深度學習的代表算法,其主要功能在于深層架構可以從高度抽象的數據中提取有區分度的特征。二維(two-dimensional,2D)網絡被用于圖像和音頻時頻譜圖的處理[31]。VGGNet是一種經典的CNN架構,在圖像分類任務中表現出良好的性能[32]。本文基于VGGNet搭建時頻深度網絡,并對其進行優化。深度網絡主體由13個卷積層和3個完全連接層組成的深度網絡,每個卷積塊包含兩個或三個卷積層,在卷積塊后接入ReLU激活函數,再建立池化層。深度網絡模型示意圖見圖3,網絡模型輸入圖像尺寸為224 × 224,通道數為3;卷積層采用3 × 3的卷積核,步長為1,填充為1;池化層采用2 × 2的最大池化,步長為2;輸出使用SoftMax函數輸出分類標簽。

過擬合是深度神經網絡普遍存在的問題,根本原因是訓練數據量不足以支撐復雜度高的模型,導致訓練次數過多,模型過分關注圖像的局部特征。在訓練數據量固定的情況下,本文使用三種方法優化深度網絡模型,分別為批量標準化、Dropout方法和L2正則化[33-35]。這三種方法的應用不僅可提高模型對過擬合的抑制能力,還可提升模型的運算效率和模型魯棒性。
1.4 后處理
時頻深度網絡的輸出是基于時間窗的分類結果,本文通過后處理,對每例被試者全部時間窗的分類結果進行綜合決策,實現基于被試者的PD + RBD和PD-RBD的分類。
后處理以被試者為對象,統計該被試者的全部時間窗的分類結果。設置閾值0.5,當模型判定為1的樣本數與該被試者總樣本數的比值大于設定閾值,判斷該被試者屬于1類,否則屬于0類,即被試對象的診斷結果由該被試對象的大多數時間窗樣本的分類結果決定。后處理的決策過程為
![]() |
式中,Yj表示被試者j的分類結果,Nj為被試者j的時間窗總數,和
分別表示被試者j預測為0和1的時間窗數。
1.5 對比分析的分類算法
本文使用了五種基準分類算法及其標準實現,并將其性能與本文所提出的時頻深度網絡進行比較。以下基準算法的相關參數均為網絡搜索技術確定的最優參數。
1.5.1 多層感知機
多層感知機(multilayer perceptron,MLP)是一種前饋人工神經網絡,比單層感知機學習能力更強,且能實現非線性分類問題。MLP由輸入層、輸出層和隱藏層三部分組成,層與層之間完全連接,并引入激活函數完成數據傳遞,其工作原理為將輸入的多個數據映射到單一的輸出上。本研究使用含15個隱藏層的MLP,每層間接入ReLU激活函數,正則化系數為0.2。訓練網絡時采用L-BFGS優化器和平方損失函數,學習速率為1 × 10?3。
1.5.2 支持向量機
支持向量機(support vector machine,SVM)的工作原理為應用徑向基核函數將原樣本空間映射到高維特征空間,在特征空間內尋求最大分割超平面,通過對樣本特征空間的分割,實現對輸入樣本的分類。SVM分類算法有兩個主要的參數,徑向基函數參數γ和最優化問題的懲罰參數C,本研究中γ和C分別取0.005和100。
1.5.3 最鄰近算法
最鄰近算法(k nearest neighbor,KNN)在分類決策上依據特征空間中最鄰近的訓練樣本的類別決定待分類樣本所屬的類別。實驗中使用曼哈頓距離決定待分類樣本的k個最近鄰樣本,待分類樣本的預測類別為鄰近樣本的大多數的類別標簽。本研究中KNN的鄰近樣本數k的取值為12。
1.5.4 隨機森林
隨機森林(random forest,RF)是一種基于Bagging方法的集成學習算法,包含多個互相不關聯的決策樹分類器。隨機森林通過統計每個決策樹的預測結果,選擇投票最多的結果作為樣本的最終分類結果。本研究中的RF集成100個決策樹分類器。
1.5.5 極限梯度提升
極限梯度提升(extreme gradient boosting,XGB)是一種基于Boost方法的集成學習算法,使用分類回歸樹作為基分類器[36]。XGB分類思想是使用貪婪算法不斷地添加樹,擬合模型上次的預測殘差。根據測試樣本的特征,每棵樹會對應一個葉子節點,最后所有樹對應葉子節點的分數加和就是該樣本的分類結果。本研究XGB集成500個最大深度為10的樹,學習速率為1 × 10?2。
1.5.6 遞歸神經網絡
本文重新構建了Ruffini等[37]處理特發性RBD患者的預診斷問題時提出的深層遞歸神經網絡(recurrent neural network,RNN)模型,該模型由3個長短期記憶(long short-term memory,LSTM)細胞構成,每個細胞的隱藏層單元數為32,并使用Dropout方法調整LSTM細胞,最后通過全連接層和SoftMax函數輸出分類結果。在訓練Ruffini模型是使用RMSprop優化器和交叉熵代價函數,學習速率設置為1 × 10?4。
1.6 模型評價標準
為了評估模型的分類性能,以及評價輔助診斷結果的可信度,本文引入準確率(accuracy,Acc)、敏感度(sensitivity,Sen)、特異性(specificity,Spc)和被試者工作特征曲線(receiver operating characteristic curve,ROC)四個評價指標。其中,準確率、敏感度和特異性的計算過程如下:
![]() |
![]() |
![]() |
式中真正類(true positive,TP)表示正樣本被正確預測為正樣本的數量;假負類(false negative,FN)表示正樣本被錯誤預測為負樣本的數量;真負類(false negative,TN)表示負樣本被正確預測為負樣本的數量;假正類(false positive,FP)表示負樣本被錯誤預測為正樣本的數量。ROC的y軸為真正率(true positive rate,TPR),x軸為假正率(false positive rate,FPR),根據分類模型輸出的樣本概率由高到低設置多個閾值,樣本概率大于閾值判定正類,反之判定為負類,根據不同閾值的FPR和TPR繪制ROC曲線。ROC曲線下面積(area under curve,AUC)越大,表示分類器性能越好。
1.7 實驗環境與數據集分配
本文實驗環境為windows10專業版64位操作系統,i9-10900X處理器,CPU主頻為3.70 GHz,已安裝內存64 GB,顯卡型號為RTX6000。仿真軟件為JetBrains PyCharm 2019.2,編譯環境為python3.7。
實驗數據集包含60例患者數據,分別為PD-RBD和PD+RBD數據各30例,實驗把數據集分成訓練集、驗證集和測試集三部分,其中訓練集和驗證集共有30例患者數據(15例PD-RBD,15例PD + RBD,樣本時間窗2 400個),并采用3折交叉驗證分割訓練集和驗證集;測試集共有患者數據30例(15例PD-RBD,15例PD + RBD,樣本時間窗2 400個)。最終,訓練集、驗證集和測試集的被試者比例為2∶1∶3。
2 結果
本文使用PD伴和不伴RBD患者的臨床數據進行以下實驗:① 基于時間窗的分類實驗,與其他分類器進行對比,驗證本文所提方法的分類性能優勢;② 基于被試者的分類實驗,與RBDSQ方法進行對比,測試本文方法的臨床應用價值。
2.1 基于時間窗的分類
2.1.1 本文方法結果
實驗以訓練集和驗證集中PD-RBD 和PD + RBD兩類被試者的時間窗腦電數據為樣本,訓練時頻深度網絡并驗證模型的分類能力。本文使用TensorFlow機器學習庫訓練時頻深度網絡,為了得到可靠穩定的網絡模型,實驗采用三折交叉驗證分割訓練集和驗證集,并選擇Adam優化器和交叉熵代價函數,學習速率為1 × 10?5。時頻深度網絡在兩類時間窗腦電數據的分類任務中表現良好,分類的準確率、敏感度和特異性分別為0.902 4 ± 0.009 5、0.887 1 ± 0.015 7和0.918 8 ± 0.014 1,ROC曲線下面積為0.96。
2.1.2 對比分析結果
為了評估本文所提方法對時頻特征的挖掘能力和分類效果,本文將MLP、SVM、KNN、XGB和RF方法應用于時頻譜圖的分類,并對這些基準分類模型進行了驗證和對比分析。為了使基準分類算法的分類性能達到最優化,實驗使用網格搜索技術確定最優參數。同時,本文將Ruffini模型應用于本文數據集,使其實現對PD + RBD和PD-RBD腦電時間窗數據的時頻譜圖的分類。對比實驗使用與本文方法相同的2 400個樣本時間窗,并結合3折交叉驗證得到分類結果。
各分類模型在驗證集上的分類準確率、敏感度、特異性和AUC如表1所示。從各項評價指標看出分類算法對分類結果的影響非常明顯,本文方法得到了最高的準確率、敏感度和特異性。圖4為不同分類模型的ROC曲線,結果顯示本文方法得到了最大的AUC,為0.96。


2.2 基于被試者的分類
2.2.1 本文方法結果
該部分實驗使用沒有參與訓練的測試集,更能驗證時頻深度網絡的泛化能力。實驗通過對每例被試者時間窗數據的分類結果進行后處理,實現基于被試者的輔助診斷。
測試集共有30例被試者的腦電數據,其中PD-RBD和PD + RBD各15例。圖5為基于被試者的時間窗樣本的分類結果柱狀統計圖,圖中橫坐標表示被試對象的真實標簽-編號,縱坐標表示每例被試對象時間窗樣本的分類結果,紅色數字為錯誤診斷的被試對象的標簽-編號和具體分類結果。本文方法在測試集以被試者為樣本的分類準確率、敏感度和特異性分別為0.933 3、0.866 7和1.000 0。

2.2.2 RBDSQ的對比結果
PSG是RBD輔助診斷的金標準,本文所有實驗結果都是基于被試者的PSG輔助診斷結果得到。除PSG檢查外,RBDSQ是臨床對RBD患者診斷的重要工具。本節將本文提出輔助診斷方法與RBDSQ進行比較,表2為兩種方法基于被試者的輔助診斷結果。在帕金森病中,RBDSQ的最佳臨界值為6分[38],對測試集被試者的RBDSQ診斷準確率、敏感度和特異性分別為0.866 7、0.933 3和0.800 0;而本文方法的診斷準確率和特異性有所提升,表現出了更好的診斷效果。

3 討論
3.1 腦電的時頻譜圖分析
本文使用腦電信號的時頻分析方法,通過訓練時頻深度網絡模型,完成基于被試者的PD伴RBD輔助診斷。特征提取可增加分析任務的有效性,從而提高模型精度,減少計算復雜度[39]。腦電是非平穩信號,使用STFT計算腦電的時頻特征,既解決了非平穩性的分析困難,又保留了腦電信號的動態特性。
腦電時頻譜圖可視化了一些腦電圖無法視覺表達的信息,與其他特征相比,卷積神經網絡更擅長挖掘腦電信號的時頻譜圖[31]。圖6是PD-RBD和PD + RBD被試者的腦電圖和腦電時頻譜圖示例。單導聯腦電的時頻譜圖中50 Hz處存在的暗條紋,是因為抑制工頻噪聲時在50 Hz做了陷波處理;圖像底部δ波段有明顯的亮條紋,是因為睡眠腦電信號低頻波段加強,高頻波段減少甚至消失,使得δ波段在睡眠腦電時頻譜圖中最為明顯[40];兩類時頻譜圖不同點在于PD+RBD腦電信號的高頻段比PD-RBD腦電信號的高頻段更活躍,出現階段性加強,這是由于RBD患者的睡眠穩定性低,睡眠時運動皮層顯著活躍,或與患者的夢境相關行為有關。

3.2 深度網絡的性能分析
本文使用批量標準化、Dropout方法和L2正則化三種方法優化時頻深度網絡。批量標準化作用在卷積層之后,對每批處理數據的卷積結果進行標準化,使訓練過程中的激活值穩定分布;Dropout方法作用在全連接層,訓練時讓神經元以固定概率失活,避免神經元的權值更新依賴固定節點;L2正則化通過在損失函數后添加正則項,通過對擬合函數的約束增加模型對數據的擬合程度。在實驗中發現,Dropout方法的保留神經元概率為0.6時,模型的分類性能最佳;批量標準化和L2正則化的使用對過擬合問題改善很大,使分類準確率從0.86增長到了0.90。
本文在探討分類算法對分類結果的影響時,使用未經過后處理的以時頻譜圖為樣本的分類結果,因為該結果是分類模型的直接輸出,比以被試者為樣本的結果更具有衡量分類效果的價值。本文使用準確率、敏感度、特異性和AUC四個評價指標評估各分類算法對腦電時頻譜圖的分類能力。從表1看出所有分類方法的特異性均高于敏感度,表示模型對負類的分類更為準確,這是因為PD伴RBD被試者的腦電信號帶有PD腦電信號的特征,在截取的時間窗內PD伴RBD時頻譜圖中的PD特征可能比RBD特征更為突出。本文提出時頻深度網絡模型的準確率和特異性均在0.90以上,且本文模型、Ruffini模型和SVM的AUC均超過了0.90,這表明腦電時頻譜圖對PD伴RBD的檢測是有效的。比較圖4中各分類算法的AUC,本文方法的AUC最優,且本文方法的準確率較Ruffini方法和SVM方法也得到了提升,由此看出,本文所提的時頻深度網絡模型對時間窗樣本的擬合度更高,分類性能更好。傳統分類器中,SVM面對復雜度高的非線性數據決策問題比KNN表現得更好,SVM比KNN的泛化能力更強;集成分類器中,XGB比RF的數據擬合能力更強,XGB是目前基于決策樹的集成算法中對真實分布擬合最好的分類算法。而深度學習是一種依賴數據驅動的方法,在大量標注數據的訓練下,表現出比傳統分類方法更好的分類能力。深層循環神經網絡被常用于時序序列的預測或分類;面對圖像分類任務,深層卷積神經網絡的特征挖掘能力和特征學習能力更強,這是時頻深度網絡在腦電時間窗樣本的分類中表現最好的原因。
另外,為了增加時頻深度網絡模型的可解釋性,本文使用梯度加權類激活圖(gradient-weighted class activation mapping,Grad-CAM)對模型進行可視化解釋[41]。CNN中的高層特征可以看作是底層特征的組合,經過卷積運算后提取空間信息[42]。Grad-CAM使用最后一個卷積層特征圖的梯度信息,生成一張目標類激活的區域定位的熱力圖,表示特征圖的每個位置對目標決策的重要程度,有助于了解輸入圖像的哪個部分得到的CNN模型做出最終的決策。圖7是PD+RBD腦電時頻譜圖的類激活圖的部分示例,特征激活熱力圖的重要區域與輸入圖像存在空間對應關系[42],通過熱力圖和原始圖像的疊加,獲得了特征激活區域在原始圖像的定位圖。目標類激活的區域主要位于導聯F4、O2和C4,導聯C3上也存在少量不規則狀激活。通過確定類激活圖的重要區域與PD + RBD腦電時頻譜圖的導聯空間位置的對應關系,發現導聯F4、O2和C4對PD + RBD的決策更為重要。因此,Grad-CAM在時頻深度網絡中將導聯選擇與特征可視化相結合,或有助于單導聯或更少導聯的方案設計。

3.3 本文方法的優勢分析
目前,RBD智能診斷研究大多以腦電、眼電、肌電等多種生理電信號共同作為工具源,并且依賴睡眠分期的結果[16,43]。睡眠分期的標注需要專家人工標注作為金標準,由于被試者的睡眠時間較長,人工標注睡眠階段的工作量大,且十分依賴專家經驗。然而,自動睡眠分期研究無法得到十分可靠的結果,分期準確率不夠理想[21,23],使用自動睡眠分期結果進行二次試驗誤差較大,可信度較差。針對PD伴RBD輔助診斷的智能方法研究相對較少,臨床對PD是否伴有RBD的輔助診斷仍然需要對被試者的PSG進行人工檢測。但PSG的采集過程繁瑣,全身的電極貼片和陌生的睡眠環境會干擾患者入睡,而且PSG作為一種新興的資源密集型設備,尚不能全面用于疑似PD伴RBD患者的檢測。本文提出的基于少導聯頭皮腦電和時頻深度網絡的PD伴RBD計算機輔助診斷方法,無需對被試者的腦電信號進行睡眠分期,無需提取REM期腦電數據,而是直接以被試者的整晚腦電作為研究對象,有效解決了數據采集困難和人工識別效率低等局限。
本文所有試驗均以被試者的PSG診斷結果作為金標準完成。表2為本文方法與臨床RBDSQ的比較結果。RBDSQ在本文測試集的PD伴RBD診斷準確率、敏感度和特異性分別為0.866 7、0.933 3和0.800 0。可見RBDSQ的特異性較低,而較高的敏感度降低了漏診率,這也是該方法獲得臨床應用的原因。然而,RBDSQ需要患者的積極配合,一旦患者存在抵觸心理,問卷便很難進行下去。本文方法在測試集基于被試者的分類準確率為0.933 3,特異性為1.000 0,相比RBDSQ診斷準確率有所提高,表現出更好的診斷效果。研究證明了本文所提出的基于少導聯腦電和時頻深度網絡方法應用于PD患者RBD診斷的有效性和可行性,具有一定的臨床價值。
4 結論
本文提出一種基于少導聯頭皮腦電和時頻深度網絡的PD伴RBD的輔助診斷方法。該方法通過對被試者整晚的睡眠腦電信號進行時間窗提取,以時間窗數據為樣本訓練時頻深度網絡,得到基于時間窗的分類結果;對每例被試者所有時間窗的分類結果進行綜合決策,實現基于被試者的PD伴RBD輔助診斷。本文設計的網絡模型在過擬合問題的抑制能力和系統的魯棒性上有所增強,并且相較其他傳統的分類方法,本文方法對腦電時頻譜圖的特征挖掘能力更強,分類效果更好。實驗結果表明,本文所提出的PD伴RBD輔助診斷方法可以對PD伴或不伴RBD的腦電進行準確的分類,基于腦電時間窗的分類平均準確率為0.902 4,基于被試者的分類綜合準確率為0.933 3。本文方法實現了基于少導聯頭皮腦電的PD伴RBD輔助診斷,同時也為相關神經疾病的腦電信號方法探索提供了研究方向。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
帕金森病(Parkinson’s disease,PD)是僅次于阿爾茨海默病的第二常見神經退行性疾病,其運動癥狀表現為靜止性震顫、運動遲緩、肌強直和姿勢平衡障礙等。睡眠障礙是PD常見的非運動癥狀之一,約三分之一的PD患者同時伴有快速眼動睡眠行為障礙(rapid eye movement sleep behavior disorder,RBD)[1]。臨床定義RBD為PD的亞型[2],其病癥為快速眼動(rapid eye movement,REM)睡眠期肌肉弛緩現象消失并伴有與夢境相關的復雜運動[3]。PD伴RBD患者相比原發性PD患者的帕金森病程持續時間更長,運動障礙及運動并發癥更重,睡眠質量更差,自主神經障礙更加突出[4-5],且臨床認為RBD是PD患者出現認知功能障礙的獨立因素[6]。研究表明RBD是PD患者神經退行性過程的突出標志,與PD的臨床惡性表型相關,故正確診斷PD伴RBD具有改善治療和預后的價值[7]。
目前,多導睡眠圖(polysomnography,PSG)是RBD診斷的金標準,臨床專家基于經驗觀察PSG數據,分析患者是否喪失正常REM睡眠期伴有的肌張力抑制[8-9],實現RBD的診斷。PSG是一種新興的資源密集型設備,只有少部分醫院擁有,不能全面用于疑似PD伴RBD患者的睡眠監測;另外,PSG包括腦電圖、眼電圖和肌電圖等十余種生理信號的幾十個采集電極,電極分布全身,易干擾患者的睡眠,且監測地點位于醫院,導致部分患者無法入睡。當缺少PSG或PSG不適用時,RBD篩查問卷(RBD screening questionnaire,RBDSQ)是臨床對RBD患者診斷的重要工具。RBDSQ對非PD患者的RBD診斷效果相對理想,但對PD伴RBD患者的診斷特異性較低,整體上不能適用于PD患者是否伴RBD的診斷[10]。由此可見,臨床現有PD伴RBD診斷方法具有局限性,迫切需要設備舒適度高、診斷準確率高的智能輔助診斷方法。
腦電通過放置在頭皮上的電極直接測量并記錄了大腦皮層和皮下神經元的放電情況,具有時間分辨率高、無損傷、無輻射和成本低等特點[11],被廣泛用于神經系統疾病和腦機接口研究[12-15]。在RBD診斷研究中,Koch等[16]提出采用主題建模方法對腦電信號進行睡眠分期,計算睡眠分期特征并使用k均值聚類算法實現PD或RBD的輔助診斷。該方法把PD和RBD視為一類,區別于正常對照組,且依賴被試者的睡眠分期情況。已有研究表明RBD患者的非REM期腦電有θ波活躍和β2波抑制現象,同時睡眠結構和睡眠穩定性也會發生改變[17]。因此,對RBD的診斷研究可以不局限于睡眠分期或REM期腦電提取。Bisgaard等[18]提取睡眠腦電信號的三種時域特征,使用離群點檢測算法實現RBD的輔助診斷。該方法肯定了睡眠腦電對區分RBD和正常對照組的作用,但分類準確率只有78%,并不理想。據調研,PD伴RBD的智能輔助診斷研究相對較少,PD患者中的RBD診斷也比正常人中的RBD診斷更具挑戰性[7]。以上RBD輔助診斷的研究均是先對腦電信號進行特征提取,再利用機器學習算法實現RBD患者和正常人的分類,同類方法有望用于PD伴RBD的研究。另外,對患者而言,腦電導聯數量會在一定程度上影響佩戴舒適度,在保證輔助診斷準確率的同時,應盡量減少研究中使用的導聯數量。因此,本文基于少導聯頭皮腦電開展不依賴睡眠分期的PD伴RBD輔助診斷方法研究。
腦電信號的特征提取和分類是PD伴RBD輔助診斷研究最重要的兩個階段。特征提取方法主要分為三類:時域、頻域和時頻域的方法[19]。時域特征和頻域特征局限于信號的區域特征,忽視了腦電信號的動態特性。時頻域特征提取了時域和頻域的聯合特征,增加了分類結果的可信度,是腦電信號分析的有效方法。分類方法包括傳統機器學習方法和深度學習方法,其中深度學習是數據分析的發展趨勢,在模式識別和計算機視覺領域領先于其他機器學習方法[20]。在睡眠腦電研究中,Wei等[21]和Jadhav等[22]使用腦電時頻特征和深度學習方法實現睡眠分期,比Fraiwan等[23]使用傳統分類算法的睡眠分期方法表現出更好的分期效果。上述研究體現了深度學習方法在分析睡眠腦電時頻特征的優勢。卷積神經網絡(convolutional neural networks,CNN)是深度學習的代表算法之一[24],會自動學習從原始圖像獲取的高層次和高抽象特征,在醫學圖像的識別和分割方面非常有效[20,25-26]。結合腦電時頻譜圖和CNN的方法在癲癇預警、睡意檢測和準腦死亡診斷等研究中得到良好的應用[27-30]。因此,本文在處理相同的腦電時頻特征時,基于CNN構建時頻深度網絡,實現基于少導聯腦電的PD伴或不伴RBD的分類。
本文提出一種基于少導聯頭皮腦電和時頻深度網絡的PD伴RBD的智能輔助診斷方法。該方法通過對被試者整晚的睡眠腦電信號進行時間窗提取,并以時間窗腦電數據為樣本訓練時頻深度網絡,以期實現基于被試者的PD伴RBD輔助診斷。
1 方法
本文提出一種基于少導聯頭皮腦電和時頻深度網絡的PD伴RBD的智能輔助診斷方法。該方法將PD伴RBD的輔助診斷問題轉化成PD伴RBD(PD with RBD,PD + RBD)和PD不伴RBD(PD without RBD,PD-RBD)的分類問題,定義PD + RBD腦電信號為正類,標記為1;定義PD-RBD腦電信號為負類,標記為0。該方法的架構圖如圖1所示,共分為四個步驟:① 數據采集;② 數據預處理;③ 訓練過程;④ 測試過程。

1.1 數據采集
臨床診斷RBD的金標準是對PSG數據的綜合分析[8-9],本文數據源是由南京醫科大學附屬腦科醫院老年醫學中心提供的PSG數據。本項研究得到了南京醫科大學附屬腦科醫院的批準,并獲得了所有參與者的知情同意。原始數據集為2018年1月至2019年10月之間在南京醫科大學附屬腦科醫院睡眠醫學中心采集的PSG數據和多導睡眠監測報告。所使用的PSG設備包括64個導聯,分別用于測量被試者睡眠期間的腦電圖、心電圖、腿部肌電圖以及胸式呼吸張力圖等多種生理電信號。PSG的記錄時間固定(21時到次日7時),多導睡眠檢測報告記錄了被試者的PSG記錄時間、入睡時間以及睡眠情況。
受實驗設備以及實驗數據影響,本文所使用的腦電數據來自于被試者的PSG記錄,且帶有醫生對被試者PSG的診斷結果。PSG設備的腦電電極使用AgCl電極片,按國際10-20系統固定在頭皮上,參考電極為同側乳突電極。采集過程中電極阻抗保持在5 kΩ以下,連續腦電數據以256 Hz的采樣頻率記錄。本文使用6導聯腦電進行實驗,包括F3、F4、C3、C4、O1和O2導聯,圖2展示了所使用導聯的頭部位置分布。數據集包含60例被試者的腦電數據,其中男性44例,女性16例,年齡為(63.38 ± 11.02)歲;PD-RBD被試者30例,腦電記錄時間為(634.35 ± 28.30)min,PD+RBD被試者30例,腦電記錄時間為(645.17 ± 42.35)min;且所選被試者從入睡到覺醒的時間都在360 min以上。

1.2 數據預處理
1.2.1 數據準備
數據源存在多種變量,如每位被試者的入睡時間、睡眠時間和腦電記錄時間都不相同。為保證研究數據的平衡,需要為每位被試者截取相同長度的睡眠腦電信號。本文根據被試者多導睡眠檢測報告中的睡眠信息,截取每例被試者從入睡到覺醒期間的360 min腦電信號。
1.2.2 頻域濾波
為了提取感興趣的腦電信號波段,本文使用帶寬為0.3~90 Hz的四階巴特沃斯雙向帶通濾波器對原始腦電信號進行濾波處理,保留δ~γ3波段的腦電信號。由于腦電信號采集裝置工頻干噪聲在50 Hz左右,為了抑制工頻噪聲對實驗結果的影響,本文對腦電信號進行50 Hz的陷波處理。
1.2.3 時間窗提取
為了降低實驗計算復雜度,提高運算效率和算法魯棒性,并為時頻特征提取提供相同時間長度的基本數據單元,本文對腦電信號進行時間窗提取。時間窗長度和相鄰窗的數據重疊率是時間窗的兩個重要參數。當時間窗長度為270 s時,計算的腦電時頻譜圖(時頻特征)滿足深度網絡對輸入圖像的像素長寬比為1的要求。由于腦電信號具有非線性和非平穩性,當時間窗長度足夠長且相鄰窗無數據重疊率時,可認為每個時間窗數據之間相互獨立。因此,本文使用長度為270 s且無重疊的時間窗提取被試者的腦電信號,故每例被試者的腦電信號被分割成80個時間窗,且每個時間窗數據之間相互獨立。
1.3 時頻深度網絡
本文通過構建時頻深度網絡,對時間窗腦電進行時頻特征提取和深度網絡分類,從而實現PD ? RBD和PD + RBD的腦電信號分類。
1.3.1 時頻特征提取
本文采用短時傅里葉變換(short time Fourier transform,STFT)將時間窗腦電數據轉換成時頻譜圖,并以此作為深度網絡的分類特征。腦電信號具有非線性和非平穩性,STFT通過加窗處理,實現腦電的短時平穩化。每例被試的腦電信號經過預處理被分割成80個時間窗,每個時間窗包含6個導聯的腦電數據,每個導聯的腦電時長為270 s,頻段為0.3~90 Hz。給定一個時間窗數據,其中,i表示時間窗編號(
),n表示導聯編號(
),模型中的STFT使用時間長度為1 s且數據重疊率為50%的漢寧窗,以頻率分辨率為1計算時間窗內單導聯腦電的時頻譜圖,計算過程如下:
![]() |
式中,w(t)是漢寧窗,隨著τ的移動,對漢寧窗內的腦電信號使用傅里葉變換。
每個時間窗數據經過STFT得到6個導聯的時頻譜圖 ,再將
按照導聯順序F3、F4、C3、C4、O1和O2拼成單位時間窗的時頻譜圖
,由此每例被試的腦電數據將生成80幅時頻譜圖。
1.3.2 深度網絡模型
卷積神經網絡是深度學習的代表算法,其主要功能在于深層架構可以從高度抽象的數據中提取有區分度的特征。二維(two-dimensional,2D)網絡被用于圖像和音頻時頻譜圖的處理[31]。VGGNet是一種經典的CNN架構,在圖像分類任務中表現出良好的性能[32]。本文基于VGGNet搭建時頻深度網絡,并對其進行優化。深度網絡主體由13個卷積層和3個完全連接層組成的深度網絡,每個卷積塊包含兩個或三個卷積層,在卷積塊后接入ReLU激活函數,再建立池化層。深度網絡模型示意圖見圖3,網絡模型輸入圖像尺寸為224 × 224,通道數為3;卷積層采用3 × 3的卷積核,步長為1,填充為1;池化層采用2 × 2的最大池化,步長為2;輸出使用SoftMax函數輸出分類標簽。

過擬合是深度神經網絡普遍存在的問題,根本原因是訓練數據量不足以支撐復雜度高的模型,導致訓練次數過多,模型過分關注圖像的局部特征。在訓練數據量固定的情況下,本文使用三種方法優化深度網絡模型,分別為批量標準化、Dropout方法和L2正則化[33-35]。這三種方法的應用不僅可提高模型對過擬合的抑制能力,還可提升模型的運算效率和模型魯棒性。
1.4 后處理
時頻深度網絡的輸出是基于時間窗的分類結果,本文通過后處理,對每例被試者全部時間窗的分類結果進行綜合決策,實現基于被試者的PD + RBD和PD-RBD的分類。
后處理以被試者為對象,統計該被試者的全部時間窗的分類結果。設置閾值0.5,當模型判定為1的樣本數與該被試者總樣本數的比值大于設定閾值,判斷該被試者屬于1類,否則屬于0類,即被試對象的診斷結果由該被試對象的大多數時間窗樣本的分類結果決定。后處理的決策過程為
![]() |
式中,Yj表示被試者j的分類結果,Nj為被試者j的時間窗總數,和
分別表示被試者j預測為0和1的時間窗數。
1.5 對比分析的分類算法
本文使用了五種基準分類算法及其標準實現,并將其性能與本文所提出的時頻深度網絡進行比較。以下基準算法的相關參數均為網絡搜索技術確定的最優參數。
1.5.1 多層感知機
多層感知機(multilayer perceptron,MLP)是一種前饋人工神經網絡,比單層感知機學習能力更強,且能實現非線性分類問題。MLP由輸入層、輸出層和隱藏層三部分組成,層與層之間完全連接,并引入激活函數完成數據傳遞,其工作原理為將輸入的多個數據映射到單一的輸出上。本研究使用含15個隱藏層的MLP,每層間接入ReLU激活函數,正則化系數為0.2。訓練網絡時采用L-BFGS優化器和平方損失函數,學習速率為1 × 10?3。
1.5.2 支持向量機
支持向量機(support vector machine,SVM)的工作原理為應用徑向基核函數將原樣本空間映射到高維特征空間,在特征空間內尋求最大分割超平面,通過對樣本特征空間的分割,實現對輸入樣本的分類。SVM分類算法有兩個主要的參數,徑向基函數參數γ和最優化問題的懲罰參數C,本研究中γ和C分別取0.005和100。
1.5.3 最鄰近算法
最鄰近算法(k nearest neighbor,KNN)在分類決策上依據特征空間中最鄰近的訓練樣本的類別決定待分類樣本所屬的類別。實驗中使用曼哈頓距離決定待分類樣本的k個最近鄰樣本,待分類樣本的預測類別為鄰近樣本的大多數的類別標簽。本研究中KNN的鄰近樣本數k的取值為12。
1.5.4 隨機森林
隨機森林(random forest,RF)是一種基于Bagging方法的集成學習算法,包含多個互相不關聯的決策樹分類器。隨機森林通過統計每個決策樹的預測結果,選擇投票最多的結果作為樣本的最終分類結果。本研究中的RF集成100個決策樹分類器。
1.5.5 極限梯度提升
極限梯度提升(extreme gradient boosting,XGB)是一種基于Boost方法的集成學習算法,使用分類回歸樹作為基分類器[36]。XGB分類思想是使用貪婪算法不斷地添加樹,擬合模型上次的預測殘差。根據測試樣本的特征,每棵樹會對應一個葉子節點,最后所有樹對應葉子節點的分數加和就是該樣本的分類結果。本研究XGB集成500個最大深度為10的樹,學習速率為1 × 10?2。
1.5.6 遞歸神經網絡
本文重新構建了Ruffini等[37]處理特發性RBD患者的預診斷問題時提出的深層遞歸神經網絡(recurrent neural network,RNN)模型,該模型由3個長短期記憶(long short-term memory,LSTM)細胞構成,每個細胞的隱藏層單元數為32,并使用Dropout方法調整LSTM細胞,最后通過全連接層和SoftMax函數輸出分類結果。在訓練Ruffini模型是使用RMSprop優化器和交叉熵代價函數,學習速率設置為1 × 10?4。
1.6 模型評價標準
為了評估模型的分類性能,以及評價輔助診斷結果的可信度,本文引入準確率(accuracy,Acc)、敏感度(sensitivity,Sen)、特異性(specificity,Spc)和被試者工作特征曲線(receiver operating characteristic curve,ROC)四個評價指標。其中,準確率、敏感度和特異性的計算過程如下:
![]() |
![]() |
![]() |
式中真正類(true positive,TP)表示正樣本被正確預測為正樣本的數量;假負類(false negative,FN)表示正樣本被錯誤預測為負樣本的數量;真負類(false negative,TN)表示負樣本被正確預測為負樣本的數量;假正類(false positive,FP)表示負樣本被錯誤預測為正樣本的數量。ROC的y軸為真正率(true positive rate,TPR),x軸為假正率(false positive rate,FPR),根據分類模型輸出的樣本概率由高到低設置多個閾值,樣本概率大于閾值判定正類,反之判定為負類,根據不同閾值的FPR和TPR繪制ROC曲線。ROC曲線下面積(area under curve,AUC)越大,表示分類器性能越好。
1.7 實驗環境與數據集分配
本文實驗環境為windows10專業版64位操作系統,i9-10900X處理器,CPU主頻為3.70 GHz,已安裝內存64 GB,顯卡型號為RTX6000。仿真軟件為JetBrains PyCharm 2019.2,編譯環境為python3.7。
實驗數據集包含60例患者數據,分別為PD-RBD和PD+RBD數據各30例,實驗把數據集分成訓練集、驗證集和測試集三部分,其中訓練集和驗證集共有30例患者數據(15例PD-RBD,15例PD + RBD,樣本時間窗2 400個),并采用3折交叉驗證分割訓練集和驗證集;測試集共有患者數據30例(15例PD-RBD,15例PD + RBD,樣本時間窗2 400個)。最終,訓練集、驗證集和測試集的被試者比例為2∶1∶3。
2 結果
本文使用PD伴和不伴RBD患者的臨床數據進行以下實驗:① 基于時間窗的分類實驗,與其他分類器進行對比,驗證本文所提方法的分類性能優勢;② 基于被試者的分類實驗,與RBDSQ方法進行對比,測試本文方法的臨床應用價值。
2.1 基于時間窗的分類
2.1.1 本文方法結果
實驗以訓練集和驗證集中PD-RBD 和PD + RBD兩類被試者的時間窗腦電數據為樣本,訓練時頻深度網絡并驗證模型的分類能力。本文使用TensorFlow機器學習庫訓練時頻深度網絡,為了得到可靠穩定的網絡模型,實驗采用三折交叉驗證分割訓練集和驗證集,并選擇Adam優化器和交叉熵代價函數,學習速率為1 × 10?5。時頻深度網絡在兩類時間窗腦電數據的分類任務中表現良好,分類的準確率、敏感度和特異性分別為0.902 4 ± 0.009 5、0.887 1 ± 0.015 7和0.918 8 ± 0.014 1,ROC曲線下面積為0.96。
2.1.2 對比分析結果
為了評估本文所提方法對時頻特征的挖掘能力和分類效果,本文將MLP、SVM、KNN、XGB和RF方法應用于時頻譜圖的分類,并對這些基準分類模型進行了驗證和對比分析。為了使基準分類算法的分類性能達到最優化,實驗使用網格搜索技術確定最優參數。同時,本文將Ruffini模型應用于本文數據集,使其實現對PD + RBD和PD-RBD腦電時間窗數據的時頻譜圖的分類。對比實驗使用與本文方法相同的2 400個樣本時間窗,并結合3折交叉驗證得到分類結果。
各分類模型在驗證集上的分類準確率、敏感度、特異性和AUC如表1所示。從各項評價指標看出分類算法對分類結果的影響非常明顯,本文方法得到了最高的準確率、敏感度和特異性。圖4為不同分類模型的ROC曲線,結果顯示本文方法得到了最大的AUC,為0.96。


2.2 基于被試者的分類
2.2.1 本文方法結果
該部分實驗使用沒有參與訓練的測試集,更能驗證時頻深度網絡的泛化能力。實驗通過對每例被試者時間窗數據的分類結果進行后處理,實現基于被試者的輔助診斷。
測試集共有30例被試者的腦電數據,其中PD-RBD和PD + RBD各15例。圖5為基于被試者的時間窗樣本的分類結果柱狀統計圖,圖中橫坐標表示被試對象的真實標簽-編號,縱坐標表示每例被試對象時間窗樣本的分類結果,紅色數字為錯誤診斷的被試對象的標簽-編號和具體分類結果。本文方法在測試集以被試者為樣本的分類準確率、敏感度和特異性分別為0.933 3、0.866 7和1.000 0。

2.2.2 RBDSQ的對比結果
PSG是RBD輔助診斷的金標準,本文所有實驗結果都是基于被試者的PSG輔助診斷結果得到。除PSG檢查外,RBDSQ是臨床對RBD患者診斷的重要工具。本節將本文提出輔助診斷方法與RBDSQ進行比較,表2為兩種方法基于被試者的輔助診斷結果。在帕金森病中,RBDSQ的最佳臨界值為6分[38],對測試集被試者的RBDSQ診斷準確率、敏感度和特異性分別為0.866 7、0.933 3和0.800 0;而本文方法的診斷準確率和特異性有所提升,表現出了更好的診斷效果。

3 討論
3.1 腦電的時頻譜圖分析
本文使用腦電信號的時頻分析方法,通過訓練時頻深度網絡模型,完成基于被試者的PD伴RBD輔助診斷。特征提取可增加分析任務的有效性,從而提高模型精度,減少計算復雜度[39]。腦電是非平穩信號,使用STFT計算腦電的時頻特征,既解決了非平穩性的分析困難,又保留了腦電信號的動態特性。
腦電時頻譜圖可視化了一些腦電圖無法視覺表達的信息,與其他特征相比,卷積神經網絡更擅長挖掘腦電信號的時頻譜圖[31]。圖6是PD-RBD和PD + RBD被試者的腦電圖和腦電時頻譜圖示例。單導聯腦電的時頻譜圖中50 Hz處存在的暗條紋,是因為抑制工頻噪聲時在50 Hz做了陷波處理;圖像底部δ波段有明顯的亮條紋,是因為睡眠腦電信號低頻波段加強,高頻波段減少甚至消失,使得δ波段在睡眠腦電時頻譜圖中最為明顯[40];兩類時頻譜圖不同點在于PD+RBD腦電信號的高頻段比PD-RBD腦電信號的高頻段更活躍,出現階段性加強,這是由于RBD患者的睡眠穩定性低,睡眠時運動皮層顯著活躍,或與患者的夢境相關行為有關。

3.2 深度網絡的性能分析
本文使用批量標準化、Dropout方法和L2正則化三種方法優化時頻深度網絡。批量標準化作用在卷積層之后,對每批處理數據的卷積結果進行標準化,使訓練過程中的激活值穩定分布;Dropout方法作用在全連接層,訓練時讓神經元以固定概率失活,避免神經元的權值更新依賴固定節點;L2正則化通過在損失函數后添加正則項,通過對擬合函數的約束增加模型對數據的擬合程度。在實驗中發現,Dropout方法的保留神經元概率為0.6時,模型的分類性能最佳;批量標準化和L2正則化的使用對過擬合問題改善很大,使分類準確率從0.86增長到了0.90。
本文在探討分類算法對分類結果的影響時,使用未經過后處理的以時頻譜圖為樣本的分類結果,因為該結果是分類模型的直接輸出,比以被試者為樣本的結果更具有衡量分類效果的價值。本文使用準確率、敏感度、特異性和AUC四個評價指標評估各分類算法對腦電時頻譜圖的分類能力。從表1看出所有分類方法的特異性均高于敏感度,表示模型對負類的分類更為準確,這是因為PD伴RBD被試者的腦電信號帶有PD腦電信號的特征,在截取的時間窗內PD伴RBD時頻譜圖中的PD特征可能比RBD特征更為突出。本文提出時頻深度網絡模型的準確率和特異性均在0.90以上,且本文模型、Ruffini模型和SVM的AUC均超過了0.90,這表明腦電時頻譜圖對PD伴RBD的檢測是有效的。比較圖4中各分類算法的AUC,本文方法的AUC最優,且本文方法的準確率較Ruffini方法和SVM方法也得到了提升,由此看出,本文所提的時頻深度網絡模型對時間窗樣本的擬合度更高,分類性能更好。傳統分類器中,SVM面對復雜度高的非線性數據決策問題比KNN表現得更好,SVM比KNN的泛化能力更強;集成分類器中,XGB比RF的數據擬合能力更強,XGB是目前基于決策樹的集成算法中對真實分布擬合最好的分類算法。而深度學習是一種依賴數據驅動的方法,在大量標注數據的訓練下,表現出比傳統分類方法更好的分類能力。深層循環神經網絡被常用于時序序列的預測或分類;面對圖像分類任務,深層卷積神經網絡的特征挖掘能力和特征學習能力更強,這是時頻深度網絡在腦電時間窗樣本的分類中表現最好的原因。
另外,為了增加時頻深度網絡模型的可解釋性,本文使用梯度加權類激活圖(gradient-weighted class activation mapping,Grad-CAM)對模型進行可視化解釋[41]。CNN中的高層特征可以看作是底層特征的組合,經過卷積運算后提取空間信息[42]。Grad-CAM使用最后一個卷積層特征圖的梯度信息,生成一張目標類激活的區域定位的熱力圖,表示特征圖的每個位置對目標決策的重要程度,有助于了解輸入圖像的哪個部分得到的CNN模型做出最終的決策。圖7是PD+RBD腦電時頻譜圖的類激活圖的部分示例,特征激活熱力圖的重要區域與輸入圖像存在空間對應關系[42],通過熱力圖和原始圖像的疊加,獲得了特征激活區域在原始圖像的定位圖。目標類激活的區域主要位于導聯F4、O2和C4,導聯C3上也存在少量不規則狀激活。通過確定類激活圖的重要區域與PD + RBD腦電時頻譜圖的導聯空間位置的對應關系,發現導聯F4、O2和C4對PD + RBD的決策更為重要。因此,Grad-CAM在時頻深度網絡中將導聯選擇與特征可視化相結合,或有助于單導聯或更少導聯的方案設計。

3.3 本文方法的優勢分析
目前,RBD智能診斷研究大多以腦電、眼電、肌電等多種生理電信號共同作為工具源,并且依賴睡眠分期的結果[16,43]。睡眠分期的標注需要專家人工標注作為金標準,由于被試者的睡眠時間較長,人工標注睡眠階段的工作量大,且十分依賴專家經驗。然而,自動睡眠分期研究無法得到十分可靠的結果,分期準確率不夠理想[21,23],使用自動睡眠分期結果進行二次試驗誤差較大,可信度較差。針對PD伴RBD輔助診斷的智能方法研究相對較少,臨床對PD是否伴有RBD的輔助診斷仍然需要對被試者的PSG進行人工檢測。但PSG的采集過程繁瑣,全身的電極貼片和陌生的睡眠環境會干擾患者入睡,而且PSG作為一種新興的資源密集型設備,尚不能全面用于疑似PD伴RBD患者的檢測。本文提出的基于少導聯頭皮腦電和時頻深度網絡的PD伴RBD計算機輔助診斷方法,無需對被試者的腦電信號進行睡眠分期,無需提取REM期腦電數據,而是直接以被試者的整晚腦電作為研究對象,有效解決了數據采集困難和人工識別效率低等局限。
本文所有試驗均以被試者的PSG診斷結果作為金標準完成。表2為本文方法與臨床RBDSQ的比較結果。RBDSQ在本文測試集的PD伴RBD診斷準確率、敏感度和特異性分別為0.866 7、0.933 3和0.800 0。可見RBDSQ的特異性較低,而較高的敏感度降低了漏診率,這也是該方法獲得臨床應用的原因。然而,RBDSQ需要患者的積極配合,一旦患者存在抵觸心理,問卷便很難進行下去。本文方法在測試集基于被試者的分類準確率為0.933 3,特異性為1.000 0,相比RBDSQ診斷準確率有所提高,表現出更好的診斷效果。研究證明了本文所提出的基于少導聯腦電和時頻深度網絡方法應用于PD患者RBD診斷的有效性和可行性,具有一定的臨床價值。
4 結論
本文提出一種基于少導聯頭皮腦電和時頻深度網絡的PD伴RBD的輔助診斷方法。該方法通過對被試者整晚的睡眠腦電信號進行時間窗提取,以時間窗數據為樣本訓練時頻深度網絡,得到基于時間窗的分類結果;對每例被試者所有時間窗的分類結果進行綜合決策,實現基于被試者的PD伴RBD輔助診斷。本文設計的網絡模型在過擬合問題的抑制能力和系統的魯棒性上有所增強,并且相較其他傳統的分類方法,本文方法對腦電時頻譜圖的特征挖掘能力更強,分類效果更好。實驗結果表明,本文所提出的PD伴RBD輔助診斷方法可以對PD伴或不伴RBD的腦電進行準確的分類,基于腦電時間窗的分類平均準確率為0.902 4,基于被試者的分類綜合準確率為0.933 3。本文方法實現了基于少導聯頭皮腦電的PD伴RBD輔助診斷,同時也為相關神經疾病的腦電信號方法探索提供了研究方向。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。