提取分析孤獨癥譜系障礙(ASD)患者腦電(EEG)信號特征對疾病的診斷治療具有重要意義。本研究基于遞歸定量分析(RQA)方法探索 ASD 兒童和正常發育(TD)兒童 EEG 信號非線性特征差異。運用 RQA 方法提取受試者各腦區 EEG 信號遞歸率(RR)、確定性(DET)、平均對角線長度(LADL)非線性特征,并結合支持向量機對 ASD 兒童和 TD 兒童進行分類。研究結果表明,對于全腦區(包括:頂葉、額葉、枕葉、顳葉),當選取 RR、DET、LADL 三個特征組合時,得到 84% 的最大分類準確率,對應敏感性為 76%,特異性為 92%,曲線下面積(AUC)值為 0.875;對于頂額葉區(包括:頂葉、額葉),當 RR、DET、LADL 三個特征組合時,得到最大分類準確率為 82%,對應敏感性為 72%,特異性為 92%,AUC 值為 0.781。研究結果表明,RQA 方法提取 EEG 信號的 RR、DET、LADL 特征能成為區分 ASD 兒童和 TD 兒童的客觀指標,并結合機器學習方法能為 ASD 臨床診斷提供輔助評價指標,同時,ASD 兒童和 TD 兒童 EEG 信號的 RR、DET、LADL 特征差異在頂額葉區具有統計學意義,本研究根據腦區所承擔的功能來分析 ASD 兒童臨床特征,為今后的診斷和治療提供了參考。
引用本文: 趙杰, 張志明, 萬靈燕, 李小俚, 康健楠. 基于遞歸定量分析方法的孤獨癥兒童腦電信號特征提取與分類研究. 生物醫學工程學雜志, 2021, 38(4): 663-670. doi: 10.7507/1001-5515.202010082 復制
引言
孤獨癥譜系障礙(autism spectrum disorder,ASD)是一種由于神經系統失調導致的發育障礙疾病,其核心癥狀包括社會交往障礙、言語交流障礙、重復刻板行為等[1]。當前,全球范圍內 ASD 的發病率顯著升高,美國疾病控制與預防中心數據表明,美國所有出生于 2002 年的孩子 ASD 發病率約為 1/68[2]。迄今為止,ASD 發病確切原因還不清楚,可能與遺傳、環境等因素相關[3]。目前醫學上主要根據量表和行為觀察進行 ASD 診斷[4],但其主觀性較強,會產生一定的誤診率,因此,尋找客觀指標對 ASD 患者進行準確評估至關重要。
腦電圖(eletroencephalography,EEG)通過電極記錄大腦細胞群自發性、節律性電活動,因其時間分辨率較高且包含大量生理和病理等信息,所以,監測 EEG 信號逐漸成為研究腦部疾病和神經認知疾病的有力手段。由于 EEG 信號所固有的非線性特性,因此應用非線性分析方法分析 EEG 信號更合適。近年來非線性分析方法如相關維數、李雅普諾夫(Lyapunov)指數、復雜度、樣本熵等被廣泛應用于 EEG 信號的研究[5]:Cukic 等[6]將樣本熵方法應用于抑郁癥患者 EEG 信號復雜度分析;李世丹[7]對比分析了線性分析方法和非線性分析方法提取酗酒者和正常人 EEG 信號特征的分類效果,結果表明基于非線性分析方法提取的 EEG 信號特征分類準確性更高。
遞歸圖(recurrence plot,RP)由 Eckmann 等[8]于 1987 年提出,RP 可以對非線性時間序列信號的非線性特征和內在相似性特征進行定性分析,而遞歸定量分析(recurrence quantification analysis,RQA)方法用于對這些特征進行精確量化。近年來 RQA 方法已廣泛應用于 EEG 信號研究,Pitsik 等[9]通過 RQA 方法計算 EEG 信號復雜度來監測人體運動開始時刻;Timothy 等[10]基于 RQA 方法對輕度認知障礙患者和正常人的靜息態 EEG 信號進行分類,準確率達 72.2%。
ASD 屬于神經發育障礙疾病,其疾病特征在 EEG 信號中有所體現,大量研究表明,根據 EEG 信號對 ASD 患者進行評估和診斷具有可行性[11-13]。RP 和 RQA 方法結合 EEG 信號已經成為分析癲癇、抑郁癥等多種腦認知疾病的有力工具。目前本課題組尚未發現有研究將 RQA 方法結合 EEG 信號用以分析 ASD 的疾病特征。基于此,本研究在這一方面進行首次探索,用 RP 和 RQA 方法來提取 ASD 患者 EEG 信號特征,然后結合支持向量機(support vector machine,SVM)對特征進行分類。同時在組間水平上對比了 ASD 兒童和 TD 兒童不同腦區 EEG 信號特征的差異,并結合腦區功能來分析特征差異同 ASD 患者臨床特征之間的聯系,為今后 ASD 的診斷和治療提供相應參考。
1 材料和方法
1.1 材料
1.1.1 受試者
本研究共招募 50 名兒童參與 EEG 信號采集,包括:① 在北京安定醫院招募 ASD 兒童 25 名,其中男生 21 名,女生 4 名,符合 ASD 患者中男性患者人數是女性患者人數的 4~5 倍[14],年齡在 3~6 歲之間,平均年齡為(4.40 ± 0.95)歲。ASD 兒童評定方法為專業醫師根據《精神病診斷與統計手冊(第五版)》和《兒童孤獨癥評定量表》進行評定。② 招募北京當地幼兒園 25 名正常發育(typical development,TD)兒童,采集他們的 EEG 信號作為對照,其中男生 11 名,女生 14 名,年齡在 3~6 歲之間,平均年齡為(4.36 ± 0.64)歲。兩組兒童年齡的差異無統計學意義(t = 0.17,P = 0.86)。本研究經過北京師范大學倫理委員會批準,并得到倫理審查通知書,在完整描述試驗步驟之后,家長簽署書面知情同意書,所有兒童均自愿參加本次試驗。
1.1.2 EEG 信號采集
本研究用 8 通道 EEG 信號采集系統對 50 名兒童的靜息態 EEG 信號進行采集,其中采樣率為 1 000 Hz,Cz 電極為參考電極,采集過程中保持電極阻抗小于 50 k?。8 個電極記錄了四個腦區的 EEG 信號:C3、C4 電極記錄頂葉區的 EEG 信號;F3、F4 電極記錄額葉區的 EEG 信號;O1、O2 電極記錄枕葉區的 EEG 信號;T3、T4 電極記錄顳葉區的 EEG 信號。
1.1.3 數據預處理
使用數據分析軟件 Matlab 2018(MathWorks,美國)中的 EEGLAB 工具箱對采集的 EEG 信號進行預處理:首先將采集的 EEG 信號通過 0.5~40 Hz 的帶通濾波器,然后用自適應偽跡檢測算法去除工頻、眼電、心電、肌電、呼吸等偽跡,去除超過閾值的序列,最后將每位兒童每個通道的 EEG 信號進行數據截選,截選長度為 5 s 的 EEG 信號進行分析。
1.2 EEG 信號特征提取
1.2.1 相空間重構
EEG 信號本質上是一維非線性時間序列信號,通過相空間重構可以將一維非線性時間序列信號映射到高維相空間中,而 RP 又可以將高維相空間信號進行可視化,所以相空間重構是研究非線性時間序列信號遞歸特性的基礎。根據周佰成等[15]報道的 Takens 理論指出,嵌入定理可以為一維非線性時間序列信號重構一個與原動力系統在拓撲意義下一樣的相空間,非線性時間序列信號的分析和預測都是在這個重構的相空間中進行的。
假設 x(n)是長度為 N 的非線性時間序列信號,n = 1,2,,N。相空間重構得到一組 m 維向量 X(n),如式(1)所示:
![]() |
其中,m 是嵌入維度,τ 是延遲時間。m 和 τ 決定著相空間重構的質量,如果 τ 太小,則相空間中向量的兩個坐標分量在數值上非常接近,從而無法提供兩個獨立的坐標分量,但 τ 太大又會出現兩個坐標分量完全獨立的情況,失去研究意義;同樣地,如果 m 太小會出現高維狀態下不相鄰點在低維狀態下相鄰,即出現虛假近鄰點,選較大 m 在理論上可行,但會增加計算量。選取 m 和 τ 的很重要,本研究分別采用虛假最臨近法和互信息法確定 m 和 τ。
1.2.2 RP
RP 將高維相空間信號映射到二維空間以實現可視化,相空間重構后兩時刻的向量 X(i)與 X(j)之間的距離為 Ri,j,則 RP 的矩陣形式如式(2)所示:
![]() |
其中 ε 為距離閾值,||.||為歐式距離,θ[x]為海維賽德(Heaviside)函數,如式(3)所示:
![]() |
對于任意兩個向量 X(i)、X(j),如果它們之間的歐式距離小于距離閾值,則 Ri,j = 1,表示兩個向量發生了遞歸,在 RP 中用黑點表示,否則 Ri,j = 0,表示兩個向量沒有發生遞歸,在 RP 中用白點表示。
如圖 1 所示,繪制了 ASD 兒童和 TD 兒童 EEG 信號的 RP。由圖可知,相比于 TD 兒童,ASD 兒童 RP 中的遞歸點要更多,且有較多的黑塊,平行于對角線的黑色線段也更多。

1.2.3 RQA
RP 不能對 EEG 信號進行準確的定量分析,自從 Zbilut 等[16]提出 RQA 方法之后,涉及到的信號監測已從定性分析上升到了更加準確的定量分析,RQA 方法在分析心率信號、EEG 信號和肌電信號等人體生理信號中有廣泛應用。本研究基于 RQA 方法提取了 ASD 兒童和 TD 兒童 EEG 信號的遞歸率(recurrence rate,RR)、確定性(determinism,DET)和平均對角線長度(length of average diagonal line,LADL)特征。
RR:指 RP 中遞歸點的個數占圖中所有點個數的比值,其值隨信號序列復雜度降低而升高,計算公式如式(4)所示:
![]() |
其中,N為 RP 中橫坐標或縱坐標的點數。
DET:指 RP 中平行于主對角線的線段所包含的遞歸點個數占總遞歸點個數的比值,其值隨信號序列周期性增強(或者模式越單一)而升高,計算公式如式(5)所示:
![]() |
上式中,l 表示線段長度,lmin 表示最小線段長度,本研究選定 lmin = 2,P(l)表示長度為 l 且平行于主對角線的線段數。
LADL:即平行于主對角線的線段所包含遞歸點個數的加權平均值(主對角線并不計算在內),其值隨系統的確定程度增強而升高,計算公式如式(6)所示:
![]() |
本研究使用以上三個特征作為 SVM 的輸入數據進行分類。
1.3 SVM 分類
1.3.1 SVM
SVM 的分類原理是在特征空間中確定一個最優分類超平面,使得不同類別的樣本到該超平面的距離最大,以保證較高的分類精度[17]。本研究使用 SVM 留一交叉驗證法進行分類,即每次從樣本集中抽取一個樣本作為分類器測試集,剩余的樣本作為分類器訓練集,以此方式無交叉地進行總樣本個數次訓練和測試,然后對所有測試結果做平均,最終得到測試結果平均值。
RQA 方法提取 EEG 信號的 RR、DET、LADL 特征,將 ASD 兒童和 TD 兒童 EEG 信號的差異直觀反映在這些特征值上,將這三個特征值歸一化后組成特征向量輸入 SVM 分類器進行留一交叉驗證分類,具體流程如圖 2 所示。

1.3.2 評價指標
本研究將 ASD 兒童作為正類,TD 兒童作為負類,用準確率(accuracy,Acc)、敏感性(sensitivity,Se)、特異性(specificity,Sp)和曲線下面積(area under the the curve,AUC)值作為指標評價分類性能,同時也繪制了分類模型的受試者工作特征曲線(receiver operating characteristic curve,ROC)。Acc 表示被正確分類的樣本數占總樣本數的比值。ROC 曲線按照真陽性率(true positive rate,TPR)為縱軸,假陽性率(false positive rate,FPR)為橫軸進行繪制。其中,真陽性(true positive,TP)表示被正確分類為正類的個數;假陽性(false positive,FP)表示被錯誤分類為正類的個數;真陰性(true negative,TN)表示被正確分類為負類的個數;假陰性(false negative,FN)表示被錯誤分類為負類的個數。ROC 曲線結合了敏感性和特異性,敏感性也叫真正率、真陽性率,表示被正確分類為正樣本的個數占總正樣本個數的比值;特異性也叫真負率、真陰性率,表示被正確分類為負樣本的個數占總的負樣本個數的比值。AUC 值指 ROC 曲線下部面積,取值范圍是 0~1,AUC 值越接近 1 則分類器的分類性能越好。Acc、Se、Sp 的計算公式分別如式(7)~(9)所示。
![]() |
![]() |
![]() |
1.3.3 統計分析
使用統計分析軟件 SPSS 24(IBM,美國)分析 ASD 兒童和 TD 兒童不同腦區的 EEG 信號非線性特征差異是否具有統計學意義。本研究中 ASD 兒童和 TD 兒童的特征數據服從正態分布且相互獨立,即符合獨立樣本t檢驗的條件,因此使用 SPSS 24 軟件中的獨立樣本t檢驗進行分析,當P < 0.05 時認為差異具有統計學意義。
2 結果與討論
2.1 結果
如圖 1 所示,采用序列長度為 5 000 的 EEG 信號繪制 RP,可以看出,相較于 TD 兒童對應的 RP,ASD 兒童對應的 RP 中遞歸點更多,且黑塊和平行于對角線的黑色線段也更多。
進一步利用 RQA 方法量化 EEG 信號的特征,基于 RR、DET、LADL 特征值的箱型圖如圖 3 所示,橫軸表示均勻分布在全腦區(包括:頂葉、額葉、枕葉、顳葉)的 8 個通道,縱軸表示對應通道的 EEG 信號特征值。從圖 3 中可以看出 ASD 兒童的 RR、DET、LADL 特征值在各個通道總體要高于 TD 兒童,尤其在 C3、C4、F3、F4 通道上這種差異更加明顯,即 ASD 兒童 EEG 信號特征值在頂額葉區(包括:頂葉、額葉)明顯比 TD 兒童大,基于 RR、DET、LADL 特征值的柱狀圖如圖 4 所示,柱狀圖從平均值的角度顯示出這種差異。基于此,對特征值進行統計學分析。


ASD 兒童和 TD 兒童在四個腦區特征值差異的統計學分析結果如表 1 所示,在頂額葉區,除了額葉區 DET 特征差異無統計學意義外,其他五項特征差異均有統計學意義(P < 0.05);在顳葉和枕葉區,僅 RR 特征差異有統計學意義,其他兩項特征的差異均無統計學意義(P > 0.05)。

本研究通過 SVM 留一交叉驗證分類,第一個分類采用 ASD 兒童和 TD 兒童全腦區的 RR、DET、LADL 特征進行。如圖 5 左圖所示,比較了三個組合特征(RR + DET + LADL)、兩個組合特征(RR + DET)以及單一特征(RR)的分類效果,ROC 曲線下面積隨著組合特征數的增加而增加,當三個特征 RR、DET、LADL 組合在一起時,得到的最高分類準確率為 84%、對應的敏感性、特異性、AUC 值分別為 76%、92%、0.875。之前結果表明 ASD 兒童和 TD 兒童的 EEG 信號特征差異在頂額葉區具有統計學意義,基于此,第二個分類采用頂額葉區 RR、DET、LADL 特征進行。如圖 5 右圖所示,隨著特征數的增加 ROC 曲線下面積也隨之增加,當三個特征 RR、DET、LADL 組合在一起時,可得到最高分類準確率為 82%,敏感性、特異性、AUC 值分別為 72%、92%、0.781。詳細的組合特征的分類結果如表 2 所示。本研究僅使用頂額葉區的 EEG 信號特征進行分類也能得到和全腦區相近的分類結果,進一步證實了 ASD 兒童和 TD 兒童 EEG 信號特征差異主要體現在頂額葉區。


2.2 討論
本研究通過對比 ASD 兒童和 TD 兒童的 RP 顯示出二者 EEG 信號的非線性特征存在差異,基于 RQA 方法分析發現 ASD 兒童 EEG 信號的 RR、DET、LADL 特征值高于 TD 兒童。通常認為,RR 反映 EEG 信號的復雜度,其值越低則 EEG 信號越復雜、新模式出現的概率也越高,本研究得出的 ASD 兒童 EEG 信號復雜度低于 TD 兒童這一結論與 ASD 兒童認知功能下降具有一致性,反映了 ASD 兒童參與和適應新認知任務的能力較弱[18-19]。DET 反應動態系統的可預測程度,其值越高則動態系統的可預測程度越高,研究結果發現 ASD 兒童 DET 值偏高可能由于 ASD 兒童臨床表現包括單一刻板的思維模式和行為方式。LADL 也反映系統的可預測程度,其值越高則系統的可預測程度就越高,本研究顯示 ASD 兒童的 LADL 值大于 TD 兒童,進一步證明了 ASD 兒童 EEG 信號可預測性更強。
研究同時發現 ASD 兒童和 TD 兒童 EEG 信號非線性特征差異在頂額葉區具有統計學意義。頂葉主要與人的邏輯思維能力和感覺響應能力有關;額葉是大腦中發育最高級的區域,額葉有使人的下意識活動服從意志的作用,并與人的情感、語言、運動及智力等方面也有緊密聯系。頂額葉區 EEG 信號的非線性特征改變與 ASD 兒童在語言以及智力方面較 TD 兒童發育落后這一臨床特征具有一致性[18]。Vogan 等[20]在一項認知任務研究中表明,ASD 兒童對完成認知任務的準確性顯著低于 TD 兒童,TD 兒童隨著任務難度增加頂額葉得到更多激活,ASD 兒童未表現出頂額葉的有效激活,他們無法有效整合復雜信息。聞芳等[21]利用多尺度熵算法研究了 ASD 兒童經過經顱直流電刺激干預前后各腦區 EEG 信號復雜度的變化,發現干預后 ASD 兒童頂額葉區 EEG 信號的熵值明顯提高,即復雜度增加了,研究結果表明 ASD 兒童在頂額葉的 EEG 信號非線性特征存在異常,與本研究結果一致。本研究顯示 RR、DET、LADL 特征能夠成為區分 ASD 兒童和 TD 兒童的客觀指標,通過這些特征進行 SVM 分類來識別 ASD 兒童和 TD 兒童具有可行性。
3 結論
本研究運用 RQA 方法提取分析 ASD 兒童和 TD 兒童 EEG 信號的 RR、DET、LADL 特征,結果發現,在全腦區,ASD 兒童 EEG 信號的 RR、DET、LADL 特征都要高于 TD 兒童,表明 ASD 兒童的 EEG 信號復雜度低于 TD 兒童且模式更單一可預測,這與 ASD 兒童認知功能下降和單一刻板思維方式的表現具有一致性,同時,這種特征差異在頂額葉區也具有統計學意義。基于提取的 RR、DET、LADL 特征利用機器學習對 ASD 兒童和 TD 兒童分類,在全腦區其最大分類準確率為 84%,在頂額葉區最大分類準確率為 82%,較傳統特征分類準確率更高。
本研究首次結合 RQA 方法分析 ASD 兒童和 TD 兒童 EEG 信號,利用提取的 EEG 信號特征結合 SVM 分類器獲得了較高的分類準確率,因此,基于 RQA 方法提取 EEG 信號非線性特征來分析和預測 ASD 兒童具有可行性。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
孤獨癥譜系障礙(autism spectrum disorder,ASD)是一種由于神經系統失調導致的發育障礙疾病,其核心癥狀包括社會交往障礙、言語交流障礙、重復刻板行為等[1]。當前,全球范圍內 ASD 的發病率顯著升高,美國疾病控制與預防中心數據表明,美國所有出生于 2002 年的孩子 ASD 發病率約為 1/68[2]。迄今為止,ASD 發病確切原因還不清楚,可能與遺傳、環境等因素相關[3]。目前醫學上主要根據量表和行為觀察進行 ASD 診斷[4],但其主觀性較強,會產生一定的誤診率,因此,尋找客觀指標對 ASD 患者進行準確評估至關重要。
腦電圖(eletroencephalography,EEG)通過電極記錄大腦細胞群自發性、節律性電活動,因其時間分辨率較高且包含大量生理和病理等信息,所以,監測 EEG 信號逐漸成為研究腦部疾病和神經認知疾病的有力手段。由于 EEG 信號所固有的非線性特性,因此應用非線性分析方法分析 EEG 信號更合適。近年來非線性分析方法如相關維數、李雅普諾夫(Lyapunov)指數、復雜度、樣本熵等被廣泛應用于 EEG 信號的研究[5]:Cukic 等[6]將樣本熵方法應用于抑郁癥患者 EEG 信號復雜度分析;李世丹[7]對比分析了線性分析方法和非線性分析方法提取酗酒者和正常人 EEG 信號特征的分類效果,結果表明基于非線性分析方法提取的 EEG 信號特征分類準確性更高。
遞歸圖(recurrence plot,RP)由 Eckmann 等[8]于 1987 年提出,RP 可以對非線性時間序列信號的非線性特征和內在相似性特征進行定性分析,而遞歸定量分析(recurrence quantification analysis,RQA)方法用于對這些特征進行精確量化。近年來 RQA 方法已廣泛應用于 EEG 信號研究,Pitsik 等[9]通過 RQA 方法計算 EEG 信號復雜度來監測人體運動開始時刻;Timothy 等[10]基于 RQA 方法對輕度認知障礙患者和正常人的靜息態 EEG 信號進行分類,準確率達 72.2%。
ASD 屬于神經發育障礙疾病,其疾病特征在 EEG 信號中有所體現,大量研究表明,根據 EEG 信號對 ASD 患者進行評估和診斷具有可行性[11-13]。RP 和 RQA 方法結合 EEG 信號已經成為分析癲癇、抑郁癥等多種腦認知疾病的有力工具。目前本課題組尚未發現有研究將 RQA 方法結合 EEG 信號用以分析 ASD 的疾病特征。基于此,本研究在這一方面進行首次探索,用 RP 和 RQA 方法來提取 ASD 患者 EEG 信號特征,然后結合支持向量機(support vector machine,SVM)對特征進行分類。同時在組間水平上對比了 ASD 兒童和 TD 兒童不同腦區 EEG 信號特征的差異,并結合腦區功能來分析特征差異同 ASD 患者臨床特征之間的聯系,為今后 ASD 的診斷和治療提供相應參考。
1 材料和方法
1.1 材料
1.1.1 受試者
本研究共招募 50 名兒童參與 EEG 信號采集,包括:① 在北京安定醫院招募 ASD 兒童 25 名,其中男生 21 名,女生 4 名,符合 ASD 患者中男性患者人數是女性患者人數的 4~5 倍[14],年齡在 3~6 歲之間,平均年齡為(4.40 ± 0.95)歲。ASD 兒童評定方法為專業醫師根據《精神病診斷與統計手冊(第五版)》和《兒童孤獨癥評定量表》進行評定。② 招募北京當地幼兒園 25 名正常發育(typical development,TD)兒童,采集他們的 EEG 信號作為對照,其中男生 11 名,女生 14 名,年齡在 3~6 歲之間,平均年齡為(4.36 ± 0.64)歲。兩組兒童年齡的差異無統計學意義(t = 0.17,P = 0.86)。本研究經過北京師范大學倫理委員會批準,并得到倫理審查通知書,在完整描述試驗步驟之后,家長簽署書面知情同意書,所有兒童均自愿參加本次試驗。
1.1.2 EEG 信號采集
本研究用 8 通道 EEG 信號采集系統對 50 名兒童的靜息態 EEG 信號進行采集,其中采樣率為 1 000 Hz,Cz 電極為參考電極,采集過程中保持電極阻抗小于 50 k?。8 個電極記錄了四個腦區的 EEG 信號:C3、C4 電極記錄頂葉區的 EEG 信號;F3、F4 電極記錄額葉區的 EEG 信號;O1、O2 電極記錄枕葉區的 EEG 信號;T3、T4 電極記錄顳葉區的 EEG 信號。
1.1.3 數據預處理
使用數據分析軟件 Matlab 2018(MathWorks,美國)中的 EEGLAB 工具箱對采集的 EEG 信號進行預處理:首先將采集的 EEG 信號通過 0.5~40 Hz 的帶通濾波器,然后用自適應偽跡檢測算法去除工頻、眼電、心電、肌電、呼吸等偽跡,去除超過閾值的序列,最后將每位兒童每個通道的 EEG 信號進行數據截選,截選長度為 5 s 的 EEG 信號進行分析。
1.2 EEG 信號特征提取
1.2.1 相空間重構
EEG 信號本質上是一維非線性時間序列信號,通過相空間重構可以將一維非線性時間序列信號映射到高維相空間中,而 RP 又可以將高維相空間信號進行可視化,所以相空間重構是研究非線性時間序列信號遞歸特性的基礎。根據周佰成等[15]報道的 Takens 理論指出,嵌入定理可以為一維非線性時間序列信號重構一個與原動力系統在拓撲意義下一樣的相空間,非線性時間序列信號的分析和預測都是在這個重構的相空間中進行的。
假設 x(n)是長度為 N 的非線性時間序列信號,n = 1,2,,N。相空間重構得到一組 m 維向量 X(n),如式(1)所示:
![]() |
其中,m 是嵌入維度,τ 是延遲時間。m 和 τ 決定著相空間重構的質量,如果 τ 太小,則相空間中向量的兩個坐標分量在數值上非常接近,從而無法提供兩個獨立的坐標分量,但 τ 太大又會出現兩個坐標分量完全獨立的情況,失去研究意義;同樣地,如果 m 太小會出現高維狀態下不相鄰點在低維狀態下相鄰,即出現虛假近鄰點,選較大 m 在理論上可行,但會增加計算量。選取 m 和 τ 的很重要,本研究分別采用虛假最臨近法和互信息法確定 m 和 τ。
1.2.2 RP
RP 將高維相空間信號映射到二維空間以實現可視化,相空間重構后兩時刻的向量 X(i)與 X(j)之間的距離為 Ri,j,則 RP 的矩陣形式如式(2)所示:
![]() |
其中 ε 為距離閾值,||.||為歐式距離,θ[x]為海維賽德(Heaviside)函數,如式(3)所示:
![]() |
對于任意兩個向量 X(i)、X(j),如果它們之間的歐式距離小于距離閾值,則 Ri,j = 1,表示兩個向量發生了遞歸,在 RP 中用黑點表示,否則 Ri,j = 0,表示兩個向量沒有發生遞歸,在 RP 中用白點表示。
如圖 1 所示,繪制了 ASD 兒童和 TD 兒童 EEG 信號的 RP。由圖可知,相比于 TD 兒童,ASD 兒童 RP 中的遞歸點要更多,且有較多的黑塊,平行于對角線的黑色線段也更多。

1.2.3 RQA
RP 不能對 EEG 信號進行準確的定量分析,自從 Zbilut 等[16]提出 RQA 方法之后,涉及到的信號監測已從定性分析上升到了更加準確的定量分析,RQA 方法在分析心率信號、EEG 信號和肌電信號等人體生理信號中有廣泛應用。本研究基于 RQA 方法提取了 ASD 兒童和 TD 兒童 EEG 信號的遞歸率(recurrence rate,RR)、確定性(determinism,DET)和平均對角線長度(length of average diagonal line,LADL)特征。
RR:指 RP 中遞歸點的個數占圖中所有點個數的比值,其值隨信號序列復雜度降低而升高,計算公式如式(4)所示:
![]() |
其中,N為 RP 中橫坐標或縱坐標的點數。
DET:指 RP 中平行于主對角線的線段所包含的遞歸點個數占總遞歸點個數的比值,其值隨信號序列周期性增強(或者模式越單一)而升高,計算公式如式(5)所示:
![]() |
上式中,l 表示線段長度,lmin 表示最小線段長度,本研究選定 lmin = 2,P(l)表示長度為 l 且平行于主對角線的線段數。
LADL:即平行于主對角線的線段所包含遞歸點個數的加權平均值(主對角線并不計算在內),其值隨系統的確定程度增強而升高,計算公式如式(6)所示:
![]() |
本研究使用以上三個特征作為 SVM 的輸入數據進行分類。
1.3 SVM 分類
1.3.1 SVM
SVM 的分類原理是在特征空間中確定一個最優分類超平面,使得不同類別的樣本到該超平面的距離最大,以保證較高的分類精度[17]。本研究使用 SVM 留一交叉驗證法進行分類,即每次從樣本集中抽取一個樣本作為分類器測試集,剩余的樣本作為分類器訓練集,以此方式無交叉地進行總樣本個數次訓練和測試,然后對所有測試結果做平均,最終得到測試結果平均值。
RQA 方法提取 EEG 信號的 RR、DET、LADL 特征,將 ASD 兒童和 TD 兒童 EEG 信號的差異直觀反映在這些特征值上,將這三個特征值歸一化后組成特征向量輸入 SVM 分類器進行留一交叉驗證分類,具體流程如圖 2 所示。

1.3.2 評價指標
本研究將 ASD 兒童作為正類,TD 兒童作為負類,用準確率(accuracy,Acc)、敏感性(sensitivity,Se)、特異性(specificity,Sp)和曲線下面積(area under the the curve,AUC)值作為指標評價分類性能,同時也繪制了分類模型的受試者工作特征曲線(receiver operating characteristic curve,ROC)。Acc 表示被正確分類的樣本數占總樣本數的比值。ROC 曲線按照真陽性率(true positive rate,TPR)為縱軸,假陽性率(false positive rate,FPR)為橫軸進行繪制。其中,真陽性(true positive,TP)表示被正確分類為正類的個數;假陽性(false positive,FP)表示被錯誤分類為正類的個數;真陰性(true negative,TN)表示被正確分類為負類的個數;假陰性(false negative,FN)表示被錯誤分類為負類的個數。ROC 曲線結合了敏感性和特異性,敏感性也叫真正率、真陽性率,表示被正確分類為正樣本的個數占總正樣本個數的比值;特異性也叫真負率、真陰性率,表示被正確分類為負樣本的個數占總的負樣本個數的比值。AUC 值指 ROC 曲線下部面積,取值范圍是 0~1,AUC 值越接近 1 則分類器的分類性能越好。Acc、Se、Sp 的計算公式分別如式(7)~(9)所示。
![]() |
![]() |
![]() |
1.3.3 統計分析
使用統計分析軟件 SPSS 24(IBM,美國)分析 ASD 兒童和 TD 兒童不同腦區的 EEG 信號非線性特征差異是否具有統計學意義。本研究中 ASD 兒童和 TD 兒童的特征數據服從正態分布且相互獨立,即符合獨立樣本t檢驗的條件,因此使用 SPSS 24 軟件中的獨立樣本t檢驗進行分析,當P < 0.05 時認為差異具有統計學意義。
2 結果與討論
2.1 結果
如圖 1 所示,采用序列長度為 5 000 的 EEG 信號繪制 RP,可以看出,相較于 TD 兒童對應的 RP,ASD 兒童對應的 RP 中遞歸點更多,且黑塊和平行于對角線的黑色線段也更多。
進一步利用 RQA 方法量化 EEG 信號的特征,基于 RR、DET、LADL 特征值的箱型圖如圖 3 所示,橫軸表示均勻分布在全腦區(包括:頂葉、額葉、枕葉、顳葉)的 8 個通道,縱軸表示對應通道的 EEG 信號特征值。從圖 3 中可以看出 ASD 兒童的 RR、DET、LADL 特征值在各個通道總體要高于 TD 兒童,尤其在 C3、C4、F3、F4 通道上這種差異更加明顯,即 ASD 兒童 EEG 信號特征值在頂額葉區(包括:頂葉、額葉)明顯比 TD 兒童大,基于 RR、DET、LADL 特征值的柱狀圖如圖 4 所示,柱狀圖從平均值的角度顯示出這種差異。基于此,對特征值進行統計學分析。


ASD 兒童和 TD 兒童在四個腦區特征值差異的統計學分析結果如表 1 所示,在頂額葉區,除了額葉區 DET 特征差異無統計學意義外,其他五項特征差異均有統計學意義(P < 0.05);在顳葉和枕葉區,僅 RR 特征差異有統計學意義,其他兩項特征的差異均無統計學意義(P > 0.05)。

本研究通過 SVM 留一交叉驗證分類,第一個分類采用 ASD 兒童和 TD 兒童全腦區的 RR、DET、LADL 特征進行。如圖 5 左圖所示,比較了三個組合特征(RR + DET + LADL)、兩個組合特征(RR + DET)以及單一特征(RR)的分類效果,ROC 曲線下面積隨著組合特征數的增加而增加,當三個特征 RR、DET、LADL 組合在一起時,得到的最高分類準確率為 84%、對應的敏感性、特異性、AUC 值分別為 76%、92%、0.875。之前結果表明 ASD 兒童和 TD 兒童的 EEG 信號特征差異在頂額葉區具有統計學意義,基于此,第二個分類采用頂額葉區 RR、DET、LADL 特征進行。如圖 5 右圖所示,隨著特征數的增加 ROC 曲線下面積也隨之增加,當三個特征 RR、DET、LADL 組合在一起時,可得到最高分類準確率為 82%,敏感性、特異性、AUC 值分別為 72%、92%、0.781。詳細的組合特征的分類結果如表 2 所示。本研究僅使用頂額葉區的 EEG 信號特征進行分類也能得到和全腦區相近的分類結果,進一步證實了 ASD 兒童和 TD 兒童 EEG 信號特征差異主要體現在頂額葉區。


2.2 討論
本研究通過對比 ASD 兒童和 TD 兒童的 RP 顯示出二者 EEG 信號的非線性特征存在差異,基于 RQA 方法分析發現 ASD 兒童 EEG 信號的 RR、DET、LADL 特征值高于 TD 兒童。通常認為,RR 反映 EEG 信號的復雜度,其值越低則 EEG 信號越復雜、新模式出現的概率也越高,本研究得出的 ASD 兒童 EEG 信號復雜度低于 TD 兒童這一結論與 ASD 兒童認知功能下降具有一致性,反映了 ASD 兒童參與和適應新認知任務的能力較弱[18-19]。DET 反應動態系統的可預測程度,其值越高則動態系統的可預測程度越高,研究結果發現 ASD 兒童 DET 值偏高可能由于 ASD 兒童臨床表現包括單一刻板的思維模式和行為方式。LADL 也反映系統的可預測程度,其值越高則系統的可預測程度就越高,本研究顯示 ASD 兒童的 LADL 值大于 TD 兒童,進一步證明了 ASD 兒童 EEG 信號可預測性更強。
研究同時發現 ASD 兒童和 TD 兒童 EEG 信號非線性特征差異在頂額葉區具有統計學意義。頂葉主要與人的邏輯思維能力和感覺響應能力有關;額葉是大腦中發育最高級的區域,額葉有使人的下意識活動服從意志的作用,并與人的情感、語言、運動及智力等方面也有緊密聯系。頂額葉區 EEG 信號的非線性特征改變與 ASD 兒童在語言以及智力方面較 TD 兒童發育落后這一臨床特征具有一致性[18]。Vogan 等[20]在一項認知任務研究中表明,ASD 兒童對完成認知任務的準確性顯著低于 TD 兒童,TD 兒童隨著任務難度增加頂額葉得到更多激活,ASD 兒童未表現出頂額葉的有效激活,他們無法有效整合復雜信息。聞芳等[21]利用多尺度熵算法研究了 ASD 兒童經過經顱直流電刺激干預前后各腦區 EEG 信號復雜度的變化,發現干預后 ASD 兒童頂額葉區 EEG 信號的熵值明顯提高,即復雜度增加了,研究結果表明 ASD 兒童在頂額葉的 EEG 信號非線性特征存在異常,與本研究結果一致。本研究顯示 RR、DET、LADL 特征能夠成為區分 ASD 兒童和 TD 兒童的客觀指標,通過這些特征進行 SVM 分類來識別 ASD 兒童和 TD 兒童具有可行性。
3 結論
本研究運用 RQA 方法提取分析 ASD 兒童和 TD 兒童 EEG 信號的 RR、DET、LADL 特征,結果發現,在全腦區,ASD 兒童 EEG 信號的 RR、DET、LADL 特征都要高于 TD 兒童,表明 ASD 兒童的 EEG 信號復雜度低于 TD 兒童且模式更單一可預測,這與 ASD 兒童認知功能下降和單一刻板思維方式的表現具有一致性,同時,這種特征差異在頂額葉區也具有統計學意義。基于提取的 RR、DET、LADL 特征利用機器學習對 ASD 兒童和 TD 兒童分類,在全腦區其最大分類準確率為 84%,在頂額葉區最大分類準確率為 82%,較傳統特征分類準確率更高。
本研究首次結合 RQA 方法分析 ASD 兒童和 TD 兒童 EEG 信號,利用提取的 EEG 信號特征結合 SVM 分類器獲得了較高的分類準確率,因此,基于 RQA 方法提取 EEG 信號非線性特征來分析和預測 ASD 兒童具有可行性。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。