本文嘗試通過腦電信號檢測方法輔助多動癥兒童進行臨床個體化診斷。首先基于一種經典的干擾控制試驗任務Simon-spatial Stroop范例采集14名多動癥兒童和16名正常兒童的腦電數據, 并完成濾波、分段、去偽跡等預處理; 然后采用主成分分析(PCA)進行電極優化選擇, 分別選取每種刺激模式下出現率90%以上的優化電極作為共有電極, 并提取共有電極潛伏期(200~450 ms)波幅的均值特征; 最后采用基于歐氏距離的k-最近鄰(KNN)和基于徑向基核函數的支持向量機(SVM)分類器來分類。實驗發現同種試驗任務中多動癥兒童比正常兒童表現出更低的反應正確率和更長的反應時間; 多動癥兒童與正常兒童的前額葉優化電極均出現N2, 頂枕葉均有P2出現, 且多動癥兒童的峰值更低; 在該實驗中KNN分類準確率高于SVM分類器, StI刺激模式下KNN分類器的最高分類準確率為89.29%。以上結果說明, 干擾控制試驗中多動癥兒童與正常兒童的前額葉及頂枕葉的腦電信號存在差異, 該結果可為多動癥個體的腦電信號臨床診斷提供一定科學依據。
引用本文: 楊姣姣, 郭倩, 李文杰, 王蘇弘, 鄒凌. 基于腦電主成分分析和k-最近鄰的多動癥兒童與正常兒童分類研究. 生物醫學工程學雜志, 2016, 33(2): 232-238. doi: 10.7507/1001-5515.20160041 復制
引言
多動癥,全稱為注意缺陷多動障礙(attention-deficit/hyperactivity disorder,ADHD),是一種發生在兒童學齡初期以注意力渙散、多動和沖動為主要特征的神經心理行為疾病,是兒童九大發育行為問題之首。美國《精神疾病的診斷和統計手冊》(Diagnostic And Statistical Manual of Mental Disorders,DSM-IV-TR)將其分為注意缺陷型、多動沖動型和混合型三種,其中注意缺陷型最為常見[1]。來自2014年國際生物醫學學術大會的數據統計表明,多動癥的發病率為1.5%~13.4%,且呈逐年上升趨勢,有近1/3的兒童癥狀會持續到青春期。多動癥通常會伴發品行障礙、對立違抗障礙、學習障礙等行為疾病。這些臨床癥狀會對兒童的認知和行為功能產生持續不良影響,不僅危害兒童的成長發育,還會給其家庭帶來沉重的經濟和心理負擔[2]。可見,多動癥已成為一種嚴重的社會公共衛生問題。
由于目前尚缺乏針對多動癥的特異性測試工具,臨床醫生一般依據DSM-IV-TR的標準,通過父母訪談、兒童評估和教師信息報告等主觀印象進行診斷,而采用量化的方法如腦電圖(electroencephalogram,EEG)測量為多動癥的診斷提供客觀證據也成為研究熱點之一。Shaw等[3]認為多動癥存在明顯的皮質發育延遲,而大腦發育與腦電信號及其腦功能連接密切相關[4]。Rubia等[5]猜想前額葉和紋狀體的活動異常可能是引起多動癥外部癥狀的關鍵原因。Barkley[6]認為行為失控是多動癥的基本缺陷,而干擾控制是與行為抑制相關聯的第三個階段。為了研究多動癥的腦神經缺陷機制,干擾控制刺激常作為誘發腦電信號的實驗任務。除了持續行為測試(continuous performance test,CPT)范例,Simon任務、Stroop任務和Flanker任務也被廣泛用來研究干擾控制。Simon任務中受試個體的前扣帶皮質、輔助運動區和楔前葉腦區有明顯的反應激活,而Stroop任務中受試的頂葉皮層涉及明顯的激活[7]。Simon-spatial Stroop任務是Simon任務和Stroop任務的聯合,也是研究多動癥的經典干擾控制范例之一。多動癥兒童難以對目標刺激保持持續關注,從而在干擾任務中表現較差(更多的錯誤,更長的平均反應時間和標準偏差),這反映了其受損的干擾控制,但行為方式本身并沒有表現潛在的認知加工神經機制。然而,鎖定時域腦電信號可以揭示神經信號在毫秒數量級的變化,從而提供人在處理事情時大腦活動的實時改變[8]。因此初步推斷,檢測干擾控制任務中多動癥兒童和正常兒童的腦電信號可輔助多動癥兒童臨床個體化診斷。
已有多種特征提取方法應用于腦電信號的研究。Siuly等[9-10]認為很多分析方法對于非平穩的腦電信號并不是最好,甚至運算效率不高,而且對于高導聯的腦電信號,很多現有的分析方法并不合適。可見,在研究多導聯的腦電信號時,如何提高其分析效率是一個值得思考的問題。Wei等[11]也證實使用優化電極的方法可提高分類準確率。因此為了提高128導聯腦電信號的運算效率和分類準確率,可采用電極優化的方法來進行研究。基于Rayleigh系數改進的遺傳算法可選擇有效的通道從而有利于運動想象腦電信號分類[12],Arvenah等[13]也提出了一種稀疏的公共空間模式算法來選擇腦電信號電極。然而很少有方法考慮了單個時間窗內所有觀測信號的變化關系,甚至多數情況下并沒有通過實驗數據本身的關系評估來選擇參數,而參數的選擇對數據的分析結果有重要的影響[10]。主成分分析(principal component analysis,PCA)方法通過對鎖定的分段時間窗內的腦電信號進行線性變換篩選出較少導聯的重要變量,其一組多變量數據的主成分包含大部分原始數據信息,隨著原始數據主要特征的確定,實現了數據降維,并能選取重要的顯著成分[14]。腦電信號一般有大量的冗余信息不能應用于臨床診斷,而PCA方法可以去除這些冗余信息[10],因此可利用PCA方法尋找分段時間窗內的腦電信號顯著成分,挑選出腦電信號的優化子集。
目前已有多種方法應用于腦電信號分類研究。作為分類技術中最簡單的方法之一,k最近鄰(k-nearest neighbor,KNN)法根據特征空間中接近訓練示例的對象進行分類,適用于類域的交叉或重疊較多的待分樣本集。Ghassemi等[15]將KNN用于多動癥兒童和正常兒童的腦電信號分類取得了較好結果。Cao等[16]發現多動癥兒童和正常兒童的潛伏期(200~450 ms)腦電信號差異并不十分明顯。因此,猜想多動癥兒童和正常兒童的腦電信號存在交叉或重疊,可嘗試KNN算法研究分類。Poil等[17]研究了不同年齡階段多動癥患者靜息態腦電信號特征,發現支持向量機(support vector machine,SVM)可對多動癥成人和正常成人分類,但不能區分多動癥兒童和正常兒童。因此,本文嘗試研究基于徑向基核函數的SVM是否能成功對干擾控制任務下的多動癥兒童和正常兒童腦電信號進行分類,并與KNN進行對比研究。
本文基于一種經典的干擾控制試驗任務Simon-spatial Stroop范例,對多動癥和正常兒童的腦電信號進行了研究,首先采用PCA方法對預處理后的腦電信號進行了電極優化選擇,然后根據不同刺激模式從所有受試的優化電極中選取出現率90%以上的電極作為共有電極,并提取共有電極潛伏期(200~450 ms)波幅的均值特征,最后用KNN和SVM分類器分類,嘗試檢測多動癥兒童與正常兒童的腦電信號,并研究其差異性以輔助多動癥兒童的臨床個體化診斷。
1 方法
1.1 受試信息
14名多動癥兒童,年齡8~11.4歲,平均年齡8.2歲,其中包括4名女孩,10名男孩,均來自蘇州大學第三附屬醫院;16名正常兒童,年齡7.3~10.1歲,平均年齡8.8歲,其中包括10名女孩,6名男孩,均來自周邊小學。多動癥兒童均根據心理疾病的標準診斷和統計手冊經過門診專業診斷評估。根據瑞文推理測驗和韋氏智力量表中國兒童修訂版進行測試,所有受試的IQ≥80,無顱腦損傷、癲癇或其他精神疾病。所有受試視力或矯正視力正常,左右手能正常活動。
1.2 試驗范例
本試驗選取了經典的干擾控制任務Simon-spatial Stroop范例[16]。試驗環境安靜舒適,受試頭戴電極帽坐在正對17英寸顯示屏80 cm處的舒適椅上,水平和垂直視力翻轉角均小于3。在詳細的指導下,受試需要根據試驗圖片快速地做出準確、穩定的按鍵反應,并盡量減少眨眼次數。試驗分三個階段,前兩個階段為試驗訓練階段,第三個階段為正式試驗階段。試驗刺激為3.5 cm×4.5 cm的白色向上或向下箭頭。第一個訓練階段由15個向上箭頭和15個向下的箭頭組成。當向上的箭頭出現時,要求受試用左手食指點擊反應盒左鍵;當向下的箭頭出現時,要求受試用右手食指點擊反應盒右鍵。第二個訓練階段包含32個試驗,箭頭隨機地出現在中心十字的左、右、上、下四個方向,構成四種不同的刺激模式:SmC-箭頭的位置與反應按鍵相一致(如:向上的箭頭位于中心十字的左側,用左手食指點擊左鍵;或向下的箭頭位于中心十字的右側,用右手食指點擊右鍵);SmI-箭頭的位置與反應按鍵相反(如:向上的箭頭位于中心十字的右側,用左手食指點擊左鍵;或向下的箭頭位于中心十字的左側,用右手食指點擊右鍵);StC-箭頭的位置與方向一致(如:向上的箭頭位于中心十字的上側);StI-箭頭的位置與方向不一致(如:向上的箭頭位于中心十字的下側)。正式試驗由288個試驗組成,分兩個塊呈現,每個塊包括144個試驗,SmC、SmI、StC和StI四種刺激模式等概率隨機呈現,每個刺激呈現時間為1 000 ms,每次刺激之間的時間間隔從2 000、2 500、3 000或3 500 ms四個時段隨機選取。第一個塊呈現結束,受試可休息2 min。
1.3 腦電信號采集和預處理
實驗設備為美國EGI公司生產的128導腦電信號采集系統,參考電極為平均參考,采集軟件為Net Station,采樣頻率500 Hz,每個電極阻抗降至100 kΩ以下。腦電信號預處理使用EGI 4.5.6版的Net Station軟件,數據重濾波范圍是0.3~30 Hz,分段(-200~1 000 ms),基線校準(-200~0 ms)。通過窗口移動算法排除實驗中噪聲較多的導聯和試驗、按鍵不正確的試驗、反應時間超出設定時間200~1 500 ms的試驗,及眼動、眨眼或壞通道數量過多(> 10)的試驗。
1.4 PCA算法
PCA方法考慮了鎖定分段時間窗內所有觀測信號的變化關系,可去掉腦電信號中的冗余信息[10]。針對預處理后的腦電數據通過PCA方法研究分段時間窗內各導聯腦電信號的變化關系從而確定主成分分量,可選取顯著信號成分對應的優化電極,實現數據降維[14]。為了不丟失信號的有效成分,本文選取了累積方差貢獻率99%的優化電極,其余均被當成噪聲成分。
1.5 分類器
1.5.1 KNN分類器
基于歐氏距離的KNN方法計算簡單,根據特征空間中接近訓練示例的對象進行分類[15]。提取多動癥組和正常組兒童的共有電極潛伏期(200~450 ms)振幅的均值特征后,本文選用KNN分類器通過計算測試樣本與訓練樣本的歐氏距離,根據同種刺激任務下單次試驗逐一投票的方法判定測試樣本所屬類別。
1.5.2 SVM分類器
本研究選用SVM作為第二個分類器,嘗試對干擾控制任務下多動癥兒童和正常兒童的腦電信號分類。SVM是采用監督式的學習方法,其主要思想是將輸入向量映射到高維的特征向量空間,并在該特征空間中構造最優分類面[18]。在分類研究過程中,為了建立分類器模型,本文隨機選擇70%的特征樣本作為訓練樣本,剩下樣本用來測試。為了測試分類器的穩定性,本文嘗試了多次運算。其具體步驟如下。
步驟一:給出兩組受試的腦電信號特征作為輸入樣本X以及與之對應的期望輸出類別Y。其表達式如下:
$ \boldsymbol{X}=\left[ {{x_1}\; \;{x_2}\; \; \cdots \; {x_N}} \right] $ |
$ \boldsymbol{Y}=\left[ {{y_1}\; \;{y_2}\; \; \cdots \; {y_N}} \right]\; \;\; \;{y_i} \in \left\{ { + 1, -1} \right\} $ |
xi(i=1, 2, …, N)為提取的腦電信號特征向量,其中+1表示正常兒童,-1代表多動癥兒童。
步驟二:為使分類面盡可能對所有信號樣本正確分類并具備分類間隔,需在約束條件c=0和ai≥0 (i=1, 2, …, N)下,求得分類面的最大差值d,從而得到最優解ai*。為了解決該約束最優化問題,可引入Lagrange函數進行約束優化[18]。約束條件和分類面的最大差值表達式如下:
$ c=\sum\limits_{i=1}^N {{y_i} \cdot {a_i}} $ |
$ d=\sum\limits_{i=1}^N {{a_i}}-\frac{1}{2}\sum\limits_{i, j=1}^N {{a_i} \cdot {a_j}} \cdot {y_i} \cdot {y_j} \cdot \left({{x_i} \cdot {x_j}} \right) $ |
步驟三:根據特定的支持向量xN計算出信號的最優權值向量w*和最優偏執向量b*:
$ {\boldsymbol{w}^*}=\sum\limits_{i=1}^N {{a_i}} \cdot {y_i} \cdot {x_i} $ |
$ {\boldsymbol{b}^*}=\frac{1}{{{y_N}}}-{\boldsymbol{w}^*} \cdot {x_N} $ |
步驟四:本文選擇徑向基核函數K(xi, xj),通過計算求得分類函數f(x)的值,計算式如下:
$ \begin{array}{*{20}{c}} {f\left(x \right)={\mathop{\rm sgn}} \left({\sum\limits_{i=1}^N {{a_i}^*} \cdot {y_i} \cdot K \cdot \left({{x_i}, x} \right) + {b^*}} \right) \cdot \sum\limits_{i, j=1}^N {{a_i} \cdot {a_j}} }\ { \cdot {y_i} \cdot {y_j} \cdot \left({{x_i} \cdot {x_j}} \right)} \end{array} $ |
根據f(x)的值為+1或-1,判斷出測試信號樣本所屬類別,與期望輸出類別進行對比,即可求出分類準確率。
2 結果
2.1 行為測試結果
多動癥兒童和正常兒童的行為數據結果如表 1所示,與不協調的試驗任務相比,在協調一致的任務中所有受試均表現出更高的反應正確率和更短的反應時間;在同種任務中多動癥兒童比正常兒童表現出更高的出錯率和更長的反應時間,且多動癥兒童的穩定性更差。

2.2 電極選擇結果
每個受試預處理后的腦電信號為128導,經PCA方法選擇累計方差貢獻率99%的主成分后,排除了75%左右的導聯,減少了電極個數,提高了數據分析的效率。根據不同刺激模式,從所有受試的優化電極中選取出現率90%以上的電極作為共有電極,選取的共有優化電極如表 2所示。

四種刺激模式下的共有電極均位于前額葉腦區和頂枕葉腦區,隨著出現率的提高共有電極個數會減少。為了研究不同出現率的共有電極對分類結果的影響,根據潛伏期(200~450 ms)振幅均值特征,本文采用KNN分類器進行了分類。如表 2所示,根據SmI和StI刺激任務所選的共有電極進行分類時,分類正確率相對較高,該兩種刺激模式下多動癥兒童和正常兒童的前額葉腦區和頂枕葉腦區的腦電信號表現出更明顯的差異。
為了進一步研究兩組受試前額葉和頂枕葉腦區的事件相關電位,分別對四種刺激模式下優化電極出現率100%的共有電極的腦電信號進行了組內疊加平均。四種刺激模式下兩組受試分別疊加平均后的腦電信號時域波形圖如圖 1所示,可見在四種刺激任務下多動癥兒童和正常兒童的前額葉腦區均有N2(200~450 ms),而在頂枕區均有P2出現;在同種任務中多動癥兒童的N2和P2振幅峰值比正常兒童低,但其差異顯著性有待進一步研究。

2.3 分類結果
由于不同的刺激模式下不同共有電極的分類準確率不同,當選用StI刺激模式優化電極出現率96%的頂枕葉電極進行分類時分類準確率達到最高。因此對SmI和StI兩種刺激模式出現率96%以上的共有電極潛伏期振幅均值特征,本文采用了SVM分類器與KNN分類器分類對比,結果如表 3所示。

如表 3所示,兩種刺激模式下KNN分類器的分類準確率高于SVM;當選用頂枕葉共有電極進行分類時分類準確率較高,StI刺激模式下KNN分類器的分類準確率最高可達89.29%,而SVM最高分類準確率只有60.50%。
3 討論
本文嘗試采用腦電信號檢測方法輔助多動癥兒童臨床個體化診斷。前人報道了多動癥受損的干擾控制能力[6, 8]。因此,本文基于干擾控制任務Simon-spatial Stroop試驗范例,采集了30名受試的腦電信號,針對預處理后的腦電數據,首先采用PCA方法篩選了優化電極(累計貢獻率≥99%),減少了分析數據的維度,提高了運算效率。研究發現主成分相關電極主要位于前額葉和頂枕葉腦區。四種刺激模式下,多動癥兒童與正常兒童前額葉均有N2(200~450 ms),頂枕葉均有P2,且同種刺激模式下兩組受試的N2和P2峰值表現出差異性。在研究優化電極出現率的過程中,由于數據集的限制,90%是設定的閾值下限,若閾值小于90%會篩選出更多電極,使得篩選出的這些電極中有部分電極并不屬于某些受試的優化電極,從而無法體現分段時間窗內不同電極貢獻率高低的差異性。若受試數量較多,可研究分段時間窗內不同累積貢獻率所選電極分類結果。
在特征提取方面,本文主要研究腦電信號潛伏期時域特性,結合了兩組受試在行為測試中的反應差異,在前人研究報道基礎上[16],根據兩組受試在干擾控制試驗任務中表現出的N2和P2潛伏期特征嘗試了試驗篩選,有效地排除了受試做出正確按鍵反應但不滿足該特征的試驗數據,一定程度上減少了數據運算量。后期的研究可從干擾控制任務組合和特征組合方面展開,也可結合頻域特征或其他非線性特征研究多動癥兒童和正常兒童的腦電信號差異性。如表 2所示,針對SmI和StI兩種試驗任務運用SVM分類器和KNN分類器分類對比,KNN取得了較好的結果,在后期的研究中可從優化權重的投票方法深入。基于徑向基核函數的SVM分類器分類準確率較低,與Poila等[17]的研究結果一致,但穩定性較好,不失為后期深入研究的基礎。
總之,本文研究了干擾控制任務中多動癥兒童和正常兒童腦電信號,通過PCA方法實現了腦電信號降維,并運用KNN和SVM分類器進行了分類對比,KNN取得的最高的分類準確率為89.29%。研究初步認為,干擾控制試驗中多動癥兒童與正常兒童的前額葉及頂枕葉腦電信號存在差異,為多動癥兒童臨床個體化診斷和腦神經缺陷機制基礎研究提供了一定的科學依據。
引言
多動癥,全稱為注意缺陷多動障礙(attention-deficit/hyperactivity disorder,ADHD),是一種發生在兒童學齡初期以注意力渙散、多動和沖動為主要特征的神經心理行為疾病,是兒童九大發育行為問題之首。美國《精神疾病的診斷和統計手冊》(Diagnostic And Statistical Manual of Mental Disorders,DSM-IV-TR)將其分為注意缺陷型、多動沖動型和混合型三種,其中注意缺陷型最為常見[1]。來自2014年國際生物醫學學術大會的數據統計表明,多動癥的發病率為1.5%~13.4%,且呈逐年上升趨勢,有近1/3的兒童癥狀會持續到青春期。多動癥通常會伴發品行障礙、對立違抗障礙、學習障礙等行為疾病。這些臨床癥狀會對兒童的認知和行為功能產生持續不良影響,不僅危害兒童的成長發育,還會給其家庭帶來沉重的經濟和心理負擔[2]。可見,多動癥已成為一種嚴重的社會公共衛生問題。
由于目前尚缺乏針對多動癥的特異性測試工具,臨床醫生一般依據DSM-IV-TR的標準,通過父母訪談、兒童評估和教師信息報告等主觀印象進行診斷,而采用量化的方法如腦電圖(electroencephalogram,EEG)測量為多動癥的診斷提供客觀證據也成為研究熱點之一。Shaw等[3]認為多動癥存在明顯的皮質發育延遲,而大腦發育與腦電信號及其腦功能連接密切相關[4]。Rubia等[5]猜想前額葉和紋狀體的活動異常可能是引起多動癥外部癥狀的關鍵原因。Barkley[6]認為行為失控是多動癥的基本缺陷,而干擾控制是與行為抑制相關聯的第三個階段。為了研究多動癥的腦神經缺陷機制,干擾控制刺激常作為誘發腦電信號的實驗任務。除了持續行為測試(continuous performance test,CPT)范例,Simon任務、Stroop任務和Flanker任務也被廣泛用來研究干擾控制。Simon任務中受試個體的前扣帶皮質、輔助運動區和楔前葉腦區有明顯的反應激活,而Stroop任務中受試的頂葉皮層涉及明顯的激活[7]。Simon-spatial Stroop任務是Simon任務和Stroop任務的聯合,也是研究多動癥的經典干擾控制范例之一。多動癥兒童難以對目標刺激保持持續關注,從而在干擾任務中表現較差(更多的錯誤,更長的平均反應時間和標準偏差),這反映了其受損的干擾控制,但行為方式本身并沒有表現潛在的認知加工神經機制。然而,鎖定時域腦電信號可以揭示神經信號在毫秒數量級的變化,從而提供人在處理事情時大腦活動的實時改變[8]。因此初步推斷,檢測干擾控制任務中多動癥兒童和正常兒童的腦電信號可輔助多動癥兒童臨床個體化診斷。
已有多種特征提取方法應用于腦電信號的研究。Siuly等[9-10]認為很多分析方法對于非平穩的腦電信號并不是最好,甚至運算效率不高,而且對于高導聯的腦電信號,很多現有的分析方法并不合適。可見,在研究多導聯的腦電信號時,如何提高其分析效率是一個值得思考的問題。Wei等[11]也證實使用優化電極的方法可提高分類準確率。因此為了提高128導聯腦電信號的運算效率和分類準確率,可采用電極優化的方法來進行研究。基于Rayleigh系數改進的遺傳算法可選擇有效的通道從而有利于運動想象腦電信號分類[12],Arvenah等[13]也提出了一種稀疏的公共空間模式算法來選擇腦電信號電極。然而很少有方法考慮了單個時間窗內所有觀測信號的變化關系,甚至多數情況下并沒有通過實驗數據本身的關系評估來選擇參數,而參數的選擇對數據的分析結果有重要的影響[10]。主成分分析(principal component analysis,PCA)方法通過對鎖定的分段時間窗內的腦電信號進行線性變換篩選出較少導聯的重要變量,其一組多變量數據的主成分包含大部分原始數據信息,隨著原始數據主要特征的確定,實現了數據降維,并能選取重要的顯著成分[14]。腦電信號一般有大量的冗余信息不能應用于臨床診斷,而PCA方法可以去除這些冗余信息[10],因此可利用PCA方法尋找分段時間窗內的腦電信號顯著成分,挑選出腦電信號的優化子集。
目前已有多種方法應用于腦電信號分類研究。作為分類技術中最簡單的方法之一,k最近鄰(k-nearest neighbor,KNN)法根據特征空間中接近訓練示例的對象進行分類,適用于類域的交叉或重疊較多的待分樣本集。Ghassemi等[15]將KNN用于多動癥兒童和正常兒童的腦電信號分類取得了較好結果。Cao等[16]發現多動癥兒童和正常兒童的潛伏期(200~450 ms)腦電信號差異并不十分明顯。因此,猜想多動癥兒童和正常兒童的腦電信號存在交叉或重疊,可嘗試KNN算法研究分類。Poil等[17]研究了不同年齡階段多動癥患者靜息態腦電信號特征,發現支持向量機(support vector machine,SVM)可對多動癥成人和正常成人分類,但不能區分多動癥兒童和正常兒童。因此,本文嘗試研究基于徑向基核函數的SVM是否能成功對干擾控制任務下的多動癥兒童和正常兒童腦電信號進行分類,并與KNN進行對比研究。
本文基于一種經典的干擾控制試驗任務Simon-spatial Stroop范例,對多動癥和正常兒童的腦電信號進行了研究,首先采用PCA方法對預處理后的腦電信號進行了電極優化選擇,然后根據不同刺激模式從所有受試的優化電極中選取出現率90%以上的電極作為共有電極,并提取共有電極潛伏期(200~450 ms)波幅的均值特征,最后用KNN和SVM分類器分類,嘗試檢測多動癥兒童與正常兒童的腦電信號,并研究其差異性以輔助多動癥兒童的臨床個體化診斷。
1 方法
1.1 受試信息
14名多動癥兒童,年齡8~11.4歲,平均年齡8.2歲,其中包括4名女孩,10名男孩,均來自蘇州大學第三附屬醫院;16名正常兒童,年齡7.3~10.1歲,平均年齡8.8歲,其中包括10名女孩,6名男孩,均來自周邊小學。多動癥兒童均根據心理疾病的標準診斷和統計手冊經過門診專業診斷評估。根據瑞文推理測驗和韋氏智力量表中國兒童修訂版進行測試,所有受試的IQ≥80,無顱腦損傷、癲癇或其他精神疾病。所有受試視力或矯正視力正常,左右手能正常活動。
1.2 試驗范例
本試驗選取了經典的干擾控制任務Simon-spatial Stroop范例[16]。試驗環境安靜舒適,受試頭戴電極帽坐在正對17英寸顯示屏80 cm處的舒適椅上,水平和垂直視力翻轉角均小于3。在詳細的指導下,受試需要根據試驗圖片快速地做出準確、穩定的按鍵反應,并盡量減少眨眼次數。試驗分三個階段,前兩個階段為試驗訓練階段,第三個階段為正式試驗階段。試驗刺激為3.5 cm×4.5 cm的白色向上或向下箭頭。第一個訓練階段由15個向上箭頭和15個向下的箭頭組成。當向上的箭頭出現時,要求受試用左手食指點擊反應盒左鍵;當向下的箭頭出現時,要求受試用右手食指點擊反應盒右鍵。第二個訓練階段包含32個試驗,箭頭隨機地出現在中心十字的左、右、上、下四個方向,構成四種不同的刺激模式:SmC-箭頭的位置與反應按鍵相一致(如:向上的箭頭位于中心十字的左側,用左手食指點擊左鍵;或向下的箭頭位于中心十字的右側,用右手食指點擊右鍵);SmI-箭頭的位置與反應按鍵相反(如:向上的箭頭位于中心十字的右側,用左手食指點擊左鍵;或向下的箭頭位于中心十字的左側,用右手食指點擊右鍵);StC-箭頭的位置與方向一致(如:向上的箭頭位于中心十字的上側);StI-箭頭的位置與方向不一致(如:向上的箭頭位于中心十字的下側)。正式試驗由288個試驗組成,分兩個塊呈現,每個塊包括144個試驗,SmC、SmI、StC和StI四種刺激模式等概率隨機呈現,每個刺激呈現時間為1 000 ms,每次刺激之間的時間間隔從2 000、2 500、3 000或3 500 ms四個時段隨機選取。第一個塊呈現結束,受試可休息2 min。
1.3 腦電信號采集和預處理
實驗設備為美國EGI公司生產的128導腦電信號采集系統,參考電極為平均參考,采集軟件為Net Station,采樣頻率500 Hz,每個電極阻抗降至100 kΩ以下。腦電信號預處理使用EGI 4.5.6版的Net Station軟件,數據重濾波范圍是0.3~30 Hz,分段(-200~1 000 ms),基線校準(-200~0 ms)。通過窗口移動算法排除實驗中噪聲較多的導聯和試驗、按鍵不正確的試驗、反應時間超出設定時間200~1 500 ms的試驗,及眼動、眨眼或壞通道數量過多(> 10)的試驗。
1.4 PCA算法
PCA方法考慮了鎖定分段時間窗內所有觀測信號的變化關系,可去掉腦電信號中的冗余信息[10]。針對預處理后的腦電數據通過PCA方法研究分段時間窗內各導聯腦電信號的變化關系從而確定主成分分量,可選取顯著信號成分對應的優化電極,實現數據降維[14]。為了不丟失信號的有效成分,本文選取了累積方差貢獻率99%的優化電極,其余均被當成噪聲成分。
1.5 分類器
1.5.1 KNN分類器
基于歐氏距離的KNN方法計算簡單,根據特征空間中接近訓練示例的對象進行分類[15]。提取多動癥組和正常組兒童的共有電極潛伏期(200~450 ms)振幅的均值特征后,本文選用KNN分類器通過計算測試樣本與訓練樣本的歐氏距離,根據同種刺激任務下單次試驗逐一投票的方法判定測試樣本所屬類別。
1.5.2 SVM分類器
本研究選用SVM作為第二個分類器,嘗試對干擾控制任務下多動癥兒童和正常兒童的腦電信號分類。SVM是采用監督式的學習方法,其主要思想是將輸入向量映射到高維的特征向量空間,并在該特征空間中構造最優分類面[18]。在分類研究過程中,為了建立分類器模型,本文隨機選擇70%的特征樣本作為訓練樣本,剩下樣本用來測試。為了測試分類器的穩定性,本文嘗試了多次運算。其具體步驟如下。
步驟一:給出兩組受試的腦電信號特征作為輸入樣本X以及與之對應的期望輸出類別Y。其表達式如下:
$ \boldsymbol{X}=\left[ {{x_1}\; \;{x_2}\; \; \cdots \; {x_N}} \right] $ |
$ \boldsymbol{Y}=\left[ {{y_1}\; \;{y_2}\; \; \cdots \; {y_N}} \right]\; \;\; \;{y_i} \in \left\{ { + 1, -1} \right\} $ |
xi(i=1, 2, …, N)為提取的腦電信號特征向量,其中+1表示正常兒童,-1代表多動癥兒童。
步驟二:為使分類面盡可能對所有信號樣本正確分類并具備分類間隔,需在約束條件c=0和ai≥0 (i=1, 2, …, N)下,求得分類面的最大差值d,從而得到最優解ai*。為了解決該約束最優化問題,可引入Lagrange函數進行約束優化[18]。約束條件和分類面的最大差值表達式如下:
$ c=\sum\limits_{i=1}^N {{y_i} \cdot {a_i}} $ |
$ d=\sum\limits_{i=1}^N {{a_i}}-\frac{1}{2}\sum\limits_{i, j=1}^N {{a_i} \cdot {a_j}} \cdot {y_i} \cdot {y_j} \cdot \left({{x_i} \cdot {x_j}} \right) $ |
步驟三:根據特定的支持向量xN計算出信號的最優權值向量w*和最優偏執向量b*:
$ {\boldsymbol{w}^*}=\sum\limits_{i=1}^N {{a_i}} \cdot {y_i} \cdot {x_i} $ |
$ {\boldsymbol{b}^*}=\frac{1}{{{y_N}}}-{\boldsymbol{w}^*} \cdot {x_N} $ |
步驟四:本文選擇徑向基核函數K(xi, xj),通過計算求得分類函數f(x)的值,計算式如下:
$ \begin{array}{*{20}{c}} {f\left(x \right)={\mathop{\rm sgn}} \left({\sum\limits_{i=1}^N {{a_i}^*} \cdot {y_i} \cdot K \cdot \left({{x_i}, x} \right) + {b^*}} \right) \cdot \sum\limits_{i, j=1}^N {{a_i} \cdot {a_j}} }\ { \cdot {y_i} \cdot {y_j} \cdot \left({{x_i} \cdot {x_j}} \right)} \end{array} $ |
根據f(x)的值為+1或-1,判斷出測試信號樣本所屬類別,與期望輸出類別進行對比,即可求出分類準確率。
2 結果
2.1 行為測試結果
多動癥兒童和正常兒童的行為數據結果如表 1所示,與不協調的試驗任務相比,在協調一致的任務中所有受試均表現出更高的反應正確率和更短的反應時間;在同種任務中多動癥兒童比正常兒童表現出更高的出錯率和更長的反應時間,且多動癥兒童的穩定性更差。

2.2 電極選擇結果
每個受試預處理后的腦電信號為128導,經PCA方法選擇累計方差貢獻率99%的主成分后,排除了75%左右的導聯,減少了電極個數,提高了數據分析的效率。根據不同刺激模式,從所有受試的優化電極中選取出現率90%以上的電極作為共有電極,選取的共有優化電極如表 2所示。

四種刺激模式下的共有電極均位于前額葉腦區和頂枕葉腦區,隨著出現率的提高共有電極個數會減少。為了研究不同出現率的共有電極對分類結果的影響,根據潛伏期(200~450 ms)振幅均值特征,本文采用KNN分類器進行了分類。如表 2所示,根據SmI和StI刺激任務所選的共有電極進行分類時,分類正確率相對較高,該兩種刺激模式下多動癥兒童和正常兒童的前額葉腦區和頂枕葉腦區的腦電信號表現出更明顯的差異。
為了進一步研究兩組受試前額葉和頂枕葉腦區的事件相關電位,分別對四種刺激模式下優化電極出現率100%的共有電極的腦電信號進行了組內疊加平均。四種刺激模式下兩組受試分別疊加平均后的腦電信號時域波形圖如圖 1所示,可見在四種刺激任務下多動癥兒童和正常兒童的前額葉腦區均有N2(200~450 ms),而在頂枕區均有P2出現;在同種任務中多動癥兒童的N2和P2振幅峰值比正常兒童低,但其差異顯著性有待進一步研究。

2.3 分類結果
由于不同的刺激模式下不同共有電極的分類準確率不同,當選用StI刺激模式優化電極出現率96%的頂枕葉電極進行分類時分類準確率達到最高。因此對SmI和StI兩種刺激模式出現率96%以上的共有電極潛伏期振幅均值特征,本文采用了SVM分類器與KNN分類器分類對比,結果如表 3所示。

如表 3所示,兩種刺激模式下KNN分類器的分類準確率高于SVM;當選用頂枕葉共有電極進行分類時分類準確率較高,StI刺激模式下KNN分類器的分類準確率最高可達89.29%,而SVM最高分類準確率只有60.50%。
3 討論
本文嘗試采用腦電信號檢測方法輔助多動癥兒童臨床個體化診斷。前人報道了多動癥受損的干擾控制能力[6, 8]。因此,本文基于干擾控制任務Simon-spatial Stroop試驗范例,采集了30名受試的腦電信號,針對預處理后的腦電數據,首先采用PCA方法篩選了優化電極(累計貢獻率≥99%),減少了分析數據的維度,提高了運算效率。研究發現主成分相關電極主要位于前額葉和頂枕葉腦區。四種刺激模式下,多動癥兒童與正常兒童前額葉均有N2(200~450 ms),頂枕葉均有P2,且同種刺激模式下兩組受試的N2和P2峰值表現出差異性。在研究優化電極出現率的過程中,由于數據集的限制,90%是設定的閾值下限,若閾值小于90%會篩選出更多電極,使得篩選出的這些電極中有部分電極并不屬于某些受試的優化電極,從而無法體現分段時間窗內不同電極貢獻率高低的差異性。若受試數量較多,可研究分段時間窗內不同累積貢獻率所選電極分類結果。
在特征提取方面,本文主要研究腦電信號潛伏期時域特性,結合了兩組受試在行為測試中的反應差異,在前人研究報道基礎上[16],根據兩組受試在干擾控制試驗任務中表現出的N2和P2潛伏期特征嘗試了試驗篩選,有效地排除了受試做出正確按鍵反應但不滿足該特征的試驗數據,一定程度上減少了數據運算量。后期的研究可從干擾控制任務組合和特征組合方面展開,也可結合頻域特征或其他非線性特征研究多動癥兒童和正常兒童的腦電信號差異性。如表 2所示,針對SmI和StI兩種試驗任務運用SVM分類器和KNN分類器分類對比,KNN取得了較好的結果,在后期的研究中可從優化權重的投票方法深入。基于徑向基核函數的SVM分類器分類準確率較低,與Poila等[17]的研究結果一致,但穩定性較好,不失為后期深入研究的基礎。
總之,本文研究了干擾控制任務中多動癥兒童和正常兒童腦電信號,通過PCA方法實現了腦電信號降維,并運用KNN和SVM分類器進行了分類對比,KNN取得的最高的分類準確率為89.29%。研究初步認為,干擾控制試驗中多動癥兒童與正常兒童的前額葉及頂枕葉腦電信號存在差異,為多動癥兒童臨床個體化診斷和腦神經缺陷機制基礎研究提供了一定的科學依據。