針對運動想象腦電信號因受試者個體差異導致辨識精度低的問題,本文提出了基于個體自適應的運動想象腦電信號特征表征方法。首先從個體差異和頻帶信號特點出發,提出了基于拓展式相關特征(ReliefF)的自適應通道選擇方法;通過提取各頻帶信號5個時頻域觀察特征,運用ReliefF算法對各頻帶信號通道進行有效性評估,進而實現各頻帶信號通道選擇。其次提出了基于快速相關濾波算法(FCBF)的共空間模式(CSP)特征表征方法(CSP-FCBF);通過CSP提取腦電信號特征,運用FCBF進行特征優化得到最優特征集,從而實現運動想象腦電信號狀態有效表征。最后使用支持向量機(SVM)作為分類器進行分類辨識。實驗分析結果表明,本文所提方法能有效實現運動想象腦電信號狀態表征,四類狀態平均辨識精度達到了(83.0±5.5)%,較傳統的CSP特征表征方法提高6.6%。本文在運動想象腦電信號特征表征方面取得的研究成果,為實現自適應的腦電信號解碼及其應用奠定了基礎。
引用本文: 潘禮正, 丁憶, 王順超, 宋愛國. 基于個體自適應的運動想象腦電信號特征表征研究. 生物醫學工程學雜志, 2022, 39(6): 1173-1180, 1188. doi: 10.7507/1001-5515.202112023 復制
引言
腦-機接口(brain-computer interface,BCI)技術是人類與計算機之間的一道通信橋梁,運動失能患者可以通過該交互方式與外界設備(輪椅等)建立連接,從而實現行動自主化[1-2]。當前BCI系統中廣泛使用的運動腦電(electroencephalogram,EEG)信號模式有誘發式和自發式,其中誘發式有穩態視覺誘發電位(steady-state visually evoked potential,SSVEP)和事件相關誘發電位[3],自發式主要有運動想象[4]。相比較誘發式運動EEG信號模式,自發式的運動想象EEG信號無需外界刺激信號激發,更切合實際應用,受到了較高關注。科學研究表明,當人們在真實運動或想象運動時,大腦皮層相關的運動感知區域在α(8~12 Hz)節律和β (16~28 Hz)節律上會出現事件相關去同步化(event related desynchronization,ERD)現象和事件相關同步化(event related synchronization,ERS)現象[5],根據這一現象,可以通過想象身體不同部位的運動,利用產生的EEG信號來實現“腦控”。近年來研究者們提出了大量關于運動想象EEG信號的相關辨識方法,包括基于時域、頻域、時頻域和空域等方面的特征提取算法以及各種用于辨識的分類器[6-7]。由于EEG信號較復雜,且目前解碼理論和方法還處于探索階段,因此針對個體的差異性,探索具有自適應性能的辨識方法,具有非常重要的實際意義。
特征表征是運動想象EEG信號辨識研究的重要工作之一,其核心工作就是相關EEG信號通道、頻段的選擇和特征選擇及優化。許多研究者針對運動想象EEG信號特征表征開展了相關研究。Das等[8]通過有效值和Z值的選擇方法,挑選出區分度較高的通道,實現通道選擇。Qi等[9]根據不同受試者的特點提出基于時空濾波的通道選擇方法,利用EEG信號的時空信息,挑選出不同個體的最佳通道集,一定程度上減小了個體之間的差異性。Park等[10]在頻段劃分的基礎上,利用共空間模式(common space pattern,CSP)獲得差異最大化的空間特征,并引入時域特征和相關系數來進行CSP濾波器組的選擇,彌補了CSP在單一頻段上的缺陷。付榮榮等[11]在使用稀疏CSP對EEG信號進行特征提取后,通過費雪(Fisher)線性判別分析對提取的特征進行優化和分類,實現運動想象EEG信號最佳判別分析。駱金晨等[12]通過提取時頻-空域-非線性動力學的初始特征向量,用主成分分析方法進行特征優化,剔除了對分類貢獻較小的特征,取得了較好的辨識效果。郜東瑞等[13]通過提取時域、頻域和空域特征,使用粒子群優化算法進行特征選擇優化,最后利用3種分類器構成集成分類器對運動想象EEG信號實現辨識。
由于不同個體在運動想象時,ERD/ERS現象較為明顯的通道往往不盡相同,即使是同一個體其最佳通道和最佳頻段也受自身內外在因素的影響而變化,導致最終特征差異性較大,從而影響分類辨識精度[14]。目前在運動想象EEG信號辨識研究中,研究者們在信號通道和頻段選擇以及特征優化方法相關參數選擇方面,未能充分考慮個體的差異性。
針對不同受試者個體差異性,為提高運動想象EEG信號特征的表征性,本文提出了基于個體自適應的運動想象EEG信號特征表征方法。首先從信號通道選擇角度出發,提出了基于拓展式相關特征(expansive relevant features with label F,ReliefF)的個體自適應通道選擇方法,確定個體不同頻段EEG數據信息的最佳通道,進而有效地實現信息優化。其次從特征選擇角度,利用多頻帶的CSP可以獲得更大特征空間的優勢,提出了基于快速相關濾波算法(fast correlation-based filter,FCBF)的CSP特征表征方法(CSP-FCBF),對特征進行優化,進而實現運動想象EEG信號的有效表征。最后采用支持向量機(support vector machine,SVM)進行四類運動想象EEG信號分類辨識。本文所提方法充分考慮了個體的差異性,因而期望可以實現具有個體自適應的運動想象EEG信號特征的表征。
1 運動想象EEG數據介紹
本文實驗使用的運動想象EEG數據來自美國紐約州衛生署中心組織構建的公開數據庫中的運動想象EEG數據庫(網址為:

2 方法
2.1 數據預處理
本文試驗數據每次運動想象時間為4 s,運動想象時間段有640個采樣數據點,需對每次運動想象數據進行預處理及樣本劃分。首先通過小波去噪、共平均參考、基線校正等進行數據前期預處理;再使用6階巴特沃斯濾波器對預處理后的EEG信號進行8~32 Hz的帶通濾波,并將其劃分為6個子頻帶:頻帶A1(8~12 Hz)、頻帶A2(12~16 Hz)、頻帶A3(16~20 Hz)、頻帶A4(20~24 Hz)、頻帶A5(24~28 Hz)和頻帶A6(28~32 Hz);最后采用窗口長度為160個數據點并以50%重疊滑窗的方法,對每一個子頻帶數據進行樣本劃分。因此,每位受試者的每個頻帶得到630個樣本數據,其高維數據形式為160×64×630 (數據點×通道×樣本)。
2.2 基于ReliefF的自適應通道選擇
眾所周知,針對運動想象EEG信號的辨識研究大多主要依據運動想象時發生的ERD/ERS現象,然而ERD/ERS現象一般出現在大腦運動感知區域,由于EEG信號為微弱的非平穩信號,不少通道所采集的運動想象EEG信號信噪比低,影響后續特征提取以及辨識精度,因此如何選擇有效信息通道具有非常重要的意義。目前在運動想象EEG信號通道選擇方面,通常采用全通道或固定通道的方式[20-21],具有一定的局限性。考慮到不同頻帶信號的特點以及個體的差異性,本文提出了基于ReliefF的自適應通道選擇方法,通過評估觀察特征量的分布情況來自適應地選擇各頻帶有效通道,從而實現信息優化;避免了常規全通道和固定通道處理方法導致數據量大、噪聲多、普適性差等缺點。
相關特征(relevant features,Relief)算法最初被提出用于解決二分類問題的特征權重問題。為了能處理多類問題,有研究者對其進行了拓展,提出了ReliefF算法[22-23]。ReliefF算法在處理多類問題時,每次從訓練樣本集中隨機取出一個樣本R,然后從和R同類的樣本集中找出R的k個近鄰樣本,從每個R的不同類的樣本集中均找出k個近鄰樣本,然后更新每個特征的權重,重復抽取m次,其單次權重迭代如式(1)所示:
![]() |
其中,為第
個樣本中第
個特征
的權重;
為與
同類的
個最近鄰樣本中的第
個樣本;
為在訓練樣本中屬于類別
的樣本所占比值;
為與
同類的樣本占總樣本的比值,其中
為樣本
的標簽;
為與
不同類的
個最近鄰樣本中的第
個樣本。函數
表示樣本
和樣本
在特征
上的差,其計算方法如式(2)所示:
![]() |
基于ReliefF的通道選擇方法如圖2所示,主要步驟如下:

步驟1:針對每一個子頻帶(A1、A2、A3、A4、A5和A6),提取每個樣本64通道的5個時頻域觀察特征:即頻帶能量(band energy,BE)、功率(power)、功率譜密度(power spectral density,PSD)、瞬時能量(instantaneous energy,IE)和小波包變換(wavelet packet transform,WPT),初步得到每個頻帶樣本的320維特征。
步驟2:對每一位受試者不同子頻帶下的所有特征,利用ReliefF算法計算各特征的權重,并對所有特征的權重進行由大到小排序。
步驟3:挑選出各子頻帶權重前70%的特征,觀察其所處通道的分布,當通道分布觀察特征數大于等于3時,該通道即為此子頻帶信息活躍通道,該通道保留;從而完成各子頻帶通道的刪選。
2.3 基于CSP-FCBF的運動想象EEG信號特征表征
CSP由于可以得到運動想象空間信息分布情況而被廣泛應用[24]。其主要通過尋求空間濾波器,以最大化兩個類別之間的差異來達到區分效果;使用求得的空間濾波器
對測試樣本信號
進行空間濾波,得到濾波后的信號
,并對其通過求取協方差對數得到對應的CSP特征向量
,其計算過程如式(3)和式(4)所示:
![]() |
![]() |
其中,為空間濾波后信號
的第
行信號,
為CSP空間濾波器的特征參數,var(?)為方差運算符,ln(?)為對數運算符。
根據CSP算法可知,的選取影響所構建空間濾波器的效果。
越大,保留的空間特征信息越多,同時特征維度過大,冗余信息越多,易影響分類精度和分類時耗;
越小,空間特征信息損失越多[25]。本文考慮到多頻帶CSP特征提取時可能存在特征維度過大,特征優劣性不確定的情況,結合其他研究者的相關分析[26],通過實驗綜合考慮最終確定每個CSP的
。通過CSP提取運動想象EEG信號特征后,為避免一些冗余特征和特征噪聲的影響,采用FCBF對特征進行優化,篩選出較優特征集,從而通過CSP-FCBF方法實現對運動想象EEG信號的有效表征。
FCBF是一種快速過濾的特征選擇算法,它的主要思想是通過使用對稱不確定性(symmetric uncertainty,SU)取代信息增益性(information gain,IG)來衡量一個特征是否與某一類別標簽相關或者冗余。由于FCBF對信息進行了歸一化處理,補償了IG在選取特征上的偏差,因而在進行特征相關性比較時,采用SU比采用IG更為客觀,其流程主要包括兩個步驟:
步驟1:刪選不相關特征。找到一個和分類相關的特征子集Slist,計算每個特征
與分類
之間的
值
,并按照降序排列;當
(
為設定的閾值),則認為特征是相關特征,將其組成新的相關特征子集Snew。
步驟2:去除冗余特征。選擇值最大的特征
(Snew中的第一個特征)作為主特征;然后在Snew中依次選擇
小于主特征的特征,分別比較該特征與主特征的
和該特征與分類
的
,剔除
的冗余特征,重復此步驟直至結束。
由此可見,要想獲得優質的特征表征子集,首先需要確定閾值。然而,過大閾值將會刪除過多有用的特征,影響表征效果;過小的閾值將不能有效刪除冗余特征。考慮到
的選擇和每個特征
與分類
之間的
值
相關,因此本文采用均值法對閾值
進行確定,其公式如式(5)所示:
![]() |
其中,為特征維度,
為
與分類
之間的
值。
2.4 SVM分類器
各分類器由于分類原理不同,其特點不同,適用的場合也不盡相同。在眾多分類器中,SVM因其在小樣本分類問題中具有較強的適應性、較高的訓練速度、良好的泛化能力而應用廣泛[27]。SVM基于結構風險最小化原理,克服了傳統機器學習中的維數災難問題,其基本目標是在維的數據特征空間中找到一個最優超平面,最終通過求解點到該最優超平面的距離來實現分類,其分類決策函數如式(6)所示:
![]() |
其中,sgn(?)表示符號函數,表示
的最優解,
表示分類的閾值,
表示核函數,
表示分類函數,
表示第
個樣本,
表示第
個樣本的結果標簽,其中分類樣本
的所屬類別根據分類函數的正負判斷。
SVM分類方法通常也稱為核分類方法,通過核函數引入可以將低維特征空間中的非線性問題轉化為高維特征空間中的線性問題。目前,常用的核函數有線性核函數、多項式核函數和徑向基核函數等。根據先驗經驗,當樣本量一般,特征維度不大時,通常選擇徑向基核函數可以得到優于其他核函數的分類效果。因此,本文采用徑向基核函數的SVM作為運動想象EEG信號辨識分類器。
通過本文所提基于ReliefF的自適應通道選擇方法和基于CSP-FCBF的特征表征方法,所構建的運動想象EEG信號辨識方法原理框圖如圖3所示。通過所提基于ReliefF的自適應通道選擇方法,根據各個體特點及頻帶信號特點實現各子頻帶最優通道的選擇,有效避免非顯性通道噪聲的干擾。通過所提基于CSP-FCBF的特征表征方法,對運動想象EEG信號進行特征提取及優化,進而實現運動想象EEG信號的有效表征,最后通過SVM分類器實現四類運動想象EEG信號的辨識。

3 實驗結果及分析
為了提高運動想象EEG信號的辨識精度,從個體差異性角度出發,本文提出了基于個體自適應的運動想象EEG信號特征表征方法,通過基于ReliefF的自適應通道選擇方法實現各子頻帶最優通道選擇,通過CSP-FCBF方法實現運動想象EEG信號的有效特征表征。為驗證本文所提方法效果,從多角度開展實驗分析研究,展現所提方法的性能。
為確保實驗的客觀性和合理性,本文連續選擇數據庫前10位受試者進行分析驗證,將原始的EEG信號數據集按照7:3劃分為訓練集和測試集,在量化分析時每類實驗重復5次以減小偶然性造成的影響,以5次平均值作為實驗結果。針對四類運動想象分類識別,采用一對一CSP模式,共構建6個空間濾波器,并按照CSP-FCBF方法進行特征提取及優化,最后采用SVM分類器進行分類識別。
3.1 通道選擇性能分析
根據本文所提基于ReliefF的自適應通道選擇方法,前10位受試者(編號:S001~ S010)不同頻帶挑選出來的通道個數如表1所示。從表1中可以看出,采用本文所提方法,每位受試者各頻帶所挑選的通道數大多約為40個,所選通道會因個體特點和頻帶信號特點存在差異。

為便于具體觀察各頻帶通道的分布情況,如圖4所示,具體展示了編號S002受試者A1~A6各頻帶通道挑選情況。從圖4中可以明顯看出,經過挑選的各頻帶通道,主要集中在主感覺運動區域周圍,由于頻帶信號特點的不同,不同頻帶的顯性通道分布存在一定的差異,很好地體現了通道選擇的自適應性。為了進一步分析通道選擇方法的效果,以CSP提取特征,SVM作為分類器,分別分析了全通道和所提通道選擇方法的性能差異,具體如表2所示。從表2通道挑選前后辨識精度對比可以看出,除受試者S004和S010在通道減少后辨識精度略微有所下降以外(分別略降0.3%和0.2%),其余每一位受試者的辨識精度皆有所提升,如受試者S006,經過通道挑選后精度提升了10.4%。總的來看,采用自適應通道選擇方法后平均辨識精度為(78.9±6.8)%,較全通道方法提升了2.5%。可以看出,并非信息通道越多效果越好,非顯性通道信息通常會成為噪聲,從而影響辨識效果。根據個體和信號頻帶特點進行顯性信息通道選擇,可以有效提高數據處理效率,且有助于提升運動想象EEG信號的辨識效果。


3.2 特征優化性能分析
為了有效表征運動想象EEG信號,本文提出了基于CSP-FCBF的特征表征方法,通過CSP提取相關特征,運用FCBF算法進行特征優化,從而實現有效表征。在特征優化FCBF算法中,通過均值法來確定閾值,為驗證閾值的有效性,研究了不同閾值選取對特征維度及分類辨識精度的影響。
首先,根據FCBF算法流程,計算各頻帶每個特征與類別
之間的SU值
,并根據
的值進行降序排列。然后分別根據每個特征與類別標簽
值變化范圍的
來選取不同閾值,觀察其特征篩選后剩余特征維度及相關辨識精度,其閾值選取公式如式(7)所示:
![]() |
其中,λ = 10~90,δ為閾值。
以S002受試者為例,根據所提方法進行通道選擇,然后通過CSP提取相關特征,通過選取不同對應的閾值運用FCBF進行特征優化(
),以SVM為分類器進行分類辨識,具體結果如表3所示。從表3可以看出,隨著
值增大(
減小),經過FCBF算法后剩余的特征維度逐漸增加,辨識精度也逐漸上升隨后下降。理論上會存在一個最優
值,此時特征維度適中,辨識精度最高。根據本文的均值法確定閾值后(對應
),特征維度為43,辨識精度為84.1%,表明均值法所選取的閾值較恰當。
在30~60不同值時,結果如圖5所示。從圖5中可以看出,均值法所確定的閾值(對應
)能夠實現較高的辨識精度。


為了更全面地驗證本文所提方法的具體效果,如表4所示,給出了10位受試者在CSP、ReliefF-CSP及ReliefF-CSP-FCBF三種方法下的具體分類辨識精度。從個體來看,采用ReliefF-CSP-FCBF方法所有個體的辨識精度皆有提升,與傳統的CSP方法相比前后精度提升最高和最低量分別為17.7%(S006)和1.8%(S001),單個個體最高辨識精度達到了89.3%(S003)。整體來看,通過引入基于ReliefF的通道選擇方法后,平均辨識精度提高了2.5%;通過綜合采用本文所提的ReliefF-CSP-FCBF方法,平均辨識精度達到了(83.0±5.5)%,提高了6.6%。

此外,利用本文所提方法進行了左右手二分類實驗研究,辨識精度為91.39%。將本文工作與文獻[28-30]報道的基于相同數據庫所開展的工作進行了比較,如表5所示。文獻[28]采用WPT和深度神經網絡(deep neural network,DNN)分別實現兩類運動想象EEG信號的特征提取和辨識分類。文獻[29]運用基于顯性不相關復合變換的CSP(strong uncorrelating transform complex CSP,SUT-CSP)進行特征提取并以隨機森林(random forest,RF)作為分類器進行分類辨識。文獻[30]利用卷積神經網絡(convolutional neural network,CNN)來實現兩類運動想象EEG信號的辨識。研究者探索的方法各不相同,從比較結果來看,相較于其它3種研究方案,本文方法取得了更好的運動想象EEG信號辨識效果,從而進一步證明了所提方法的優勢和有效性。

4 結論
為提高運動想象EEG信號辨識精度,從個體差異性角度考慮出發,提出了基于個體自適應的運動想象EEG信號表征方法。通過基于ReliefF的自適應頻帶通道選擇方法,根據不同個體和頻帶信號的特點有效選擇顯性信息通道,避免了全通道信息處理數據量大、噪聲多、普適性弱等缺點。通過CSP-FCBF方法對運動想象EEG信號進行特征提取及優化,進而實現運動想象EEG信號狀態的有效表征。通過大量實驗比較分析,充分表明了本文所提基于個體自適應的運動想象EEG信號表征方法的有效性。最終,運用本文所提方法四分類中單個個體最高辨識精度達到了89.3%,10位受試者平均辨識精度為(83.0±5.5)%。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻說明:作者潘禮正和丁憶參與論文選題、實驗設計、相關算法實現及論文寫作;作者王順超參與實驗數據整理及實驗結果分析統計;作者宋愛國參與實驗設計及論文修改。所有作者都閱讀并確認了最終稿件。
引言
腦-機接口(brain-computer interface,BCI)技術是人類與計算機之間的一道通信橋梁,運動失能患者可以通過該交互方式與外界設備(輪椅等)建立連接,從而實現行動自主化[1-2]。當前BCI系統中廣泛使用的運動腦電(electroencephalogram,EEG)信號模式有誘發式和自發式,其中誘發式有穩態視覺誘發電位(steady-state visually evoked potential,SSVEP)和事件相關誘發電位[3],自發式主要有運動想象[4]。相比較誘發式運動EEG信號模式,自發式的運動想象EEG信號無需外界刺激信號激發,更切合實際應用,受到了較高關注。科學研究表明,當人們在真實運動或想象運動時,大腦皮層相關的運動感知區域在α(8~12 Hz)節律和β (16~28 Hz)節律上會出現事件相關去同步化(event related desynchronization,ERD)現象和事件相關同步化(event related synchronization,ERS)現象[5],根據這一現象,可以通過想象身體不同部位的運動,利用產生的EEG信號來實現“腦控”。近年來研究者們提出了大量關于運動想象EEG信號的相關辨識方法,包括基于時域、頻域、時頻域和空域等方面的特征提取算法以及各種用于辨識的分類器[6-7]。由于EEG信號較復雜,且目前解碼理論和方法還處于探索階段,因此針對個體的差異性,探索具有自適應性能的辨識方法,具有非常重要的實際意義。
特征表征是運動想象EEG信號辨識研究的重要工作之一,其核心工作就是相關EEG信號通道、頻段的選擇和特征選擇及優化。許多研究者針對運動想象EEG信號特征表征開展了相關研究。Das等[8]通過有效值和Z值的選擇方法,挑選出區分度較高的通道,實現通道選擇。Qi等[9]根據不同受試者的特點提出基于時空濾波的通道選擇方法,利用EEG信號的時空信息,挑選出不同個體的最佳通道集,一定程度上減小了個體之間的差異性。Park等[10]在頻段劃分的基礎上,利用共空間模式(common space pattern,CSP)獲得差異最大化的空間特征,并引入時域特征和相關系數來進行CSP濾波器組的選擇,彌補了CSP在單一頻段上的缺陷。付榮榮等[11]在使用稀疏CSP對EEG信號進行特征提取后,通過費雪(Fisher)線性判別分析對提取的特征進行優化和分類,實現運動想象EEG信號最佳判別分析。駱金晨等[12]通過提取時頻-空域-非線性動力學的初始特征向量,用主成分分析方法進行特征優化,剔除了對分類貢獻較小的特征,取得了較好的辨識效果。郜東瑞等[13]通過提取時域、頻域和空域特征,使用粒子群優化算法進行特征選擇優化,最后利用3種分類器構成集成分類器對運動想象EEG信號實現辨識。
由于不同個體在運動想象時,ERD/ERS現象較為明顯的通道往往不盡相同,即使是同一個體其最佳通道和最佳頻段也受自身內外在因素的影響而變化,導致最終特征差異性較大,從而影響分類辨識精度[14]。目前在運動想象EEG信號辨識研究中,研究者們在信號通道和頻段選擇以及特征優化方法相關參數選擇方面,未能充分考慮個體的差異性。
針對不同受試者個體差異性,為提高運動想象EEG信號特征的表征性,本文提出了基于個體自適應的運動想象EEG信號特征表征方法。首先從信號通道選擇角度出發,提出了基于拓展式相關特征(expansive relevant features with label F,ReliefF)的個體自適應通道選擇方法,確定個體不同頻段EEG數據信息的最佳通道,進而有效地實現信息優化。其次從特征選擇角度,利用多頻帶的CSP可以獲得更大特征空間的優勢,提出了基于快速相關濾波算法(fast correlation-based filter,FCBF)的CSP特征表征方法(CSP-FCBF),對特征進行優化,進而實現運動想象EEG信號的有效表征。最后采用支持向量機(support vector machine,SVM)進行四類運動想象EEG信號分類辨識。本文所提方法充分考慮了個體的差異性,因而期望可以實現具有個體自適應的運動想象EEG信號特征的表征。
1 運動想象EEG數據介紹
本文實驗使用的運動想象EEG數據來自美國紐約州衛生署中心組織構建的公開數據庫中的運動想象EEG數據庫(網址為:

2 方法
2.1 數據預處理
本文試驗數據每次運動想象時間為4 s,運動想象時間段有640個采樣數據點,需對每次運動想象數據進行預處理及樣本劃分。首先通過小波去噪、共平均參考、基線校正等進行數據前期預處理;再使用6階巴特沃斯濾波器對預處理后的EEG信號進行8~32 Hz的帶通濾波,并將其劃分為6個子頻帶:頻帶A1(8~12 Hz)、頻帶A2(12~16 Hz)、頻帶A3(16~20 Hz)、頻帶A4(20~24 Hz)、頻帶A5(24~28 Hz)和頻帶A6(28~32 Hz);最后采用窗口長度為160個數據點并以50%重疊滑窗的方法,對每一個子頻帶數據進行樣本劃分。因此,每位受試者的每個頻帶得到630個樣本數據,其高維數據形式為160×64×630 (數據點×通道×樣本)。
2.2 基于ReliefF的自適應通道選擇
眾所周知,針對運動想象EEG信號的辨識研究大多主要依據運動想象時發生的ERD/ERS現象,然而ERD/ERS現象一般出現在大腦運動感知區域,由于EEG信號為微弱的非平穩信號,不少通道所采集的運動想象EEG信號信噪比低,影響后續特征提取以及辨識精度,因此如何選擇有效信息通道具有非常重要的意義。目前在運動想象EEG信號通道選擇方面,通常采用全通道或固定通道的方式[20-21],具有一定的局限性。考慮到不同頻帶信號的特點以及個體的差異性,本文提出了基于ReliefF的自適應通道選擇方法,通過評估觀察特征量的分布情況來自適應地選擇各頻帶有效通道,從而實現信息優化;避免了常規全通道和固定通道處理方法導致數據量大、噪聲多、普適性差等缺點。
相關特征(relevant features,Relief)算法最初被提出用于解決二分類問題的特征權重問題。為了能處理多類問題,有研究者對其進行了拓展,提出了ReliefF算法[22-23]。ReliefF算法在處理多類問題時,每次從訓練樣本集中隨機取出一個樣本R,然后從和R同類的樣本集中找出R的k個近鄰樣本,從每個R的不同類的樣本集中均找出k個近鄰樣本,然后更新每個特征的權重,重復抽取m次,其單次權重迭代如式(1)所示:
![]() |
其中,為第
個樣本中第
個特征
的權重;
為與
同類的
個最近鄰樣本中的第
個樣本;
為在訓練樣本中屬于類別
的樣本所占比值;
為與
同類的樣本占總樣本的比值,其中
為樣本
的標簽;
為與
不同類的
個最近鄰樣本中的第
個樣本。函數
表示樣本
和樣本
在特征
上的差,其計算方法如式(2)所示:
![]() |
基于ReliefF的通道選擇方法如圖2所示,主要步驟如下:

步驟1:針對每一個子頻帶(A1、A2、A3、A4、A5和A6),提取每個樣本64通道的5個時頻域觀察特征:即頻帶能量(band energy,BE)、功率(power)、功率譜密度(power spectral density,PSD)、瞬時能量(instantaneous energy,IE)和小波包變換(wavelet packet transform,WPT),初步得到每個頻帶樣本的320維特征。
步驟2:對每一位受試者不同子頻帶下的所有特征,利用ReliefF算法計算各特征的權重,并對所有特征的權重進行由大到小排序。
步驟3:挑選出各子頻帶權重前70%的特征,觀察其所處通道的分布,當通道分布觀察特征數大于等于3時,該通道即為此子頻帶信息活躍通道,該通道保留;從而完成各子頻帶通道的刪選。
2.3 基于CSP-FCBF的運動想象EEG信號特征表征
CSP由于可以得到運動想象空間信息分布情況而被廣泛應用[24]。其主要通過尋求空間濾波器,以最大化兩個類別之間的差異來達到區分效果;使用求得的空間濾波器
對測試樣本信號
進行空間濾波,得到濾波后的信號
,并對其通過求取協方差對數得到對應的CSP特征向量
,其計算過程如式(3)和式(4)所示:
![]() |
![]() |
其中,為空間濾波后信號
的第
行信號,
為CSP空間濾波器的特征參數,var(?)為方差運算符,ln(?)為對數運算符。
根據CSP算法可知,的選取影響所構建空間濾波器的效果。
越大,保留的空間特征信息越多,同時特征維度過大,冗余信息越多,易影響分類精度和分類時耗;
越小,空間特征信息損失越多[25]。本文考慮到多頻帶CSP特征提取時可能存在特征維度過大,特征優劣性不確定的情況,結合其他研究者的相關分析[26],通過實驗綜合考慮最終確定每個CSP的
。通過CSP提取運動想象EEG信號特征后,為避免一些冗余特征和特征噪聲的影響,采用FCBF對特征進行優化,篩選出較優特征集,從而通過CSP-FCBF方法實現對運動想象EEG信號的有效表征。
FCBF是一種快速過濾的特征選擇算法,它的主要思想是通過使用對稱不確定性(symmetric uncertainty,SU)取代信息增益性(information gain,IG)來衡量一個特征是否與某一類別標簽相關或者冗余。由于FCBF對信息進行了歸一化處理,補償了IG在選取特征上的偏差,因而在進行特征相關性比較時,采用SU比采用IG更為客觀,其流程主要包括兩個步驟:
步驟1:刪選不相關特征。找到一個和分類相關的特征子集Slist,計算每個特征
與分類
之間的
值
,并按照降序排列;當
(
為設定的閾值),則認為特征是相關特征,將其組成新的相關特征子集Snew。
步驟2:去除冗余特征。選擇值最大的特征
(Snew中的第一個特征)作為主特征;然后在Snew中依次選擇
小于主特征的特征,分別比較該特征與主特征的
和該特征與分類
的
,剔除
的冗余特征,重復此步驟直至結束。
由此可見,要想獲得優質的特征表征子集,首先需要確定閾值。然而,過大閾值將會刪除過多有用的特征,影響表征效果;過小的閾值將不能有效刪除冗余特征。考慮到
的選擇和每個特征
與分類
之間的
值
相關,因此本文采用均值法對閾值
進行確定,其公式如式(5)所示:
![]() |
其中,為特征維度,
為
與分類
之間的
值。
2.4 SVM分類器
各分類器由于分類原理不同,其特點不同,適用的場合也不盡相同。在眾多分類器中,SVM因其在小樣本分類問題中具有較強的適應性、較高的訓練速度、良好的泛化能力而應用廣泛[27]。SVM基于結構風險最小化原理,克服了傳統機器學習中的維數災難問題,其基本目標是在維的數據特征空間中找到一個最優超平面,最終通過求解點到該最優超平面的距離來實現分類,其分類決策函數如式(6)所示:
![]() |
其中,sgn(?)表示符號函數,表示
的最優解,
表示分類的閾值,
表示核函數,
表示分類函數,
表示第
個樣本,
表示第
個樣本的結果標簽,其中分類樣本
的所屬類別根據分類函數的正負判斷。
SVM分類方法通常也稱為核分類方法,通過核函數引入可以將低維特征空間中的非線性問題轉化為高維特征空間中的線性問題。目前,常用的核函數有線性核函數、多項式核函數和徑向基核函數等。根據先驗經驗,當樣本量一般,特征維度不大時,通常選擇徑向基核函數可以得到優于其他核函數的分類效果。因此,本文采用徑向基核函數的SVM作為運動想象EEG信號辨識分類器。
通過本文所提基于ReliefF的自適應通道選擇方法和基于CSP-FCBF的特征表征方法,所構建的運動想象EEG信號辨識方法原理框圖如圖3所示。通過所提基于ReliefF的自適應通道選擇方法,根據各個體特點及頻帶信號特點實現各子頻帶最優通道的選擇,有效避免非顯性通道噪聲的干擾。通過所提基于CSP-FCBF的特征表征方法,對運動想象EEG信號進行特征提取及優化,進而實現運動想象EEG信號的有效表征,最后通過SVM分類器實現四類運動想象EEG信號的辨識。

3 實驗結果及分析
為了提高運動想象EEG信號的辨識精度,從個體差異性角度出發,本文提出了基于個體自適應的運動想象EEG信號特征表征方法,通過基于ReliefF的自適應通道選擇方法實現各子頻帶最優通道選擇,通過CSP-FCBF方法實現運動想象EEG信號的有效特征表征。為驗證本文所提方法效果,從多角度開展實驗分析研究,展現所提方法的性能。
為確保實驗的客觀性和合理性,本文連續選擇數據庫前10位受試者進行分析驗證,將原始的EEG信號數據集按照7:3劃分為訓練集和測試集,在量化分析時每類實驗重復5次以減小偶然性造成的影響,以5次平均值作為實驗結果。針對四類運動想象分類識別,采用一對一CSP模式,共構建6個空間濾波器,并按照CSP-FCBF方法進行特征提取及優化,最后采用SVM分類器進行分類識別。
3.1 通道選擇性能分析
根據本文所提基于ReliefF的自適應通道選擇方法,前10位受試者(編號:S001~ S010)不同頻帶挑選出來的通道個數如表1所示。從表1中可以看出,采用本文所提方法,每位受試者各頻帶所挑選的通道數大多約為40個,所選通道會因個體特點和頻帶信號特點存在差異。

為便于具體觀察各頻帶通道的分布情況,如圖4所示,具體展示了編號S002受試者A1~A6各頻帶通道挑選情況。從圖4中可以明顯看出,經過挑選的各頻帶通道,主要集中在主感覺運動區域周圍,由于頻帶信號特點的不同,不同頻帶的顯性通道分布存在一定的差異,很好地體現了通道選擇的自適應性。為了進一步分析通道選擇方法的效果,以CSP提取特征,SVM作為分類器,分別分析了全通道和所提通道選擇方法的性能差異,具體如表2所示。從表2通道挑選前后辨識精度對比可以看出,除受試者S004和S010在通道減少后辨識精度略微有所下降以外(分別略降0.3%和0.2%),其余每一位受試者的辨識精度皆有所提升,如受試者S006,經過通道挑選后精度提升了10.4%。總的來看,采用自適應通道選擇方法后平均辨識精度為(78.9±6.8)%,較全通道方法提升了2.5%。可以看出,并非信息通道越多效果越好,非顯性通道信息通常會成為噪聲,從而影響辨識效果。根據個體和信號頻帶特點進行顯性信息通道選擇,可以有效提高數據處理效率,且有助于提升運動想象EEG信號的辨識效果。


3.2 特征優化性能分析
為了有效表征運動想象EEG信號,本文提出了基于CSP-FCBF的特征表征方法,通過CSP提取相關特征,運用FCBF算法進行特征優化,從而實現有效表征。在特征優化FCBF算法中,通過均值法來確定閾值,為驗證閾值的有效性,研究了不同閾值選取對特征維度及分類辨識精度的影響。
首先,根據FCBF算法流程,計算各頻帶每個特征與類別
之間的SU值
,并根據
的值進行降序排列。然后分別根據每個特征與類別標簽
值變化范圍的
來選取不同閾值,觀察其特征篩選后剩余特征維度及相關辨識精度,其閾值選取公式如式(7)所示:
![]() |
其中,λ = 10~90,δ為閾值。
以S002受試者為例,根據所提方法進行通道選擇,然后通過CSP提取相關特征,通過選取不同對應的閾值運用FCBF進行特征優化(
),以SVM為分類器進行分類辨識,具體結果如表3所示。從表3可以看出,隨著
值增大(
減小),經過FCBF算法后剩余的特征維度逐漸增加,辨識精度也逐漸上升隨后下降。理論上會存在一個最優
值,此時特征維度適中,辨識精度最高。根據本文的均值法確定閾值后(對應
),特征維度為43,辨識精度為84.1%,表明均值法所選取的閾值較恰當。
在30~60不同值時,結果如圖5所示。從圖5中可以看出,均值法所確定的閾值(對應
)能夠實現較高的辨識精度。


為了更全面地驗證本文所提方法的具體效果,如表4所示,給出了10位受試者在CSP、ReliefF-CSP及ReliefF-CSP-FCBF三種方法下的具體分類辨識精度。從個體來看,采用ReliefF-CSP-FCBF方法所有個體的辨識精度皆有提升,與傳統的CSP方法相比前后精度提升最高和最低量分別為17.7%(S006)和1.8%(S001),單個個體最高辨識精度達到了89.3%(S003)。整體來看,通過引入基于ReliefF的通道選擇方法后,平均辨識精度提高了2.5%;通過綜合采用本文所提的ReliefF-CSP-FCBF方法,平均辨識精度達到了(83.0±5.5)%,提高了6.6%。

此外,利用本文所提方法進行了左右手二分類實驗研究,辨識精度為91.39%。將本文工作與文獻[28-30]報道的基于相同數據庫所開展的工作進行了比較,如表5所示。文獻[28]采用WPT和深度神經網絡(deep neural network,DNN)分別實現兩類運動想象EEG信號的特征提取和辨識分類。文獻[29]運用基于顯性不相關復合變換的CSP(strong uncorrelating transform complex CSP,SUT-CSP)進行特征提取并以隨機森林(random forest,RF)作為分類器進行分類辨識。文獻[30]利用卷積神經網絡(convolutional neural network,CNN)來實現兩類運動想象EEG信號的辨識。研究者探索的方法各不相同,從比較結果來看,相較于其它3種研究方案,本文方法取得了更好的運動想象EEG信號辨識效果,從而進一步證明了所提方法的優勢和有效性。

4 結論
為提高運動想象EEG信號辨識精度,從個體差異性角度考慮出發,提出了基于個體自適應的運動想象EEG信號表征方法。通過基于ReliefF的自適應頻帶通道選擇方法,根據不同個體和頻帶信號的特點有效選擇顯性信息通道,避免了全通道信息處理數據量大、噪聲多、普適性弱等缺點。通過CSP-FCBF方法對運動想象EEG信號進行特征提取及優化,進而實現運動想象EEG信號狀態的有效表征。通過大量實驗比較分析,充分表明了本文所提基于個體自適應的運動想象EEG信號表征方法的有效性。最終,運用本文所提方法四分類中單個個體最高辨識精度達到了89.3%,10位受試者平均辨識精度為(83.0±5.5)%。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻說明:作者潘禮正和丁憶參與論文選題、實驗設計、相關算法實現及論文寫作;作者王順超參與實驗數據整理及實驗結果分析統計;作者宋愛國參與實驗設計及論文修改。所有作者都閱讀并確認了最終稿件。