共空間模式(CSP)是腦電信號特征提取的主要方法, 但它存在較嚴重的過擬合問題。本文提出對多通道腦電數據劃分多個區域, 分別用CSP算法提取各區域的腦電數據特征, 對得到的各特征分別進行線性分類, 用Choquet模糊積分融合各線性分類結果, 有助于克服腦電信號處理的過擬合問題和提高腦電信號識別準確度, 從而給出了腦電數據處理的一種新框架。采用2005年國際腦機接口(BCI)競賽數據驗證該處理框架, 獲得的識別準確率顯著提高, 并且在一定程度上解決了CSP的過擬合問題, 顯示了本框架處理腦電信息的有效性。
引用本文: 徐魯強, 肖光燦, 黎茂鋒. 腦電信號共空間模式模糊融合的研究. 生物醫學工程學雜志, 2015, 32(6): 1173-1178. doi: 10.7507/1001-5515.20150208 復制
0 引言
腦電應用開發不僅可以應用在腦機接口(brain-computer interface,BCI),也可以應用在神經康復神經反饋訓練中。常用的腦電研究主要針對四種腦電信號:視覺誘發電位(visual evoked potential,VEP)、mu和beta節律、事件相關電位(event-related potentials,ERP)、慢皮層電位(slow cortical potential,SCP),大腦處于運動想象和運動控制狀態時的mu和beta節律現象被應用研究得比較廣泛。在腦部的感覺運動皮層區域能記錄到與運動想象和運動控制狀態相關的節律變化,這類事件相關的腦電變化是基于能量的變化而發生,被認為是腦電的事件相關去同步化和同步化現象(event-related desynchronization/synchronization,ERD/ERS)[1]。
采用非侵入方式采集到的腦電信號,是從皮層傳導到頭皮,并在頭皮被記錄下來。在傳導過程中,由于低通現象和各種噪聲干擾,腦電信號中的有用信號非常弱,通常淹沒在各種腦電信號自發背景噪聲中[2]。共空間模式(common spatial patterns, CSP)目前是腦電信號預處理中廣泛使用的特征提取方法[3],用CSP進行空域濾波計算有助于區分不同運動想象狀態,這些不同運動想象狀態的信號是由相應的運動腦皮層區域的腦神經同步化和異步化活動引起的。由于腦電信號信噪比較低[4]、數據中的噪聲問題較嚴重[5]和信號的非穩態特性[6],CSP提取的特征在可靠性和通用性方面不能令人滿意[7]。針對這些具體問題出現了一些CSP計算的改進方法:CSP空域濾波計算是基于數據驅動的方式,在CSP計算中進行正則化處理能得到不同運動想象狀態的協方差矩陣,特別是在小樣本情況下[8];采用最大最小方法提高CSP計算的魯棒性[9];引入Lp范式強化CSP計算的魯棒性[10];對數據Student-t分布進行CSP計算[11];采用結合小波變換進行CSP計算[12];CSP空域計算后采用貝葉斯識別[13]等改進方法。
目前的運動想象狀態識別主要是用CSP方法計算得到腦電特性,并用線性識別器對特征進行識別。在實際腦電采集過程中,得到的腦電信號數據可分辨性很弱,個體差異較大,在運動想象狀態識別過程中容易出現過擬合現象。為了更好地提高腦電信號的識別效果,我們在已有的研究成果的基礎上,提出一種腦電信號識別的新框架,應用CSP提取特征,用線性判別分析(linear discriminant analysis, LDA)進行信號識別,采用Choquet模糊測度和模糊積分的方法,對單個識別器的識別結果進行融合,以期得到更好的腦電識別效果。
1 計算方法
給出模糊集與模糊測度相關概念。U上的全體Fuzzy集A所構成的集合記為F(U)。
設映射μ:F(U)→
(1)(平凡性)若Φ∈F(U),則μ(Φ)=0;
(2)(單調性)若s?A,B∈F(U), A?B,則μ(A)≤μ(B);
(3)(下連續性)若{An|n∈N}?F(U),An?An+1(n∈N), 則;
(4)(上連續性)若{An|n∈N}?F(U),An?An+1(n∈N),則。
其中μ為Fuzzy測度。若μ只滿足條件平凡性、單調性和下連續性,則稱為下半連續Fuzzy測度;若μ只滿足條件平凡性、單調性和上連續性,則稱為上半連續Fuzzy測度。特別若μ(U)<+∞,則稱為有限Fuzzy測度;若μ(U)=1,則μ稱為正規Fuzzy測度[14]。在實際應用中,往往使用在有限集上的正規Fuzzy測度,由于集合為有限集,因而上下連續自動滿足。對腦電信號進行模糊積分運算時,Fuzzy測度滿足可加性,故可以利用可加性幫助確定Fuzzy測度。
設μ為帶有符號的Fuzzy測度,實函數f:U→(-∞, +∞),記μ:F(U)→(-∞, +∞),則,其中與積分同時存在或至少有一個存在,則稱為關于μ的Choquet積分,式中α∈(-∞, +∞), Fα={x|f(x)≥α, x∈U}。
設U={x1, x2, …, xn}有限集,并且對于任意的可測f:U→(-∞, +∞),如果與積分同時存在且有限,我們將f(x1), f(x2), …, f(xn)按從小到大排序:f(x1′)≤f(x2′)≤…≤f(xn′),其中(x1′, x2′, …, xn′)為(x1, x2, …, xn)的一個確定排列,那么上述定義的Choquet積分可用下面的公式進行計算[15]:,其中f(x0′)=0。
用模糊測度來構造Choquet模糊積分分類器,具體步驟如下:
步驟1:訓練樣本數據預處理后,提取特征并用線性識別器進行識別訓練。
步驟2:根據訓練樣本識別結果,利用模糊測度的可加性,初步估計出模糊測度,把模糊測度代入計算中,比較計算結果,進而確定組合分類器中各個分類識別器模糊測度μ(A), A∈F(U)。
步驟3:測試樣本數據預處理后,提取特征并用線性識別器進行識別,得到隸屬于每一類的程度值。
步驟4:把步驟2中得到的模糊測度值和步驟3中得到的隸屬于每一類的程度值代入Choquet積分公式中,計算出模糊積分值。
步驟5:根據測試樣本計算出的Choquet積分值判斷其所屬的類別。
2 實例分析和討論
采用國際腦電接口比賽數據Data_set_Ⅳa[16](2005年),德國柏林的BCI研究組提供數據進行分析。受試者坐在舒適的椅子上,電腦顯示器上出現的圖片或符號作為想象任務開始或結束的提示,提示任務出現后,受試者開始執行想象左右手動或腳動的任務,想象持續的時間為3.5 s,想象任務完成之后,有不固定的休息(1.75~2.25 s)時間。競賽中采用的分類是想象右手和想象腳動兩類樣本。數據集共包含了五位受試者(AA,AL,AV,AW,AY)的想象運動數據,每位受試者共采集了四組數據,每組共70個樣本(每類35個),共有280個樣本(每類140個)。其中數據的一部分帶有類別標簽,作為訓練集,用于特征提取和分類器訓練;另一部分無標簽的作為測試集,用于算法性能的評價。每位受試者訓練集和測試集的大小不同,AA、AL、AV、AW和AY訓練集分別為168、224、84、56和28;測試集分別為112、56、196、224和252。
樣本數據處理按照圖 1所示框架進行,每個樣本的不同通道區域的數據分別處理,采用CSP方法計算得到特征值,并對這些特征值單獨進行線性分類,得到該樣本不同通道區域多個數據所隸屬狀態的隸屬度值,對這些隸屬程度的值進行Choquet模糊積分,最后得到融合結果。特征選取之前,用r2值選擇出與運動想象相關的頻段和腦電通道,選出這些通道的數據,并根據相關頻段范圍濾波處理,再進行CSP算法提取特征。樣本數據之間存在個體差異,不同樣本選擇不同的濾波頻率。AA、AL、AV、AW和AY樣本的濾波頻率分別為12~13、10~13、10~12、11~14和9~12 Hz。與運動想象相關的腦電區域按照國際標準的10/20導聯系統分別為C3、Cz和C4區域。對樣本的訓練數據初步分析后,得到樣本各自對應的區域的通道號,如表 1所示。


各樣本數據經過頻率處理后,選擇對應區域的通道進行CSP運算得到樣本數據的特征值,用下列線性識別器分別進行識別,得到測試樣本屬于每個類別的隸屬程度,根據隸屬程度值大小確定樣本所屬的類別。越靠近隸屬度為1的區域樣本點隸屬于運動想象右手的程度越大,越靠近隸屬度為0的區域樣本點隸屬于運動想象腳的程度越大,因此將隸屬度大于0.5的樣本分類為運動想象右手狀態,隸屬度小于0.5的樣本分類為運動想象腳狀態。線性識別采用下列公式:,公式中P(ωi)代表第i類的先驗概率,μi和分別是第i類信號數據的均值和協方差。對各樣本C3、Cz和C4周圍通道的區域進行劃分,采用CSP方法提取特征,用線性分類器分類,再用Choquet模糊積分對各個分類結果進行融合。
比賽數據用訓練集訓練后,按比賽要求對測試集數據進行測試識別,得到的相應識別錯誤率如表 2中所示。運動想象右手和腳相關位置分別在C3和Cz區域,C4區域在這兩種運動想象過程中也有變化。實驗結果顯示:采用Choquet模糊積分的識別錯誤率,明顯低于各區域的識別錯誤率。采用同樣的頻率范圍對全部電極的數據進行濾波后,得到的特征值應用相同的線性識別方法進行識別得到的結果列在表 2的最后一列。從結果中可以看出,預處理中選用全部電極得到的特征值線性識別錯誤率低于選擇各區域部分電極特征值的識別錯誤率,說明特征提取過程中CSP算法使用的電極數據越多,越能區分兩種不同的狀態,通過CSP進行特征提取能使特征數據更有辨識力。由于個體差異普遍存在,樣本各個區域的腦電數據經處理后,得到的識別錯誤率之間差別較大。但是,同一樣本各區域分類結果經過模糊融合處理之后,得到的識別錯誤率比采用全部電極進行CSP特征提取后進行識別的錯誤率還要低。

CSP是目前腦電分析中主要的特征提取方法之一。CSP算法要想得到比較好的識別特征,需要進行參數優化選擇。這些參數的優化選擇沒有成熟的方法,而CSP特征提取過程中也常常存在較為嚴重的過擬合問題。從表 3的腦電數據分析中可以看出,選用的通道越多,CSP提取的特征可分辨性越強,存在的過擬合問題也越嚴重。表 3顯示,CSP采用全部電極時比選取部分區域電極時的識別錯誤率要低很多。特別是訓練樣本比較少、訓練又不太充分時,訓練集和測試集的識別存在比較嚴重的過擬合問題。

圖 2和圖 3是樣本AA和AL的測試樣本識別的散點圖,與表 2結果對應。圖 2顯示,AA樣本三個區域樣本數據兩種狀態混雜情況比較嚴重,提取的特征信號按照C4區域、C3區域到Cz區域順序分離程度依次增強。模糊融合處理后的數據顯示兩類特征值向兩類邊緣靠攏現象明顯,原先集中在中間區域的數據經過處理后,紛紛移動到兩邊,數據信號的可分辨性明顯提高。從圖 3中也可以看到類似的現象,各區域提取出來的特征識別錯誤率不同,但經過模糊融合處理后,特征值向兩類邊緣明顯靠攏,中間區域的數據減少,這樣使提取特征的可分辨性明顯提高。


3 結語
腦電信號的準確識別是腦電應用研究的關鍵,目前的單一模式識別方法不能得到滿意的識別效果。基于信息的互補性,對較好的識別結果進行融合以進一步提高識別準確率,是值得研究的可行思路。我們應用模糊測度和Choquet積分對多個識別結果進行融合,實驗結果顯示融合后的識別效果明顯好于每個識別結果,有效地提高了識別準確度。
CSP算法是當前腦電數據分析主要的特征提取方法,但CSP方法提取的特征存在過擬合問題。CSP算法計算過程中采用的腦電通道越多,訓練數據越不足,過擬合問題就越嚴重。我們的研究中,對多通道腦電數據劃分多個區域分別進行CSP算法特征提取,對得到的特征進行線性識別,對識別結果用Choquet模糊積分進行模糊融合識別,融合后得到的識別錯誤率比各區域單獨提取的CSP特征識別錯誤率明顯降低,并且在一定程度上克服了CSP的過擬合問題。
0 引言
腦電應用開發不僅可以應用在腦機接口(brain-computer interface,BCI),也可以應用在神經康復神經反饋訓練中。常用的腦電研究主要針對四種腦電信號:視覺誘發電位(visual evoked potential,VEP)、mu和beta節律、事件相關電位(event-related potentials,ERP)、慢皮層電位(slow cortical potential,SCP),大腦處于運動想象和運動控制狀態時的mu和beta節律現象被應用研究得比較廣泛。在腦部的感覺運動皮層區域能記錄到與運動想象和運動控制狀態相關的節律變化,這類事件相關的腦電變化是基于能量的變化而發生,被認為是腦電的事件相關去同步化和同步化現象(event-related desynchronization/synchronization,ERD/ERS)[1]。
采用非侵入方式采集到的腦電信號,是從皮層傳導到頭皮,并在頭皮被記錄下來。在傳導過程中,由于低通現象和各種噪聲干擾,腦電信號中的有用信號非常弱,通常淹沒在各種腦電信號自發背景噪聲中[2]。共空間模式(common spatial patterns, CSP)目前是腦電信號預處理中廣泛使用的特征提取方法[3],用CSP進行空域濾波計算有助于區分不同運動想象狀態,這些不同運動想象狀態的信號是由相應的運動腦皮層區域的腦神經同步化和異步化活動引起的。由于腦電信號信噪比較低[4]、數據中的噪聲問題較嚴重[5]和信號的非穩態特性[6],CSP提取的特征在可靠性和通用性方面不能令人滿意[7]。針對這些具體問題出現了一些CSP計算的改進方法:CSP空域濾波計算是基于數據驅動的方式,在CSP計算中進行正則化處理能得到不同運動想象狀態的協方差矩陣,特別是在小樣本情況下[8];采用最大最小方法提高CSP計算的魯棒性[9];引入Lp范式強化CSP計算的魯棒性[10];對數據Student-t分布進行CSP計算[11];采用結合小波變換進行CSP計算[12];CSP空域計算后采用貝葉斯識別[13]等改進方法。
目前的運動想象狀態識別主要是用CSP方法計算得到腦電特性,并用線性識別器對特征進行識別。在實際腦電采集過程中,得到的腦電信號數據可分辨性很弱,個體差異較大,在運動想象狀態識別過程中容易出現過擬合現象。為了更好地提高腦電信號的識別效果,我們在已有的研究成果的基礎上,提出一種腦電信號識別的新框架,應用CSP提取特征,用線性判別分析(linear discriminant analysis, LDA)進行信號識別,采用Choquet模糊測度和模糊積分的方法,對單個識別器的識別結果進行融合,以期得到更好的腦電識別效果。
1 計算方法
給出模糊集與模糊測度相關概念。U上的全體Fuzzy集A所構成的集合記為F(U)。
設映射μ:F(U)→
(1)(平凡性)若Φ∈F(U),則μ(Φ)=0;
(2)(單調性)若s?A,B∈F(U), A?B,則μ(A)≤μ(B);
(3)(下連續性)若{An|n∈N}?F(U),An?An+1(n∈N), 則;
(4)(上連續性)若{An|n∈N}?F(U),An?An+1(n∈N),則。
其中μ為Fuzzy測度。若μ只滿足條件平凡性、單調性和下連續性,則稱為下半連續Fuzzy測度;若μ只滿足條件平凡性、單調性和上連續性,則稱為上半連續Fuzzy測度。特別若μ(U)<+∞,則稱為有限Fuzzy測度;若μ(U)=1,則μ稱為正規Fuzzy測度[14]。在實際應用中,往往使用在有限集上的正規Fuzzy測度,由于集合為有限集,因而上下連續自動滿足。對腦電信號進行模糊積分運算時,Fuzzy測度滿足可加性,故可以利用可加性幫助確定Fuzzy測度。
設μ為帶有符號的Fuzzy測度,實函數f:U→(-∞, +∞),記μ:F(U)→(-∞, +∞),則,其中與積分同時存在或至少有一個存在,則稱為關于μ的Choquet積分,式中α∈(-∞, +∞), Fα={x|f(x)≥α, x∈U}。
設U={x1, x2, …, xn}有限集,并且對于任意的可測f:U→(-∞, +∞),如果與積分同時存在且有限,我們將f(x1), f(x2), …, f(xn)按從小到大排序:f(x1′)≤f(x2′)≤…≤f(xn′),其中(x1′, x2′, …, xn′)為(x1, x2, …, xn)的一個確定排列,那么上述定義的Choquet積分可用下面的公式進行計算[15]:,其中f(x0′)=0。
用模糊測度來構造Choquet模糊積分分類器,具體步驟如下:
步驟1:訓練樣本數據預處理后,提取特征并用線性識別器進行識別訓練。
步驟2:根據訓練樣本識別結果,利用模糊測度的可加性,初步估計出模糊測度,把模糊測度代入計算中,比較計算結果,進而確定組合分類器中各個分類識別器模糊測度μ(A), A∈F(U)。
步驟3:測試樣本數據預處理后,提取特征并用線性識別器進行識別,得到隸屬于每一類的程度值。
步驟4:把步驟2中得到的模糊測度值和步驟3中得到的隸屬于每一類的程度值代入Choquet積分公式中,計算出模糊積分值。
步驟5:根據測試樣本計算出的Choquet積分值判斷其所屬的類別。
2 實例分析和討論
采用國際腦電接口比賽數據Data_set_Ⅳa[16](2005年),德國柏林的BCI研究組提供數據進行分析。受試者坐在舒適的椅子上,電腦顯示器上出現的圖片或符號作為想象任務開始或結束的提示,提示任務出現后,受試者開始執行想象左右手動或腳動的任務,想象持續的時間為3.5 s,想象任務完成之后,有不固定的休息(1.75~2.25 s)時間。競賽中采用的分類是想象右手和想象腳動兩類樣本。數據集共包含了五位受試者(AA,AL,AV,AW,AY)的想象運動數據,每位受試者共采集了四組數據,每組共70個樣本(每類35個),共有280個樣本(每類140個)。其中數據的一部分帶有類別標簽,作為訓練集,用于特征提取和分類器訓練;另一部分無標簽的作為測試集,用于算法性能的評價。每位受試者訓練集和測試集的大小不同,AA、AL、AV、AW和AY訓練集分別為168、224、84、56和28;測試集分別為112、56、196、224和252。
樣本數據處理按照圖 1所示框架進行,每個樣本的不同通道區域的數據分別處理,采用CSP方法計算得到特征值,并對這些特征值單獨進行線性分類,得到該樣本不同通道區域多個數據所隸屬狀態的隸屬度值,對這些隸屬程度的值進行Choquet模糊積分,最后得到融合結果。特征選取之前,用r2值選擇出與運動想象相關的頻段和腦電通道,選出這些通道的數據,并根據相關頻段范圍濾波處理,再進行CSP算法提取特征。樣本數據之間存在個體差異,不同樣本選擇不同的濾波頻率。AA、AL、AV、AW和AY樣本的濾波頻率分別為12~13、10~13、10~12、11~14和9~12 Hz。與運動想象相關的腦電區域按照國際標準的10/20導聯系統分別為C3、Cz和C4區域。對樣本的訓練數據初步分析后,得到樣本各自對應的區域的通道號,如表 1所示。


各樣本數據經過頻率處理后,選擇對應區域的通道進行CSP運算得到樣本數據的特征值,用下列線性識別器分別進行識別,得到測試樣本屬于每個類別的隸屬程度,根據隸屬程度值大小確定樣本所屬的類別。越靠近隸屬度為1的區域樣本點隸屬于運動想象右手的程度越大,越靠近隸屬度為0的區域樣本點隸屬于運動想象腳的程度越大,因此將隸屬度大于0.5的樣本分類為運動想象右手狀態,隸屬度小于0.5的樣本分類為運動想象腳狀態。線性識別采用下列公式:,公式中P(ωi)代表第i類的先驗概率,μi和分別是第i類信號數據的均值和協方差。對各樣本C3、Cz和C4周圍通道的區域進行劃分,采用CSP方法提取特征,用線性分類器分類,再用Choquet模糊積分對各個分類結果進行融合。
比賽數據用訓練集訓練后,按比賽要求對測試集數據進行測試識別,得到的相應識別錯誤率如表 2中所示。運動想象右手和腳相關位置分別在C3和Cz區域,C4區域在這兩種運動想象過程中也有變化。實驗結果顯示:采用Choquet模糊積分的識別錯誤率,明顯低于各區域的識別錯誤率。采用同樣的頻率范圍對全部電極的數據進行濾波后,得到的特征值應用相同的線性識別方法進行識別得到的結果列在表 2的最后一列。從結果中可以看出,預處理中選用全部電極得到的特征值線性識別錯誤率低于選擇各區域部分電極特征值的識別錯誤率,說明特征提取過程中CSP算法使用的電極數據越多,越能區分兩種不同的狀態,通過CSP進行特征提取能使特征數據更有辨識力。由于個體差異普遍存在,樣本各個區域的腦電數據經處理后,得到的識別錯誤率之間差別較大。但是,同一樣本各區域分類結果經過模糊融合處理之后,得到的識別錯誤率比采用全部電極進行CSP特征提取后進行識別的錯誤率還要低。

CSP是目前腦電分析中主要的特征提取方法之一。CSP算法要想得到比較好的識別特征,需要進行參數優化選擇。這些參數的優化選擇沒有成熟的方法,而CSP特征提取過程中也常常存在較為嚴重的過擬合問題。從表 3的腦電數據分析中可以看出,選用的通道越多,CSP提取的特征可分辨性越強,存在的過擬合問題也越嚴重。表 3顯示,CSP采用全部電極時比選取部分區域電極時的識別錯誤率要低很多。特別是訓練樣本比較少、訓練又不太充分時,訓練集和測試集的識別存在比較嚴重的過擬合問題。

圖 2和圖 3是樣本AA和AL的測試樣本識別的散點圖,與表 2結果對應。圖 2顯示,AA樣本三個區域樣本數據兩種狀態混雜情況比較嚴重,提取的特征信號按照C4區域、C3區域到Cz區域順序分離程度依次增強。模糊融合處理后的數據顯示兩類特征值向兩類邊緣靠攏現象明顯,原先集中在中間區域的數據經過處理后,紛紛移動到兩邊,數據信號的可分辨性明顯提高。從圖 3中也可以看到類似的現象,各區域提取出來的特征識別錯誤率不同,但經過模糊融合處理后,特征值向兩類邊緣明顯靠攏,中間區域的數據減少,這樣使提取特征的可分辨性明顯提高。


3 結語
腦電信號的準確識別是腦電應用研究的關鍵,目前的單一模式識別方法不能得到滿意的識別效果。基于信息的互補性,對較好的識別結果進行融合以進一步提高識別準確率,是值得研究的可行思路。我們應用模糊測度和Choquet積分對多個識別結果進行融合,實驗結果顯示融合后的識別效果明顯好于每個識別結果,有效地提高了識別準確度。
CSP算法是當前腦電數據分析主要的特征提取方法,但CSP方法提取的特征存在過擬合問題。CSP算法計算過程中采用的腦電通道越多,訓練數據越不足,過擬合問題就越嚴重。我們的研究中,對多通道腦電數據劃分多個區域分別進行CSP算法特征提取,對得到的特征進行線性識別,對識別結果用Choquet模糊積分進行模糊融合識別,融合后得到的識別錯誤率比各區域單獨提取的CSP特征識別錯誤率明顯降低,并且在一定程度上克服了CSP的過擬合問題。