腦-機接口(BCI)中常用高密度導聯來獲取腦電(EEG)信號的空間信息, 為了避免使用過多導聯給EEG采集工作帶來不便, 消除無關的噪聲通道, 本文提出了一種基于共空間模式(CSP)的導聯優化方法, 基于CSP方法得到的投影矩陣, 使用2-范數的導聯篩選準則, 篩選出在投影空間中權重較大的M個導聯, 目的是用較少的導聯來獲得與使用高密度導聯相近的分類識別率。實驗數據使用BCI Competition 2005 DatasetⅢa, 針對三個受試者的三類運動想象(左手、右手和腳), 分別比較了使用該方法選擇的導聯和使用全部導聯情況下得到的分類識別率。實驗表明, 使用篩選后的20導聯得到的三個受試者的分類識別率, 均高于使用全部60導聯得到的分類識別率, 從而驗證了所提出方法的有效性和實用性。
引用本文: 周蚌艷, 吳小培, 呂釗, 張磊, 郭曉靜, 張超. 基于共空間模式方法的多類運動想象腦電的導聯選擇. 生物醫學工程學雜志, 2015, 32(3): 520-525. doi: 10.7507/1001-5515.20150095 復制
引言
腦-機接口(brain-computer interface,BCI)是一種不依賴于大腦外周神經和肌肉的人機交互技術,可以將不同思維狀態的神經活動(neural activity,NA)信息直接轉換成對外部設備的控制命令[1]。目前在BCI系統中,常用的神經活動采集技術有:腦電圖(electroencephalograph,EEG)、腦磁圖(magnetoencephalography,MEG)和功能性磁共振成像(functional magnetic resonance imaging,fMRI)等[2]。其中EEG由于操作簡單、時間分辨率較高和成本低[3]等優點被廣泛應用于BCI系統中。
研究表明,在肢體的真實運動或大腦想象運動時,大腦運動皮層的Mu節律和Beta節律會出現能量的衰減或增強,這種現象稱之為事件相關去同步化(event related desynchronization,ERD)和事件相關同步化(event related synchronization,ERS)[4]。運動想象BCI(motor imagery BCI,MI-BCI)利用ERD/ERS現象,從采集到的EEG信號中提取出基于不同想象任務的相關特征進行正確地分類識別。共空間模式(common spatial pattern,CSP)作為代表性的空域濾波方法之一,因其良好的性能被廣泛應用于MI-BCI中[5]。
為了獲得較好的性能,大多數BCI系統在EEG采集過程中使用高密度導聯來獲取大腦不同皮層的神經活動信息[6]。理論上導聯越多提供的大腦神經活動信息越豐富,越有利于不同任務模式下EEG信號的準確分類。然而在實際應用中,一方面采集到的EEG信號中可能會包含噪聲偽跡[7],從而對分類識別造成干擾,降低CSP算法的性能;另一方面,高密度導聯EEG信號的采集工作也是一件耗時費力的事情,從而給BCI的推廣應用帶來不便。從神經科學角度分析,選擇任務相關皮層區域導聯進行測試理論上會得到較好的結果,然而不同的受試者對任務的反應不同,最優的導聯位置也因個體差異性而各不相同[8]。如何權衡導聯數量及其分布與識別率之間的關系,使用較少的導聯來獲得最佳的識別率,是BCI系統實現中的關鍵問題之一。文獻[9-15]提出了不同的導聯優化選擇方法,大致可以分為兩類:一是利用分類器(如支持向量機)的導聯優化方法,通常依賴于分類器對不同導聯特征進行評估;二是采用直接導聯分布優化方法,如采用導聯間的互信息大小作為導聯選擇標準。上述方法大多是針對兩分類任務的導聯優化選擇,本文則研究了在多類運動想象分類識別過程中的導聯優化選擇問題,主要工作包括:①使用基于CSP方法的導聯優化方法,利用投影矩陣和導聯篩選準則選出適當的導聯,以期通過較少的導聯獲得與使用全部導聯相近的分類效果。②使用一對多(one-versus-the-rest,OVR)方法[16]進行多類運動想象的分類識別,分別使用C3、C4和CZ三導聯,優化選擇后的導聯,自主選擇的運動皮層相關導聯以及全部導聯來分析三類運動想象數據,比較四種情況下的分類識別率。
1 實驗方法
1.1 CSP算法
經典CSP算法是主要針對兩分類任務的空域濾波方法,基于兩類信號的協方差矩陣同時對角化設計最優空域濾波器,使得濾波后的信號在保持總能量不變的前提下,平均能量差異最大化[9]。
設S=[s1, s2, …, sN] T和X=[x1, x2, …, xN] T分別為隱含“CSP源”信號和多道腦電觀測信號,X可以看成是由si(i=1, 2, …, N)線性瞬時混合疊加而成,即
$ \boldsymbol{X}=\boldsymbol{AS} $ |
其中矩陣A的每一列稱為一個空間模式,由“CSP源”在各個導聯上分布的權重系數組成。假定X1、X2分別為測量的兩類任務模式下的N導聯EEG數據,首先對 X1和X2作濾波和去均值處理,使得E(X1)=E(X2)=0。其次計算其歸一化協方差矩陣:
$ {\boldsymbol{{C}}_{1}}=\text{E}\left({\boldsymbol{{X}}_{1}}\ \ \boldsymbol{X}_{1}^{T} \right)\text{trace}\left\{ \text{E}\left({\boldsymbol{{X}}_{1}}\ \ \boldsymbol{X}_{1}^{T} \right)\right\} $ |
$ {\boldsymbol{{C}}_{2}}=\text{E}\left({\boldsymbol{{X}}_{2}}\ \ \boldsymbol{X}_{2}^{T} \right)\text{trace}\left\{ \text{E}\left({\boldsymbol{{X}}_{2}}\ \ \boldsymbol{X}_{2}^{T} \right)\right\} $ |
其中trace(.)函數為矩陣的跡。由于協方差矩陣C1和C2是實對稱矩陣,因此存在正交矩陣W,使得:
$ {{\boldsymbol{\text{W}}}^{T}}{{C}_{1}}\text{W-}\boldsymbol{\Lambda} \text{=diag}\left({{\lambda }_{1}}, {{\lambda }_{2}}, \cdots, {{\lambda }_{N}} \right) $ |
$ {{\boldsymbol{\text{W}}}^{T}}{{\boldsymbol{C}}_{2}}\boldsymbol{\text{W}=\boldsymbol{I-}}\boldsymbol{\Lambda} $ |
其中I為N維的單位矩陣,λi(i=1, 2, …,N)為C1的N個特征值,并且λ 1≥λ 2≥…≥λ N。分別取Λ中最大和最小的NP個特征值對應的特征向量組成投影矩陣W1和W2,則W1和W2分別是與第一類和第二類任務相對應的空間濾波器,濾波后的信號為S1=W1X1,S2=W2X2,S1和S2中每一行即為一個“CSP源”分量,其方差的大小直接作為分類的判據。
1.2 基于多分類問題的CSP-OVR方法
針對多任務模式下的分類問題,本文采用CSP-OVR方法。OVR方法是把N類問題轉化為N個新的兩類問題,分別為其中的一類樣本和所有剩余N-1類樣本。本文針對三類運動想象(左手、右手和腳)的分類問題,采用OVR方法構造兩組空間濾波器,即手和腳以及左手和右手的分類。
假定X l、Xr和X f分別為測量的左手、右手和腳三類運動想象的原始EEG信號,首先將測量的三類EEG數據分為兩類標簽數據,即手(包括左手和右手)和腳兩大類,利用經典CSP方法得到相應的空間濾波器W h和W f。其次,使用左手和右手EEG數據設計對應左手和右手的空間濾波器W l和W r。將所得的空間濾波器對三類運動想象的EEG數據進行空域濾波,得到濾波后的運動相關分量為:Z f=W f X,Z h=W h X,Z l=W l X,Z r=W r X。根據相應分量方差和的大小直接進行運動想象類型判別,判斷流程圖如圖 1所示。

1.3 導聯的選擇方法
導聯優化選擇是CSP方法中關鍵問題之一,不同導聯信號記錄了大腦皮層不同區域的神經活動信息。如何衡量各個導聯在分類識別過程中的貢獻,本文提出了結合CSP投影矩陣W和2-范數篩選準則的導聯優化方法。
利用公式(4)和(5)得到的投影矩陣W,選擇W矩陣中對應Λ最大和最小的NP個特征值的特征向量組成空間濾波器W CSP∈R2NP×N,則濾波后的信號為:
$ \boldsymbol{S}={{\boldsymbol{W}}_{CSP}}\boldsymbol{X}=\left[\begin{matrix} {{w}_{11}} & \cdots & {{w}_{1N}} \\ \vdots & \ddots & \vdots \\ {{w}_{2{{N}_{p}}1}} & \cdots & {{w}_{2{{N}_{p}}N}} \\ \end{matrix} \right]\left[\begin{align} & {{x}_{1}} \\ & \vdots \\ & {{x}_{N}} \\ \end{align} \right] $ |
令W CSP=[w1, w2, …,wN],其中wi(i=1, 2, …,N)表示W CSP中的第i列向量,wi代表了各個導聯信號xi(i=1, 2, …,N)在投影空間的權重,反映了其對投影后的信號的影響。我們采用2-范數形式給每個導聯定義一個權重值SC:
$ SC(i)=\left\| {{w}_{i}} \right\|2/{{\left\| {{\boldsymbol{W}}_{\text{csp}}} \right\|}_{2}} $ |
其中‖·‖2代表了向量的2-范數。權重值大則說明該導聯觀測信號對投影后的信號影響大,反之則說明影響小,最終選擇權重值大的若干導聯作為測試導聯,具體步驟如下:
第一步:針對兩類運動想象,使用全部N個導聯的所有訓練數據設計CSP空域濾波器,得到投影矩陣W,選取投影矩陣W中對應Λ最大和最小的 NP個特征值的特征向量,組成空域濾波矩陣W CSP。
第二步:利用公式(7)計算各個導聯在投影空間中的權重值,并按權重值從高到低進行排序,選擇權重值較高的M個導聯進行測試。
2 實驗數據和結果
2.1 實驗數據
實驗數據來自BCI competition 2005標準MI-EEG數據庫(DatasetⅢa)。數據通過64導的Neuroscan腦電放大器采集獲得,采樣頻率為250 Hz,并對數據進行了1~50 Hz的帶通濾波處理,記錄了其中60個導聯的EEG數據,包含三個受試者(K3B、L1B和K6B)的四類運動想象(左手、右手、腳和舌頭)。單次試驗的時間長度為8 s,其中前2 s為準備期,計算機顯示黑屏,2 s時計算機發出“嗶”提示音表示實驗開始,屏幕出現“十”字,3 s時屏幕出現向左、向右、向上或向下的指示箭頭,分別提示受試者進行左手、右手、舌頭和腳的運動想象,箭頭顯示持續到7 s結束,受試者等待下一次試驗開始。具體的導聯分布和實驗范式如圖 2所示。

本文試驗采用三個受試者的三類運動想象(左手、右手和腳)的數據,其中K3B訓練集和測試集均包含135個單次試驗,對應左手、右手和腳的運動想象各45次;L1B和K6B的訓練集和測試集分別包含90個單次試驗,對應左手、右手和腳的運動想象各30次。在設計空域濾波器之前實驗數據經過了5~35 Hz的數字帶通濾波,因為該頻段包含了運動相關的主要節律成分(mu節律和beta節律),訓練時間段和測試時間段均選擇ERD/ERS現象較明顯的3.5~7 s的運動想象時間段。
2.2 實驗結果與分析
2.2.1 兩類運動想象的導聯優化選擇
首先將DatasetⅢa中的三個受試者的三類運動想象信號分成兩組兩類運動想象問題:手和腳、左手和右手,針對每組運動想象的全部60導EEG數據利用CSP方法得到投影矩陣W,取W中對應Λ最大和最小3個特征值的特征向量構成空間濾波器W CSP,利用2-范數形式計算各個導聯的權重值,按照權重值從高到低進行排序。為了測試導聯的個數和分類識別率之間的關系,分別選擇權重最高的M個不同導聯數進行測試,得到了基于不同導聯個數下的分類識別率。實驗共進行了20組,每組中分別對訓練集全部數據做5折交叉驗證,隨機選擇其中的4/5數據用于訓練,剩余的1/5數據用于測試,得到的平均分類識別率如圖 3所示。

從圖 3中可以看出使用過多或過少的導聯均不能獲得最佳的分類效果,一方面導聯數過少提供的大腦神經活動信息較少,分類識別的判據不足,導致識別率不高;另一方面,導聯數過多可能會引入偽跡干擾,同樣也會降低CSP方法的分類識別率,所以使用全部60導聯數據并不一定能夠獲得最高的識別率。圖 4畫出了兩組濾波器中每個導聯的權重值所對應的腦地形圖。從圖中可以看出K3B的兩組濾波器中優化導聯的位置比較集中,且主要分布在運動想象皮層,因此使用相對較少的導聯即可獲得較好的識別率;而L1B和K6B的優化導聯位置比較分散,且分布在大腦不同皮層區域,所以需要用相對較多的導聯信息來識別不同的運動想象狀態。綜合考慮后本文選擇權重值最高的前20個導聯進行測試,這20個導聯的權重值之和占所有導聯的權重和的平均比例在75%以上,是構成投影后的“CSP源”信號的主要分量。

2.2.2 基于三類運動想象的不同導聯選擇方案
在本節中分別使用了兩種導聯選擇方法。一種是基于CSP-2-范數的導聯優化方法,在兩分類任務的導聯選擇的基礎之上,針對三類運動想象的導聯選擇,使用OVR方法分別設計了手和腳、左手和右手兩組濾波器,從每組濾波器的投影矩陣中各選擇權重值最高的10個導聯,兩組導聯合在一起形成20個導聯。另一種是手動選擇的方法,根據神經電生理研究結果,在左、右手運動想象時,肢體同側運動皮層(C3和C4導聯)會出現ERS現象,在肢體對側運動皮層(C4和C3導聯)會出現ERD現象,腳運動想象時,ERD現象發生在頂部運動皮層(CZ導聯),而CSP空域濾波之后的運動相關分量方差的大小即對應了相應導聯的ERS/ERD現象[17],因此本文分別計算了每個導聯和C3、C4和CZ導聯之間的相關系數,從60個導聯中分別選擇相關系數較高的20個導聯。
兩種方法最終選擇的導聯如圖 5所示,其中前三幅分別對應了K3B、L1B和K6B利用CSP-2-范數導聯優化方法選擇的導聯位置分布圖。從導聯分布的位置來看,對于不同的受試者選擇的最優導聯各不相同,在所選導聯中,僅K3B一人同時包括了C3、C4和CZ三個導聯,并且導聯大多集中在運動皮層區域,而L1B和K6B優化選擇后的導聯位置比較分散,分布在大腦的不同功能區,說明對于L1B和K6B來說,用于區分不同任務之間的有效特征不只是由運動想象產生的,這可能也是L1B和K6B識別率較低的原因之一。最后一幅是利用導聯間的相關系數手動選擇的20導聯。從選擇的結果看,導聯均集中在運動皮層區域。

針對DatasetⅢa中的三個被試分別使用3導聯、60導聯、手動選擇的20導聯和用CSP-2-范數方法選擇的20導聯進行比較。測試共進行了30組,每組中分別對三個受試者的三類運動想象訓練數據做5折交叉驗證,結果如表 1所示。

從表 1中可以看出:①僅使用C3、C4、CZ三個導聯得到的平均分類識別率較低,特別是K6B,平均識別率僅為48.33%,從圖 5中可以看出,在優化選擇的導聯中,對于K6B只有C3導聯是包含其中的,C4和CZ導聯在投影矩陣中所占的比重較小,所以在這種情況下需要選擇更適合的導聯進行測試。②使用手動選擇的運動皮層區域的20導聯得到的分類識別率較使用全部60導聯得到的識別率略低,說明由運動想象引起的大腦不同皮層區域活動對不同的受試者也不完全相同,如果在導聯優化選擇的過程中綜合考慮個體差異,將有助于提高分類識別率。③在四種方案中,使用CSP-2-范數方法選擇的20導聯得到的識別率最高,因為使用該方法選擇的導聯代表了不同受試者在多類運動想象時特征差異最明顯的導聯,避免了過多導聯可能帶來的偽跡干擾。以上充分說明了在基于CSP方法的MI-BCI系統中,需要選擇適當的導聯數和導聯組合方案才能得到較好的分類識別效果,同時也驗證了本文所提出方法的有效性和實用性。
3 總結與討論
在基于CSP的BCI系統中,導聯選擇是數據預處理過程中重要的步驟之一,導聯的數量和不同的組合方案對分類識別率影響較大。本文采用了基于CSP的導聯優化選擇方法,利用投影矩陣W,依據2-范數導聯篩選準則,選擇了在投影空間中貢獻較大的導聯進行測試,實驗表明,對于不同的受試者其最優導聯的分布位置各不相同。針對三類運動想象識別,采用CSP-OVR方法分別測試了基于3導聯、全部60導聯、運動皮層相關20導聯和使用本文所提方法選擇的20導聯的EEG數據,實驗結果表明,本文所提方法得到的分類識別率最高,說明在使用CSP方法時,使用恰當的少量導聯即可獲得與使用高密度導聯相近甚至更高的分類識別率。
同時,本文中的導聯選擇方法是基于受試者的單一時間段(一天)的測量數據,實驗過程需要采集全部導聯的所有EEG數據計算投影矩陣W,今后的工作重點是測試同一受試者的特征導聯組合是否具有一致性,即使用相同的導聯組合測試同一受試者不同時期采集的數據是否始終能夠獲得較好的分類識別率,或是針對不同時期采集的EEG數據是否具有相似的最優導聯,從而可以真正減少EEG信號采集過程中的導聯個數。
引言
腦-機接口(brain-computer interface,BCI)是一種不依賴于大腦外周神經和肌肉的人機交互技術,可以將不同思維狀態的神經活動(neural activity,NA)信息直接轉換成對外部設備的控制命令[1]。目前在BCI系統中,常用的神經活動采集技術有:腦電圖(electroencephalograph,EEG)、腦磁圖(magnetoencephalography,MEG)和功能性磁共振成像(functional magnetic resonance imaging,fMRI)等[2]。其中EEG由于操作簡單、時間分辨率較高和成本低[3]等優點被廣泛應用于BCI系統中。
研究表明,在肢體的真實運動或大腦想象運動時,大腦運動皮層的Mu節律和Beta節律會出現能量的衰減或增強,這種現象稱之為事件相關去同步化(event related desynchronization,ERD)和事件相關同步化(event related synchronization,ERS)[4]。運動想象BCI(motor imagery BCI,MI-BCI)利用ERD/ERS現象,從采集到的EEG信號中提取出基于不同想象任務的相關特征進行正確地分類識別。共空間模式(common spatial pattern,CSP)作為代表性的空域濾波方法之一,因其良好的性能被廣泛應用于MI-BCI中[5]。
為了獲得較好的性能,大多數BCI系統在EEG采集過程中使用高密度導聯來獲取大腦不同皮層的神經活動信息[6]。理論上導聯越多提供的大腦神經活動信息越豐富,越有利于不同任務模式下EEG信號的準確分類。然而在實際應用中,一方面采集到的EEG信號中可能會包含噪聲偽跡[7],從而對分類識別造成干擾,降低CSP算法的性能;另一方面,高密度導聯EEG信號的采集工作也是一件耗時費力的事情,從而給BCI的推廣應用帶來不便。從神經科學角度分析,選擇任務相關皮層區域導聯進行測試理論上會得到較好的結果,然而不同的受試者對任務的反應不同,最優的導聯位置也因個體差異性而各不相同[8]。如何權衡導聯數量及其分布與識別率之間的關系,使用較少的導聯來獲得最佳的識別率,是BCI系統實現中的關鍵問題之一。文獻[9-15]提出了不同的導聯優化選擇方法,大致可以分為兩類:一是利用分類器(如支持向量機)的導聯優化方法,通常依賴于分類器對不同導聯特征進行評估;二是采用直接導聯分布優化方法,如采用導聯間的互信息大小作為導聯選擇標準。上述方法大多是針對兩分類任務的導聯優化選擇,本文則研究了在多類運動想象分類識別過程中的導聯優化選擇問題,主要工作包括:①使用基于CSP方法的導聯優化方法,利用投影矩陣和導聯篩選準則選出適當的導聯,以期通過較少的導聯獲得與使用全部導聯相近的分類效果。②使用一對多(one-versus-the-rest,OVR)方法[16]進行多類運動想象的分類識別,分別使用C3、C4和CZ三導聯,優化選擇后的導聯,自主選擇的運動皮層相關導聯以及全部導聯來分析三類運動想象數據,比較四種情況下的分類識別率。
1 實驗方法
1.1 CSP算法
經典CSP算法是主要針對兩分類任務的空域濾波方法,基于兩類信號的協方差矩陣同時對角化設計最優空域濾波器,使得濾波后的信號在保持總能量不變的前提下,平均能量差異最大化[9]。
設S=[s1, s2, …, sN] T和X=[x1, x2, …, xN] T分別為隱含“CSP源”信號和多道腦電觀測信號,X可以看成是由si(i=1, 2, …, N)線性瞬時混合疊加而成,即
$ \boldsymbol{X}=\boldsymbol{AS} $ |
其中矩陣A的每一列稱為一個空間模式,由“CSP源”在各個導聯上分布的權重系數組成。假定X1、X2分別為測量的兩類任務模式下的N導聯EEG數據,首先對 X1和X2作濾波和去均值處理,使得E(X1)=E(X2)=0。其次計算其歸一化協方差矩陣:
$ {\boldsymbol{{C}}_{1}}=\text{E}\left({\boldsymbol{{X}}_{1}}\ \ \boldsymbol{X}_{1}^{T} \right)\text{trace}\left\{ \text{E}\left({\boldsymbol{{X}}_{1}}\ \ \boldsymbol{X}_{1}^{T} \right)\right\} $ |
$ {\boldsymbol{{C}}_{2}}=\text{E}\left({\boldsymbol{{X}}_{2}}\ \ \boldsymbol{X}_{2}^{T} \right)\text{trace}\left\{ \text{E}\left({\boldsymbol{{X}}_{2}}\ \ \boldsymbol{X}_{2}^{T} \right)\right\} $ |
其中trace(.)函數為矩陣的跡。由于協方差矩陣C1和C2是實對稱矩陣,因此存在正交矩陣W,使得:
$ {{\boldsymbol{\text{W}}}^{T}}{{C}_{1}}\text{W-}\boldsymbol{\Lambda} \text{=diag}\left({{\lambda }_{1}}, {{\lambda }_{2}}, \cdots, {{\lambda }_{N}} \right) $ |
$ {{\boldsymbol{\text{W}}}^{T}}{{\boldsymbol{C}}_{2}}\boldsymbol{\text{W}=\boldsymbol{I-}}\boldsymbol{\Lambda} $ |
其中I為N維的單位矩陣,λi(i=1, 2, …,N)為C1的N個特征值,并且λ 1≥λ 2≥…≥λ N。分別取Λ中最大和最小的NP個特征值對應的特征向量組成投影矩陣W1和W2,則W1和W2分別是與第一類和第二類任務相對應的空間濾波器,濾波后的信號為S1=W1X1,S2=W2X2,S1和S2中每一行即為一個“CSP源”分量,其方差的大小直接作為分類的判據。
1.2 基于多分類問題的CSP-OVR方法
針對多任務模式下的分類問題,本文采用CSP-OVR方法。OVR方法是把N類問題轉化為N個新的兩類問題,分別為其中的一類樣本和所有剩余N-1類樣本。本文針對三類運動想象(左手、右手和腳)的分類問題,采用OVR方法構造兩組空間濾波器,即手和腳以及左手和右手的分類。
假定X l、Xr和X f分別為測量的左手、右手和腳三類運動想象的原始EEG信號,首先將測量的三類EEG數據分為兩類標簽數據,即手(包括左手和右手)和腳兩大類,利用經典CSP方法得到相應的空間濾波器W h和W f。其次,使用左手和右手EEG數據設計對應左手和右手的空間濾波器W l和W r。將所得的空間濾波器對三類運動想象的EEG數據進行空域濾波,得到濾波后的運動相關分量為:Z f=W f X,Z h=W h X,Z l=W l X,Z r=W r X。根據相應分量方差和的大小直接進行運動想象類型判別,判斷流程圖如圖 1所示。

1.3 導聯的選擇方法
導聯優化選擇是CSP方法中關鍵問題之一,不同導聯信號記錄了大腦皮層不同區域的神經活動信息。如何衡量各個導聯在分類識別過程中的貢獻,本文提出了結合CSP投影矩陣W和2-范數篩選準則的導聯優化方法。
利用公式(4)和(5)得到的投影矩陣W,選擇W矩陣中對應Λ最大和最小的NP個特征值的特征向量組成空間濾波器W CSP∈R2NP×N,則濾波后的信號為:
$ \boldsymbol{S}={{\boldsymbol{W}}_{CSP}}\boldsymbol{X}=\left[\begin{matrix} {{w}_{11}} & \cdots & {{w}_{1N}} \\ \vdots & \ddots & \vdots \\ {{w}_{2{{N}_{p}}1}} & \cdots & {{w}_{2{{N}_{p}}N}} \\ \end{matrix} \right]\left[\begin{align} & {{x}_{1}} \\ & \vdots \\ & {{x}_{N}} \\ \end{align} \right] $ |
令W CSP=[w1, w2, …,wN],其中wi(i=1, 2, …,N)表示W CSP中的第i列向量,wi代表了各個導聯信號xi(i=1, 2, …,N)在投影空間的權重,反映了其對投影后的信號的影響。我們采用2-范數形式給每個導聯定義一個權重值SC:
$ SC(i)=\left\| {{w}_{i}} \right\|2/{{\left\| {{\boldsymbol{W}}_{\text{csp}}} \right\|}_{2}} $ |
其中‖·‖2代表了向量的2-范數。權重值大則說明該導聯觀測信號對投影后的信號影響大,反之則說明影響小,最終選擇權重值大的若干導聯作為測試導聯,具體步驟如下:
第一步:針對兩類運動想象,使用全部N個導聯的所有訓練數據設計CSP空域濾波器,得到投影矩陣W,選取投影矩陣W中對應Λ最大和最小的 NP個特征值的特征向量,組成空域濾波矩陣W CSP。
第二步:利用公式(7)計算各個導聯在投影空間中的權重值,并按權重值從高到低進行排序,選擇權重值較高的M個導聯進行測試。
2 實驗數據和結果
2.1 實驗數據
實驗數據來自BCI competition 2005標準MI-EEG數據庫(DatasetⅢa)。數據通過64導的Neuroscan腦電放大器采集獲得,采樣頻率為250 Hz,并對數據進行了1~50 Hz的帶通濾波處理,記錄了其中60個導聯的EEG數據,包含三個受試者(K3B、L1B和K6B)的四類運動想象(左手、右手、腳和舌頭)。單次試驗的時間長度為8 s,其中前2 s為準備期,計算機顯示黑屏,2 s時計算機發出“嗶”提示音表示實驗開始,屏幕出現“十”字,3 s時屏幕出現向左、向右、向上或向下的指示箭頭,分別提示受試者進行左手、右手、舌頭和腳的運動想象,箭頭顯示持續到7 s結束,受試者等待下一次試驗開始。具體的導聯分布和實驗范式如圖 2所示。

本文試驗采用三個受試者的三類運動想象(左手、右手和腳)的數據,其中K3B訓練集和測試集均包含135個單次試驗,對應左手、右手和腳的運動想象各45次;L1B和K6B的訓練集和測試集分別包含90個單次試驗,對應左手、右手和腳的運動想象各30次。在設計空域濾波器之前實驗數據經過了5~35 Hz的數字帶通濾波,因為該頻段包含了運動相關的主要節律成分(mu節律和beta節律),訓練時間段和測試時間段均選擇ERD/ERS現象較明顯的3.5~7 s的運動想象時間段。
2.2 實驗結果與分析
2.2.1 兩類運動想象的導聯優化選擇
首先將DatasetⅢa中的三個受試者的三類運動想象信號分成兩組兩類運動想象問題:手和腳、左手和右手,針對每組運動想象的全部60導EEG數據利用CSP方法得到投影矩陣W,取W中對應Λ最大和最小3個特征值的特征向量構成空間濾波器W CSP,利用2-范數形式計算各個導聯的權重值,按照權重值從高到低進行排序。為了測試導聯的個數和分類識別率之間的關系,分別選擇權重最高的M個不同導聯數進行測試,得到了基于不同導聯個數下的分類識別率。實驗共進行了20組,每組中分別對訓練集全部數據做5折交叉驗證,隨機選擇其中的4/5數據用于訓練,剩余的1/5數據用于測試,得到的平均分類識別率如圖 3所示。

從圖 3中可以看出使用過多或過少的導聯均不能獲得最佳的分類效果,一方面導聯數過少提供的大腦神經活動信息較少,分類識別的判據不足,導致識別率不高;另一方面,導聯數過多可能會引入偽跡干擾,同樣也會降低CSP方法的分類識別率,所以使用全部60導聯數據并不一定能夠獲得最高的識別率。圖 4畫出了兩組濾波器中每個導聯的權重值所對應的腦地形圖。從圖中可以看出K3B的兩組濾波器中優化導聯的位置比較集中,且主要分布在運動想象皮層,因此使用相對較少的導聯即可獲得較好的識別率;而L1B和K6B的優化導聯位置比較分散,且分布在大腦不同皮層區域,所以需要用相對較多的導聯信息來識別不同的運動想象狀態。綜合考慮后本文選擇權重值最高的前20個導聯進行測試,這20個導聯的權重值之和占所有導聯的權重和的平均比例在75%以上,是構成投影后的“CSP源”信號的主要分量。

2.2.2 基于三類運動想象的不同導聯選擇方案
在本節中分別使用了兩種導聯選擇方法。一種是基于CSP-2-范數的導聯優化方法,在兩分類任務的導聯選擇的基礎之上,針對三類運動想象的導聯選擇,使用OVR方法分別設計了手和腳、左手和右手兩組濾波器,從每組濾波器的投影矩陣中各選擇權重值最高的10個導聯,兩組導聯合在一起形成20個導聯。另一種是手動選擇的方法,根據神經電生理研究結果,在左、右手運動想象時,肢體同側運動皮層(C3和C4導聯)會出現ERS現象,在肢體對側運動皮層(C4和C3導聯)會出現ERD現象,腳運動想象時,ERD現象發生在頂部運動皮層(CZ導聯),而CSP空域濾波之后的運動相關分量方差的大小即對應了相應導聯的ERS/ERD現象[17],因此本文分別計算了每個導聯和C3、C4和CZ導聯之間的相關系數,從60個導聯中分別選擇相關系數較高的20個導聯。
兩種方法最終選擇的導聯如圖 5所示,其中前三幅分別對應了K3B、L1B和K6B利用CSP-2-范數導聯優化方法選擇的導聯位置分布圖。從導聯分布的位置來看,對于不同的受試者選擇的最優導聯各不相同,在所選導聯中,僅K3B一人同時包括了C3、C4和CZ三個導聯,并且導聯大多集中在運動皮層區域,而L1B和K6B優化選擇后的導聯位置比較分散,分布在大腦的不同功能區,說明對于L1B和K6B來說,用于區分不同任務之間的有效特征不只是由運動想象產生的,這可能也是L1B和K6B識別率較低的原因之一。最后一幅是利用導聯間的相關系數手動選擇的20導聯。從選擇的結果看,導聯均集中在運動皮層區域。

針對DatasetⅢa中的三個被試分別使用3導聯、60導聯、手動選擇的20導聯和用CSP-2-范數方法選擇的20導聯進行比較。測試共進行了30組,每組中分別對三個受試者的三類運動想象訓練數據做5折交叉驗證,結果如表 1所示。

從表 1中可以看出:①僅使用C3、C4、CZ三個導聯得到的平均分類識別率較低,特別是K6B,平均識別率僅為48.33%,從圖 5中可以看出,在優化選擇的導聯中,對于K6B只有C3導聯是包含其中的,C4和CZ導聯在投影矩陣中所占的比重較小,所以在這種情況下需要選擇更適合的導聯進行測試。②使用手動選擇的運動皮層區域的20導聯得到的分類識別率較使用全部60導聯得到的識別率略低,說明由運動想象引起的大腦不同皮層區域活動對不同的受試者也不完全相同,如果在導聯優化選擇的過程中綜合考慮個體差異,將有助于提高分類識別率。③在四種方案中,使用CSP-2-范數方法選擇的20導聯得到的識別率最高,因為使用該方法選擇的導聯代表了不同受試者在多類運動想象時特征差異最明顯的導聯,避免了過多導聯可能帶來的偽跡干擾。以上充分說明了在基于CSP方法的MI-BCI系統中,需要選擇適當的導聯數和導聯組合方案才能得到較好的分類識別效果,同時也驗證了本文所提出方法的有效性和實用性。
3 總結與討論
在基于CSP的BCI系統中,導聯選擇是數據預處理過程中重要的步驟之一,導聯的數量和不同的組合方案對分類識別率影響較大。本文采用了基于CSP的導聯優化選擇方法,利用投影矩陣W,依據2-范數導聯篩選準則,選擇了在投影空間中貢獻較大的導聯進行測試,實驗表明,對于不同的受試者其最優導聯的分布位置各不相同。針對三類運動想象識別,采用CSP-OVR方法分別測試了基于3導聯、全部60導聯、運動皮層相關20導聯和使用本文所提方法選擇的20導聯的EEG數據,實驗結果表明,本文所提方法得到的分類識別率最高,說明在使用CSP方法時,使用恰當的少量導聯即可獲得與使用高密度導聯相近甚至更高的分類識別率。
同時,本文中的導聯選擇方法是基于受試者的單一時間段(一天)的測量數據,實驗過程需要采集全部導聯的所有EEG數據計算投影矩陣W,今后的工作重點是測試同一受試者的特征導聯組合是否具有一致性,即使用相同的導聯組合測試同一受試者不同時期采集的數據是否始終能夠獲得較好的分類識別率,或是針對不同時期采集的EEG數據是否具有相似的最優導聯,從而可以真正減少EEG信號采集過程中的導聯個數。