由于大腦信息編碼的稀疏特性, 微電極陣列記錄的神經元集群信號中包含大量的噪聲和冗余信息, 這降低了運動意圖解碼的穩定性和精確度。針對這一問題, 本文將偏最小二乘(PLS)特征提取應用于神經元集群解碼中, 首先采用PLS提取神經元集群鋒電位發放特征, 然后用支持向量機(SVM)對提取的特征進行分類, 解碼得到運動意圖。采集三組鴿子十字迷宮轉向實驗中的大腦神經元集群信號進行解碼, 結果表明, PLS結合分類模型的解碼方法克服了PLS回歸易受噪聲累積影響的缺點, 穩定性和解碼正確率均更高, 相比傳統的降維方法, PLS提取特征個數更少, 包含有用信息更多, 三組實測數據的解碼正確率分別為93.59%、84.00%和83.59%。
引用本文: 萬紅, 楊會, 劉新玉, 尚志剛. 運動意圖的偏最小二乘解碼研究. 生物醫學工程學雜志, 2016, 33(4): 626-630. doi: 10.7507/1001-5515.20160104 復制
引言
運動意圖解碼是腦機接口研究中的重要內容,其通過提取人或實驗動物的神經信號,解碼出運動信息來控制一些外部設備,對于挖掘人類認知潛能、殘障人康復、神經疾病治療等都具有重要的意義[1-2]。目前研究表明,大腦通過神經元集群方式動態編碼外部信息,并且,在作用于同一刺激的神經元群體中,只有極少數的神經元同時被激活,即神經信息的“稀疏編碼”[3]。因此,如何從多通道神經元集群信號中提取有效特征,是運動意圖解碼中的關鍵問題。
神經元集群信號具有高維、小樣本和強噪聲的特點,在神經解碼中應用較多的最優線性估計和卡爾曼濾波解碼算法,在神經數據多重共線性的情況下均容易出現模型估計失效的問題[4],因此,在神經解碼中需要采用有效的降維方法。常用的降維方法有主成分分析(principal component analysis,PCA)、粗糙集等。例如,Chapin等[5]使用PCA對神經信息進行降維,把信息從原有的特征空間變換到新的特征空間,僅使用第一主成分成功預測了大鼠前肢對機械桿的壓桿動作;Dai等[6]應用粗糙集理論從神經元與解碼目標相關的角度選出神經元進行解析,利用初級運動皮層神經元集群信號成功預測了大鼠前肢運動意圖。但是PCA只考慮神經數據各維度之間的相關性而忽略了與解析運動目標的相關性,粗糙集方法沒有考慮神經元之間的相關性,這些都可能會丟失有用的信息。
偏最小二乘(partial least squares,PLS)算法由于在變量選擇和降維方面的實用性,在腦圖像、計量化學、數據挖掘等領域得到廣泛應用[7-9],近年來也開始應用在神經元集群解碼的研究中。Chao等[10]將PLS用于腦皮層電信號的解碼,以克服過擬合的產生;王蕊[11]采用PLS方法判別猴子四種抓握方式,并根據模型回歸系數評價局部場電位各頻段在解碼中的重要性;朱凡等[12]采用PLS回歸解碼大鼠運動皮層鋒電位(spike)信號,預測大鼠壓桿壓力,相比卡爾曼濾波和維納濾波在時間和準確率上更有優越性;Chen等[13]采集猴子左腦中央溝和弓形溝中間腦回的腦皮質電信號,獲取各個通道的頻帶特征,采用PLS回歸預測猴子右手三維運動軌跡,取得了很好的效果。
在現有的神經解碼研究中,采用PLS回歸模型解碼動物運動意圖和運動軌跡均取得了很好的效果,但PLS本質上是一種線性方法,易受噪聲累積影響導致解碼效果變差。本文針對鴿子十字迷宮實驗數據,采用PLS提取神經元集群信號響應特征,結合支持向量機(support vector machine,SVM)解碼得到鴿子運動意圖,并與PLS回歸解碼進行對比,探究其對于提高PLS解碼效果的作用。
1 實驗數據
本文基于鴿子十字迷宮轉向實驗,采集鴿子轉向過程中弓狀皮質尾外側(nidopallium caudolaterale,NCL)神經元集群spike信號進行解碼,得到鴿子轉向意圖。鴿子NCL區類似于哺乳動物的前額葉皮質,現有鴿子行為研究表明,NCL區在工作記憶和行為控制中有重要作用[14-15]。十字迷宮轉向裝置如圖 1(a)所示,(b)為實驗流程示意圖,提示音響起,門打開,實驗開始,鴿子從起始臂走出,紅外檢測裝置記錄鴿子經過起始臂和目標臂中對應位置的時間,鴿子在轉向正確情況下獲得食物獎勵,錯誤時沒有獎勵,之后鴿子回到起始臂,門閉合,實驗結束。同步標記之間記錄的神經元集群活動包含意圖編碼信息,為本文運動意圖解碼信號。訓練前,將鴿子禁食,待體重降至原80%左右時開始訓練,一般訓練一周可達到90%以上的轉向正確率。

(a)十字迷宮實驗裝置;(b)實驗流程示意圖(直行)
Figure1. Installation and flow chart of pigeon plus-maze test(a) installation of plus-maze test; (b) test flow chart (straight)
選擇3只鴿子,分別編號P600、P609、P619,訓練成功后,在鴿子頭部兩側NCL區分別植入2×8微電極陣列,恢復后采用Cerebus128TM信號采集系統(Blackrock Microsystems,US)采集鴿子轉向時的NCL區神經活動信號,采樣頻率30 kHz。對采集的信號使用Butterworth帶通濾波器(0.25~5 kHz)濾波,然后用閾值法檢測spike發放(閾值設置為4倍信號標準差),并記錄發放時刻。對檢測到的各通道spike信號采用電極間相關法進行去噪,并對去噪后的spike進行分類,得到每個神經元的spike發放數據。本文實驗數據如表 1所示。

2 偏最小二乘原理
PLS集合了PCA、典型相關分析和多元線性回歸分析的功能,能同時從自變量X和因變量y中提取各自的潛變量,使其盡可能多地包含原變量中的變異信息,同時使兩者相關度達到最大,并最終建立因變量關于所提取潛變量的回歸方程,因此,特別適用于樣本數較小、變量個數較多且存在多重相關性的數據的回歸建模。
假設X和y均已做標準化處理,觀測數據的標準化數據陣分別為E0和F0,則PLS回歸建模的具體步驟如下:
首先求解矩陣E0TF0F0TE0最大特征值對應的特征向量w1,得到成分t1=w1TX,成分得分向量s1=w1TE0,然后建立E0和F0關于s1的最小二乘回歸方程,E0=s1α1T+E1,F0=s1β1T+F1,其中,α1=E0Ts1/‖s1‖2,β1=F0Ts1/‖s1‖2,E1和F1為殘差矩陣。然后,用殘差矩陣E1和F1代替E0和F0繼續提取第二個成分t2,求解矩陣E1TF1F1TE1最大特征值對應的特征向量w2,成分t2=w2TX,得分向量s2=w2TE1,E1和F1關于s2的回歸方程為E1=s2α2T+E2,F1=s2β2T+F2,其中,α2=E1Ts2/‖s2‖2,β2=F1Ts2/‖s2‖2,E2和F2為殘差矩陣。
重復以上步驟,根據精度要求確定提取成分個數r,數據陣E0的秩為A,則r≤A。提取r個成分t1, t2, …, tr,得到E0=s1α1T+s2α2T+…+srαrT+Er,F0=s1β1T+s2β2T+…+srβrT+Fr,自變量個數為m, 則把tk=wk1x1+wk2x2+…+wkmxm(k=1, 2, …, r)代入y=t1β1T+t2β2T+…trβrT,得到偏最小二乘回歸方程y=a1x1+a2x2+…+amxm。
3 運動意圖神經信息解碼
3.1 相關符號定義
圖 2為數據符號表征示意圖。假設實驗次數為n,每次實驗共記錄到p個神經元的spike信號。對第i次實驗,對每個神經元spike發放序列進行bins處理,設時間窗個數為q,計算各時間窗內spike的平均發放率,共得到q個變量,依次對p個神經元spike信號進行處理,然后將bins處理后的所有神經元spike發放率序列轉化為一維行向量,即為Xi=(Xi1, Xi2, …, Xip),變量個數m=p×q。對每次實驗數據進行處理,則得到n次實驗的數據(X1, y1),(X2, y2),…,(Xn, yn)。

3.2 偏最小二乘特征提取
特征提取是PLS的關鍵內容,提取的潛變量盡可能多地包含自變量與因變量的信息,并使之相關程度達到最大,是一種有監督的特征提取方法。
本文實驗數據中自變量X為采集到的所有神經元時間窗的spike發放率,因變量y={1, 2, 3},分別表示左轉、直行和右轉。假設X和y均已做標準化處理,對n次實驗數據(X1, y1),(X2, y2),…,(Xn, yn),采用PLS提取神經元集群spike發放特征,并根據5倍交叉驗證得到的鴿子全部轉向的分類正確率確定提取成分的個數r,提取潛變量ti1,ti2,…,tir,剔除多通道神經元集群信號中的噪聲和冗余信息,最后得到降維后的數據(t1, y1),(t2, y2),…,(tn, yn),其中ti=(ti1, ti2, …, tir),i=1, …, n。采用分類模型對降維后數據進行分類,則得到鴿子運動意圖的解碼結果。
3.3 支持向量機解碼
PLS特征提取后分類模型的選擇對于結果有很大影響,根據現有研究,采用SVM能取得較好效果[8-9]。SVM是以結構風險最小化原理為基礎的模式識別算法,具有較完備的理論基礎,在小樣本、非線性和高維數據模式識別問題中有很多優勢。因此,本文對PLS降維后的數據(t1, y1),(t2, y2),…,(tn, yn),用SVM作進一步的分類,并采用5倍交叉驗證法評價解碼效果。
4 結果與分析
4.1 時間窗長度確定
鴿子每次轉向標記區間的時間長度為2~4 s,時間窗的長度直接決定了輸入變量的維數及包含噪聲和信息冗余的程度。為確定適合的時間窗,選取不同的個數q,采用PLS-SVM解碼鴿子運動意圖。SVM核函數采用徑向基函數,懲罰因子c和核參數σ默認分別取1和0.07,時間窗個數分別取1、2、4、6、8、10,解碼正確率如圖 3所示。

從圖中可以看到,鴿子轉向的解碼正確率隨著時間窗個數增加而上升,趨于穩定后開始下降。時間窗個數為8時,三只鴿子的解碼結果均較好,正確率分別為93.59%、84.00%和83.59%,PLS提取潛變量個數分別為3、3、9。對三組數據時間長度做統計分析,得到此時時間窗長度在200~400 ms范圍內。
4.2 PLS-SVM與PLS回歸解碼對比
為探究PLS特征提取結合SVM分類模型對運動意圖解碼的效果,時間窗個數取8,同時采用PLS回歸模型和PLS-SVM對三只鴿子的NCL區神經元集群數據進行解碼,采用5倍交叉驗證方法,得到結果如表 2所示。

可以看到,直接采用PLS回歸模型進行解碼時不同個體的結果區別較大,P600解碼正確率為81.28%,P609和P619只有45%左右,模型穩定性較差;而PLS-SVM的解碼正確率均在80%以上,最高為93.59%,明顯高于PLS回歸,且穩定性更好。這可能是因為PLS回歸本質上是一種線性方法,在鴿子運動意圖解碼中,由于變量維度過高,噪聲的累積影響了模型的穩定性,使解碼的效果變差;而PLS-SVM則充分利用了PLS在特征提取上的優勢,結合SVM提高了模型的穩定性,獲得了更好的解碼效果。
4.3 PLS與PCA降維對比
為探究PLS對去除神經元集群信號中包含的噪聲和冗余信息,以及提高解碼效果的作用,同時采用傳統的PCA降維方法提取特征,時間窗個數為8,結果對比如圖 4所示。可以看到,對三組實測數據,PLS提取特征個數均遠小于PCA,兩種方法的平均值分別為5和21。

對PCA降維后的數據采用SVM進行分類,三只鴿子運動轉向的解碼正確率分別為55.90%、36.89%和36.03%,均值為42.94%,遠低于采用PLS降維的解碼結果,且標準差為11.23%,穩定性也較低。可見,PLS由于同時考慮了神經元集群信號與解碼目標的相關性,相比PCA降維,不僅提取的特征個數更少,而且包含的有用信息更多,去除了更多的噪聲和冗余信息,從而能夠有效提高解碼的效果。
5 結論
本文將PLS結合SVM的算法應用于鴿子NCL區神經元集群信號的解碼中,針對十字迷宮實驗數據,首先采用PLS提取有效特征,然后結合SVM解碼運動意圖,解決了PLS回歸模型易受噪聲累積影響導致不同個體數據解碼結果區別較大的問題,提高了解碼的正確率和模型的穩定性,同時對PLS與傳統PCA降維方法進行了對比,得到如下結論:
(1)?PLS回歸本質上是PLS特征提取和最小二乘回歸的結合,在運動意圖解碼中雖然也能得到較好的結果,但在噪聲過多的情況下效果較差,不同個體數據結果區別較大。將PLS作為一種特征提取方法,與分類模型SVM結合,能極大地提高解碼的效果。
(2)?PLS作為一種有監督的特征提取方法,相比傳統的PCA降維,能有效去除信號中包含的噪聲和冗余信息,提取的特征包含有用信息更多,且個數更少,結合同樣的分類模型,效果明顯更好,對于提高神經元集群解碼效果作用顯著。
(3)?時間窗長度對于運動意圖解碼有很大影響,時間窗過長或過短都不能很好地包含意圖信息以及取得較好的解碼效果。在本文基于PLS特征提取的鴿子NCL區運動意圖解碼中,最佳時間窗長度范圍為200~400 ms。
引言
運動意圖解碼是腦機接口研究中的重要內容,其通過提取人或實驗動物的神經信號,解碼出運動信息來控制一些外部設備,對于挖掘人類認知潛能、殘障人康復、神經疾病治療等都具有重要的意義[1-2]。目前研究表明,大腦通過神經元集群方式動態編碼外部信息,并且,在作用于同一刺激的神經元群體中,只有極少數的神經元同時被激活,即神經信息的“稀疏編碼”[3]。因此,如何從多通道神經元集群信號中提取有效特征,是運動意圖解碼中的關鍵問題。
神經元集群信號具有高維、小樣本和強噪聲的特點,在神經解碼中應用較多的最優線性估計和卡爾曼濾波解碼算法,在神經數據多重共線性的情況下均容易出現模型估計失效的問題[4],因此,在神經解碼中需要采用有效的降維方法。常用的降維方法有主成分分析(principal component analysis,PCA)、粗糙集等。例如,Chapin等[5]使用PCA對神經信息進行降維,把信息從原有的特征空間變換到新的特征空間,僅使用第一主成分成功預測了大鼠前肢對機械桿的壓桿動作;Dai等[6]應用粗糙集理論從神經元與解碼目標相關的角度選出神經元進行解析,利用初級運動皮層神經元集群信號成功預測了大鼠前肢運動意圖。但是PCA只考慮神經數據各維度之間的相關性而忽略了與解析運動目標的相關性,粗糙集方法沒有考慮神經元之間的相關性,這些都可能會丟失有用的信息。
偏最小二乘(partial least squares,PLS)算法由于在變量選擇和降維方面的實用性,在腦圖像、計量化學、數據挖掘等領域得到廣泛應用[7-9],近年來也開始應用在神經元集群解碼的研究中。Chao等[10]將PLS用于腦皮層電信號的解碼,以克服過擬合的產生;王蕊[11]采用PLS方法判別猴子四種抓握方式,并根據模型回歸系數評價局部場電位各頻段在解碼中的重要性;朱凡等[12]采用PLS回歸解碼大鼠運動皮層鋒電位(spike)信號,預測大鼠壓桿壓力,相比卡爾曼濾波和維納濾波在時間和準確率上更有優越性;Chen等[13]采集猴子左腦中央溝和弓形溝中間腦回的腦皮質電信號,獲取各個通道的頻帶特征,采用PLS回歸預測猴子右手三維運動軌跡,取得了很好的效果。
在現有的神經解碼研究中,采用PLS回歸模型解碼動物運動意圖和運動軌跡均取得了很好的效果,但PLS本質上是一種線性方法,易受噪聲累積影響導致解碼效果變差。本文針對鴿子十字迷宮實驗數據,采用PLS提取神經元集群信號響應特征,結合支持向量機(support vector machine,SVM)解碼得到鴿子運動意圖,并與PLS回歸解碼進行對比,探究其對于提高PLS解碼效果的作用。
1 實驗數據
本文基于鴿子十字迷宮轉向實驗,采集鴿子轉向過程中弓狀皮質尾外側(nidopallium caudolaterale,NCL)神經元集群spike信號進行解碼,得到鴿子轉向意圖。鴿子NCL區類似于哺乳動物的前額葉皮質,現有鴿子行為研究表明,NCL區在工作記憶和行為控制中有重要作用[14-15]。十字迷宮轉向裝置如圖 1(a)所示,(b)為實驗流程示意圖,提示音響起,門打開,實驗開始,鴿子從起始臂走出,紅外檢測裝置記錄鴿子經過起始臂和目標臂中對應位置的時間,鴿子在轉向正確情況下獲得食物獎勵,錯誤時沒有獎勵,之后鴿子回到起始臂,門閉合,實驗結束。同步標記之間記錄的神經元集群活動包含意圖編碼信息,為本文運動意圖解碼信號。訓練前,將鴿子禁食,待體重降至原80%左右時開始訓練,一般訓練一周可達到90%以上的轉向正確率。

(a)十字迷宮實驗裝置;(b)實驗流程示意圖(直行)
Figure1. Installation and flow chart of pigeon plus-maze test(a) installation of plus-maze test; (b) test flow chart (straight)
選擇3只鴿子,分別編號P600、P609、P619,訓練成功后,在鴿子頭部兩側NCL區分別植入2×8微電極陣列,恢復后采用Cerebus128TM信號采集系統(Blackrock Microsystems,US)采集鴿子轉向時的NCL區神經活動信號,采樣頻率30 kHz。對采集的信號使用Butterworth帶通濾波器(0.25~5 kHz)濾波,然后用閾值法檢測spike發放(閾值設置為4倍信號標準差),并記錄發放時刻。對檢測到的各通道spike信號采用電極間相關法進行去噪,并對去噪后的spike進行分類,得到每個神經元的spike發放數據。本文實驗數據如表 1所示。

2 偏最小二乘原理
PLS集合了PCA、典型相關分析和多元線性回歸分析的功能,能同時從自變量X和因變量y中提取各自的潛變量,使其盡可能多地包含原變量中的變異信息,同時使兩者相關度達到最大,并最終建立因變量關于所提取潛變量的回歸方程,因此,特別適用于樣本數較小、變量個數較多且存在多重相關性的數據的回歸建模。
假設X和y均已做標準化處理,觀測數據的標準化數據陣分別為E0和F0,則PLS回歸建模的具體步驟如下:
首先求解矩陣E0TF0F0TE0最大特征值對應的特征向量w1,得到成分t1=w1TX,成分得分向量s1=w1TE0,然后建立E0和F0關于s1的最小二乘回歸方程,E0=s1α1T+E1,F0=s1β1T+F1,其中,α1=E0Ts1/‖s1‖2,β1=F0Ts1/‖s1‖2,E1和F1為殘差矩陣。然后,用殘差矩陣E1和F1代替E0和F0繼續提取第二個成分t2,求解矩陣E1TF1F1TE1最大特征值對應的特征向量w2,成分t2=w2TX,得分向量s2=w2TE1,E1和F1關于s2的回歸方程為E1=s2α2T+E2,F1=s2β2T+F2,其中,α2=E1Ts2/‖s2‖2,β2=F1Ts2/‖s2‖2,E2和F2為殘差矩陣。
重復以上步驟,根據精度要求確定提取成分個數r,數據陣E0的秩為A,則r≤A。提取r個成分t1, t2, …, tr,得到E0=s1α1T+s2α2T+…+srαrT+Er,F0=s1β1T+s2β2T+…+srβrT+Fr,自變量個數為m, 則把tk=wk1x1+wk2x2+…+wkmxm(k=1, 2, …, r)代入y=t1β1T+t2β2T+…trβrT,得到偏最小二乘回歸方程y=a1x1+a2x2+…+amxm。
3 運動意圖神經信息解碼
3.1 相關符號定義
圖 2為數據符號表征示意圖。假設實驗次數為n,每次實驗共記錄到p個神經元的spike信號。對第i次實驗,對每個神經元spike發放序列進行bins處理,設時間窗個數為q,計算各時間窗內spike的平均發放率,共得到q個變量,依次對p個神經元spike信號進行處理,然后將bins處理后的所有神經元spike發放率序列轉化為一維行向量,即為Xi=(Xi1, Xi2, …, Xip),變量個數m=p×q。對每次實驗數據進行處理,則得到n次實驗的數據(X1, y1),(X2, y2),…,(Xn, yn)。

3.2 偏最小二乘特征提取
特征提取是PLS的關鍵內容,提取的潛變量盡可能多地包含自變量與因變量的信息,并使之相關程度達到最大,是一種有監督的特征提取方法。
本文實驗數據中自變量X為采集到的所有神經元時間窗的spike發放率,因變量y={1, 2, 3},分別表示左轉、直行和右轉。假設X和y均已做標準化處理,對n次實驗數據(X1, y1),(X2, y2),…,(Xn, yn),采用PLS提取神經元集群spike發放特征,并根據5倍交叉驗證得到的鴿子全部轉向的分類正確率確定提取成分的個數r,提取潛變量ti1,ti2,…,tir,剔除多通道神經元集群信號中的噪聲和冗余信息,最后得到降維后的數據(t1, y1),(t2, y2),…,(tn, yn),其中ti=(ti1, ti2, …, tir),i=1, …, n。采用分類模型對降維后數據進行分類,則得到鴿子運動意圖的解碼結果。
3.3 支持向量機解碼
PLS特征提取后分類模型的選擇對于結果有很大影響,根據現有研究,采用SVM能取得較好效果[8-9]。SVM是以結構風險最小化原理為基礎的模式識別算法,具有較完備的理論基礎,在小樣本、非線性和高維數據模式識別問題中有很多優勢。因此,本文對PLS降維后的數據(t1, y1),(t2, y2),…,(tn, yn),用SVM作進一步的分類,并采用5倍交叉驗證法評價解碼效果。
4 結果與分析
4.1 時間窗長度確定
鴿子每次轉向標記區間的時間長度為2~4 s,時間窗的長度直接決定了輸入變量的維數及包含噪聲和信息冗余的程度。為確定適合的時間窗,選取不同的個數q,采用PLS-SVM解碼鴿子運動意圖。SVM核函數采用徑向基函數,懲罰因子c和核參數σ默認分別取1和0.07,時間窗個數分別取1、2、4、6、8、10,解碼正確率如圖 3所示。

從圖中可以看到,鴿子轉向的解碼正確率隨著時間窗個數增加而上升,趨于穩定后開始下降。時間窗個數為8時,三只鴿子的解碼結果均較好,正確率分別為93.59%、84.00%和83.59%,PLS提取潛變量個數分別為3、3、9。對三組數據時間長度做統計分析,得到此時時間窗長度在200~400 ms范圍內。
4.2 PLS-SVM與PLS回歸解碼對比
為探究PLS特征提取結合SVM分類模型對運動意圖解碼的效果,時間窗個數取8,同時采用PLS回歸模型和PLS-SVM對三只鴿子的NCL區神經元集群數據進行解碼,采用5倍交叉驗證方法,得到結果如表 2所示。

可以看到,直接采用PLS回歸模型進行解碼時不同個體的結果區別較大,P600解碼正確率為81.28%,P609和P619只有45%左右,模型穩定性較差;而PLS-SVM的解碼正確率均在80%以上,最高為93.59%,明顯高于PLS回歸,且穩定性更好。這可能是因為PLS回歸本質上是一種線性方法,在鴿子運動意圖解碼中,由于變量維度過高,噪聲的累積影響了模型的穩定性,使解碼的效果變差;而PLS-SVM則充分利用了PLS在特征提取上的優勢,結合SVM提高了模型的穩定性,獲得了更好的解碼效果。
4.3 PLS與PCA降維對比
為探究PLS對去除神經元集群信號中包含的噪聲和冗余信息,以及提高解碼效果的作用,同時采用傳統的PCA降維方法提取特征,時間窗個數為8,結果對比如圖 4所示。可以看到,對三組實測數據,PLS提取特征個數均遠小于PCA,兩種方法的平均值分別為5和21。

對PCA降維后的數據采用SVM進行分類,三只鴿子運動轉向的解碼正確率分別為55.90%、36.89%和36.03%,均值為42.94%,遠低于采用PLS降維的解碼結果,且標準差為11.23%,穩定性也較低。可見,PLS由于同時考慮了神經元集群信號與解碼目標的相關性,相比PCA降維,不僅提取的特征個數更少,而且包含的有用信息更多,去除了更多的噪聲和冗余信息,從而能夠有效提高解碼的效果。
5 結論
本文將PLS結合SVM的算法應用于鴿子NCL區神經元集群信號的解碼中,針對十字迷宮實驗數據,首先采用PLS提取有效特征,然后結合SVM解碼運動意圖,解決了PLS回歸模型易受噪聲累積影響導致不同個體數據解碼結果區別較大的問題,提高了解碼的正確率和模型的穩定性,同時對PLS與傳統PCA降維方法進行了對比,得到如下結論:
(1)?PLS回歸本質上是PLS特征提取和最小二乘回歸的結合,在運動意圖解碼中雖然也能得到較好的結果,但在噪聲過多的情況下效果較差,不同個體數據結果區別較大。將PLS作為一種特征提取方法,與分類模型SVM結合,能極大地提高解碼的效果。
(2)?PLS作為一種有監督的特征提取方法,相比傳統的PCA降維,能有效去除信號中包含的噪聲和冗余信息,提取的特征包含有用信息更多,且個數更少,結合同樣的分類模型,效果明顯更好,對于提高神經元集群解碼效果作用顯著。
(3)?時間窗長度對于運動意圖解碼有很大影響,時間窗過長或過短都不能很好地包含意圖信息以及取得較好的解碼效果。在本文基于PLS特征提取的鴿子NCL區運動意圖解碼中,最佳時間窗長度范圍為200~400 ms。