鋒電位(spike)和局部場電位(LFP)是神經信息解碼中最重要的兩種候選信號。目前對于哺乳類動物的spike信號和LFP信號的解碼性能已有諸多研究,但是鳥類大腦這兩種信號的解碼性能并不清楚。本文利用6只鴿子為模式動物,基于留一法和k近鄰的神經解碼算法(LOO-kNN)研究了目標導向抉擇任務中弓狀皮質尾外側區spike信號和LFP信號的解碼性能,探討了通道個數、解碼窗口的位置、長度以及最近鄰k值等參數對解碼性能的影響。本文研究結果表明,spike信號和LFP信號都能有效解碼出目標導向抉擇任務中鴿子的運動意圖,但是相比之下,LFP信號解碼性能更優異,而且受通道個數的影響較弱。對于解碼窗口而言,最佳解碼窗口位于目標導向抉擇過程的后半段,而且LFP信號最佳解碼窗口長度(0.3 s)明顯短于spike信號最佳解碼窗口長度(1 s)。對于LOO-kNN算法來說,解碼正確率與k值的大小基本成反比,k值越小解碼正確率越高。通過以上本文研究結果,期望本文方法有助于大腦神經信息處理機制的解析,對于腦—機接口等進一步深入研究提供一定的參考價值。
引用本文: 劉新玉, 平燕娜, 王東云, 姚汝賢, 萬紅. 鴿子目標導向抉擇任務中鋒電位和局部場電位解碼性能對比研究. 生物醫學工程學雜志, 2018, 35(5): 786-793. doi: 10.7507/1001-5515.201712038 復制
引言
神經信息解碼是基于大腦神經信號并利用信號處理與模式識別算法,實現對外界刺激參數的預測或解讀,比如圖像、氣味、運動軌跡、意圖等[1-4],其對于神經信息處理機制解析及腦—機接口研發等都具有十分重要的意義。在神經信息解碼的候選信號中,基于微電極陣列胞外方式采集的神經信號由于具有較高的時間和空間分辨率[5],得到了大多數研究人員的青睞。微電極陣列記錄的神經活動主要由兩種信號組成,即以耗能形式主動傳播的高頻鋒電位(spike)(0.25~5 kHz)和在傳播中會發生衰減和變形的低頻局部場電位(local field potential, LFP)(0~0.25 kHz)。雖然這兩種信號分布在不同的頻帶,而且具有不同的編碼模式,但是它們都攜帶有外界刺激信息,在目前運動意圖神經信息解碼中得到了廣泛應用。
對于 spike 和 LFP 信號解碼性能的研究由來已久。早在 20 世紀 90 年代末,Chapin 等[6]就利用大鼠運動皮層 spike 信號實現了對壓桿行為中前肢運動意圖的解碼,并且針對不同動物的解碼正確率基本都在 60% 以上。2003 年,Mehring 等[7]對比分析了 spike 信號和 LFP 信號的解碼性能,發現在猴子手部運動的解碼中,LFP 信號和 spike 信號具有類似的解碼性能。隨后,經過大量的實驗研究發現,在神經信息解碼中 spike 信號和 LFP 信號各有千秋,在解碼精度上 spike 信號的性能要優于 LFP 信號,但是在長期解碼中,LFP 信號則具有更好的可靠性和穩定性[8-9]。但是,目前對于 spike 信號和 LFP 信號解碼性能的研究都是在大(小)鼠、猴子等哺乳動物上開展的,鳥類的研究較少。相對于哺乳動物,鳥類獨自經歷了近 3 億年的進化歷程,而且在運動方式、生活習性等上都存在差異,它們是否分享了類似的神經計算原理還有待檢驗。
針對鳥類大腦 spike 信號和 LFP 信號的解碼性能,本文以鴿子為模式動物,利用基于留一法(leave-one-out, LOO)和 k 最近鄰(k-nearest neighbor, kNN)的神經解碼算法——LOO-kNN 算法,結合微電極陣列采集當鴿子執行以食物和指示燈為目標,選擇最終目的地的“目標導向抉擇任務”時弓狀皮質尾外側區(nidopallium caudolaterale, NCL)的神經信號,對比了 spike 信號和 LFP 信號的解碼性能,討論了通道個數、解碼窗口的位置、長度等參數對于解碼性能的影響,并分析了最近鄰 k 值變化時解碼正確率的動態變化特性。基于本文的研究結果,將有助于解析鴿子大腦的神經信息處理機制,今后對于腦—機接口等智能假肢的研究或可具有一定的參考價值。
1 材料與方法
1.1 神經解碼算法
在神經信息解碼中,本文利用 LOO-kNN 算法,分析了目標導向抉擇任務中 NCL 區 spike 信號和 LFP 信號對鴿子運動意圖的解碼性能。本文將 kNN 算法與 LOO 算法相結合,不僅能夠提高樣本的利用率,而且在類別決策時,只與極少量的相鄰樣本有關,可在一定程度上減少噪聲樣本對分類的干擾。
1.1.1 kNN 算法
kNN 算法是一種經典的非參數分類方法,其工作原理是首先找到被分類對象在訓練數據集中的 k 個最近的鄰居,然后根據這些鄰居的分類屬性進行投票,將得出的預測值賦給被分類對象的分類屬性[10]。假設存在 n 個樣本 x1, x2,
, xn,已知每個樣本的分類屬性 y1, y2,
, yn。樣本 xi(i = 1, 2,
, n) 為多維變量,分類屬性 yi 為離散性變量,其值域定義為 C,C = {c1, c2,
, cm},yi ∈ C,m ≤ n。對于一個新樣本 x,為了獲得其分類屬性 y,首先應計算新樣本與每個已知樣本的距離,然后根據距離的大小對已知樣本重新進行排序,即如式(1)所示:
![]() |
其中‖·‖表示距離范式,x(i)(i = 1, 2,
, n)表示重新排序的樣本。與新樣本 x 距離最小的 k 個已知樣本即為新樣本的 k 個最近鄰,x 的分類屬性就由其 k 個近鄰的分類屬性投票決定,即如式(2)所示:
![]() |
其中 Ck 為樣本 x 的 k 個最近鄰分類屬性的值域。
綜上所述,kNN 算法的性能由兩個參數決定,即最近鄰的個數和距離范式。根據文獻[10]的研究結果,如果沒有特別說明,本文選用近鄰個數 k = 1 和歐氏(Euclidean)距離進行 kNN 算法的計算。
1.1.2 LOO-kNN 解碼算法
LOO 算法是一種通常用來訓練和測試分類器的交叉驗證方法[11],本文將其與 kNN 算法進行了結合。假設每只鴿子進行 N 次實驗并分別記錄,即 N 個樣本,共包含有 M 個運動方向,即其分類屬性的值域為 C = {c1, c2,
, cm}。
關于 LOO-kNN 算法的基本原理在文獻[12-13]已進行過詳細敘述,本文簡述如下:每只鴿子,對于其 N 個樣本,首先選取其中 1 個樣本作為測試集,其余 N – 1 個樣本則作為訓練集,并對其進行類別標記;其次利用 kNN 算法和訓練集獲得測試樣本的類別屬性,作為該樣本的解碼結果。如此循環,直到解碼出所有 N 個樣本的類別屬性,即運動方向。最后,將解碼出的 N 個樣本的類別與其真實類別進行對比,即可得到解碼的正確率(accuracy,以符號 A 表示),即如式(3)所示:
![]() |
其中 Nright 為正確解碼的樣本個數。
1.2 信號采集與處理
本文實驗動物選用 6 只經過預訓練篩選后的成年家鴿,體重 450~550 g,雌雄各半。實驗中,訓練鴿子在十字迷宮中執行目標導向抉擇任務,如圖 1 所示。關于實驗鴿子行為訓練范式和神經信號的采集與處理詳細信息參考文獻[12-13],本文簡述如小節 1.2.1~1.2.3 所示。
1.2.1 行為訓練
如圖 1 所示,訓練中首先將鴿子放置在等待區,訓練鴿子在提示音響起后由抉擇臂進入“十字迷宮”,在十字路口根據放置在獎勵臂末端的線索(食物和指示燈)進行“目標導向抉擇任務”(左轉、右轉或直行),待鴿子獲得食物獎勵后,必須返回實驗等待區,等待下一次實驗的開始。如果鴿子正確執行了行為范式,將在等待區額外獲得一次食物獎勵。每次實驗中,提示線索出現的方向是隨機的。待鴿子在連續兩天中行為正確率大于 90% 時,進行微電極陣列的植入。

1.2.2 信號采集
微電極陣列植入手術前,將實驗鴿子進行全身麻醉,俯臥固定于腦立體定位儀(ST-5ND-C,成都儀器廠,中國)上。參考鴿子腦立體定位圖譜[14],確定 NCL 區位置,去除顱骨和硬腦膜,進行微電極陣列(4 × 4 排列,共 16 通道)植入。待電極到達目標位置后,用牙科水泥(II 型,香港德派實業有限公司生產)對電極進行固定,并進行傷口縫合和消毒處理,等待動物蘇醒與恢復。經過 5~7 d 恢復之后,開始對鴿子進行神經信號采集,即在鴿子執行 1.2.1 小節介紹的相關行為任務的同時,用神經信號采集裝置(CerebusTM, Blockrock Inc., 美國)檢測鴿子 NCL 區的神經信號。實驗中共采集了 6 只鴿子的神經信號,這 6 只鴿子分別編號為 P010、P600、P601、P605、P609 和 P619。
1.2.3 信號處理
針對 1.2.2 小節采集后的 spike 信號,處理方式依序為:濾波(0.25~5 kHz)、spike 信號檢測、去噪,獲得不同通道的 spike 信號發放序列。其中濾波器采用神經信號采集裝置默認的二階巴特沃斯(Butterworth)濾波器;spike 信號檢測采用經典的幅度閾值法,閾值為 4~5 倍信號均方根,用于將 spike 信號與背景噪聲分離;去噪算法采用具有較高識別精度且易于實現的電極間相關法[15],用于去除 spike 信號中誤檢的大幅值干擾。而對于采集的 LFP 信號,同樣需經過以下處理:濾波(0~0.25 kHz)、去除基線漂移、降采樣、去噪,獲得不同通道的 LFP 信號。其中去噪環節采用自適應共同空間參考算法[16],該算法將自適應干擾對消與共同空間參考相結合,能在提高信號去噪性能的同時降低信號的畸變。spike 信號的采樣頻率為 30 kHz,LFP 信號的采樣頻率為 2 kHz。
1.3 統計分析
文中解碼特征和解碼正確率等一般以均值 ± 標準差的形式表示。在統計分析中,利用威爾科克森(Wilcoxon)秩和檢驗度量差異是否具有統計學意義[17],顯著性水平設置為 5%,即 P < 0.05 被認為差異具有統計學意義。在統計分析中,威爾科克森秩和檢驗是一種非參數檢驗方法,其利用樣本秩代替了樣本值,不要求樣本總體服從正態分布。
2 結果
2.1 單個通道解碼性能的對比分析
如圖 2 所示,給出了目標導向抉擇任務中微電極陣列采集的典型 spike 信號和 LFP 信號,圖中自動門、轉向前紅外檢測器(turning begin sensor, TBS)和轉向后紅外檢測器(turning end sensor, TES)的位置分別用紅色豎直線標識。圖中的紅色矩形虛線標記了實驗鴿子在執行目標導向抉擇任務中的 spike 信號發放序列和 LFP 信號波形圖。由圖 2 可知,在實驗鴿子執行目標導向抉擇任務中 spike 信號發放率和 LFP 信號的高頻振蕩都明顯增加,在 TES 附近達到峰值。因此,在分析 spike 信號和 LFP 信號解碼性能時,選取 TES 附近 1 s 的窗口內,即從 TES 前 0.5 s 到 TES 后 0.5 s 之間的神經信號作為解碼信號。

此外,為了提取實驗鴿子執行目標導向抉擇任務過程中神經信號的解碼特征,根據文獻[12-13]的研究結果,對于 spike 信號,將解碼時間窗中 spike 信號發放率作為 spike 信號的解碼特征,而對于 LFP 信號,將 LFP 信號中 0~100 Hz 均分成 10 個不同的子帶,即 0~10 Hz, 10~20 Hz,
, 90~100 Hz,通過計算不同子帶的發放率,選取 40~50 Hz 和 50~60 Hz 兩個子帶,即 40~60 Hz 中信號能量作為 LFP 信號的解碼特征。
如圖 3 所示,給出了單個通道 spike 信號和 LFP 信號的解碼性能。圖中的虛線為隨機解碼正確率(1/3≈33%),即三個方向隨機進行選擇的正確率。由圖 3 可知,對于 spike 信號,單個通道的解碼正確率并不高,6 只鴿子的解碼正確率都低于 60%,而且只有兩只鴿子,編號為 P600 和 P605的解碼正確率高于隨機解碼正確率,差異具有統計學意義(P < 0.05)。但是對于 LFP 信號,大部分鴿子的解碼正確率都高于 60%,而且 6 只鴿子單個通道的解碼正確率都高于隨機解碼正確率,差異具有統計學意義( P < 0.05),甚至有些通道的解碼正確率高于 95%,比如編號為 P605 的第 13 通道和編號為 P609 的第 10 和第 16 通道。

2.2 通道個數對解碼性能的影響分析
如圖 4 所示,給出了 spike 信號和 LFP 信號解碼正確率與通道個數之間的變化關系。圖中解碼正確率曲線為所有通道(共 16 個)根據通道個數隨機選擇的 10 次重復實驗平均值,即每次計算時從所有通道中隨機選擇相應的通道數計算解碼正確率,并重復 10 次,計算其平均值。由圖可知,對于 spike 信號,隨著通道個數的增加,除編號為 P605 和編號為 P609 的鴿子之外,其余 4 只鴿子的解碼正確率都有明顯提高,其中編號為 P600 的鴿子最大解碼正確率甚至達到了 95% 以上。而對于 LFP 信號,隨著通道個數的增加,LFP 信號解碼正確率增加并不明顯。但是對于不同的通道個數,LFP 信號都能獲得較好的解碼性能。

*
*
在此基礎上,本文對比分析了單個通道和全部通道(即 16 個通道)作為解碼特征時 spike 信號和 LFP 信號解碼正確率,結果如圖 4 所示。由圖 4 可知,對于 spike 信號,全部通道作為解碼特征時的解碼正確率明顯高于單個通道作為解碼特征時的解碼正確率,差異具有統計學意義(P < 0.05)。而對于 LFP 信號,盡管全部通道作為解碼特征時解碼正確率也高于單個通道作為解碼特征時的解碼正確率,但是差異并不具有統計學意義( P > 0.05)。
此外,如圖 4 所示,進一步分析了全部通道作為解碼特征時解碼正確率的混淆矩陣(confusion matrix)。混淆矩陣也被稱作錯誤矩陣(error matrix),是一種評價分類性能的可視化矩陣,其中每一列表示預測的類別,每一行表示真實的類別,每個矩陣塊中的數值表示預測的正確率。從混淆矩陣可知,對于 spike 信號,其對左轉和直行的分類能力要優于對右轉的分類能力,而對于 LFP 信號,其對不同方向的預測能力比較均衡,預測性能也優于 spike 信號的預測性能。
2.3 解碼窗口位置對解碼性能的影響分析
在 2.1 節和 2.2 節對 spike 和 LFP 信號解碼性能分析的基礎上,進一步分析了解碼窗口位置對解碼性能的影響,結果如圖 5 所示。圖中的圓圈為 6 只鴿子的平均解碼正確率,實線為二階多項式的擬合結果。為了獲得最佳的解碼窗口位置,在分析解碼窗口位置對解碼正確率的影響時,將其分為以 TBS 位置為對齊點和以 TES 位置為對齊點兩種情況進行討論,兩種情況中窗長都為 1 s,步長為 0.1 s,總時長為 3 s。
由圖 5 中的二階多項式的擬合曲線可知,無論是以 TBS 為對齊點還是以 TES 為對齊點,結果都顯示,在實驗鴿子執行目標導向抉擇任務過程中,越接近 TES 解碼正確率越高,這一結果也與神經信號響應的位置基本吻合。但相比之下,以 TES 為對齊點的解碼正確率峰值要高于以 TBS 為對齊點的解碼正確率峰值。而且,就整體而言,LFP 信號的解碼正確率高于 spike 信號的解碼正確率。

2.4 解碼窗口長度對解碼性能的影響分析
除了解碼窗口的位置,解碼窗口的長度也影響著神經信號的解碼性能。由圖 6 所示,分析了解碼窗口的長度對解碼正確率的影響。根據 2.3 節的分析結果,解碼窗口的位置以 TES 為對齊點,初始解碼窗口的長度和步長都設置為 0.1 s,總時長為 2 s。圖中的圓圈為 6 只鴿子的平均解碼正確率,實線為二階多項式的擬合結果。由圖 6 可知,隨著解碼窗口長度的增加,spike 信號和 LFP 信號的解碼正確率都是先增加后下降,但是 spike 信號在解碼窗口長度為 1 s 附近達到峰值,LFP 信號則在解碼窗口長度為 0.3 s 附近達到峰值。基于二階多項式的擬合結果來看,spike 信號解碼正確率出現了明顯的峰值,但是 LFP 信號解碼正確率則近似為直線下降。這一結果表明在獲得最優的解碼性能時 spike 信號的耗時可能更長。

2.5 最近鄰 k 值對解碼性能的影響分析
由圖 7 所示,分析了最近鄰 k 值對解碼正確率的影響。最近鄰 k 值的初始值設置為 1,步長也設置為 1。圖中的圓圈為 6 只鴿子的平均解碼正確率,實線為一階多項式的擬合結果。由圖 7 可知,無論是 spike 信號還是 LFP 信號,隨著 k 值的增加,解碼正確率基本呈下降趨勢。但相比之下,LFP 信號解碼正確率的下降趨勢更明顯。而且最近鄰 k 值的大小與解碼正確率基本呈反比,即 k 值越大解碼正確率越低。這一結果表明,最近鄰 k 值也影響了神經信號的解碼性能。

3 討論
在神經信息解碼中,spike 信號和 LFP 信號是兩種最主要的候選信號[18],對于腦—機接口、大腦信息處理機制解析等都具有重要意義。本文對比分析了鴿子 NCL 區 spike 信號和 LFP 信號在神經信息解碼中的性能,并在此基礎上進一步分析了通道個數、解碼窗口的位置、長度及最近鄰 k 值等參數對解碼正確率的影響。研究結果表明:① 盡管 spike 信號和 LFP 信號都能解碼目標導向抉擇任務中鴿子的運動意圖,但是相比之下,LFP 信號具有更優異的解碼性能;②spike 信號解碼性能受通道個數的影響較大,LFP 信號解碼性能受其影響則較小,這表明不同通道之間 LFP 信號可能具有更大的信息冗余;③ 解碼窗口的位置和長度都會影響解碼正確率,研究發現響應越強烈的位置解碼正確率一般越大;④ 對于 LOO-kNN 解碼算法,解碼性能與最近鄰 k 值的大小成反比,較小的近鄰個數得到的解碼性能更優。
對于微電極陣列采集的兩種不同頻帶范圍的神經信號,spike 信號來自于電極尖端附近單個神經元的活動,LFP 信號則是電極尖端附近神經元興奮性和抑制性突觸后電位的總和[19]。本文的研究發現,對于單個通道而言,LFP 信號解碼正確率要優于 spike 信號解碼正確率,但是隨著通道個數的增加,6 只鴿子中 4 只鴿子的 spike 信號解碼正確率都明顯增加,但所有鴿子的 LFP 信號解碼正確率變化都不明顯。這一結果表明不同通道 LFP 信號之間的信息冗余要大于 spike 信號之間的信息冗余,這與這兩種信號的特性基本是一致的。此外,研究還發現,大部分鴿子的 spike 信號和 LFP 信號之間的解碼性能基本一致,即如果 spike 信號表現出較好的解碼性能,則 LFP 信號的解碼性能也不差。但是這種對應關系并不是絕對的,比如編號為 P605 鴿子,其 spike 信號的解碼正確率并不高,而 LFP 信號卻表現出較高的解碼正確率。而且,就整體而言,LFP 信號的解碼正確率整體上也要優于 spike 信號的解碼正確率。這意味著對于長期植入的微電極陣列信號采集實驗,LFP 信號可能更適合作為神經信息解碼的候選信號。
此外,在解碼參數上,本文的研究結果發現,無論是以 TBS 為對齊點還是以 TES 為對齊點,TES 附近的解碼正確率都明顯高于 TBS 附近的解碼正確率,而且相比之下,以 TES 為對齊點的解碼正確率整體上要高于以 TBS 為對齊點的解碼正確率。這表明,神經信號的解碼性能除了與解碼窗口的位置有關外,與對齊點的位置可能也有關,這暗示著在微電極陣列信號采集實驗中對齊點的位置也影響著實驗結果。在目標導向抉擇任務中,誘導鴿子進行抉擇的線索,即目標位于獎勵臂的末端,鴿子到達十字路口并發現目標位置之前,是不能進行抉擇的,因此鴿子進行抉擇的行為應該是看到食物后進行的,即靠近 TES 位置,這可能也是 TES 附近解碼正確率高于 TBS 附近解碼正確率的原因。此外在神經信息解碼中,解碼窗口的長度也影響著解碼正確率。實驗結果顯示,LFP 信號的最優解碼窗口集中在 0.3 s 附近,而 spike 信號的最優解碼窗口則在 1 s 附近,這可能暗示著神經元集群信號解碼性能要優于單個神經元信號的解碼性能,但是深層次原因還需深入研究。
對于解碼算法,LOO 方法是一種統計分析中對分類器進行交叉驗證的方法,其有兩個優點:① 每一次計算中幾乎所有樣本皆用于模型訓練,使得訓練樣本最接近原始樣本分布,解碼結果比較可靠;② 實驗過程中沒有隨機因素影響實驗數據,確保實驗過程可以被復制。但其主要缺點就是計算成本高、速度慢。而 kNN 算法的優勢就是計算簡單、易于實現,特別適合多分類問題。因此將 LOO 算法和 kNN 算法相結合,可以充分發揮各自優勢。此外,LOO 算法和 kNN 算法都是非參數算法,影響 LOO-kNN 算法解碼結果的最主要參數就是最近鄰 k 值。研究結果顯示,LOO-kNN 算法解碼性能與 k 值基本成反比,即隨著 k 值的增加,spike 信號和 LFP 信號的解碼正確率都呈下降趨勢,這與目前的研究結果基本一致[10]。這一結果也為 LOO-kNN 算法的應用提供了有益的借鑒。
綜上所述,本文利用 NCL 區 spike 信號和 LFP 信號針對鴿子運動意圖的神經解碼問題,對比分析了這兩種信號的解碼性能,并探討了通道個數、解碼窗口的位置、長度及最近鄰 k 值等參數對解碼正確率的影響。結果表明,盡管 spike 信號和 LFP 信號都能有效解碼目標導向抉擇任務中鴿子的運動意圖,但是 LFP 信號具有更優的解碼性能,受通道個數的影響也較弱。在解碼窗口位置的選擇上,最佳的解碼窗口位于 TES 附近,而且 LFP 信號的最佳解碼窗口長度(0.3 s)明顯短于 spike 信號的最佳解碼窗口長度(1 s)。對于 LOO-kNN 算法,spike 信號和 LFP 信號的解碼正確率與最近鄰 k 值基本成反比。本文的結果將有助于鴿子大腦神經信息處理機制的解析,而且對于腦—機接口等也有重要的參考價值。
引言
神經信息解碼是基于大腦神經信號并利用信號處理與模式識別算法,實現對外界刺激參數的預測或解讀,比如圖像、氣味、運動軌跡、意圖等[1-4],其對于神經信息處理機制解析及腦—機接口研發等都具有十分重要的意義。在神經信息解碼的候選信號中,基于微電極陣列胞外方式采集的神經信號由于具有較高的時間和空間分辨率[5],得到了大多數研究人員的青睞。微電極陣列記錄的神經活動主要由兩種信號組成,即以耗能形式主動傳播的高頻鋒電位(spike)(0.25~5 kHz)和在傳播中會發生衰減和變形的低頻局部場電位(local field potential, LFP)(0~0.25 kHz)。雖然這兩種信號分布在不同的頻帶,而且具有不同的編碼模式,但是它們都攜帶有外界刺激信息,在目前運動意圖神經信息解碼中得到了廣泛應用。
對于 spike 和 LFP 信號解碼性能的研究由來已久。早在 20 世紀 90 年代末,Chapin 等[6]就利用大鼠運動皮層 spike 信號實現了對壓桿行為中前肢運動意圖的解碼,并且針對不同動物的解碼正確率基本都在 60% 以上。2003 年,Mehring 等[7]對比分析了 spike 信號和 LFP 信號的解碼性能,發現在猴子手部運動的解碼中,LFP 信號和 spike 信號具有類似的解碼性能。隨后,經過大量的實驗研究發現,在神經信息解碼中 spike 信號和 LFP 信號各有千秋,在解碼精度上 spike 信號的性能要優于 LFP 信號,但是在長期解碼中,LFP 信號則具有更好的可靠性和穩定性[8-9]。但是,目前對于 spike 信號和 LFP 信號解碼性能的研究都是在大(小)鼠、猴子等哺乳動物上開展的,鳥類的研究較少。相對于哺乳動物,鳥類獨自經歷了近 3 億年的進化歷程,而且在運動方式、生活習性等上都存在差異,它們是否分享了類似的神經計算原理還有待檢驗。
針對鳥類大腦 spike 信號和 LFP 信號的解碼性能,本文以鴿子為模式動物,利用基于留一法(leave-one-out, LOO)和 k 最近鄰(k-nearest neighbor, kNN)的神經解碼算法——LOO-kNN 算法,結合微電極陣列采集當鴿子執行以食物和指示燈為目標,選擇最終目的地的“目標導向抉擇任務”時弓狀皮質尾外側區(nidopallium caudolaterale, NCL)的神經信號,對比了 spike 信號和 LFP 信號的解碼性能,討論了通道個數、解碼窗口的位置、長度等參數對于解碼性能的影響,并分析了最近鄰 k 值變化時解碼正確率的動態變化特性。基于本文的研究結果,將有助于解析鴿子大腦的神經信息處理機制,今后對于腦—機接口等智能假肢的研究或可具有一定的參考價值。
1 材料與方法
1.1 神經解碼算法
在神經信息解碼中,本文利用 LOO-kNN 算法,分析了目標導向抉擇任務中 NCL 區 spike 信號和 LFP 信號對鴿子運動意圖的解碼性能。本文將 kNN 算法與 LOO 算法相結合,不僅能夠提高樣本的利用率,而且在類別決策時,只與極少量的相鄰樣本有關,可在一定程度上減少噪聲樣本對分類的干擾。
1.1.1 kNN 算法
kNN 算法是一種經典的非參數分類方法,其工作原理是首先找到被分類對象在訓練數據集中的 k 個最近的鄰居,然后根據這些鄰居的分類屬性進行投票,將得出的預測值賦給被分類對象的分類屬性[10]。假設存在 n 個樣本 x1, x2,
, xn,已知每個樣本的分類屬性 y1, y2,
, yn。樣本 xi(i = 1, 2,
, n) 為多維變量,分類屬性 yi 為離散性變量,其值域定義為 C,C = {c1, c2,
, cm},yi ∈ C,m ≤ n。對于一個新樣本 x,為了獲得其分類屬性 y,首先應計算新樣本與每個已知樣本的距離,然后根據距離的大小對已知樣本重新進行排序,即如式(1)所示:
![]() |
其中‖·‖表示距離范式,x(i)(i = 1, 2,
, n)表示重新排序的樣本。與新樣本 x 距離最小的 k 個已知樣本即為新樣本的 k 個最近鄰,x 的分類屬性就由其 k 個近鄰的分類屬性投票決定,即如式(2)所示:
![]() |
其中 Ck 為樣本 x 的 k 個最近鄰分類屬性的值域。
綜上所述,kNN 算法的性能由兩個參數決定,即最近鄰的個數和距離范式。根據文獻[10]的研究結果,如果沒有特別說明,本文選用近鄰個數 k = 1 和歐氏(Euclidean)距離進行 kNN 算法的計算。
1.1.2 LOO-kNN 解碼算法
LOO 算法是一種通常用來訓練和測試分類器的交叉驗證方法[11],本文將其與 kNN 算法進行了結合。假設每只鴿子進行 N 次實驗并分別記錄,即 N 個樣本,共包含有 M 個運動方向,即其分類屬性的值域為 C = {c1, c2,
, cm}。
關于 LOO-kNN 算法的基本原理在文獻[12-13]已進行過詳細敘述,本文簡述如下:每只鴿子,對于其 N 個樣本,首先選取其中 1 個樣本作為測試集,其余 N – 1 個樣本則作為訓練集,并對其進行類別標記;其次利用 kNN 算法和訓練集獲得測試樣本的類別屬性,作為該樣本的解碼結果。如此循環,直到解碼出所有 N 個樣本的類別屬性,即運動方向。最后,將解碼出的 N 個樣本的類別與其真實類別進行對比,即可得到解碼的正確率(accuracy,以符號 A 表示),即如式(3)所示:
![]() |
其中 Nright 為正確解碼的樣本個數。
1.2 信號采集與處理
本文實驗動物選用 6 只經過預訓練篩選后的成年家鴿,體重 450~550 g,雌雄各半。實驗中,訓練鴿子在十字迷宮中執行目標導向抉擇任務,如圖 1 所示。關于實驗鴿子行為訓練范式和神經信號的采集與處理詳細信息參考文獻[12-13],本文簡述如小節 1.2.1~1.2.3 所示。
1.2.1 行為訓練
如圖 1 所示,訓練中首先將鴿子放置在等待區,訓練鴿子在提示音響起后由抉擇臂進入“十字迷宮”,在十字路口根據放置在獎勵臂末端的線索(食物和指示燈)進行“目標導向抉擇任務”(左轉、右轉或直行),待鴿子獲得食物獎勵后,必須返回實驗等待區,等待下一次實驗的開始。如果鴿子正確執行了行為范式,將在等待區額外獲得一次食物獎勵。每次實驗中,提示線索出現的方向是隨機的。待鴿子在連續兩天中行為正確率大于 90% 時,進行微電極陣列的植入。

1.2.2 信號采集
微電極陣列植入手術前,將實驗鴿子進行全身麻醉,俯臥固定于腦立體定位儀(ST-5ND-C,成都儀器廠,中國)上。參考鴿子腦立體定位圖譜[14],確定 NCL 區位置,去除顱骨和硬腦膜,進行微電極陣列(4 × 4 排列,共 16 通道)植入。待電極到達目標位置后,用牙科水泥(II 型,香港德派實業有限公司生產)對電極進行固定,并進行傷口縫合和消毒處理,等待動物蘇醒與恢復。經過 5~7 d 恢復之后,開始對鴿子進行神經信號采集,即在鴿子執行 1.2.1 小節介紹的相關行為任務的同時,用神經信號采集裝置(CerebusTM, Blockrock Inc., 美國)檢測鴿子 NCL 區的神經信號。實驗中共采集了 6 只鴿子的神經信號,這 6 只鴿子分別編號為 P010、P600、P601、P605、P609 和 P619。
1.2.3 信號處理
針對 1.2.2 小節采集后的 spike 信號,處理方式依序為:濾波(0.25~5 kHz)、spike 信號檢測、去噪,獲得不同通道的 spike 信號發放序列。其中濾波器采用神經信號采集裝置默認的二階巴特沃斯(Butterworth)濾波器;spike 信號檢測采用經典的幅度閾值法,閾值為 4~5 倍信號均方根,用于將 spike 信號與背景噪聲分離;去噪算法采用具有較高識別精度且易于實現的電極間相關法[15],用于去除 spike 信號中誤檢的大幅值干擾。而對于采集的 LFP 信號,同樣需經過以下處理:濾波(0~0.25 kHz)、去除基線漂移、降采樣、去噪,獲得不同通道的 LFP 信號。其中去噪環節采用自適應共同空間參考算法[16],該算法將自適應干擾對消與共同空間參考相結合,能在提高信號去噪性能的同時降低信號的畸變。spike 信號的采樣頻率為 30 kHz,LFP 信號的采樣頻率為 2 kHz。
1.3 統計分析
文中解碼特征和解碼正確率等一般以均值 ± 標準差的形式表示。在統計分析中,利用威爾科克森(Wilcoxon)秩和檢驗度量差異是否具有統計學意義[17],顯著性水平設置為 5%,即 P < 0.05 被認為差異具有統計學意義。在統計分析中,威爾科克森秩和檢驗是一種非參數檢驗方法,其利用樣本秩代替了樣本值,不要求樣本總體服從正態分布。
2 結果
2.1 單個通道解碼性能的對比分析
如圖 2 所示,給出了目標導向抉擇任務中微電極陣列采集的典型 spike 信號和 LFP 信號,圖中自動門、轉向前紅外檢測器(turning begin sensor, TBS)和轉向后紅外檢測器(turning end sensor, TES)的位置分別用紅色豎直線標識。圖中的紅色矩形虛線標記了實驗鴿子在執行目標導向抉擇任務中的 spike 信號發放序列和 LFP 信號波形圖。由圖 2 可知,在實驗鴿子執行目標導向抉擇任務中 spike 信號發放率和 LFP 信號的高頻振蕩都明顯增加,在 TES 附近達到峰值。因此,在分析 spike 信號和 LFP 信號解碼性能時,選取 TES 附近 1 s 的窗口內,即從 TES 前 0.5 s 到 TES 后 0.5 s 之間的神經信號作為解碼信號。

此外,為了提取實驗鴿子執行目標導向抉擇任務過程中神經信號的解碼特征,根據文獻[12-13]的研究結果,對于 spike 信號,將解碼時間窗中 spike 信號發放率作為 spike 信號的解碼特征,而對于 LFP 信號,將 LFP 信號中 0~100 Hz 均分成 10 個不同的子帶,即 0~10 Hz, 10~20 Hz,
, 90~100 Hz,通過計算不同子帶的發放率,選取 40~50 Hz 和 50~60 Hz 兩個子帶,即 40~60 Hz 中信號能量作為 LFP 信號的解碼特征。
如圖 3 所示,給出了單個通道 spike 信號和 LFP 信號的解碼性能。圖中的虛線為隨機解碼正確率(1/3≈33%),即三個方向隨機進行選擇的正確率。由圖 3 可知,對于 spike 信號,單個通道的解碼正確率并不高,6 只鴿子的解碼正確率都低于 60%,而且只有兩只鴿子,編號為 P600 和 P605的解碼正確率高于隨機解碼正確率,差異具有統計學意義(P < 0.05)。但是對于 LFP 信號,大部分鴿子的解碼正確率都高于 60%,而且 6 只鴿子單個通道的解碼正確率都高于隨機解碼正確率,差異具有統計學意義( P < 0.05),甚至有些通道的解碼正確率高于 95%,比如編號為 P605 的第 13 通道和編號為 P609 的第 10 和第 16 通道。

2.2 通道個數對解碼性能的影響分析
如圖 4 所示,給出了 spike 信號和 LFP 信號解碼正確率與通道個數之間的變化關系。圖中解碼正確率曲線為所有通道(共 16 個)根據通道個數隨機選擇的 10 次重復實驗平均值,即每次計算時從所有通道中隨機選擇相應的通道數計算解碼正確率,并重復 10 次,計算其平均值。由圖可知,對于 spike 信號,隨著通道個數的增加,除編號為 P605 和編號為 P609 的鴿子之外,其余 4 只鴿子的解碼正確率都有明顯提高,其中編號為 P600 的鴿子最大解碼正確率甚至達到了 95% 以上。而對于 LFP 信號,隨著通道個數的增加,LFP 信號解碼正確率增加并不明顯。但是對于不同的通道個數,LFP 信號都能獲得較好的解碼性能。

*
*
在此基礎上,本文對比分析了單個通道和全部通道(即 16 個通道)作為解碼特征時 spike 信號和 LFP 信號解碼正確率,結果如圖 4 所示。由圖 4 可知,對于 spike 信號,全部通道作為解碼特征時的解碼正確率明顯高于單個通道作為解碼特征時的解碼正確率,差異具有統計學意義(P < 0.05)。而對于 LFP 信號,盡管全部通道作為解碼特征時解碼正確率也高于單個通道作為解碼特征時的解碼正確率,但是差異并不具有統計學意義( P > 0.05)。
此外,如圖 4 所示,進一步分析了全部通道作為解碼特征時解碼正確率的混淆矩陣(confusion matrix)。混淆矩陣也被稱作錯誤矩陣(error matrix),是一種評價分類性能的可視化矩陣,其中每一列表示預測的類別,每一行表示真實的類別,每個矩陣塊中的數值表示預測的正確率。從混淆矩陣可知,對于 spike 信號,其對左轉和直行的分類能力要優于對右轉的分類能力,而對于 LFP 信號,其對不同方向的預測能力比較均衡,預測性能也優于 spike 信號的預測性能。
2.3 解碼窗口位置對解碼性能的影響分析
在 2.1 節和 2.2 節對 spike 和 LFP 信號解碼性能分析的基礎上,進一步分析了解碼窗口位置對解碼性能的影響,結果如圖 5 所示。圖中的圓圈為 6 只鴿子的平均解碼正確率,實線為二階多項式的擬合結果。為了獲得最佳的解碼窗口位置,在分析解碼窗口位置對解碼正確率的影響時,將其分為以 TBS 位置為對齊點和以 TES 位置為對齊點兩種情況進行討論,兩種情況中窗長都為 1 s,步長為 0.1 s,總時長為 3 s。
由圖 5 中的二階多項式的擬合曲線可知,無論是以 TBS 為對齊點還是以 TES 為對齊點,結果都顯示,在實驗鴿子執行目標導向抉擇任務過程中,越接近 TES 解碼正確率越高,這一結果也與神經信號響應的位置基本吻合。但相比之下,以 TES 為對齊點的解碼正確率峰值要高于以 TBS 為對齊點的解碼正確率峰值。而且,就整體而言,LFP 信號的解碼正確率高于 spike 信號的解碼正確率。

2.4 解碼窗口長度對解碼性能的影響分析
除了解碼窗口的位置,解碼窗口的長度也影響著神經信號的解碼性能。由圖 6 所示,分析了解碼窗口的長度對解碼正確率的影響。根據 2.3 節的分析結果,解碼窗口的位置以 TES 為對齊點,初始解碼窗口的長度和步長都設置為 0.1 s,總時長為 2 s。圖中的圓圈為 6 只鴿子的平均解碼正確率,實線為二階多項式的擬合結果。由圖 6 可知,隨著解碼窗口長度的增加,spike 信號和 LFP 信號的解碼正確率都是先增加后下降,但是 spike 信號在解碼窗口長度為 1 s 附近達到峰值,LFP 信號則在解碼窗口長度為 0.3 s 附近達到峰值。基于二階多項式的擬合結果來看,spike 信號解碼正確率出現了明顯的峰值,但是 LFP 信號解碼正確率則近似為直線下降。這一結果表明在獲得最優的解碼性能時 spike 信號的耗時可能更長。

2.5 最近鄰 k 值對解碼性能的影響分析
由圖 7 所示,分析了最近鄰 k 值對解碼正確率的影響。最近鄰 k 值的初始值設置為 1,步長也設置為 1。圖中的圓圈為 6 只鴿子的平均解碼正確率,實線為一階多項式的擬合結果。由圖 7 可知,無論是 spike 信號還是 LFP 信號,隨著 k 值的增加,解碼正確率基本呈下降趨勢。但相比之下,LFP 信號解碼正確率的下降趨勢更明顯。而且最近鄰 k 值的大小與解碼正確率基本呈反比,即 k 值越大解碼正確率越低。這一結果表明,最近鄰 k 值也影響了神經信號的解碼性能。

3 討論
在神經信息解碼中,spike 信號和 LFP 信號是兩種最主要的候選信號[18],對于腦—機接口、大腦信息處理機制解析等都具有重要意義。本文對比分析了鴿子 NCL 區 spike 信號和 LFP 信號在神經信息解碼中的性能,并在此基礎上進一步分析了通道個數、解碼窗口的位置、長度及最近鄰 k 值等參數對解碼正確率的影響。研究結果表明:① 盡管 spike 信號和 LFP 信號都能解碼目標導向抉擇任務中鴿子的運動意圖,但是相比之下,LFP 信號具有更優異的解碼性能;②spike 信號解碼性能受通道個數的影響較大,LFP 信號解碼性能受其影響則較小,這表明不同通道之間 LFP 信號可能具有更大的信息冗余;③ 解碼窗口的位置和長度都會影響解碼正確率,研究發現響應越強烈的位置解碼正確率一般越大;④ 對于 LOO-kNN 解碼算法,解碼性能與最近鄰 k 值的大小成反比,較小的近鄰個數得到的解碼性能更優。
對于微電極陣列采集的兩種不同頻帶范圍的神經信號,spike 信號來自于電極尖端附近單個神經元的活動,LFP 信號則是電極尖端附近神經元興奮性和抑制性突觸后電位的總和[19]。本文的研究發現,對于單個通道而言,LFP 信號解碼正確率要優于 spike 信號解碼正確率,但是隨著通道個數的增加,6 只鴿子中 4 只鴿子的 spike 信號解碼正確率都明顯增加,但所有鴿子的 LFP 信號解碼正確率變化都不明顯。這一結果表明不同通道 LFP 信號之間的信息冗余要大于 spike 信號之間的信息冗余,這與這兩種信號的特性基本是一致的。此外,研究還發現,大部分鴿子的 spike 信號和 LFP 信號之間的解碼性能基本一致,即如果 spike 信號表現出較好的解碼性能,則 LFP 信號的解碼性能也不差。但是這種對應關系并不是絕對的,比如編號為 P605 鴿子,其 spike 信號的解碼正確率并不高,而 LFP 信號卻表現出較高的解碼正確率。而且,就整體而言,LFP 信號的解碼正確率整體上也要優于 spike 信號的解碼正確率。這意味著對于長期植入的微電極陣列信號采集實驗,LFP 信號可能更適合作為神經信息解碼的候選信號。
此外,在解碼參數上,本文的研究結果發現,無論是以 TBS 為對齊點還是以 TES 為對齊點,TES 附近的解碼正確率都明顯高于 TBS 附近的解碼正確率,而且相比之下,以 TES 為對齊點的解碼正確率整體上要高于以 TBS 為對齊點的解碼正確率。這表明,神經信號的解碼性能除了與解碼窗口的位置有關外,與對齊點的位置可能也有關,這暗示著在微電極陣列信號采集實驗中對齊點的位置也影響著實驗結果。在目標導向抉擇任務中,誘導鴿子進行抉擇的線索,即目標位于獎勵臂的末端,鴿子到達十字路口并發現目標位置之前,是不能進行抉擇的,因此鴿子進行抉擇的行為應該是看到食物后進行的,即靠近 TES 位置,這可能也是 TES 附近解碼正確率高于 TBS 附近解碼正確率的原因。此外在神經信息解碼中,解碼窗口的長度也影響著解碼正確率。實驗結果顯示,LFP 信號的最優解碼窗口集中在 0.3 s 附近,而 spike 信號的最優解碼窗口則在 1 s 附近,這可能暗示著神經元集群信號解碼性能要優于單個神經元信號的解碼性能,但是深層次原因還需深入研究。
對于解碼算法,LOO 方法是一種統計分析中對分類器進行交叉驗證的方法,其有兩個優點:① 每一次計算中幾乎所有樣本皆用于模型訓練,使得訓練樣本最接近原始樣本分布,解碼結果比較可靠;② 實驗過程中沒有隨機因素影響實驗數據,確保實驗過程可以被復制。但其主要缺點就是計算成本高、速度慢。而 kNN 算法的優勢就是計算簡單、易于實現,特別適合多分類問題。因此將 LOO 算法和 kNN 算法相結合,可以充分發揮各自優勢。此外,LOO 算法和 kNN 算法都是非參數算法,影響 LOO-kNN 算法解碼結果的最主要參數就是最近鄰 k 值。研究結果顯示,LOO-kNN 算法解碼性能與 k 值基本成反比,即隨著 k 值的增加,spike 信號和 LFP 信號的解碼正確率都呈下降趨勢,這與目前的研究結果基本一致[10]。這一結果也為 LOO-kNN 算法的應用提供了有益的借鑒。
綜上所述,本文利用 NCL 區 spike 信號和 LFP 信號針對鴿子運動意圖的神經解碼問題,對比分析了這兩種信號的解碼性能,并探討了通道個數、解碼窗口的位置、長度及最近鄰 k 值等參數對解碼正確率的影響。結果表明,盡管 spike 信號和 LFP 信號都能有效解碼目標導向抉擇任務中鴿子的運動意圖,但是 LFP 信號具有更優的解碼性能,受通道個數的影響也較弱。在解碼窗口位置的選擇上,最佳的解碼窗口位于 TES 附近,而且 LFP 信號的最佳解碼窗口長度(0.3 s)明顯短于 spike 信號的最佳解碼窗口長度(1 s)。對于 LOO-kNN 算法,spike 信號和 LFP 信號的解碼正確率與最近鄰 k 值基本成反比。本文的結果將有助于鴿子大腦神經信息處理機制的解析,而且對于腦—機接口等也有重要的參考價值。