生物學研究表明,位置細胞是大鼠知曉當前所處空間位置的主要依據。由于網格細胞是位置細胞的主要信息輸入源,因此需要構建由網格細胞到位置細胞的映射模型。針對這一問題,本文提出一種網格細胞到位置細胞的逆傳播誤差神經網絡映射模型,實現在給定區域內對位置的精確表達。又依據邊界細胞對環境邊界特異性放電這一生理特性,實現利用邊界細胞對網格野位相的周期性重置,使該模型完成任意大小空間中的位置認知。本文設計了仿真實驗對比理論位置細胞板的活動情況,又分別對比競爭型神經網絡模型的耗時和 RatSLAM 位姿細胞板的定位誤差。實驗結果表明,本文模型能夠得到單一的位置野,并在耗時實驗中較競爭型神經網絡模型算法效率提高 85.94%;在定位實驗中較 RatSLAM 位姿細胞板的平均定位誤差下降 41.35%。因此本文提出的位置認知模型不僅可以實現網格細胞到位置細胞之間信息的高效傳遞,而且能夠在任意大小的空間區域內實現自身位置的精確定位。
引用本文: 于乃功, 廖詣深, 鄭相國. 一種基于海馬位置細胞選擇機制的空間認知模型. 生物醫學工程學雜志, 2020, 37(1): 27-37. doi: 10.7507/1001-5515.201901044 復制
引言
海馬體是大鼠認知環境的重要生理結構。O’Keefe 等[1]于 1971 年在鼠腦海馬體中發現一種對空間位置具有選擇性的細胞,只有當大鼠處于空間中的特定位置時,該細胞才會發生放電活動。這種細胞被稱為位置細胞[2],而對應其放電的空間區域則被稱為位置野[3-4]。2005 年 Hafting 等[5]通過相關實驗,發現了大鼠的內嗅皮層中另一種對空間位置具有強烈放電特性的神經元細胞,該細胞會對空間中特定區域產生周期性放電。與位置細胞的放電規律不同的是,該細胞的放電野是以正六邊形的形式遍布整個空間區域,這種也對空間位置有著放電特性的神經元細胞被稱為網格細胞。1996 年,O’Keefe 等[6]在實驗中發現當改變老鼠運動的空間位置的大小時,位置野所對應的空間區域也會等倍地往環境邊緣平移,為了解釋這一現象,O’Keefe 等預測,大腦中存在著一種細胞,能對環境的邊界產生響應,能反映距離邊界不同距離和不同角度的相對位置,這種細胞稱為邊界細胞。2008 年多個實驗室相繼發表文章說明,在內嗅皮層的淺皮層中發現了邊界細胞[7-8]。
之后的研究中,構建由網格細胞到位置細胞的映射模型成為研究的熱點,很多構建這一映射關系的模型被相繼提出,包括基于高斯激活函數的模型[9]、基于競爭型神經網絡的模型[10]、基于獨立成分分析的模型[11]和基于徑向基函數神經網絡的模型[12]。文獻[9]提出一種基于高斯激活函數的模型,該模型算法效率高,消耗網格細胞數量少且能生成單一位置野。但該模型對網格細胞網格野的空間位相、定向、網格野間距等網格參數的特異性要求較高,只有在網格細胞的空間位相相同的情況下,才能夠輸出單一的位置野。文獻[10]為課題組在之前的研究中提出的一種網格細胞到位置細胞的競爭型神經網絡模型,實現了網格細胞到位置細胞的信息傳遞與映射,并能夠得到單一的位置細胞放電野;且該模型是基于鼠腦海馬體的側抑制現象來建模的,具有充分的生理學依據。但該模型消耗網格細胞的數目較多,不具備良好的實時性。課題組在后續將競爭型神經網絡用于仿鼠腦海馬認知機制構建環境認知地圖的工作中,取得了較好的實驗結果,但同時也證實了競爭型神經網絡模型存在算法效率較低的問題[13]。文獻[11]提出一種基于獨立成分分析的模型,生成單一位置野的概率為 70%,算法性能較高;但該模型是一種線性的數學模型,缺乏生理學依據。文獻[12]提出一種基于徑向基函數神經網絡的網格細胞到位置細胞的位置估計模型,能夠模擬大鼠對空間位置學習與認知的過程,卻只能夠在給定區域范圍實現對位置的估計,未能實現任意大小空間區域的位置認知。
對于機器人來說,仿生機制的一項重要作用就是能夠表達自我在環境中的位置,在鼠腦海馬體的諸多細胞中,位置細胞具有表達空間位置的功能,其能夠對路徑進行積分。澳大利亞昆士蘭大學的“RatSLAM”課題組提出一種成熟的基于鼠腦海馬的實時定位與地圖構建方法[14]。此算法核心部分被稱作位姿細胞,其作用和海馬體中的位置細胞類似,都是對路徑進行積分,但是 RatSLAM 中的方向、速度信息直接驅動位姿細胞板上的活動包運動實現路徑積分,因此 RatSLAM 主要模仿了大鼠的神經行為學特征,而不是完全基于鼠腦海馬體的解剖結構和生理學特性。針對如何利用鼠腦海馬體內各種空間細胞的放電機制來實現對位置的表達這一問題,本文提出一種網格細胞到位置細胞的逆傳播誤差(back propagation error,BP)神經網絡模型,既能夠實現網格細胞向位置細胞的信息傳遞,又能實現位置細胞的路徑積分功能。另外,基于邊界細胞對環境邊界的特異性放電這一生理特性,實現利用邊界細胞對網格細胞放電野位相的周期性重置,完成任意大小空間區域的編碼與位置認知。
1 基本模型的建立
1.1 基于條紋波的二維網格野模型
網格野有三個特征參數,分別是網格野間距(相鄰網格節點的距離)、網格野位相(相對于外部參考點的偏移)和網格野定向(相對于外部參考系的傾斜度),網格野的具體表征形式如圖 1 所示。圖 1 中 d 代表網格野間距,px 代表網格野位相在 x 軸方向上的坐標,py 代表網格野位相在 y 軸方向上的坐標,α 代表網格野定向。本文的二維網格野模型采用課題組研究的基于條紋波的二維網格野模型[9-10]。

條紋細胞位于傍下托和內嗅皮層的淺表層,是一種在二維平面上有著周期性條紋狀放電野的細胞族。研究表明,三個有著 60° 朝向的條紋細胞族產生的條紋波,通過物理學上的振蕩干涉理論,可以在空間上形成遍布整個空間的呈正六邊形排布的網格野[15-17]。
針對條紋波,可以采用二維 cos 波來表示,如式(1)所示。
![]() |
其中, 為條紋波的波矢量;
為當前大鼠所處的空間位置。由于波矢量
有大小與方向,其大小就是波數,表示為
,其值如式(2)所示。
![]() |
是
波的波長,因此網格細胞在二維空間的激活率函數可以由式(3)表示。
![]() |
從式(3)可以看出,該式僅能表達網格野位相為 時,網格細胞在空間區域內的激活函數。當空間位相為任意位置
時,網格細胞在空間的激活函數應改為如式(4)所示。
![]() |
網格間距 和 cos 波的波數
之間的關系如圖 2 和式(5)所示。

![]() |
從圖 2 中可以看出,3 個 波分別是以 0°、60°、120° 的方向,經振蕩干涉在二維平面形成正六邊形網格野,因此波矢量
的取值為式(6)所示:
![]() |
式中 為網格野定向。
從式(3)可以看出,激活函數 的值域為
,為了使得激活函數的取值恒為正數,將激活函數
改寫為
,其數學表達如式(7)所示。
![]() |
1.2 位置細胞的放電模型
位置細胞是一種對空間位置具有選擇性的放電細胞,只有當大鼠處于空間中的特定位置時,該細胞才會發生放電活動,而在空間中的其他位置則不產生放電活動,位置細胞的放電特性如圖 3 所示。本文構建表征空間環境的位置細胞采用了 O’Keefe 等[6]提供的位置細胞數學模型來計算位置細胞在當前位置下的放電率,其數學表達式如式(8)所示。

![]() |
式(8)中, 為位置細胞
在位置
的放電率,
表征當前大鼠在環境中的位置坐標;
為位置細胞
的的放電野中心所對應的位置坐標;
為位置細胞放電野調整系數。
1.3 網格細胞到位置細胞的逆傳播誤差神經網絡模型
位置細胞的前向輸入是網格細胞的輸出,位置細胞神經面板上的放電位置是路徑積分系統的輸出。不同尺度的網格細胞放電輸入給位置細胞,最后形成位置細胞的單峰放電現象。因此模擬位置細胞在神經面板上的放電活動,需要多個不同尺度不同朝向的網格細胞神經面板的共同作用。生理學研究表明,網格細胞和位置細胞均為神經細胞,它們是由細胞體和細胞突起構成,而細胞突起是細胞體自身延伸出來的細長部分,細長部分又分為樹突和軸突。每個神經元只有一個軸突,它可以把信號傳遞到其他組織或另一個神經元,每個神經元可以有多個樹突,它可以接受刺激并將興奮傳入細胞體內,網格細胞與位置細胞之間信息傳遞亦是如此[9],網格細胞到位置細胞的信息傳遞與連接方式如圖 4 所示。因此上述生理學研究結論為建立網格細胞到位置細胞的神經網絡模型奠定了理論基礎。

對大鼠的神經行為學研究表明,當大鼠來到一個新空間區域時,對應該空間區域的空間細胞放電野則會很快形成[18]。設大鼠來到一個新空間區域的時刻為零時刻,此時各個空間細胞對應當前空間區域的放電野還未建立,隨著時間的推移,大鼠在新空間區域中不斷探索,各個空間細胞的放電野才能被建立,這就說明大鼠對新空間區域的認知存在一個學習與記憶的過程。結合上文中提及的網格細胞與位置細胞之間是以神經網絡的方式來傳遞信息這一生理學研究事實,本文提出一種網格細胞到位置細胞的 BP 神經網絡模型。通過 BP 神經網絡模型可模擬大鼠認知新空間區域這一過程,并能夠很好地表達網格細胞與位置細胞之間的映射關系,實現網格細胞到位置細胞的映射關系和基于位置細胞放電機制的路徑積分功能。本文將 BP 神經網絡模型設計為單隱層結構的神經網絡,隱層擁有 9 個隱層神經元,其結構如圖 5 所示。在對 BP 神經網絡進行訓練的過程中,以網格細胞的放電率作為輸入,理論的位置細胞放電率作為期望輸出,模擬大鼠對空間區域學習與認知的過程。

BP 神經網絡是一種靜態神經網絡,對其進行訓練的過程可以看做是一個參數尋優的過程,即在參數空間中尋找一組最優參數使得均方誤差最小。在具體的訓練過程中,神經網絡可能會陷入局部極小狀態。為了防止局部極小現象的出現,本文以多組不同的參數值初始化連接網格細胞與位置細胞的 BP 神經網絡,取訓練之后誤差最小的解作為最終參數,以提高模型的精確性和泛化性。
1.4 邊界細胞的放電模型
邊界細胞是一種能對環境的邊界產生響應的空間細胞,能反映距離邊界不同距離和不同角度的相對位置,邊界細胞的放電特性如圖 6 所示,四幅圖分別為邊界細胞在編碼區域上、下、左、右邊界處的放電效果。本文將邊界細胞建模成一種直接對邊界產生響應的細胞模型,即當大鼠到達位置細胞群所覆蓋的區域邊界時,邊界細胞會產生特異性放電;而當大鼠在區域內部活動的時候,邊界細胞則將保持靜息狀態。其放電率的數學表達式[19]如式(9)所示。

![]() |
式(9)中, 代表邊界細胞的放電率,
代表邊界區域,
代表當前所處的位置,
代表邊界細胞在被激活時的放電率。
2 位置認知模型的實現步驟
針對上述各類細胞模型的生理特性可知,位置細胞只對空間的特定位置有放電效果,是位置表達的主要來源。網格野可以作為一個表征空間位置的坐標系,當多個網格野同時作用時,就可以得出當前大鼠所處空間環境中的位置,位置認知模型總體結構如圖 7 所示。

本文模型的主要思路是利用 BP 神經網絡模擬鼠腦海馬體的記憶與學習機制,通過對空間中的特征位置點的記憶與學習,構建出能夠精確表達網格細胞到位置細胞的映射模型。其步驟如下。
步驟一:在給定空間大小的區域內設定網格細胞與位置細胞的網絡參數,本文將該區域大小設定為正方形區域,如圖 8 所示,區域的邊長為 。設定位置細胞的個數為
,則每個位置細胞放電野的中心位置對應圖 8 中的各個網格結點,每個位置細胞的位置野中心坐標的表達式如式(10)所示。

![]() |
式(10)中 代表該位置細胞位置野中心的坐標,
代表正方形區域邊長,
代表位置細胞板的邊長,i、j 分別代表當前位置細胞在細胞板上的列數與行數。
設定網格細胞的數量為 ,配置多個網格細胞對應網格野的網格參數。得出每個網格細胞的激活率函數。
步驟二:在給定區域內隨機選取 K 個待學習和記憶的坐標點,分別利用網格細胞的激活率函數和位置細胞的放電率函數,計算所有網格細胞和位置細胞的放電率作為學習樣本。通過當前所有的待學習坐標點及其對應的參數對 BP 神經網絡進行訓練,模擬大鼠在環境中探索時學習和記憶的過程。為了防止 BP 神經網絡出現過擬合現象,本文選取的待記憶點為正方形活動區域內分布均勻的位置點。
步驟三:使用訓練完成之后的神經網絡模型,實現網格細胞到位置細胞的信息傳遞。首先依據該模型完成大鼠在給定區域內運動時,觀察位置細胞的路徑積分特性,驗證模型的有效性。
步驟四:實現該模型在任意大小的空間區域中的位置認知。鼠腦海馬體中的位置細胞是有限的,大鼠無法利用有限數量的位置細胞對無限大的空間進行編碼,即鼠腦海馬體中的位置細胞只能對有限空間進行編碼,而有限的空間就一定對應有空間區域的邊界。邊界細胞是一種對區域邊界有著特異性放電的神經元。針對這一現象,本文提出一種基于邊界細胞的放電特性對網格野進行重置的方法,在邊界細胞放電的激勵作用下,網格野位相可以在到達編碼的區域邊界時進行周期性重置,從而實現大鼠對任意大小空間區域內的位置認知。
具體實現方法為:初始條件設定為大鼠處于當前網格野覆蓋的矩形區域的中心,則矩形區域對應有四個方向上的邊界。當大鼠到達給定區域空間的任意邊界時,該邊界所對應的邊界細胞就會產生特異性放電,將網格細胞的網格野位相重置,使得大鼠處于重置以后的網格野覆蓋的矩形區域的中心。通過該方式,每完成一次對網格野位相的重置,大鼠腦海馬體中的位置細胞就可以立即生成對新的空間區域的編碼,完成大鼠對任意大小空間的位置認知。利用邊界細胞對網格細胞放電野位相進行周期性重置的數學表達式如式(11)所示。
![]() |
式(11)中 為網格野位相,
與
分別代表網格野位相的橫縱坐標。
為各個邊界所對應的邊界細胞放電率,
的取值從 1 到 4 分別對應正方形區域的上左下右邊界,
為邊界細胞的放電率閾值,
為正方形區域的邊長。基于網格野周期性重置的位置認知模型的運行機制示意圖如圖 9 所示,位置認知模型的流程圖如圖 10 所示。


3 仿真實驗與結果分析
3.1 仿真參數的設定
設定空間區域的大小為 10 m × 10 m 的正方形區域,位置細胞的個數為 15 × 15 個,位置細胞的位置野調整因子 設定為 1。網格細胞的個數設定為 10 個,網格細胞所對應的網格野位相在該區域內任意選取,網格野定向
在 0~60° 內隨機選取,網格野間距
在 20~70 cm 之間隨機選取。空間待學習點的個數設定為 500,訓練過程中的 BP 神經網絡的學習率設定為 0.02,均方誤差(mean-square error,MSE)截止閾值設定為 0.004,迭代次數設定為 1 000。
3.2 給定空間區域內運動時的仿真實驗
截取 Hafting[5]報道的生理學軌跡,通過適當的比例縮放,作為大鼠的運動軌跡。實驗的部分結果如圖 11 所示,其中理論的位置細胞板為位置細胞按照公式(8)的放電規律,在細胞板上呈現的放電活動。隨著大鼠在空間區域內的不斷運動,位置細胞板上的興奮活動包也會隨之移動,符合位置細胞進行路徑積分這一生理特性,且實際位置細胞板活動情況與理論的位置細胞板活動情況大體一致,驗證了模型的有效性。

3.3 任意大小空間范圍內運動時的仿真實驗
將 Hafting[5]的生理學軌跡按照比例放大 25 倍,此時大鼠的運動軌跡已經不局限于 10 m × 10 m 的正方形區域,從而驗證采用邊界細胞對網格細胞網格野位相進行重置的方法的正確性。圖 12 所示為大鼠穿越編碼區域右邊界前后的軌跡圖、位置細胞活動板的活動情況和覆蓋區域內的網格野。

如圖 12 所示,可以看出在大鼠穿越當前編碼區域的右邊界時,邊界細胞放電,使得網格野所覆蓋的區域被重置到以當前大鼠的位置為中心位置的正方形區域。此時位置細胞的活動包也隨著網格野位相的重置而被重置到位置細胞板的中心位置,保證后續位置細胞對路徑進行積分的可行性。
隨后分別進行了大鼠從左側、下側和上側等方向穿越編碼區域的實驗,結果表明,在穿越編碼區域的邊界時,均可激發邊界細胞放電,從而重置網格野位相和位置細胞活動板。驗證了本文模型能夠在任意大小的空間區域內進行路徑積分與位置認知的功能。
3.4 對比競爭型神經網絡的算法效率實驗
鑒于目前建立的競爭型神經網絡模型不能在任意大小的空間區域內進行位置感知,所以在進行對比試驗時,本文算法模型和競爭型神經網絡模型均在 10 m × 10 m 的區域內模擬大鼠的運動,截取 Hafting[5]的生理學軌跡中的前 20 s,取時間間隔為 2 s,將 20 s 的生理學軌跡劃分為 10 段 2 s 的生理學軌跡,每一段中有 100 個大鼠的定位點,10 段生理學軌跡如圖 13 所示。該對比實驗采取的方法是統計兩種模型在每一段生理學軌跡中生成位置野的時間總和。兩種模型中位置細胞個數均設定為 15 × 15 個,實驗結果對比如表 1 所示,其中本文算法的平均耗時為 11.93 s,競爭型神經網絡的平均耗時為 85.23 s,相比之下,本文算法耗時較競爭性神經網絡的耗時縮短 85.94%。實驗結果表明本文算法的耗時遠低于競爭型神經網絡模型的耗時,因此本文算法的效率更高。


3.5 本文算法位置細胞板與 RatSLAM 中位姿細胞板對比實驗
RatSLAM 的原始算法是基于位姿細胞板的活動與視覺里程計來實現認知地圖,而本文的主要工作是實現基于海馬仿生機制的位置細胞路徑積分對位置進行感知。將本文算法模型產生的位置細胞板活動情況與 RatSLAM 中位姿細胞板活動情況作對比,由于 RatSLAM 算法中位姿細胞也可以實現對任意大小空間區域的位置感知,所以將 Hafting[5]的生理學軌跡按比例放大 40 倍作為本實驗軌跡,兩種算法的細胞板尺寸均設定為 15 × 15,覆蓋的編碼區域均設置為 10 m × 10 m,對比結果如圖 14 所示。

對比兩種算法細胞板的活動情況后,再分別對比兩種算法的定位性能。對比方法為:隨機設置 Hafting[5]的生理學軌跡上的 200 個點作為待定位點,如圖 15 所示,圖中線條為生理學軌跡,綠色圓點表示待定位點。在每個定位點分別獲取位置細胞興奮活動包在細胞板上的坐標作為當前算法解算得到的位置坐標,取算法定位的坐標至實際坐標的直線距離大小作為定位誤差。將兩種算法得到的坐標點與實際生理學軌跡的對應坐標進行對比,分析兩種算法的定位性能。定位誤差的分布如圖 16 所示。


通過對比兩種算法得到的細胞板活動情況可以發現,兩種算法不僅能生成單一的位置野,實現路徑積分功能,對當前所處環境位置進行表達,而且兩種方法都可以實現在大范圍內的位置認知。RatSLAM 算法之所以能夠對大范圍空間中的位置進行表達,是將位姿細胞建模成了環狀吸引子模型,而本文算法模型則是利用邊界細胞的特異性放電來重置網格野位相,使其能夠對大范圍空間中的位置進行表達,且本文算法是基于大鼠腦海馬的解剖結構和生理學特性進行研究的,更具有生理學意義。
在定位誤差對比實驗中,本文算法位置細胞板與 RatSLAM 位姿細胞板在 200 個待定位點的平均定位誤差分別為 0.743 m 和 1.267 m,定位誤差下降 41.35%。因此在細胞板尺寸和覆蓋編碼區域面積均相同的情況下,本文算法位置細胞板的定位結果比 RatSLAM 位姿細胞板更精確。然而從圖 16 中可以看出,本文算法得到的位置細胞板在定位實驗中,存在幾處定位點誤差較大的情況,而 RatSLAM 位姿細胞板的定位誤差相對比較集中,不存在誤差值浮動較大的情況。導致該問題的原因可能是當運動軌跡到達編碼區域邊界很近的位置卻未穿越編碼區域邊界時,邊界細胞可能超前對編碼區域邊界做出響應,使得網格野位相的重置超前于大鼠實際穿越編碼區域邊界的時刻,從而導致定位誤差較大。在后續的研究中,將會針對該問題進行解決與改善,主要是改進邊界細胞對編碼區域邊界響應的放電模型以及邊界細胞對網格野位相重置的算法,從而進一步提高模型的定位精度,并結合豐富的視覺信息,實現對環境情景認知地圖的構建。
4 結論
本文提出一種網格細胞到位置細胞的 BP 神經網絡模型,利用神經網絡的訓練過程模擬大鼠在環境中探索時學習和記憶的過程,得出網格細胞到位置細胞的映射關系,隨后引入邊界細胞,用于對網格野位相的周期性重置,實現大鼠對任意空間區域的編碼,從而完成大鼠在任意空間區域內的位置感知。
本文采用的算法運算簡單,對網格細胞的個數要求較少,而且只需要在學習和記憶階段訓練神經網絡,在空間區域內的位置認知中,可直接使用已經訓練好的模型,運行速度得到提高,改進了算法的實時性。通過該算法不僅可以很好地模擬大鼠腦海馬體的認知機制,實現網格細胞對位置細胞的信息傳遞和基于位置細胞放電機制的路徑積分功能,還可以在任意大小空間區域內實現位置認知。通過本文提出的模型,可以對機器人在空間環境中的位置進行認知,實現面向目標的導航。綜上所述,本文提出的基于海馬位置細胞選擇機制的空間認知模型對機器人導航、環境認知以及地圖重構等研究具有重要的意義。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
海馬體是大鼠認知環境的重要生理結構。O’Keefe 等[1]于 1971 年在鼠腦海馬體中發現一種對空間位置具有選擇性的細胞,只有當大鼠處于空間中的特定位置時,該細胞才會發生放電活動。這種細胞被稱為位置細胞[2],而對應其放電的空間區域則被稱為位置野[3-4]。2005 年 Hafting 等[5]通過相關實驗,發現了大鼠的內嗅皮層中另一種對空間位置具有強烈放電特性的神經元細胞,該細胞會對空間中特定區域產生周期性放電。與位置細胞的放電規律不同的是,該細胞的放電野是以正六邊形的形式遍布整個空間區域,這種也對空間位置有著放電特性的神經元細胞被稱為網格細胞。1996 年,O’Keefe 等[6]在實驗中發現當改變老鼠運動的空間位置的大小時,位置野所對應的空間區域也會等倍地往環境邊緣平移,為了解釋這一現象,O’Keefe 等預測,大腦中存在著一種細胞,能對環境的邊界產生響應,能反映距離邊界不同距離和不同角度的相對位置,這種細胞稱為邊界細胞。2008 年多個實驗室相繼發表文章說明,在內嗅皮層的淺皮層中發現了邊界細胞[7-8]。
之后的研究中,構建由網格細胞到位置細胞的映射模型成為研究的熱點,很多構建這一映射關系的模型被相繼提出,包括基于高斯激活函數的模型[9]、基于競爭型神經網絡的模型[10]、基于獨立成分分析的模型[11]和基于徑向基函數神經網絡的模型[12]。文獻[9]提出一種基于高斯激活函數的模型,該模型算法效率高,消耗網格細胞數量少且能生成單一位置野。但該模型對網格細胞網格野的空間位相、定向、網格野間距等網格參數的特異性要求較高,只有在網格細胞的空間位相相同的情況下,才能夠輸出單一的位置野。文獻[10]為課題組在之前的研究中提出的一種網格細胞到位置細胞的競爭型神經網絡模型,實現了網格細胞到位置細胞的信息傳遞與映射,并能夠得到單一的位置細胞放電野;且該模型是基于鼠腦海馬體的側抑制現象來建模的,具有充分的生理學依據。但該模型消耗網格細胞的數目較多,不具備良好的實時性。課題組在后續將競爭型神經網絡用于仿鼠腦海馬認知機制構建環境認知地圖的工作中,取得了較好的實驗結果,但同時也證實了競爭型神經網絡模型存在算法效率較低的問題[13]。文獻[11]提出一種基于獨立成分分析的模型,生成單一位置野的概率為 70%,算法性能較高;但該模型是一種線性的數學模型,缺乏生理學依據。文獻[12]提出一種基于徑向基函數神經網絡的網格細胞到位置細胞的位置估計模型,能夠模擬大鼠對空間位置學習與認知的過程,卻只能夠在給定區域范圍實現對位置的估計,未能實現任意大小空間區域的位置認知。
對于機器人來說,仿生機制的一項重要作用就是能夠表達自我在環境中的位置,在鼠腦海馬體的諸多細胞中,位置細胞具有表達空間位置的功能,其能夠對路徑進行積分。澳大利亞昆士蘭大學的“RatSLAM”課題組提出一種成熟的基于鼠腦海馬的實時定位與地圖構建方法[14]。此算法核心部分被稱作位姿細胞,其作用和海馬體中的位置細胞類似,都是對路徑進行積分,但是 RatSLAM 中的方向、速度信息直接驅動位姿細胞板上的活動包運動實現路徑積分,因此 RatSLAM 主要模仿了大鼠的神經行為學特征,而不是完全基于鼠腦海馬體的解剖結構和生理學特性。針對如何利用鼠腦海馬體內各種空間細胞的放電機制來實現對位置的表達這一問題,本文提出一種網格細胞到位置細胞的逆傳播誤差(back propagation error,BP)神經網絡模型,既能夠實現網格細胞向位置細胞的信息傳遞,又能實現位置細胞的路徑積分功能。另外,基于邊界細胞對環境邊界的特異性放電這一生理特性,實現利用邊界細胞對網格細胞放電野位相的周期性重置,完成任意大小空間區域的編碼與位置認知。
1 基本模型的建立
1.1 基于條紋波的二維網格野模型
網格野有三個特征參數,分別是網格野間距(相鄰網格節點的距離)、網格野位相(相對于外部參考點的偏移)和網格野定向(相對于外部參考系的傾斜度),網格野的具體表征形式如圖 1 所示。圖 1 中 d 代表網格野間距,px 代表網格野位相在 x 軸方向上的坐標,py 代表網格野位相在 y 軸方向上的坐標,α 代表網格野定向。本文的二維網格野模型采用課題組研究的基于條紋波的二維網格野模型[9-10]。

條紋細胞位于傍下托和內嗅皮層的淺表層,是一種在二維平面上有著周期性條紋狀放電野的細胞族。研究表明,三個有著 60° 朝向的條紋細胞族產生的條紋波,通過物理學上的振蕩干涉理論,可以在空間上形成遍布整個空間的呈正六邊形排布的網格野[15-17]。
針對條紋波,可以采用二維 cos 波來表示,如式(1)所示。
![]() |
其中, 為條紋波的波矢量;
為當前大鼠所處的空間位置。由于波矢量
有大小與方向,其大小就是波數,表示為
,其值如式(2)所示。
![]() |
是
波的波長,因此網格細胞在二維空間的激活率函數可以由式(3)表示。
![]() |
從式(3)可以看出,該式僅能表達網格野位相為 時,網格細胞在空間區域內的激活函數。當空間位相為任意位置
時,網格細胞在空間的激活函數應改為如式(4)所示。
![]() |
網格間距 和 cos 波的波數
之間的關系如圖 2 和式(5)所示。

![]() |
從圖 2 中可以看出,3 個 波分別是以 0°、60°、120° 的方向,經振蕩干涉在二維平面形成正六邊形網格野,因此波矢量
的取值為式(6)所示:
![]() |
式中 為網格野定向。
從式(3)可以看出,激活函數 的值域為
,為了使得激活函數的取值恒為正數,將激活函數
改寫為
,其數學表達如式(7)所示。
![]() |
1.2 位置細胞的放電模型
位置細胞是一種對空間位置具有選擇性的放電細胞,只有當大鼠處于空間中的特定位置時,該細胞才會發生放電活動,而在空間中的其他位置則不產生放電活動,位置細胞的放電特性如圖 3 所示。本文構建表征空間環境的位置細胞采用了 O’Keefe 等[6]提供的位置細胞數學模型來計算位置細胞在當前位置下的放電率,其數學表達式如式(8)所示。

![]() |
式(8)中, 為位置細胞
在位置
的放電率,
表征當前大鼠在環境中的位置坐標;
為位置細胞
的的放電野中心所對應的位置坐標;
為位置細胞放電野調整系數。
1.3 網格細胞到位置細胞的逆傳播誤差神經網絡模型
位置細胞的前向輸入是網格細胞的輸出,位置細胞神經面板上的放電位置是路徑積分系統的輸出。不同尺度的網格細胞放電輸入給位置細胞,最后形成位置細胞的單峰放電現象。因此模擬位置細胞在神經面板上的放電活動,需要多個不同尺度不同朝向的網格細胞神經面板的共同作用。生理學研究表明,網格細胞和位置細胞均為神經細胞,它們是由細胞體和細胞突起構成,而細胞突起是細胞體自身延伸出來的細長部分,細長部分又分為樹突和軸突。每個神經元只有一個軸突,它可以把信號傳遞到其他組織或另一個神經元,每個神經元可以有多個樹突,它可以接受刺激并將興奮傳入細胞體內,網格細胞與位置細胞之間信息傳遞亦是如此[9],網格細胞到位置細胞的信息傳遞與連接方式如圖 4 所示。因此上述生理學研究結論為建立網格細胞到位置細胞的神經網絡模型奠定了理論基礎。

對大鼠的神經行為學研究表明,當大鼠來到一個新空間區域時,對應該空間區域的空間細胞放電野則會很快形成[18]。設大鼠來到一個新空間區域的時刻為零時刻,此時各個空間細胞對應當前空間區域的放電野還未建立,隨著時間的推移,大鼠在新空間區域中不斷探索,各個空間細胞的放電野才能被建立,這就說明大鼠對新空間區域的認知存在一個學習與記憶的過程。結合上文中提及的網格細胞與位置細胞之間是以神經網絡的方式來傳遞信息這一生理學研究事實,本文提出一種網格細胞到位置細胞的 BP 神經網絡模型。通過 BP 神經網絡模型可模擬大鼠認知新空間區域這一過程,并能夠很好地表達網格細胞與位置細胞之間的映射關系,實現網格細胞到位置細胞的映射關系和基于位置細胞放電機制的路徑積分功能。本文將 BP 神經網絡模型設計為單隱層結構的神經網絡,隱層擁有 9 個隱層神經元,其結構如圖 5 所示。在對 BP 神經網絡進行訓練的過程中,以網格細胞的放電率作為輸入,理論的位置細胞放電率作為期望輸出,模擬大鼠對空間區域學習與認知的過程。

BP 神經網絡是一種靜態神經網絡,對其進行訓練的過程可以看做是一個參數尋優的過程,即在參數空間中尋找一組最優參數使得均方誤差最小。在具體的訓練過程中,神經網絡可能會陷入局部極小狀態。為了防止局部極小現象的出現,本文以多組不同的參數值初始化連接網格細胞與位置細胞的 BP 神經網絡,取訓練之后誤差最小的解作為最終參數,以提高模型的精確性和泛化性。
1.4 邊界細胞的放電模型
邊界細胞是一種能對環境的邊界產生響應的空間細胞,能反映距離邊界不同距離和不同角度的相對位置,邊界細胞的放電特性如圖 6 所示,四幅圖分別為邊界細胞在編碼區域上、下、左、右邊界處的放電效果。本文將邊界細胞建模成一種直接對邊界產生響應的細胞模型,即當大鼠到達位置細胞群所覆蓋的區域邊界時,邊界細胞會產生特異性放電;而當大鼠在區域內部活動的時候,邊界細胞則將保持靜息狀態。其放電率的數學表達式[19]如式(9)所示。

![]() |
式(9)中, 代表邊界細胞的放電率,
代表邊界區域,
代表當前所處的位置,
代表邊界細胞在被激活時的放電率。
2 位置認知模型的實現步驟
針對上述各類細胞模型的生理特性可知,位置細胞只對空間的特定位置有放電效果,是位置表達的主要來源。網格野可以作為一個表征空間位置的坐標系,當多個網格野同時作用時,就可以得出當前大鼠所處空間環境中的位置,位置認知模型總體結構如圖 7 所示。

本文模型的主要思路是利用 BP 神經網絡模擬鼠腦海馬體的記憶與學習機制,通過對空間中的特征位置點的記憶與學習,構建出能夠精確表達網格細胞到位置細胞的映射模型。其步驟如下。
步驟一:在給定空間大小的區域內設定網格細胞與位置細胞的網絡參數,本文將該區域大小設定為正方形區域,如圖 8 所示,區域的邊長為 。設定位置細胞的個數為
,則每個位置細胞放電野的中心位置對應圖 8 中的各個網格結點,每個位置細胞的位置野中心坐標的表達式如式(10)所示。

![]() |
式(10)中 代表該位置細胞位置野中心的坐標,
代表正方形區域邊長,
代表位置細胞板的邊長,i、j 分別代表當前位置細胞在細胞板上的列數與行數。
設定網格細胞的數量為 ,配置多個網格細胞對應網格野的網格參數。得出每個網格細胞的激活率函數。
步驟二:在給定區域內隨機選取 K 個待學習和記憶的坐標點,分別利用網格細胞的激活率函數和位置細胞的放電率函數,計算所有網格細胞和位置細胞的放電率作為學習樣本。通過當前所有的待學習坐標點及其對應的參數對 BP 神經網絡進行訓練,模擬大鼠在環境中探索時學習和記憶的過程。為了防止 BP 神經網絡出現過擬合現象,本文選取的待記憶點為正方形活動區域內分布均勻的位置點。
步驟三:使用訓練完成之后的神經網絡模型,實現網格細胞到位置細胞的信息傳遞。首先依據該模型完成大鼠在給定區域內運動時,觀察位置細胞的路徑積分特性,驗證模型的有效性。
步驟四:實現該模型在任意大小的空間區域中的位置認知。鼠腦海馬體中的位置細胞是有限的,大鼠無法利用有限數量的位置細胞對無限大的空間進行編碼,即鼠腦海馬體中的位置細胞只能對有限空間進行編碼,而有限的空間就一定對應有空間區域的邊界。邊界細胞是一種對區域邊界有著特異性放電的神經元。針對這一現象,本文提出一種基于邊界細胞的放電特性對網格野進行重置的方法,在邊界細胞放電的激勵作用下,網格野位相可以在到達編碼的區域邊界時進行周期性重置,從而實現大鼠對任意大小空間區域內的位置認知。
具體實現方法為:初始條件設定為大鼠處于當前網格野覆蓋的矩形區域的中心,則矩形區域對應有四個方向上的邊界。當大鼠到達給定區域空間的任意邊界時,該邊界所對應的邊界細胞就會產生特異性放電,將網格細胞的網格野位相重置,使得大鼠處于重置以后的網格野覆蓋的矩形區域的中心。通過該方式,每完成一次對網格野位相的重置,大鼠腦海馬體中的位置細胞就可以立即生成對新的空間區域的編碼,完成大鼠對任意大小空間的位置認知。利用邊界細胞對網格細胞放電野位相進行周期性重置的數學表達式如式(11)所示。
![]() |
式(11)中 為網格野位相,
與
分別代表網格野位相的橫縱坐標。
為各個邊界所對應的邊界細胞放電率,
的取值從 1 到 4 分別對應正方形區域的上左下右邊界,
為邊界細胞的放電率閾值,
為正方形區域的邊長。基于網格野周期性重置的位置認知模型的運行機制示意圖如圖 9 所示,位置認知模型的流程圖如圖 10 所示。


3 仿真實驗與結果分析
3.1 仿真參數的設定
設定空間區域的大小為 10 m × 10 m 的正方形區域,位置細胞的個數為 15 × 15 個,位置細胞的位置野調整因子 設定為 1。網格細胞的個數設定為 10 個,網格細胞所對應的網格野位相在該區域內任意選取,網格野定向
在 0~60° 內隨機選取,網格野間距
在 20~70 cm 之間隨機選取。空間待學習點的個數設定為 500,訓練過程中的 BP 神經網絡的學習率設定為 0.02,均方誤差(mean-square error,MSE)截止閾值設定為 0.004,迭代次數設定為 1 000。
3.2 給定空間區域內運動時的仿真實驗
截取 Hafting[5]報道的生理學軌跡,通過適當的比例縮放,作為大鼠的運動軌跡。實驗的部分結果如圖 11 所示,其中理論的位置細胞板為位置細胞按照公式(8)的放電規律,在細胞板上呈現的放電活動。隨著大鼠在空間區域內的不斷運動,位置細胞板上的興奮活動包也會隨之移動,符合位置細胞進行路徑積分這一生理特性,且實際位置細胞板活動情況與理論的位置細胞板活動情況大體一致,驗證了模型的有效性。

3.3 任意大小空間范圍內運動時的仿真實驗
將 Hafting[5]的生理學軌跡按照比例放大 25 倍,此時大鼠的運動軌跡已經不局限于 10 m × 10 m 的正方形區域,從而驗證采用邊界細胞對網格細胞網格野位相進行重置的方法的正確性。圖 12 所示為大鼠穿越編碼區域右邊界前后的軌跡圖、位置細胞活動板的活動情況和覆蓋區域內的網格野。

如圖 12 所示,可以看出在大鼠穿越當前編碼區域的右邊界時,邊界細胞放電,使得網格野所覆蓋的區域被重置到以當前大鼠的位置為中心位置的正方形區域。此時位置細胞的活動包也隨著網格野位相的重置而被重置到位置細胞板的中心位置,保證后續位置細胞對路徑進行積分的可行性。
隨后分別進行了大鼠從左側、下側和上側等方向穿越編碼區域的實驗,結果表明,在穿越編碼區域的邊界時,均可激發邊界細胞放電,從而重置網格野位相和位置細胞活動板。驗證了本文模型能夠在任意大小的空間區域內進行路徑積分與位置認知的功能。
3.4 對比競爭型神經網絡的算法效率實驗
鑒于目前建立的競爭型神經網絡模型不能在任意大小的空間區域內進行位置感知,所以在進行對比試驗時,本文算法模型和競爭型神經網絡模型均在 10 m × 10 m 的區域內模擬大鼠的運動,截取 Hafting[5]的生理學軌跡中的前 20 s,取時間間隔為 2 s,將 20 s 的生理學軌跡劃分為 10 段 2 s 的生理學軌跡,每一段中有 100 個大鼠的定位點,10 段生理學軌跡如圖 13 所示。該對比實驗采取的方法是統計兩種模型在每一段生理學軌跡中生成位置野的時間總和。兩種模型中位置細胞個數均設定為 15 × 15 個,實驗結果對比如表 1 所示,其中本文算法的平均耗時為 11.93 s,競爭型神經網絡的平均耗時為 85.23 s,相比之下,本文算法耗時較競爭性神經網絡的耗時縮短 85.94%。實驗結果表明本文算法的耗時遠低于競爭型神經網絡模型的耗時,因此本文算法的效率更高。


3.5 本文算法位置細胞板與 RatSLAM 中位姿細胞板對比實驗
RatSLAM 的原始算法是基于位姿細胞板的活動與視覺里程計來實現認知地圖,而本文的主要工作是實現基于海馬仿生機制的位置細胞路徑積分對位置進行感知。將本文算法模型產生的位置細胞板活動情況與 RatSLAM 中位姿細胞板活動情況作對比,由于 RatSLAM 算法中位姿細胞也可以實現對任意大小空間區域的位置感知,所以將 Hafting[5]的生理學軌跡按比例放大 40 倍作為本實驗軌跡,兩種算法的細胞板尺寸均設定為 15 × 15,覆蓋的編碼區域均設置為 10 m × 10 m,對比結果如圖 14 所示。

對比兩種算法細胞板的活動情況后,再分別對比兩種算法的定位性能。對比方法為:隨機設置 Hafting[5]的生理學軌跡上的 200 個點作為待定位點,如圖 15 所示,圖中線條為生理學軌跡,綠色圓點表示待定位點。在每個定位點分別獲取位置細胞興奮活動包在細胞板上的坐標作為當前算法解算得到的位置坐標,取算法定位的坐標至實際坐標的直線距離大小作為定位誤差。將兩種算法得到的坐標點與實際生理學軌跡的對應坐標進行對比,分析兩種算法的定位性能。定位誤差的分布如圖 16 所示。


通過對比兩種算法得到的細胞板活動情況可以發現,兩種算法不僅能生成單一的位置野,實現路徑積分功能,對當前所處環境位置進行表達,而且兩種方法都可以實現在大范圍內的位置認知。RatSLAM 算法之所以能夠對大范圍空間中的位置進行表達,是將位姿細胞建模成了環狀吸引子模型,而本文算法模型則是利用邊界細胞的特異性放電來重置網格野位相,使其能夠對大范圍空間中的位置進行表達,且本文算法是基于大鼠腦海馬的解剖結構和生理學特性進行研究的,更具有生理學意義。
在定位誤差對比實驗中,本文算法位置細胞板與 RatSLAM 位姿細胞板在 200 個待定位點的平均定位誤差分別為 0.743 m 和 1.267 m,定位誤差下降 41.35%。因此在細胞板尺寸和覆蓋編碼區域面積均相同的情況下,本文算法位置細胞板的定位結果比 RatSLAM 位姿細胞板更精確。然而從圖 16 中可以看出,本文算法得到的位置細胞板在定位實驗中,存在幾處定位點誤差較大的情況,而 RatSLAM 位姿細胞板的定位誤差相對比較集中,不存在誤差值浮動較大的情況。導致該問題的原因可能是當運動軌跡到達編碼區域邊界很近的位置卻未穿越編碼區域邊界時,邊界細胞可能超前對編碼區域邊界做出響應,使得網格野位相的重置超前于大鼠實際穿越編碼區域邊界的時刻,從而導致定位誤差較大。在后續的研究中,將會針對該問題進行解決與改善,主要是改進邊界細胞對編碼區域邊界響應的放電模型以及邊界細胞對網格野位相重置的算法,從而進一步提高模型的定位精度,并結合豐富的視覺信息,實現對環境情景認知地圖的構建。
4 結論
本文提出一種網格細胞到位置細胞的 BP 神經網絡模型,利用神經網絡的訓練過程模擬大鼠在環境中探索時學習和記憶的過程,得出網格細胞到位置細胞的映射關系,隨后引入邊界細胞,用于對網格野位相的周期性重置,實現大鼠對任意空間區域的編碼,從而完成大鼠在任意空間區域內的位置感知。
本文采用的算法運算簡單,對網格細胞的個數要求較少,而且只需要在學習和記憶階段訓練神經網絡,在空間區域內的位置認知中,可直接使用已經訓練好的模型,運行速度得到提高,改進了算法的實時性。通過該算法不僅可以很好地模擬大鼠腦海馬體的認知機制,實現網格細胞對位置細胞的信息傳遞和基于位置細胞放電機制的路徑積分功能,還可以在任意大小空間區域內實現位置認知。通過本文提出的模型,可以對機器人在空間環境中的位置進行認知,實現面向目標的導航。綜上所述,本文提出的基于海馬位置細胞選擇機制的空間認知模型對機器人導航、環境認知以及地圖重構等研究具有重要的意義。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。