生理學研究發現,大鼠進行空間導航和記憶依賴多種空間細胞。基于此,本文對鼠腦內嗅—海馬結構內空間細胞的放電機制進行研究,提出了一種移動機器人空間定位模型。其特點為:在網格細胞到位置細胞信息傳遞模型的基礎上,引入位置細胞相互作用的神經網絡模型得到具有單峰興奮活動包的細胞板。通過建立興奮活動包在細胞板上的位置與機器人在物理環境中的位置之間的轉換關系,實現對機器人位置的解算。本文設計了仿真實驗和物理實驗對模型進行驗證。實驗結果表明:相較于RatSLAM和網格—位置映射模型,本文模型的定位性能更加精確,且在機器人長時間的路徑積分過程中所產生的累積誤差也更小。本文研究成果為仿鼠腦認知機制的機器人導航方法奠定了基礎。
引用本文: 于乃功, 廖詣深. 基于鼠腦內嗅—海馬認知機制的移動機器人空間定位模型. 生物醫學工程學雜志, 2022, 39(2): 217-227. doi: 10.7507/1001-5515.202109051 復制
引言
環境認知是人類及各類高等哺乳動物特有的一種能力,而如何將這種能力賦予機器人是人工智能、機器人學以及神經科學共同關心的問題。大鼠作為哺乳動物的一員,也擁有著卓越的導航能力。生理學研究表明,內嗅—海馬結構是大鼠進行環境認知與導航的關鍵腦區[1],其內部存在的多種對空間有著特異性放電作用的神經元細胞(空間細胞)則是內嗅—海馬結構的基礎[2-3]。
在成年大鼠的腦結構中,空間與方位信息由海馬體表征,通過海馬位置細胞的路徑積分特性定位自身在環境中的位置[4-6]。那么自運動信息是通過什么途徑進入海馬的呢?生理學研究表明,方向信息被認為是輸入至下托結構的頭朝向細胞[7],實現對大鼠頭朝向角度的表征[8];速度信息被認為是輸入至內嗅皮層的速度細胞[9],并由條紋細胞對特定方向的線速度信息進行路徑積分[10]。作為網格細胞上游皮層的神經元細胞,多個條紋細胞族通過振蕩干涉機制能夠形成遍布整個空間區域的正六邊形網格野,因此條紋細胞被認為是形成網格細胞的基礎[11]。網格細胞集成了自運動信息之后,通過突觸連接將信息傳遞至海馬位置細胞群以更新位置細胞的放電率[12-13]。綜上所述,位置細胞能夠進行路徑積分的關鍵在于網格細胞對空間環境度量信息的強大表達能力[14-15]。
快速而準確地定位自身在環境中的位置是移動機器人導航過程中的關鍵,近年來以鼠腦內嗅—海馬的解剖結構及各空間細胞的電生理學特性為基礎,模擬其環境認知機制的研究成果層出不窮。目前基于鼠腦內嗅—海馬環境認知機制的仿生計算模型主要有兩個研究方向。一個是構建神經網絡模型模擬各類空間細胞之間的信息傳遞和空間細胞的特異性放電機制。該方向圍繞內嗅—海馬結構的生理學研究事實進行展開,主要包括:網格細胞放電模型[16-20]、網格細胞到位置細胞的信息傳遞映射模型(以下簡稱網格—位置模型)以及基于位置細胞的空間表達模型[21-27]。大多數關于位置細胞的研究聚焦于構建其放電模型[21-23],而利用位置細胞進行空間定位的研究相對較少。文獻[25]能夠基于網格—位置模型在給定空間區域內實現定位,但未能實現任意大小空間區域的位置認知。文獻[24]借助邊界細胞的特異性放電機制,實現了網格—位置模型對于任意大小空間區域的環境認知,但其未考慮位置細胞之間的相互作用關系[10,26-27],且定位精度欠佳。文獻[26]與[27]基于競爭型神經網絡實現了網格—位置信息傳遞映射,借助Hebb學習機制構建了位置細胞之間相互作用的模型,但由于競爭學習結果的隨機性,也未能實現空間定位。另一個研究方向是基于鼠腦海馬神經行為學的移動機器人實時定位與地圖構建。澳大利亞昆士蘭大學的RatSLAM課題組對仿海馬環境認知的神經計算模型進行了廣泛和深入的研究[28-29],提出了一種成熟的實時定位與地圖構建方法,該模型的核心部分被稱作位姿細胞。在這之后的眾多研究者在RatSLAM的基礎上也提出了許多改進模型[30-32],但由于RatSLAM模型使用方向、速度信息直接驅動位姿細胞板上的活動包運動以實現路徑積分,且位姿細胞并不是鼠腦海馬結構中的空間細胞,因此該類模型主要模仿了大鼠的神經行為學特征,而不是完全基于海馬的解剖結構和生理學特性[24]。
基于上述研究現狀,本文提出一種基于鼠腦內嗅—海馬認知機制的移動機器人空間定位模型,在課題組之前所研究的網格—位置模型的基礎上,引入位置細胞相互作用的神經網絡模型得到具有單峰興奮活動包的位置細胞板。通過建立興奮活動包在細胞板上的位置與機器人在物理環境中的真實位置之間的轉換關系,解算機器人在環境中的位置以實現空間定位。本文首先利用仿真實驗驗證了空間細胞放電模型的有效性,隨后分別展開生理學軌跡定位實驗和機器人平臺路徑積分實驗,并將實驗結果與RatSLAM和網格—位置兩種模型進行定位性能的比較。
1 模型的建立
1.1 模型的整體結構
模型主要分為以下三個方面:① 構建網格細胞到位置細胞的信息傳遞映射模型,引入邊界細胞使該模型完成任意大小空間中的位置認知;② 在位置細胞板結構的基礎上引入位置細胞相互作用的神經網絡模型;③ 建立了由位置細胞放電活動解算機器人在物理環境中位置的數學模型,實現空間定位。模型的整體運行機制如圖1所示。
圖1
模型的整體運行機制示意圖
Figure1.
Schematic diagram of the overall operation mechanism of the model
1.2 內嗅—海馬信息傳遞模型
內嗅—海馬信息傳遞模型的建立步驟如下。
步驟一:在給定空間大小的區域內設定網格細胞與位置細胞的參數[24]。首先給出網格細胞與位置細胞的理論放電率表達式,分別為:
![]() |
![]() |
其中,式(1)代表網格細胞在位置
處的放電率表達式,
代表網格細胞放電率的最大值,
代表波矢量,
代表網格野位相,
代表當前智能體所處位置;式(2)代表位置細胞在位置
處的放電率表達式,
代表位置野中心的坐標,
代表位置
與放電野中心的距離,
為位置細胞放電野調整系數。將位置細胞板所對應的編碼區域形狀設定為正方形,區域邊長為
。設定位置細胞的個數為
。每個位置細胞的放電野中心坐標的表達式如下:
![]() |
步驟二:在區域內隨機選取若干個待學習點,分別計算所有網格細胞和位置細胞的放電率作為學習樣本。當智能體運動至編碼區域邊界時,網格—位置模型所產生的細胞板放電活動存在信息缺失,導致模型在編碼區域邊界處的定位誤差較大。為解決這一問題,將位置細胞板左右邊界的神經元與上下邊界的神經元相互連接, 形成二維環狀細胞板模型,其結構如圖2所示。二維環狀細胞板模型下,位置細胞理論放電率表達式被調整為:
圖2
二維環狀位置細胞板模型示意圖
Figure2.
Schematic diagram of two-dimensional annular place cells plate model
![]() |
其中
和
分別代表當前智能體所處位置
與位置細胞放電野中心之間的橫縱坐標差值,其數學表達式如下,其中 min 代表取最小值。
![]() |
利用式(1)和(4)計算當前所有待學習點的網格細胞和位置細胞放電率,將其作為學習樣本對BP神經網絡[33]進行訓練,模擬大鼠在環境中探索時的學習和記憶過程。
步驟三:引入邊界細胞實現該模型在任意大小的空間區域中的位置認知。當智能體到達編碼區域邊界時,邊界細胞產生特異性放電重置網格野位相。
1.3 位置細胞相互作用模型
研究表明,位置細胞之間同樣存在著相互作用[10],可通過突觸分支對其周圍的位置細胞產生興奮性或抑制性作用。網格細胞激活率大的子集生成的位置細胞的興奮程度相對較強,對周圍神經細胞的抑制作用也較強,這將促使位置細胞板上形成一個單峰型的興奮活動包。位置細胞相互作用的示意如圖3所示。
圖3
位置細胞相互作用示意圖
Figure3.
Diagram of place cells interaction
二維的高斯分布被用于創建位置細胞的興奮性權值連接矩陣
,其數學表達式為:
![]() |
其中,下標m和n分別代表細胞板坐標系X和Y中所屬單元橫縱坐標之間的距離,
代表矩陣的分布寬度常量。由于局部興奮性連接導致的位置細胞活動的變化量為:
![]() |
其中,
代表細胞板上第i行第j列位置細胞的放電率大小,
代表細胞板邊長。位置細胞的抑制信號發生在局部性興奮連接之后,而不是同時起作用。興奮性和抑制性連接矩陣的對稱性保證了合適的神經網絡動力學,確保空間中的吸引子不會無限制地興奮。位置細胞由抑制性連接權值引起的活動變化量為:
![]() |
其中,
是抑制性連接權值,
控制全局性的抑制水平。由于位置細胞的放電率均為0到1之間的數,因此為確保所有時刻的全體位置細胞放電率均不小于零,將位置細胞的放電率與0進行比較并歸一化,其計算的數學表達式如下:
![]() |
![]() |
其中,
與
分別代表當前時刻與下一時刻。通過上述建模方法即可實現位置細胞之間的相互作用,使得細胞板上表現出更加集中的單峰活動包,為后續的位置解算奠定了基礎。
1.4 基于位置細胞板的空間定位方法
得到位置細胞板的放電活動之后即可對智能體在空間中的位置進行解算,鑒于位置細胞板是一個二維環狀結構,其位置解算的方法也需要分為兩種情況分別考慮。一種是當興奮活動包完全集中在原位置細胞板(代表環狀細胞板在二維平面上平鋪后的表現形式,以下統稱原位置細胞板)上的一處區域,此時直接計算興奮活動包在細胞板上的位置即可;另一種情況是當智能體運動至接近編碼區域邊界時(邊界細胞還未產生放電活動),此時在原位置細胞板將會表現出兩處興奮活動包,不便于求解其位置。因此需要對上述兩種情況進行區分并分別處理。首先對原位置細胞板放電活動的離散程度進行判定,具體做法為建立離散判據函數
,其數學表達式為:
![]() |
其中,
代表當前處于興奮狀態的位置細胞個數,
和
分別代表第i個處于興奮狀態的位置細胞在原位置細胞板上的橫縱坐標,
和
分別代表所有處于興奮狀態的位置細胞在原位置細胞板上的橫縱坐標均值。離散判據函數的數學含義為:求取所有處于興奮狀態的位置細胞在原位置細胞板上的橫縱坐標方差的最大值。顯然當原位置細胞板上出現多處興奮活動時,離散判據函數的函數值越大;反之亦然。隨后對位置細胞板進行分割以重構新位置細胞板
,其數學表達式為:
![]() |
其中,
代表對
取整,
代表智能體所接近的編碼區域邊界,其取值從1到4分別對應正方形區域的上左下右邊界;
代表離散判據閾值。函數
代表在原位置細胞板
的參考系下,分別在橫縱坐標為
和
處對環狀細胞模型進行分割,隨后在二維平面上平鋪后所表現的新位置細胞板。求解興奮活動包在二維平面上展開的位置細胞板上位置的函數為
,其數學表達式為:
![]() |
其中,
和
分別代表
時刻興奮活動包在位置細胞板上的橫縱坐標,且當
、
小于0時需要對
取余數。則活動包在原二維環狀位置細胞板的坐標
的數學表達式為:
![]() |
智能體運動的初始位置位于細胞板所編碼正方形區域面積的中央,定義物理坐標系以初始運動位置為原點,位置細胞板的水平方向為
軸正方向,下文中所提及的物理坐標系均為該坐標系。則智能體在空間區域內的位置坐標
數學表達式如下:
![]() |
其中,
為位置細胞板上的坐標向真實位置坐標轉換的比例系數,其取值為正方形編碼區域的邊長
與位置細胞板的邊長
的比值。
和
分別代表上一次網格野重置時所記錄的智能體在空間區域內的橫縱坐標,通過上述計算即可實現任意大小空間區域內的定位。
2 實驗驗證
2.1 實驗說明
本文設計仿真實驗與機器人平臺物理實驗對模型進行驗證。仿真實驗主要是對模型中各類空間細胞的放電特性以及生理學軌跡定位性能的驗證與對比,物理實驗用于驗證本文模型在機器人平臺探索環境過程中的路徑積分性能。
首先對實驗的相關參數進行說明,設定編碼區域的大小為10 m × 10 m的正方形空間區域(代表區域的邊長
為10 m),位置細胞的個數為15 × 15個(代表細胞板邊長
為15),位置野調整因子
設定為1。網格細胞的個數設定為10個,網格細胞所對應的網格野位相在該區域內任意選取,網格野定向在0~60 °內隨機選取,網格野間距在20~70 cm之間隨機選取,網格細胞放電率的最大值
設定為1。邊界細胞建模為開關量,即當智能體運動至編碼區域邊界時為1,反之為0,因此將邊界細胞放電閾值
設定為0.5。空間待學習點的個數設定為500,神經網絡學習率設定為0.02,均方誤差截止閾值設定為0.004,迭代次數設定為1 000。位置細胞相互作用神經網絡與空間定位模型的相關參數設定如下:全局抑制水平
設定為0.000 02,分布寬度常量
設定為5,位置細胞板的離散判據閾值
設定為30。
移動機器人平臺使用四輪獨立驅動、差速轉向的移動機器人,機器人平臺結構如圖4所示。Kinect RGB-D相機置于機器人的平臺面板上方,使用逆變器供電;機器人主體內嵌陀螺儀傳感器以獲取當前的方向信息。機器人通過WIFI與計算機建立通信,控制機器人的旋轉角速度與方向,同時機器人也能夠將各項傳感器信息反饋到計算機上進行解算。由于機器人需要接受電腦端發送的運動指令,而電腦是通過USB端口與Kinect攝像頭連接,因此需要將筆記本電腦置于機器人平臺上,通過無線鍵盤操控機器人在環境中運動,采集速度、方向以及RGB-D圖像。采樣周期為1 s,采集過程中移動機器人平臺最大移動速度設定為1 m/s。
圖4
機器人平臺示意圖
Figure4.
Schematic diagram of robot platform
2.2 空間細胞放電實驗
以Hafting等[34]的生理學軌跡作為仿真實驗中智能體的運動軌跡,給定空間區域大小分別設定為10 m × 10 m以及50 m × 50 m(相當于將原生理學軌跡分別放大5倍與25倍)。其中,10 m × 10 m空間區域實驗用于驗證模型在編碼空間區域內的空間細胞放電情況(此時沒有邊界細胞放電情況,網格野不進行周期性重置),實驗結果如圖5所示。從圖中可以看出:隨著時間的推移,智能體在空間區域內不斷運動,位置細胞板上的興奮活動包也會隨之移動,符合位置細胞進行路徑積分這一生理特性。而且,網格—位置模型所產生的位置細胞板在運動過程中易出現活動包分散的情況,導致后續的空間定位性能不佳;而引入位置細胞相互作用機制后能夠得到更為集中的興奮活動包,其放電效果更接近理論的細胞板放電活動[利用公式(2)所得出的位置細胞板放電活動],從而驗證了模型的有效性。
圖5
10 m×10 m空間區域內的實驗效果
Figure5.
Experimental results in 10 m×10 m space
50 m × 50 m空間區域實驗用于驗證大范圍空間認知模型的有效性,實驗結果如圖6 ~ 8所示。圖6代表當智能體接近編碼區域邊界時位置細胞板放電情況,此時邊界細胞還未產生放電活動。從圖中的第二列可以看出相互作用之前的位置細胞板在編碼區域邊界處會產生混亂放電情況,從而導致定位性能不佳。而從圖中第三列可以看出加入相互作用機制之后的位置細胞板可以使混亂的興奮活動包收斂為單峰活動包,極大地改善了網格—位置模型在編碼區域邊界處所產生的混亂放電現象,從而提高了模型在編碼區域邊界處的定位性能。圖7為細胞板上混亂的興奮活動包隨著相互作用的次數增多逐漸收斂為單峰活動包的變化過程。
圖6
智能體接近編碼區域邊界時位置細胞板放電情況
Figure6.
Firing of the place cells plate when the agent approaches the boundary of coding area
圖8
智能體穿越編碼區域邊界的實驗效果
Figure8.
Experimental results of agent crossing the boundary of coding region
圖7
相互作用機制下位置細胞板的變化過程
Figure7.
Changes process of place cell plates under the mechanism of interaction
圖8代表智能體穿越編碼區域邊界前后的實驗效果。從圖中可以看出,當智能體穿越當前編碼區域的邊界時,邊界細胞的放電作用能夠將編碼區域重置到以當前智能體的位置為中心位置的正方形區域。此時位置細胞的活動包也隨著網格野位相的重置而被重置到位置細胞板的中心位置,保證了本文模型在任意大小空間范圍內路徑積分的可行性。
2.3 生理學軌跡定位實驗
得到穩定的位置細胞板活動包之后,則可基于細胞板的放電活動實現空間定位。為驗證本文模型的定位性能,將其分別與RatSLAM和網格—位置模型[24]進行對比。將生理學軌跡放大40倍作為本實驗軌跡,取運動軌跡上的200個點作為待定位點。遵循對照原則,細胞板尺寸以及所覆蓋編碼區域的大小均保持一致,定位過程中位置細胞板重構效果如圖9所示。從圖中可以看出,通過細胞板重構機制可以將興奮活動分散的細胞板重構成具有單峰活動包的位置細胞板,從而驗證了模型的有效性。
圖9
位置細胞板重構效果圖
Figure9.
Effect of place cells plate reconstruction
隨后對模型的定位性能進行驗證。在每個定位點處分別獲取興奮活動包在細胞板上的坐標作為當前算法解算得到的位置坐標,取算法定位的坐標至實際坐標的直線距離大小作為定位誤差,將3種模型解算得到的坐標點與實際生理學軌跡的對應坐標進行對比,分析算法的定位性能。圖10所示為定位誤差的分布情況,探索過程共出現了6次智能體運動至編碼區域邊界的情況,表1所示為智能體運動至編碼區域邊界時網格—位置模型與本文模型的定位誤差對比情況。
圖10
定位誤差對比
Figure10.
Comparison of positioning errors
在定位誤差對比實驗中,RatSLAM、網格—位置模型[24]以及本文模型在200個待定位點的平均定位誤差分別為1.267、0.743、0.405 m。因此在細胞板尺寸和覆蓋編碼區域面積均相同的情況下,本文模型具有更高的定位精度。且從圖10以及表1中可以看出,引入位置細胞相互作用機制的網格—位置模型能夠在定位過程中消除原網格—位置模型在邊界處較大的定位誤差,驗證了模型的有效性。
2.4 機器人平臺路徑積分實驗
為進一步驗證模型的定位性能,設計機器人平臺物理實驗在室內環境下進行開環路徑積分實驗。實驗地點為實驗室的三通道走廊環境,先后進行4次路徑積分實驗。為便于測量路徑積分的真實值,將機器人的運動軌跡設置為直線,使用卷尺測量機器人路徑積分過程始末位置的直線距離作為路徑長度的真實值。走廊環境平面圖與機器人運動的4條路徑積分軌跡如圖11所示(圖中紅色線條代表路徑積分軌跡)。
圖11
走廊環境與路徑積分軌跡示意圖
Figure11.
Schematic diagram of corridor environment and path integration trajectory
路徑積分的實驗結果如圖12所示,圖中藍、紅、綠、黑線條分別代表真實路徑長度以及RatSLAM、網格—位置模型、本文模型的路徑積分結果,每條線段上方的數字代表路徑長度值。從4次路徑積分實驗的結果中可以看出,本文模型的輸出結果與真實值最接近,路徑積分精度最高。其原因主要在于:① RatSLAM模型是由自運動信息直接驅動興奮活動包在位姿細胞模型上移動,而本文模型所構建的空間細胞模型對突變的自運動信息有著一定的濾波作用,在一定程度上彌補了傳感器采集信息的突變以及路面不平的影響;② 網格—位置模型時常會出現活動包分散的情況,而本文通過引入位置細胞之間相互作用的神經網絡模型可以得到具有單峰興奮活動包的細胞板,因此其定位精度更高。但本文模型卻不能夠消除由于傳感器測量值與真實值之間的轉換比例誤差所導致的路徑積分累積誤差,因此在后續的工作中需要引入其他傳感信息(如視覺、嗅覺、聽覺等)對其進行校正,以獲取更加精確的定位性能。
圖12
機器人平臺路徑積分實驗結果
Figure12.
Experimental results of path integration of robot
3 結論
本文提出一種基于鼠腦內嗅—海馬認知機制的移動機器人空間定位模型,主要在以下方面取得了進步:① 引入位置細胞相互作用的神經網絡模型可以得到具有單峰興奮活動包的細胞板;② 在位置細胞學習、記憶以及位置解算的過程中,解決了網格—位置模型在編碼區域邊界處定位誤差較大的問題;③ 建立了由位置細胞放電活動求解機器人在物理環境中位置的數學模型。本文模型完全依據海馬空間細胞的生理學研究事實,并設計了仿真實驗和物理實驗對模型進行驗證。實驗結果表明:相較于RatSLAM和網格—位置映射模型,本文模型的定位更加精確,且在機器人長時間的路徑積分過程中所產生的累積誤差也更小。
移動機器人要執行的導航任務往往會在復雜未知環境下進行,而本文模型所實現的功能僅僅是在自運動信息的輸入下實現機器人的路徑積分。高等哺乳動物通常會結合多種內、外源信息實現自身在環境中的精確定位,例如生理學上發現的大鼠使用環境信息對路徑積分過程中的累計誤差進行快速而準確的矯正。因此,本文的研究工作對于復雜未知環境的適應能力還遠不及嚙齒類動物的水平,下一步的研究方向應為從認知機制的角度出發構建空間細胞模型,以多種外源信息(視覺、嗅覺、聽覺等)為輸入,力求使機器人在與環境的交互過程中漸進地形成和發展對環境的認知能力,從而提高機器人在復雜環境下的適應能力。
綜上所述,本文研究成果為仿鼠腦認知機制的機器人導航方法奠定了基礎,對機器人導航、環境認知和地圖重構等領域的研究具有重要的意義。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:于乃功對相關工作進行了調查,發現了現有方法的不足,提出了本文的核心觀點與研究思路;廖詣深針對該研究思路進行了實現,并設計了實驗對本文方法進行了驗證。
引言
環境認知是人類及各類高等哺乳動物特有的一種能力,而如何將這種能力賦予機器人是人工智能、機器人學以及神經科學共同關心的問題。大鼠作為哺乳動物的一員,也擁有著卓越的導航能力。生理學研究表明,內嗅—海馬結構是大鼠進行環境認知與導航的關鍵腦區[1],其內部存在的多種對空間有著特異性放電作用的神經元細胞(空間細胞)則是內嗅—海馬結構的基礎[2-3]。
在成年大鼠的腦結構中,空間與方位信息由海馬體表征,通過海馬位置細胞的路徑積分特性定位自身在環境中的位置[4-6]。那么自運動信息是通過什么途徑進入海馬的呢?生理學研究表明,方向信息被認為是輸入至下托結構的頭朝向細胞[7],實現對大鼠頭朝向角度的表征[8];速度信息被認為是輸入至內嗅皮層的速度細胞[9],并由條紋細胞對特定方向的線速度信息進行路徑積分[10]。作為網格細胞上游皮層的神經元細胞,多個條紋細胞族通過振蕩干涉機制能夠形成遍布整個空間區域的正六邊形網格野,因此條紋細胞被認為是形成網格細胞的基礎[11]。網格細胞集成了自運動信息之后,通過突觸連接將信息傳遞至海馬位置細胞群以更新位置細胞的放電率[12-13]。綜上所述,位置細胞能夠進行路徑積分的關鍵在于網格細胞對空間環境度量信息的強大表達能力[14-15]。
快速而準確地定位自身在環境中的位置是移動機器人導航過程中的關鍵,近年來以鼠腦內嗅—海馬的解剖結構及各空間細胞的電生理學特性為基礎,模擬其環境認知機制的研究成果層出不窮。目前基于鼠腦內嗅—海馬環境認知機制的仿生計算模型主要有兩個研究方向。一個是構建神經網絡模型模擬各類空間細胞之間的信息傳遞和空間細胞的特異性放電機制。該方向圍繞內嗅—海馬結構的生理學研究事實進行展開,主要包括:網格細胞放電模型[16-20]、網格細胞到位置細胞的信息傳遞映射模型(以下簡稱網格—位置模型)以及基于位置細胞的空間表達模型[21-27]。大多數關于位置細胞的研究聚焦于構建其放電模型[21-23],而利用位置細胞進行空間定位的研究相對較少。文獻[25]能夠基于網格—位置模型在給定空間區域內實現定位,但未能實現任意大小空間區域的位置認知。文獻[24]借助邊界細胞的特異性放電機制,實現了網格—位置模型對于任意大小空間區域的環境認知,但其未考慮位置細胞之間的相互作用關系[10,26-27],且定位精度欠佳。文獻[26]與[27]基于競爭型神經網絡實現了網格—位置信息傳遞映射,借助Hebb學習機制構建了位置細胞之間相互作用的模型,但由于競爭學習結果的隨機性,也未能實現空間定位。另一個研究方向是基于鼠腦海馬神經行為學的移動機器人實時定位與地圖構建。澳大利亞昆士蘭大學的RatSLAM課題組對仿海馬環境認知的神經計算模型進行了廣泛和深入的研究[28-29],提出了一種成熟的實時定位與地圖構建方法,該模型的核心部分被稱作位姿細胞。在這之后的眾多研究者在RatSLAM的基礎上也提出了許多改進模型[30-32],但由于RatSLAM模型使用方向、速度信息直接驅動位姿細胞板上的活動包運動以實現路徑積分,且位姿細胞并不是鼠腦海馬結構中的空間細胞,因此該類模型主要模仿了大鼠的神經行為學特征,而不是完全基于海馬的解剖結構和生理學特性[24]。
基于上述研究現狀,本文提出一種基于鼠腦內嗅—海馬認知機制的移動機器人空間定位模型,在課題組之前所研究的網格—位置模型的基礎上,引入位置細胞相互作用的神經網絡模型得到具有單峰興奮活動包的位置細胞板。通過建立興奮活動包在細胞板上的位置與機器人在物理環境中的真實位置之間的轉換關系,解算機器人在環境中的位置以實現空間定位。本文首先利用仿真實驗驗證了空間細胞放電模型的有效性,隨后分別展開生理學軌跡定位實驗和機器人平臺路徑積分實驗,并將實驗結果與RatSLAM和網格—位置兩種模型進行定位性能的比較。
1 模型的建立
1.1 模型的整體結構
模型主要分為以下三個方面:① 構建網格細胞到位置細胞的信息傳遞映射模型,引入邊界細胞使該模型完成任意大小空間中的位置認知;② 在位置細胞板結構的基礎上引入位置細胞相互作用的神經網絡模型;③ 建立了由位置細胞放電活動解算機器人在物理環境中位置的數學模型,實現空間定位。模型的整體運行機制如圖1所示。
圖1
模型的整體運行機制示意圖
Figure1.
Schematic diagram of the overall operation mechanism of the model
1.2 內嗅—海馬信息傳遞模型
內嗅—海馬信息傳遞模型的建立步驟如下。
步驟一:在給定空間大小的區域內設定網格細胞與位置細胞的參數[24]。首先給出網格細胞與位置細胞的理論放電率表達式,分別為:
![]() |
![]() |
其中,式(1)代表網格細胞在位置
處的放電率表達式,
代表網格細胞放電率的最大值,
代表波矢量,
代表網格野位相,
代表當前智能體所處位置;式(2)代表位置細胞在位置
處的放電率表達式,
代表位置野中心的坐標,
代表位置
與放電野中心的距離,
為位置細胞放電野調整系數。將位置細胞板所對應的編碼區域形狀設定為正方形,區域邊長為
。設定位置細胞的個數為
。每個位置細胞的放電野中心坐標的表達式如下:
![]() |
步驟二:在區域內隨機選取若干個待學習點,分別計算所有網格細胞和位置細胞的放電率作為學習樣本。當智能體運動至編碼區域邊界時,網格—位置模型所產生的細胞板放電活動存在信息缺失,導致模型在編碼區域邊界處的定位誤差較大。為解決這一問題,將位置細胞板左右邊界的神經元與上下邊界的神經元相互連接, 形成二維環狀細胞板模型,其結構如圖2所示。二維環狀細胞板模型下,位置細胞理論放電率表達式被調整為:
圖2
二維環狀位置細胞板模型示意圖
Figure2.
Schematic diagram of two-dimensional annular place cells plate model
![]() |
其中
和
分別代表當前智能體所處位置
與位置細胞放電野中心之間的橫縱坐標差值,其數學表達式如下,其中 min 代表取最小值。
![]() |
利用式(1)和(4)計算當前所有待學習點的網格細胞和位置細胞放電率,將其作為學習樣本對BP神經網絡[33]進行訓練,模擬大鼠在環境中探索時的學習和記憶過程。
步驟三:引入邊界細胞實現該模型在任意大小的空間區域中的位置認知。當智能體到達編碼區域邊界時,邊界細胞產生特異性放電重置網格野位相。
1.3 位置細胞相互作用模型
研究表明,位置細胞之間同樣存在著相互作用[10],可通過突觸分支對其周圍的位置細胞產生興奮性或抑制性作用。網格細胞激活率大的子集生成的位置細胞的興奮程度相對較強,對周圍神經細胞的抑制作用也較強,這將促使位置細胞板上形成一個單峰型的興奮活動包。位置細胞相互作用的示意如圖3所示。
圖3
位置細胞相互作用示意圖
Figure3.
Diagram of place cells interaction
二維的高斯分布被用于創建位置細胞的興奮性權值連接矩陣
,其數學表達式為:
![]() |
其中,下標m和n分別代表細胞板坐標系X和Y中所屬單元橫縱坐標之間的距離,
代表矩陣的分布寬度常量。由于局部興奮性連接導致的位置細胞活動的變化量為:
![]() |
其中,
代表細胞板上第i行第j列位置細胞的放電率大小,
代表細胞板邊長。位置細胞的抑制信號發生在局部性興奮連接之后,而不是同時起作用。興奮性和抑制性連接矩陣的對稱性保證了合適的神經網絡動力學,確保空間中的吸引子不會無限制地興奮。位置細胞由抑制性連接權值引起的活動變化量為:
![]() |
其中,
是抑制性連接權值,
控制全局性的抑制水平。由于位置細胞的放電率均為0到1之間的數,因此為確保所有時刻的全體位置細胞放電率均不小于零,將位置細胞的放電率與0進行比較并歸一化,其計算的數學表達式如下:
![]() |
![]() |
其中,
與
分別代表當前時刻與下一時刻。通過上述建模方法即可實現位置細胞之間的相互作用,使得細胞板上表現出更加集中的單峰活動包,為后續的位置解算奠定了基礎。
1.4 基于位置細胞板的空間定位方法
得到位置細胞板的放電活動之后即可對智能體在空間中的位置進行解算,鑒于位置細胞板是一個二維環狀結構,其位置解算的方法也需要分為兩種情況分別考慮。一種是當興奮活動包完全集中在原位置細胞板(代表環狀細胞板在二維平面上平鋪后的表現形式,以下統稱原位置細胞板)上的一處區域,此時直接計算興奮活動包在細胞板上的位置即可;另一種情況是當智能體運動至接近編碼區域邊界時(邊界細胞還未產生放電活動),此時在原位置細胞板將會表現出兩處興奮活動包,不便于求解其位置。因此需要對上述兩種情況進行區分并分別處理。首先對原位置細胞板放電活動的離散程度進行判定,具體做法為建立離散判據函數
,其數學表達式為:
![]() |
其中,
代表當前處于興奮狀態的位置細胞個數,
和
分別代表第i個處于興奮狀態的位置細胞在原位置細胞板上的橫縱坐標,
和
分別代表所有處于興奮狀態的位置細胞在原位置細胞板上的橫縱坐標均值。離散判據函數的數學含義為:求取所有處于興奮狀態的位置細胞在原位置細胞板上的橫縱坐標方差的最大值。顯然當原位置細胞板上出現多處興奮活動時,離散判據函數的函數值越大;反之亦然。隨后對位置細胞板進行分割以重構新位置細胞板
,其數學表達式為:
![]() |
其中,
代表對
取整,
代表智能體所接近的編碼區域邊界,其取值從1到4分別對應正方形區域的上左下右邊界;
代表離散判據閾值。函數
代表在原位置細胞板
的參考系下,分別在橫縱坐標為
和
處對環狀細胞模型進行分割,隨后在二維平面上平鋪后所表現的新位置細胞板。求解興奮活動包在二維平面上展開的位置細胞板上位置的函數為
,其數學表達式為:
![]() |
其中,
和
分別代表
時刻興奮活動包在位置細胞板上的橫縱坐標,且當
、
小于0時需要對
取余數。則活動包在原二維環狀位置細胞板的坐標
的數學表達式為:
![]() |
智能體運動的初始位置位于細胞板所編碼正方形區域面積的中央,定義物理坐標系以初始運動位置為原點,位置細胞板的水平方向為
軸正方向,下文中所提及的物理坐標系均為該坐標系。則智能體在空間區域內的位置坐標
數學表達式如下:
![]() |
其中,
為位置細胞板上的坐標向真實位置坐標轉換的比例系數,其取值為正方形編碼區域的邊長
與位置細胞板的邊長
的比值。
和
分別代表上一次網格野重置時所記錄的智能體在空間區域內的橫縱坐標,通過上述計算即可實現任意大小空間區域內的定位。
2 實驗驗證
2.1 實驗說明
本文設計仿真實驗與機器人平臺物理實驗對模型進行驗證。仿真實驗主要是對模型中各類空間細胞的放電特性以及生理學軌跡定位性能的驗證與對比,物理實驗用于驗證本文模型在機器人平臺探索環境過程中的路徑積分性能。
首先對實驗的相關參數進行說明,設定編碼區域的大小為10 m × 10 m的正方形空間區域(代表區域的邊長
為10 m),位置細胞的個數為15 × 15個(代表細胞板邊長
為15),位置野調整因子
設定為1。網格細胞的個數設定為10個,網格細胞所對應的網格野位相在該區域內任意選取,網格野定向在0~60 °內隨機選取,網格野間距在20~70 cm之間隨機選取,網格細胞放電率的最大值
設定為1。邊界細胞建模為開關量,即當智能體運動至編碼區域邊界時為1,反之為0,因此將邊界細胞放電閾值
設定為0.5。空間待學習點的個數設定為500,神經網絡學習率設定為0.02,均方誤差截止閾值設定為0.004,迭代次數設定為1 000。位置細胞相互作用神經網絡與空間定位模型的相關參數設定如下:全局抑制水平
設定為0.000 02,分布寬度常量
設定為5,位置細胞板的離散判據閾值
設定為30。
移動機器人平臺使用四輪獨立驅動、差速轉向的移動機器人,機器人平臺結構如圖4所示。Kinect RGB-D相機置于機器人的平臺面板上方,使用逆變器供電;機器人主體內嵌陀螺儀傳感器以獲取當前的方向信息。機器人通過WIFI與計算機建立通信,控制機器人的旋轉角速度與方向,同時機器人也能夠將各項傳感器信息反饋到計算機上進行解算。由于機器人需要接受電腦端發送的運動指令,而電腦是通過USB端口與Kinect攝像頭連接,因此需要將筆記本電腦置于機器人平臺上,通過無線鍵盤操控機器人在環境中運動,采集速度、方向以及RGB-D圖像。采樣周期為1 s,采集過程中移動機器人平臺最大移動速度設定為1 m/s。
圖4
機器人平臺示意圖
Figure4.
Schematic diagram of robot platform
2.2 空間細胞放電實驗
以Hafting等[34]的生理學軌跡作為仿真實驗中智能體的運動軌跡,給定空間區域大小分別設定為10 m × 10 m以及50 m × 50 m(相當于將原生理學軌跡分別放大5倍與25倍)。其中,10 m × 10 m空間區域實驗用于驗證模型在編碼空間區域內的空間細胞放電情況(此時沒有邊界細胞放電情況,網格野不進行周期性重置),實驗結果如圖5所示。從圖中可以看出:隨著時間的推移,智能體在空間區域內不斷運動,位置細胞板上的興奮活動包也會隨之移動,符合位置細胞進行路徑積分這一生理特性。而且,網格—位置模型所產生的位置細胞板在運動過程中易出現活動包分散的情況,導致后續的空間定位性能不佳;而引入位置細胞相互作用機制后能夠得到更為集中的興奮活動包,其放電效果更接近理論的細胞板放電活動[利用公式(2)所得出的位置細胞板放電活動],從而驗證了模型的有效性。
圖5
10 m×10 m空間區域內的實驗效果
Figure5.
Experimental results in 10 m×10 m space
50 m × 50 m空間區域實驗用于驗證大范圍空間認知模型的有效性,實驗結果如圖6 ~ 8所示。圖6代表當智能體接近編碼區域邊界時位置細胞板放電情況,此時邊界細胞還未產生放電活動。從圖中的第二列可以看出相互作用之前的位置細胞板在編碼區域邊界處會產生混亂放電情況,從而導致定位性能不佳。而從圖中第三列可以看出加入相互作用機制之后的位置細胞板可以使混亂的興奮活動包收斂為單峰活動包,極大地改善了網格—位置模型在編碼區域邊界處所產生的混亂放電現象,從而提高了模型在編碼區域邊界處的定位性能。圖7為細胞板上混亂的興奮活動包隨著相互作用的次數增多逐漸收斂為單峰活動包的變化過程。
圖6
智能體接近編碼區域邊界時位置細胞板放電情況
Figure6.
Firing of the place cells plate when the agent approaches the boundary of coding area
圖8
智能體穿越編碼區域邊界的實驗效果
Figure8.
Experimental results of agent crossing the boundary of coding region
圖7
相互作用機制下位置細胞板的變化過程
Figure7.
Changes process of place cell plates under the mechanism of interaction
圖8代表智能體穿越編碼區域邊界前后的實驗效果。從圖中可以看出,當智能體穿越當前編碼區域的邊界時,邊界細胞的放電作用能夠將編碼區域重置到以當前智能體的位置為中心位置的正方形區域。此時位置細胞的活動包也隨著網格野位相的重置而被重置到位置細胞板的中心位置,保證了本文模型在任意大小空間范圍內路徑積分的可行性。
2.3 生理學軌跡定位實驗
得到穩定的位置細胞板活動包之后,則可基于細胞板的放電活動實現空間定位。為驗證本文模型的定位性能,將其分別與RatSLAM和網格—位置模型[24]進行對比。將生理學軌跡放大40倍作為本實驗軌跡,取運動軌跡上的200個點作為待定位點。遵循對照原則,細胞板尺寸以及所覆蓋編碼區域的大小均保持一致,定位過程中位置細胞板重構效果如圖9所示。從圖中可以看出,通過細胞板重構機制可以將興奮活動分散的細胞板重構成具有單峰活動包的位置細胞板,從而驗證了模型的有效性。
圖9
位置細胞板重構效果圖
Figure9.
Effect of place cells plate reconstruction
隨后對模型的定位性能進行驗證。在每個定位點處分別獲取興奮活動包在細胞板上的坐標作為當前算法解算得到的位置坐標,取算法定位的坐標至實際坐標的直線距離大小作為定位誤差,將3種模型解算得到的坐標點與實際生理學軌跡的對應坐標進行對比,分析算法的定位性能。圖10所示為定位誤差的分布情況,探索過程共出現了6次智能體運動至編碼區域邊界的情況,表1所示為智能體運動至編碼區域邊界時網格—位置模型與本文模型的定位誤差對比情況。
圖10
定位誤差對比
Figure10.
Comparison of positioning errors
在定位誤差對比實驗中,RatSLAM、網格—位置模型[24]以及本文模型在200個待定位點的平均定位誤差分別為1.267、0.743、0.405 m。因此在細胞板尺寸和覆蓋編碼區域面積均相同的情況下,本文模型具有更高的定位精度。且從圖10以及表1中可以看出,引入位置細胞相互作用機制的網格—位置模型能夠在定位過程中消除原網格—位置模型在邊界處較大的定位誤差,驗證了模型的有效性。
2.4 機器人平臺路徑積分實驗
為進一步驗證模型的定位性能,設計機器人平臺物理實驗在室內環境下進行開環路徑積分實驗。實驗地點為實驗室的三通道走廊環境,先后進行4次路徑積分實驗。為便于測量路徑積分的真實值,將機器人的運動軌跡設置為直線,使用卷尺測量機器人路徑積分過程始末位置的直線距離作為路徑長度的真實值。走廊環境平面圖與機器人運動的4條路徑積分軌跡如圖11所示(圖中紅色線條代表路徑積分軌跡)。
圖11
走廊環境與路徑積分軌跡示意圖
Figure11.
Schematic diagram of corridor environment and path integration trajectory
路徑積分的實驗結果如圖12所示,圖中藍、紅、綠、黑線條分別代表真實路徑長度以及RatSLAM、網格—位置模型、本文模型的路徑積分結果,每條線段上方的數字代表路徑長度值。從4次路徑積分實驗的結果中可以看出,本文模型的輸出結果與真實值最接近,路徑積分精度最高。其原因主要在于:① RatSLAM模型是由自運動信息直接驅動興奮活動包在位姿細胞模型上移動,而本文模型所構建的空間細胞模型對突變的自運動信息有著一定的濾波作用,在一定程度上彌補了傳感器采集信息的突變以及路面不平的影響;② 網格—位置模型時常會出現活動包分散的情況,而本文通過引入位置細胞之間相互作用的神經網絡模型可以得到具有單峰興奮活動包的細胞板,因此其定位精度更高。但本文模型卻不能夠消除由于傳感器測量值與真實值之間的轉換比例誤差所導致的路徑積分累積誤差,因此在后續的工作中需要引入其他傳感信息(如視覺、嗅覺、聽覺等)對其進行校正,以獲取更加精確的定位性能。
圖12
機器人平臺路徑積分實驗結果
Figure12.
Experimental results of path integration of robot
3 結論
本文提出一種基于鼠腦內嗅—海馬認知機制的移動機器人空間定位模型,主要在以下方面取得了進步:① 引入位置細胞相互作用的神經網絡模型可以得到具有單峰興奮活動包的細胞板;② 在位置細胞學習、記憶以及位置解算的過程中,解決了網格—位置模型在編碼區域邊界處定位誤差較大的問題;③ 建立了由位置細胞放電活動求解機器人在物理環境中位置的數學模型。本文模型完全依據海馬空間細胞的生理學研究事實,并設計了仿真實驗和物理實驗對模型進行驗證。實驗結果表明:相較于RatSLAM和網格—位置映射模型,本文模型的定位更加精確,且在機器人長時間的路徑積分過程中所產生的累積誤差也更小。
移動機器人要執行的導航任務往往會在復雜未知環境下進行,而本文模型所實現的功能僅僅是在自運動信息的輸入下實現機器人的路徑積分。高等哺乳動物通常會結合多種內、外源信息實現自身在環境中的精確定位,例如生理學上發現的大鼠使用環境信息對路徑積分過程中的累計誤差進行快速而準確的矯正。因此,本文的研究工作對于復雜未知環境的適應能力還遠不及嚙齒類動物的水平,下一步的研究方向應為從認知機制的角度出發構建空間細胞模型,以多種外源信息(視覺、嗅覺、聽覺等)為輸入,力求使機器人在與環境的交互過程中漸進地形成和發展對環境的認知能力,從而提高機器人在復雜環境下的適應能力。
綜上所述,本文研究成果為仿鼠腦認知機制的機器人導航方法奠定了基礎,對機器人導航、環境認知和地圖重構等領域的研究具有重要的意義。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:于乃功對相關工作進行了調查,發現了現有方法的不足,提出了本文的核心觀點與研究思路;廖詣深針對該研究思路進行了實現,并設計了實驗對本文方法進行了驗證。
















