視距外控制對具有大范圍運動能力的生物機器人意義重大。鴿子生物機器人以在體預編程的方式實現了視距外控制,但尚未形成控制閉環。本研究在鴿子生物機器人控制系統的神經刺激功能之上增設運動監測功能,對鴿子飛行狀態實時解算,結合邏輯判據實現戶外飛行過程中轉向及盤旋的閉環調控。調控刺激位點位于鴿子中腦網狀結構(FRM)的兩側,分別用于左向和右向控制;刺激信號具有生物神經細胞膜電位的波形特征并間歇激活;控制系統總重11.8 g。結果表明,該鴿子生物機器人的閉環調控成功率達到90%;輔以在體攝像裝置,可方便獲取飛行機動時的翼面形態;結合鴿群等級特征,能夠實現個體調控對集群演化的干預。這些為發掘鴿子生物機器人在科學研究領域的應用奠定了基礎。
引用本文: 王浩, 王紹康, 邱兆成, 張琦, 許帥. 戶外鴿子生物機器人的設計及初步應用. 生物醫學工程學雜志, 2022, 39(6): 1209-1217. doi: 10.7507/1001-5515.202207077 復制
引言
生物機器人具有生物和機器的雙重屬性,是把生物有機體作為載體的特種機器人,是人類通過控制技術施加干預信號調控生物行為從而實現人類操控的生物[1-2]。可見,生物機器人研究的目的之一是充分利用自然界動物在陸上[3-6]、水下[7-9]、空中[10-12]的運動能力。然而,受制于遙控遙測手段和通訊距離的限制[13],大多數生物機器人的受控范圍局限于室內或室外幾百米的半徑內,這極大地限制了生物機器人的運動潛能和應用潛力。特別是對以歸巢本能和長距離飛行為特點的鴿子生物機器人[14-16]而言,實現其戶外飛行的視距外運動調控尤為重要。舍棄實時通訊,在遠端控制系統直接編程控制指令,以預設條件觸發固定的腦電刺激信號,為解決戶外鴿子生物機器人的視距外調控提供了思路[17]。這種預編程調控模式解決了鴿子生物機器人在操作人員視距外運動時如何產生控制指令的問題,但還缺乏反饋,未形成控制閉環。
另一方面,隨著生物機器人技術的日趨成熟,發掘這項技術的應用出口已提上日程。除了偵察與救援這一熱門應用方向[18-19],把生物機器人作為人工可控的科學工具,用于動物個體及集群的運動、協調、交互等各類行為機制及仿生應用的研究[20-22],也逐漸受到重視。
鴿子生物機器人已經具有了可靠的微電刺激~運動響應范式,在80 Hz正負雙相電壓刺激脈沖的作用下,通過調節刺激脈沖占空比、脈沖序列的長短及周期性間隔,可以實現轉彎、盤旋等多種飛行動作的控制[17, 22],為后續研究奠定基礎。本文針對鴿子生物機器人發展和應用的需求,采用邏輯調控思路,依托神經調控原理和腦機接口技術,設計了一種可實現戶外飛行閉環控制的鴿子生物機器人,并展示了該機器人在撲翼飛行和集群協調等研究領域的應用。鴿子背載的控制系統中預設機動任務,如在特定區域或時刻開始轉向或盤旋;系統借助北斗導航模塊對飛行軌跡實時監測,并解算當前飛行狀態;依據調控邏輯觸發控制指令,發送腦電刺激信號;判斷機動任務的執行情況,并形成下一步指令。
1 閉環控制系統
1.1 系統邏輯
自然界鴿子飛行能力較強,具體表現在:飛行距離遠,一般在十公里以上[17];飛行速度快,平均時速約60 km/h[17],短時間內爆發速度可達100 km/h;巡航飛行高度約為150 m,同時個體負載能力有限。鴿子飛行的這些特點限制了現有生物機器人通訊技術[13]在鴿子生物機器人上的應用,尤其在戶外遠距離場景下,無法構成地面端人工監測中心和遠端鴿子生物機器人的控制閉環。本文提出,在生物機器人背載設備的神經刺激功能之上,增加運動監測功能,以在體機器監測替代遠端人工監測,用邏輯算法實現生物機器人的控制閉環。運動監測功能的實現依托全球衛星定位導航技術[23],選用外形小巧、定位精度更優的國產北斗模塊[24]。模塊設置了最高時間分辨率(5 Hz),以滿足快速飛行采樣的要求。鴿子生物機器人閉環控制系統的邏輯流程如圖1所示。

1.2 軟硬件設計
我們設計的鴿子生物機器人的整體系統結構如圖2所示。其中,在體控制系統包括中央控制模塊、運動監測模塊、神經刺激模塊、數據存儲模塊;腦機接口是控制系統與鴿腦的連接;馬甲或背貼用于控制系統的穿戴或背載。圖中箭頭表示數據流向,實線段表示物理連接。中央控制模塊主要由嵌入式系統中央處理器STM32F103RBT6和電源管理芯片RT9193、TC7660EOA組成;運動監測模塊由北斗導航單元ATGM336H和無源陶瓷天線組成;神經刺激模塊由中控的GPIO與運算放大器MC33202組成;腦機接口結合鴿子顱骨特性設計[25]。

1.2.1 系統硬件
系統硬件的電路原理如圖3所示。中央控制模塊的核心是STM32F103RBT6芯片(意法半導體),工作時鐘最高為72 MHz。在KEIL開發環境(Keil Software,美國)下編譯成功的控制程序貯存在芯片存儲器中。當系統上電后,芯片根據設定的時序依次在存儲器中調用程序,設置相應的數據寄存器,并配置輸入輸出端口。控制程序從外周設備讀取數據,通過運算模塊對數據進行代數及邏輯運算,并依據運算結果形成輸出指令,產生下一步操作。中央控制模塊由一片鋰電池(3.7 V,400 mAh)供電,可以持續供電4 h左右。電源管理包括穩壓電路、負壓轉換電路、抗干擾及過壓保護電路。穩壓電路選用RT9193,產生3.3 V恒壓為系統各模塊供電;負壓轉換電路選用TC7660EOA,為雙相腦電刺激信號提供負壓;抗干擾電路采用濾波方式以減輕來自電源的耦合干擾,過壓保護電路避免電路中突然的過壓燒壞元器件。另外,中央控制模塊預留接口,用于功能擴充。

運動監測模塊采用商用北斗模組ATGM336H(中科微電子,中國),其靈敏度高,支持BDS、GPS和GLONASS三種衛星導航系統的單系統定位以及任意組合的多系統聯合定位。模組的配置可在PC端使用GNSSToolKit工具實現,設置上限采樣率(5 Hz)以匹配鴿子的飛行速度,同時設定UART接口RXD/TXD的波特率為15.2 kBit/s;為減少數據傳輸量,按NMEA-0183協議僅選擇$GNRMC幀信息,輸出僅包含經度、緯度、高度及時間信息的BDS定位數據。運動監測模塊與中央控制模塊通過SPI協議進行數據傳送,電氣上直接與PA9(TXD)和PA10(RXD)連接。
神經刺激模塊由中央控制模塊的GPIO輸出與運算放大器MC33202共同組成。主控程序產生脈寬可調的PWM信號,其中一路不作分壓處理,另一路通過電阻分壓降低信號幅值,兩路信號經由運算放大器MC33202進行減法運算,可以產生幅值與脈寬靈活多變的雙相腦電刺激信號。
數據存儲模塊由TF卡及其驅動電路組成。TF卡存儲容量可達8 GB,可記錄實驗過程中的各類數據。數據存儲模塊通過SPI總線與中央控制模塊連接,以DMA方式進行數據傳輸。
鴿子生物機器人的腦機接口在文獻[25]中有詳細介紹,在此不再贅述。通過腦機接口植入兩根刺激電極和一根參考電極。刺激電極的目標靶點位于鴿子中腦網狀結構(formation reticularis medialis mesencephali,FRM)的左右雙側,即以耳桿連線中點為空間坐標系原點,矢向取3.0~3.6 mm,冠向取1.0~2.5 mm,縱向取4.0~6.5 mm;參考電極置于頭部皮下的一側顱骨上。
鴿子生物機器人控制系統(見圖4a)的外形尺寸為30 mm×30 mm×12 mm,含電池重量為11.8 g,其背載方式有背貼式和馬甲式兩種。背貼式即在鴿子左右翅根之間的背部區域、背載設備的底面,分別粘貼尼龍搭扣的兩部分,該方式背載、脫離方便,適用于一體化的背載設備(見圖4b);馬甲式即用彈性布料量體裁制組合式馬甲(見圖4c),可套頭穿戴至胸腹部,在馬甲上可以穿引導線用于電氣連接,適用于分布式的背載設備(見圖4d)。

a. 控制系統;b. 背貼式背載;c. 馬甲;d. 馬甲式背載 (彩圖)
Figure4. Photos of pigeon-robotsa. control system; b. wearing by Velcro; c. pigeon vest; d. wearing by vest
1.2.2 系統軟件
系統軟件在KEIL開發平臺編輯、編譯和調試,確保工作流程(見圖1)的執行。軟件除了驅動系統硬件、協調外周模塊等次要功能外,主要功能是實現鴿子生物機器人的邏輯調控:一是利用運動監測模塊硬件獲取的實時坐標數據分析飛行調控任務執行情況,二是結合神經刺激模塊硬件構造雙相腦電刺激信號。
運動監測模塊實時獲取當前地理經緯度坐標,并依據WGS-84系統規則把經緯度坐標轉換為笛卡爾坐標(以鴿舍為坐標原點),以當前時刻坐標與上一時刻坐標的矢量差解算當前的飛行速度與方向。當飛行調控任務啟動后,令腦電刺激開始前的飛行方向為參考方向;之后每施加一次單元刺激序列(見后文定義),進行一次飛行方向解算,并與參考方向比較獲得飛行偏角;以飛行偏角的數值判定任務是否達到預期。對于轉向任務,設定具體的預期偏角;對于盤旋任務,以飛行偏角超過±270°(+代表左盤旋,–代表右盤旋)為判據,此后即使沒有后續刺激,鴿子也會本能地繼續轉向,以回歸刺激前的飛行方向。
神經刺激模塊輸出的單元刺激序列為一時長4 s的脈沖串信號,前2 s為刺激脈沖串,后2 s為零電平,以避免持續電刺激對腦組織造成損傷。刺激脈沖串的頻率為80 Hz(周期12.5 ms,由系統72 M主頻、1 000分頻、900重裝載值決定),刺激波形由中控GPIO產生的兩路PWM波經由運算放大器減法合成,產生正負幅值比例、正負脈寬比例均可調的雙相刺激信號(見圖5a)。單個刺激脈沖的波形仿照神經細胞動作電位設計。神經細胞動作電位(見圖5b)包含一個細胞膜電位快速由負電位上升至正電位然后回落的過程。由負升正段由去極化(圖5b中b-c段)和反極化/超射(圖5b中c-d段)構成,過程陡峭,此時膜內的負電位迅速消失并繼而變為正電位,膜內外電位差快速升高;回落段由復極化(圖5b中d-e段)構成,過程相對較緩,膜內外電位差逐步回落,并最終恢復至靜息負電位。鴿子生物機器人的腦電刺激信號按照上述膜電位生理過程設計,在刺激目標靶區用較短的時間施加較大的負電壓(–3.3 V)以注入負電荷,然后用兩倍的時間施加較小正電壓(+1.65 V),形成模擬動作電位的刺激信號(見圖5c)。在軟件中調整PWM的占空比和脈沖幅值,使PWM1的幅值是PWM2的一半,而脈寬是其兩倍,且滿足相位關系,即可實現單刺激脈沖的合成。單元刺激序列則是由160個單刺激脈沖組成的連續刺激脈沖串。

a. 雙相刺激信號合成;b. 神經細胞動作電位;c. 示波器顯示的單個刺激脈沖
Figure5. Design of the brain stimulation signala. synthesis of biphasic signals; b. action potential of nerve cell; c. stimulation pulse in oscilloscope
2 動物實驗和結果
動物實驗所用的鴿子,在當地信鴿協會的指導和監督下,由課題組自主飼養和繁育。實驗選用兩只月齡6個月以上的成年鴿,體重范圍在400~500 g之間。經外科手術植入控制電極并安裝腦機接口的鴿子生物機器人在恢復3~5天后,進行室內和戶外運動調控測試。室內測試的目的是檢驗調控的有效性,并確定戶外測試所需的腦電刺激參數。戶外測試在合適的天氣條件(晴天、微風)下進行。鴿子生物機器人于10 km外獨自歸巢,約10 min的飛行行程。為避免起飛和降落階段的自主飛行機動影響,邏輯調控在行程中段進行,時間窗口有限,僅調控左、右盤旋各一次。實驗共進行5次,分別在5個上午進行。在室內和戶外測試確認了鴿子生物機器人飛行調控有效性的基礎上,進一步測試了鴿子生物機器人的兩類應用能力:一是同步獲取自身機動飛行軌跡和翼面形態的能力,二是干預影響所屬集群決策和演化的能力。前者通過單只鴿子生物機器人展示;后者由1只鴿子生物機器人和2只自然鴿構成的集群展示,其中自然鴿的月齡和體重與鴿子生物機器人相當。
2.1 室內測試
室內測試鴿子生物機器人在1次單元刺激序列作用下身體轉向的角度,并在調控有效的前提下確定腦電刺激脈沖參數。刺激脈沖的脈沖頻率及正負相電壓幅值恒定不變,可變參數僅為刺激脈寬P。由于正負相脈寬比例恒定,以負相脈寬定義參數P,取值范圍在0.014~4.167 ms,變化步長近似為0.014 ms;正相脈寬是負相的2倍。測試以兩分鐘為間隔,逐步增加刺激脈沖的P值,直到該脈寬的單元刺激序列能夠誘導出鴿子原地轉向360°的動作。即,確定誘導鴿子原地轉向一周所需的最小脈寬值,為后續戶外測試所用。對左右腦目標靶區的刺激參數采用相同的方式確定。
全部室內測試均實現了鴿子生物機器人原地360°轉向誘導,所需刺激脈寬如圖6所示。可見,不同個體、不同腦區的刺激脈寬有較大差異,這是由動物間的個體差異以及電極植入位點的定位誤差所致。另外,隨著實驗次數的增加,為實現相同誘導動作所需的刺激脈寬P也在逐漸增大。生物組織對侵入的異物會產生自然的排異反應,從異物尖端開始逐漸產生包裹層。隨著電極尖端觸點周圍包裹層的日益增厚,其組織阻抗增大、電傳導性變差,同等強度刺激的效果越來越不明顯,為達到相同的刺激效果,需要增大刺激強度。一般而言,植入刺激電極后的兩周至一個月內,是鴿子生物機器人最佳測試時間。

為了增加鴿子生物機器人測試結果的可比較性,需要在所有測試中均采用刺激效果相當的單元刺激序列,所以在每一次戶外測試之前都必須通過室內測試重新確定刺激參數。
2.2 戶外測試
自由飛行的鴿子面對復雜的戶外環境,為誘導出預期的盤旋動作往往需要多個單元刺激序列持續作用。但過長的刺激序列會對腦組織造成潛在損傷,一般控制在30 s以內為宜。為此,戶外測試在邏輯調控流程中(見圖1)設定可調用單元刺激序列的次數上限為8次。
戶外飛行鴿子生物機器人的盤旋誘導共測試20組(見表1),包含2只鴿子(RP1和RP2)的左右向誘導盤旋各5次,總體成功率為90%,其中左向誘導成功率100%,右向誘導成功率80%。為避免過度刺激對鴿腦造成傷害的風險,邏輯調控流程中可調用單元刺激序列的數目上限設定為8次,并以8次以內刺激序列能夠誘導出1次完整盤旋軌跡作為測試成功與否的判據標準。圖7展示了表1中部分測試的飛行軌跡。成功的測試中,最少僅需施加1次單元刺激序列(見圖7a),最多需要6次(見圖7b);失敗的測試中,施加8次單元刺激序列,仍未能實現盤旋誘導(見圖7c)。


a. 1次刺激誘導成功;b. 6次刺激誘導成功;c. 誘導失敗
Figure7. Circling control during flying outdoora. success by 1 stimulation; b. success by 6 stimulations; c. failed case
2.3 飛行機動翼面形態測試
鴿子生物機器人的中央控制模塊留有多種擴展接口,如接入微型輕量的圖像采集裝置,就可以在誘導自由飛行鴿子轉彎機動的過程中,同步獲取翅膀形態變化的細節(見圖8)。圖中展示了鴿子生物機器人的一段飛行軌跡(見圖8a),以及在誘導轉向開始前(見圖8b)和轉向中(見圖8c)的翅膀翼面形態變化情況。空中轉彎機動過程中,鴿子的外翼顯著向后彎折,導致翼面的展向變形。

a. 飛行軌跡;b. 轉向前的翼面;c. 轉向中的翼面
Figure8. Induced turning and wing morphinga. flight trajectory; b. before turning; c. during turning
2.4 集群演化干預效果測試
為探討鴿子生物機器人對飛行集群的行為和演化是否會產生影響,初步測試了3只個體構成的小集群(1只鴿子生物機器人,2只自然鴿)。每只個體在鴿子集群中都有不同的等級[22, 26],即自由集群作出飛行方向選擇時,個體是處于決定地位還是跟隨地位。個體等級可由方向相關法[26]計算得到。選擇不同等級的鴿子作為鴿子生物機器人,對集群演化的干預效果截然不同。當鴿子生物機器人處于相對高等級時(見圖9a),它受控時的機動飛行對集群中其他個體影響顯著;反之,當處于相對低等級時(見圖9b),鴿子生物機器人受控時的機動飛行則明顯受到集群中其他個體的影響。

a. 高等級鴿子生物機器人的影響;b. 低等級鴿子生物機器人的影響
Figure9. Internal coordination in a flying pigeon flocka. robo-pigeon at high hierarchy; b. robo-pigeon at low hierarchy
3 討論
3.1 影響戶外測試效果的因素及本研究的局限
戶外測試中的鴿子生物機器人運動調控效果明顯不如室內,所需單元刺激序列的數目多、變化范圍大,并且存在誘導失敗的情況。分析影響戶外測試效果的因素可能存在于三個方面:首先,戶外自然環境復雜、不可預測,鴿子對視覺、氣流等外界刺激的感受會與正常的腦電刺激響應相互疊加和影響,導致整體響應的遲鈍和動作的不自然;其次,鴿子對長期重復的腦電刺激會產生一定的適應性,調控效果會由于適應性脫敏而逐漸減弱;最后,鴿子的個體存在差異性,對腦電刺激及外界環境的響應方式都會有所不同。
受制于野外生物活體實驗數據獲取的條件約束,本研究的樣本量偏少,測試時間和空間也較為有限,存在不足之處。未來為了獲得鴿子生物機器人更加穩定的性能和更加可靠的應用,后續研究需要從三方面加以完善:一是探索更豐富的功能腦區及神經核團,在中腦網狀結構調控轉彎行為的基礎上,進一步發掘并拓展新的調控功能,如加減速、爬升下降等功能;二是獲得更完備的實驗設計和數據樣本,長期積累單次/多次盤旋、S彎、上下坡等多種行為調控實驗的數據樣本;三是采用更寬泛的測試空間和外場環境,使鴿子生物機器人的設計與測試更具普適性。
3.2 鴿子生物機器人在科學研究領域的應用價值
盡管鴿子生物機器人在戶外條件下尚無法達到精確的運動誘導和百分之百的誘導成功率,但其作為一種人工可控的生物工具,在自然環境下飛行動物個體或群體現象的科學研究中,已初步體現出應用價值。
一是研究鴿子機動飛行的翼面變形現象。動物飛行的機動性能遠優于仿生飛行機器人,其機動過程中的翼面變形是仿生設計的要點之一。研究人員利用風洞等設備開展了大量研究,但簡化的室內實驗條件往往會忽略動物飛行過程中的一些細節現象,而這些現象與機動性能的關系并不明確。可見在戶外自然條件下,獲取自由飛行動物的實驗數據十分必要[27-28],但如何高效率高質量地獲取各類飛行機動數據,是實踐操作的難點所在。如果利用鴿子生物機器人的飛行調控功能,并輔以各類功能載荷,則有望解決上述難題。例如,配備了微型輕量的圖像采集裝置的鴿子生物機器人(見圖8),可以同步獲取其自由飛行機動時的運動軌跡、翅膀形態變化細節等各類實驗數據,這對飛行力學的研究和仿生飛行機器的設計都會起到促進作用。
二是研究鴿子集群飛行的內部協調機制。隨著無人機技術的日益成熟,軍民均具應用潛力的無人機集群受到越來越多的關注,個體間如何協調以發揮出更大的群體優勢,是無人機集群研究的難點和熱點。而在自然界中,生物的大規模集群現象普遍存在,鳥群作為空中集群的典型代表,其集群飛行的復雜行為及底層的協調機制廣受關注。但是,由于自由飛行鳥群的運動具有很大隨意性且難于干預,目前對鳥群運動的研究大多基于長期觀察和數學建模,效率不高,不易抓住鳥群個體間協調的本質。如何在自由飛行鳥群中加入人工可控因素,以提高研究的系統性和效率,是鴿子集群飛行研究中亟待解決的難題之一[29-30]。如果把攜帶神經調控代碼的鴿子生物機器人作為鴿群的一員,則可以通過人工誘導鴿子生物機器人飛行機動的方式,在鴿群中加入人工可控因素,有望解決上述難題。例如,本研究在三只個體構成的小型家鴿集群測試中(見圖9),處于相對高等級的鴿子生物機器人可以顯著影響集群的飛行方向選擇,通過對鴿子生物機器人的盤旋動作的誘導,實現了對整個集群飛行行為的操控。這類研究可以擴展到更大的集群,逐步揭示集群的復雜性,還可對無人機集群的協調算法設計有所啟示。
4 結論
本研究依托神經調控原理和腦機接口技術,提出了一種生物機器人的邏輯調控方法,設計制作了控制系統的軟硬件,實現了可在戶外自由飛行條件下運動調控的鴿子生物機器人。控制系統尺寸小(30 mm × 30 mm × 12 mm),重量輕(含電源重11.8 g),續航時間長(約為4 h),能夠滿足鴿子生物機器人的背載及戶外工作要求。以機器取代人工對鴿子運動狀態的監測,實現邏輯調控閉環,突破了鴿子生物機器人工作半徑的制約,適用于戶外廣闊的空間。腦電刺激信號仿照神經細胞動作電位設計并以間歇激活方式工作,可減輕對鴿子腦組織造成的損傷。在戶外自由飛行條件下,鴿子生物機器人展示了轉向及盤旋運動的可誘導性,并在鴿子機動飛行的翼面變形現象、集群飛行的內部協調機制等研究方向體現出應用價值。
致謝:作者感謝蔡雷、吳錦、李俊杰、朱志堅等在持續優化腦接接口和神經調控參數的工作中做出的貢獻。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:王浩負責實驗設計、數據分析、論文寫作,王紹康、邱兆成、張琦、許帥負責實驗開展、數據收集和數據分析。
倫理聲明:本研究通過了南京航空航天大學動物實驗倫理委員會的審批(批文編號:JSNUAA20180056)。
引言
生物機器人具有生物和機器的雙重屬性,是把生物有機體作為載體的特種機器人,是人類通過控制技術施加干預信號調控生物行為從而實現人類操控的生物[1-2]。可見,生物機器人研究的目的之一是充分利用自然界動物在陸上[3-6]、水下[7-9]、空中[10-12]的運動能力。然而,受制于遙控遙測手段和通訊距離的限制[13],大多數生物機器人的受控范圍局限于室內或室外幾百米的半徑內,這極大地限制了生物機器人的運動潛能和應用潛力。特別是對以歸巢本能和長距離飛行為特點的鴿子生物機器人[14-16]而言,實現其戶外飛行的視距外運動調控尤為重要。舍棄實時通訊,在遠端控制系統直接編程控制指令,以預設條件觸發固定的腦電刺激信號,為解決戶外鴿子生物機器人的視距外調控提供了思路[17]。這種預編程調控模式解決了鴿子生物機器人在操作人員視距外運動時如何產生控制指令的問題,但還缺乏反饋,未形成控制閉環。
另一方面,隨著生物機器人技術的日趨成熟,發掘這項技術的應用出口已提上日程。除了偵察與救援這一熱門應用方向[18-19],把生物機器人作為人工可控的科學工具,用于動物個體及集群的運動、協調、交互等各類行為機制及仿生應用的研究[20-22],也逐漸受到重視。
鴿子生物機器人已經具有了可靠的微電刺激~運動響應范式,在80 Hz正負雙相電壓刺激脈沖的作用下,通過調節刺激脈沖占空比、脈沖序列的長短及周期性間隔,可以實現轉彎、盤旋等多種飛行動作的控制[17, 22],為后續研究奠定基礎。本文針對鴿子生物機器人發展和應用的需求,采用邏輯調控思路,依托神經調控原理和腦機接口技術,設計了一種可實現戶外飛行閉環控制的鴿子生物機器人,并展示了該機器人在撲翼飛行和集群協調等研究領域的應用。鴿子背載的控制系統中預設機動任務,如在特定區域或時刻開始轉向或盤旋;系統借助北斗導航模塊對飛行軌跡實時監測,并解算當前飛行狀態;依據調控邏輯觸發控制指令,發送腦電刺激信號;判斷機動任務的執行情況,并形成下一步指令。
1 閉環控制系統
1.1 系統邏輯
自然界鴿子飛行能力較強,具體表現在:飛行距離遠,一般在十公里以上[17];飛行速度快,平均時速約60 km/h[17],短時間內爆發速度可達100 km/h;巡航飛行高度約為150 m,同時個體負載能力有限。鴿子飛行的這些特點限制了現有生物機器人通訊技術[13]在鴿子生物機器人上的應用,尤其在戶外遠距離場景下,無法構成地面端人工監測中心和遠端鴿子生物機器人的控制閉環。本文提出,在生物機器人背載設備的神經刺激功能之上,增加運動監測功能,以在體機器監測替代遠端人工監測,用邏輯算法實現生物機器人的控制閉環。運動監測功能的實現依托全球衛星定位導航技術[23],選用外形小巧、定位精度更優的國產北斗模塊[24]。模塊設置了最高時間分辨率(5 Hz),以滿足快速飛行采樣的要求。鴿子生物機器人閉環控制系統的邏輯流程如圖1所示。

1.2 軟硬件設計
我們設計的鴿子生物機器人的整體系統結構如圖2所示。其中,在體控制系統包括中央控制模塊、運動監測模塊、神經刺激模塊、數據存儲模塊;腦機接口是控制系統與鴿腦的連接;馬甲或背貼用于控制系統的穿戴或背載。圖中箭頭表示數據流向,實線段表示物理連接。中央控制模塊主要由嵌入式系統中央處理器STM32F103RBT6和電源管理芯片RT9193、TC7660EOA組成;運動監測模塊由北斗導航單元ATGM336H和無源陶瓷天線組成;神經刺激模塊由中控的GPIO與運算放大器MC33202組成;腦機接口結合鴿子顱骨特性設計[25]。

1.2.1 系統硬件
系統硬件的電路原理如圖3所示。中央控制模塊的核心是STM32F103RBT6芯片(意法半導體),工作時鐘最高為72 MHz。在KEIL開發環境(Keil Software,美國)下編譯成功的控制程序貯存在芯片存儲器中。當系統上電后,芯片根據設定的時序依次在存儲器中調用程序,設置相應的數據寄存器,并配置輸入輸出端口。控制程序從外周設備讀取數據,通過運算模塊對數據進行代數及邏輯運算,并依據運算結果形成輸出指令,產生下一步操作。中央控制模塊由一片鋰電池(3.7 V,400 mAh)供電,可以持續供電4 h左右。電源管理包括穩壓電路、負壓轉換電路、抗干擾及過壓保護電路。穩壓電路選用RT9193,產生3.3 V恒壓為系統各模塊供電;負壓轉換電路選用TC7660EOA,為雙相腦電刺激信號提供負壓;抗干擾電路采用濾波方式以減輕來自電源的耦合干擾,過壓保護電路避免電路中突然的過壓燒壞元器件。另外,中央控制模塊預留接口,用于功能擴充。

運動監測模塊采用商用北斗模組ATGM336H(中科微電子,中國),其靈敏度高,支持BDS、GPS和GLONASS三種衛星導航系統的單系統定位以及任意組合的多系統聯合定位。模組的配置可在PC端使用GNSSToolKit工具實現,設置上限采樣率(5 Hz)以匹配鴿子的飛行速度,同時設定UART接口RXD/TXD的波特率為15.2 kBit/s;為減少數據傳輸量,按NMEA-0183協議僅選擇$GNRMC幀信息,輸出僅包含經度、緯度、高度及時間信息的BDS定位數據。運動監測模塊與中央控制模塊通過SPI協議進行數據傳送,電氣上直接與PA9(TXD)和PA10(RXD)連接。
神經刺激模塊由中央控制模塊的GPIO輸出與運算放大器MC33202共同組成。主控程序產生脈寬可調的PWM信號,其中一路不作分壓處理,另一路通過電阻分壓降低信號幅值,兩路信號經由運算放大器MC33202進行減法運算,可以產生幅值與脈寬靈活多變的雙相腦電刺激信號。
數據存儲模塊由TF卡及其驅動電路組成。TF卡存儲容量可達8 GB,可記錄實驗過程中的各類數據。數據存儲模塊通過SPI總線與中央控制模塊連接,以DMA方式進行數據傳輸。
鴿子生物機器人的腦機接口在文獻[25]中有詳細介紹,在此不再贅述。通過腦機接口植入兩根刺激電極和一根參考電極。刺激電極的目標靶點位于鴿子中腦網狀結構(formation reticularis medialis mesencephali,FRM)的左右雙側,即以耳桿連線中點為空間坐標系原點,矢向取3.0~3.6 mm,冠向取1.0~2.5 mm,縱向取4.0~6.5 mm;參考電極置于頭部皮下的一側顱骨上。
鴿子生物機器人控制系統(見圖4a)的外形尺寸為30 mm×30 mm×12 mm,含電池重量為11.8 g,其背載方式有背貼式和馬甲式兩種。背貼式即在鴿子左右翅根之間的背部區域、背載設備的底面,分別粘貼尼龍搭扣的兩部分,該方式背載、脫離方便,適用于一體化的背載設備(見圖4b);馬甲式即用彈性布料量體裁制組合式馬甲(見圖4c),可套頭穿戴至胸腹部,在馬甲上可以穿引導線用于電氣連接,適用于分布式的背載設備(見圖4d)。

a. 控制系統;b. 背貼式背載;c. 馬甲;d. 馬甲式背載 (彩圖)
Figure4. Photos of pigeon-robotsa. control system; b. wearing by Velcro; c. pigeon vest; d. wearing by vest
1.2.2 系統軟件
系統軟件在KEIL開發平臺編輯、編譯和調試,確保工作流程(見圖1)的執行。軟件除了驅動系統硬件、協調外周模塊等次要功能外,主要功能是實現鴿子生物機器人的邏輯調控:一是利用運動監測模塊硬件獲取的實時坐標數據分析飛行調控任務執行情況,二是結合神經刺激模塊硬件構造雙相腦電刺激信號。
運動監測模塊實時獲取當前地理經緯度坐標,并依據WGS-84系統規則把經緯度坐標轉換為笛卡爾坐標(以鴿舍為坐標原點),以當前時刻坐標與上一時刻坐標的矢量差解算當前的飛行速度與方向。當飛行調控任務啟動后,令腦電刺激開始前的飛行方向為參考方向;之后每施加一次單元刺激序列(見后文定義),進行一次飛行方向解算,并與參考方向比較獲得飛行偏角;以飛行偏角的數值判定任務是否達到預期。對于轉向任務,設定具體的預期偏角;對于盤旋任務,以飛行偏角超過±270°(+代表左盤旋,–代表右盤旋)為判據,此后即使沒有后續刺激,鴿子也會本能地繼續轉向,以回歸刺激前的飛行方向。
神經刺激模塊輸出的單元刺激序列為一時長4 s的脈沖串信號,前2 s為刺激脈沖串,后2 s為零電平,以避免持續電刺激對腦組織造成損傷。刺激脈沖串的頻率為80 Hz(周期12.5 ms,由系統72 M主頻、1 000分頻、900重裝載值決定),刺激波形由中控GPIO產生的兩路PWM波經由運算放大器減法合成,產生正負幅值比例、正負脈寬比例均可調的雙相刺激信號(見圖5a)。單個刺激脈沖的波形仿照神經細胞動作電位設計。神經細胞動作電位(見圖5b)包含一個細胞膜電位快速由負電位上升至正電位然后回落的過程。由負升正段由去極化(圖5b中b-c段)和反極化/超射(圖5b中c-d段)構成,過程陡峭,此時膜內的負電位迅速消失并繼而變為正電位,膜內外電位差快速升高;回落段由復極化(圖5b中d-e段)構成,過程相對較緩,膜內外電位差逐步回落,并最終恢復至靜息負電位。鴿子生物機器人的腦電刺激信號按照上述膜電位生理過程設計,在刺激目標靶區用較短的時間施加較大的負電壓(–3.3 V)以注入負電荷,然后用兩倍的時間施加較小正電壓(+1.65 V),形成模擬動作電位的刺激信號(見圖5c)。在軟件中調整PWM的占空比和脈沖幅值,使PWM1的幅值是PWM2的一半,而脈寬是其兩倍,且滿足相位關系,即可實現單刺激脈沖的合成。單元刺激序列則是由160個單刺激脈沖組成的連續刺激脈沖串。

a. 雙相刺激信號合成;b. 神經細胞動作電位;c. 示波器顯示的單個刺激脈沖
Figure5. Design of the brain stimulation signala. synthesis of biphasic signals; b. action potential of nerve cell; c. stimulation pulse in oscilloscope
2 動物實驗和結果
動物實驗所用的鴿子,在當地信鴿協會的指導和監督下,由課題組自主飼養和繁育。實驗選用兩只月齡6個月以上的成年鴿,體重范圍在400~500 g之間。經外科手術植入控制電極并安裝腦機接口的鴿子生物機器人在恢復3~5天后,進行室內和戶外運動調控測試。室內測試的目的是檢驗調控的有效性,并確定戶外測試所需的腦電刺激參數。戶外測試在合適的天氣條件(晴天、微風)下進行。鴿子生物機器人于10 km外獨自歸巢,約10 min的飛行行程。為避免起飛和降落階段的自主飛行機動影響,邏輯調控在行程中段進行,時間窗口有限,僅調控左、右盤旋各一次。實驗共進行5次,分別在5個上午進行。在室內和戶外測試確認了鴿子生物機器人飛行調控有效性的基礎上,進一步測試了鴿子生物機器人的兩類應用能力:一是同步獲取自身機動飛行軌跡和翼面形態的能力,二是干預影響所屬集群決策和演化的能力。前者通過單只鴿子生物機器人展示;后者由1只鴿子生物機器人和2只自然鴿構成的集群展示,其中自然鴿的月齡和體重與鴿子生物機器人相當。
2.1 室內測試
室內測試鴿子生物機器人在1次單元刺激序列作用下身體轉向的角度,并在調控有效的前提下確定腦電刺激脈沖參數。刺激脈沖的脈沖頻率及正負相電壓幅值恒定不變,可變參數僅為刺激脈寬P。由于正負相脈寬比例恒定,以負相脈寬定義參數P,取值范圍在0.014~4.167 ms,變化步長近似為0.014 ms;正相脈寬是負相的2倍。測試以兩分鐘為間隔,逐步增加刺激脈沖的P值,直到該脈寬的單元刺激序列能夠誘導出鴿子原地轉向360°的動作。即,確定誘導鴿子原地轉向一周所需的最小脈寬值,為后續戶外測試所用。對左右腦目標靶區的刺激參數采用相同的方式確定。
全部室內測試均實現了鴿子生物機器人原地360°轉向誘導,所需刺激脈寬如圖6所示。可見,不同個體、不同腦區的刺激脈寬有較大差異,這是由動物間的個體差異以及電極植入位點的定位誤差所致。另外,隨著實驗次數的增加,為實現相同誘導動作所需的刺激脈寬P也在逐漸增大。生物組織對侵入的異物會產生自然的排異反應,從異物尖端開始逐漸產生包裹層。隨著電極尖端觸點周圍包裹層的日益增厚,其組織阻抗增大、電傳導性變差,同等強度刺激的效果越來越不明顯,為達到相同的刺激效果,需要增大刺激強度。一般而言,植入刺激電極后的兩周至一個月內,是鴿子生物機器人最佳測試時間。

為了增加鴿子生物機器人測試結果的可比較性,需要在所有測試中均采用刺激效果相當的單元刺激序列,所以在每一次戶外測試之前都必須通過室內測試重新確定刺激參數。
2.2 戶外測試
自由飛行的鴿子面對復雜的戶外環境,為誘導出預期的盤旋動作往往需要多個單元刺激序列持續作用。但過長的刺激序列會對腦組織造成潛在損傷,一般控制在30 s以內為宜。為此,戶外測試在邏輯調控流程中(見圖1)設定可調用單元刺激序列的次數上限為8次。
戶外飛行鴿子生物機器人的盤旋誘導共測試20組(見表1),包含2只鴿子(RP1和RP2)的左右向誘導盤旋各5次,總體成功率為90%,其中左向誘導成功率100%,右向誘導成功率80%。為避免過度刺激對鴿腦造成傷害的風險,邏輯調控流程中可調用單元刺激序列的數目上限設定為8次,并以8次以內刺激序列能夠誘導出1次完整盤旋軌跡作為測試成功與否的判據標準。圖7展示了表1中部分測試的飛行軌跡。成功的測試中,最少僅需施加1次單元刺激序列(見圖7a),最多需要6次(見圖7b);失敗的測試中,施加8次單元刺激序列,仍未能實現盤旋誘導(見圖7c)。


a. 1次刺激誘導成功;b. 6次刺激誘導成功;c. 誘導失敗
Figure7. Circling control during flying outdoora. success by 1 stimulation; b. success by 6 stimulations; c. failed case
2.3 飛行機動翼面形態測試
鴿子生物機器人的中央控制模塊留有多種擴展接口,如接入微型輕量的圖像采集裝置,就可以在誘導自由飛行鴿子轉彎機動的過程中,同步獲取翅膀形態變化的細節(見圖8)。圖中展示了鴿子生物機器人的一段飛行軌跡(見圖8a),以及在誘導轉向開始前(見圖8b)和轉向中(見圖8c)的翅膀翼面形態變化情況。空中轉彎機動過程中,鴿子的外翼顯著向后彎折,導致翼面的展向變形。

a. 飛行軌跡;b. 轉向前的翼面;c. 轉向中的翼面
Figure8. Induced turning and wing morphinga. flight trajectory; b. before turning; c. during turning
2.4 集群演化干預效果測試
為探討鴿子生物機器人對飛行集群的行為和演化是否會產生影響,初步測試了3只個體構成的小集群(1只鴿子生物機器人,2只自然鴿)。每只個體在鴿子集群中都有不同的等級[22, 26],即自由集群作出飛行方向選擇時,個體是處于決定地位還是跟隨地位。個體等級可由方向相關法[26]計算得到。選擇不同等級的鴿子作為鴿子生物機器人,對集群演化的干預效果截然不同。當鴿子生物機器人處于相對高等級時(見圖9a),它受控時的機動飛行對集群中其他個體影響顯著;反之,當處于相對低等級時(見圖9b),鴿子生物機器人受控時的機動飛行則明顯受到集群中其他個體的影響。

a. 高等級鴿子生物機器人的影響;b. 低等級鴿子生物機器人的影響
Figure9. Internal coordination in a flying pigeon flocka. robo-pigeon at high hierarchy; b. robo-pigeon at low hierarchy
3 討論
3.1 影響戶外測試效果的因素及本研究的局限
戶外測試中的鴿子生物機器人運動調控效果明顯不如室內,所需單元刺激序列的數目多、變化范圍大,并且存在誘導失敗的情況。分析影響戶外測試效果的因素可能存在于三個方面:首先,戶外自然環境復雜、不可預測,鴿子對視覺、氣流等外界刺激的感受會與正常的腦電刺激響應相互疊加和影響,導致整體響應的遲鈍和動作的不自然;其次,鴿子對長期重復的腦電刺激會產生一定的適應性,調控效果會由于適應性脫敏而逐漸減弱;最后,鴿子的個體存在差異性,對腦電刺激及外界環境的響應方式都會有所不同。
受制于野外生物活體實驗數據獲取的條件約束,本研究的樣本量偏少,測試時間和空間也較為有限,存在不足之處。未來為了獲得鴿子生物機器人更加穩定的性能和更加可靠的應用,后續研究需要從三方面加以完善:一是探索更豐富的功能腦區及神經核團,在中腦網狀結構調控轉彎行為的基礎上,進一步發掘并拓展新的調控功能,如加減速、爬升下降等功能;二是獲得更完備的實驗設計和數據樣本,長期積累單次/多次盤旋、S彎、上下坡等多種行為調控實驗的數據樣本;三是采用更寬泛的測試空間和外場環境,使鴿子生物機器人的設計與測試更具普適性。
3.2 鴿子生物機器人在科學研究領域的應用價值
盡管鴿子生物機器人在戶外條件下尚無法達到精確的運動誘導和百分之百的誘導成功率,但其作為一種人工可控的生物工具,在自然環境下飛行動物個體或群體現象的科學研究中,已初步體現出應用價值。
一是研究鴿子機動飛行的翼面變形現象。動物飛行的機動性能遠優于仿生飛行機器人,其機動過程中的翼面變形是仿生設計的要點之一。研究人員利用風洞等設備開展了大量研究,但簡化的室內實驗條件往往會忽略動物飛行過程中的一些細節現象,而這些現象與機動性能的關系并不明確。可見在戶外自然條件下,獲取自由飛行動物的實驗數據十分必要[27-28],但如何高效率高質量地獲取各類飛行機動數據,是實踐操作的難點所在。如果利用鴿子生物機器人的飛行調控功能,并輔以各類功能載荷,則有望解決上述難題。例如,配備了微型輕量的圖像采集裝置的鴿子生物機器人(見圖8),可以同步獲取其自由飛行機動時的運動軌跡、翅膀形態變化細節等各類實驗數據,這對飛行力學的研究和仿生飛行機器的設計都會起到促進作用。
二是研究鴿子集群飛行的內部協調機制。隨著無人機技術的日益成熟,軍民均具應用潛力的無人機集群受到越來越多的關注,個體間如何協調以發揮出更大的群體優勢,是無人機集群研究的難點和熱點。而在自然界中,生物的大規模集群現象普遍存在,鳥群作為空中集群的典型代表,其集群飛行的復雜行為及底層的協調機制廣受關注。但是,由于自由飛行鳥群的運動具有很大隨意性且難于干預,目前對鳥群運動的研究大多基于長期觀察和數學建模,效率不高,不易抓住鳥群個體間協調的本質。如何在自由飛行鳥群中加入人工可控因素,以提高研究的系統性和效率,是鴿子集群飛行研究中亟待解決的難題之一[29-30]。如果把攜帶神經調控代碼的鴿子生物機器人作為鴿群的一員,則可以通過人工誘導鴿子生物機器人飛行機動的方式,在鴿群中加入人工可控因素,有望解決上述難題。例如,本研究在三只個體構成的小型家鴿集群測試中(見圖9),處于相對高等級的鴿子生物機器人可以顯著影響集群的飛行方向選擇,通過對鴿子生物機器人的盤旋動作的誘導,實現了對整個集群飛行行為的操控。這類研究可以擴展到更大的集群,逐步揭示集群的復雜性,還可對無人機集群的協調算法設計有所啟示。
4 結論
本研究依托神經調控原理和腦機接口技術,提出了一種生物機器人的邏輯調控方法,設計制作了控制系統的軟硬件,實現了可在戶外自由飛行條件下運動調控的鴿子生物機器人。控制系統尺寸小(30 mm × 30 mm × 12 mm),重量輕(含電源重11.8 g),續航時間長(約為4 h),能夠滿足鴿子生物機器人的背載及戶外工作要求。以機器取代人工對鴿子運動狀態的監測,實現邏輯調控閉環,突破了鴿子生物機器人工作半徑的制約,適用于戶外廣闊的空間。腦電刺激信號仿照神經細胞動作電位設計并以間歇激活方式工作,可減輕對鴿子腦組織造成的損傷。在戶外自由飛行條件下,鴿子生物機器人展示了轉向及盤旋運動的可誘導性,并在鴿子機動飛行的翼面變形現象、集群飛行的內部協調機制等研究方向體現出應用價值。
致謝:作者感謝蔡雷、吳錦、李俊杰、朱志堅等在持續優化腦接接口和神經調控參數的工作中做出的貢獻。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:王浩負責實驗設計、數據分析、論文寫作,王紹康、邱兆成、張琦、許帥負責實驗開展、數據收集和數據分析。
倫理聲明:本研究通過了南京航空航天大學動物實驗倫理委員會的審批(批文編號:JSNUAA20180056)。