為了滿足臨床中單個患者合作與競爭實驗的需求,本文提出了兩個基于隱馬爾可夫模型的人類交互行為按鍵模型。基于兩個按鍵模型,設計了驗證實驗并采集了有效被試行為學數據和前額葉腦血氧數據用于模型的評價。利用被試參與度與模型預測得分之間的相關性評價模型合理性;利用被試按鍵時間信息評價模型行為學模擬的準確率;提取前額深層信息,從信號同步性關系評價模型對生理學信息的提取。合理性評價表明合作按鍵模型在訓練數據和測試數據的相關系數別為 0.883 1 和 0.578 6,競爭模型則分別為 0.813 1 和 0.617 8。行為學信息評價結果表明,兩種模型對被試行為學模擬的準確率都達到 71.43%。生理學評價結果表明,合作按鍵模型與競爭按鍵模型能夠提取到被試的前額葉深層信息,且該信息與雙人合作按鍵與競爭按鍵提取到的信息具有一致性。綜上所述,合作、競爭兩種按鍵模型的行為學、生理學評價結果顯示,模型的實際表現與人-人的交互過程一致性較高,因此可考慮用于臨床試驗研究。
引用本文: 覃龍, 高琳, 張權, 王逸飛, 魏玉會, 閆相國. 人類交互行為的隱馬爾可夫模型. 生物醫學工程學雜志, 2019, 36(1): 40-49. doi: 10.7507/1001-5515.201705037 復制
引言
社會交互指在社會生活中,人與人之間產生的相互作用和相互影響。人類社會存在復雜的社會交互模式,良好的社會交往行為有利于建立良好的人際關系,促進健康和長壽;而抑郁癥和自閉癥等社會認知障礙類疾病患者表現為社會交往行為障礙,并會影響身體健康。近年來,神經影像學的發展為無創測量大腦活動提供了可行的手段,利用功能成像對自閉癥[1]、X 染色體易裂癥[2]和威廉斯氏綜合征[3]等的研究,使我們對社會認知障礙患者的大腦結構和功能的差異有了更深的了解。社會交互活動中合作與競爭是兩種最基本行為,Cui 等[4]建立了一種由兩人參與的合作、競爭實驗范式。以此實驗范式為基礎,我們[5]利用基于近紅外光譜的超掃描技術研究了人類社會交互活動過程中的腦功能變化。現有研究需要由兩人共同參與來完成,我們的長遠研究目標是把社會交互活動監測用于對精神疾病(特別是抑郁癥)患者的臨床客觀評價,而在臨床應用中不可能由專門人員與患者一起完成,需要建立一種模仿人與患者共同參與的人?機測試模式。
本文旨在通過研究人?人合作或競爭的實驗范式得到人?機測試模型。其中,人?人交互過程的狀態是明確可觀測的,而在人?機交互中被試者合作、競爭的對象的表現模式是隱藏的,需要通過可觀測的人?人交互狀態來推測。隱馬爾可夫模型(hidden Markov model,HMM)是一種統計概率模型,用來描述一個含有隱含未知參數的馬爾可夫過程[6–12],因此可以解決上述問題。本論文利用 HMM 技術,以合作與競爭為基礎研究社會交互行為,對被試按鍵行為進行建模,實現人?機環境下的社會交互行為評價。
1 按鍵模型建立的訓練數據采集實驗
為建立有效的模擬人類交互行為的 HMM,首先需要采集訓練數據,實驗內容主要包括合作任務與競爭任務。為模擬兩人間的合作和競爭,本文采用雙人手動按鍵實驗范式[5]。被試須根據屏幕中給出的按鍵提示做出按鍵動作,合作任務通過兩個人相互配合、盡可能地同時按鍵來模擬,被試根據本次按鍵的屏幕反饋,調整下次按鍵的快慢;競爭任務則通過兩個人爭取比對方更快按鍵來模擬。
1.1 合作任務
合作任務流程如圖 1 所示,在每次按鍵開始時,出現一個空心的灰色圓圈,提示準備按鍵,在隨機的延遲之后,灰色圓圈被填實為綠色,此信號作為可以開始按鍵信號,記為“go”,被試只能在“go”信號之后按鍵。相對電腦屏幕左邊的被試按“J”鍵,右邊的被試按“K”鍵。當兩個被試都按鍵之后,屏幕會顯示相應的反饋信息并停留 4 s,2 s 間隔之后又開始下一次合作按鍵。“go”信號與被試按鍵之間的時間間隔為反應時間,如果兩位被試反應時間之差小于某個閾值 T,則本次合作按鍵成功,合作成功加 1 分,并在反饋信息界面顯示“WIN”字樣以及累積得分;否則為合作按鍵失敗,合作失敗減 1 分,并在反饋信息界面顯示“LOSE”字樣以及累積得分。無論合作成功與否,都會在被試對應側屏幕顯示“+”或“?”(“+”表示本次按鍵實驗中對應側被試比另一位被試按鍵快,“?”表示比另一位被試按鍵慢)。被試被要求根據反饋信息調整下次按鍵快慢,盡可能地獲取高分。閾值 T 通過如下公式獲得:

![]() |
其中、
分別為兩個被試的本次按鍵時間。
1.2 競爭任務
競爭任務中被試被要求比同組另一名被試盡可能快地按鍵。競爭任務流程與合作按鍵相似,但屏幕顯示有差異,在兩名被試都按鍵后,會在被試對應側屏幕分別顯示“WIN”“LOSE”,其他顯示以及符號的含義與合作任務相同。競爭任務的記分策略為:先按鍵者得 1 分,后按鍵者扣 1 分;在“go”信號之前按鍵扣 1 分。被試通過屏幕反饋信息調整下一次的按鍵時間。
本文的實驗任務由兩部分組成,分別為測試部分和正式實驗部分。測試部分由 5 次合作按鍵組成,目的在于使被試準確了解實驗要求以及熟悉實驗環境。正式實驗部分由休息、合作按鍵、休息、競爭按鍵、休息五個模塊組成。休息為 300 s 閉眼休息,合作按鍵和競爭按鍵都為 40 次按鍵,每次按鍵時間 7~8 s,整個實驗部分持續大約 30 min。
根據上述實驗任務,選取被試參與實驗。被試選取的標準為無社會認知行為障礙以及視力或矯正視力正常的大學生,實驗暫不考慮被試性別差異但保持每組被試性別相同。實驗方案通過西安交通大學生命科學與技術學院倫理委員會批準,并征得被試同意。實驗時每組的兩名被試使用同一臺電腦的不同顯示器及鍵盤完成實驗任務,被試者之間用擋板隔開避免相互影響。實驗一共采集了 20 名共 10 組被試的按鍵行為數據,年齡 22~25(22.9 ± 1.3)歲,其中男性 12 人,女性 8 人。此 10 組數據為訓練數據,主要用來建立人?機交互模型。
2 交互行為的隱馬爾可夫模型
上述實驗采集都是采用雙人合作與競爭按鍵實驗范式,但后續研究為了便于臨床應用,需要開發單人的合作與競爭按鍵實驗,即人?機合作與人?機競爭實驗。在人?機交互實驗中僅有一名被試做任務實驗,機器主要記錄人?機交互實驗中人的合作與競爭按鍵表現,并通過建立的模型對按鍵結果進行評價,從而讓被試者可根據評判結果進行按鍵時間的調整。本文采用 HMM 分別對合作與競爭按鍵行為建模,用于開發單人參與的人?機合作與人?機競爭按鍵實驗任務。
2.1 隱馬爾可夫模型
HMM 是一種雙重的隨機過程,其中一個可以觀測,另一個不可以觀測。不可觀測的隨機過程又稱隱藏狀態,是一個馬爾可夫 (Markov) 過程,即是一個有限狀態機,其中每個狀態都帶有轉移概率。可觀測的隨機過程由一系列觀測值組成,又稱可觀測狀態,可觀測狀態與隱藏狀態之間依概率相關。因此,HMM 可以看成一個五元組{S, V, A, B, π}:
![]() |
![]() |
![]() |
![]() |
![]() |
其中 S 為隱藏狀態集,共有 N 個狀態;V 為可觀測狀態集,共有 M 個狀態;A 為狀態轉移矩陣, 表示從狀態
轉移到狀態
的概率(圖 2b);B 為混淆矩陣,
表示在狀態
時,可觀測狀態
的概率(圖 2c);π 為初始概率矩陣,
表示初始時刻狀態 i 的概率。HMM 如下圖 2a 所示。

a. 隱馬爾可夫模型;b.
a. HMM model; b. state transfer matrix
HMM 主要解決以下 3 個方面的問題:
(1)評估問題:對給定模型和觀察序列 V,求產生給定觀察值序列的概率
。它可以衡量給定模型與此觀察值序列之間的匹配情況。
(2)解碼問題:對于給定的模型和觀察值序列,求可能性最大的隱含狀態序列。解碼問題可用維特比(Viterbi)算法實現。
(3)學習問題:根據觀察值序列樣本來找到一個最可能的模型,即求模型參數。學習問題可用前向?后向算法,又稱 Baum-Welch 算法。
2.2 合作按鍵建模
合作按鍵模型中,建模思路為通過被試的按鍵時間判斷合作的結果。因此,被試按鍵時間為可觀測狀態,按鍵結果為隱藏狀態。
本文將隱藏狀態定義為如下四類:按鍵過快失分、按鍵偏快得分、按鍵偏慢得分、按鍵過慢失分,分別用 1、2、3、4 來表示。如圖 3a 所示,其中,
、
為兩個被試第n次按鍵的反應時間。

a.隱藏狀態定義;b.觀察值狀態定義
Figure3. Definition of collaborative modeling statea. definition of hidden state; b. definition of observed value state
按鍵反應時間與合作結果之間有著直接的關系,但單個被試的按鍵時間不能反映合作的結果,合作實驗更關注通過屏幕反饋信息的調整過程,因此同一被試前后兩次按鍵時間的差異更能體現調整狀態。在此基礎上我們將調整程度分為四個狀態,并將它定義為模型的觀測值狀態,用 1’、2’、3’、4’來表示。如圖 3b 所示,,其中
、
分別為同一被試本次和上一次的按鍵時間。
通過以上定義的隱含狀態與觀測狀態,對采集到的被試合作按鍵數據進行統計,同一組中隨機選取一個被試按鍵數據,一共 10 組數據,稱為訓練數據。由于本文中已知隱含狀態序列與觀察狀態序列,因此使用統計的方法計算 HMM 參數,即狀態轉移矩陣 A、混淆矩陣 B 以及初始概率 π。
![]() |
![]() |
![]() |
基于模型參數與 Viterbi 算法,通過模型利用觀測狀態即被試調整時間可以預測被試本次按鍵的結果。
2.3 競爭按鍵建模
同合作按鍵類似,我們同樣可以用 HMM 來對競爭按鍵行為進行建模。同樣地,競爭按鍵結果與調整程度分別作為隱含狀態和觀察狀態。隱藏狀態如圖 4 所示,,其中
、
分別為兩個被試按鍵時間。觀察狀態即按鍵調整程度定義與合作按鍵一致。

通過以上定義的隱含狀態與觀測狀態,對采集到的被試競爭按鍵數據進行統計,同一組中只隨機選取一個被試按鍵數據,一共 10 組數據,稱為訓練數據。通過統計的方法計算 HMM 參數,然后通過 Viterbi 算法預測隱含狀態,得到相應的競爭按鍵結果。
![]() |
![]() |
![]() |
3 按鍵模型驗證的數據采集實驗
為了實現對模型的驗證和評價,本文基于得到的合作按鍵模型與競爭按鍵模型設計驗證實驗。驗證實驗主要實現以下四種按鍵:人?人合作、人?機合作、人?人競爭、人?機競爭。其中人?人實驗通過雙人按鍵實現,人?機合作實驗通過合作按鍵模型實現,人?機競爭實驗通過競爭按鍵模型實現。實驗流程如圖 5 所示,其中,合作任務的兩個階段分別為人?機合作與人?人合作,競爭的兩個階段為人?機競爭與人?人競爭,但人?機與人?人實驗先后順序隨機安排,即每位被試在一次驗證實驗中四種按鍵任務均需要執行。每次實驗邀請兩名被試同時進行,使用同一臺電腦的不同顯示器及鍵盤按鍵完成實驗任務,被試者之間用擋板隔開避免相互影響,兩名被試在實驗過程中被隨機安排進行人?人交互或人?機交互實驗,且被試未被告知實驗對象的類型。整個實驗范式的實現借助 Psychtoolbox 完成。Psychtoolbox 是基于 Matlab 的心理學實驗設計軟件,可完成多種心理學刺激實驗。通過 Psychtoolbox 能夠單獨控制兩個顯示器輸出每一個被試的反饋信息,避免被試猜測實驗內容從而影響實驗的結果。

基于以上實驗內容選取被試參與實驗,被試為無社會認知行為障礙、視力或矯正視力正常的大學生,實驗暫不考慮被試性別差異。采集了 8 組共 16 位被試[年齡(24 ± 1.4)歲;其中男性 10 例,女性 6 例]的按鍵行為數據和前額葉腦血氧數據作為測試數據,與前文提到的訓練數據相互獨立。行為數據通過個人計算機記錄(如圖 6 上圖所示);腦血氧數據通過近紅外光譜設備采集被試雙側前額葉區域,探頭佩戴位置為左右側眉毛上方 1 cm 處(如圖 6 左下所示),接收探頭與光源的距離分別為 1.2、2.0、3.0 cm,依次命名為表層、近端以及遠端(如圖 6 右下所示)。16 名被試中有 2 位被試行為數據缺失,余下的 14 位被試中,1 位被試腦血氧數據記錄缺失。因此,由驗證實驗,共得到 14 位被試的行為學測試數據,參與模型的合理性驗證和行為學驗證分析;得到 13 位被試的腦血氧數據,參與模型的生理學評價分析。

近紅外光通過人體大腦時光程類似“香蕉”形態,不同發射-接收距離下的探測深度不同,距離越大探測深度越深[13]。1.2 cm 處探頭主要接收通過大腦表層的光信號,2.0 cm 處探頭采集到的信號中既有大腦表層信息也有少量大腦深層信息,3.0 cm 處探頭采集到的信號中既有大腦表層信息也有大量大腦深層信息。在本文的合作與競爭按鍵實驗中,主要關心被試在實驗期間前額葉深層的血氧變化,因此本文采用了基于多變量經驗模態分解(multivariate empirical mode decomposition,MEMD)的自適應濾波算法實現腦深層信息的提取。
MEMD 將 N 元時間序列看作 N 維向量序列,在 N 維空間中沿不同方向投影向量序列,計算各個投影向量的包絡[14]。求這些包絡的均值即為多元時間序列的均值向量,進而實現多元信號同尺度分解。因此,MEMD 實現了不同類別的信號分解時具有同一尺度,且克服了經驗模態分解的模態混疊現象。
基于 MEMD 的自適應濾波算法流程為:
(1)將表層血氧信號 signal_s、近端血氧信號 signal_n 以及遠端血氧信號 signal_f 經過 MEMD 算法分解,得到各自對應的本征函數(intrinsic mode function,IMF)和余量。
(2)選取 signal_s 和 signal_f 同一分解層的 IMF 信號進行自適應濾波。被選取用于自適應濾波的分解層應該滿足該層的 signal_s 和 signal_f 對應的 IMF 信號相關性大于某個閾值 T0 且在目標頻帶內。本文中自適應濾波器算法為 NLMS 算法,T0 取 0.5,目標頻帶為 0.03~0.20 Hz。
(3)將各層 IMF 自適應濾波后得到的信號疊加,即得深層腦血氧信號記為 signal_e,是后文生理學評價的基礎。小波相干分析法是一種同時考慮幅度和相位信息,從時頻域的角度研究兩個信號同步性的線性方法,由于其在時頻面的伸縮性,小波相干分析法已成為一種研究神經系統內部相干性的重要方法。根據 Torrence 等[15]關于小波相干性的定義,可由小波相干分析發現信號間的局部相關性。本文使用小波相干分析方法計算近紅外信號之間的同步性。
4 按鍵模型評價
模型的驗證和評價主要包括模型的合理性驗證、行為學驗證及生理學評價。其中合理性驗證同時利用了訓練數據與測試數據的按鍵行為學數據,主要分析模型預測與實際對按鍵速度調整狀態之間的相關性;行為學驗證使用了測試數據中被試的按鍵反應時間數據;而生理學評價則主要分析測試數據中被試在人?人與人?機實驗過程中深層腦血氧信號間的同步性。
4.1 基于評分表的模型合理性驗證
為了量化單個被試參與合作的程度,我們設計了合作任務評分表,如表 1 所示。合作評分表主要從被試本次合作按鍵調整程度相較上一次合作按鍵結果的合理性來打分,例如上次按鍵過快導致失分且本次按鍵也過快,則失 2 分,上次按鍵過慢失分且本次按鍵亦過慢也失 2 分,分數的高低代表參與合作的程度。其中“按鍵調整過快”“偏快”等程度由 2.2 節合作按鍵建模中定義。

本文分別使用了訓練數據和測試數據對模型的合理性進行驗證,訓練數據為前期訓練模型時使用到的 10 位被試數據,測試數據為驗證實驗采集到的 14 位被試數據。將訓練數據中的觀察序列通過 HMM,得到基于合作模型的合作結果預測序列,按合作成功得 1 分、失敗減 1 分的算法,統計單個被試者的合作模型預測得分。然后,將訓練數據的合作結果預測序列和觀察序列通過合作評分表進行打分,得到單個被試者的合作參與程度,比較被試者合作參與度與合作模型預測得分之間的關系。測試數據包括了被試者按鍵時間即合作模型觀測狀態,以及通過模型預測得到的合作結果預測序列。將觀測狀態序列與合作結果預測序列通過合作評分表進行打分,得到每位被試者的合作參與度。然后,統計被試者參與人?機合作的總得分,該得分為合作模型預測得分。比較被試合作參與度與合作模型預測得分之間的相關關系,其中訓練數據和測試數據的合作參與度與合作模型預測得分散點圖如圖 7 所示。使用 SPSS 軟件對訓練、測試數據合作參與度與合作模型預測得分進行 Pearson 相關性檢驗,P < 0.05 表示具有相關關系。檢驗結果表明,訓練數據之間的相關性系數為 0.883 1,P = 0.002 0;測試數據相關系數為 0.578 6,P = 0.030 0。

與合作按鍵一致,為了量化單個被試參與競爭的程度,我們設計如表 2 所示的競爭任務評分表,從被試本次競爭按鍵調整程度相較上一次競爭按鍵結果的合理性來打分,例如上次競爭獲勝且優勢明顯而本次競爭按鍵調整過快,則得 2 分;上次競爭失敗且劣勢明顯而本次競爭按鍵調整仍過慢,則失 2 分,分數的高低代表參與競爭的程度。其中“獲勝且優勢明顯”等程度由 2.3 節競爭按鍵建模中定義。分別比較訓練數據和測試數據的競爭參與度與競爭模型預測得分之間的相關關系,訓練數據和測試數據的競爭參與度與競爭模型預測得分散點圖如圖 8 所示。使用 SPSS 軟件對訓練、測試數據競爭參與度與競爭模型預測得分進行 Pearson 相關性檢驗,P < 0.05 表示具有相關關系。檢驗結果表明,訓練數據相關系數為 0.813 1,P = 0.002 0;測試數據的相關系數為 0.617 8,P = 0.019 0。


4.2 模型行為學驗證
比較驗證實驗采集到的 14 位被試按鍵行為數據,驗證他們的行為學特征差異有無統計學意義。利用獨立t檢驗進行人?人交互與人?機交互結果的統計分析,若P值小于 0.05 表明差異有統計學意義。合作按鍵模型行為學驗證分析與競爭按鍵模型行為學驗證分析結果如表 3 和 表 4 所示。統計結果顯示,合作按鍵模型中 14 例被試中 10 例被試的差異無統計學意義,4 例的差異有統計學意義;競爭按鍵模型中 10 例被試的差異無統計學意義,4 例的差異有統計學意義。行為學驗證表明,合作按鍵模型模擬雙人合作按鍵行為學信息的準確率為 71.43%,競爭按鍵模型模擬雙人競爭按鍵行為學信息的準確率為 71.43%。說明合作模型和競爭模型在行為學上具有較強的模擬能力。


4.3 模型生理學評價
基于 MEMD 算法流程提取到的深層血氧信號 signal_e 包括雙側深層含氧血紅蛋白和脫氧血紅蛋白四種信息:l_hbo2_e、l_hb_e、r_hbo2_e、r_hb_e。利用小波相干分析計算以下四組信號間的同步性:l_hbo2_e 與 l_hb_e、r_hbo2_e 與 r_hb_e、l_hbo2_e 與 r_hbo2_e、l_hb_e 與 r_hb_e。然后,計算頻率為 0.03~0.20 Hz 范圍內四種任務的小波相干指數,則每位被試每一種信號組合可得到一個小波相干指數,反映了信號間的同步性,其中不同腦深層血氧信號對在各任務階段的小波相干系數的均值如表 5 所示。

生理學驗證的流程為:首先統計分析人?人合作與人?機合作、人?人競爭與人?機競爭時的小波相干指數,判斷人?人合作與人?機合作在同步性上是否一致,以及人?人競爭與人?機競爭在同步性上是否一致。其次,在同步性一致的基礎上,比較人?人合作與人?人競爭、人?機合作與人?機競爭,觀測結果是否一致。本文驗證被試參與不同任務時的統計學參數:小波相干系數,每組均滿足正態分布,因此可以采用配對t檢驗,P值小于 0.05 表明差異有統計學意義,利用 SPSS 軟件進行分析,分析結果如表 5 所示。
由結果可以看出:① 在 0.03~0.20 Hz 頻段,對于四對信號人?人合作與人?機合作間的差異均無統計學意義,說明它們具有一致;同樣地,對于四對信號人?人競爭與人?機競爭間的差異也均無統計學意義,說明它們也具有一致性。② 在 0.03~0.20 Hz 頻段,對于 r_hbo2_e 和 r_hb_e 平均小波相干指數,人?人合作與人?人競爭間的差異有統計學意義且人?人合作高于人?人競爭,人?機合作與人?機競爭間的差異有統計學意義且人?機合作高于人?機競爭,其余三對間的差異均無統計學意義,進一步表明了人?人合作與人?機合作具有一致性,以及人?人競爭與人?機競爭具有一致性。
5 討論與結論
本文利用 HMM 分別對被試合作與競爭按鍵行為進行了建模,利用被試的前后兩次按鍵的調整程度預測出合作與競爭按鍵的結果。合作與競爭按鍵行為的實驗設計與數據采集方案依據請見參考文獻[4]。首先,在合作評分表條件下,合作按鍵模型對于訓練數據集的相關系數為 0.883 1,對于測試數據集的相關系數為 0.578 6;在競爭評分表條件下,競爭按鍵模型對于訓練數據集的相關系數為 0.813 1,對于測試數據集的相關系數為 0.617 8,且對于合作模型和競爭模型中訓練數據和測試數據的相關性檢驗結果P值均小于 0.05,說明合作/競爭參與度的得分與對應模型預測得分之間存在正相關關系,驗證了合作與競爭模型的設計是合理的。其次,對于訓練數據和測試數據的相關系數,訓練數據集的結果要明顯大于測試數據集,這是因為模型是基于訓練數據集建立的,與測試數據集互相獨立,個體差異會使得結果相關性變低;但合作與競爭模型對于測試數據集相關系數的值仍均大于 0.5,表明合作模型與競爭模型均具有很好的穩定性和推廣性,若增大訓練數據集也許會使得模型的適用性更廣。就測試數據集相關性而言,競爭模型相關性明顯優于合作模型,可能由如下原因造成:① 我們建立的合作按鍵模型與競爭按鍵模型都是一種基于平均的模型,無法考慮被試的個體差異,而本文開展的社會交互行為中合作的影響因素要比競爭復雜,很難通過平均模型描述合作狀態,但對于影響因素較少的競爭行為,模型能在一定程度上反映競爭狀態。② 合作狀態下被試差異大,但實驗數據量太少影響了模型的準確性。這一點從合作模型對于訓練數據具有較高的相關性,而測試數據相關性較低這一結果中得到支持。③ 合作與競爭評分表只是從被試反應的合理性方面對模型的初步打分,設計不夠精細、準確,影響了對模型合理性的判斷。
其次,通過行為學實驗對提出的模型進行了驗證,合作按鍵模型和競爭按鍵模型中均有 71.43% 的被試在人?人實驗與人?機實驗的行為學結果上無明顯差異。這說明按鍵模型對于被試者實驗時合作或競爭對象按鍵過程的模擬與真實人?人按鍵時相同,即合作與競爭按鍵模型在行為學上一定程度地模擬了人?人之間的合作與競爭按鍵行為。但是,70% 左右的準確率仍不夠理想,原因可能為:① 用于產生合作按鍵模型和競爭按鍵模型的訓練數據只是在校大學生的按鍵數據,數據種類單一;同時模型參數由先驗數據得到,不能根據特定被試者適當調整參數。② 被試在參與人?人實驗和人?機實驗過程中同組被試類型不同,因此使被試產生不同的按鍵行為。
最后,生理學驗證表明當被試在進行任務實驗時,大腦額葉深層幾組不同血氧信號的相干值在人?人合作與人?機合作間的差異無統計學意義,在人?人競爭與人?機競爭間的差異也無統計學意義。這種一致性現象說明了合作按鍵模型反映的大腦前額葉各深層信號之間的同步性關系與雙人合作按鍵實驗相比具有一致性,即合作按鍵模型很好地模擬了雙人合作按鍵實驗時腦深層信息的變化;競爭按鍵模型反映的大腦深層信號之間的同步性關系與雙人競爭按鍵實驗相比也具有一致性,即競爭按鍵模型能夠模擬雙人競爭按鍵實驗時前額葉深層腦信息的變化,從而從生理學信息的角度驗證了合作按鍵模型和競爭按鍵模型的可行性。
此外,研究發現,受試者在進行合作任務時,深層血氧信號間的相干值都高于進行競爭任務時的相干值,尤其在右側深層脫氧血紅蛋白和右側深層含氧血紅蛋白這兩組信號的相干值上,人?人合作與人?人競爭、人?機合作與人?機競爭之間均存在顯著差異,這或許是因為合作任務中存在被試者心率的同步性。Konvalinka 等[16]研究發現,在西班牙渡火儀式中,積極參與者和觀眾間會發生心率同步。Muller 等[17]研究發現,在合唱過程中,指揮與歌手間會發生心率同步。在血氧信號中包括了心臟的搏動信息,這或許是導致合作時相干系數要大于競爭時相干系數的主要原因。
綜上所述,為了解決臨床試驗中單個被試無法參與合作與競爭實驗的問題,本文提出了基于 HMM 的合作與競爭按鍵模型,并通過評分表、行為學數據、生理學信息三種檢驗方法分別對合作按鍵模型和競爭按鍵模型進行了檢驗,結果表明可以利用提出的合作按鍵模型與競爭按鍵模型開展臨床試驗研究。
雖然本文通過以上三種方法評價了模型的可行性,但還存在一些不足。首先,評分表只是初步考慮了被試行為反應的合理性,缺乏理論支撐,需要進一步優化評分表的設計;其次,模型在行為學上的準確率偏低,需要進一步提高準確率;最后,可以結合行為學信息與生理學信息對模型進行更為準確的評價。以上問題將在下一步研究中逐步解決。
引言
社會交互指在社會生活中,人與人之間產生的相互作用和相互影響。人類社會存在復雜的社會交互模式,良好的社會交往行為有利于建立良好的人際關系,促進健康和長壽;而抑郁癥和自閉癥等社會認知障礙類疾病患者表現為社會交往行為障礙,并會影響身體健康。近年來,神經影像學的發展為無創測量大腦活動提供了可行的手段,利用功能成像對自閉癥[1]、X 染色體易裂癥[2]和威廉斯氏綜合征[3]等的研究,使我們對社會認知障礙患者的大腦結構和功能的差異有了更深的了解。社會交互活動中合作與競爭是兩種最基本行為,Cui 等[4]建立了一種由兩人參與的合作、競爭實驗范式。以此實驗范式為基礎,我們[5]利用基于近紅外光譜的超掃描技術研究了人類社會交互活動過程中的腦功能變化。現有研究需要由兩人共同參與來完成,我們的長遠研究目標是把社會交互活動監測用于對精神疾病(特別是抑郁癥)患者的臨床客觀評價,而在臨床應用中不可能由專門人員與患者一起完成,需要建立一種模仿人與患者共同參與的人?機測試模式。
本文旨在通過研究人?人合作或競爭的實驗范式得到人?機測試模型。其中,人?人交互過程的狀態是明確可觀測的,而在人?機交互中被試者合作、競爭的對象的表現模式是隱藏的,需要通過可觀測的人?人交互狀態來推測。隱馬爾可夫模型(hidden Markov model,HMM)是一種統計概率模型,用來描述一個含有隱含未知參數的馬爾可夫過程[6–12],因此可以解決上述問題。本論文利用 HMM 技術,以合作與競爭為基礎研究社會交互行為,對被試按鍵行為進行建模,實現人?機環境下的社會交互行為評價。
1 按鍵模型建立的訓練數據采集實驗
為建立有效的模擬人類交互行為的 HMM,首先需要采集訓練數據,實驗內容主要包括合作任務與競爭任務。為模擬兩人間的合作和競爭,本文采用雙人手動按鍵實驗范式[5]。被試須根據屏幕中給出的按鍵提示做出按鍵動作,合作任務通過兩個人相互配合、盡可能地同時按鍵來模擬,被試根據本次按鍵的屏幕反饋,調整下次按鍵的快慢;競爭任務則通過兩個人爭取比對方更快按鍵來模擬。
1.1 合作任務
合作任務流程如圖 1 所示,在每次按鍵開始時,出現一個空心的灰色圓圈,提示準備按鍵,在隨機的延遲之后,灰色圓圈被填實為綠色,此信號作為可以開始按鍵信號,記為“go”,被試只能在“go”信號之后按鍵。相對電腦屏幕左邊的被試按“J”鍵,右邊的被試按“K”鍵。當兩個被試都按鍵之后,屏幕會顯示相應的反饋信息并停留 4 s,2 s 間隔之后又開始下一次合作按鍵。“go”信號與被試按鍵之間的時間間隔為反應時間,如果兩位被試反應時間之差小于某個閾值 T,則本次合作按鍵成功,合作成功加 1 分,并在反饋信息界面顯示“WIN”字樣以及累積得分;否則為合作按鍵失敗,合作失敗減 1 分,并在反饋信息界面顯示“LOSE”字樣以及累積得分。無論合作成功與否,都會在被試對應側屏幕顯示“+”或“?”(“+”表示本次按鍵實驗中對應側被試比另一位被試按鍵快,“?”表示比另一位被試按鍵慢)。被試被要求根據反饋信息調整下次按鍵快慢,盡可能地獲取高分。閾值 T 通過如下公式獲得:

![]() |
其中、
分別為兩個被試的本次按鍵時間。
1.2 競爭任務
競爭任務中被試被要求比同組另一名被試盡可能快地按鍵。競爭任務流程與合作按鍵相似,但屏幕顯示有差異,在兩名被試都按鍵后,會在被試對應側屏幕分別顯示“WIN”“LOSE”,其他顯示以及符號的含義與合作任務相同。競爭任務的記分策略為:先按鍵者得 1 分,后按鍵者扣 1 分;在“go”信號之前按鍵扣 1 分。被試通過屏幕反饋信息調整下一次的按鍵時間。
本文的實驗任務由兩部分組成,分別為測試部分和正式實驗部分。測試部分由 5 次合作按鍵組成,目的在于使被試準確了解實驗要求以及熟悉實驗環境。正式實驗部分由休息、合作按鍵、休息、競爭按鍵、休息五個模塊組成。休息為 300 s 閉眼休息,合作按鍵和競爭按鍵都為 40 次按鍵,每次按鍵時間 7~8 s,整個實驗部分持續大約 30 min。
根據上述實驗任務,選取被試參與實驗。被試選取的標準為無社會認知行為障礙以及視力或矯正視力正常的大學生,實驗暫不考慮被試性別差異但保持每組被試性別相同。實驗方案通過西安交通大學生命科學與技術學院倫理委員會批準,并征得被試同意。實驗時每組的兩名被試使用同一臺電腦的不同顯示器及鍵盤完成實驗任務,被試者之間用擋板隔開避免相互影響。實驗一共采集了 20 名共 10 組被試的按鍵行為數據,年齡 22~25(22.9 ± 1.3)歲,其中男性 12 人,女性 8 人。此 10 組數據為訓練數據,主要用來建立人?機交互模型。
2 交互行為的隱馬爾可夫模型
上述實驗采集都是采用雙人合作與競爭按鍵實驗范式,但后續研究為了便于臨床應用,需要開發單人的合作與競爭按鍵實驗,即人?機合作與人?機競爭實驗。在人?機交互實驗中僅有一名被試做任務實驗,機器主要記錄人?機交互實驗中人的合作與競爭按鍵表現,并通過建立的模型對按鍵結果進行評價,從而讓被試者可根據評判結果進行按鍵時間的調整。本文采用 HMM 分別對合作與競爭按鍵行為建模,用于開發單人參與的人?機合作與人?機競爭按鍵實驗任務。
2.1 隱馬爾可夫模型
HMM 是一種雙重的隨機過程,其中一個可以觀測,另一個不可以觀測。不可觀測的隨機過程又稱隱藏狀態,是一個馬爾可夫 (Markov) 過程,即是一個有限狀態機,其中每個狀態都帶有轉移概率。可觀測的隨機過程由一系列觀測值組成,又稱可觀測狀態,可觀測狀態與隱藏狀態之間依概率相關。因此,HMM 可以看成一個五元組{S, V, A, B, π}:
![]() |
![]() |
![]() |
![]() |
![]() |
其中 S 為隱藏狀態集,共有 N 個狀態;V 為可觀測狀態集,共有 M 個狀態;A 為狀態轉移矩陣, 表示從狀態
轉移到狀態
的概率(圖 2b);B 為混淆矩陣,
表示在狀態
時,可觀測狀態
的概率(圖 2c);π 為初始概率矩陣,
表示初始時刻狀態 i 的概率。HMM 如下圖 2a 所示。

a. 隱馬爾可夫模型;b.
a. HMM model; b. state transfer matrix
HMM 主要解決以下 3 個方面的問題:
(1)評估問題:對給定模型和觀察序列 V,求產生給定觀察值序列的概率
。它可以衡量給定模型與此觀察值序列之間的匹配情況。
(2)解碼問題:對于給定的模型和觀察值序列,求可能性最大的隱含狀態序列。解碼問題可用維特比(Viterbi)算法實現。
(3)學習問題:根據觀察值序列樣本來找到一個最可能的模型,即求模型參數。學習問題可用前向?后向算法,又稱 Baum-Welch 算法。
2.2 合作按鍵建模
合作按鍵模型中,建模思路為通過被試的按鍵時間判斷合作的結果。因此,被試按鍵時間為可觀測狀態,按鍵結果為隱藏狀態。
本文將隱藏狀態定義為如下四類:按鍵過快失分、按鍵偏快得分、按鍵偏慢得分、按鍵過慢失分,分別用 1、2、3、4 來表示。如圖 3a 所示,其中,
、
為兩個被試第n次按鍵的反應時間。

a.隱藏狀態定義;b.觀察值狀態定義
Figure3. Definition of collaborative modeling statea. definition of hidden state; b. definition of observed value state
按鍵反應時間與合作結果之間有著直接的關系,但單個被試的按鍵時間不能反映合作的結果,合作實驗更關注通過屏幕反饋信息的調整過程,因此同一被試前后兩次按鍵時間的差異更能體現調整狀態。在此基礎上我們將調整程度分為四個狀態,并將它定義為模型的觀測值狀態,用 1’、2’、3’、4’來表示。如圖 3b 所示,,其中
、
分別為同一被試本次和上一次的按鍵時間。
通過以上定義的隱含狀態與觀測狀態,對采集到的被試合作按鍵數據進行統計,同一組中隨機選取一個被試按鍵數據,一共 10 組數據,稱為訓練數據。由于本文中已知隱含狀態序列與觀察狀態序列,因此使用統計的方法計算 HMM 參數,即狀態轉移矩陣 A、混淆矩陣 B 以及初始概率 π。
![]() |
![]() |
![]() |
基于模型參數與 Viterbi 算法,通過模型利用觀測狀態即被試調整時間可以預測被試本次按鍵的結果。
2.3 競爭按鍵建模
同合作按鍵類似,我們同樣可以用 HMM 來對競爭按鍵行為進行建模。同樣地,競爭按鍵結果與調整程度分別作為隱含狀態和觀察狀態。隱藏狀態如圖 4 所示,,其中
、
分別為兩個被試按鍵時間。觀察狀態即按鍵調整程度定義與合作按鍵一致。

通過以上定義的隱含狀態與觀測狀態,對采集到的被試競爭按鍵數據進行統計,同一組中只隨機選取一個被試按鍵數據,一共 10 組數據,稱為訓練數據。通過統計的方法計算 HMM 參數,然后通過 Viterbi 算法預測隱含狀態,得到相應的競爭按鍵結果。
![]() |
![]() |
![]() |
3 按鍵模型驗證的數據采集實驗
為了實現對模型的驗證和評價,本文基于得到的合作按鍵模型與競爭按鍵模型設計驗證實驗。驗證實驗主要實現以下四種按鍵:人?人合作、人?機合作、人?人競爭、人?機競爭。其中人?人實驗通過雙人按鍵實現,人?機合作實驗通過合作按鍵模型實現,人?機競爭實驗通過競爭按鍵模型實現。實驗流程如圖 5 所示,其中,合作任務的兩個階段分別為人?機合作與人?人合作,競爭的兩個階段為人?機競爭與人?人競爭,但人?機與人?人實驗先后順序隨機安排,即每位被試在一次驗證實驗中四種按鍵任務均需要執行。每次實驗邀請兩名被試同時進行,使用同一臺電腦的不同顯示器及鍵盤按鍵完成實驗任務,被試者之間用擋板隔開避免相互影響,兩名被試在實驗過程中被隨機安排進行人?人交互或人?機交互實驗,且被試未被告知實驗對象的類型。整個實驗范式的實現借助 Psychtoolbox 完成。Psychtoolbox 是基于 Matlab 的心理學實驗設計軟件,可完成多種心理學刺激實驗。通過 Psychtoolbox 能夠單獨控制兩個顯示器輸出每一個被試的反饋信息,避免被試猜測實驗內容從而影響實驗的結果。

基于以上實驗內容選取被試參與實驗,被試為無社會認知行為障礙、視力或矯正視力正常的大學生,實驗暫不考慮被試性別差異。采集了 8 組共 16 位被試[年齡(24 ± 1.4)歲;其中男性 10 例,女性 6 例]的按鍵行為數據和前額葉腦血氧數據作為測試數據,與前文提到的訓練數據相互獨立。行為數據通過個人計算機記錄(如圖 6 上圖所示);腦血氧數據通過近紅外光譜設備采集被試雙側前額葉區域,探頭佩戴位置為左右側眉毛上方 1 cm 處(如圖 6 左下所示),接收探頭與光源的距離分別為 1.2、2.0、3.0 cm,依次命名為表層、近端以及遠端(如圖 6 右下所示)。16 名被試中有 2 位被試行為數據缺失,余下的 14 位被試中,1 位被試腦血氧數據記錄缺失。因此,由驗證實驗,共得到 14 位被試的行為學測試數據,參與模型的合理性驗證和行為學驗證分析;得到 13 位被試的腦血氧數據,參與模型的生理學評價分析。

近紅外光通過人體大腦時光程類似“香蕉”形態,不同發射-接收距離下的探測深度不同,距離越大探測深度越深[13]。1.2 cm 處探頭主要接收通過大腦表層的光信號,2.0 cm 處探頭采集到的信號中既有大腦表層信息也有少量大腦深層信息,3.0 cm 處探頭采集到的信號中既有大腦表層信息也有大量大腦深層信息。在本文的合作與競爭按鍵實驗中,主要關心被試在實驗期間前額葉深層的血氧變化,因此本文采用了基于多變量經驗模態分解(multivariate empirical mode decomposition,MEMD)的自適應濾波算法實現腦深層信息的提取。
MEMD 將 N 元時間序列看作 N 維向量序列,在 N 維空間中沿不同方向投影向量序列,計算各個投影向量的包絡[14]。求這些包絡的均值即為多元時間序列的均值向量,進而實現多元信號同尺度分解。因此,MEMD 實現了不同類別的信號分解時具有同一尺度,且克服了經驗模態分解的模態混疊現象。
基于 MEMD 的自適應濾波算法流程為:
(1)將表層血氧信號 signal_s、近端血氧信號 signal_n 以及遠端血氧信號 signal_f 經過 MEMD 算法分解,得到各自對應的本征函數(intrinsic mode function,IMF)和余量。
(2)選取 signal_s 和 signal_f 同一分解層的 IMF 信號進行自適應濾波。被選取用于自適應濾波的分解層應該滿足該層的 signal_s 和 signal_f 對應的 IMF 信號相關性大于某個閾值 T0 且在目標頻帶內。本文中自適應濾波器算法為 NLMS 算法,T0 取 0.5,目標頻帶為 0.03~0.20 Hz。
(3)將各層 IMF 自適應濾波后得到的信號疊加,即得深層腦血氧信號記為 signal_e,是后文生理學評價的基礎。小波相干分析法是一種同時考慮幅度和相位信息,從時頻域的角度研究兩個信號同步性的線性方法,由于其在時頻面的伸縮性,小波相干分析法已成為一種研究神經系統內部相干性的重要方法。根據 Torrence 等[15]關于小波相干性的定義,可由小波相干分析發現信號間的局部相關性。本文使用小波相干分析方法計算近紅外信號之間的同步性。
4 按鍵模型評價
模型的驗證和評價主要包括模型的合理性驗證、行為學驗證及生理學評價。其中合理性驗證同時利用了訓練數據與測試數據的按鍵行為學數據,主要分析模型預測與實際對按鍵速度調整狀態之間的相關性;行為學驗證使用了測試數據中被試的按鍵反應時間數據;而生理學評價則主要分析測試數據中被試在人?人與人?機實驗過程中深層腦血氧信號間的同步性。
4.1 基于評分表的模型合理性驗證
為了量化單個被試參與合作的程度,我們設計了合作任務評分表,如表 1 所示。合作評分表主要從被試本次合作按鍵調整程度相較上一次合作按鍵結果的合理性來打分,例如上次按鍵過快導致失分且本次按鍵也過快,則失 2 分,上次按鍵過慢失分且本次按鍵亦過慢也失 2 分,分數的高低代表參與合作的程度。其中“按鍵調整過快”“偏快”等程度由 2.2 節合作按鍵建模中定義。

本文分別使用了訓練數據和測試數據對模型的合理性進行驗證,訓練數據為前期訓練模型時使用到的 10 位被試數據,測試數據為驗證實驗采集到的 14 位被試數據。將訓練數據中的觀察序列通過 HMM,得到基于合作模型的合作結果預測序列,按合作成功得 1 分、失敗減 1 分的算法,統計單個被試者的合作模型預測得分。然后,將訓練數據的合作結果預測序列和觀察序列通過合作評分表進行打分,得到單個被試者的合作參與程度,比較被試者合作參與度與合作模型預測得分之間的關系。測試數據包括了被試者按鍵時間即合作模型觀測狀態,以及通過模型預測得到的合作結果預測序列。將觀測狀態序列與合作結果預測序列通過合作評分表進行打分,得到每位被試者的合作參與度。然后,統計被試者參與人?機合作的總得分,該得分為合作模型預測得分。比較被試合作參與度與合作模型預測得分之間的相關關系,其中訓練數據和測試數據的合作參與度與合作模型預測得分散點圖如圖 7 所示。使用 SPSS 軟件對訓練、測試數據合作參與度與合作模型預測得分進行 Pearson 相關性檢驗,P < 0.05 表示具有相關關系。檢驗結果表明,訓練數據之間的相關性系數為 0.883 1,P = 0.002 0;測試數據相關系數為 0.578 6,P = 0.030 0。

與合作按鍵一致,為了量化單個被試參與競爭的程度,我們設計如表 2 所示的競爭任務評分表,從被試本次競爭按鍵調整程度相較上一次競爭按鍵結果的合理性來打分,例如上次競爭獲勝且優勢明顯而本次競爭按鍵調整過快,則得 2 分;上次競爭失敗且劣勢明顯而本次競爭按鍵調整仍過慢,則失 2 分,分數的高低代表參與競爭的程度。其中“獲勝且優勢明顯”等程度由 2.3 節競爭按鍵建模中定義。分別比較訓練數據和測試數據的競爭參與度與競爭模型預測得分之間的相關關系,訓練數據和測試數據的競爭參與度與競爭模型預測得分散點圖如圖 8 所示。使用 SPSS 軟件對訓練、測試數據競爭參與度與競爭模型預測得分進行 Pearson 相關性檢驗,P < 0.05 表示具有相關關系。檢驗結果表明,訓練數據相關系數為 0.813 1,P = 0.002 0;測試數據的相關系數為 0.617 8,P = 0.019 0。


4.2 模型行為學驗證
比較驗證實驗采集到的 14 位被試按鍵行為數據,驗證他們的行為學特征差異有無統計學意義。利用獨立t檢驗進行人?人交互與人?機交互結果的統計分析,若P值小于 0.05 表明差異有統計學意義。合作按鍵模型行為學驗證分析與競爭按鍵模型行為學驗證分析結果如表 3 和 表 4 所示。統計結果顯示,合作按鍵模型中 14 例被試中 10 例被試的差異無統計學意義,4 例的差異有統計學意義;競爭按鍵模型中 10 例被試的差異無統計學意義,4 例的差異有統計學意義。行為學驗證表明,合作按鍵模型模擬雙人合作按鍵行為學信息的準確率為 71.43%,競爭按鍵模型模擬雙人競爭按鍵行為學信息的準確率為 71.43%。說明合作模型和競爭模型在行為學上具有較強的模擬能力。


4.3 模型生理學評價
基于 MEMD 算法流程提取到的深層血氧信號 signal_e 包括雙側深層含氧血紅蛋白和脫氧血紅蛋白四種信息:l_hbo2_e、l_hb_e、r_hbo2_e、r_hb_e。利用小波相干分析計算以下四組信號間的同步性:l_hbo2_e 與 l_hb_e、r_hbo2_e 與 r_hb_e、l_hbo2_e 與 r_hbo2_e、l_hb_e 與 r_hb_e。然后,計算頻率為 0.03~0.20 Hz 范圍內四種任務的小波相干指數,則每位被試每一種信號組合可得到一個小波相干指數,反映了信號間的同步性,其中不同腦深層血氧信號對在各任務階段的小波相干系數的均值如表 5 所示。

生理學驗證的流程為:首先統計分析人?人合作與人?機合作、人?人競爭與人?機競爭時的小波相干指數,判斷人?人合作與人?機合作在同步性上是否一致,以及人?人競爭與人?機競爭在同步性上是否一致。其次,在同步性一致的基礎上,比較人?人合作與人?人競爭、人?機合作與人?機競爭,觀測結果是否一致。本文驗證被試參與不同任務時的統計學參數:小波相干系數,每組均滿足正態分布,因此可以采用配對t檢驗,P值小于 0.05 表明差異有統計學意義,利用 SPSS 軟件進行分析,分析結果如表 5 所示。
由結果可以看出:① 在 0.03~0.20 Hz 頻段,對于四對信號人?人合作與人?機合作間的差異均無統計學意義,說明它們具有一致;同樣地,對于四對信號人?人競爭與人?機競爭間的差異也均無統計學意義,說明它們也具有一致性。② 在 0.03~0.20 Hz 頻段,對于 r_hbo2_e 和 r_hb_e 平均小波相干指數,人?人合作與人?人競爭間的差異有統計學意義且人?人合作高于人?人競爭,人?機合作與人?機競爭間的差異有統計學意義且人?機合作高于人?機競爭,其余三對間的差異均無統計學意義,進一步表明了人?人合作與人?機合作具有一致性,以及人?人競爭與人?機競爭具有一致性。
5 討論與結論
本文利用 HMM 分別對被試合作與競爭按鍵行為進行了建模,利用被試的前后兩次按鍵的調整程度預測出合作與競爭按鍵的結果。合作與競爭按鍵行為的實驗設計與數據采集方案依據請見參考文獻[4]。首先,在合作評分表條件下,合作按鍵模型對于訓練數據集的相關系數為 0.883 1,對于測試數據集的相關系數為 0.578 6;在競爭評分表條件下,競爭按鍵模型對于訓練數據集的相關系數為 0.813 1,對于測試數據集的相關系數為 0.617 8,且對于合作模型和競爭模型中訓練數據和測試數據的相關性檢驗結果P值均小于 0.05,說明合作/競爭參與度的得分與對應模型預測得分之間存在正相關關系,驗證了合作與競爭模型的設計是合理的。其次,對于訓練數據和測試數據的相關系數,訓練數據集的結果要明顯大于測試數據集,這是因為模型是基于訓練數據集建立的,與測試數據集互相獨立,個體差異會使得結果相關性變低;但合作與競爭模型對于測試數據集相關系數的值仍均大于 0.5,表明合作模型與競爭模型均具有很好的穩定性和推廣性,若增大訓練數據集也許會使得模型的適用性更廣。就測試數據集相關性而言,競爭模型相關性明顯優于合作模型,可能由如下原因造成:① 我們建立的合作按鍵模型與競爭按鍵模型都是一種基于平均的模型,無法考慮被試的個體差異,而本文開展的社會交互行為中合作的影響因素要比競爭復雜,很難通過平均模型描述合作狀態,但對于影響因素較少的競爭行為,模型能在一定程度上反映競爭狀態。② 合作狀態下被試差異大,但實驗數據量太少影響了模型的準確性。這一點從合作模型對于訓練數據具有較高的相關性,而測試數據相關性較低這一結果中得到支持。③ 合作與競爭評分表只是從被試反應的合理性方面對模型的初步打分,設計不夠精細、準確,影響了對模型合理性的判斷。
其次,通過行為學實驗對提出的模型進行了驗證,合作按鍵模型和競爭按鍵模型中均有 71.43% 的被試在人?人實驗與人?機實驗的行為學結果上無明顯差異。這說明按鍵模型對于被試者實驗時合作或競爭對象按鍵過程的模擬與真實人?人按鍵時相同,即合作與競爭按鍵模型在行為學上一定程度地模擬了人?人之間的合作與競爭按鍵行為。但是,70% 左右的準確率仍不夠理想,原因可能為:① 用于產生合作按鍵模型和競爭按鍵模型的訓練數據只是在校大學生的按鍵數據,數據種類單一;同時模型參數由先驗數據得到,不能根據特定被試者適當調整參數。② 被試在參與人?人實驗和人?機實驗過程中同組被試類型不同,因此使被試產生不同的按鍵行為。
最后,生理學驗證表明當被試在進行任務實驗時,大腦額葉深層幾組不同血氧信號的相干值在人?人合作與人?機合作間的差異無統計學意義,在人?人競爭與人?機競爭間的差異也無統計學意義。這種一致性現象說明了合作按鍵模型反映的大腦前額葉各深層信號之間的同步性關系與雙人合作按鍵實驗相比具有一致性,即合作按鍵模型很好地模擬了雙人合作按鍵實驗時腦深層信息的變化;競爭按鍵模型反映的大腦深層信號之間的同步性關系與雙人競爭按鍵實驗相比也具有一致性,即競爭按鍵模型能夠模擬雙人競爭按鍵實驗時前額葉深層腦信息的變化,從而從生理學信息的角度驗證了合作按鍵模型和競爭按鍵模型的可行性。
此外,研究發現,受試者在進行合作任務時,深層血氧信號間的相干值都高于進行競爭任務時的相干值,尤其在右側深層脫氧血紅蛋白和右側深層含氧血紅蛋白這兩組信號的相干值上,人?人合作與人?人競爭、人?機合作與人?機競爭之間均存在顯著差異,這或許是因為合作任務中存在被試者心率的同步性。Konvalinka 等[16]研究發現,在西班牙渡火儀式中,積極參與者和觀眾間會發生心率同步。Muller 等[17]研究發現,在合唱過程中,指揮與歌手間會發生心率同步。在血氧信號中包括了心臟的搏動信息,這或許是導致合作時相干系數要大于競爭時相干系數的主要原因。
綜上所述,為了解決臨床試驗中單個被試無法參與合作與競爭實驗的問題,本文提出了基于 HMM 的合作與競爭按鍵模型,并通過評分表、行為學數據、生理學信息三種檢驗方法分別對合作按鍵模型和競爭按鍵模型進行了檢驗,結果表明可以利用提出的合作按鍵模型與競爭按鍵模型開展臨床試驗研究。
雖然本文通過以上三種方法評價了模型的可行性,但還存在一些不足。首先,評分表只是初步考慮了被試行為反應的合理性,缺乏理論支撐,需要進一步優化評分表的設計;其次,模型在行為學上的準確率偏低,需要進一步提高準確率;最后,可以結合行為學信息與生理學信息對模型進行更為準確的評價。以上問題將在下一步研究中逐步解決。