現有情感壓力評估方法主要針對有無壓力進行評估,或者雖然實現了簡單壓力分級,但未考慮前一狀態對當前壓力狀態的影響,因此評估效果不理想。針對這一問題,本文提出了一種基于隱馬爾科夫模型(HMM)的情感壓力分級模型。進一步地,在情感計算理論支持下,建立了情感壓力分級算法。該算法考慮了前一個壓力狀態對當前壓力的影響以及環境因素的影響,并建立了匹配過程,使用間隔放大并設定閾值的方法,根據數據的范圍按比例線性調節,經匹配后,對特征參數進行歸一化,作為模型的輸入得出情感壓力分級的結果。實驗結果表明,該方法考慮了外界環境因素與前一壓力狀態對當前壓力狀態的影響,能有效地對情感壓力進行分級,并提高情感壓力分級的準確率。
引用本文: 李昕, 齊曉英, 陳澤濤, 侯永捷, 楊亞丹, 梁瓊予. 基于改進的隱馬爾科夫模型的情感壓力分級方法. 生物醫學工程學雜志, 2016, 33(3): 553-558. doi: 10.7507/1001-5515.20160092 復制
引言
當今社會,人們面臨著眾多壓力。從生理學的角度,壓力的產生是由于外界因素刺激導致神經過激,從而促進腺體分泌激素影響相關生理參數,導致發生相應的體征變化。從心理學的角度,壓力來源于人對危機的不確定感,壓力通過外部作用于內部而產生心理認知[1]。
耶基斯-多德森曲線(Yerkes-Dodson Curve)是基于耶基斯-多德森定律(Yerkes-Dodson Law)[2]的一種鐘形曲線,該曲線表明壓力水平與工作績效的關系,說明在較低或較高的壓力狀態下都不利于工作效率的提高。當心理壓力過高時,容易誘發抑郁癥等精神類疾病,嚴重影響人們的正常生活。因此,有效的壓力評估,特別是壓力分級評估,將為壓力干預提供幫助。
傳統的壓力評估主要是針對有無壓力進行分析[3]。Costin等[4]運用求取心率變異性(heart rate variability,HRV)和形態變異(morphologic variability,MV)的方法,針對心電信號(electrocardiogram,ECG)的HRV與MV特征進行精神壓力識別,其方法是在獲得了ECG信號之后,首先求取ECG信號的HRV與MV特征量,然后根據HRV與MV特征量并結合問卷調查與對受試的觀察進行精神壓力識別。Melollo等[5]針對在大學考試的過程中和休息時的HRV變化,運用非參數分類技術和分類回歸樹來識別壓力狀況。Subahni等[6]則將視頻游戲作為壓力源,同樣通過比較ECG信號的HRV特征來識別壓力狀態。在上述三者的研究中只針對有、無壓力,而并未對壓力的強弱進行精確地分級。
在Karthikeyan等[7]的研究中,將心算任務作為壓力源,運用非連續小波變換(discrete wavelet transform,DWT)的方法分離出ECG信號的高頻段(High Frequency,HF)和低頻段(Low Frequency,LF)等特征,運用K-最近鄰分類器將壓力水平分為4個等級,其分類準確率為65.5%。在Healey等[8]的實驗中,采用了四種生理信號作為數據源,即ECG信號、肌電信號、呼吸信號和皮膚電導率信號,對各生理參數提取了若干的統計特征,并結合調查問卷來對駕駛員的壓力進行分級,所使用的分級方法為線性判別分析,雖然其準確率達到了97%,但系統數據采集復雜,不利于個體壓力的實時監測。 本文旨在探討情感壓力的量化評估,針對目前情感壓力分級研究的不足,以日常生活中常見的場景作為壓力源,如意外電話、考試通知等,以ECG信號為對象,以情感計算理論[9]為基礎,利用隱馬爾科夫模型(hidden Markov model,HMM)與問卷相結合的方法實現對情感壓力的分級評價。
1 生理參數提取與特征融合
實驗前,受試者被告知需要在進行數據采集的同時進行正常的工作與學習,每當感覺到壓力時,需及時記錄下當時的時間,之后再花3分鐘左右填寫國際標準壓力問卷(PSTRI)。實驗時,受試者佩戴便攜式心電監測儀,并會受到不少于5次的不定時的不同的壓力源刺激。實驗后,由實驗員依據問卷結果將實驗數據標記上從1到5的壓力等級,根據受試者標記的壓力點與問卷顯示的壓力等級截取壓力數據段,從每位受試者的數據中選出5段數據,每段數據時長30 s。實驗共邀請了39位受試者參與。
ECG信號能充分反映壓力情感狀態。而HRV是指心臟搏動周期存在的微小變異現象,可作為反映心臟交感神經和迷走神經活動緊張性和均衡性的一種非侵入性指標,也是心電分析的重要指標[10-11]。
基于ECG信號特點,選擇特征參數:
(1) HRV時域特征:差值均方的平方r-MSSD,是HRV的重要時域特征之一。反應了HRV中的快變化成分。其計算公式如式(1) 所示。
$r-MSSD=\sqrt{\frac{1}{N-1}\sum\limits_{i=1}^{N-1}{\left( R{{R}_{i+1}}-R{{R}_{i}} \right)}}$ |
其中RR為R波間隔,N為序列長度。
(2) HRV頻域特征:頻域特征中的高頻段HF(0.15~0.4 Hz),該特征生理意義明確,反映了迷走神經的活動,能夠從側面反映呼吸節律的變化,為自主神經系統調節功能的定量分析提供了工具,因而是重要的心理壓力評估參數。
(3) 近似熵:近似熵應用于HRV信號分析時,能反映心率的調節機制。本文應用近似熵[12]的快速算法來計算信號的近似熵,其計算如式(2) 所示。
$\text{ApEn}\left( 2,r,N \right)=\underset{N\to \infty }{\mathop{\lim }}\,\left[ \frac{1}{N-m+1}\sum\limits_{i=1}^{N-m}{\ln \frac{C_{i}^{m+1}\left( r \right)}{C_{i}^{m}\left( r \right)}} \right]$ |
其中,r為相似容限,m為模式維數,N為序列長度。
(4) 復雜度:HRV序列的復雜性可以反映RR間期序列的隨機程度,即可以體現心臟受自主神經系統調節的有序程度。L-Z復雜度使用最為廣泛,當其越接近1,則說明時間序列越復雜,反之則越規則[13-14]。其計算方法如式(3) 所示。
$LZC\left( n \right)=c\left( n \right)*\left( {{\log }_{2}}n \right)/n$ |
其中n為序列長度,c(n)為子串個數。
(5) 脈搏率:隨著心理壓力的增加,心跳速度也會相應地加快,即脈搏率增加。
與單一特征信號相比,多特征融合增加了信號的可信度,減少了信息的模糊性,提高了信息的空間分辨率;且單一特征具有片面性缺點。多特征融合具有擴展空間和時間覆蓋范圍的特點,能增加系統的監視能力和檢測效率。由于每組特征的可信度難以完全一致,為了最優化融合結果,可根據各組特征所得到的測量值自適應地尋找其對應的權數以達到最優的融合結果,即自適應加權融合算法[15],其結構如圖 1所示。

由圖 1結構可知數據融合的結果為:
$\hat{X}=\sum\limits_{i=1}^{N}{{{W}_{i}}{{X}_{i}}}$ |
式中,Wi為第i個特征的加權因子。且滿足式(5) 和式(6) 。
$\sum\limits_{i=1}^{n}{{{W}_{i}}}=1$ |
${{\sigma }^{2}}=\sum\limits_{i=1}^{n}{W_{i}^{2}}\sigma _{i}^{2}$ |
依據總的均方誤差最小的準則,即應求出式(6) 在式(5) 條件下的極值,而由多元函數極值理論得到式(7) 。當加權因子符合式(7) 時,σ2有最小值,如式(8) 所示。
${{W}_{i}}=\frac{1}{\sigma _{i}^{2}\sum\limits_{i=1}^{n}{\frac{1}{\sigma _{i}^{2}}}}$ |
${{\sigma }_{\min }}=\frac{1}{\sum\limits_{i=1}^{n}{\frac{1}{\sigma _{i}^{2}}}}$ |
可見,各特征的權系數僅由其測量方差決定。只要使各特征的權系數符合式(7) 就可使總均方誤差極小,且此時如式(9) 所示。
$\hat{X}=\frac{\sum\limits_{i=1}^{n}{\frac{{{X}_{i}}}{\sigma _{i}^{2}}}}{\sum\limits_{i=1}^{n}{\frac{1}{\sigma _{i}^{2}}}}$ |
利用以上方法自適應地求取最優的權重,求出ECG信號的HRV時域特征、頻域特征、心電近似熵、復雜度和脈搏率這五個生理特征融合后的參數向量。將融合后的特征參數經歸一化處理后作為壓力分級模型的輸入來計算壓力等級。如圖 2所示顯示了依據此方法融合前后數據特征參數的變化情況,將5種ECG特征融合為一維向量形式,縱軸表示特征值,橫軸表示數據序數。

2 壓力分級模型
HMM是20世紀60年代末、70年代初提出來的一種基于馬爾科夫(Markov)鏈概率函數的統計模型,是一種用參數表示,用于描述隨機過程統計特性的概率模型[16]。HMM包括兩個隨機過程:一個隨機過程描述觀察值和狀態之間的統計對應關系;另一個是Markov鏈,它描述狀態的轉移,由初始狀態分布概率和轉移概率矩陣描述,輸出為狀態序列。HMM的當前狀態與前一狀態有關,這符合前面分析的情感壓力狀態的特征。其主要的計算過程可表達為如式(10) 所示。
$P=\prod AB$ |
其中∏為初始狀態概率,A為狀態轉移矩陣,B為混淆矩陣,P為各等級壓力出現的概率。
在HMM中,初始狀態概率矢量∏,代表在初始時刻,各個情感狀態出現的概率,假設初始狀態隨機出現,即對初始概率賦隨機值[17]。狀態轉移概率矩陣A表示狀態之間互轉的概率,其概率值的決定因素是多種多樣的,包括壓力情感本身的不確定因素以及環境因素等外部影響。通過對模型參數[用μ=(A,B,∏)來表示模型參數]的調整,使得在當前狀態下觀察到指定觀察序列的概率最大,本文使用Baum-Welch(BW)算法[18]作為調整模型參數的學習算法。在不同的生理特征和外界因素刺激下,當輸入狀態序列不同時所得到的輸出情感觀察值序列也不同。
經過特征融合后,得到的序列為特征值序列,即觀察序列O,分別用O1,O2,O3,…,On表示,隱藏序列為情感狀態,即壓力等級,用H表示,是時間的函數,可記為H(t)。因為當前時刻的壓力等級H(t)僅與過去時刻的壓力等級H(t-1) 有關,且隱藏狀態可以通過混淆矩陣由觀察序列間接表示,如式(11) 所示,因此,只需要求得轉移矩陣A和混淆矩陣B,便可得出特征值向量與壓力等級之間的關系。
$\left\{ \frac{H\left( j \right)=A\left( i,j \right) H\left( i \right)}{H\left( j \right)=B\left( i,j \right)*O\left( i \right)} \right.$ |
在上式中,A(i,j)表示從隱藏狀態H(i)到隱藏狀態H(j)的概率; B(i,j)表示由觀察狀態O(i)得到隱藏狀態H(j)的概率;一般情況下,j>1,而此處為j=i+1。
HMM 的求解問題一般分為三類:評估問題、解碼問題和學習問題。本文需要求取一個最合適的HMM,即HMM的參數(轉移概率矩陣A、混淆矩陣B和初始矩陣∏),為HMM的學習問題,可通過BW算法來實現[18]。
BW算法主要包括兩個過程:預估和評測。該算法是以一種梯度下降的形式尋找一種錯誤測度的最小值,在給定初始HMM(初始矩陣∏和觀察序列O)的情況下,按照以下步驟計算HMM系數:
(1) 計算給定觀察序列O及HMM參數,定義t時刻位于隱藏狀態Hi的概率變量γt(i)和定義t時刻位于Ht及和t+1時刻位于Hi的概率變量ξt(i,j),計算公式分別如式(12) 和式(13) 所示。
${{\gamma }_{t}}\left( i \right)=P\left( {{q}_{t}}={{H}_{i}}O,\prod \right)$ |
${{\xi }_{t}}\left( i,j \right)=P\left( {{q}_{t}}={{H}_{i}},{{q}_{t+1}}={{H}_{i}}O,\prod \right)$ |
(2) 根據ξt(i,j)和γt(i)重估模型參數μ;對參數進行重估的計算式如式(14) 、(15) 和(16) 所示。
${{{\hat{\pi }}}_{i}}=P\left( {{q}_{t}}=iO,\mu \right)$ |
${{\hat{a}}_{ij}}=\frac{\sum\limits_{t=1}^{T-1}{{{\xi }_{t}}\left( i,j \right)}}{\sum\limits_{t=1}^{T-1}{{{\gamma }_{t}}\left( i \right)}}$ |
${{\hat{b}}_{ik}}=\frac{\sum\nolimits_{\left\{ t\left| O \right.\left( t \right)=k,1\le t\le T \right\}}{{{\gamma }_{t}}\left( i \right)}}{\sum\limits_{t=1}^{T-1}{{{\gamma }_{t}}\left( i \right)}}$ |
反復迭代上述(1) 、(2) 過程,直到收斂,然后所求的HMM即為最優化的模型,可依據此模型對壓力等級進行預測。
在該模型中,輸入為融合后的生理特征構成的觀察序列,輸出為壓力等級序列。在神經計算理論的基礎上,結合HMM的當前狀態與前一狀態有關,且觀察序列和隱藏狀態序列依概率對應這兩個特點,建立了基于HMM的壓力情感模型。在該模型中壓力作為隱藏狀態,顯性狀態表示的是融合后的生理特征。另外,在模型中添加了壓力識別與顯性狀態之間的匹配過程,該匹配過程主要解決了壓力特征值分布不均對分級準確度的影響問題,并對線性不理想的結果進行重新分級,以此來提高壓力情感識別的準確率。基于HMM的壓力情感分級模型如圖 3所示。該匹配過程為采用線性方法稀釋了數據點分布中密度大的部分。在經過匹配過程之前,特征融合后的特征值點分布如圖 4所示。


在本文所涉及到的模型中,輸入參數為顯狀態,與壓力隱狀態構成HMM,是HMM中的學習問題,經過上述學習算法的訓練,確定HMM的參數μ。根據壓力隱狀態與壓力等級之間的對應關系,對壓力隱狀態進行壓力識別,進而進行壓力分級;然后通過匹配過程來對壓力識別與顯狀態之間的對應關系參數進行微調,對結果進行校驗。該模型主要包括以下三部分內容:
(1) 顯狀態與壓力隱狀態之間的學習問題。顯狀態表示融合后的生理特征;隱狀態為情感壓力狀態,分5級表示。該部分運用BW算法進行訓練學習并優化,可得出優化后的模型參數。
(2) 壓力識別與顯狀態的匹配校驗問題。匹配過程采取設定閾值進行判斷的方法,對誤差較大的結果進行重新分級,從而有效提高壓力狀態識別的準確率。
(3) 情感分級結果的準確率驗證問題。將融合后的訓練集數據特征參數作為BW算法的輸入,設定輸入狀態數為20,即將輸入特征值劃分為20個等級,輸入序列為同一受試的5組特征值;評估后的壓力等級為輸出,設定輸出狀態數為5,即5個壓力等級,據此得出HMM的參數。然后,通過將測試集數據融合后經模型處理得出的壓力等級與經問卷得出的結果進行對比,確定壓力分級的準確率。
3 結果和討論
對數據進行分析之前首先對數據進行特征融合,這樣能降低單一數據的片面性,并且能夠提高數據的空間分辨率,最大限度地降低因數據不完整而造成的誤差。在設計好整個過程之后,將17組訓練樣本通過HMM,用BW算法對HMM進行訓練,得到模型參數(初始概率矩陣∏、轉移概率矩陣A、混淆概率矩陣B),然后再用得到的參數模型對22組測試樣本進行測試,得到的壓力識別數據如表 1所示,平均準確率為90.7%,遠高于文獻[7]所述的65.5%。

如表 1所示,只有壓力2等級的準確率達到了100%,其他的壓力等級越高識別率越低。基于此現象,對數據重新進行了整理并分析,發現數據靠近1的部分變化率低,即融合后的參數在歸一化后靠近1的那部分數據的密集度大,導致分辨率較低。融合后的數據特征參數歸一化后的分布情況如圖 4所示,由圖可知特征值較大的部分分布較密集,這說明對密集度高的數據的可識別分辨率較低。為了解決這個問題,在隱馬爾科夫壓力分級模型中建立了匹配過程,結構如圖 3所示。在匹配過程中,使用間隔放大并設定閾值的方法,根據數據的范圍按比例線性調節。由于結果是對應相關的,該調節并不影響結果的準確性。經匹配過程之后再對特征參數進行歸一化,作為模型的輸入得出情感壓力分級的結果。經過匹配過程之后的情感壓力分級識別情況如表 2所示,其準確率有所提升。加入匹配過程后平均匹配率為96.4%,該匹配準確率雖尚未達到Healey等的97%,但該模型僅應用ECG數據一種生理參數,系統更易于實現。

綜上所述,本文建立了基于HMM的壓力分級模型,并且加入了一個匹配過程可以提高分級的準確率。
4 結論
情感壓力是生活中不可避免的精神現象,雖然在生活與學習工作中不能完全消除壓力的影響作用,但可以通過對情感壓力的研究,區別對待不同等級的情感壓力,合理調控情感壓力。
本文在分析生理信號與情感壓力特點的基礎上,利用日常生活場景作為壓力源,使用ECG信號作為壓力分級的對象,建立了基于HMM和情感計算理論的情感壓力分級模型,并成功地將模型應用于情感壓力的分級,對測試樣本進行分級的準確率達到了96.4%。在結果分析的過程中,與國際上同類研究進行了比較,并與未加匹配過程的模型進行了比較。
通過本課題的研究,得出以下三點經驗:① 合理地控制壓力的范圍能有效提高工作效率;② 生理參數特征融合能夠從不同側面反映信號的特征,避免了單一特征的片面性,能夠有效地提高壓力分級的準確率;③ 使用ECG數據作為壓力分級對象,基于HMM與情感計算理論的壓力分級模型能夠很好地劃分情感壓力等級,對日常生活場景所導致的壓力具有很好的識別能力。
引言
當今社會,人們面臨著眾多壓力。從生理學的角度,壓力的產生是由于外界因素刺激導致神經過激,從而促進腺體分泌激素影響相關生理參數,導致發生相應的體征變化。從心理學的角度,壓力來源于人對危機的不確定感,壓力通過外部作用于內部而產生心理認知[1]。
耶基斯-多德森曲線(Yerkes-Dodson Curve)是基于耶基斯-多德森定律(Yerkes-Dodson Law)[2]的一種鐘形曲線,該曲線表明壓力水平與工作績效的關系,說明在較低或較高的壓力狀態下都不利于工作效率的提高。當心理壓力過高時,容易誘發抑郁癥等精神類疾病,嚴重影響人們的正常生活。因此,有效的壓力評估,特別是壓力分級評估,將為壓力干預提供幫助。
傳統的壓力評估主要是針對有無壓力進行分析[3]。Costin等[4]運用求取心率變異性(heart rate variability,HRV)和形態變異(morphologic variability,MV)的方法,針對心電信號(electrocardiogram,ECG)的HRV與MV特征進行精神壓力識別,其方法是在獲得了ECG信號之后,首先求取ECG信號的HRV與MV特征量,然后根據HRV與MV特征量并結合問卷調查與對受試的觀察進行精神壓力識別。Melollo等[5]針對在大學考試的過程中和休息時的HRV變化,運用非參數分類技術和分類回歸樹來識別壓力狀況。Subahni等[6]則將視頻游戲作為壓力源,同樣通過比較ECG信號的HRV特征來識別壓力狀態。在上述三者的研究中只針對有、無壓力,而并未對壓力的強弱進行精確地分級。
在Karthikeyan等[7]的研究中,將心算任務作為壓力源,運用非連續小波變換(discrete wavelet transform,DWT)的方法分離出ECG信號的高頻段(High Frequency,HF)和低頻段(Low Frequency,LF)等特征,運用K-最近鄰分類器將壓力水平分為4個等級,其分類準確率為65.5%。在Healey等[8]的實驗中,采用了四種生理信號作為數據源,即ECG信號、肌電信號、呼吸信號和皮膚電導率信號,對各生理參數提取了若干的統計特征,并結合調查問卷來對駕駛員的壓力進行分級,所使用的分級方法為線性判別分析,雖然其準確率達到了97%,但系統數據采集復雜,不利于個體壓力的實時監測。 本文旨在探討情感壓力的量化評估,針對目前情感壓力分級研究的不足,以日常生活中常見的場景作為壓力源,如意外電話、考試通知等,以ECG信號為對象,以情感計算理論[9]為基礎,利用隱馬爾科夫模型(hidden Markov model,HMM)與問卷相結合的方法實現對情感壓力的分級評價。
1 生理參數提取與特征融合
實驗前,受試者被告知需要在進行數據采集的同時進行正常的工作與學習,每當感覺到壓力時,需及時記錄下當時的時間,之后再花3分鐘左右填寫國際標準壓力問卷(PSTRI)。實驗時,受試者佩戴便攜式心電監測儀,并會受到不少于5次的不定時的不同的壓力源刺激。實驗后,由實驗員依據問卷結果將實驗數據標記上從1到5的壓力等級,根據受試者標記的壓力點與問卷顯示的壓力等級截取壓力數據段,從每位受試者的數據中選出5段數據,每段數據時長30 s。實驗共邀請了39位受試者參與。
ECG信號能充分反映壓力情感狀態。而HRV是指心臟搏動周期存在的微小變異現象,可作為反映心臟交感神經和迷走神經活動緊張性和均衡性的一種非侵入性指標,也是心電分析的重要指標[10-11]。
基于ECG信號特點,選擇特征參數:
(1) HRV時域特征:差值均方的平方r-MSSD,是HRV的重要時域特征之一。反應了HRV中的快變化成分。其計算公式如式(1) 所示。
$r-MSSD=\sqrt{\frac{1}{N-1}\sum\limits_{i=1}^{N-1}{\left( R{{R}_{i+1}}-R{{R}_{i}} \right)}}$ |
其中RR為R波間隔,N為序列長度。
(2) HRV頻域特征:頻域特征中的高頻段HF(0.15~0.4 Hz),該特征生理意義明確,反映了迷走神經的活動,能夠從側面反映呼吸節律的變化,為自主神經系統調節功能的定量分析提供了工具,因而是重要的心理壓力評估參數。
(3) 近似熵:近似熵應用于HRV信號分析時,能反映心率的調節機制。本文應用近似熵[12]的快速算法來計算信號的近似熵,其計算如式(2) 所示。
$\text{ApEn}\left( 2,r,N \right)=\underset{N\to \infty }{\mathop{\lim }}\,\left[ \frac{1}{N-m+1}\sum\limits_{i=1}^{N-m}{\ln \frac{C_{i}^{m+1}\left( r \right)}{C_{i}^{m}\left( r \right)}} \right]$ |
其中,r為相似容限,m為模式維數,N為序列長度。
(4) 復雜度:HRV序列的復雜性可以反映RR間期序列的隨機程度,即可以體現心臟受自主神經系統調節的有序程度。L-Z復雜度使用最為廣泛,當其越接近1,則說明時間序列越復雜,反之則越規則[13-14]。其計算方法如式(3) 所示。
$LZC\left( n \right)=c\left( n \right)*\left( {{\log }_{2}}n \right)/n$ |
其中n為序列長度,c(n)為子串個數。
(5) 脈搏率:隨著心理壓力的增加,心跳速度也會相應地加快,即脈搏率增加。
與單一特征信號相比,多特征融合增加了信號的可信度,減少了信息的模糊性,提高了信息的空間分辨率;且單一特征具有片面性缺點。多特征融合具有擴展空間和時間覆蓋范圍的特點,能增加系統的監視能力和檢測效率。由于每組特征的可信度難以完全一致,為了最優化融合結果,可根據各組特征所得到的測量值自適應地尋找其對應的權數以達到最優的融合結果,即自適應加權融合算法[15],其結構如圖 1所示。

由圖 1結構可知數據融合的結果為:
$\hat{X}=\sum\limits_{i=1}^{N}{{{W}_{i}}{{X}_{i}}}$ |
式中,Wi為第i個特征的加權因子。且滿足式(5) 和式(6) 。
$\sum\limits_{i=1}^{n}{{{W}_{i}}}=1$ |
${{\sigma }^{2}}=\sum\limits_{i=1}^{n}{W_{i}^{2}}\sigma _{i}^{2}$ |
依據總的均方誤差最小的準則,即應求出式(6) 在式(5) 條件下的極值,而由多元函數極值理論得到式(7) 。當加權因子符合式(7) 時,σ2有最小值,如式(8) 所示。
${{W}_{i}}=\frac{1}{\sigma _{i}^{2}\sum\limits_{i=1}^{n}{\frac{1}{\sigma _{i}^{2}}}}$ |
${{\sigma }_{\min }}=\frac{1}{\sum\limits_{i=1}^{n}{\frac{1}{\sigma _{i}^{2}}}}$ |
可見,各特征的權系數僅由其測量方差決定。只要使各特征的權系數符合式(7) 就可使總均方誤差極小,且此時如式(9) 所示。
$\hat{X}=\frac{\sum\limits_{i=1}^{n}{\frac{{{X}_{i}}}{\sigma _{i}^{2}}}}{\sum\limits_{i=1}^{n}{\frac{1}{\sigma _{i}^{2}}}}$ |
利用以上方法自適應地求取最優的權重,求出ECG信號的HRV時域特征、頻域特征、心電近似熵、復雜度和脈搏率這五個生理特征融合后的參數向量。將融合后的特征參數經歸一化處理后作為壓力分級模型的輸入來計算壓力等級。如圖 2所示顯示了依據此方法融合前后數據特征參數的變化情況,將5種ECG特征融合為一維向量形式,縱軸表示特征值,橫軸表示數據序數。

2 壓力分級模型
HMM是20世紀60年代末、70年代初提出來的一種基于馬爾科夫(Markov)鏈概率函數的統計模型,是一種用參數表示,用于描述隨機過程統計特性的概率模型[16]。HMM包括兩個隨機過程:一個隨機過程描述觀察值和狀態之間的統計對應關系;另一個是Markov鏈,它描述狀態的轉移,由初始狀態分布概率和轉移概率矩陣描述,輸出為狀態序列。HMM的當前狀態與前一狀態有關,這符合前面分析的情感壓力狀態的特征。其主要的計算過程可表達為如式(10) 所示。
$P=\prod AB$ |
其中∏為初始狀態概率,A為狀態轉移矩陣,B為混淆矩陣,P為各等級壓力出現的概率。
在HMM中,初始狀態概率矢量∏,代表在初始時刻,各個情感狀態出現的概率,假設初始狀態隨機出現,即對初始概率賦隨機值[17]。狀態轉移概率矩陣A表示狀態之間互轉的概率,其概率值的決定因素是多種多樣的,包括壓力情感本身的不確定因素以及環境因素等外部影響。通過對模型參數[用μ=(A,B,∏)來表示模型參數]的調整,使得在當前狀態下觀察到指定觀察序列的概率最大,本文使用Baum-Welch(BW)算法[18]作為調整模型參數的學習算法。在不同的生理特征和外界因素刺激下,當輸入狀態序列不同時所得到的輸出情感觀察值序列也不同。
經過特征融合后,得到的序列為特征值序列,即觀察序列O,分別用O1,O2,O3,…,On表示,隱藏序列為情感狀態,即壓力等級,用H表示,是時間的函數,可記為H(t)。因為當前時刻的壓力等級H(t)僅與過去時刻的壓力等級H(t-1) 有關,且隱藏狀態可以通過混淆矩陣由觀察序列間接表示,如式(11) 所示,因此,只需要求得轉移矩陣A和混淆矩陣B,便可得出特征值向量與壓力等級之間的關系。
$\left\{ \frac{H\left( j \right)=A\left( i,j \right) H\left( i \right)}{H\left( j \right)=B\left( i,j \right)*O\left( i \right)} \right.$ |
在上式中,A(i,j)表示從隱藏狀態H(i)到隱藏狀態H(j)的概率; B(i,j)表示由觀察狀態O(i)得到隱藏狀態H(j)的概率;一般情況下,j>1,而此處為j=i+1。
HMM 的求解問題一般分為三類:評估問題、解碼問題和學習問題。本文需要求取一個最合適的HMM,即HMM的參數(轉移概率矩陣A、混淆矩陣B和初始矩陣∏),為HMM的學習問題,可通過BW算法來實現[18]。
BW算法主要包括兩個過程:預估和評測。該算法是以一種梯度下降的形式尋找一種錯誤測度的最小值,在給定初始HMM(初始矩陣∏和觀察序列O)的情況下,按照以下步驟計算HMM系數:
(1) 計算給定觀察序列O及HMM參數,定義t時刻位于隱藏狀態Hi的概率變量γt(i)和定義t時刻位于Ht及和t+1時刻位于Hi的概率變量ξt(i,j),計算公式分別如式(12) 和式(13) 所示。
${{\gamma }_{t}}\left( i \right)=P\left( {{q}_{t}}={{H}_{i}}O,\prod \right)$ |
${{\xi }_{t}}\left( i,j \right)=P\left( {{q}_{t}}={{H}_{i}},{{q}_{t+1}}={{H}_{i}}O,\prod \right)$ |
(2) 根據ξt(i,j)和γt(i)重估模型參數μ;對參數進行重估的計算式如式(14) 、(15) 和(16) 所示。
${{{\hat{\pi }}}_{i}}=P\left( {{q}_{t}}=iO,\mu \right)$ |
${{\hat{a}}_{ij}}=\frac{\sum\limits_{t=1}^{T-1}{{{\xi }_{t}}\left( i,j \right)}}{\sum\limits_{t=1}^{T-1}{{{\gamma }_{t}}\left( i \right)}}$ |
${{\hat{b}}_{ik}}=\frac{\sum\nolimits_{\left\{ t\left| O \right.\left( t \right)=k,1\le t\le T \right\}}{{{\gamma }_{t}}\left( i \right)}}{\sum\limits_{t=1}^{T-1}{{{\gamma }_{t}}\left( i \right)}}$ |
反復迭代上述(1) 、(2) 過程,直到收斂,然后所求的HMM即為最優化的模型,可依據此模型對壓力等級進行預測。
在該模型中,輸入為融合后的生理特征構成的觀察序列,輸出為壓力等級序列。在神經計算理論的基礎上,結合HMM的當前狀態與前一狀態有關,且觀察序列和隱藏狀態序列依概率對應這兩個特點,建立了基于HMM的壓力情感模型。在該模型中壓力作為隱藏狀態,顯性狀態表示的是融合后的生理特征。另外,在模型中添加了壓力識別與顯性狀態之間的匹配過程,該匹配過程主要解決了壓力特征值分布不均對分級準確度的影響問題,并對線性不理想的結果進行重新分級,以此來提高壓力情感識別的準確率。基于HMM的壓力情感分級模型如圖 3所示。該匹配過程為采用線性方法稀釋了數據點分布中密度大的部分。在經過匹配過程之前,特征融合后的特征值點分布如圖 4所示。


在本文所涉及到的模型中,輸入參數為顯狀態,與壓力隱狀態構成HMM,是HMM中的學習問題,經過上述學習算法的訓練,確定HMM的參數μ。根據壓力隱狀態與壓力等級之間的對應關系,對壓力隱狀態進行壓力識別,進而進行壓力分級;然后通過匹配過程來對壓力識別與顯狀態之間的對應關系參數進行微調,對結果進行校驗。該模型主要包括以下三部分內容:
(1) 顯狀態與壓力隱狀態之間的學習問題。顯狀態表示融合后的生理特征;隱狀態為情感壓力狀態,分5級表示。該部分運用BW算法進行訓練學習并優化,可得出優化后的模型參數。
(2) 壓力識別與顯狀態的匹配校驗問題。匹配過程采取設定閾值進行判斷的方法,對誤差較大的結果進行重新分級,從而有效提高壓力狀態識別的準確率。
(3) 情感分級結果的準確率驗證問題。將融合后的訓練集數據特征參數作為BW算法的輸入,設定輸入狀態數為20,即將輸入特征值劃分為20個等級,輸入序列為同一受試的5組特征值;評估后的壓力等級為輸出,設定輸出狀態數為5,即5個壓力等級,據此得出HMM的參數。然后,通過將測試集數據融合后經模型處理得出的壓力等級與經問卷得出的結果進行對比,確定壓力分級的準確率。
3 結果和討論
對數據進行分析之前首先對數據進行特征融合,這樣能降低單一數據的片面性,并且能夠提高數據的空間分辨率,最大限度地降低因數據不完整而造成的誤差。在設計好整個過程之后,將17組訓練樣本通過HMM,用BW算法對HMM進行訓練,得到模型參數(初始概率矩陣∏、轉移概率矩陣A、混淆概率矩陣B),然后再用得到的參數模型對22組測試樣本進行測試,得到的壓力識別數據如表 1所示,平均準確率為90.7%,遠高于文獻[7]所述的65.5%。

如表 1所示,只有壓力2等級的準確率達到了100%,其他的壓力等級越高識別率越低。基于此現象,對數據重新進行了整理并分析,發現數據靠近1的部分變化率低,即融合后的參數在歸一化后靠近1的那部分數據的密集度大,導致分辨率較低。融合后的數據特征參數歸一化后的分布情況如圖 4所示,由圖可知特征值較大的部分分布較密集,這說明對密集度高的數據的可識別分辨率較低。為了解決這個問題,在隱馬爾科夫壓力分級模型中建立了匹配過程,結構如圖 3所示。在匹配過程中,使用間隔放大并設定閾值的方法,根據數據的范圍按比例線性調節。由于結果是對應相關的,該調節并不影響結果的準確性。經匹配過程之后再對特征參數進行歸一化,作為模型的輸入得出情感壓力分級的結果。經過匹配過程之后的情感壓力分級識別情況如表 2所示,其準確率有所提升。加入匹配過程后平均匹配率為96.4%,該匹配準確率雖尚未達到Healey等的97%,但該模型僅應用ECG數據一種生理參數,系統更易于實現。

綜上所述,本文建立了基于HMM的壓力分級模型,并且加入了一個匹配過程可以提高分級的準確率。
4 結論
情感壓力是生活中不可避免的精神現象,雖然在生活與學習工作中不能完全消除壓力的影響作用,但可以通過對情感壓力的研究,區別對待不同等級的情感壓力,合理調控情感壓力。
本文在分析生理信號與情感壓力特點的基礎上,利用日常生活場景作為壓力源,使用ECG信號作為壓力分級的對象,建立了基于HMM和情感計算理論的情感壓力分級模型,并成功地將模型應用于情感壓力的分級,對測試樣本進行分級的準確率達到了96.4%。在結果分析的過程中,與國際上同類研究進行了比較,并與未加匹配過程的模型進行了比較。
通過本課題的研究,得出以下三點經驗:① 合理地控制壓力的范圍能有效提高工作效率;② 生理參數特征融合能夠從不同側面反映信號的特征,避免了單一特征的片面性,能夠有效地提高壓力分級的準確率;③ 使用ECG數據作為壓力分級對象,基于HMM與情感計算理論的壓力分級模型能夠很好地劃分情感壓力等級,對日常生活場景所導致的壓力具有很好的識別能力。