人在行走的時候會產生步態信號,不同的人會產生不同的步態信號,步態信號復雜度的研究在醫學上具有重要的意義。我們可以根據一個人步態信號的復雜度來評估一個人的健康狀況,從而及時發現和診斷疾病。本文采用詹森香農差異(JSD)的復雜度分析方法,分別計算健康老年人、健康年輕人和帕金森病患者的步態信號復雜度,并對實驗數據進行方差分析。結果表明,三種步態信號的復雜度具有明顯差異。通過本文的研究,我們得出了帕金森病患者、健康老年人和健康年輕人步態信號復雜度的取值范圍,從而為臨床診斷提供了重要依據。
引用本文: 王沛存, 王俊. 基于詹森香農差異的步態信號復雜度分析. 生物醫學工程學雜志, 2014, 31(3): 583-585. doi: 10.7507/1001-5515.20140109 復制
引言
所謂步態是指人們走路時候的姿勢,它由身體各個部位的相對運動組成,是人體生理機能和心理活動在行走時的外在表現形式。不同年齡、性別、性格、健康狀況和職業的人的步態是不同的[1]。基于不同個體之間所存在的不同步態特征可以實現非接觸情況下的身份識別[2]。步態信號是人在走路的時候產生的信號。隨著科技進步和社會的發展,步態信號的分析和處理能力得到了極大的提高,步態信號在生物醫學方法的應用也越來越普遍。步態信號的研究在臨床上能夠評估患者是否存在異常步態,為患者的康復和治療提供了最好的評價手段[3],具有重大意義。本文采用詹森香農差異(Jensen-Shannon divergence,JSD)的復雜度分析方法分析和研究了健康老年人、年輕人和帕金森病患者的步態信號,得出了這三種人步態信號復雜度的取值范圍,為醫學診斷提供了依據。
1 統計復雜度
統計復雜度作為描述序列隨機本質的重要指標,在時間序列和符號序列的研究分析中起著越來越重要的作用[4]。統計復雜度反映了時間序列或符號序列隨時間增長新模式出現的速率,序列的統計復雜度越大,表明在單位時間內這一序列的變化越快,出現的新模式越多,說明單位時間內這一序列的變化是統計復雜的并且隨機性較強,反之亦然。
自JSD(用于度量隨機變量概率分布之間的差異)于1991年提出后[5],就被廣泛應用于時間序列和符號序列的分析和特征描述中[6],如模式識別、DNA序列的分割。同時,JSD也在傳感網絡以及圖像視頻等領域得到了很好的應用,比如圖像分割和邊緣檢測等。JSD是對Kullback-Leibler divergence進行對稱和平滑的結果,JSD的非負性、對稱性、連續性和有界性等特征在時間序列數據分析中得到了普遍的應用[7]。步態信號可以視為一種時間序列,所以,基于JSD的統計復雜度分析方法可用來實現步態信號的識別與檢測。本文采用JSD的統計復雜度分析方法對三種步態信號進行了對比分析與研究。
2 算法描述
基于JSD的步態信號的復雜度計算方法:
(1)設步態信號序列為X,X={x1,x2,x3,…xi,…,xN},序列長度為N。
(2)對步態信號序列采用符號動力學方法進行符號化處理[8];對時間序列X粗粒化處理[9],轉換成符號序列S={s1,s2,…,si,…,sN},si∈A (A=0,1,2,3)。計算時間序列的平均值u。
${{s}_{i}}\left( {{x}_{i}} \right)=\left\{ \begin{align} & 0:u <{{x}_{i}}\le \left( 1+a \right)u\text{ } \\ & 1:\left( 1+a \right)u<{{x}_{i}}<\infty \\ & 2:\left( 1-a \right)u<{{x}_{i}}\le u \\ & 3:0\le {{x}_{i}}\le \left( 1-a \right)u \\ \end{align} \right.,$ |
其中i=1,2,…,N。a是一個常量,a=0.05。a的值取得過大或過小,在把原始時間序列轉化成符號序列時,會導致細節信息的丟失,不能很好地捕捉到信號中的動態信息。
(3)統計符號序列排列的概率分布[10]。采用B-P算法,嵌入維數取d=6。 對于給定時間序列{xn,n=1,2,…,N}和一個嵌入維數d>1,對每一時刻i=1,2,…,N-d+1,其d階順次模式是由時刻(i,i+1,…,i+d-1)的值組成的d維向量表示:
$\left( S \right)|->({{x}_{i}},{{x}_{i+1}},\ldots ,{{x}_{i+d-1}}),$ |
根據d階順次模式,定義(0,1,…d-1)的一個排列π=(r0,r1,…,rd-1)為
${{x}_{i+{{r}_{0}}}}\le {{x}_{i+{{r}_{1}}}}\le \ldots \le {{x}_{i+{{r}_{d-1}}}},$ |
若xi+r1≤xi+ri-1,則ri<ri-1。因此,對所有可能的d!個d階排列π,概率分布P={p(π)}定義為[11]
$p(\pi )=\frac{\#\{s|iT-d+1;\left( s \right)has-type-\pi \}}{T-d+1}$ |
其中符號#代表排列的數目。
(4)計算Shannon熵和最大熵,得到歸一化熵HS,即
${{H}_{S}}=H\left[ P \right]/{{H}_{max}},{{H}_{max}}=ln\left( k \right),$ |
其中k為排列π的所有組合數目。
(5)計算概率分布P與均勻分布Pe的JSD:
${{D}_{js}}=H((P+{{P}_{e}})/2)-H\left[ P \right]/2-H[{{P}_{e}}]/2,$ |
其中Pe為均勻概率分布,為1/k;
(6)計算統計復雜度C:
${{C}_{js}}={{Q}_{0}}^{(J)}{{D}_{js}}{{H}_{S}}~,$ |
其中Qo為一常數[12],
${{Q}_{0}}^{(J)}=-2\left( \frac{k+1}{k} \right)ln\left( k+1 \right)-2ln\left( 2k \right)+ln\left( k \right)\wedge \left( -1 \right)$ |
3 基于JSD的步態信號復雜度計算和分析
實驗中采用的數據是從MIT-BIH標準數據庫中提取的來自Gait in Aging and Disease Database的10組樣本(行走步幅間隔時間序列):10例健康年輕人(年齡23~29周歲,以下簡稱年輕人),10例健康老年人(年齡71~77周歲,以下簡稱老年人),10例患有帕金森病的老年人(年齡60~77周歲)。行走步幅間隔是由放置在鞋內的超薄力敏電阻測量的。
編寫程序,計算老年人、帕金森病患者和年輕人的步態信號的復雜度,結果如表 1所示。

將三種步態信號的復雜度投影到CH平面,結果如圖 1所示。

從圖 1我們可發現,三種步態信號的復雜度在CH平面的投影點和投影區域有所不同。年輕人的步態信號復雜度分布在圖的中上部,老年人的復雜度分布在圖的中間,而帕金森病患者的復雜度主要分布在圖的下部,即年輕人的步態信號復雜度最大,老年人次之,而帕金森病患者的步態信號復雜度最小。三種步態信號的復雜度相互之間都有重疊部分。年輕人與帕金森病患者的重疊部分很少,老年人與帕金森病患者的重疊部分很多,而年輕人的復雜度與老年人之間大約有一半重疊。就三種復雜度之間的數值差距來看,老年人和年輕人的復雜度相差不大,而帕金森病患者的復雜度就小得多了。
以上分析充分說明不同年齡、不同健康狀況的人步態信號復雜度差異是比較明顯的,因此,步態信號的復雜度值可以作為評判健康狀況的依據,為臨床診斷提供幫助。
根據醫學研究中的統計學方法[13],對三種步態信號的復雜度進行方差分析,并繪制三種步態信號復雜度的箱線圖(見圖 2)。
箱線圖又稱為盒須圖、盒式圖或箱形圖,是一種用作顯示一組數據分散情況資料的統計圖,因型狀如箱子而得名。箱線圖將一組數據從大到小排列,分別計算出上邊緣、上四分位數、中位數、下四分位數、下邊緣。

方差分析得出F值為13.33,P值為0.000 09,顯示三種步態信號的復雜度有明顯的差異,即基于JSD的復雜度分析結果具有統計學意義。
4 結論
步態是具有個體差異性的行為特征,不同的人在走路時會產生不同的步態信號。本文提出一種新的基于JSD的復雜度分析方法,對三種步態信號的復雜度進行了分析和研究,結果表明三種步態信號復雜度具有明顯差異,步態信號的復雜度值可以作為評判健康狀況的依據,為臨床診斷提供幫助。
引言
所謂步態是指人們走路時候的姿勢,它由身體各個部位的相對運動組成,是人體生理機能和心理活動在行走時的外在表現形式。不同年齡、性別、性格、健康狀況和職業的人的步態是不同的[1]。基于不同個體之間所存在的不同步態特征可以實現非接觸情況下的身份識別[2]。步態信號是人在走路的時候產生的信號。隨著科技進步和社會的發展,步態信號的分析和處理能力得到了極大的提高,步態信號在生物醫學方法的應用也越來越普遍。步態信號的研究在臨床上能夠評估患者是否存在異常步態,為患者的康復和治療提供了最好的評價手段[3],具有重大意義。本文采用詹森香農差異(Jensen-Shannon divergence,JSD)的復雜度分析方法分析和研究了健康老年人、年輕人和帕金森病患者的步態信號,得出了這三種人步態信號復雜度的取值范圍,為醫學診斷提供了依據。
1 統計復雜度
統計復雜度作為描述序列隨機本質的重要指標,在時間序列和符號序列的研究分析中起著越來越重要的作用[4]。統計復雜度反映了時間序列或符號序列隨時間增長新模式出現的速率,序列的統計復雜度越大,表明在單位時間內這一序列的變化越快,出現的新模式越多,說明單位時間內這一序列的變化是統計復雜的并且隨機性較強,反之亦然。
自JSD(用于度量隨機變量概率分布之間的差異)于1991年提出后[5],就被廣泛應用于時間序列和符號序列的分析和特征描述中[6],如模式識別、DNA序列的分割。同時,JSD也在傳感網絡以及圖像視頻等領域得到了很好的應用,比如圖像分割和邊緣檢測等。JSD是對Kullback-Leibler divergence進行對稱和平滑的結果,JSD的非負性、對稱性、連續性和有界性等特征在時間序列數據分析中得到了普遍的應用[7]。步態信號可以視為一種時間序列,所以,基于JSD的統計復雜度分析方法可用來實現步態信號的識別與檢測。本文采用JSD的統計復雜度分析方法對三種步態信號進行了對比分析與研究。
2 算法描述
基于JSD的步態信號的復雜度計算方法:
(1)設步態信號序列為X,X={x1,x2,x3,…xi,…,xN},序列長度為N。
(2)對步態信號序列采用符號動力學方法進行符號化處理[8];對時間序列X粗粒化處理[9],轉換成符號序列S={s1,s2,…,si,…,sN},si∈A (A=0,1,2,3)。計算時間序列的平均值u。
${{s}_{i}}\left( {{x}_{i}} \right)=\left\{ \begin{align} & 0:u <{{x}_{i}}\le \left( 1+a \right)u\text{ } \\ & 1:\left( 1+a \right)u<{{x}_{i}}<\infty \\ & 2:\left( 1-a \right)u<{{x}_{i}}\le u \\ & 3:0\le {{x}_{i}}\le \left( 1-a \right)u \\ \end{align} \right.,$ |
其中i=1,2,…,N。a是一個常量,a=0.05。a的值取得過大或過小,在把原始時間序列轉化成符號序列時,會導致細節信息的丟失,不能很好地捕捉到信號中的動態信息。
(3)統計符號序列排列的概率分布[10]。采用B-P算法,嵌入維數取d=6。 對于給定時間序列{xn,n=1,2,…,N}和一個嵌入維數d>1,對每一時刻i=1,2,…,N-d+1,其d階順次模式是由時刻(i,i+1,…,i+d-1)的值組成的d維向量表示:
$\left( S \right)|->({{x}_{i}},{{x}_{i+1}},\ldots ,{{x}_{i+d-1}}),$ |
根據d階順次模式,定義(0,1,…d-1)的一個排列π=(r0,r1,…,rd-1)為
${{x}_{i+{{r}_{0}}}}\le {{x}_{i+{{r}_{1}}}}\le \ldots \le {{x}_{i+{{r}_{d-1}}}},$ |
若xi+r1≤xi+ri-1,則ri<ri-1。因此,對所有可能的d!個d階排列π,概率分布P={p(π)}定義為[11]
$p(\pi )=\frac{\#\{s|iT-d+1;\left( s \right)has-type-\pi \}}{T-d+1}$ |
其中符號#代表排列的數目。
(4)計算Shannon熵和最大熵,得到歸一化熵HS,即
${{H}_{S}}=H\left[ P \right]/{{H}_{max}},{{H}_{max}}=ln\left( k \right),$ |
其中k為排列π的所有組合數目。
(5)計算概率分布P與均勻分布Pe的JSD:
${{D}_{js}}=H((P+{{P}_{e}})/2)-H\left[ P \right]/2-H[{{P}_{e}}]/2,$ |
其中Pe為均勻概率分布,為1/k;
(6)計算統計復雜度C:
${{C}_{js}}={{Q}_{0}}^{(J)}{{D}_{js}}{{H}_{S}}~,$ |
其中Qo為一常數[12],
${{Q}_{0}}^{(J)}=-2\left( \frac{k+1}{k} \right)ln\left( k+1 \right)-2ln\left( 2k \right)+ln\left( k \right)\wedge \left( -1 \right)$ |
3 基于JSD的步態信號復雜度計算和分析
實驗中采用的數據是從MIT-BIH標準數據庫中提取的來自Gait in Aging and Disease Database的10組樣本(行走步幅間隔時間序列):10例健康年輕人(年齡23~29周歲,以下簡稱年輕人),10例健康老年人(年齡71~77周歲,以下簡稱老年人),10例患有帕金森病的老年人(年齡60~77周歲)。行走步幅間隔是由放置在鞋內的超薄力敏電阻測量的。
編寫程序,計算老年人、帕金森病患者和年輕人的步態信號的復雜度,結果如表 1所示。

將三種步態信號的復雜度投影到CH平面,結果如圖 1所示。

從圖 1我們可發現,三種步態信號的復雜度在CH平面的投影點和投影區域有所不同。年輕人的步態信號復雜度分布在圖的中上部,老年人的復雜度分布在圖的中間,而帕金森病患者的復雜度主要分布在圖的下部,即年輕人的步態信號復雜度最大,老年人次之,而帕金森病患者的步態信號復雜度最小。三種步態信號的復雜度相互之間都有重疊部分。年輕人與帕金森病患者的重疊部分很少,老年人與帕金森病患者的重疊部分很多,而年輕人的復雜度與老年人之間大約有一半重疊。就三種復雜度之間的數值差距來看,老年人和年輕人的復雜度相差不大,而帕金森病患者的復雜度就小得多了。
以上分析充分說明不同年齡、不同健康狀況的人步態信號復雜度差異是比較明顯的,因此,步態信號的復雜度值可以作為評判健康狀況的依據,為臨床診斷提供幫助。
根據醫學研究中的統計學方法[13],對三種步態信號的復雜度進行方差分析,并繪制三種步態信號復雜度的箱線圖(見圖 2)。
箱線圖又稱為盒須圖、盒式圖或箱形圖,是一種用作顯示一組數據分散情況資料的統計圖,因型狀如箱子而得名。箱線圖將一組數據從大到小排列,分別計算出上邊緣、上四分位數、中位數、下四分位數、下邊緣。

方差分析得出F值為13.33,P值為0.000 09,顯示三種步態信號的復雜度有明顯的差異,即基于JSD的復雜度分析結果具有統計學意義。
4 結論
步態是具有個體差異性的行為特征,不同的人在走路時會產生不同的步態信號。本文提出一種新的基于JSD的復雜度分析方法,對三種步態信號的復雜度進行了分析和研究,結果表明三種步態信號復雜度具有明顯差異,步態信號的復雜度值可以作為評判健康狀況的依據,為臨床診斷提供幫助。