本文利用微軟公司研發的體感周邊外設(Kinect)獲取偏癱患者的步行軌跡數據,在此基礎上實現了偏癱步態的自動識別,并對識別特征的重要性進行了排序。首先,研究設立了試驗組和對照組,兩組受試者按要求分別完成規定的范式動作,經由 Kinect 實時獲取受試者的步行軌跡數據。從獲取的數據中可提取步態識別特征:步速、步幅、質心的移動范圍(上下和左右方向)。然后,利用貝葉斯分類算法對這些特征構成的樣本集進行分類學習,實現偏癱步態的自動識別。最后,利用隨機森林算法確定每個特征的重要性,通過對每個特征的重要性進行排序,可為病情診斷提供參考。本文研究結果表明,基于貝葉斯算法的分類準確率為 96%;使用隨機森林算法確定的特征重要性排序為步速、步幅、質心左右偏移距離、質心上下偏移距離,而步速與步幅、步速與質心左右偏移距離的組合是偏癱步態分析診斷的重要依據。本文研究結果或可為偏癱步態的智能診斷提供新的思路和參考。
引用本文: 朱業安, 徐唯祎, 王睿, 童楊, 盧巍, 王浩倫. 偏癱步態障礙的自動識別和分析. 生物醫學工程學雜志, 2019, 36(2): 306-314. doi: 10.7507/1001-5515.201806044 復制
引言
偏癱患者步行功能的恢復是其迫切需要解決的問題之一。在臨床康復中,通過對偏癱步態進行分析獲取定量的步態信息,可為揭示異常步態原因、矯正異常步態、制定康復治療計劃以及評估康復干預效果提供依據[1]。
大多數臨床醫生在對偏癱患者的步態評估中采用的是主觀觀察和量表評分兩種手段,但是帶有個人主觀差異性的觀察評估在臨床治療中并不夠可靠[2],而量表評分提供的關于患者日常運動能力的信息,也常被認為不客觀以及對患者病情的改變評價不夠敏感[3]。因此,主觀觀察評估再輔以客觀測量,才是提高步態評估可靠性和準確性的有效手段。目前,三維運動捕捉系統和測力平臺是實驗室中用于步態評估的常用設備,可作為評估患者的下肢運動功能表現的數據采集裝置。作為獲取步態運動學數據的重要工具,三維運動捕捉系統具有較高的準確性和可靠性,但昂貴的價格和較高的技術要求限制了其在臨床診斷中的大規模使用[4]。測力平臺是獲取步態動力學數據的重要裝置,但由于患者只能在有限的寬度范圍內活動,具有較大的局限[5]。對此,有研究者提出利用基于逆向動力學的骨肌仿真模型來獲取患者步行時的動力學參數[6-8],這類方法利用運動捕捉系統捕獲的患者運動軌跡作為輸入,然后基于逆向動力學模型來預測患者在整個步態周期內的動力學參數,也不失為一種客觀辦法。綜上所述,如何在較低成本的前提下高效便捷地獲取患者的運動軌跡,是能否將偏癱患者步態的客觀測量方法廣泛應用于臨床的關鍵所在。
微軟公司的 Kinect(Kinect 2.0 for Windows,Microsoft Corp,美國)為解決上述問題提供了新的途徑,相比現有的運動捕捉設備,Kinect 系統的優勢體現在:第一,Kinect 的價格低廉(目前國內售價為 1 350 元);第二,受空間范圍的約束小,可在一定范圍的場地內捕獲步行軌跡數據;第三,它不需要重新定位標記來跟蹤關節運動,因此可以克服穿戴式傳感器和三維運動捕捉系統需要重復標定的限制。
目前領域內已經開展了很多利用 Kinect 系統進行步態分析的研究,Dolatabadi 等[9]研究了 Kinect 用于步態時空參數測量的有效性,結果表明 Kinect 能有效地測量健康成年人的步態時空參數。Latorre 等[10]對使用 Kinect 采集的卒中后患者的步態時空參數是否可靠進行了研究,發現雖然結果的準確性有限,但能很好地補充傳統測量工具。Eltoukhy 等[11]分別使用三維運動分析系統和 Kinect 對帕金森患者和正常健康老年人的步態進行了分析,他發現 Kinect 獲取的數據對區分兩組受試者之間的差異具有足夠的靈敏度,和三維運動分析系統的結果有較高的一致性。然而,很少有研究將 Kinect 系統獲取的數據同智能算法結合起來,以實現偏癱步態的自動識別并用于輔助臨床醫生診斷。因此,本文的第一個目的是利用貝葉斯分類算法從 Kinect 捕獲的運動軌跡數據中識別步態模式;第二個目的是通過隨機森林算法中所有決策樹得到的平均不純度衰減來度量識別特征的重要性,獲得識別特征的重要性排序,為臨床醫生提供參考。另一方面,許多前人的工作已經證實虛擬環境在物理治療、運動治療和心理治療中的有效性[12-13],而作為模擬康復醫師或康復理療師的虛擬人是以人的形象在計算機生成空間(三維虛擬環境)中的幾何特性與行為特性的投射[14],利用這種新的人機交互應用可以幫助緩解康復醫師短缺問題,所以本文的第三個目的是為實現虛擬醫師的智能診斷功能進行初步探索。
1 材料與方法
1.1 步態采集試驗
本文研究共招募了 60 名受試者。其中,試驗組為 20 位偏癱患者,12 名男性、8 名女性,年齡(54.3 ± 12.2)歲,身高(164.75 ± 6.13)cm,體重(61.5 ± 10.1)kg;對照Ⅰ組為 20 位健康老年受試者,男女各 10 名,年齡(71.83 ± 10.55)歲,身高(159.83 ± 10.49)cm,體重(58.16 ± 7.52) kg;對照Ⅱ組為 20 位健康青年受試者,13 名男性、7 名女性,年齡(24.43 ± 3.83)歲,身高(169 ± 6.87)cm,體重(59.93 ± 13.58)kg,兩組對照組均無運動障礙相關疾病。
本文試驗在江西省人民醫院康復醫學科進行,由當地倫理委員會審批通過,受試者均簽署了知情同意書。試驗時,每個受試者均需完成規定的范式動作:單次直線行走 5 m,一次試驗走 3 次,重復 3 次試驗。因 Kinect 測量精度的限制,本文確定的有效試驗范圍為 1.5~4.5 m,現場試驗如圖 1 所示。由 Kinect 傳感器捕獲到的標記點如圖 2 所示,每個標記點對應的骨骼節點如表 1 所示。在試驗過程中,受試者骨骼節點的三維坐標位置會被實時捕獲和存儲。



1.2 步態特征提取
1.2.1 運動學特征提取
人體質心的移動范圍是進行步態運動學分析的一個重要指標。Winter 等[15]提出的身體節段法是質心測量的“金標準”,該方法首先將人體分為頭、軀干、上臂、前臂、手、骨盆、大腿、小腿、足等 15 個獨立的身體節段,本研究利用 Kinect 系統采集了該方法所定義的所有身體節段的近端坐標和遠端坐標,設置的節段如表 2 所示,表中的近端和遠端標記點與前文所述標記點位置一致。然后,利用采集到的標記點位置計算出每個節段的質心位置,定義一個身體節段質心位置的計算公式如式(1)所示:

![]() |
式中,xcm、ycm、zcm 為節段質心坐標;xp、yp、zp 是節段近端的坐標;xd、yd、zd 是節段遠端的坐標;lp 是從近端到末端的節段長度的百分比;ld 是從遠端到末端的節段長度的百分比,參數詳情如表 2 所示[16]。
最后,利用各節段質心位置來計算人體質心位置,其計算公式如式(2)所示:
![]() |
式中,xtcm、ytcm、ztcm 為人體質心的坐標;xi、yi 是第 i 段的坐標;mi 是第 i 段的質量;M 是 15 個身體節段的總質量。本文獲得的質心移動范圍(上下和左右方向)如圖 3 所示,在此基礎上,可計算出受試者質心移動范圍(上下和左右方向)的平均值。

1.2.2 時空特征提取
本文從 Kinect 系統捕獲的步行軌跡數據中提取出步幅、步速作為步態的時空特征。提取算法可歸納為以下幾個步驟:首先,對 Kinect 捕獲的標記點坐標數據進行預處理,去除標記點坐標的粗誤差;然后,計算標記點 15 和 16 的中心位置坐標來獲得左足底坐標;計算標記點 19 和 20 的中心位置坐標來獲得右足底坐標;接著利用單側足底坐標間的歐氏距離來計算平均步幅,如圖 4 所示;最后,測量所有受試者的腿長,即計算節段 13~15 和節段 17~19 之間的歐氏距離,用它們的均值對步幅進行標準化[17]。在獲得步幅特征后,由步速 = 步幅/步行周期,可計算出步速特征。

1.3 步態模式識別
假設從獲取的數據中得到了一個包含 m 個實例的數據集,即輸入空間:,每個實例由 d 個屬性描述:
,
;并定義了所有實例的標記的集合 Y,即輸出空間,其中
是實例 xi 的標簽。在此基礎上通過對訓練集
進行分類學習,可以建立一個從輸入空間 X 到輸出空間 Y 的映射(f:X→Y),當這個映射關系被應用到無標簽實例時,就可以根據該實例的屬性特征來預測該實例的標簽,即該實例屬于哪一類。貝葉斯決策論是在概率框架下實施決策的基本方法,對分類任務來說,該方法可根據已知概率和誤判損失,來為一個未知標簽的實例 x 選擇最優的類別標簽。本文的貝葉斯分類算法如下所示:
輸入:實例數據集 ,每個實例由 4 個屬性描述:xi =(質心左右偏移距離、質心上下偏移距離、步幅、步速);以及對應的標記
{偏癱患者組、健康老人組、健康青年組},k = 1,2,3;未知標簽的實例 x。
(1)計算先驗概率 P(yk)和條件概率 P(xi,d|yk),其計算公式如式(3)所示:
![]() |
式中,xi,d 為第 i 個實例在第 d 個屬性上的取值,,d = 1,2,3,4。
(2)對于給定的實例 x,計算其后驗概率。其計算公式如式(4)所示:
![]() |
式中,xd 為實例 x 在第 d 個屬性上的取值。
(3)確定實例 x 的標簽,其計算公式如式(5)所示:
![]() |
輸出:實例 x 的標簽 y,即實例 x 的類別。
1.4 特征重要性排序
隨機森林是一種以決策樹為基學習器的集成學習算法,它利用重采樣技術從原始樣本中隨機抽取數據構造多個樣本,然后對每個重采樣樣本采用節點的隨機分裂技術來構造多顆決策樹,最后將多棵決策樹組合,通過投票得出最終的預測結果。隨機森林算法可在訓練過程中輸出各變量的重要性排序。它的實現原理是,當訓練一棵決策樹時,可以計算出每個特征減少了多少樹的不純度,對于一個決策樹森林來說,可以算出每個特征平均減少了多少樹的不純度,并把它平均減少的不純度作為度量特征重要性的值。應用基尼指數計算不純度的算法如式(6)~式(8)所示:
屬性 a 的基尼指數如式(6)所示:
![]() |
式中,c 為樣本類別個數,pi 為屬性 a 屬于類別 cj 的概率。由此可得特征 f 的基尼指數,其計算公式如式(7)所示:
![]() |
式中,p 為屬性個數,ni 為屬性 ai 的樣本數。綜合 m 個訓練集,可得到特征 f 的重要性評分 S(i),其計算公式如式(8)所示:
![]() |
式中,fij 為第 j 個訓練集中第 i 維特征。
2 結果
2.1 貝葉斯分類結果
本文按 7∶3 的比例將樣本數據集分成訓練集和測試集,樣本數據集如表 3 所示,利用訓練集訓練了貝葉斯分類模型,然后用模型對測試樣本進行預測,從而對模型的分類準確性進行檢驗,準確率的計算公式如式(9)所示:

![]() |
式中的 yi 是實例的真實標簽,f(xi)是預測標簽,N 是實例數量,I 是指示函數,即當 yi = f(xi)時為 1,否則為 0。
利用全部特征進行訓練的貝葉斯分類模型有 96% 的分類準確率。基于不同特征組合訓練的模型的分類準確性如表 4 所示,可以看出其中有幾類包含了步速特征的分類模型具有較高準確率,可作為最佳的分類子特征;其中,步速與步幅(準確率 94%)、步速與質心左右偏移距離(準確率 92%)的組合是偏癱步態分析診斷的重要依據。各類之間的貝葉斯決策邊界如圖 5 所示,其中不同的背景色代表不同的決策界限,這些界限可以在臨床實踐中用于將來訪者劃分到合適類別,尤其是在診斷指標不足的情況下做出初步診斷。


2.2 特征重要性排序結果
本文構造了 10 000 棵決策樹,通過計算每個特征平均減少的樹的不純度,獲得了特征的相對重要性,如圖 6 所示,步速、步幅、質心左右偏移、質心上下偏移所占的比重分別為 34.2%、22.3%、22%、21.3%。因此臨床上對偏癱步態障礙進行診斷分析和康復評估時最先應該關注患者的步速,尤其值得注意的是步速與步幅、步速與質心左右偏移距離的組合是偏癱步態分析診斷的重要依據。

3 討論
越來越多的研究者開始關注 Kinect 在人體運動檢測和康復醫療領域的應用,但研究視角主要還是聚焦在研究數據的可靠性和準確性方面[18-19]。對于我國康復醫療的發展來說,這一新技術可以有效降低康復治療成本,提高康復行業的服務能力,但沒能改善康復醫師短缺的現狀。人工智能技術的飛速發展,為解決上述問題提供了新思路。因此,本文將 Kinect 骨骼跟蹤技術同貝葉斯分類算法相結合,提出了一種基于 Kinect 的偏癱步態識別方法。研究結果表明,基于貝葉斯分類算法的分類準確率為 96%。另外,針對本文采集的數據集,我們驗證了不同分類算法的分類效果,結果如表 5 所示。相比較而言,貝葉斯分類算法實現簡單、學習與預測效率高,分類準確率在同類算法中也最高。

本研究的不足之處是:只提取了步態的時空特征和運動學特征,并沒有提取動力學特征,因此后面的工作本課題組會圍繞動力學的原理提取步態特征,例如:提取地面反作用力參數等,以提高本文研究結果的精確性。此外本研究的樣本量不大,還可以根據更多的樣本和試驗來提高分類模型的準確性。
偏癱步態障礙患者常因股四頭肌痙攣導致膝關節屈曲困難、小腿三頭肌痙攣導致足下垂、脛后肌痙攣導致足內翻。這使得多數患者在擺動相時骨盆代償性抬高,髖關節外展外旋;在支撐相時往往采用膝過伸的姿態代償。另外,由于患肢的支撐力下降,患者一般會通過縮短患肢的支撐時間來代償,部分患者還會出現側身,健腿在前,患腿在后,患足在地面拖行等姿態行走,因此可以基于這些病理特征和行為表現構建更具體的特征工程,從而實現不同類型、不同損傷程度的步態障礙的自動識別。
引言
偏癱患者步行功能的恢復是其迫切需要解決的問題之一。在臨床康復中,通過對偏癱步態進行分析獲取定量的步態信息,可為揭示異常步態原因、矯正異常步態、制定康復治療計劃以及評估康復干預效果提供依據[1]。
大多數臨床醫生在對偏癱患者的步態評估中采用的是主觀觀察和量表評分兩種手段,但是帶有個人主觀差異性的觀察評估在臨床治療中并不夠可靠[2],而量表評分提供的關于患者日常運動能力的信息,也常被認為不客觀以及對患者病情的改變評價不夠敏感[3]。因此,主觀觀察評估再輔以客觀測量,才是提高步態評估可靠性和準確性的有效手段。目前,三維運動捕捉系統和測力平臺是實驗室中用于步態評估的常用設備,可作為評估患者的下肢運動功能表現的數據采集裝置。作為獲取步態運動學數據的重要工具,三維運動捕捉系統具有較高的準確性和可靠性,但昂貴的價格和較高的技術要求限制了其在臨床診斷中的大規模使用[4]。測力平臺是獲取步態動力學數據的重要裝置,但由于患者只能在有限的寬度范圍內活動,具有較大的局限[5]。對此,有研究者提出利用基于逆向動力學的骨肌仿真模型來獲取患者步行時的動力學參數[6-8],這類方法利用運動捕捉系統捕獲的患者運動軌跡作為輸入,然后基于逆向動力學模型來預測患者在整個步態周期內的動力學參數,也不失為一種客觀辦法。綜上所述,如何在較低成本的前提下高效便捷地獲取患者的運動軌跡,是能否將偏癱患者步態的客觀測量方法廣泛應用于臨床的關鍵所在。
微軟公司的 Kinect(Kinect 2.0 for Windows,Microsoft Corp,美國)為解決上述問題提供了新的途徑,相比現有的運動捕捉設備,Kinect 系統的優勢體現在:第一,Kinect 的價格低廉(目前國內售價為 1 350 元);第二,受空間范圍的約束小,可在一定范圍的場地內捕獲步行軌跡數據;第三,它不需要重新定位標記來跟蹤關節運動,因此可以克服穿戴式傳感器和三維運動捕捉系統需要重復標定的限制。
目前領域內已經開展了很多利用 Kinect 系統進行步態分析的研究,Dolatabadi 等[9]研究了 Kinect 用于步態時空參數測量的有效性,結果表明 Kinect 能有效地測量健康成年人的步態時空參數。Latorre 等[10]對使用 Kinect 采集的卒中后患者的步態時空參數是否可靠進行了研究,發現雖然結果的準確性有限,但能很好地補充傳統測量工具。Eltoukhy 等[11]分別使用三維運動分析系統和 Kinect 對帕金森患者和正常健康老年人的步態進行了分析,他發現 Kinect 獲取的數據對區分兩組受試者之間的差異具有足夠的靈敏度,和三維運動分析系統的結果有較高的一致性。然而,很少有研究將 Kinect 系統獲取的數據同智能算法結合起來,以實現偏癱步態的自動識別并用于輔助臨床醫生診斷。因此,本文的第一個目的是利用貝葉斯分類算法從 Kinect 捕獲的運動軌跡數據中識別步態模式;第二個目的是通過隨機森林算法中所有決策樹得到的平均不純度衰減來度量識別特征的重要性,獲得識別特征的重要性排序,為臨床醫生提供參考。另一方面,許多前人的工作已經證實虛擬環境在物理治療、運動治療和心理治療中的有效性[12-13],而作為模擬康復醫師或康復理療師的虛擬人是以人的形象在計算機生成空間(三維虛擬環境)中的幾何特性與行為特性的投射[14],利用這種新的人機交互應用可以幫助緩解康復醫師短缺問題,所以本文的第三個目的是為實現虛擬醫師的智能診斷功能進行初步探索。
1 材料與方法
1.1 步態采集試驗
本文研究共招募了 60 名受試者。其中,試驗組為 20 位偏癱患者,12 名男性、8 名女性,年齡(54.3 ± 12.2)歲,身高(164.75 ± 6.13)cm,體重(61.5 ± 10.1)kg;對照Ⅰ組為 20 位健康老年受試者,男女各 10 名,年齡(71.83 ± 10.55)歲,身高(159.83 ± 10.49)cm,體重(58.16 ± 7.52) kg;對照Ⅱ組為 20 位健康青年受試者,13 名男性、7 名女性,年齡(24.43 ± 3.83)歲,身高(169 ± 6.87)cm,體重(59.93 ± 13.58)kg,兩組對照組均無運動障礙相關疾病。
本文試驗在江西省人民醫院康復醫學科進行,由當地倫理委員會審批通過,受試者均簽署了知情同意書。試驗時,每個受試者均需完成規定的范式動作:單次直線行走 5 m,一次試驗走 3 次,重復 3 次試驗。因 Kinect 測量精度的限制,本文確定的有效試驗范圍為 1.5~4.5 m,現場試驗如圖 1 所示。由 Kinect 傳感器捕獲到的標記點如圖 2 所示,每個標記點對應的骨骼節點如表 1 所示。在試驗過程中,受試者骨骼節點的三維坐標位置會被實時捕獲和存儲。



1.2 步態特征提取
1.2.1 運動學特征提取
人體質心的移動范圍是進行步態運動學分析的一個重要指標。Winter 等[15]提出的身體節段法是質心測量的“金標準”,該方法首先將人體分為頭、軀干、上臂、前臂、手、骨盆、大腿、小腿、足等 15 個獨立的身體節段,本研究利用 Kinect 系統采集了該方法所定義的所有身體節段的近端坐標和遠端坐標,設置的節段如表 2 所示,表中的近端和遠端標記點與前文所述標記點位置一致。然后,利用采集到的標記點位置計算出每個節段的質心位置,定義一個身體節段質心位置的計算公式如式(1)所示:

![]() |
式中,xcm、ycm、zcm 為節段質心坐標;xp、yp、zp 是節段近端的坐標;xd、yd、zd 是節段遠端的坐標;lp 是從近端到末端的節段長度的百分比;ld 是從遠端到末端的節段長度的百分比,參數詳情如表 2 所示[16]。
最后,利用各節段質心位置來計算人體質心位置,其計算公式如式(2)所示:
![]() |
式中,xtcm、ytcm、ztcm 為人體質心的坐標;xi、yi 是第 i 段的坐標;mi 是第 i 段的質量;M 是 15 個身體節段的總質量。本文獲得的質心移動范圍(上下和左右方向)如圖 3 所示,在此基礎上,可計算出受試者質心移動范圍(上下和左右方向)的平均值。

1.2.2 時空特征提取
本文從 Kinect 系統捕獲的步行軌跡數據中提取出步幅、步速作為步態的時空特征。提取算法可歸納為以下幾個步驟:首先,對 Kinect 捕獲的標記點坐標數據進行預處理,去除標記點坐標的粗誤差;然后,計算標記點 15 和 16 的中心位置坐標來獲得左足底坐標;計算標記點 19 和 20 的中心位置坐標來獲得右足底坐標;接著利用單側足底坐標間的歐氏距離來計算平均步幅,如圖 4 所示;最后,測量所有受試者的腿長,即計算節段 13~15 和節段 17~19 之間的歐氏距離,用它們的均值對步幅進行標準化[17]。在獲得步幅特征后,由步速 = 步幅/步行周期,可計算出步速特征。

1.3 步態模式識別
假設從獲取的數據中得到了一個包含 m 個實例的數據集,即輸入空間:,每個實例由 d 個屬性描述:
,
;并定義了所有實例的標記的集合 Y,即輸出空間,其中
是實例 xi 的標簽。在此基礎上通過對訓練集
進行分類學習,可以建立一個從輸入空間 X 到輸出空間 Y 的映射(f:X→Y),當這個映射關系被應用到無標簽實例時,就可以根據該實例的屬性特征來預測該實例的標簽,即該實例屬于哪一類。貝葉斯決策論是在概率框架下實施決策的基本方法,對分類任務來說,該方法可根據已知概率和誤判損失,來為一個未知標簽的實例 x 選擇最優的類別標簽。本文的貝葉斯分類算法如下所示:
輸入:實例數據集 ,每個實例由 4 個屬性描述:xi =(質心左右偏移距離、質心上下偏移距離、步幅、步速);以及對應的標記
{偏癱患者組、健康老人組、健康青年組},k = 1,2,3;未知標簽的實例 x。
(1)計算先驗概率 P(yk)和條件概率 P(xi,d|yk),其計算公式如式(3)所示:
![]() |
式中,xi,d 為第 i 個實例在第 d 個屬性上的取值,,d = 1,2,3,4。
(2)對于給定的實例 x,計算其后驗概率。其計算公式如式(4)所示:
![]() |
式中,xd 為實例 x 在第 d 個屬性上的取值。
(3)確定實例 x 的標簽,其計算公式如式(5)所示:
![]() |
輸出:實例 x 的標簽 y,即實例 x 的類別。
1.4 特征重要性排序
隨機森林是一種以決策樹為基學習器的集成學習算法,它利用重采樣技術從原始樣本中隨機抽取數據構造多個樣本,然后對每個重采樣樣本采用節點的隨機分裂技術來構造多顆決策樹,最后將多棵決策樹組合,通過投票得出最終的預測結果。隨機森林算法可在訓練過程中輸出各變量的重要性排序。它的實現原理是,當訓練一棵決策樹時,可以計算出每個特征減少了多少樹的不純度,對于一個決策樹森林來說,可以算出每個特征平均減少了多少樹的不純度,并把它平均減少的不純度作為度量特征重要性的值。應用基尼指數計算不純度的算法如式(6)~式(8)所示:
屬性 a 的基尼指數如式(6)所示:
![]() |
式中,c 為樣本類別個數,pi 為屬性 a 屬于類別 cj 的概率。由此可得特征 f 的基尼指數,其計算公式如式(7)所示:
![]() |
式中,p 為屬性個數,ni 為屬性 ai 的樣本數。綜合 m 個訓練集,可得到特征 f 的重要性評分 S(i),其計算公式如式(8)所示:
![]() |
式中,fij 為第 j 個訓練集中第 i 維特征。
2 結果
2.1 貝葉斯分類結果
本文按 7∶3 的比例將樣本數據集分成訓練集和測試集,樣本數據集如表 3 所示,利用訓練集訓練了貝葉斯分類模型,然后用模型對測試樣本進行預測,從而對模型的分類準確性進行檢驗,準確率的計算公式如式(9)所示:

![]() |
式中的 yi 是實例的真實標簽,f(xi)是預測標簽,N 是實例數量,I 是指示函數,即當 yi = f(xi)時為 1,否則為 0。
利用全部特征進行訓練的貝葉斯分類模型有 96% 的分類準確率。基于不同特征組合訓練的模型的分類準確性如表 4 所示,可以看出其中有幾類包含了步速特征的分類模型具有較高準確率,可作為最佳的分類子特征;其中,步速與步幅(準確率 94%)、步速與質心左右偏移距離(準確率 92%)的組合是偏癱步態分析診斷的重要依據。各類之間的貝葉斯決策邊界如圖 5 所示,其中不同的背景色代表不同的決策界限,這些界限可以在臨床實踐中用于將來訪者劃分到合適類別,尤其是在診斷指標不足的情況下做出初步診斷。


2.2 特征重要性排序結果
本文構造了 10 000 棵決策樹,通過計算每個特征平均減少的樹的不純度,獲得了特征的相對重要性,如圖 6 所示,步速、步幅、質心左右偏移、質心上下偏移所占的比重分別為 34.2%、22.3%、22%、21.3%。因此臨床上對偏癱步態障礙進行診斷分析和康復評估時最先應該關注患者的步速,尤其值得注意的是步速與步幅、步速與質心左右偏移距離的組合是偏癱步態分析診斷的重要依據。

3 討論
越來越多的研究者開始關注 Kinect 在人體運動檢測和康復醫療領域的應用,但研究視角主要還是聚焦在研究數據的可靠性和準確性方面[18-19]。對于我國康復醫療的發展來說,這一新技術可以有效降低康復治療成本,提高康復行業的服務能力,但沒能改善康復醫師短缺的現狀。人工智能技術的飛速發展,為解決上述問題提供了新思路。因此,本文將 Kinect 骨骼跟蹤技術同貝葉斯分類算法相結合,提出了一種基于 Kinect 的偏癱步態識別方法。研究結果表明,基于貝葉斯分類算法的分類準確率為 96%。另外,針對本文采集的數據集,我們驗證了不同分類算法的分類效果,結果如表 5 所示。相比較而言,貝葉斯分類算法實現簡單、學習與預測效率高,分類準確率在同類算法中也最高。

本研究的不足之處是:只提取了步態的時空特征和運動學特征,并沒有提取動力學特征,因此后面的工作本課題組會圍繞動力學的原理提取步態特征,例如:提取地面反作用力參數等,以提高本文研究結果的精確性。此外本研究的樣本量不大,還可以根據更多的樣本和試驗來提高分類模型的準確性。
偏癱步態障礙患者常因股四頭肌痙攣導致膝關節屈曲困難、小腿三頭肌痙攣導致足下垂、脛后肌痙攣導致足內翻。這使得多數患者在擺動相時骨盆代償性抬高,髖關節外展外旋;在支撐相時往往采用膝過伸的姿態代償。另外,由于患肢的支撐力下降,患者一般會通過縮短患肢的支撐時間來代償,部分患者還會出現側身,健腿在前,患腿在后,患足在地面拖行等姿態行走,因此可以基于這些病理特征和行為表現構建更具體的特征工程,從而實現不同類型、不同損傷程度的步態障礙的自動識別。