為了準確評價腦卒中患者在日常康復訓練時的動作相似性,基于動態時間規整(DTW)算法構建了一個新的量化評定系統。該系統首先對原始加速度信號進行預處理;其次,依次計算加速度信號與四個動作的標準模板之間的相似性,從而識別出加速度信號所屬的動作類別;最后,根據識別出的動作類別結果,調用對應的映射模型,從而計算出該加速度信號所對應動作的量化評定結果。臨床試驗結果表明,不同動作間的 DTW 最短路徑長度 R 值存在較大差異,R 值作為動作分類的特征,識別準確率可達 91% 以上。此外,隨著康復進程的推進,R 值呈逐漸下降趨勢,即 R 值可以作為評價腦卒中患者完成指定動作質量的量化指標,應用于康復運動處方自動生成或情景交互游戲場景中,從而決定患者是否需要更改康復訓練計劃或者調整游戲中的難度等級,以便開展個體化的康復治療服務。
引用本文: 李墅娜, 郁磊. 基于動態時間規整算法的腦卒中量化評定研究. 生物醫學工程學雜志, 2018, 35(1): 139-144. doi: 10.7507/1001-5515.201611050 復制
引言
隨著生活水平的提高和人口老齡化,腦卒中的發病率呈上升趨勢。據統計,我國每年新增近 250 萬例腦卒中患者,其中約 21% 的腦卒中患者不能夠達到上肢功能的完全恢復[1-2]。功能評定是腦卒中康復治療中非常重要的一環,目前關于腦卒中運動功能評定的方法很多且特色各異,如 Brunnstrom 評定法、上田敏法、運動評定量表(Motor Assessment Scale,MAS)法和 Fugl-Meyer 評定量表等[3]。
然而,上述評定方法都依賴于醫生的徒手檢查和觀察,屬于人工評定,雖然在臨床上廣泛使用,但依然存在以下幾個問題:首先,評定結果容易受到康復醫師主觀因素的影響,不同評定者在不同時間的評定結果會有差異,康復評定的準確度也往往取決于康復醫師的經驗和水平;其次,評定項目繁多,費時費力,且需要康復醫師實時參與,這在居家康復或社區康復中往往是難以實現的;第三,量表分級較為粗大,且存在“天花板效應”,導致評定結果不能精確反映肢體運動的過程與細節,不利于生成個體化、專業化的康復治療方案。
近年來,隨著互聯網及物聯網技術的快速發展,可穿戴傳感器網絡技術已廣泛應用于醫療行業中[4-10],包括日常的健康信息監測系統(如計步器、卡路里消耗、睡眠監測等)、面向特定人群的監護系統(如老人跌倒報警系統、兒童防丟報警系統、異常心電報警系統等)。然而,在腦卒中患者肢體運動功能量化評定研究方面,公開報道的研究甚少。復旦大學的廖夢佳等[11]基于多傳感器融合技術,設計了一個面向腦卒中患者的上肢動作識別系統,識別準確率可達 97.99%,遺憾的是,該研究并未做細致的量化分析,從嚴格意義上講,尚不能稱之為“量化評定”研究。
筆者所在課題組在該方面做了深入的研究,如王景麗等[12]利用遺傳算法和極限學習機等工具建立了加速度傳感器信號與 Fugl-Meyer 評定量表間的映射模型,構建了一個基于加速度傳感器的智能自動評估系統。然而,該模型需要先分別為 4 個動作(肩關節前屈、肩關節外展、前臂旋前旋后、手觸腰椎)建立子映射模型。換句話說,即需要先將患者的加速度傳感器數據離線分為四類,分別對應 4 個不同的動作,從而限制了系統的應用。另外,在康復運動處方自動生成或情景交互游戲等應用場景中,通常需要一個能夠準確評價患者完成指定動作(任務)質量的量化指標,從而決定患者是否需要更改康復訓練計劃或者調整游戲中的難度等級。為此,本文基于動態時間規整(dynamic time warping,DTW)算法提出了一個新的量化評定系統,可以在線、個體化地進行量化評定分析。
1 基于動態時間規整算法的量化評定系統
1.1 系統概述
如圖 1 所示,量化評定系統由三部分組成:預處理、相似性度量和映射模型建立。首先,由于加速度傳感器原始信號中常常含有一些噪聲,因此,需要對原始信號進行預處理,考慮到人體的運動頻率一般介于 0.5~20 Hz 之間,因此這里對加速度信號進行了帶通濾波處理,即將頻率高于 20 Hz 以及低于 0.5 Hz 的成分濾除,從而保證加速度信號中不包含與患者真實運動無關的噪聲信息;其次,依次計算加速度信號與四個動作的標準模板信號(健康人完成動作所記錄下的加速度信號)之間的相似性,從而識別出加速度信號所屬的動作類別;最后,根據識別出的動作類別結果,調用對應的映射模型,從而計算出該加速度信號所對應動作的量化評定結果。

1.2 動態時間規整算法
目前,常用的時間序列相似性度量方法主要有:歐式距離法和相關系數法,然而上述方法僅適用于等長的時間序列,且對序列在時間軸上的偏移敏感。在本文中,由于腦卒中患者在日常的康復訓練中經常出現動作快慢不一的現象,導致信號長度不一致,且動作趨勢存在偏移問題,給相似性度量造成一定的困難。
DTW 算法是一種通過計算最小代價的時間彎曲路徑來對時間序列的形態進行匹配映射的相似性度量方法,它最早被應用于語音信號的處理。下面簡要概述 DTW 算法的基本原理[13]:
如圖 2 所示,假設有兩個長度分別為 m 和 n 的時間序列
和
。距離矩陣
由 X 和 Y 的歐式距離的平方構成,即:
![]() |
在距離矩陣
中尋找一條路徑
使得 X 和 Y 的相似性最高,即將 X 和 Y 進行延伸和縮短后,兩個時間序列的距離最短。
考慮到路徑 W 中的元素需要滿足邊界約束、單調性和連續性約束等條件,因此,可以通過動態規劃方法進行最優路徑的求解。定義累積矩陣
來記錄最短路徑,即:
![]() |

2 實驗方案
2.1 實驗對象征集
本文中所有實驗均在蘇州大學附屬第一醫院康復科完成,共征集了 20 名腦卒中患者參與本項研究。實驗對象的納入標準為:① 臨床診斷符合 1995 年中華醫學會第四次全國腦血管會議制定的腦卒中的診斷標準,并經頭顱計算機斷層成像(computed tomography,CT)或磁共振成像(magnetic resonance imaging,MRI)確診;② 發病時間為 3~12 個月,偏癱側上肢有自主運動能力。排除標準為:① 有認知障礙,無法配合者;② 伴有上肢或軀干疼痛并影響主動運動者。該實驗獲得蘇州大學附屬第一醫院倫理委員會的許可。患者的基本資料如表 1 所示。
其中,UE-FMA 得分為 Fugl-Meyer 評定量表中上肢部分項目的得分。共包含 33 個小項目,每個小項目分三級,分別為 0 分、1 分和 2 分,滿分為 66 分。

2.2 實驗方案與數據采集
本文中的實驗方案與文獻[12]中的實驗方案一致,即分別采集肩肘部分的 4 個動作(肩關節前屈、肩關節外展、前臂旋前旋后、手觸腰椎)的加速度傳感器數據。實驗中所用的加速度傳感器模塊由筆者所在課題組自主研制,采樣率為 40 Hz。數據采集前,先將兩個加速度傳感器分別佩戴在患者偏癱側的前臂和上臂,如圖 3 所示。其中,為了保證數據的一致性,要求前臂的加速度傳感器放置于背側腕橫紋中央上 10 cm 處,上臂的加速度傳感器放置于肱骨外上髁上 8 cm 處。實驗正式開始前,每個動作由康復醫師示范 1~2 次,待患者熟悉后開始正式采集,每個動作根據患者身體情況重復 8~10 次。

3 結果分析與討論
3.1 不同動作間的相似性度量結果分析
為了驗證 DTW 算法對不同動作間的相似性度量的可行性,需要對比四個不同動作間的相似性度量結果。同時,為了避免康復進程對結果的影響,首先僅討論同一名患者在做四個不同動作時的情況。某名患者的分析結果分別如圖 4 中四幅小圖所示。其中,圖 4a 為連續兩次動作 1(肩關節前屈)之間的相似性度量結果;圖 4b-d 分別為動作 1(肩關節前屈)與動作 2(肩關節外展)、動作 3(前臂旋前旋后)和動作 4(手觸腰椎)之間的相似性度量結果。圖中的 R 值即為尋找到的最短路徑,R 值越小,表明相似性越高。從圖中可以看出,相同動作之間的相似性最高;動作 1 與動作 4 之間的相似性最低。

a. 動作 1 與動作 1 之間;b. 動作 1 與動作 2 之間;c. 動作 1 與動作 3 之間;d. 動作 1 與動作 4 之間
Figure4. The optimal path of DTW algorithm between four different tasksa. between task 1 and task 1; b. between task 1 and task 2; c. between task 1 and task 3; d. between task 1 and task 4
由于篇幅限制,本文僅給出動作 1 與其他三個動作之間的 DTW 最優路徑圖,各個動作之間的 R 值統計結果如表 2 所示。從表中可以看出,除了動作 1(肩關節前屈)與動作 2(肩關節外展)之間的相似性較高外,其余幾個動作之間的差異均較大,這是因為動作 1 和動作 2 均為肩部動作,而動作 3 為前臂腕部動作,動作 4 為肩、肘和腕的聯合動作。



另外,從表中可以看出,相同動作間的 R 值與不同動作間的 R 值差別較大,因此,如前文圖 1 中所述,在實際應用中,可以將實時采集的加速度信號分別與四個動作的模板信號進行相似性度量,取最小 R 值對應的模板動作標記實時采集信號的類別。本實驗中共采集了 572 個動作信號,利用 R 值進行動作識別的混淆矩陣如表 3 所列。從表中可以看出,總體的識別正確率達到 91.43%。

3.2 康復進程對相似性度量結果的影響
如 3.1 節所述,康復進程會對相似性度量結果造成影響,因此接下來將對該因素進行深入分析與討論。我們跟蹤觀察了 5 名患者(在實際實驗過程中,在事先征求患者本人及家屬的配合意愿的前提下,20 名患者中僅有 5 名患者愿意接受為期 3 個月的跟蹤觀察)在 3 個月內每周一次的動作 1(肩關節前屈)與模板間的相似性度量結果,并且每個月對其進行一次 UE-FMA 臨床評定,對應的結果如圖 5 和表 4 所示。從中可以看出,隨著康復進程的推進,5 名患者的 UE-FMA 得分逐漸增加或保持,對應的 R 值呈逐漸下降趨勢,即意味著患者的動作與模板間的相似性愈來愈高,表明患者的動作完成情況越來越好。
因此,上述結論可以應用于康復運動處方自動生成或情景交互游戲場景中,即可以利用 DTW 算法計算出的 R 值評價腦卒中患者完成指定動作(任務)的質量,從而決定患者是否需要更改康復訓練計劃或者調整游戲中的難度等級,以便開展個體化的康復治療服務。
3.3 結果討論
當利用加速度傳感器對腦卒中患者的肢體運動功能進行量化評定時,通常需要為不同的訓練動作建立對應的量化分析模型。換句話說,需要完成兩個任務:① 定性分析:自動識別不同的動作;② 定量分析:針對每個動作建模。在以往的研究中,上述兩個任務通常相互獨立,定性分析階段提取的特征未必適用于定量分析階段,反之亦然。與之相比,本文所提出的利用 DTW 算法得出的度量方法,可以有效地將定性和定量分析結合在一起。具體而言,利用 R 值可以實現:① 不同動作間的識別,可以準確區分不同的動作類別;② 相同動作間的相似性度量,可以有效衡量腦卒中患者完成動作與健康人完成動作之間的相似性。

P1~P5 分別代表 5 名患者
Figure5. The influence of rehabilitation process on similarity measurement resultsP1 to P5 represents five stroke patient, respectively

4 結語
為了準確評價腦卒中患者在日常康復訓練時的動作相似性,本文基于 DTW 算法構建了一個新的量化評定系統。臨床試驗結果表明,不同動作間的 DTW 最短路徑長度 R 值存在較大差異,R 值作為動作分類的特征,識別準確率可達 91% 以上。此外,隨著康復進程的推進,R 值呈逐漸下降趨勢,即 R 值可以作為評價腦卒中患者完成指定動作質量的量化指標,應用于康復運動處方自動生成或情景交互游戲場景中,從而決定患者是否需要更改訓練計劃或者調整游戲難度等級,以便開展個體化的康復治療服務。
引言
隨著生活水平的提高和人口老齡化,腦卒中的發病率呈上升趨勢。據統計,我國每年新增近 250 萬例腦卒中患者,其中約 21% 的腦卒中患者不能夠達到上肢功能的完全恢復[1-2]。功能評定是腦卒中康復治療中非常重要的一環,目前關于腦卒中運動功能評定的方法很多且特色各異,如 Brunnstrom 評定法、上田敏法、運動評定量表(Motor Assessment Scale,MAS)法和 Fugl-Meyer 評定量表等[3]。
然而,上述評定方法都依賴于醫生的徒手檢查和觀察,屬于人工評定,雖然在臨床上廣泛使用,但依然存在以下幾個問題:首先,評定結果容易受到康復醫師主觀因素的影響,不同評定者在不同時間的評定結果會有差異,康復評定的準確度也往往取決于康復醫師的經驗和水平;其次,評定項目繁多,費時費力,且需要康復醫師實時參與,這在居家康復或社區康復中往往是難以實現的;第三,量表分級較為粗大,且存在“天花板效應”,導致評定結果不能精確反映肢體運動的過程與細節,不利于生成個體化、專業化的康復治療方案。
近年來,隨著互聯網及物聯網技術的快速發展,可穿戴傳感器網絡技術已廣泛應用于醫療行業中[4-10],包括日常的健康信息監測系統(如計步器、卡路里消耗、睡眠監測等)、面向特定人群的監護系統(如老人跌倒報警系統、兒童防丟報警系統、異常心電報警系統等)。然而,在腦卒中患者肢體運動功能量化評定研究方面,公開報道的研究甚少。復旦大學的廖夢佳等[11]基于多傳感器融合技術,設計了一個面向腦卒中患者的上肢動作識別系統,識別準確率可達 97.99%,遺憾的是,該研究并未做細致的量化分析,從嚴格意義上講,尚不能稱之為“量化評定”研究。
筆者所在課題組在該方面做了深入的研究,如王景麗等[12]利用遺傳算法和極限學習機等工具建立了加速度傳感器信號與 Fugl-Meyer 評定量表間的映射模型,構建了一個基于加速度傳感器的智能自動評估系統。然而,該模型需要先分別為 4 個動作(肩關節前屈、肩關節外展、前臂旋前旋后、手觸腰椎)建立子映射模型。換句話說,即需要先將患者的加速度傳感器數據離線分為四類,分別對應 4 個不同的動作,從而限制了系統的應用。另外,在康復運動處方自動生成或情景交互游戲等應用場景中,通常需要一個能夠準確評價患者完成指定動作(任務)質量的量化指標,從而決定患者是否需要更改康復訓練計劃或者調整游戲中的難度等級。為此,本文基于動態時間規整(dynamic time warping,DTW)算法提出了一個新的量化評定系統,可以在線、個體化地進行量化評定分析。
1 基于動態時間規整算法的量化評定系統
1.1 系統概述
如圖 1 所示,量化評定系統由三部分組成:預處理、相似性度量和映射模型建立。首先,由于加速度傳感器原始信號中常常含有一些噪聲,因此,需要對原始信號進行預處理,考慮到人體的運動頻率一般介于 0.5~20 Hz 之間,因此這里對加速度信號進行了帶通濾波處理,即將頻率高于 20 Hz 以及低于 0.5 Hz 的成分濾除,從而保證加速度信號中不包含與患者真實運動無關的噪聲信息;其次,依次計算加速度信號與四個動作的標準模板信號(健康人完成動作所記錄下的加速度信號)之間的相似性,從而識別出加速度信號所屬的動作類別;最后,根據識別出的動作類別結果,調用對應的映射模型,從而計算出該加速度信號所對應動作的量化評定結果。

1.2 動態時間規整算法
目前,常用的時間序列相似性度量方法主要有:歐式距離法和相關系數法,然而上述方法僅適用于等長的時間序列,且對序列在時間軸上的偏移敏感。在本文中,由于腦卒中患者在日常的康復訓練中經常出現動作快慢不一的現象,導致信號長度不一致,且動作趨勢存在偏移問題,給相似性度量造成一定的困難。
DTW 算法是一種通過計算最小代價的時間彎曲路徑來對時間序列的形態進行匹配映射的相似性度量方法,它最早被應用于語音信號的處理。下面簡要概述 DTW 算法的基本原理[13]:
如圖 2 所示,假設有兩個長度分別為 m 和 n 的時間序列
和
。距離矩陣
由 X 和 Y 的歐式距離的平方構成,即:
![]() |
在距離矩陣
中尋找一條路徑
使得 X 和 Y 的相似性最高,即將 X 和 Y 進行延伸和縮短后,兩個時間序列的距離最短。
考慮到路徑 W 中的元素需要滿足邊界約束、單調性和連續性約束等條件,因此,可以通過動態規劃方法進行最優路徑的求解。定義累積矩陣
來記錄最短路徑,即:
![]() |

2 實驗方案
2.1 實驗對象征集
本文中所有實驗均在蘇州大學附屬第一醫院康復科完成,共征集了 20 名腦卒中患者參與本項研究。實驗對象的納入標準為:① 臨床診斷符合 1995 年中華醫學會第四次全國腦血管會議制定的腦卒中的診斷標準,并經頭顱計算機斷層成像(computed tomography,CT)或磁共振成像(magnetic resonance imaging,MRI)確診;② 發病時間為 3~12 個月,偏癱側上肢有自主運動能力。排除標準為:① 有認知障礙,無法配合者;② 伴有上肢或軀干疼痛并影響主動運動者。該實驗獲得蘇州大學附屬第一醫院倫理委員會的許可。患者的基本資料如表 1 所示。
其中,UE-FMA 得分為 Fugl-Meyer 評定量表中上肢部分項目的得分。共包含 33 個小項目,每個小項目分三級,分別為 0 分、1 分和 2 分,滿分為 66 分。

2.2 實驗方案與數據采集
本文中的實驗方案與文獻[12]中的實驗方案一致,即分別采集肩肘部分的 4 個動作(肩關節前屈、肩關節外展、前臂旋前旋后、手觸腰椎)的加速度傳感器數據。實驗中所用的加速度傳感器模塊由筆者所在課題組自主研制,采樣率為 40 Hz。數據采集前,先將兩個加速度傳感器分別佩戴在患者偏癱側的前臂和上臂,如圖 3 所示。其中,為了保證數據的一致性,要求前臂的加速度傳感器放置于背側腕橫紋中央上 10 cm 處,上臂的加速度傳感器放置于肱骨外上髁上 8 cm 處。實驗正式開始前,每個動作由康復醫師示范 1~2 次,待患者熟悉后開始正式采集,每個動作根據患者身體情況重復 8~10 次。

3 結果分析與討論
3.1 不同動作間的相似性度量結果分析
為了驗證 DTW 算法對不同動作間的相似性度量的可行性,需要對比四個不同動作間的相似性度量結果。同時,為了避免康復進程對結果的影響,首先僅討論同一名患者在做四個不同動作時的情況。某名患者的分析結果分別如圖 4 中四幅小圖所示。其中,圖 4a 為連續兩次動作 1(肩關節前屈)之間的相似性度量結果;圖 4b-d 分別為動作 1(肩關節前屈)與動作 2(肩關節外展)、動作 3(前臂旋前旋后)和動作 4(手觸腰椎)之間的相似性度量結果。圖中的 R 值即為尋找到的最短路徑,R 值越小,表明相似性越高。從圖中可以看出,相同動作之間的相似性最高;動作 1 與動作 4 之間的相似性最低。

a. 動作 1 與動作 1 之間;b. 動作 1 與動作 2 之間;c. 動作 1 與動作 3 之間;d. 動作 1 與動作 4 之間
Figure4. The optimal path of DTW algorithm between four different tasksa. between task 1 and task 1; b. between task 1 and task 2; c. between task 1 and task 3; d. between task 1 and task 4
由于篇幅限制,本文僅給出動作 1 與其他三個動作之間的 DTW 最優路徑圖,各個動作之間的 R 值統計結果如表 2 所示。從表中可以看出,除了動作 1(肩關節前屈)與動作 2(肩關節外展)之間的相似性較高外,其余幾個動作之間的差異均較大,這是因為動作 1 和動作 2 均為肩部動作,而動作 3 為前臂腕部動作,動作 4 為肩、肘和腕的聯合動作。



另外,從表中可以看出,相同動作間的 R 值與不同動作間的 R 值差別較大,因此,如前文圖 1 中所述,在實際應用中,可以將實時采集的加速度信號分別與四個動作的模板信號進行相似性度量,取最小 R 值對應的模板動作標記實時采集信號的類別。本實驗中共采集了 572 個動作信號,利用 R 值進行動作識別的混淆矩陣如表 3 所列。從表中可以看出,總體的識別正確率達到 91.43%。

3.2 康復進程對相似性度量結果的影響
如 3.1 節所述,康復進程會對相似性度量結果造成影響,因此接下來將對該因素進行深入分析與討論。我們跟蹤觀察了 5 名患者(在實際實驗過程中,在事先征求患者本人及家屬的配合意愿的前提下,20 名患者中僅有 5 名患者愿意接受為期 3 個月的跟蹤觀察)在 3 個月內每周一次的動作 1(肩關節前屈)與模板間的相似性度量結果,并且每個月對其進行一次 UE-FMA 臨床評定,對應的結果如圖 5 和表 4 所示。從中可以看出,隨著康復進程的推進,5 名患者的 UE-FMA 得分逐漸增加或保持,對應的 R 值呈逐漸下降趨勢,即意味著患者的動作與模板間的相似性愈來愈高,表明患者的動作完成情況越來越好。
因此,上述結論可以應用于康復運動處方自動生成或情景交互游戲場景中,即可以利用 DTW 算法計算出的 R 值評價腦卒中患者完成指定動作(任務)的質量,從而決定患者是否需要更改康復訓練計劃或者調整游戲中的難度等級,以便開展個體化的康復治療服務。
3.3 結果討論
當利用加速度傳感器對腦卒中患者的肢體運動功能進行量化評定時,通常需要為不同的訓練動作建立對應的量化分析模型。換句話說,需要完成兩個任務:① 定性分析:自動識別不同的動作;② 定量分析:針對每個動作建模。在以往的研究中,上述兩個任務通常相互獨立,定性分析階段提取的特征未必適用于定量分析階段,反之亦然。與之相比,本文所提出的利用 DTW 算法得出的度量方法,可以有效地將定性和定量分析結合在一起。具體而言,利用 R 值可以實現:① 不同動作間的識別,可以準確區分不同的動作類別;② 相同動作間的相似性度量,可以有效衡量腦卒中患者完成動作與健康人完成動作之間的相似性。

P1~P5 分別代表 5 名患者
Figure5. The influence of rehabilitation process on similarity measurement resultsP1 to P5 represents five stroke patient, respectively

4 結語
為了準確評價腦卒中患者在日常康復訓練時的動作相似性,本文基于 DTW 算法構建了一個新的量化評定系統。臨床試驗結果表明,不同動作間的 DTW 最短路徑長度 R 值存在較大差異,R 值作為動作分類的特征,識別準確率可達 91% 以上。此外,隨著康復進程的推進,R 值呈逐漸下降趨勢,即 R 值可以作為評價腦卒中患者完成指定動作質量的量化指標,應用于康復運動處方自動生成或情景交互游戲場景中,從而決定患者是否需要更改訓練計劃或者調整游戲難度等級,以便開展個體化的康復治療服務。