重癥監護室中急性低血壓發生的預測研究是臨床醫學的重點與難點。本文應用非線性混沌分析方法, 對MIMICⅡ臨床記錄中患者的平均動脈壓時間序列信號進行分析, 構建患者的李雅普諾夫指數變化曲線。研究發現患者在急性低血壓癥狀發生前一般會出現明顯的指數曲線突變情況, 這為急性低血壓的有效預測提供了直觀的依據, 為急性低血壓的理論研究與應用提供了一條可參考的思路。
引用本文: 姜大志, 李立宇, 彭晨楓. 基于非線性混沌分析的急性低血壓預測. 生物醫學工程學雜志, 2015, 32(1): 209-213. doi: 10.7507/1001-5515.20150038 復制
引言
在醫院重癥監護室(intensive care unit,ICU)中,急性低血壓(acute hypotensive episode,AHE)發生的預測研究已引起了廣泛的重視,并逐漸成為國際上的一個熱點問題[1]。AHE指:在1 h的預測窗口中,患者在任何30 min或以上的時間內,至少有90%的每分鐘平均動脈血壓(arterial blood pressure,ABP)等于或者小于60 mm Hg[1]。AHE發生后需要及時、有效的干預,如果不做任何處理,可引起昏厥或休克,導致患者的不可逆性器官損傷,甚至死亡。據美國復雜生理信號研究資源PhysioNet的MIMICⅡ(the Multi-Parameter Intelligent Monitoring for Intensive CareⅡ)數據庫顯示,2008年12月共記錄了2 320例患者的資料,有動脈血壓信號的為1 237例,其中511例患者發生過AHE,這511例患者的死亡率是12月份所有患者(2 320例)死亡率的2倍。因此,如果能通過ICU所監測的數據來預測患者在未來的一段時間內是否會發生AHE,實現AHE發生的提前預測與干預,爭取寶貴的搶救時間,具有重要的臨床意義。
AHE預測的經典方法有統計學方法、最近鄰算法、神經網絡算法、支持向量機、小波變換等。在國外,Crespo等[2]提出利用患者ABP波形的各種統計量,如均值、方差、中位數等來進行分析;Fournier等[3]提取平均動脈血壓(mean artery pressure,MAP)用最近鄰算法來匹配訓練集進而進行預測;Henriques等[4]提出利用多個神經網絡分析1小時預測窗口中的MAP波形值。在國內,華南理工大學的團隊做了大量研究工作[5-7],取得了不錯的結果。
混沌技術是一種應用極其廣泛的非線性系統分析方法[8-9]。MIMICⅡ數據庫中ICU患者的MAP數據是一個典型的時間序列數據,經過分析發現該時間序列具有明顯的混沌特性,這啟發我們用非線性混沌的分析方法對其進行測算與處理。在計算MAP序列的嵌入維數、時延和平均周期等關鍵參數后,刻畫出混沌時間序列的李雅普諾夫指數,通過分析該指數曲線的變化規律來預測AHE的發生。
1 實驗數據獲取
從MIMICⅡ上獲得的數據以一個患者為單位,一部分患者的數據為采樣頻率為125 Hz的ABP值序列。本文用到的是MAP數據,所以需要將ABP數據轉換為MAP數據。從醫學角度看,MAP與ABP數據同一周期內的收縮壓(systolic blood pressure,SBP)和舒張壓(diastolic blood pressure,DBP)相關,通常MAP值等于(收縮壓×1+舒張壓×2)/3。另一部分患者的數據則是采樣頻率為1 Hz的MAP值序列。此外,為每個患者的MAP數據規定一個預測起始點T0,即預測在T0點之后的1 h內患者是否發生AHE,示例見圖 1。圖 1(a)中患者a40050在T0后發生AHE,圖 1(b)中患者a40282在T0后未發生AHE。

(a)患者a40050的
(a) patient a40050 (2 h before
2 非線性混沌分析
2.1 相空間重構
相空間重構是混沌時間序列分析的前提,一般可采用延遲坐標法對混沌時間序列x={xi|i=1, 2, …, N}進行有效的相空間重構X={Xi|Xi=[xi, xi+t, …, xi+(m-1)t]T, i=1, 2, …, M},式中m為嵌入維,t為時延,M=N-(m-1)t為相空間中的點數。假如嵌入維數m≥2d+1,d為系統動力學維數,那么認為重構的系統與原系統在拓撲意義上等價。然而由于d未知,而且實際上供實驗研究的時間序列一般有限長,此外還存在噪聲干擾,因此時延t不可任意取值。自然地,選擇合適的時延t和嵌入維m成為相空間重構的關鍵。本文采用C-C方法求重構相空間的嵌入維數和時間延遲[10],該方法使用關聯積分同時估計時延和嵌入維。對于X,嵌入時間序列的關聯積分可定義為:
$ \begin{align} & C\left(m, N, r, t \right)=\frac{2}{M\left(M-1 \right)}\sum\limits_{1\le i\le j\le M}{H\left(r-\left\| {{x}_{i}}-{{x}_{j}} \right\| \right)}, \\ & r > 0 \\ \end{align} $ |
其統計量S(m, N, r, t)=C(m, N, r, t)-Cm(1, N, r, t)可用來表示非線性時間序列的相關性。S(m, N, r, t)可以用來確定t和m。其中H(r)=,為簡單階躍函數。
2.2 混沌時間序列的平均周期
混沌時間序列的平均周期P的正確與否直接影響著混沌分析的效果,也就是李雅普諾夫指數的計算結果。不恰當的P甚至會對混沌時間序列造成錯誤判斷。為了避免參考點和其最鄰近點不在同一條軌道上,應采用限制短暫分離策略,即參考點與其最鄰近點的間隔大于序列的平均周期。混沌時間序列的平均周期可以通過快速傅里葉變換(fast Fourier transform, FFT)求得。FFT可將基于時域的時間序列通過變換轉換到頻域,依據序列的頻域信息可以計算原有序列的平均周期Tm[11]。
對時間序列 x={xi|i=1, 2, …, N}進行FFT后,得到:
$ F\left(k \right)=\sum\limits_{n=1}^{N}{{{x}_{n}}{{\text{e}}^{-j2\pi \left(k-1 \right)\frac{n-1}{N}}}} $ |
FFT中所用的頻率可表示為fn=
, n=1, 2, …, N,然后計算能量光譜的平均頻率:
$ {{f}_{mn}}=\frac{\sum\limits_{n=1}^{N}{{{f}_{n}}}}{N}=\frac{2\pi \sum\limits_{n=1}^{N}{\left(n-1 \right)}}{{{N}^{2}}} $ |
利用fnm的倒數可對時間序列的平均周期Tm進行大致估計,計算公式為:
$ {{T}_{m1}}=\frac{1}{{{f}_{mn}}}=\frac{{{N}_{2}}}{2\pi \sum\limits_{n=1}^{N}{\left(n-1 \right)}}=\frac{N}{\left(N-1 \right)\pi } $ |
2.3 李雅普諾夫指數曲線
李雅普諾夫指數是刻畫系統混沌性的一個有效指標,它定量地描述在主導相空間方向上系統對初始條件的敏感依賴性。一般認為,混沌系統至少含有一個正的李雅普諾夫指數,此外指數越大,表明混沌性越強。混沌時間序列是數據流的一種,研究時間序列的數據流中,基于滑動窗口的數據流采樣技術應用非常廣泛。我們利用滑動窗口技術,在一個時間窗內計算該有效時間序列的李雅普諾夫指數,然后通過窗口的滑動來最終構建李雅普諾夫指數變化曲線。顯然問題的核心是計算李雅普諾夫指數。本文采用小數據量法,該方法運算速度快,易于實現,對嵌入維、時間延遲以及數據量的規模均表現出比較強的魯棒性。小數據量法的具體計算步驟如下所示[12]:
Input:嵌入維數m、時延t、平均周期P。
Step1:根據m和t重構相空間X={Xi|i=1, 2, …, M};找相空間中每個點Xi的最鄰近點X′ i并限制短暫分離,即:di(0)=min‖Xi-Xi′‖|i-i′|>P;
Step2:對相空間中每個點Xi,計算出該鄰點的j個離散時間步后的距離di(j):
$ {{d}_{i}}\left(j \right)=\min \left\| {{X}_{i+j}}-{{X}_{{{i}^{'}}+j}} \right\|, j=1, 2, \cdots, \min \left(M-i, M={{i}^{'}} \right) $ |
Step3:對每個j,求出所有i的lndi(j)平均y(j),即:y(j)= lndi(j),其中q是非零di(j)的數目,Δt為觀測序列的采樣間隔或步長。
Output:李雅普諾夫指數。
3 實驗與結果
3.1 數據預處理
2009年Physionet網站公布的AHE預測數據,包含60條訓練數據和50條測試數據,但是該ABP數據存在較大的數據缺失。對于缺失值采用兩種策略進行處理:當缺失值的數量大于數據總量的10%時,則認定這個數據質量差而剔除不用;對于缺失值較少的數據則使用屬性的平均值來代替。此外對于數據集合中的噪音數據,將血壓值小于等于零和大于或等于250 mm Hg都定義為噪聲,并使用樣條插值函數擬合數據來光滑數據。經過數據預處理后選取訓練數據集中的48條可用數據和測試數據集中37條可用數據,共85條數據。對于訓練集數據,每一條選擇T0前后各1 h數據用于計算李雅普諾夫指數曲線。對于測試集數據,由于只提供了T0前2 h的ABP數據,所以選取T0前2 h的數據。
3.2 實驗及結果分析
本實驗首先隨機選取訓練集中20條數據,利用C-C方法求AHE時間序列的重構相空間的嵌入維數和時間延遲,然后計算20條數據運行后結果的均值并取整,得到嵌入維數m為10,時間延遲t為40。采用同樣的手段,利用FFT求得時間序列的平均周期P為122。本實驗利用基于固定長度的滑動窗口來對AHE混沌序列進行分段處理,設定時間滑動窗口w=3 000,滑動位移s=1 000,點與點之間的時間間隔是0.008 s,因此在李雅普諾夫指數曲線圖中的步長為8 s。最后,利用上述參數,求解混沌時間序列的李雅普諾夫指數曲線。訓練數據集中,典型的AHE和非AHE的李雅普諾夫指數曲線如圖 2所示。

(a)非AHE患者a40282;(b)AHE患者a40493
Figure2. Curves of Lyapunov exponent(a) patient a40282 without AHE; (b) patient a40493 with AHE
圖 2(a)是一例未發生AHE樣本的李雅普諾夫指數曲線,曲線變化趨勢較為平緩,是一種典型的未發生AHE的李雅普諾夫指數曲線。圖 2(b)是發生AHE樣本的李雅普諾夫指數曲線,該圖中長方體標識中尖銳突起部分(指數值達到1.5左右)稱之為曲線突變。經過實驗發現,如果患者的李雅普諾夫指數曲線出現突變,則一般表示該患者在未來不久的某個時刻有可能出現AHE癥狀。
此外,經過實驗發現,發生AHE患者在T0時刻之前并不一定只出現一次突變,圖 3就是一例出現多次突變的極端患者的李雅普諾夫指數變化曲線(見圖 3中長方體標識部分)。

85條數據的預測結果如表 1所示。對于非AHE數據,一般不應該出現指數曲線突變,而對AHE數據,將會出現突變。依據這個規則,本文提出的方法獲得較好的辨識效果,預測準確率達到77.65%,靈敏度為71.05%,特異性為82.98%,這在臨床上具有一定的指導意義。

4 結論
本文主要對AHE的診斷預測進行研究,對于患者的MAP時間序列信號,應用非線性混沌分析的方法做出探討,結合相空間重構、FFT、小數據量法和移動時間窗口技術構建患者的李雅普諾夫指數曲線,通過曲線中的突變情況來構建AHE發生的預測指標,具有一定可參考的作用。
下一步的工作主要體現在三個方面:其一,本文的方法雖然有指導意義,但準確率還不是很高,究其原因還是數據的問題,由于樣本集中數據的采樣頻率不一致,這給突變的辨識帶來了干擾。因此,下一步工作需要結合相關領域專家知識在MIMICⅡ數據中收集并構建高質量的大數據集。其二,與特征提取方法相結合,提取患者李雅普諾夫指數曲線的相關特征,然后與一些經典、高效的分類方法相結合,如神經網絡、支持向量機等,建立分類預測模型,提升預測效率。其三,考慮MIMICⅡ中其它的監護參數,如心率和血氧飽和度等。根據臨床經驗,這些生命體征參數的變化與AHE的發生有密切的聯系,下一步的工作將把這些因素與李雅普諾夫指數曲線的相關因素整合起來進行預測研究。
引言
在醫院重癥監護室(intensive care unit,ICU)中,急性低血壓(acute hypotensive episode,AHE)發生的預測研究已引起了廣泛的重視,并逐漸成為國際上的一個熱點問題[1]。AHE指:在1 h的預測窗口中,患者在任何30 min或以上的時間內,至少有90%的每分鐘平均動脈血壓(arterial blood pressure,ABP)等于或者小于60 mm Hg[1]。AHE發生后需要及時、有效的干預,如果不做任何處理,可引起昏厥或休克,導致患者的不可逆性器官損傷,甚至死亡。據美國復雜生理信號研究資源PhysioNet的MIMICⅡ(the Multi-Parameter Intelligent Monitoring for Intensive CareⅡ)數據庫顯示,2008年12月共記錄了2 320例患者的資料,有動脈血壓信號的為1 237例,其中511例患者發生過AHE,這511例患者的死亡率是12月份所有患者(2 320例)死亡率的2倍。因此,如果能通過ICU所監測的數據來預測患者在未來的一段時間內是否會發生AHE,實現AHE發生的提前預測與干預,爭取寶貴的搶救時間,具有重要的臨床意義。
AHE預測的經典方法有統計學方法、最近鄰算法、神經網絡算法、支持向量機、小波變換等。在國外,Crespo等[2]提出利用患者ABP波形的各種統計量,如均值、方差、中位數等來進行分析;Fournier等[3]提取平均動脈血壓(mean artery pressure,MAP)用最近鄰算法來匹配訓練集進而進行預測;Henriques等[4]提出利用多個神經網絡分析1小時預測窗口中的MAP波形值。在國內,華南理工大學的團隊做了大量研究工作[5-7],取得了不錯的結果。
混沌技術是一種應用極其廣泛的非線性系統分析方法[8-9]。MIMICⅡ數據庫中ICU患者的MAP數據是一個典型的時間序列數據,經過分析發現該時間序列具有明顯的混沌特性,這啟發我們用非線性混沌的分析方法對其進行測算與處理。在計算MAP序列的嵌入維數、時延和平均周期等關鍵參數后,刻畫出混沌時間序列的李雅普諾夫指數,通過分析該指數曲線的變化規律來預測AHE的發生。
1 實驗數據獲取
從MIMICⅡ上獲得的數據以一個患者為單位,一部分患者的數據為采樣頻率為125 Hz的ABP值序列。本文用到的是MAP數據,所以需要將ABP數據轉換為MAP數據。從醫學角度看,MAP與ABP數據同一周期內的收縮壓(systolic blood pressure,SBP)和舒張壓(diastolic blood pressure,DBP)相關,通常MAP值等于(收縮壓×1+舒張壓×2)/3。另一部分患者的數據則是采樣頻率為1 Hz的MAP值序列。此外,為每個患者的MAP數據規定一個預測起始點T0,即預測在T0點之后的1 h內患者是否發生AHE,示例見圖 1。圖 1(a)中患者a40050在T0后發生AHE,圖 1(b)中患者a40282在T0后未發生AHE。

(a)患者a40050的
(a) patient a40050 (2 h before
2 非線性混沌分析
2.1 相空間重構
相空間重構是混沌時間序列分析的前提,一般可采用延遲坐標法對混沌時間序列x={xi|i=1, 2, …, N}進行有效的相空間重構X={Xi|Xi=[xi, xi+t, …, xi+(m-1)t]T, i=1, 2, …, M},式中m為嵌入維,t為時延,M=N-(m-1)t為相空間中的點數。假如嵌入維數m≥2d+1,d為系統動力學維數,那么認為重構的系統與原系統在拓撲意義上等價。然而由于d未知,而且實際上供實驗研究的時間序列一般有限長,此外還存在噪聲干擾,因此時延t不可任意取值。自然地,選擇合適的時延t和嵌入維m成為相空間重構的關鍵。本文采用C-C方法求重構相空間的嵌入維數和時間延遲[10],該方法使用關聯積分同時估計時延和嵌入維。對于X,嵌入時間序列的關聯積分可定義為:
$ \begin{align} & C\left(m, N, r, t \right)=\frac{2}{M\left(M-1 \right)}\sum\limits_{1\le i\le j\le M}{H\left(r-\left\| {{x}_{i}}-{{x}_{j}} \right\| \right)}, \\ & r > 0 \\ \end{align} $ |
其統計量S(m, N, r, t)=C(m, N, r, t)-Cm(1, N, r, t)可用來表示非線性時間序列的相關性。S(m, N, r, t)可以用來確定t和m。其中H(r)=,為簡單階躍函數。
2.2 混沌時間序列的平均周期
混沌時間序列的平均周期P的正確與否直接影響著混沌分析的效果,也就是李雅普諾夫指數的計算結果。不恰當的P甚至會對混沌時間序列造成錯誤判斷。為了避免參考點和其最鄰近點不在同一條軌道上,應采用限制短暫分離策略,即參考點與其最鄰近點的間隔大于序列的平均周期。混沌時間序列的平均周期可以通過快速傅里葉變換(fast Fourier transform, FFT)求得。FFT可將基于時域的時間序列通過變換轉換到頻域,依據序列的頻域信息可以計算原有序列的平均周期Tm[11]。
對時間序列 x={xi|i=1, 2, …, N}進行FFT后,得到:
$ F\left(k \right)=\sum\limits_{n=1}^{N}{{{x}_{n}}{{\text{e}}^{-j2\pi \left(k-1 \right)\frac{n-1}{N}}}} $ |
FFT中所用的頻率可表示為fn=
, n=1, 2, …, N,然后計算能量光譜的平均頻率:
$ {{f}_{mn}}=\frac{\sum\limits_{n=1}^{N}{{{f}_{n}}}}{N}=\frac{2\pi \sum\limits_{n=1}^{N}{\left(n-1 \right)}}{{{N}^{2}}} $ |
利用fnm的倒數可對時間序列的平均周期Tm進行大致估計,計算公式為:
$ {{T}_{m1}}=\frac{1}{{{f}_{mn}}}=\frac{{{N}_{2}}}{2\pi \sum\limits_{n=1}^{N}{\left(n-1 \right)}}=\frac{N}{\left(N-1 \right)\pi } $ |
2.3 李雅普諾夫指數曲線
李雅普諾夫指數是刻畫系統混沌性的一個有效指標,它定量地描述在主導相空間方向上系統對初始條件的敏感依賴性。一般認為,混沌系統至少含有一個正的李雅普諾夫指數,此外指數越大,表明混沌性越強。混沌時間序列是數據流的一種,研究時間序列的數據流中,基于滑動窗口的數據流采樣技術應用非常廣泛。我們利用滑動窗口技術,在一個時間窗內計算該有效時間序列的李雅普諾夫指數,然后通過窗口的滑動來最終構建李雅普諾夫指數變化曲線。顯然問題的核心是計算李雅普諾夫指數。本文采用小數據量法,該方法運算速度快,易于實現,對嵌入維、時間延遲以及數據量的規模均表現出比較強的魯棒性。小數據量法的具體計算步驟如下所示[12]:
Input:嵌入維數m、時延t、平均周期P。
Step1:根據m和t重構相空間X={Xi|i=1, 2, …, M};找相空間中每個點Xi的最鄰近點X′ i并限制短暫分離,即:di(0)=min‖Xi-Xi′‖|i-i′|>P;
Step2:對相空間中每個點Xi,計算出該鄰點的j個離散時間步后的距離di(j):
$ {{d}_{i}}\left(j \right)=\min \left\| {{X}_{i+j}}-{{X}_{{{i}^{'}}+j}} \right\|, j=1, 2, \cdots, \min \left(M-i, M={{i}^{'}} \right) $ |
Step3:對每個j,求出所有i的lndi(j)平均y(j),即:y(j)= lndi(j),其中q是非零di(j)的數目,Δt為觀測序列的采樣間隔或步長。
Output:李雅普諾夫指數。
3 實驗與結果
3.1 數據預處理
2009年Physionet網站公布的AHE預測數據,包含60條訓練數據和50條測試數據,但是該ABP數據存在較大的數據缺失。對于缺失值采用兩種策略進行處理:當缺失值的數量大于數據總量的10%時,則認定這個數據質量差而剔除不用;對于缺失值較少的數據則使用屬性的平均值來代替。此外對于數據集合中的噪音數據,將血壓值小于等于零和大于或等于250 mm Hg都定義為噪聲,并使用樣條插值函數擬合數據來光滑數據。經過數據預處理后選取訓練數據集中的48條可用數據和測試數據集中37條可用數據,共85條數據。對于訓練集數據,每一條選擇T0前后各1 h數據用于計算李雅普諾夫指數曲線。對于測試集數據,由于只提供了T0前2 h的ABP數據,所以選取T0前2 h的數據。
3.2 實驗及結果分析
本實驗首先隨機選取訓練集中20條數據,利用C-C方法求AHE時間序列的重構相空間的嵌入維數和時間延遲,然后計算20條數據運行后結果的均值并取整,得到嵌入維數m為10,時間延遲t為40。采用同樣的手段,利用FFT求得時間序列的平均周期P為122。本實驗利用基于固定長度的滑動窗口來對AHE混沌序列進行分段處理,設定時間滑動窗口w=3 000,滑動位移s=1 000,點與點之間的時間間隔是0.008 s,因此在李雅普諾夫指數曲線圖中的步長為8 s。最后,利用上述參數,求解混沌時間序列的李雅普諾夫指數曲線。訓練數據集中,典型的AHE和非AHE的李雅普諾夫指數曲線如圖 2所示。

(a)非AHE患者a40282;(b)AHE患者a40493
Figure2. Curves of Lyapunov exponent(a) patient a40282 without AHE; (b) patient a40493 with AHE
圖 2(a)是一例未發生AHE樣本的李雅普諾夫指數曲線,曲線變化趨勢較為平緩,是一種典型的未發生AHE的李雅普諾夫指數曲線。圖 2(b)是發生AHE樣本的李雅普諾夫指數曲線,該圖中長方體標識中尖銳突起部分(指數值達到1.5左右)稱之為曲線突變。經過實驗發現,如果患者的李雅普諾夫指數曲線出現突變,則一般表示該患者在未來不久的某個時刻有可能出現AHE癥狀。
此外,經過實驗發現,發生AHE患者在T0時刻之前并不一定只出現一次突變,圖 3就是一例出現多次突變的極端患者的李雅普諾夫指數變化曲線(見圖 3中長方體標識部分)。

85條數據的預測結果如表 1所示。對于非AHE數據,一般不應該出現指數曲線突變,而對AHE數據,將會出現突變。依據這個規則,本文提出的方法獲得較好的辨識效果,預測準確率達到77.65%,靈敏度為71.05%,特異性為82.98%,這在臨床上具有一定的指導意義。

4 結論
本文主要對AHE的診斷預測進行研究,對于患者的MAP時間序列信號,應用非線性混沌分析的方法做出探討,結合相空間重構、FFT、小數據量法和移動時間窗口技術構建患者的李雅普諾夫指數曲線,通過曲線中的突變情況來構建AHE發生的預測指標,具有一定可參考的作用。
下一步的工作主要體現在三個方面:其一,本文的方法雖然有指導意義,但準確率還不是很高,究其原因還是數據的問題,由于樣本集中數據的采樣頻率不一致,這給突變的辨識帶來了干擾。因此,下一步工作需要結合相關領域專家知識在MIMICⅡ數據中收集并構建高質量的大數據集。其二,與特征提取方法相結合,提取患者李雅普諾夫指數曲線的相關特征,然后與一些經典、高效的分類方法相結合,如神經網絡、支持向量機等,建立分類預測模型,提升預測效率。其三,考慮MIMICⅡ中其它的監護參數,如心率和血氧飽和度等。根據臨床經驗,這些生命體征參數的變化與AHE的發生有密切的聯系,下一步的工作將把這些因素與李雅普諾夫指數曲線的相關因素整合起來進行預測研究。