房顫(AF)是一種常見的心率失常疾病,基于心電圖(ECG)的房顫檢測對臨床診斷具有十分重要的意義。由于 ECG 信號的非線性和復雜性,人工檢測 ECG 信號的過程需要耗費大量時間且極易出現錯誤。為了克服上述問題,本文提出基于 RR 間期的特征提取方法,以穩健變異系數(RCV)描述 RR 間期的離散程度,以偏態參數(SKP)描述 RR 間期的分布形狀,以 Lempel-Ziv 復雜度(LZC)描述 RR 間期的復雜度。最后將 RCV、SKP、LZC 特征值組成特征向量輸入支持向量機(SVM)分類器模型,實現房顫的自動分類檢測。為驗證本文方法的有效性和實用性,以 MIT-BIH 房顫數據庫數據進行驗證,最終分類結果顯示,靈敏度為 95.81%、特異度為 96.48%、準確率可達到 96.09%,同時在 MIT-BIH 竇性心律數據庫中實現了 95.16% 的特異度。實驗結果表明,本文所提方法是一種有效的房顫分類方法。
引用本文: 陳志博, 李健, 李智, 彭韻陶, 高興姣. 基于 RR 間期和多特征值的房顫自動檢測分類. 生物醫學工程學雜志, 2018, 35(4): 550-556. doi: 10.7507/1001-5515.201710050 復制
引言
在全球醫療保健系統中,房顫(atrial fibrillation,AF)患者的檢測和治療變得越來越重要[1-2]。由于房顫可使患者發生中風的風險增加近 5 倍[3],所以其早期的檢測和治療顯得尤為重要。雖然市場上出現了一些基于一次性貼片系統[4]和 iPhone 心電圖(electrocardiogram,ECG)技術[5]的新設備可專門用于房顫檢測,但是當患者表現出房顫癥狀時,醫生通過 12 導聯 ECG 信號進行房顫檢測仍然是最科學的方法[6]。ECG 信號是能夠反映心臟活動的周期性電信號,當房顫發生時,其 ECG 信號會表現為 P 波消失,代之以一系列形態不一致、方向各不相同的 f 波信號,且 RR 間期(兩個 QRS 波中 R 波之間相隔的時間)絕對不規則[7]。一些學者先將 ECG 信號中的 QRS-T 波消除,得到僅包含 P 波或 f 波的信號,然后再通過分析這部分信號進行房顫檢測。Ladavich 等[8]使用 P 波特征的高斯混合模型對 ECG 信號進行分類,靈敏度(sensitivity,Se)達到 98.10%,特異度(specificity,Sp)達到 91.70%。Weng 等[9]采用小波分解,將 ECG 信號分解成不同頻域段信號,然后提取各頻域段信號的峰值平均功率比特征值輸入支持向量機(support vector machine,SVM)分類器進行分類;Asgari 等[10]在 Weng 等[9]的基礎上增加了各頻域段信號的 log 熵特征,使用 SVM 交叉驗證方法對房顫數據進行實驗,實現了 97.00% 的靈敏度、97.10% 的特異度、97.10% 的準確率(accuracy,Acc)。但是 ECG 信號中 QRS-T 波群形 態變異很大,一般情況下,難以被完全消除,且殘存的信號容易使 P 波誤檢。Babaeizadeh 等[11]結合 f 波或 P 波分析提高了算法的準確率,但是心房活動中 P 波或 f 波屬于微弱信號,檢測特征點會比較困難,而且在動態 ECG 信號中,極易受到噪聲干擾的影響。Parvaresh 等[12]提出直接提取 ECG 信號分段的自回歸(auto regressive,AR)模型參數特征,不需要 R 波、P 波、f 波檢測,也不需要 QRS-T 波消除,對 ECG 信號進行房顫檢測,實現了 96.14% 的靈敏度、93.20% 的特異度。可是該方法模型必須自相關,且自相關系數要大于 0.5,否則會造成預測結果極不準確。
RR 間期在一定程度上可以反映心率[13]。房顫 ECG 信號的一個突出特征是 RR 間期絕對不規則,且 R 波幅值較大,相比于對 P 波、f 波的檢測定位,RR 間期的檢測定位更容易且準確。目前 ECG 信號的 R 波檢測方法較多,準確率可達到 99.00%[14-15]。基于 RR 間期的房顫檢測具有較強魯棒性,可實現移動端的房顫檢測。Li 等[16]使用 RR 間期信息熵、RR 間期差概率密度分布和空白窗比率特征進行房顫分類,實現了 95.30% 的靈敏度、96.30% 的特異度、95.90% 的準確率。
從 ECG 信號中提取有效反映疾病的特征,是一個特征選擇的過程[17]。在實踐應用中,統計學分析方法僅是對數據進行定性的分析,而非線性理論卻能提取系統的演變信息,定量地描述系統的復雜性。所以可以將 RR 間期的非線性參數分析法看作傳統統計方法的一種補充,可以通過結合 RR 間期的統計量特征和非線性參數特征得到 RR 間期的多角度分布特征,以提高房顫檢測的準確性。本文提取 RR 間期的統計特征——穩健變異系數(robust coefficient of variation,RCV)、偏態參數(skewness parameter,SKP)和非線性參數特征——Lempel-Ziv 復雜度(Lempel-Ziv complexity,LZC)組成特征向量,進行房顫分類檢測。
1 實驗數據
本文以麻省理工學院-貝斯以色列醫院(Massachusetts Institute of Technology-Beth Israel Hospital,MIT-BIH)房顫數據庫(MIT-BIH Atrial Fibrillation,MIT-BIH-AF)(https://www.physionet.org/physiobank/database/afdb/)[18]中的數據作為實驗數據測試來源,共選擇包含了 25 條 ECG 信號的記錄數據,每條 ECG 信號記錄時間長度為 10 h。ECG 信號的采樣頻率是 250 Hz、分辨率為 12 bit、采樣帶寬是 0.1~40 Hz。
本文還選擇了 MIT-BIH 竇性心律(MIT-BIH Normal Sinus Rhythm,MIT-BIH-NSR)數據庫(https://physionet.org/physiobank/database/nsrdb/)[18]中 18 條時長達 24 h 的 ECG 信號記錄數據。所有信號記錄均無明顯的心律失常,因而可用于驗證房顫檢測算法的特異度。MIT-BIH-AF 數據庫與 MIT-BIH-NSR 數據庫中房顫與非房顫心搏的具體數量如表 1 所示。

2 房顫分類
房顫分類系統流程如圖 1 所示,主要包含 3 個技術步驟:
(1)預處理:進行 ECG 信號 RR 間期的獲取與分段;
(2)特征提取:提取表征房顫段與非房顫段 RR 間期的特征向量;
(3)分類:訓練 SVM 分類器模型用于預測輸入樣本標簽。

2.1 預處理
本文研究的重點是房顫的分類,所以將 MIT-BIH-AF 數據庫中前 12 條 ECG 信號記錄(記錄號較小的 12 條)作為訓練集訓練分類模型,后 13 條 ECG 信號記錄(記錄號較大的 13 條)作為測試集進行分類模型準確性的檢驗。在對一個患者的全程 ECG 信號 RR 間期進行分段與實際類別標注時,分別取 32、64 和 128 個心搏為一段,如圖 2 所示,有的 RR 間期段內不僅包含房顫心搏,也包含非房顫心搏,對于這些 RR 間期段,若房顫心搏數量超過該段總心搏數量的一半時,則標注這些段是房顫段,否則標注為非房顫段。對 MIT-BIH 數據庫進行分段、標注整理,各數據庫中的不同分段長度,房顫與非房顫段數目如表 2 所示。


2.2 特征提取
實驗中本文提取了 RR 間期的 3 個特征值:穩健變異系數、偏態參數、Lempel-Ziv 復雜度。
(1)穩健變異系數:
在穩健統計技術中,穩健變異系數(以符號 RCV 表示)定義為歸一化 RR 間期四分位間距與 RR 間期中位數的比值。其中,四分位間距(interquartile range,IQR),以符號 IQR 表示;中位數(median,M),以符號 M 表示,則計算公式如式(1)所示:
![]() |
式(1)中的 IQR × 0.741 3 表示的是歸一化 RR 間期四分位間距,使之等于正態分布的標準差。
(2)偏態參數:
偏態參數(以符號 SKP 表示)可以評估數據分布形態中表現的偏斜方向和程度,能夠對數據分布的非對稱性進行描述。一組 RR 間期序列的偏態參數計算公式如式(2)所示:
![]() |
其中,RRi 表示第 i 個 RR 間期,
表示 RR 間期平均值,N 是 RR 間期長度,標準差(standard deviation,SD),以符號 SD 表示。
(3)Lempel-Ziv 復雜度:
Lempel-Ziv 復雜度算法,是將一個長度一定的序列的復雜度視為該序列中新模式隨序列長度的遞增而產生的速度[19],其具體算法如下:
步驟一:首先將已知序列
重構,計算該序列的平均值
,將序列中滿足
的部分都置“1”,滿足
的部分都置“0”,通過這樣的方法將原序列 X 重構為一個僅包括“0”和“1”的符號序列
。
步驟二:對上面所得(“0”,“1”)序列中已存在的一個子串
,在其后加上一個字符 sm+1,或者是加上一串 k 個字符的
,得到一符號序列
;將字符串 SQ 去除最后一個字符得到 SQv,即
,然后檢查Q 是否與 SQv 中己出現過的子串相同,即查看是否存在某個 i,1 ≤ i ≤ m,使
;若是存在,就將 Q 加到后面的方式稱為“復制”,此時,將 Q 延長,也就是增加 k,不停重復上面的步驟,一直到 Q 不屬于 SQv 中已出現過的子串為止;而將 Q 不屬于 SQv 中已出現過的子串的過程稱為“插入”,在“插入”時將一個“·”符號放在 Q 后;然后將“·”前面的全部字符都作為 S,循環上面的步驟。
步驟三:如上,一個序列被“·”斷分為多個字符串段,定義得到的字符段數量為“復雜度”(以符號 C(n)表示)。
步驟四:根據文獻[19],一個 S∈{“0”,“1”}的序列,其復雜度會趨近一個值 b(n),計算公式如式(3)所示:
![]() |
b(n)表示的是序列的漸進形態,可以使用 b(n)將 C(n)進行歸一化,得到“相對復雜度”測度(以符號 c(n)表示),計算公式如式(4)所示:
![]() |
從計算過程可知,Lempel-Ziv 復雜度度量的是一個序列中產生新模式的速度,c(n)取不同值,序列中產生新模式的速度不同,該序列表現了不同的特性;或者可以從另一個角度認為 c(n)是計算一個時間序列同隨機序列相似的程度。
2.3 SVM 分類器
在機器學習領域,SVM 是一個基于統計理論的、有監督的學習模型,是一種常見的分類判別方法。給定一個訓練集,如式(5)所示:
![]() |
其中,x1∈Rn,y∈{+1,–1},
。xi 為第 i 個特征向量,也稱為實例,yi 為 xi 的兩種 +1、–1 類標記,(xi,yi)稱為樣本點。設定這一訓練集實例能夠被一個超平面進行線性劃分,該超平面對應于一個方程,如式(6)所示:
![]() |
因為支持向量與超平面之間的距離為
,所以線性可分情況下的 SVM 的最優化問題分別如式(7)、(8)所示:
![]() |
![]() |
這是一個凸二次規劃問題,使用拉格朗日對偶性,最后可求得最優分類決策函數如式(9)所示:
![]() |
上式訓練集中對應于 α* 的樣本點就是支持向量,b* 表示的是分類閥值,K(xi·x)是將輸入空間映射到高維特征空間的核函數。SVM 由于其具有良好的結構風險最小化的生成能力,已被廣泛應用于實際分類問題[20]。
2.4 評估指標
本文利用靈敏度(以符號 Se 表示)、特異度(以符號 Sp 表示)、準確率(以符號 Acc 表示)來評估房顫分類效果,且這 3 個指標由真陽性(true positive,TP)(以符號 TP 表示)、真陰性(true negative,TN)(以符號 TN 表示)、假陽性(false positive,FP)(以符號 FP 表示)、假陰性(false negative,FN)(以符號 FN 表示)決定,計算公式分別如式(10)、(11)、(12)所示:
![]() |
![]() |
![]() |
3 實驗分析
3.1 分類的實現
房顫分類實驗首先提取 RR 間期的穩健變異系數、偏態參數和 Lempel-Ziv 復雜度,組成特征向量,然后再結合 MIT-BIH 數據庫中房顫的類型標注,將訓練集特征向量與房顫標注一起輸入 SVM 分類器進行訓練,最后將測試集的特征向量輸入上述已經訓練好的分類器,對測試集進行分類。其中,本文采用了徑向基函數(radial basis kernel,RBF)核的 SVM,該分類器包含了 Chang 等[21]開發的支持向量機庫(a library for support vector machines,LIBSVM)工具箱。
3.2 實驗結果分析
如前文 2.1 小節所述,當 RR 間期段長度分別為 32、64、128 個點時,MIT-BIH-AF 數據庫和 MIT-BIH-NSR 數據庫的分類效果如表 3 所示,本方法對于不同 RR 間期長度均獲得了不錯的分類效果,其中當取 RR 間期長度為 64 個點時,得到的分類效果最好,在 MIT-BIH-AF 數據庫測試集中達到了 95.81% 的靈敏度、96.48% 的特異度和 96.09% 的準確率,在 MIT-BIH-NSR 數據庫中達到了 95.16% 的特異度。

當 RR 間期長度為 64 個點時,測試集的穩健變異系數、偏態參數、Lempel-Ziv 復雜度特征組成的三維圖如圖 3 所示,可以看出房顫與非房顫三維特征值的分布區域存在明顯差異。理論上非房顫 RR 間期的穩健變異系數值應較小,但是部分非房顫 RR 間期的穩健變異系數出現較大值,與房顫 RR 間期的特征值發生交疊,降低了分類的準確性。分布在圖中左上部的為非房顫特征點,這些非房顫點的穩健變異系數值較大,出現了異常,但 Lempel-Ziv 復雜度特征的加入,得到這些點的 Lempel-Ziv 復雜度值較小,使這些點分布在了 Lempel-Ziv 復雜度軸的靠負軸方向,而房顫的 Lempel-Ziv 復雜度值較大,分布在了 Lempel-Ziv 復雜度軸的靠正軸方向,使房顫與非房顫的三維特征值分布區域有了明顯的可分性,提高了分類準確性。

近年來房顫分類檢測文獻的分類效果,以及本文所提統計特征結合非線性參數特征的分類效果如表 4 所示,所得分類效果都是基于 MIT-BIH-AF 數據庫。從表中可以發現,與其他算法對比,本文所提房顫檢測算法在靈敏度、特異度和準確率方面都具有優勢,實現了房顫的準確診斷。

4 結論
計算機自動分析、檢測房顫具有很大的實用性。本文從離散程度、分布形態、復雜度等多個角度對 RR 間期進行特征分析,并且在各角度分析中選擇較有效的參數進行特征表征。基于 RR 間期房顫檢測局限性的根源在于:沒有加入 ECG 信號的其他特征(如 P 波),這是因為 ECG 信號上的 P 波幅度相對較低,在移動期間可能難以準確記錄。若 ECG 信號采集設備能夠采集到低噪聲的 ECG 信號數據,可以考慮結合 P 波特征進行檢測,使房顫檢測系統更加精確、高效。
引言
在全球醫療保健系統中,房顫(atrial fibrillation,AF)患者的檢測和治療變得越來越重要[1-2]。由于房顫可使患者發生中風的風險增加近 5 倍[3],所以其早期的檢測和治療顯得尤為重要。雖然市場上出現了一些基于一次性貼片系統[4]和 iPhone 心電圖(electrocardiogram,ECG)技術[5]的新設備可專門用于房顫檢測,但是當患者表現出房顫癥狀時,醫生通過 12 導聯 ECG 信號進行房顫檢測仍然是最科學的方法[6]。ECG 信號是能夠反映心臟活動的周期性電信號,當房顫發生時,其 ECG 信號會表現為 P 波消失,代之以一系列形態不一致、方向各不相同的 f 波信號,且 RR 間期(兩個 QRS 波中 R 波之間相隔的時間)絕對不規則[7]。一些學者先將 ECG 信號中的 QRS-T 波消除,得到僅包含 P 波或 f 波的信號,然后再通過分析這部分信號進行房顫檢測。Ladavich 等[8]使用 P 波特征的高斯混合模型對 ECG 信號進行分類,靈敏度(sensitivity,Se)達到 98.10%,特異度(specificity,Sp)達到 91.70%。Weng 等[9]采用小波分解,將 ECG 信號分解成不同頻域段信號,然后提取各頻域段信號的峰值平均功率比特征值輸入支持向量機(support vector machine,SVM)分類器進行分類;Asgari 等[10]在 Weng 等[9]的基礎上增加了各頻域段信號的 log 熵特征,使用 SVM 交叉驗證方法對房顫數據進行實驗,實現了 97.00% 的靈敏度、97.10% 的特異度、97.10% 的準確率(accuracy,Acc)。但是 ECG 信號中 QRS-T 波群形 態變異很大,一般情況下,難以被完全消除,且殘存的信號容易使 P 波誤檢。Babaeizadeh 等[11]結合 f 波或 P 波分析提高了算法的準確率,但是心房活動中 P 波或 f 波屬于微弱信號,檢測特征點會比較困難,而且在動態 ECG 信號中,極易受到噪聲干擾的影響。Parvaresh 等[12]提出直接提取 ECG 信號分段的自回歸(auto regressive,AR)模型參數特征,不需要 R 波、P 波、f 波檢測,也不需要 QRS-T 波消除,對 ECG 信號進行房顫檢測,實現了 96.14% 的靈敏度、93.20% 的特異度。可是該方法模型必須自相關,且自相關系數要大于 0.5,否則會造成預測結果極不準確。
RR 間期在一定程度上可以反映心率[13]。房顫 ECG 信號的一個突出特征是 RR 間期絕對不規則,且 R 波幅值較大,相比于對 P 波、f 波的檢測定位,RR 間期的檢測定位更容易且準確。目前 ECG 信號的 R 波檢測方法較多,準確率可達到 99.00%[14-15]。基于 RR 間期的房顫檢測具有較強魯棒性,可實現移動端的房顫檢測。Li 等[16]使用 RR 間期信息熵、RR 間期差概率密度分布和空白窗比率特征進行房顫分類,實現了 95.30% 的靈敏度、96.30% 的特異度、95.90% 的準確率。
從 ECG 信號中提取有效反映疾病的特征,是一個特征選擇的過程[17]。在實踐應用中,統計學分析方法僅是對數據進行定性的分析,而非線性理論卻能提取系統的演變信息,定量地描述系統的復雜性。所以可以將 RR 間期的非線性參數分析法看作傳統統計方法的一種補充,可以通過結合 RR 間期的統計量特征和非線性參數特征得到 RR 間期的多角度分布特征,以提高房顫檢測的準確性。本文提取 RR 間期的統計特征——穩健變異系數(robust coefficient of variation,RCV)、偏態參數(skewness parameter,SKP)和非線性參數特征——Lempel-Ziv 復雜度(Lempel-Ziv complexity,LZC)組成特征向量,進行房顫分類檢測。
1 實驗數據
本文以麻省理工學院-貝斯以色列醫院(Massachusetts Institute of Technology-Beth Israel Hospital,MIT-BIH)房顫數據庫(MIT-BIH Atrial Fibrillation,MIT-BIH-AF)(https://www.physionet.org/physiobank/database/afdb/)[18]中的數據作為實驗數據測試來源,共選擇包含了 25 條 ECG 信號的記錄數據,每條 ECG 信號記錄時間長度為 10 h。ECG 信號的采樣頻率是 250 Hz、分辨率為 12 bit、采樣帶寬是 0.1~40 Hz。
本文還選擇了 MIT-BIH 竇性心律(MIT-BIH Normal Sinus Rhythm,MIT-BIH-NSR)數據庫(https://physionet.org/physiobank/database/nsrdb/)[18]中 18 條時長達 24 h 的 ECG 信號記錄數據。所有信號記錄均無明顯的心律失常,因而可用于驗證房顫檢測算法的特異度。MIT-BIH-AF 數據庫與 MIT-BIH-NSR 數據庫中房顫與非房顫心搏的具體數量如表 1 所示。

2 房顫分類
房顫分類系統流程如圖 1 所示,主要包含 3 個技術步驟:
(1)預處理:進行 ECG 信號 RR 間期的獲取與分段;
(2)特征提取:提取表征房顫段與非房顫段 RR 間期的特征向量;
(3)分類:訓練 SVM 分類器模型用于預測輸入樣本標簽。

2.1 預處理
本文研究的重點是房顫的分類,所以將 MIT-BIH-AF 數據庫中前 12 條 ECG 信號記錄(記錄號較小的 12 條)作為訓練集訓練分類模型,后 13 條 ECG 信號記錄(記錄號較大的 13 條)作為測試集進行分類模型準確性的檢驗。在對一個患者的全程 ECG 信號 RR 間期進行分段與實際類別標注時,分別取 32、64 和 128 個心搏為一段,如圖 2 所示,有的 RR 間期段內不僅包含房顫心搏,也包含非房顫心搏,對于這些 RR 間期段,若房顫心搏數量超過該段總心搏數量的一半時,則標注這些段是房顫段,否則標注為非房顫段。對 MIT-BIH 數據庫進行分段、標注整理,各數據庫中的不同分段長度,房顫與非房顫段數目如表 2 所示。


2.2 特征提取
實驗中本文提取了 RR 間期的 3 個特征值:穩健變異系數、偏態參數、Lempel-Ziv 復雜度。
(1)穩健變異系數:
在穩健統計技術中,穩健變異系數(以符號 RCV 表示)定義為歸一化 RR 間期四分位間距與 RR 間期中位數的比值。其中,四分位間距(interquartile range,IQR),以符號 IQR 表示;中位數(median,M),以符號 M 表示,則計算公式如式(1)所示:
![]() |
式(1)中的 IQR × 0.741 3 表示的是歸一化 RR 間期四分位間距,使之等于正態分布的標準差。
(2)偏態參數:
偏態參數(以符號 SKP 表示)可以評估數據分布形態中表現的偏斜方向和程度,能夠對數據分布的非對稱性進行描述。一組 RR 間期序列的偏態參數計算公式如式(2)所示:
![]() |
其中,RRi 表示第 i 個 RR 間期,
表示 RR 間期平均值,N 是 RR 間期長度,標準差(standard deviation,SD),以符號 SD 表示。
(3)Lempel-Ziv 復雜度:
Lempel-Ziv 復雜度算法,是將一個長度一定的序列的復雜度視為該序列中新模式隨序列長度的遞增而產生的速度[19],其具體算法如下:
步驟一:首先將已知序列
重構,計算該序列的平均值
,將序列中滿足
的部分都置“1”,滿足
的部分都置“0”,通過這樣的方法將原序列 X 重構為一個僅包括“0”和“1”的符號序列
。
步驟二:對上面所得(“0”,“1”)序列中已存在的一個子串
,在其后加上一個字符 sm+1,或者是加上一串 k 個字符的
,得到一符號序列
;將字符串 SQ 去除最后一個字符得到 SQv,即
,然后檢查Q 是否與 SQv 中己出現過的子串相同,即查看是否存在某個 i,1 ≤ i ≤ m,使
;若是存在,就將 Q 加到后面的方式稱為“復制”,此時,將 Q 延長,也就是增加 k,不停重復上面的步驟,一直到 Q 不屬于 SQv 中已出現過的子串為止;而將 Q 不屬于 SQv 中已出現過的子串的過程稱為“插入”,在“插入”時將一個“·”符號放在 Q 后;然后將“·”前面的全部字符都作為 S,循環上面的步驟。
步驟三:如上,一個序列被“·”斷分為多個字符串段,定義得到的字符段數量為“復雜度”(以符號 C(n)表示)。
步驟四:根據文獻[19],一個 S∈{“0”,“1”}的序列,其復雜度會趨近一個值 b(n),計算公式如式(3)所示:
![]() |
b(n)表示的是序列的漸進形態,可以使用 b(n)將 C(n)進行歸一化,得到“相對復雜度”測度(以符號 c(n)表示),計算公式如式(4)所示:
![]() |
從計算過程可知,Lempel-Ziv 復雜度度量的是一個序列中產生新模式的速度,c(n)取不同值,序列中產生新模式的速度不同,該序列表現了不同的特性;或者可以從另一個角度認為 c(n)是計算一個時間序列同隨機序列相似的程度。
2.3 SVM 分類器
在機器學習領域,SVM 是一個基于統計理論的、有監督的學習模型,是一種常見的分類判別方法。給定一個訓練集,如式(5)所示:
![]() |
其中,x1∈Rn,y∈{+1,–1},
。xi 為第 i 個特征向量,也稱為實例,yi 為 xi 的兩種 +1、–1 類標記,(xi,yi)稱為樣本點。設定這一訓練集實例能夠被一個超平面進行線性劃分,該超平面對應于一個方程,如式(6)所示:
![]() |
因為支持向量與超平面之間的距離為
,所以線性可分情況下的 SVM 的最優化問題分別如式(7)、(8)所示:
![]() |
![]() |
這是一個凸二次規劃問題,使用拉格朗日對偶性,最后可求得最優分類決策函數如式(9)所示:
![]() |
上式訓練集中對應于 α* 的樣本點就是支持向量,b* 表示的是分類閥值,K(xi·x)是將輸入空間映射到高維特征空間的核函數。SVM 由于其具有良好的結構風險最小化的生成能力,已被廣泛應用于實際分類問題[20]。
2.4 評估指標
本文利用靈敏度(以符號 Se 表示)、特異度(以符號 Sp 表示)、準確率(以符號 Acc 表示)來評估房顫分類效果,且這 3 個指標由真陽性(true positive,TP)(以符號 TP 表示)、真陰性(true negative,TN)(以符號 TN 表示)、假陽性(false positive,FP)(以符號 FP 表示)、假陰性(false negative,FN)(以符號 FN 表示)決定,計算公式分別如式(10)、(11)、(12)所示:
![]() |
![]() |
![]() |
3 實驗分析
3.1 分類的實現
房顫分類實驗首先提取 RR 間期的穩健變異系數、偏態參數和 Lempel-Ziv 復雜度,組成特征向量,然后再結合 MIT-BIH 數據庫中房顫的類型標注,將訓練集特征向量與房顫標注一起輸入 SVM 分類器進行訓練,最后將測試集的特征向量輸入上述已經訓練好的分類器,對測試集進行分類。其中,本文采用了徑向基函數(radial basis kernel,RBF)核的 SVM,該分類器包含了 Chang 等[21]開發的支持向量機庫(a library for support vector machines,LIBSVM)工具箱。
3.2 實驗結果分析
如前文 2.1 小節所述,當 RR 間期段長度分別為 32、64、128 個點時,MIT-BIH-AF 數據庫和 MIT-BIH-NSR 數據庫的分類效果如表 3 所示,本方法對于不同 RR 間期長度均獲得了不錯的分類效果,其中當取 RR 間期長度為 64 個點時,得到的分類效果最好,在 MIT-BIH-AF 數據庫測試集中達到了 95.81% 的靈敏度、96.48% 的特異度和 96.09% 的準確率,在 MIT-BIH-NSR 數據庫中達到了 95.16% 的特異度。

當 RR 間期長度為 64 個點時,測試集的穩健變異系數、偏態參數、Lempel-Ziv 復雜度特征組成的三維圖如圖 3 所示,可以看出房顫與非房顫三維特征值的分布區域存在明顯差異。理論上非房顫 RR 間期的穩健變異系數值應較小,但是部分非房顫 RR 間期的穩健變異系數出現較大值,與房顫 RR 間期的特征值發生交疊,降低了分類的準確性。分布在圖中左上部的為非房顫特征點,這些非房顫點的穩健變異系數值較大,出現了異常,但 Lempel-Ziv 復雜度特征的加入,得到這些點的 Lempel-Ziv 復雜度值較小,使這些點分布在了 Lempel-Ziv 復雜度軸的靠負軸方向,而房顫的 Lempel-Ziv 復雜度值較大,分布在了 Lempel-Ziv 復雜度軸的靠正軸方向,使房顫與非房顫的三維特征值分布區域有了明顯的可分性,提高了分類準確性。

近年來房顫分類檢測文獻的分類效果,以及本文所提統計特征結合非線性參數特征的分類效果如表 4 所示,所得分類效果都是基于 MIT-BIH-AF 數據庫。從表中可以發現,與其他算法對比,本文所提房顫檢測算法在靈敏度、特異度和準確率方面都具有優勢,實現了房顫的準確診斷。

4 結論
計算機自動分析、檢測房顫具有很大的實用性。本文從離散程度、分布形態、復雜度等多個角度對 RR 間期進行特征分析,并且在各角度分析中選擇較有效的參數進行特征表征。基于 RR 間期房顫檢測局限性的根源在于:沒有加入 ECG 信號的其他特征(如 P 波),這是因為 ECG 信號上的 P 波幅度相對較低,在移動期間可能難以準確記錄。若 ECG 信號采集設備能夠采集到低噪聲的 ECG 信號數據,可以考慮結合 P 波特征進行檢測,使房顫檢測系統更加精確、高效。