引用本文: 張金寶, 何培宇, 田翩, 蔡建民, 潘帆, 錢永軍, 趙啟軍. 一種用于心拍分類的可解釋機器學習方法. 中國胸心血管外科臨床雜志, 2023, 30(2): 185-190. doi: 10.7507/1007-4848.202204067 復制
心律失常為全球性健康問題,全世界每年大約有370萬人發生心源性猝死,其中嚴重心律失常是引起心源性猝死的重要原因之一[1]。據中國心源性猝死流行病學調查資料估計,我國每年心源性猝死患者高達50多萬例[2],其中由惡性心律失常引起者約占80%[3]。心電圖(electrocardiogram,ECG)能記錄心臟每一心動周期所產生的電活動變化,所以現階段醫生一般通過ECG對心律失常進行診斷。近年來,隨著大數據技術的發展,基于深度學習的心拍分類研究與日俱增,從卷積神經網絡[4],到雙向長短時記憶模型[5]、將長短時記憶網絡和卷積神經網絡并行組合的模型[6],再到融合卷積神經網絡和多層雙邊長短時記憶網絡模型[7]。
以上模型在心拍分類上都取得了不錯的效果,但在研究時并沒有關注分類結果的可解釋性。深度學習在大數據背景下得到極大的發展,可是大部分深度學習自動提取的復雜信息和高維特征不便于解釋和理解。在醫學和生理信號領域,解釋性又恰恰是極為重要的。一個模型的分類可信度受到其解釋性和在數據集上驗證的準確率的共同影響。缺乏解釋性的深度學習模型就像一個黑匣,盡管在各式各樣的數據集上取得較好的成效,但在面對一個全新的可能具有較強特異性的個體時,會阻礙人們的理解,影響分類結果的可信度。
Tsetlin Machine(TM)是一種基于博弈論的能使眾多學習自動機成功合作的機器學習方法[8]。Granmo[8]的理論分析表明,TM 中尋找最優解的 Nash 均衡與提供最佳模式識別準確性的命題公式是一致的。這將許多問題轉化為沒有局部最優只有全局最優的學習。而在對支持向量機數據集的實證評價中,TM與多層感知機網絡、支持向量機、決策樹、隨機森林、樸素貝葉斯分類器和 logit 模型相比都具有競爭力。TM在花朵分類、數字識別、MNIST數據集上取得了不錯的分類成果,最關鍵的是能從TM中獲得其內部狀態,對分類結果進行解釋性研究。本文旨在使用TM對數據集進行分類的同時對模型的分類依據作出解釋。
1 資料與方法
1.1 數據來源
本研究的數據來自中國生理信號挑戰賽(China Physiological Signal Challenge,CPSC)2020數據庫[9]。該數據集包括10例心律失常患者的單導聯ECG記錄,每個記錄持續約24 h。CPSC2020的公開數據集中給出了室性早搏(premature ventricular contraction,PVC,記作心拍V)和室上性早搏(supraventricular premature beat,SPB,記作心拍S)的QRS波頂點的參考位置,各種類心拍總數見表1。

由于2號患者有心房顫動,波形干擾較大,實驗數據集由另外9例患者數據組成。正常心拍(記作心拍N)數據過多,每例患者取其中5 000個數據參與實驗,九折交叉驗證后得到最終實驗結果。
1.2 數據預處理
原始ECG信號通常受到基線漂移、工頻、人體肌電等干擾,使ECG信號難以識別和診斷。針對ECG信號去噪的研究[10]表明,經過小波變換分解重構后,ECG 數據的基線漂移能得到很好的補償,極大降低ECG 的工頻等噪聲,保留ECG 波形的變化趨勢。本文采用“bior2.6”小波對ECG信號進行8層分解,提取相應的細節系數和近似系數,并將1、2層的細節系數(即高頻系數)和8層的近似系數(低頻系數)置0,達到去噪的目的,處理結果對比見圖1。

正常心拍的持續時間(P波開始到T波結束)在0.75 s以內,考慮到CPSC2020數據集的采樣率為400 Hz,本文選取320個點,即0.80 s作為單個心拍的持續時間,以確保能包含完整心拍信息。電壓幅值使用心拍中的最大值進行歸一化處理,最終得到320×100大小的心拍圖片;見圖2。

1.3 方法
TM是一種基于Tsetlin Automata的大規模復雜模式識別的新技術。Tsetlin Automata是由Tsetlin[11]在20世紀60年代初于蘇聯開發的自動學習機技術,是一種比人工神經元更為基礎和通用的學習機制,其最基本的單元見圖3。

在Granmo等提出了一種基于博弈論的TM后,學習自動機的學習從局部最優轉變為全局最優,從而使多個學習自動機可以成功合作[12],使得學習自動機可以處理許多較為復雜的模式識別問題。學習自動機在處理模式識別問題時可以用位模式表示其中的各種命題[13]。適用于某些特殊圖片分類,例如能處理為二值圖片的ECG信號。TM已經在花朵分類、數字識別和MNIST數據集[14]上取得了不錯的分類成果,并且能從TM中獲得其內部狀態,進而得到具有可解釋性的位模式解釋圖;見圖4。

符號“*”可以接受值“0”或“1”,其余位值需嚴格匹配
與神經網絡等相比,位模式相對容易理解,基于位模式的解釋圖能對分類結果作出解釋,有助于對其進行理解與審查,對醫學等領域具有重要意義。
2 結果
2.1 實驗結果
TM將各個Tsetlin Automata當作子句,并將子句分為正子句(通過位模式判斷出屬于該類的圖片)和負子句(通過位模式判斷出不屬于該類的圖片)。通過兩種子句不同的輸出判斷出圖片的類別。實驗時選取2 000個子句數量的TM,進行100輪訓練(確保訓練集的驗證準確率到99.99%)。
模型對于各個類別的正確率(precision,符號記為Pre)、召回率(recall,符號記為Rec)、準確率(accuracy,符號記為Acc)等常被用于判別和分析一個多分類模型的能力,各個指標計算公式見式(1)~(3)。
![]() |
![]() |
![]() |
真陽性(true positive,TP)表示對該類別來說本是陽性,也被正確分類的樣本數量,例如實際是心拍N也被正確分類為心拍N的情況。假陽性(false positive,FP)表示該類別本不是陽性,卻被分類為陽性的個數,例如對心拍N來說,假陽性是指實際是另外兩類心拍卻被分類為心拍N的心拍總數。假陰性(false negative,FN)表示該類別本不是陰性,卻被分類為陰性的個數,即在心拍N中,本屬于心拍N卻被分類為另外兩類心拍的心拍總數。樣本總數(All)指所有參與測試的樣本總數。
最終TM九折交叉實驗的混淆矩陣見圖5。從混淆矩陣中可以看出,TM對心拍N和心拍V的分辨識別能力較強,而在心拍S的分類上稍差一些。

通過混淆矩陣我們還可以看出,心拍N更加容易被判為心拍S,同樣心拍S更容易被判別為心拍N,也就是說,TM更容易將這兩類心拍混淆。進一步,我們可以將這個三分類矩陣看作3個二分類的混淆矩陣,分別是心拍N與非心拍N,心拍V與非心拍V,心拍S與非心拍S,最終計算得到各自的準確率(Acc)分別為89.1%、92.1%和86.5%,更加直觀地表明心拍N與心拍S更容易被TM混淆。
2.2 Tsetlin Machine分類結果的解釋性分析
在訓練結束以后,TM中的位模式狀態能對分類結果進行解釋,本文進一步將位模式解釋圖與各個類別的典型波形圖疊加,繪制出屬于各個類別的熱力圖。
需要說明的是,在較復雜圖片的識別中,位模式出現“1”的概率非常小,本次研究中TM的位模式狀態中并不存在任何一個“1”,即位模式解釋圖中僅存在“*”和“0”。最終繪制熱力圖時以“*”代表“0”出現概率高的地方,三種類別各自的熱力圖見圖6。

a:由TM得到的用于區分正常心拍的位模式解釋圖與正常心拍典型圖疊加而成;b:將TM用于區分室性早搏心拍的位模式解釋圖與室性早搏心拍圖疊加而成;c:將TM用于區分室上性早搏心拍的位模式解釋圖與室上性早搏心拍圖疊加而成
TM在判斷一張圖片是否屬于本類時,圖片對應熱力圖中“*”密集的地方越趨近于空白,代表這張圖屬于該類別的概率越高。從熱力圖中可以看出TM在作出分類判決時關注的重點信息不同。
3 討論
本文探索了TM在生理信號的處理與分類中的應用,也是第1次使用TM來針對ECG信號給出解釋圖。可以明顯地看出,TM可以分辨出不同心拍之間的差別并加以區分,最終通過位模式狀態得到的熱力圖使得TM的分類結果得到了很好的解釋。并且這樣的結果是具有理論依據的,SPB(心拍S)是室上性的電指令引起心臟除極導致的,電指令往心房方向逆傳的過程會使心房除極的P波出現異常,電指令往心室方向傳導的過程與竇性指令下傳心室的過程一致,最終導致心電信號中P波位置偏移,QRS波規整且偏窄。而PVC(心拍V)是來自心室的電指令引起心臟除極導致的,PVC的起搏點多在心室的一邊,發出的電指令使整個心室除極的過程從一側心室跨過室間隔去到另一側心室,傳導速度慢,最終導致QRS波畸形且增寬。在ECG中,我們會發現心拍N與心拍S是相對難以區分的,心拍S的QRS波群一般與竇性心律者相似,只有P波形態略微變化為P’波,間隔具有一定差別[15]。同時,心拍V畸形且擴張的QRS波使得它更易于與另外兩類心拍區分。
TM在分類識別心拍N時,重點關注S波位置與形狀。QRS波的間隔和形狀是TM區分心拍V最為明顯的依據。同時,在分辨心拍S時,P波位置周圍和QRS波中星號密度顯然增大,也就是說TM通過P波位置和QRS波間隔來判別心拍S;見圖6。這與前文討論的生理依據是基本一致的。
而且,值得注意的是,發生PVC時,室性電指令使心室除極,此時心電往往是從一側心室到另一側心室,之后的機械性收縮或舒張也是從一個心室到另一個心室,與正常心臟的左右心室呈向心性收縮或舒張的狀況不同,易造成血流動力學障礙。而發生SPB時,室上性電指令使心室除極,心電自左右心室內膜向外膜方向除極,之后心室收縮和舒張同樣是呈向心性的,與正常竇性心律相同。也就是說,對比心拍V與心拍S,即PVC與SPB兩種心律不齊時,PVC相對要嚴重許多,可能會導致卒中和心源性猝死[16]。而TM對心拍V的區分度更高,也就代表相對于三分類準確率為84.3%這樣的分類結果來說,TM可能會有更好的臨床使用價值。總的來說,TM的分類結果能找到相應的理論依據,可解釋且具有依據的分類結果能增加模型的可信度,便于人們審查和理解。
研究的局限性:本文使用的數據集分類是正常與早搏的三分類,并沒有達到美國醫療器械促進協會推薦的五分類標準。數據集來自9例患者的單導聯數據,患者數量較少,單導聯相較于十二導聯波形受噪聲干擾也更大。因此,需要更大樣本量、更全面的數據集驗證本文結論。
利益沖突:無。
作者貢獻:張金寶負責設計、執行研究,分析數據,撰寫論文;何培宇、趙啟軍負責設計、組織研究;錢永軍負責組織研究,論文審閱與修改;潘帆負責設計、組織研究,收集數據,修改論文;田翩負責收集數據;蔡建民負責整理數據。
心律失常為全球性健康問題,全世界每年大約有370萬人發生心源性猝死,其中嚴重心律失常是引起心源性猝死的重要原因之一[1]。據中國心源性猝死流行病學調查資料估計,我國每年心源性猝死患者高達50多萬例[2],其中由惡性心律失常引起者約占80%[3]。心電圖(electrocardiogram,ECG)能記錄心臟每一心動周期所產生的電活動變化,所以現階段醫生一般通過ECG對心律失常進行診斷。近年來,隨著大數據技術的發展,基于深度學習的心拍分類研究與日俱增,從卷積神經網絡[4],到雙向長短時記憶模型[5]、將長短時記憶網絡和卷積神經網絡并行組合的模型[6],再到融合卷積神經網絡和多層雙邊長短時記憶網絡模型[7]。
以上模型在心拍分類上都取得了不錯的效果,但在研究時并沒有關注分類結果的可解釋性。深度學習在大數據背景下得到極大的發展,可是大部分深度學習自動提取的復雜信息和高維特征不便于解釋和理解。在醫學和生理信號領域,解釋性又恰恰是極為重要的。一個模型的分類可信度受到其解釋性和在數據集上驗證的準確率的共同影響。缺乏解釋性的深度學習模型就像一個黑匣,盡管在各式各樣的數據集上取得較好的成效,但在面對一個全新的可能具有較強特異性的個體時,會阻礙人們的理解,影響分類結果的可信度。
Tsetlin Machine(TM)是一種基于博弈論的能使眾多學習自動機成功合作的機器學習方法[8]。Granmo[8]的理論分析表明,TM 中尋找最優解的 Nash 均衡與提供最佳模式識別準確性的命題公式是一致的。這將許多問題轉化為沒有局部最優只有全局最優的學習。而在對支持向量機數據集的實證評價中,TM與多層感知機網絡、支持向量機、決策樹、隨機森林、樸素貝葉斯分類器和 logit 模型相比都具有競爭力。TM在花朵分類、數字識別、MNIST數據集上取得了不錯的分類成果,最關鍵的是能從TM中獲得其內部狀態,對分類結果進行解釋性研究。本文旨在使用TM對數據集進行分類的同時對模型的分類依據作出解釋。
1 資料與方法
1.1 數據來源
本研究的數據來自中國生理信號挑戰賽(China Physiological Signal Challenge,CPSC)2020數據庫[9]。該數據集包括10例心律失常患者的單導聯ECG記錄,每個記錄持續約24 h。CPSC2020的公開數據集中給出了室性早搏(premature ventricular contraction,PVC,記作心拍V)和室上性早搏(supraventricular premature beat,SPB,記作心拍S)的QRS波頂點的參考位置,各種類心拍總數見表1。

由于2號患者有心房顫動,波形干擾較大,實驗數據集由另外9例患者數據組成。正常心拍(記作心拍N)數據過多,每例患者取其中5 000個數據參與實驗,九折交叉驗證后得到最終實驗結果。
1.2 數據預處理
原始ECG信號通常受到基線漂移、工頻、人體肌電等干擾,使ECG信號難以識別和診斷。針對ECG信號去噪的研究[10]表明,經過小波變換分解重構后,ECG 數據的基線漂移能得到很好的補償,極大降低ECG 的工頻等噪聲,保留ECG 波形的變化趨勢。本文采用“bior2.6”小波對ECG信號進行8層分解,提取相應的細節系數和近似系數,并將1、2層的細節系數(即高頻系數)和8層的近似系數(低頻系數)置0,達到去噪的目的,處理結果對比見圖1。

正常心拍的持續時間(P波開始到T波結束)在0.75 s以內,考慮到CPSC2020數據集的采樣率為400 Hz,本文選取320個點,即0.80 s作為單個心拍的持續時間,以確保能包含完整心拍信息。電壓幅值使用心拍中的最大值進行歸一化處理,最終得到320×100大小的心拍圖片;見圖2。

1.3 方法
TM是一種基于Tsetlin Automata的大規模復雜模式識別的新技術。Tsetlin Automata是由Tsetlin[11]在20世紀60年代初于蘇聯開發的自動學習機技術,是一種比人工神經元更為基礎和通用的學習機制,其最基本的單元見圖3。

在Granmo等提出了一種基于博弈論的TM后,學習自動機的學習從局部最優轉變為全局最優,從而使多個學習自動機可以成功合作[12],使得學習自動機可以處理許多較為復雜的模式識別問題。學習自動機在處理模式識別問題時可以用位模式表示其中的各種命題[13]。適用于某些特殊圖片分類,例如能處理為二值圖片的ECG信號。TM已經在花朵分類、數字識別和MNIST數據集[14]上取得了不錯的分類成果,并且能從TM中獲得其內部狀態,進而得到具有可解釋性的位模式解釋圖;見圖4。

符號“*”可以接受值“0”或“1”,其余位值需嚴格匹配
與神經網絡等相比,位模式相對容易理解,基于位模式的解釋圖能對分類結果作出解釋,有助于對其進行理解與審查,對醫學等領域具有重要意義。
2 結果
2.1 實驗結果
TM將各個Tsetlin Automata當作子句,并將子句分為正子句(通過位模式判斷出屬于該類的圖片)和負子句(通過位模式判斷出不屬于該類的圖片)。通過兩種子句不同的輸出判斷出圖片的類別。實驗時選取2 000個子句數量的TM,進行100輪訓練(確保訓練集的驗證準確率到99.99%)。
模型對于各個類別的正確率(precision,符號記為Pre)、召回率(recall,符號記為Rec)、準確率(accuracy,符號記為Acc)等常被用于判別和分析一個多分類模型的能力,各個指標計算公式見式(1)~(3)。
![]() |
![]() |
![]() |
真陽性(true positive,TP)表示對該類別來說本是陽性,也被正確分類的樣本數量,例如實際是心拍N也被正確分類為心拍N的情況。假陽性(false positive,FP)表示該類別本不是陽性,卻被分類為陽性的個數,例如對心拍N來說,假陽性是指實際是另外兩類心拍卻被分類為心拍N的心拍總數。假陰性(false negative,FN)表示該類別本不是陰性,卻被分類為陰性的個數,即在心拍N中,本屬于心拍N卻被分類為另外兩類心拍的心拍總數。樣本總數(All)指所有參與測試的樣本總數。
最終TM九折交叉實驗的混淆矩陣見圖5。從混淆矩陣中可以看出,TM對心拍N和心拍V的分辨識別能力較強,而在心拍S的分類上稍差一些。

通過混淆矩陣我們還可以看出,心拍N更加容易被判為心拍S,同樣心拍S更容易被判別為心拍N,也就是說,TM更容易將這兩類心拍混淆。進一步,我們可以將這個三分類矩陣看作3個二分類的混淆矩陣,分別是心拍N與非心拍N,心拍V與非心拍V,心拍S與非心拍S,最終計算得到各自的準確率(Acc)分別為89.1%、92.1%和86.5%,更加直觀地表明心拍N與心拍S更容易被TM混淆。
2.2 Tsetlin Machine分類結果的解釋性分析
在訓練結束以后,TM中的位模式狀態能對分類結果進行解釋,本文進一步將位模式解釋圖與各個類別的典型波形圖疊加,繪制出屬于各個類別的熱力圖。
需要說明的是,在較復雜圖片的識別中,位模式出現“1”的概率非常小,本次研究中TM的位模式狀態中并不存在任何一個“1”,即位模式解釋圖中僅存在“*”和“0”。最終繪制熱力圖時以“*”代表“0”出現概率高的地方,三種類別各自的熱力圖見圖6。

a:由TM得到的用于區分正常心拍的位模式解釋圖與正常心拍典型圖疊加而成;b:將TM用于區分室性早搏心拍的位模式解釋圖與室性早搏心拍圖疊加而成;c:將TM用于區分室上性早搏心拍的位模式解釋圖與室上性早搏心拍圖疊加而成
TM在判斷一張圖片是否屬于本類時,圖片對應熱力圖中“*”密集的地方越趨近于空白,代表這張圖屬于該類別的概率越高。從熱力圖中可以看出TM在作出分類判決時關注的重點信息不同。
3 討論
本文探索了TM在生理信號的處理與分類中的應用,也是第1次使用TM來針對ECG信號給出解釋圖。可以明顯地看出,TM可以分辨出不同心拍之間的差別并加以區分,最終通過位模式狀態得到的熱力圖使得TM的分類結果得到了很好的解釋。并且這樣的結果是具有理論依據的,SPB(心拍S)是室上性的電指令引起心臟除極導致的,電指令往心房方向逆傳的過程會使心房除極的P波出現異常,電指令往心室方向傳導的過程與竇性指令下傳心室的過程一致,最終導致心電信號中P波位置偏移,QRS波規整且偏窄。而PVC(心拍V)是來自心室的電指令引起心臟除極導致的,PVC的起搏點多在心室的一邊,發出的電指令使整個心室除極的過程從一側心室跨過室間隔去到另一側心室,傳導速度慢,最終導致QRS波畸形且增寬。在ECG中,我們會發現心拍N與心拍S是相對難以區分的,心拍S的QRS波群一般與竇性心律者相似,只有P波形態略微變化為P’波,間隔具有一定差別[15]。同時,心拍V畸形且擴張的QRS波使得它更易于與另外兩類心拍區分。
TM在分類識別心拍N時,重點關注S波位置與形狀。QRS波的間隔和形狀是TM區分心拍V最為明顯的依據。同時,在分辨心拍S時,P波位置周圍和QRS波中星號密度顯然增大,也就是說TM通過P波位置和QRS波間隔來判別心拍S;見圖6。這與前文討論的生理依據是基本一致的。
而且,值得注意的是,發生PVC時,室性電指令使心室除極,此時心電往往是從一側心室到另一側心室,之后的機械性收縮或舒張也是從一個心室到另一個心室,與正常心臟的左右心室呈向心性收縮或舒張的狀況不同,易造成血流動力學障礙。而發生SPB時,室上性電指令使心室除極,心電自左右心室內膜向外膜方向除極,之后心室收縮和舒張同樣是呈向心性的,與正常竇性心律相同。也就是說,對比心拍V與心拍S,即PVC與SPB兩種心律不齊時,PVC相對要嚴重許多,可能會導致卒中和心源性猝死[16]。而TM對心拍V的區分度更高,也就代表相對于三分類準確率為84.3%這樣的分類結果來說,TM可能會有更好的臨床使用價值。總的來說,TM的分類結果能找到相應的理論依據,可解釋且具有依據的分類結果能增加模型的可信度,便于人們審查和理解。
研究的局限性:本文使用的數據集分類是正常與早搏的三分類,并沒有達到美國醫療器械促進協會推薦的五分類標準。數據集來自9例患者的單導聯數據,患者數量較少,單導聯相較于十二導聯波形受噪聲干擾也更大。因此,需要更大樣本量、更全面的數據集驗證本文結論。
利益沖突:無。
作者貢獻:張金寶負責設計、執行研究,分析數據,撰寫論文;何培宇、趙啟軍負責設計、組織研究;錢永軍負責組織研究,論文審閱與修改;潘帆負責設計、組織研究,收集數據,修改論文;田翩負責收集數據;蔡建民負責整理數據。