本文以心音特征為基礎,實現了連續的左心室收縮壓預測。通過對 3 只比格犬進行實驗,以腎上腺素誘發心臟血流動力學發生變化,然后同步采集實驗犬的心音、心電、左心室血壓等信號,共獲取了 28 組有效數據。通過提取心音特征,借助人工神經網絡實現了反推左心室收縮血壓,獲得了較好的預測效果。本研究在較大的血壓動態變化范圍內,得到了絕對誤差均值僅為 7.3 mm Hg、預測血壓與測量血壓的平均相關系數為 0.92 的實驗結果。研究結果顯示,本文所述方法有助于實現無創的左心室血流動力的連續監測。
引用本文: 張晶慧, 唐洪. 基于體表心音的左心室血壓預測方法研究. 生物醫學工程學雜志, 2017, 34(3): 335-341. doi: 10.7507/1001-5515.201606068 復制
引言
心音圖(phonocardiogram,PCG)是心臟及其周圍血管組織在血流動力作用下產生的一系列機械振動信號。通過放置在胸腔體表面的傳感器,可以將這些聲音信號收集起來,俗稱體表心音。正常人在一個心動周期內可聞及兩組聲音,分別是第一心音(sound1,S1)和第二心音(sound2,S2)。它們都能在一定程度上反映出心臟血流動力學的狀態,有助于疾病的早期診斷[1-5]。
早在 50 年前,研究者們就已經開始探索心音特征與血流動力學之間的相互聯系。Sakamoto 等[6]通過對 51 只成年犬進行實驗研究,發現了 S1 的幅度與左心室血壓上升速率存在著密切的線性關系。Blick 等[7]在理論上提出了一維瓣膜振動模型來模擬生物瓣膜的振動。以瓣膜兩側血壓梯度來代替振動模型所受外力,并根據瓣膜的振動方程求解出位移曲線。通過理論分析,發現瓣膜兩側血壓梯度與瓣膜振動所產生的聲壓幅度存在著密切的聯系。Sikarskie 等[8]借助一維振動模型的理論分析,發現隨著瓣膜兩側壓力差和壓力梯度的增加,瓣膜振動幅度隨之增大。以此為基礎,Zhang 等[9]進一步發現主動脈壓的增高可同時引發心音振動幅度與頻率的增加。Ozcan 等[10]通過對成人進行主動脈弓處收縮壓的有創采集,得出 S2 的幅度與主動脈壓有著正相關的線性關系。Hoon 等[11]通過對健康成人進行數據采集,發現 S1、S2 的幅度比值與收縮壓存在較強的相關性。
除了心音幅度特征,諸如時間特征和頻率特征也逐漸被人們重視起來。Zhang 等[12-13]提出了一種心音的時間域特征物理量——RS2,定義為左心室血壓的上升起點到 S2 的開始時刻這一時間間隔。通過理論建模,發現 RS2 與血壓呈現密切的負相關關系。在此基礎上,Wong 等[14-15]對 RS2 這一變量進行了重新定義。在新的定義中,RS2 表示以心電信號的 R 波為起點,到 S2 的波峰位置處這一時間間隔。重新定義的 RS2 同樣與血壓呈現出密切的負相關關系,不僅在健康的個體中,甚至在高血壓患者中均已證實了該理論的合理性。在 2015 年,Peng 等[16]通過采集 32 個健康成人的心音信號,并利用 S2 的頻率特征,實現了血壓預測。
基于以上研究結果,本文選取了 3 只健康比格犬,以腎上腺素誘發動物心臟血流學發生改變,通過信號處理和網絡模型訓練等方法,實現基于心音信號的左心室血壓連續預測的功能。本文工作與前人研究的區別在于:① 本文的左心室血壓是通過導管有創采集的,血壓值真實可靠,有利于評價血壓反推方法的有效性。② 本文實驗中血壓的動態變化范圍較大,收縮壓從最小值 100 mm Hg 到最大值 280 mm Hg,有利于評估反推方法在較大血壓動態范圍內的有效性。③ 本文采用了多個心音特征,有利于研究多特征的聯合預測效果。基于以上幾點可見,本文提出了一個無創的連續監測左心室血壓的方法,從而改進了傳統有創監測的弊端。并且本文的血壓值范圍較傳統預測模型有很大提高,這在一定程度上增加了模型的可信度。
1 方法
1.1 動物實驗
本文動物實驗已獲得重慶醫科大學倫理委員會的批準,并在附屬的動物實驗中心完成實驗。實驗過程中采取了相關保護動物的措施[17-18]。
在數據采集之前,3 只實驗犬已進行了為期兩周的適應性飼養。實驗開始時,先對實驗犬進行稱重,并以 0.2 mL/kg 的麻醉劑陸眠寧(鹽酸塞拉嗪注射液,1 mg∶1 mL,獸藥字(2011)070011077,吉林省華牧動物保健品有限公司)對其進行麻醉。將處于麻醉狀態下的實驗犬以仰臥的姿勢固定在實驗臺上,并用留置針在實驗犬的前肢靜脈進行穿刺,慢速滴注入 0.9% 的生理鹽水以維持后續腎上腺素的注射通道。剪去實驗犬左、右肩部和心尖處(左側胸骨外緣)的毛,將心電電極片貼在肩部剪毛處并將心音傳感器(MLT201,ADInstrument,Austra-lia)放置在心尖位置。將心電電極片、心音傳感器與生理信號記錄儀(PL3508,Powerlab8/35 ADInstru-ment,Australia)連接好并同步采集信號,持續采集 2 min。剪去實驗犬頸部表皮的絨毛并用碘酒對頸部裸露的表皮進行消毒,沿頸部正中位縱向切開表皮后分離出一小段右側頸總動脈,在頸總動脈下端的空隙處穿線備用以固定后續的導管連接。將三通管、導管與生理信號記錄儀連接好,該導管與標定好的壓力傳感器(MLT0699,ADInstrument,Australia)連接。借助三通管向導管內注射肝素(500 units/mL)以防止血液凝固并同時排除導管內的氣泡。將連接好的導管沿頸總動脈逆向插入實驗犬的左心室。在壓力換能器的作用下,記錄儀上可以觀察到左心室的血壓信號。當導管插入到一定的深度后,當出現突破感和落空感并且血壓波形變為左心室內壓波形時,停止插入。此時的導管前端已到達左心室,并用之前預留的線將導管固定。
準備工作完成后,觀察并記錄一段同步的心電、心音及左心室血壓信號。在此過程中,實驗犬處于正常的生理狀態。隨后,通過預留的靜脈通道注入腎上腺素,實驗中注射的劑量如表 1 所示。在腎上腺素的作用期間,同步記錄信號,直至血壓恢復到基線為止,為1組數據采集完畢。改變腎上腺素的注射劑量,重復以上操作。
實驗結束后,取出實驗犬的動脈插管,結扎其頸總動脈并對手術區域進行縫合。對實驗犬進行精心飼養,直至其自然死亡。
本文共采集了 37 組數據記錄,選取了 28 組有效數據,分布如表 1 所示。其中刪去的 9 組無效數據,是因操作不當或實驗犬自身原因而存在較大的誤差,予以棄除不用,在表中以“×”標記。每組數據包含的心動周期數范圍為 326~719。28 組有效數據共包含了 14 612 個心動周期。就目前的文獻看,在研究心音特征與心臟血流動力學的關系中,本文所涉及的心動周期數最多。

1.2 數據處理
1.2.1 心音分割 心音信號分割是將 S1 和 S2 從心音信號中分離出來,為后續的心音特征提取做準備。本文所采用的手段是基于香農能量包絡的心音分割方法[19-20]。
首先對心音信號進行零相位巴特沃斯低通濾波處理,截止頻率設置為 160 Hz,以去除噪聲干擾。其次,將心音信號進行歸一化處理,使其幅度范圍在[—1, 1]的區間內,并求出其香農能量 E。
$E = {x^2}\log ({x^2})$ |
其中,x 是歸一化后的心音信號。隨后,用一個寬為 20 ms 的窗對香農能量進行平均濾波,滑動窗有 10 ms 的重疊,如式(2)所示:
${E_A} = \frac{1}{N}\sum\limits_{i = 1}^N {{E_i}} $ |
其中,EA 表示平均香農能量,Ei 表示位置 i 處的心音信號香農能量,N 表示截取窗寬。因本信號的采樣頻率為 1 000 Hz,這里的窗寬選取 20。再對平均香農能量進行標準化,如式(3)所示:
${E_N} = \frac{{{E_A} - M({E_A})}}{{S({E_A})}}$ |
其中,EN 是標準化后的平均香農能量,M(EA)和S(EA)分別表示平均香農能量的均值和標準差。
設置兩個能量閾值來篩選 S1 和 S2 的主峰。根據同步采集的心音信號 R 波位置來對齊 S1 位置,從而可將篩選出來的主峰劃分為 S1 和 S2,如圖 1 所示。為了較好地統一后續心音信號的整齊性,分別以 S1 和 S2 的最大幅值處為中心,對 S1 和 S2 進行寬度為 141 ms 和 101 ms 的截取。

1.2.2 特征提取 根據前人的研究可知,心音信號與血流動力學之間存在著密切的相互聯系,其幅度、頻率等特征可在一定程度上反映血流動力學狀態。為了提高血壓預測的實時性,本文選取了部分心音特征,如最大幅值,心音能量,時間特征等,具體描述如下:
(1)幅度特征:分別選取每個心動周期 S1、S2 的最大絕對幅度值,并將其表示為 S1 最大幅度(amplitude of S1,Amp1)和 S2 最大幅度(amplitude of S2,Amp2)。
(2)能量特征:心音能量(Energy,Ener)可表達為式(4)[21]:
${\rm{Ener}} = \frac{1}{N}\sum\limits_{i = 1}^N {{x_i}^2} $ |
其中,xi 表示待求心音,N 表示所截取心音信號的寬度。分別將 S1 和 S2 的能量表示為 S1 的心音能量(Energy of S1,Ener1)和 S2 的心音能量(Energy of S2,Ener2)。
(3)時間特征:在同一個心動周期中,以心電信號的 R 波為起點,到 S2 波峰的時間間隔被定義為時間特征 RS2[14-15]。
從每個心動周期內提取以上心音特征和對應的左心室收縮壓(systolic blood pressure,SBP)。這些心音特征與 SBP 之間的典型關系,如圖 2 所示,為實驗犬 3 的數據展示。由圖中可以看出,在腎上腺素作用下,實驗犬的左心室 SBP 迅速增加,隨著腎上腺素代謝,經過約 300 個心跳,血壓逐漸恢復到正常值。在此過程中,左心室 SBP 與心音幅度特征、能量特征表現出正相關關系,與時間特征 RS2 表現出負相關關系。

1.3 預測模型
本文引入反向傳播(back propagation,BP)人工神經網絡作為預測模型,來完成基于心音特征的左心室 SBP 反推。BP 神經網絡是一種按誤差逆傳播算法訓練的多層前饋型網絡,是目前應用最為廣泛的神經網絡模型之一[22-24],通過其自身的訓練及學習,實現了從輸入到輸出的非線性映射。BP 網絡的每一個神經節點(Node)都可表示為輸入的加權之和,如式(5)所示:
${\rm{Nod}}{{\rm{e}}_j} = \sum\limits_{k = 1}^n {{x_k}{w_{kj}}} $ |
其中,xk 表示節點 j 的輸入,n 代表輸入的維數,wkj 表示連結節點 k 和結點 j 之間的權系數。
本實驗的預測模型選用 4 層神經網絡結構,其隱層為 2 層。輸入層為所選取的心音特征(5 維),輸出層為左心室 SBP(1 維)。第一隱層和第二隱層的節點數分別被設置為 5 和 3。其中第一隱層的傳遞函數采用非線性 Sigmoid 函數,如式(6)所示。第二隱層的傳遞函數則采用線性函數,如式(7)所示。
$O{}_j = \frac{1}{{1 + {{\rm e}^{ - ({\rm{Nod}}{{\rm{e}}_j} + {\beta _j})}}}}$ |
${O_j} = {\rm{Nod}}{{\rm{e}}_j} + {\beta _j}$ |
其中,βj 表示節點 j 的閾值,Oj 表示節點 j 的最終輸出。輸出層的傳遞函數同樣采用式(7)的線性函數。
BP 網絡的訓練過程是一個權系數不斷迭代更替的過程,其誤差能量,如式(8)所示,隨著迭代次數的增加逐漸減小直至穩定,從而可獲得最小的訓練誤差。
${E_{{\rm{error}}}} = \frac{1}{2}\sum\limits_m {{{({d_m} - {y_m})}^2}} $ |
其中,Eerror 是誤差能量,m 是訓練數據輸入輸出對的個數,d 是理想輸出,y 是實際輸出。在整個的訓練過程中,沿著能量梯度下降的方向進行系數迭代。
2 實驗結果
本文采用了十折交叉驗證(10-fold cross-vali-dation)評估網絡預測性能[25]。實驗獲得了 28 組記錄。將每組記錄的心音特征向量作為輸入、左心室 SBP 作為輸出,平均分成 10 段,并編號為 1 至 10。用 1~9 段對神經網絡進行訓練,第 10 段用于測試。再以 2~10 段進行訓練,第 1 段用于測試。以此重復,直到每一段都被測試過。這種交叉驗證的思想保證了每一個心動周期的數據都被測試。將血壓的估測結果與實際測量結果進行比較,通過皮爾森相關系數(correlation coefficient,CC)、誤差均值(mean error,ME)、絕對誤差均值(mean absolute error,MAE)和誤差標準差(standard deviation,SD)等指標對預測性能進行定量評價。這些指標的計算,如式(9)~式(12)所示:
${\rm{ME}} = \frac{1}{n}\sum\limits_{i = 1}^n {({y_i} - {x_i})} $ |
${\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{y_i} - {x_i}} \right|} $ |
${\rm{SD}} = \sqrt {\frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{({y_i} - {x_i} - {\rm{ME}})}^2}} } $ |
${\rm{CC}} = \frac{{\sum\limits_{i = 1}^n {({x_i} - \overline x )} ({y_i} - \overline y )}}{{\sqrt {\sum\limits_{i = 1}^n {{{({x_i} - \overline x )}^2}} } \sqrt {\sum\limits_{i = 1}^n {{{({y_i} - \overline y )}^2}} } }}$ |
其中,y 表示網絡預測輸出值,x 表示血壓傳感器測量值,n 表示某組數據中心動周期的個數。
對于參與訓練的 28 組數據,其預測結果的評價指標如圖 3、表 2 所示,MAE 整體水平穩定在 7 mm Hg 附近,ME 整體在 0 mm Hg 位置上下浮動,個別數據出現較大振動,但均不超過±3 mm Hg。SD 水平整體穩定在 10 mm Hg 左右,均未超過 18 mm Hg。從皮爾森 CC 可以看出,整體數值均高于 0.8,多達半數高于 0.9 的水平。這意味著,該方法估計的左心室 SBP 與實際測量得的 SBP 在數值上有很高的相關性,說明該方法的血壓預測結果較為準確。


如圖 4 所示,為來自不同犬的 3 組血壓預測結果,圖中展示了實驗犬 1 的#6 數據、實驗犬 2 的#23 數據、實驗犬 3 的#35 數據。BP 網絡預測的左心室 SBP 與傳感器所測量的實際左心室 SBP 之間的皮爾森 CC 值分別為 0.95、0.91 和 0.98,均同時保證了較高的置信水平。

3 討論與分析
本文通過挑選出有效的心音特征,借助 BP 神經網絡,實現了對左心室 SBP 的預測。如表 2 所示,血壓預測的 MAE 總體均小于 14 mm Hg,最小值為 4.33 mm Hg,最大值為 13.10 mm Hg,均值為 7.34 mm Hg。血壓預測 ME 的誤差范圍維持在上下 3 mm Hg 以內,均值接近 0 mm Hg 的水平。預測水平的 SD 總體均小于 18 mm Hg,最小值為 6.10 mm Hg,最大值為 17.47 mm Hg,均值為 10.33 mm Hg。SBP 的最終預測結果與實際數值之間的相關系數在 0.82 與 0.98 之間,平均水平為 0.92。由上述的結果可以看出,基于 BP 網絡的血壓預測有著較高的準確性,誤差范圍低,預測輸出與實際輸出相關系數較高。盡管左心室 SBP 在 100 mm Hg 到 280 mm Hg 之間,有較大的動態變化范圍,本文也獲得了較好的估計結果。這一結論進一步證實了,通過心音特征實現血壓預測是可行的。
本文主要選取了心音信號的幅度特征、能量特征和時間特征,還有其他有效的特征有待深入發掘。在更加廣泛的代表性特征支持下,預測結果可能會進一步提高。另外,模型參數、模型種類也可能影響預測性能,本文采用了經典的 BP 模型來完成血壓的預測,并取得了較好的結果,而其它模型的預測性能還有待進一步研究。本文的結論驗證了心音特征與心臟血流動力學的密切關系。本文提出的血壓預測方法是無創的、連續的,區別于傳統的袖帶血壓檢測,具有較好的舒適性、便利性,有利于長期監測心臟的血流動力。
引言
心音圖(phonocardiogram,PCG)是心臟及其周圍血管組織在血流動力作用下產生的一系列機械振動信號。通過放置在胸腔體表面的傳感器,可以將這些聲音信號收集起來,俗稱體表心音。正常人在一個心動周期內可聞及兩組聲音,分別是第一心音(sound1,S1)和第二心音(sound2,S2)。它們都能在一定程度上反映出心臟血流動力學的狀態,有助于疾病的早期診斷[1-5]。
早在 50 年前,研究者們就已經開始探索心音特征與血流動力學之間的相互聯系。Sakamoto 等[6]通過對 51 只成年犬進行實驗研究,發現了 S1 的幅度與左心室血壓上升速率存在著密切的線性關系。Blick 等[7]在理論上提出了一維瓣膜振動模型來模擬生物瓣膜的振動。以瓣膜兩側血壓梯度來代替振動模型所受外力,并根據瓣膜的振動方程求解出位移曲線。通過理論分析,發現瓣膜兩側血壓梯度與瓣膜振動所產生的聲壓幅度存在著密切的聯系。Sikarskie 等[8]借助一維振動模型的理論分析,發現隨著瓣膜兩側壓力差和壓力梯度的增加,瓣膜振動幅度隨之增大。以此為基礎,Zhang 等[9]進一步發現主動脈壓的增高可同時引發心音振動幅度與頻率的增加。Ozcan 等[10]通過對成人進行主動脈弓處收縮壓的有創采集,得出 S2 的幅度與主動脈壓有著正相關的線性關系。Hoon 等[11]通過對健康成人進行數據采集,發現 S1、S2 的幅度比值與收縮壓存在較強的相關性。
除了心音幅度特征,諸如時間特征和頻率特征也逐漸被人們重視起來。Zhang 等[12-13]提出了一種心音的時間域特征物理量——RS2,定義為左心室血壓的上升起點到 S2 的開始時刻這一時間間隔。通過理論建模,發現 RS2 與血壓呈現密切的負相關關系。在此基礎上,Wong 等[14-15]對 RS2 這一變量進行了重新定義。在新的定義中,RS2 表示以心電信號的 R 波為起點,到 S2 的波峰位置處這一時間間隔。重新定義的 RS2 同樣與血壓呈現出密切的負相關關系,不僅在健康的個體中,甚至在高血壓患者中均已證實了該理論的合理性。在 2015 年,Peng 等[16]通過采集 32 個健康成人的心音信號,并利用 S2 的頻率特征,實現了血壓預測。
基于以上研究結果,本文選取了 3 只健康比格犬,以腎上腺素誘發動物心臟血流學發生改變,通過信號處理和網絡模型訓練等方法,實現基于心音信號的左心室血壓連續預測的功能。本文工作與前人研究的區別在于:① 本文的左心室血壓是通過導管有創采集的,血壓值真實可靠,有利于評價血壓反推方法的有效性。② 本文實驗中血壓的動態變化范圍較大,收縮壓從最小值 100 mm Hg 到最大值 280 mm Hg,有利于評估反推方法在較大血壓動態范圍內的有效性。③ 本文采用了多個心音特征,有利于研究多特征的聯合預測效果。基于以上幾點可見,本文提出了一個無創的連續監測左心室血壓的方法,從而改進了傳統有創監測的弊端。并且本文的血壓值范圍較傳統預測模型有很大提高,這在一定程度上增加了模型的可信度。
1 方法
1.1 動物實驗
本文動物實驗已獲得重慶醫科大學倫理委員會的批準,并在附屬的動物實驗中心完成實驗。實驗過程中采取了相關保護動物的措施[17-18]。
在數據采集之前,3 只實驗犬已進行了為期兩周的適應性飼養。實驗開始時,先對實驗犬進行稱重,并以 0.2 mL/kg 的麻醉劑陸眠寧(鹽酸塞拉嗪注射液,1 mg∶1 mL,獸藥字(2011)070011077,吉林省華牧動物保健品有限公司)對其進行麻醉。將處于麻醉狀態下的實驗犬以仰臥的姿勢固定在實驗臺上,并用留置針在實驗犬的前肢靜脈進行穿刺,慢速滴注入 0.9% 的生理鹽水以維持后續腎上腺素的注射通道。剪去實驗犬左、右肩部和心尖處(左側胸骨外緣)的毛,將心電電極片貼在肩部剪毛處并將心音傳感器(MLT201,ADInstrument,Austra-lia)放置在心尖位置。將心電電極片、心音傳感器與生理信號記錄儀(PL3508,Powerlab8/35 ADInstru-ment,Australia)連接好并同步采集信號,持續采集 2 min。剪去實驗犬頸部表皮的絨毛并用碘酒對頸部裸露的表皮進行消毒,沿頸部正中位縱向切開表皮后分離出一小段右側頸總動脈,在頸總動脈下端的空隙處穿線備用以固定后續的導管連接。將三通管、導管與生理信號記錄儀連接好,該導管與標定好的壓力傳感器(MLT0699,ADInstrument,Australia)連接。借助三通管向導管內注射肝素(500 units/mL)以防止血液凝固并同時排除導管內的氣泡。將連接好的導管沿頸總動脈逆向插入實驗犬的左心室。在壓力換能器的作用下,記錄儀上可以觀察到左心室的血壓信號。當導管插入到一定的深度后,當出現突破感和落空感并且血壓波形變為左心室內壓波形時,停止插入。此時的導管前端已到達左心室,并用之前預留的線將導管固定。
準備工作完成后,觀察并記錄一段同步的心電、心音及左心室血壓信號。在此過程中,實驗犬處于正常的生理狀態。隨后,通過預留的靜脈通道注入腎上腺素,實驗中注射的劑量如表 1 所示。在腎上腺素的作用期間,同步記錄信號,直至血壓恢復到基線為止,為1組數據采集完畢。改變腎上腺素的注射劑量,重復以上操作。
實驗結束后,取出實驗犬的動脈插管,結扎其頸總動脈并對手術區域進行縫合。對實驗犬進行精心飼養,直至其自然死亡。
本文共采集了 37 組數據記錄,選取了 28 組有效數據,分布如表 1 所示。其中刪去的 9 組無效數據,是因操作不當或實驗犬自身原因而存在較大的誤差,予以棄除不用,在表中以“×”標記。每組數據包含的心動周期數范圍為 326~719。28 組有效數據共包含了 14 612 個心動周期。就目前的文獻看,在研究心音特征與心臟血流動力學的關系中,本文所涉及的心動周期數最多。

1.2 數據處理
1.2.1 心音分割 心音信號分割是將 S1 和 S2 從心音信號中分離出來,為后續的心音特征提取做準備。本文所采用的手段是基于香農能量包絡的心音分割方法[19-20]。
首先對心音信號進行零相位巴特沃斯低通濾波處理,截止頻率設置為 160 Hz,以去除噪聲干擾。其次,將心音信號進行歸一化處理,使其幅度范圍在[—1, 1]的區間內,并求出其香農能量 E。
$E = {x^2}\log ({x^2})$ |
其中,x 是歸一化后的心音信號。隨后,用一個寬為 20 ms 的窗對香農能量進行平均濾波,滑動窗有 10 ms 的重疊,如式(2)所示:
${E_A} = \frac{1}{N}\sum\limits_{i = 1}^N {{E_i}} $ |
其中,EA 表示平均香農能量,Ei 表示位置 i 處的心音信號香農能量,N 表示截取窗寬。因本信號的采樣頻率為 1 000 Hz,這里的窗寬選取 20。再對平均香農能量進行標準化,如式(3)所示:
${E_N} = \frac{{{E_A} - M({E_A})}}{{S({E_A})}}$ |
其中,EN 是標準化后的平均香農能量,M(EA)和S(EA)分別表示平均香農能量的均值和標準差。
設置兩個能量閾值來篩選 S1 和 S2 的主峰。根據同步采集的心音信號 R 波位置來對齊 S1 位置,從而可將篩選出來的主峰劃分為 S1 和 S2,如圖 1 所示。為了較好地統一后續心音信號的整齊性,分別以 S1 和 S2 的最大幅值處為中心,對 S1 和 S2 進行寬度為 141 ms 和 101 ms 的截取。

1.2.2 特征提取 根據前人的研究可知,心音信號與血流動力學之間存在著密切的相互聯系,其幅度、頻率等特征可在一定程度上反映血流動力學狀態。為了提高血壓預測的實時性,本文選取了部分心音特征,如最大幅值,心音能量,時間特征等,具體描述如下:
(1)幅度特征:分別選取每個心動周期 S1、S2 的最大絕對幅度值,并將其表示為 S1 最大幅度(amplitude of S1,Amp1)和 S2 最大幅度(amplitude of S2,Amp2)。
(2)能量特征:心音能量(Energy,Ener)可表達為式(4)[21]:
${\rm{Ener}} = \frac{1}{N}\sum\limits_{i = 1}^N {{x_i}^2} $ |
其中,xi 表示待求心音,N 表示所截取心音信號的寬度。分別將 S1 和 S2 的能量表示為 S1 的心音能量(Energy of S1,Ener1)和 S2 的心音能量(Energy of S2,Ener2)。
(3)時間特征:在同一個心動周期中,以心電信號的 R 波為起點,到 S2 波峰的時間間隔被定義為時間特征 RS2[14-15]。
從每個心動周期內提取以上心音特征和對應的左心室收縮壓(systolic blood pressure,SBP)。這些心音特征與 SBP 之間的典型關系,如圖 2 所示,為實驗犬 3 的數據展示。由圖中可以看出,在腎上腺素作用下,實驗犬的左心室 SBP 迅速增加,隨著腎上腺素代謝,經過約 300 個心跳,血壓逐漸恢復到正常值。在此過程中,左心室 SBP 與心音幅度特征、能量特征表現出正相關關系,與時間特征 RS2 表現出負相關關系。

1.3 預測模型
本文引入反向傳播(back propagation,BP)人工神經網絡作為預測模型,來完成基于心音特征的左心室 SBP 反推。BP 神經網絡是一種按誤差逆傳播算法訓練的多層前饋型網絡,是目前應用最為廣泛的神經網絡模型之一[22-24],通過其自身的訓練及學習,實現了從輸入到輸出的非線性映射。BP 網絡的每一個神經節點(Node)都可表示為輸入的加權之和,如式(5)所示:
${\rm{Nod}}{{\rm{e}}_j} = \sum\limits_{k = 1}^n {{x_k}{w_{kj}}} $ |
其中,xk 表示節點 j 的輸入,n 代表輸入的維數,wkj 表示連結節點 k 和結點 j 之間的權系數。
本實驗的預測模型選用 4 層神經網絡結構,其隱層為 2 層。輸入層為所選取的心音特征(5 維),輸出層為左心室 SBP(1 維)。第一隱層和第二隱層的節點數分別被設置為 5 和 3。其中第一隱層的傳遞函數采用非線性 Sigmoid 函數,如式(6)所示。第二隱層的傳遞函數則采用線性函數,如式(7)所示。
$O{}_j = \frac{1}{{1 + {{\rm e}^{ - ({\rm{Nod}}{{\rm{e}}_j} + {\beta _j})}}}}$ |
${O_j} = {\rm{Nod}}{{\rm{e}}_j} + {\beta _j}$ |
其中,βj 表示節點 j 的閾值,Oj 表示節點 j 的最終輸出。輸出層的傳遞函數同樣采用式(7)的線性函數。
BP 網絡的訓練過程是一個權系數不斷迭代更替的過程,其誤差能量,如式(8)所示,隨著迭代次數的增加逐漸減小直至穩定,從而可獲得最小的訓練誤差。
${E_{{\rm{error}}}} = \frac{1}{2}\sum\limits_m {{{({d_m} - {y_m})}^2}} $ |
其中,Eerror 是誤差能量,m 是訓練數據輸入輸出對的個數,d 是理想輸出,y 是實際輸出。在整個的訓練過程中,沿著能量梯度下降的方向進行系數迭代。
2 實驗結果
本文采用了十折交叉驗證(10-fold cross-vali-dation)評估網絡預測性能[25]。實驗獲得了 28 組記錄。將每組記錄的心音特征向量作為輸入、左心室 SBP 作為輸出,平均分成 10 段,并編號為 1 至 10。用 1~9 段對神經網絡進行訓練,第 10 段用于測試。再以 2~10 段進行訓練,第 1 段用于測試。以此重復,直到每一段都被測試過。這種交叉驗證的思想保證了每一個心動周期的數據都被測試。將血壓的估測結果與實際測量結果進行比較,通過皮爾森相關系數(correlation coefficient,CC)、誤差均值(mean error,ME)、絕對誤差均值(mean absolute error,MAE)和誤差標準差(standard deviation,SD)等指標對預測性能進行定量評價。這些指標的計算,如式(9)~式(12)所示:
${\rm{ME}} = \frac{1}{n}\sum\limits_{i = 1}^n {({y_i} - {x_i})} $ |
${\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{y_i} - {x_i}} \right|} $ |
${\rm{SD}} = \sqrt {\frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{({y_i} - {x_i} - {\rm{ME}})}^2}} } $ |
${\rm{CC}} = \frac{{\sum\limits_{i = 1}^n {({x_i} - \overline x )} ({y_i} - \overline y )}}{{\sqrt {\sum\limits_{i = 1}^n {{{({x_i} - \overline x )}^2}} } \sqrt {\sum\limits_{i = 1}^n {{{({y_i} - \overline y )}^2}} } }}$ |
其中,y 表示網絡預測輸出值,x 表示血壓傳感器測量值,n 表示某組數據中心動周期的個數。
對于參與訓練的 28 組數據,其預測結果的評價指標如圖 3、表 2 所示,MAE 整體水平穩定在 7 mm Hg 附近,ME 整體在 0 mm Hg 位置上下浮動,個別數據出現較大振動,但均不超過±3 mm Hg。SD 水平整體穩定在 10 mm Hg 左右,均未超過 18 mm Hg。從皮爾森 CC 可以看出,整體數值均高于 0.8,多達半數高于 0.9 的水平。這意味著,該方法估計的左心室 SBP 與實際測量得的 SBP 在數值上有很高的相關性,說明該方法的血壓預測結果較為準確。


如圖 4 所示,為來自不同犬的 3 組血壓預測結果,圖中展示了實驗犬 1 的#6 數據、實驗犬 2 的#23 數據、實驗犬 3 的#35 數據。BP 網絡預測的左心室 SBP 與傳感器所測量的實際左心室 SBP 之間的皮爾森 CC 值分別為 0.95、0.91 和 0.98,均同時保證了較高的置信水平。

3 討論與分析
本文通過挑選出有效的心音特征,借助 BP 神經網絡,實現了對左心室 SBP 的預測。如表 2 所示,血壓預測的 MAE 總體均小于 14 mm Hg,最小值為 4.33 mm Hg,最大值為 13.10 mm Hg,均值為 7.34 mm Hg。血壓預測 ME 的誤差范圍維持在上下 3 mm Hg 以內,均值接近 0 mm Hg 的水平。預測水平的 SD 總體均小于 18 mm Hg,最小值為 6.10 mm Hg,最大值為 17.47 mm Hg,均值為 10.33 mm Hg。SBP 的最終預測結果與實際數值之間的相關系數在 0.82 與 0.98 之間,平均水平為 0.92。由上述的結果可以看出,基于 BP 網絡的血壓預測有著較高的準確性,誤差范圍低,預測輸出與實際輸出相關系數較高。盡管左心室 SBP 在 100 mm Hg 到 280 mm Hg 之間,有較大的動態變化范圍,本文也獲得了較好的估計結果。這一結論進一步證實了,通過心音特征實現血壓預測是可行的。
本文主要選取了心音信號的幅度特征、能量特征和時間特征,還有其他有效的特征有待深入發掘。在更加廣泛的代表性特征支持下,預測結果可能會進一步提高。另外,模型參數、模型種類也可能影響預測性能,本文采用了經典的 BP 模型來完成血壓的預測,并取得了較好的結果,而其它模型的預測性能還有待進一步研究。本文的結論驗證了心音特征與心臟血流動力學的密切關系。本文提出的血壓預測方法是無創的、連續的,區別于傳統的袖帶血壓檢測,具有較好的舒適性、便利性,有利于長期監測心臟的血流動力。