高血壓是危害人類健康的首要疾病,方便準確的血壓測量方法將有助于高血壓的防控。本文提出了一種基于面部視頻信號的連續血壓測量方法。采用顏色失真濾波與獨立成分分析法提取面部視頻信號中感興趣區域的視頻脈搏波,基于時頻域以及生理學原理對脈搏波進行多維特征提取;設計了一種集成特征選擇方法提取具有通用性的最優特征子集;比較基于粒子群優化的Elman神經網絡、支持向量機與深度信念網絡所建立的單人血壓測量模型;采用支持向量回歸算法構建通用血壓預測模型,并與真實血壓值進行比較與評價。實驗結果表明:基于面部視頻的血壓測量結果與標準血壓值具有較好的一致性,由視頻估計出的收縮壓與標準收縮壓的平均絕對誤差(MAE)為4.9 mm Hg,標準差(STD)為5.9 mm Hg;舒張壓的MAE為4.6 mm Hg,STD為5.0 mm Hg,符合AAMI標準。本文所提出的基于視頻流的非接觸式血壓檢測方法可以用于血壓的測量。
引用本文: 閆昊, 李霞, 朱田楊, 陳修強, 龔寧, 周秦武. 基于視頻流的非接觸式連續血壓檢測算法研究. 生物醫學工程學雜志, 2023, 40(2): 249-256. doi: 10.7507/1001-5515.202211071 復制
0 引言
高血壓是危害人類健康的首要疾病之一,相關數據[1]表明,1990年至2019年間,全球高血壓人數已經由約6.5億增至12.8億。隨著生活水平的提高,快節奏、高壓力的生活方式成為心血管疾病的誘因,伴隨人口老齡化程度的加重[2],高血壓在我國的發病率也逐年上升,因此高血壓的防控顯得尤為重要。
血壓(blood pressure,BP)測量可分為有創測量與無創測量[3],根據測量結果可分為間斷式與連續式測量方法。近年來,基于光電容積脈搏波描記法(photoplethysmography,PPG)的連續無創血壓測量研究層出不窮[4-10]。其中非接觸式連續血壓測量方法具有測量過程舒適、方法簡單、易于攜帶等特點,被國內外學者廣為關注。2008年,Verkruysse等[11]提出了在環境光下提取面部視頻信號中的遠程光電容積脈搏波描記法(video-photoplethysmography,vPPG)信號,使得該血壓測量方式成為可能。2016年,Jain等[12]提出僅采用面部視頻提取vPPG特征,建立多項式回歸模型對血壓進行估計。2019年,Luo等[13]采用智能手機攝像頭獲取面部不同位置的vPPG信號,構建多層感知機模型對連續血壓進行預測,但其準確度有待提高。
目前基于單vPPG作為信號源的非接觸式血壓估計方法較少,而且沒有相關的公開數據源可供參考與研究,同時非接觸式血壓估計的準確度還有待進一步提高。針對以上問題,本文提出了一種基于視頻流的非接觸式連續血壓檢測算法:采用MIMIC數據庫數據[14-15]以及實驗平臺采集數據,豐富數據量,構建不同血壓估計模型并進行篩選,設計集成特征選擇算法對vPPG特征進行篩選與優化,基于皮膚生理與光學特性與信號處理分離技術相結合的方法提取vPPG信號,以此來提高血壓估計的可信度與準確度。
1 信號產生原理
1.1 血壓的生理機制
血液在血管中流動并對血管壁產生的壓力稱為血壓,血壓的變化受到血液充盈量、心臟周期性泵血、動脈血管彈性以及外周阻力等相關因素影響。血液的充盈程度直接影響著血壓的大小。
1.2 脈搏波的生理機制
PPG的波形反映了血管內血容量的變化,當心血管發生異常時,會引起PPG波形的改變,而血壓的變化也會受到血容量的影響,因此PPG信號的時頻域特征與血壓之間存在相關性,對PPG信號特征的相關研究,能夠使我們對血壓進行預測與分析。
1.3 PPG與vPPG的采集原理
PPG的采集利用光學原理與皮膚特性,當光線照射到皮膚組織時,部分光線經過皮膚內部的角質層、結締組織以及微動靜脈等人體組織后,會從皮膚反射出來[16],由傳感器接收光強變化即得到PPG信號。vPPG的采集原理與PPG相似,也可叫做遠程光電容積描記術(remote PPG,rPPG),在環境光的照射下,使用攝像頭記錄面部由心臟泵血引起的光強變化,即vPPG信號。
2 信號處理部分
2.1 實驗數據庫
本文數據來源于兩部分,一部分為MIMIC數據庫的連續血壓與PPG數據;另一部分來自實驗平臺所采集的面部視頻數據與連續血壓數據。經過篩選后,共選取了MIMIC數據庫中102例受試者的相關數據,每例受試者3組數據,每組數據長度約為10 min。
在實驗平臺的數據采集中,受試者采用校內自由招募的形式,在實驗前均需簽署實驗告知書。采用日本Canon EOS 60D相機記錄面部視頻數據,采用美國BIOPAC MP160型16通道生理儀進行連續血壓與指尖PPG信號的采集。測量過程中,受試者與相機距離約為1 m,受試者盡量保持靜止狀態,保證面部充滿整個屏幕,在白天室內正常光線下以及夜晚日光燈照明下,記錄不同時間段數據。每例受試者記錄15~20組數據,每組數據2 min左右。共采集5例受試者視頻數據,并經受試者知情同意,所采集數據可用于科學研究,采樣率為60 fps,分辨率為1 280*720,指尖PPG信號采樣率為1 000 Hz,共100組數據。
2.2 數據預處理
對于MIMIC數據庫受試者的PPG數據,我們采用以coif5為母小波對其進行分解,采用軟閾值策略對信號進行去噪處理,最后重構恢復出干凈的PPG信號。對于實驗平臺采集到的vPPG數據,通過對視頻信號中感興趣區域(region of interest,ROI)的選取,降低vPPG的提取難度,并且提高圖像處理的速度。Kwon等[17]的研究顯示,眼睛下方區域顯示出良好的信號質量。經過選擇面部不同區域如額頭、鼻子、下巴等進行驗證與測試,我們同樣選擇左側眼睛下眼瞼部位的臉頰中部區域作為我們的ROI區域,用于后續vPPG的提取,ROI區域分辨率為200*200,如圖1所示,紅色框選區域為ROI區域。

本文結合皮膚光學特性以及信號分離方法,采用顏色失真濾波器(color distortion filter,CDF)與獨立成分分析(independent component analysis,ICA)算法相結合的脈搏波檢測方法,對vPPG信號進行預處理與提取。圖2為vPPG信號的預處理與提取流程。

CDF由Wang等[18]提出,該方法能夠去除顏色引起的干擾以及其他生理信號如呼吸等干擾。CDF處理步驟主要包括數據預處理、定義特征顏色空間以及加權計算能量濾波。
ICA是一種盲源信號提取方法[19-20],可從多源干擾信號中提取出所需要的目標信號。如圖2所示,CDF濾波器處理后的RGB三個通道信號經過ICA算法處理后獲得了三個通道中存在的近似vPPG信號,即成分1、2、3。根據頻譜分析對三種成分進行自動提取,如圖2所示,選擇頻譜與PPG信號相近的成分2作為vPPG信號。
之后我們設計切比雪夫Ⅰ型濾波器對vPPG信號進行進一步處理,得到最終的vPPG信號。將vPPG信號與指尖同步采集的PPG信號進行比對,如圖3所示,vPPG信號具有顯著周期性的脈搏波波形,且與指尖PPG信號在大體上吻合,但一些vPPG信號存在重搏波消失等現象。采用計算瞬時心率(單位為bpm)的方法,公式如下所示:

![]() |
式中,IBI為收縮峰值之間的時間,FPS為采集幀率。
對實驗平臺采集的100組vPPG數據進行了驗證,與PPG數據的瞬時心率的均方根誤差在2~7 bmp之間,具有較好的一致性。
3 血壓預測模型
3.1 評價標準
本文采用美國醫療儀器促進協會標準(The Association for The Advancement of Medical Instrumentation,AAMI)[21]和英國高血壓學會(British Hypertension Society,BHS)標準[22]進行評價與判斷。
AAMI一般要求測量受試者數量不少于85例,每例受試者需3組數據,平均絕對誤差(mean absolute error,MAE)≤5 mm Hg,誤差的標準差(standard deviation,STD)≤8 mm Hg。BHS標準根據三種不同閾值下待檢測裝置所測血壓與聽診器所測血壓的累計誤差百分比(cumulative error,CE)進行分級,如表1所示。

3.2 脈搏波特征提取
由于脈搏波特征點的幅值、位置等波形特征與血管外周阻力以及血管壁彈性相關,因此研究中首先采用MIMIC數據庫的PPG信號,盡可能完備地提取時間特征、幅值特征、面積特征以及相關的生理參量。由于篇幅原因只在此處說明提取相關特征的類型與數目,用于血壓預測的vPPG特征將于特征篩選與優化部分進行具體說明與解釋。根據收縮時間ST、舒張時間DT共計算出12個時間特征,根據脈搏波波峰幅值H、波形特征K以及相關時間特征共計算出11個面積特征,根據時間特征與面積特征共計算出一階微分特征9個,提取生理參數特征每搏心搏輸出量Z、心輸出量SV以及外周阻力TPR共3個,提取傅里葉變換域特征25個、小波域特征5個、Hilbert變換域特征13個,共計78個特征。
3.3 單人血壓預測模型構建與選擇
本研究首先根據脈搏波信號特征以及與血壓之間的關系,初步選擇基于粒子群優化的Elman神經網絡、深度信念網絡(deep belief network,DBN)以及支持向量機(support vector machine,SVM)算法進行單人的血壓模型構建,進行比較與評價后得出最優算法用于后續的特征篩選驗證以及通用模型構建。
Elman神經網絡是一種前饋神經網絡[23],相比于普通神經網絡增加了承接層與循環連接。為了增強網絡的穩定性,采用粒子群優化算法(particle swarm optimization,PSO)尋找最優權值以及閾值,并采用變異操作在每次粒子更新后以一定概率重新初始化粒子,防止PSO算法出現過早收斂、搜索精度降低等問題。
SVM算法是一種強大的分類器[24-25],對于線性分類以及非線性分類均有很好的表現,目前廣泛地應用于小樣本數據以及生理數據處理方面[26]。經過測試后,本文采用基于RBF內核的SVR算法進行模型的構建。對于模型中的超參數,采用網格參數尋優函數SVMcgForRegress進行確定與優化。
DBN算法是由受限玻爾茲曼機(restricted Boltzmann machine,RBM)堆疊形成的分層結構[27],并采用逐層學習算法進行訓練。RBM預訓練中可利用大量無標簽數據對單個RBM進行訓練,使得輸入的特征參數在降維時保留更多的信息,通過反向傳播來調整相關參數,最終得到訓練好的DBN網絡。
研究中共采用102例MIMIC數據庫受試者數據以及實驗平臺采集的5例受試者的指尖PPG與血壓數據,采用提取到的78個PPG特征作為模型的輸入。每例受試者60%的數據采用三折交叉驗證的方法進行模型的構建,40%數據用于測試。由MIMIC數據庫數據進行模型的測試結果,對于三種模型而言,均滿足AAMI標準,由SVR方法構建的模型具有最高的精確度,收縮壓(systolic blood pressure,SBP)MAE為3.3 mm Hg,STD為3.9 mm Hg;舒張壓(diastolic blood pressure,DBP)MAE為1.75 mm Hg,STD為2.25 mm Hg。由實驗平臺采集數據構建模型的預測SBP與DBP均滿足AAMI標準,且SVR模型的預測精度均高于其他兩種模型。為了進一步評價SVR算法的可行性與準確度,對來自數據庫與實驗平臺共107例受試者的數據進行誤差統計,如表2所示,模型的預測結果均滿足BHS的A級標準,因此我們選擇SVR算法作為血壓預測模型構建方法。

3.4 特征篩選與優化
由于不同個體之間的生理差異性,如年齡、性別、健康狀態等[28],導致不同人群之間脈搏波特征與血壓的相關程度不同,因此對于提取到的78個脈搏波特征需要進行優化,才能保證血壓預測模型的準確度。其次,vPPG與PPG信號之間存在著波形等方面的差異,為了保證模型構建以及算法的復雜度,需要對特征進行進一步篩選。本文設計了一種基于集成特征選擇的方法,對78個特征進行優化,最終篩選出6/7個脈搏波特征用于血壓的預測。
我們選用兩種過濾式特征選擇方法[RRelieff和近鄰成分分析(neighborhood component analysis,NCA)法]和兩種嵌入式特征選擇方法[平均影響值(mean impact value,MIV)法和基于支持向量機的遞歸特征消除(support vector machine-recursive feature elimination,SVM-RFE)法],采用基于排名的穩定性聚合技術,進行集成特征選擇。集成穩定性聚合方法步驟如下:首先對B個訓練樣本應用特征選擇方法進行排名,得到r1,r2,···,rn排序,之后通過計算每個特征Ji的得分Si,將得分Si作為該特征選擇的特征權重得分進行特征排序。當該特征的排序處于我們所選擇的特征參數數目s以內時,則對該特征進行選取。
圖4為特征選擇方法的總體流程圖,采用MIMIC數據庫中65例受試者的3段不同時間段數據,共195組數據進行特征選擇。每組數據首先采用四種方法分別進行特征排序,對于每種方法得到的特征排序結果,采用穩定性聚合的方法得到4種特征權重排序,對于這4種特征權重排序,再次進行穩定性聚合,得到最終的排序結果。

如圖5所示,我們首先對特征數量進行了選擇與驗證。采用參與特征選擇的65例受試者的任意一組數據,對于排序后的78個特征分別選取排序靠前的前3到前20個,以及前30、40、50、60個特征分別進行SVR模型構建,并使用參與特征選擇的65例受試者剩余的130組數據,以及未參與特征選擇的37例受試者的111組數據,共計241組數據分別進行驗證,當選擇特征數目增加至4個以后,預測誤差基本上趨于穩定。

為了獲得更加精確的特征數目,對選擇特征數目4、6/7、15進行進一步的驗證,結果如表3所示。綜合運算速度與預測精度,確定采用前6個PPG特征進行SBP預測,前7個PPG特征進行DBP預測。

3.5 通用血壓預測模型構建
我們將vPPG所提取到的特征按上述方法進行排序后,提取前6/7個特征與PPG特征進行比較,結果如表4所示。選擇平均絕對百分比誤差(mean absolute percentage error,MAPE)均在20%以內的P5、F1、F2、T、RP5、RP6共6個特征用于通用血壓預測模型的構建。

最終我們采用SVR算法,使用篩選后的6個脈搏波特征作為輸入,采用MIMIC數據庫數據構建通用連續血壓預測模型,并使用實驗平臺所采集到的5例受試者的100組數據進行模型的驗證。
4 結果與討論
4.1 視頻血壓預測結果
結果表明,采用通用血壓預測模型所得SBP的MAE為4.9 mm Hg,STD為5.9 mm Hg,DBP的MAE為4.6 mm Hg,STD為5.0 mm Hg,滿足AAMI標準;如表5所示,血壓預測結果也滿足BHS的A級標準。

最后,對由視頻估計出的血壓與實驗測得的標準血壓進行了一致性分析,由圖6可知,視頻估計出的SBP與實驗測得的標準SBP的皮爾遜相關系數達到0.94,即存在94%的視頻估計值與實驗標準值的誤差值落在95%一致性區間內(–6.5 mm Hg,7.6 mm Hg),且在一致性區間內的差值絕對值最大為7.6 mm Hg;由視頻估計出的DBP與標準DBP的皮爾遜相關系數達到0.94,即存在94%的視頻估計值與實驗標準值的誤差值落在95%一致性區間內(–5.1 mm Hg,5.9 mm Hg),且在一致性區間內的差值絕對值最大為5.9 mm Hg,因此可以認為由視頻估計的血壓與實驗測得的標準血壓具有較好的一致性。

4.2 總結與展望
本文基于MIMIC數據庫與實驗平臺采集的數據,實現了一種基于視頻流的非接觸式血壓測量方法。視頻數據預處理部分,采用CDF與ICA相結合的方法有效地提取出vPPG信號;對基于粒子群優化的Elman神經網絡、SVR與DBN三種方法進行了比較與選擇,將SVR方法作為模型構建方法;共提取78個脈搏波時頻域特征,并且設計具有數據多樣性與算法多樣性的集成特征選擇方法對特征進行篩選與優化,得到6個vPPG最優特征用于通用模型構建;最終建立基于SVR的通用血壓預測模型,預測結果符合AAMI與BHS標準。本研究還可繼續進行優化與改進。受限于時間以及實驗條件,實驗平臺所采集的受試者數量不足,后續研究可采集更多人群的數據用于視頻血壓估計。
基于視頻的血壓測量方法檢測過程簡單,設備便于攜帶,具有廣泛的應用場景與市場需求。該方法可用于網絡遠程醫療、自身居家健康檢測及上班族在使用電腦工作時的健康檢測。進一步的,可采集不同場景下,以及高血壓、低血壓等不同受試者樣本數據來完善模型,有望用于臨床工作中的連續血壓測量。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:閆昊負責論文寫作、血壓模型構建和整體流程設計;李霞負責數據采集與處理和特征篩選;朱田楊負責視頻數據處理;龔寧負責數據采集和數據預處理;陳修強負責數據采集和特征提取;周秦武負責方法流程設計與指導以及文章寫作指導。
0 引言
高血壓是危害人類健康的首要疾病之一,相關數據[1]表明,1990年至2019年間,全球高血壓人數已經由約6.5億增至12.8億。隨著生活水平的提高,快節奏、高壓力的生活方式成為心血管疾病的誘因,伴隨人口老齡化程度的加重[2],高血壓在我國的發病率也逐年上升,因此高血壓的防控顯得尤為重要。
血壓(blood pressure,BP)測量可分為有創測量與無創測量[3],根據測量結果可分為間斷式與連續式測量方法。近年來,基于光電容積脈搏波描記法(photoplethysmography,PPG)的連續無創血壓測量研究層出不窮[4-10]。其中非接觸式連續血壓測量方法具有測量過程舒適、方法簡單、易于攜帶等特點,被國內外學者廣為關注。2008年,Verkruysse等[11]提出了在環境光下提取面部視頻信號中的遠程光電容積脈搏波描記法(video-photoplethysmography,vPPG)信號,使得該血壓測量方式成為可能。2016年,Jain等[12]提出僅采用面部視頻提取vPPG特征,建立多項式回歸模型對血壓進行估計。2019年,Luo等[13]采用智能手機攝像頭獲取面部不同位置的vPPG信號,構建多層感知機模型對連續血壓進行預測,但其準確度有待提高。
目前基于單vPPG作為信號源的非接觸式血壓估計方法較少,而且沒有相關的公開數據源可供參考與研究,同時非接觸式血壓估計的準確度還有待進一步提高。針對以上問題,本文提出了一種基于視頻流的非接觸式連續血壓檢測算法:采用MIMIC數據庫數據[14-15]以及實驗平臺采集數據,豐富數據量,構建不同血壓估計模型并進行篩選,設計集成特征選擇算法對vPPG特征進行篩選與優化,基于皮膚生理與光學特性與信號處理分離技術相結合的方法提取vPPG信號,以此來提高血壓估計的可信度與準確度。
1 信號產生原理
1.1 血壓的生理機制
血液在血管中流動并對血管壁產生的壓力稱為血壓,血壓的變化受到血液充盈量、心臟周期性泵血、動脈血管彈性以及外周阻力等相關因素影響。血液的充盈程度直接影響著血壓的大小。
1.2 脈搏波的生理機制
PPG的波形反映了血管內血容量的變化,當心血管發生異常時,會引起PPG波形的改變,而血壓的變化也會受到血容量的影響,因此PPG信號的時頻域特征與血壓之間存在相關性,對PPG信號特征的相關研究,能夠使我們對血壓進行預測與分析。
1.3 PPG與vPPG的采集原理
PPG的采集利用光學原理與皮膚特性,當光線照射到皮膚組織時,部分光線經過皮膚內部的角質層、結締組織以及微動靜脈等人體組織后,會從皮膚反射出來[16],由傳感器接收光強變化即得到PPG信號。vPPG的采集原理與PPG相似,也可叫做遠程光電容積描記術(remote PPG,rPPG),在環境光的照射下,使用攝像頭記錄面部由心臟泵血引起的光強變化,即vPPG信號。
2 信號處理部分
2.1 實驗數據庫
本文數據來源于兩部分,一部分為MIMIC數據庫的連續血壓與PPG數據;另一部分來自實驗平臺所采集的面部視頻數據與連續血壓數據。經過篩選后,共選取了MIMIC數據庫中102例受試者的相關數據,每例受試者3組數據,每組數據長度約為10 min。
在實驗平臺的數據采集中,受試者采用校內自由招募的形式,在實驗前均需簽署實驗告知書。采用日本Canon EOS 60D相機記錄面部視頻數據,采用美國BIOPAC MP160型16通道生理儀進行連續血壓與指尖PPG信號的采集。測量過程中,受試者與相機距離約為1 m,受試者盡量保持靜止狀態,保證面部充滿整個屏幕,在白天室內正常光線下以及夜晚日光燈照明下,記錄不同時間段數據。每例受試者記錄15~20組數據,每組數據2 min左右。共采集5例受試者視頻數據,并經受試者知情同意,所采集數據可用于科學研究,采樣率為60 fps,分辨率為1 280*720,指尖PPG信號采樣率為1 000 Hz,共100組數據。
2.2 數據預處理
對于MIMIC數據庫受試者的PPG數據,我們采用以coif5為母小波對其進行分解,采用軟閾值策略對信號進行去噪處理,最后重構恢復出干凈的PPG信號。對于實驗平臺采集到的vPPG數據,通過對視頻信號中感興趣區域(region of interest,ROI)的選取,降低vPPG的提取難度,并且提高圖像處理的速度。Kwon等[17]的研究顯示,眼睛下方區域顯示出良好的信號質量。經過選擇面部不同區域如額頭、鼻子、下巴等進行驗證與測試,我們同樣選擇左側眼睛下眼瞼部位的臉頰中部區域作為我們的ROI區域,用于后續vPPG的提取,ROI區域分辨率為200*200,如圖1所示,紅色框選區域為ROI區域。

本文結合皮膚光學特性以及信號分離方法,采用顏色失真濾波器(color distortion filter,CDF)與獨立成分分析(independent component analysis,ICA)算法相結合的脈搏波檢測方法,對vPPG信號進行預處理與提取。圖2為vPPG信號的預處理與提取流程。

CDF由Wang等[18]提出,該方法能夠去除顏色引起的干擾以及其他生理信號如呼吸等干擾。CDF處理步驟主要包括數據預處理、定義特征顏色空間以及加權計算能量濾波。
ICA是一種盲源信號提取方法[19-20],可從多源干擾信號中提取出所需要的目標信號。如圖2所示,CDF濾波器處理后的RGB三個通道信號經過ICA算法處理后獲得了三個通道中存在的近似vPPG信號,即成分1、2、3。根據頻譜分析對三種成分進行自動提取,如圖2所示,選擇頻譜與PPG信號相近的成分2作為vPPG信號。
之后我們設計切比雪夫Ⅰ型濾波器對vPPG信號進行進一步處理,得到最終的vPPG信號。將vPPG信號與指尖同步采集的PPG信號進行比對,如圖3所示,vPPG信號具有顯著周期性的脈搏波波形,且與指尖PPG信號在大體上吻合,但一些vPPG信號存在重搏波消失等現象。采用計算瞬時心率(單位為bpm)的方法,公式如下所示:

![]() |
式中,IBI為收縮峰值之間的時間,FPS為采集幀率。
對實驗平臺采集的100組vPPG數據進行了驗證,與PPG數據的瞬時心率的均方根誤差在2~7 bmp之間,具有較好的一致性。
3 血壓預測模型
3.1 評價標準
本文采用美國醫療儀器促進協會標準(The Association for The Advancement of Medical Instrumentation,AAMI)[21]和英國高血壓學會(British Hypertension Society,BHS)標準[22]進行評價與判斷。
AAMI一般要求測量受試者數量不少于85例,每例受試者需3組數據,平均絕對誤差(mean absolute error,MAE)≤5 mm Hg,誤差的標準差(standard deviation,STD)≤8 mm Hg。BHS標準根據三種不同閾值下待檢測裝置所測血壓與聽診器所測血壓的累計誤差百分比(cumulative error,CE)進行分級,如表1所示。

3.2 脈搏波特征提取
由于脈搏波特征點的幅值、位置等波形特征與血管外周阻力以及血管壁彈性相關,因此研究中首先采用MIMIC數據庫的PPG信號,盡可能完備地提取時間特征、幅值特征、面積特征以及相關的生理參量。由于篇幅原因只在此處說明提取相關特征的類型與數目,用于血壓預測的vPPG特征將于特征篩選與優化部分進行具體說明與解釋。根據收縮時間ST、舒張時間DT共計算出12個時間特征,根據脈搏波波峰幅值H、波形特征K以及相關時間特征共計算出11個面積特征,根據時間特征與面積特征共計算出一階微分特征9個,提取生理參數特征每搏心搏輸出量Z、心輸出量SV以及外周阻力TPR共3個,提取傅里葉變換域特征25個、小波域特征5個、Hilbert變換域特征13個,共計78個特征。
3.3 單人血壓預測模型構建與選擇
本研究首先根據脈搏波信號特征以及與血壓之間的關系,初步選擇基于粒子群優化的Elman神經網絡、深度信念網絡(deep belief network,DBN)以及支持向量機(support vector machine,SVM)算法進行單人的血壓模型構建,進行比較與評價后得出最優算法用于后續的特征篩選驗證以及通用模型構建。
Elman神經網絡是一種前饋神經網絡[23],相比于普通神經網絡增加了承接層與循環連接。為了增強網絡的穩定性,采用粒子群優化算法(particle swarm optimization,PSO)尋找最優權值以及閾值,并采用變異操作在每次粒子更新后以一定概率重新初始化粒子,防止PSO算法出現過早收斂、搜索精度降低等問題。
SVM算法是一種強大的分類器[24-25],對于線性分類以及非線性分類均有很好的表現,目前廣泛地應用于小樣本數據以及生理數據處理方面[26]。經過測試后,本文采用基于RBF內核的SVR算法進行模型的構建。對于模型中的超參數,采用網格參數尋優函數SVMcgForRegress進行確定與優化。
DBN算法是由受限玻爾茲曼機(restricted Boltzmann machine,RBM)堆疊形成的分層結構[27],并采用逐層學習算法進行訓練。RBM預訓練中可利用大量無標簽數據對單個RBM進行訓練,使得輸入的特征參數在降維時保留更多的信息,通過反向傳播來調整相關參數,最終得到訓練好的DBN網絡。
研究中共采用102例MIMIC數據庫受試者數據以及實驗平臺采集的5例受試者的指尖PPG與血壓數據,采用提取到的78個PPG特征作為模型的輸入。每例受試者60%的數據采用三折交叉驗證的方法進行模型的構建,40%數據用于測試。由MIMIC數據庫數據進行模型的測試結果,對于三種模型而言,均滿足AAMI標準,由SVR方法構建的模型具有最高的精確度,收縮壓(systolic blood pressure,SBP)MAE為3.3 mm Hg,STD為3.9 mm Hg;舒張壓(diastolic blood pressure,DBP)MAE為1.75 mm Hg,STD為2.25 mm Hg。由實驗平臺采集數據構建模型的預測SBP與DBP均滿足AAMI標準,且SVR模型的預測精度均高于其他兩種模型。為了進一步評價SVR算法的可行性與準確度,對來自數據庫與實驗平臺共107例受試者的數據進行誤差統計,如表2所示,模型的預測結果均滿足BHS的A級標準,因此我們選擇SVR算法作為血壓預測模型構建方法。

3.4 特征篩選與優化
由于不同個體之間的生理差異性,如年齡、性別、健康狀態等[28],導致不同人群之間脈搏波特征與血壓的相關程度不同,因此對于提取到的78個脈搏波特征需要進行優化,才能保證血壓預測模型的準確度。其次,vPPG與PPG信號之間存在著波形等方面的差異,為了保證模型構建以及算法的復雜度,需要對特征進行進一步篩選。本文設計了一種基于集成特征選擇的方法,對78個特征進行優化,最終篩選出6/7個脈搏波特征用于血壓的預測。
我們選用兩種過濾式特征選擇方法[RRelieff和近鄰成分分析(neighborhood component analysis,NCA)法]和兩種嵌入式特征選擇方法[平均影響值(mean impact value,MIV)法和基于支持向量機的遞歸特征消除(support vector machine-recursive feature elimination,SVM-RFE)法],采用基于排名的穩定性聚合技術,進行集成特征選擇。集成穩定性聚合方法步驟如下:首先對B個訓練樣本應用特征選擇方法進行排名,得到r1,r2,···,rn排序,之后通過計算每個特征Ji的得分Si,將得分Si作為該特征選擇的特征權重得分進行特征排序。當該特征的排序處于我們所選擇的特征參數數目s以內時,則對該特征進行選取。
圖4為特征選擇方法的總體流程圖,采用MIMIC數據庫中65例受試者的3段不同時間段數據,共195組數據進行特征選擇。每組數據首先采用四種方法分別進行特征排序,對于每種方法得到的特征排序結果,采用穩定性聚合的方法得到4種特征權重排序,對于這4種特征權重排序,再次進行穩定性聚合,得到最終的排序結果。

如圖5所示,我們首先對特征數量進行了選擇與驗證。采用參與特征選擇的65例受試者的任意一組數據,對于排序后的78個特征分別選取排序靠前的前3到前20個,以及前30、40、50、60個特征分別進行SVR模型構建,并使用參與特征選擇的65例受試者剩余的130組數據,以及未參與特征選擇的37例受試者的111組數據,共計241組數據分別進行驗證,當選擇特征數目增加至4個以后,預測誤差基本上趨于穩定。

為了獲得更加精確的特征數目,對選擇特征數目4、6/7、15進行進一步的驗證,結果如表3所示。綜合運算速度與預測精度,確定采用前6個PPG特征進行SBP預測,前7個PPG特征進行DBP預測。

3.5 通用血壓預測模型構建
我們將vPPG所提取到的特征按上述方法進行排序后,提取前6/7個特征與PPG特征進行比較,結果如表4所示。選擇平均絕對百分比誤差(mean absolute percentage error,MAPE)均在20%以內的P5、F1、F2、T、RP5、RP6共6個特征用于通用血壓預測模型的構建。

最終我們采用SVR算法,使用篩選后的6個脈搏波特征作為輸入,采用MIMIC數據庫數據構建通用連續血壓預測模型,并使用實驗平臺所采集到的5例受試者的100組數據進行模型的驗證。
4 結果與討論
4.1 視頻血壓預測結果
結果表明,采用通用血壓預測模型所得SBP的MAE為4.9 mm Hg,STD為5.9 mm Hg,DBP的MAE為4.6 mm Hg,STD為5.0 mm Hg,滿足AAMI標準;如表5所示,血壓預測結果也滿足BHS的A級標準。

最后,對由視頻估計出的血壓與實驗測得的標準血壓進行了一致性分析,由圖6可知,視頻估計出的SBP與實驗測得的標準SBP的皮爾遜相關系數達到0.94,即存在94%的視頻估計值與實驗標準值的誤差值落在95%一致性區間內(–6.5 mm Hg,7.6 mm Hg),且在一致性區間內的差值絕對值最大為7.6 mm Hg;由視頻估計出的DBP與標準DBP的皮爾遜相關系數達到0.94,即存在94%的視頻估計值與實驗標準值的誤差值落在95%一致性區間內(–5.1 mm Hg,5.9 mm Hg),且在一致性區間內的差值絕對值最大為5.9 mm Hg,因此可以認為由視頻估計的血壓與實驗測得的標準血壓具有較好的一致性。

4.2 總結與展望
本文基于MIMIC數據庫與實驗平臺采集的數據,實現了一種基于視頻流的非接觸式血壓測量方法。視頻數據預處理部分,采用CDF與ICA相結合的方法有效地提取出vPPG信號;對基于粒子群優化的Elman神經網絡、SVR與DBN三種方法進行了比較與選擇,將SVR方法作為模型構建方法;共提取78個脈搏波時頻域特征,并且設計具有數據多樣性與算法多樣性的集成特征選擇方法對特征進行篩選與優化,得到6個vPPG最優特征用于通用模型構建;最終建立基于SVR的通用血壓預測模型,預測結果符合AAMI與BHS標準。本研究還可繼續進行優化與改進。受限于時間以及實驗條件,實驗平臺所采集的受試者數量不足,后續研究可采集更多人群的數據用于視頻血壓估計。
基于視頻的血壓測量方法檢測過程簡單,設備便于攜帶,具有廣泛的應用場景與市場需求。該方法可用于網絡遠程醫療、自身居家健康檢測及上班族在使用電腦工作時的健康檢測。進一步的,可采集不同場景下,以及高血壓、低血壓等不同受試者樣本數據來完善模型,有望用于臨床工作中的連續血壓測量。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:閆昊負責論文寫作、血壓模型構建和整體流程設計;李霞負責數據采集與處理和特征篩選;朱田楊負責視頻數據處理;龔寧負責數據采集和數據預處理;陳修強負責數據采集和特征提取;周秦武負責方法流程設計與指導以及文章寫作指導。