光電容積脈搏(PPG)易受干擾的影響,導致生理信息的誤判,因此在生理信息檢測前對PPG信號的質量進行評估至關重要。針對傳統機器學習方法準確度不高、深度學習方法需要大量樣本訓練的問題,本文提出了一種融合多類特征與多尺度時序信息的PPG信號質量評估的方法。提取多類特征以減少方法對樣本的依賴,采用多尺度卷積和雙向長短時記憶網絡提取多尺度時序信息,以提高質量評估結果的準確率。所提方法在7項試驗的14 700組樣本上,獲得94.21%的準確率,與6種質量評估方法相比,在全部的敏感性、特異性、精準率、F1分數指標上呈現出最好的性能。本文提供了一種PPG信號小樣本質量評估和質量信息挖掘的新方法,有望用于臨床及日常PPG生理信息的準確提取與監測。
引用本文: 漆宇晟, 張愛華, 馬玉潤, 王惠東, 李佳琪, 陳誠. 融合多類特征與多尺度時序信息的光電脈搏信號質量評估方法. 生物醫學工程學雜志, 2023, 40(3): 536-543. doi: 10.7507/1001-5515.202211054 復制
0 引言
光電容積脈搏(photoplethysmography,PPG)信號作為一種便捷、非侵入、低成本的脈搏檢測方式,廣泛應用于臨床、日常心率及血氧飽和度的檢測[1-2]。PPG信號中蘊含著能夠反映人體狀況的生理、病理信息,可用于血壓、睡眠質量、心律失常、健康狀況監測等領域[3-6]。
然而,由于PPG信號較為微弱,在采集過程中常常受到基線漂移、運動偽影、脈沖信號、隨機噪聲、工頻信號等干擾的影響,導致信號質量下降[7]。研究表明,由于臨床干擾導致的誤報警率高達85%[8-9],因此,在提取生理信息前進行PPG信號質量的評估至關重要。
目前,PPG信號的質量評估通常采用基于信號特征的傳統機器學習方法[10-13]。傳統機器學習方法可在一定程度上避免啟發式閾值方法由于決策分界過渡平滑,導致在質量模糊數據上評估性能不佳的問題。但人為提取的特征仍然存在一些問題,如不夠完備、對質量信息的解釋能力不足,以及在不同數據集或復雜干擾下對與PPG信號相似的干擾不敏感等,影響了質量評估的準確性。因此,有學者開始采用能夠提取非標準化信息的深度學習方法。
深度學習方法因其較深的模型結構,在復雜問題的解釋、信息提取上具有優勢,也逐漸應用于PPG信號的質量評估[14-17]。Naeini等[14]提出了一種基于卷積神經網絡(convolutional neural network,CNN)的質量評估方法。CNN結構采用196個卷積核長度為16的濾波器,經最大池化處理后,通過全連接層獲得“好”和“差”的2分類質量標簽,研究表明,通過質量評估提高了心率提取的準確率。Gao等[15]提出了一種基于長短時記憶網絡(long short-term memory,LSTM)的質量評估方法,采用從連續PPG信號上截取固定長度數據放入LSTM網絡的方式,實現數據的遍歷和模型的訓練,最后完成信號質量“高”和“低”的劃分。深度學習方法在PPG信號質量評估領域作出了有益的嘗試,但由于深度網絡參數較多,通常需要大量訓練樣本才能具有較好的質量評估性能和泛化能力。
綜上所述,PPG信號質量評估研究已取得了一定的成果,但仍存在一些問題亟待解決:① 從質量評估方法角度來說,基于信號特征的傳統機器學習方法簡便、高效,但準確率依賴特征提取的完備性。深度學習方法依靠較深的網絡結構,可實現信號質量信息的挖掘,但依賴大量樣本的訓練。② 從信號質量等級角度來說,不夠細致的質量劃分,不足以描述日常復雜干擾影響下的PPG信號質量,也不利于后續對含有干擾PPG信號的處理與分析。
因此,針對以上問題,本文提出融合多類特征與多尺度時序信息的質量評估方法。提取基于PPG信號的多類特征,以減少對樣本量的依賴;挖掘多尺度時序信息,以增加特征的完備性;融合多類特征與多尺度時序信息,以提高質量評估性能。為實現PPG信號的精細化處理與分析,根據干擾類型將信號質量劃分為5類。根據日常生活狀態設計靜止、運動、明顯干擾共7項試驗,通過實測數據驗證所提方法的有效性、準確性及小樣本性能,并與傳統機器學習和深度學習質量評估方法進行對比分析。
1 質量評估方法
本文融合多類特征與多尺度時序信息的質量評估方法如圖1所示(其中左上角圖片引用自本課題組既往文獻[18])。首先,提取有關PPG信號、明顯干擾的多類特征;然后,采用多尺度CNN描述不同尺度下PPG尺度信息,并采用雙向長短時記憶(bi-directional long short-term memory,BiLSTM)網絡提取多尺度時序信息;最后,融合多類特征與多尺度時序信息,通過線性輸出層實現PPG信號質量的劃分。

為抑制PPG信號中的工頻、高頻噪聲的影響,在提取多類特征和多尺度時序信息前,采用截止頻率為40 Hz的3階低通巴特沃斯濾波器對PPG信號進行預處理。
1.1 多類特征提取
為充分提取PPG信號及受干擾影響程度的信息,避免波形個體差異的影響并提升質量評估的性能,多類特征分別選擇PPG信號的波形、統計學、非線性、動態模板特征,以及明顯干擾的脈沖信號、隨機噪聲特征,共10項特征,如表1所示。

1.1.1 PPG信號特征
(1)波形特征:為避免個體差異對PPG信號波形特征的影響,選擇可反映PPG動態變化特點的幅值標準差(A_std)、基線總和(D)、上升時間標準差(RT_std)、下降時間標準差(DT_std)。如圖2所示為PPG信號波峰、波谷以及PPG信號相應波形特征示意圖,波峰、波谷由Billauer算法獲得[13],波形特征A_std、D、RT_std、DT_std可分別由式(1)~(4)計算得到,其中N為當前樣本中完整PPG信號周期的個數,i為第i個PPG信號周期。

![]() |
![]() |
![]() |
![]() |
(2)統計學特征:PPG信號的統計學特征選擇峰度(kurtosis,K)、偏度(skewness,S)[19-20],分別用于衡量信號分布的集中程度和不對稱程度,見式(5)~(6)。其中PPG為樣本信號,μ為信號均值,σ為信號方差,k3、k4分別為3階中心距和4階中心距。
![]() |
![]() |
(3)非線性特征:非線性特征選擇香農熵(shannon entropy,SE)用于評估PPG信號中的信息量[21-22],如式(7)所示。其中n為根據數據分布劃分的數據間隔個數。對于采樣點個數為M的PPG信號,n取值如式(8)所示,ppg_i為數據分布在第i個間隔的數據,P(·)為求概率符號。
![]() |
![]() |
(4)動態模板特征:提出采用動態模板描述PPG信號質量變化指標,避免固定模板易受不同受試者PPG信號波形差異的影響,以提高特征提取的有效性和準確性。如圖3所示,選取峰值點前、后各100個采樣點的數據,作為一個峰值信號段,計算樣本中所有峰值信號段的均值為本組樣本的模板,見式(9)。其中T(i)為PPG信號動態模板第i個點處的數據,N為峰值信號段的個數,PPG_j(i)表示第j個峰值信號段中,第i個點處的數據。因此,各峰值信號段與模板之間距離T_D由式(10)所示。

![]() |
![]() |
1.1.2 明顯干擾特征
(1)脈沖信號特征:脈沖信號是由于劇烈運動導致信號幅值超出采集設備量程,因此設定信號范圍為采集最大量程的4%~96%,脈沖信號特征記作IMPULSE,在范圍內IMPULSE值為0,否則為1。
(2)隨機噪聲特征:隨機噪聲使用脈搏信號變異系數(coefficient of variation,CV)進行檢測[23-24],如式(11)所示,其中PPG_std和PPG_mean分別為PPG信號的標準差和均值。
![]() |
1.2 多尺度時序信息提取
利用多個CNN[25-26]提取PPG信號不同尺度下的局部信息,再利用BiLSTM[27-28]網絡提取PPG信號多尺度的時序信息。
1.2.1 多尺度CNN網絡
本文為充分提取多尺度局部信息,采用卷積核尺寸不同的5個CNN模塊。為去除冗余信息,并防止梯度爆炸和消失,每個CNN模塊由1維CNN網絡、1維最大池化(max pooling,Maxpool)、批歸一化(batch normalization,BN)、線性整流函數(rectified linear unit,ReLU)激活函數構成,如圖1所示。
正常脈搏的搏動周期為30~180次/分,根據采樣頻率對應采樣點個數分別為450和100,為提取更豐富的脈搏信息,將采樣點范圍擴大到32~512。多尺度CNN卷積核尺寸分別選擇32、64、128、256、512,濾波器為8,步長為卷積核尺寸,卷積時不進行填充。為避免最大池化尺寸導致輸入特征權重存在較大差異,每個最大池化的尺寸統一為16。
1.2.2 BiLSTM網絡
利用BiLSTM網絡在時間序列數據上具有長時記憶信息的優勢,提取PPG信號多尺度的序列信息。
BiLSTM包括前向和后向LSTM網絡,主要由輸入門(it)、遺忘門(ft)、輸出門(ot)組成,在訓練過程中通過“門”實現信息的傳遞與丟棄,如圖4所示,其中ht為隱狀態,Ct為細胞狀態,σ(·)、tanh(·)分別為sigmoid和tanh激活函數[29]。

將合并之后的多尺度信息放入BiLSTM網絡訓練,合并數據維度為873。在保證準確率的基礎上降低BiLSTM模型的復雜度,網絡參數選擇1層堆疊,隱藏層節點數為64。
1.3 質量評估及網絡優化
PPG信號質量的輸出采用線性全連接層,其輸入數據分別由BiLSTM的輸出和多類特征組成,因此輸入維度為138,輸出維度為5,激活函數采用sigmoid函數。
為避免質量評估模型過擬合,在BiLSTM網絡采用dropout技術,在線性層采用L2正則。訓練過程中采用Adam優化器,損失函數采用交叉熵函數,學習率為0.000 5。
2 試驗設計
2.1 試驗數據采集
采用本課題組所研制的脈搏檢測系統[18]在血流灌注較為穩定且受運動影響較小的耳后進行PPG信號的檢測,實測圖如圖1所示。為了便于信號的處理與分析,降采樣至300 Hz。
2.2 試驗內容
試驗共招募31名成年受試者,17名男性,14名女性,年齡22~32歲,試驗前告知試驗內容并簽署試驗知情同意書,試驗過程按照《世界醫學協會赫爾辛基宣言》的要求進行。
試驗分別設計平躺、坐姿、站姿、慢走、慢跑、說話、明顯干擾7項試驗。平躺、坐姿、站姿試驗為靜止狀態,用于采集不同強度基線漂移影響下的PPG信號。說話、慢走、慢跑試驗為運動狀態,用于采集不同強度運動偽跡影響下的PPG信號。明顯干擾試驗主要采集傳感器佩戴或取下時的脈沖信號和無PPG信號的隨機噪聲。
2.3 質量標定
以干擾源及干擾強度作為依據標定PPG信號的質量,將主要干擾為基線漂移的靜態試驗(試驗1~3)的信號質量劃分q0和q1,主要干擾為運動偽跡的動態試驗(試驗4~6)的信號質量劃分q2和q3,明顯干擾的信號質量劃分為q4。如表2所示,每項試驗2 100組,7項試驗共14 700組。

2.4 試驗對比方法
為驗證所提模型的準確性和在小樣本數據上的性能,傳統機器學習對比方法分別選擇基于聚類、決策樹、神經網絡和經典分類器的k-最近鄰(k-nearest neighbors,KNN)、隨機森林(random forest,RF)、多層感知器(multilayer perception,MLP)、支持向量機(support vector machine,SVM),特征采用本文的多類特征。深度學習對比方法分別選擇文獻[14]、文獻[15]中的CNN和LSTM方法,通過調整結構中全連接層的維度,滿足樣本輸入維度和輸出質量類別的要求。試驗將70%的樣本作為訓練集,30%的樣本作為測試集,算法通過Scikit-Learn 1.0.2和Pytorch 1.10.1實現,不同質量評估方法參數采用網格搜索尋優,如表3所示。

2.5 模型性能評估指標
為了充分評價質量評估算法的性能,分別選擇準確率、敏感性、特異性、精確率和F1分數指標[30]。
3 試驗結果與分析
3.1 不同模型參數對模型的影響
3.1.1 不同尺度CNN參數及組合
如表4所示,在相同濾波器個數下,多尺度CNN組合準確率高于單尺度CNN;在相同尺度CNN組合下,濾波器8和16結果較為接近,高于濾波器為4的準確率。含有1 024尺度的組合準確率有所下降,其原因在于1 024卷積核長度已超出正常脈搏信號范圍,進一步驗證了多尺度CNN參數選擇的合理性。

3.1.2 不同BiLSTM參數
如表5所示,總體呈現出隱藏層節點數較小時(<64),堆疊層數的增加可提升準確率;當隱藏層節點數大于64時,堆疊層數的增加對準確率貢獻有限。隨著隱藏層節點數和堆疊層數的增加,增加的參數會影響算法在小樣本數據集上的性能。因此,在保證準確率的基礎上提升模型收斂速度,堆疊層數選擇為1,隱藏層節點數選擇為64。

3.1.3 不同學習率及丟棄率參數
如表6所示,學習率越大算法收斂速度越快,當學習率為0.000 1時準確率穩步提升但提升速率較慢,當學習率為0.005時模型迅速收斂,但準確率的波動較大。丟棄率的使用是為了避免算法出現過擬合并提升魯棒性,當丟棄率為0.5時準確率有明顯降低。結合算法的收斂速度和準確率,學習率和丟棄率分別選擇為0.000 5、0.2。

3.2 消融實驗
為驗證算法改進對質量評估性能的提升,以PPG信號直接輸入LSTM網絡為基線模型,進行消融實驗。本文主要進行了以下改進:① 改進1:采用多尺度時序信息替代PPG信號,以提高特征提取的完備性;② 改進2:融合多類特征用于質量評估,提供更豐富的PPG信號特征,并提升算法收斂速度;③ 改進3:采用BiLSTM替換LSTM,從前向、后向提取PPG信號的多尺度時序信息。
如表7所示,提出的每項改進均可提升算法的性能,對性能提升從大到小分別為改進2、改進1和改進3,且總體呈現出改進的組合數越多質量評估性能越高。所提的方法具有最高的準確率、敏感性、特異性、F1分數指標,保證了質量評估的有效性和準確性。

3.3 質量評估結果與對比
如表8所示,所提方法具有最高的準確率(94.21%),敏感性、特異性、精準率、F1分數指標均大于0.92,各項指標均好于其他方法。每類標簽下的性能指標詳見附件1和附件2。

q3樣本的準確劃分為本試驗難點。與傳統機器學習方法相比,所提方法q3質量評估敏感性提升約49%,F1分數提升約20%;由于CNN[14]、LSTM[15]將全部q3樣本錯分,導致敏感性、F1分數均為“nan”,精準率為0,如表9所示。

3.4 模型性能與對比
3.4.1 不同樣本量下性能
為驗證所提方法準確率與小樣本量下的性能,將14 700組樣本數據訓練集比例調整為10%、30%、50%、70%、90%,不同質量評估方法準確率如圖5所示。

與傳統機器學習方法相比,得益于多尺度時序信息的融合,所提方法在不同訓練集比例下均具有最高的準確率;與深度學習方法相比,得益于多類特征所提供的能夠快速分類的信息,所提方法在10%訓練樣本下,已具有穩定的質量評估性能。
3.4.2 學習曲線
為直觀反映所提方法的訓練過程及性能,對準確率和損失曲線進行分析,如圖6所示。由于本文方法采用了多類特征,有效提升了訓練初期的收斂速度,并依據多尺度時序信息,進一步降低了損失,因此,準確率、收斂速度、損失指標均好于CNN[14]、LSTM[15]方法。

3.4.3 不同信噪比下性能
為進一步驗證算法魯棒性,在特征及PPG信號上疊加高斯噪聲,并對不同質量評估方法進行性能分析。如表10所示,傳統機器學習方法和CNN[14]方法隨著信噪比的降低質量評估準確率有較大程度的降低,LSTM[15]準確率降低程度較小,說明含有噪聲的多類特征和PPG信號均會影響質量評估的準確率,而本文所提方法在不同信噪比下均具有最高的準確率且波動較小。

4 結論
本文提出采用融合多類特征與多尺度時序信息的質量評估方法,以解決傳統機器學習和深度學習方法在質量評估中存在的準確率不高、需大量訓練樣本的問題。相較于傳統機器學習和深度學習方法,所提方法在10%的訓練樣本下已具有穩定的質量評估性能,在不同樣本比例下均具有最高的準確率,且在質量q3樣本中的敏感性提升了49%,F1分數提升了20%。
綜上所述,本文提供了一種既能用于小樣本,又能提高準確率的質量評估方法,在質量劃分精細和質量較難準確判別的樣本上具有明顯優勢,為質量信息的深度挖掘及質量評估方法用于小樣本性能的提升提供了新的思路,為復雜干擾下PPG信號的精細化處理、分析提供了依據,為進一步臨床及日常對PPG信號所蘊含生理信息的準確提取與監測提供了可行方案。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:漆宇晟主要負責平臺的搭建、試驗的設計、算法的實現以及論文的撰寫;張愛華、馬玉潤主要負責試驗的整體安排以及論文的修訂;王惠東、李佳琪、陳誠負責數據的記錄與分析以及論文的修訂。
本文附件見本刊網站的電子版本(biomedeng.cn)。
0 引言
光電容積脈搏(photoplethysmography,PPG)信號作為一種便捷、非侵入、低成本的脈搏檢測方式,廣泛應用于臨床、日常心率及血氧飽和度的檢測[1-2]。PPG信號中蘊含著能夠反映人體狀況的生理、病理信息,可用于血壓、睡眠質量、心律失常、健康狀況監測等領域[3-6]。
然而,由于PPG信號較為微弱,在采集過程中常常受到基線漂移、運動偽影、脈沖信號、隨機噪聲、工頻信號等干擾的影響,導致信號質量下降[7]。研究表明,由于臨床干擾導致的誤報警率高達85%[8-9],因此,在提取生理信息前進行PPG信號質量的評估至關重要。
目前,PPG信號的質量評估通常采用基于信號特征的傳統機器學習方法[10-13]。傳統機器學習方法可在一定程度上避免啟發式閾值方法由于決策分界過渡平滑,導致在質量模糊數據上評估性能不佳的問題。但人為提取的特征仍然存在一些問題,如不夠完備、對質量信息的解釋能力不足,以及在不同數據集或復雜干擾下對與PPG信號相似的干擾不敏感等,影響了質量評估的準確性。因此,有學者開始采用能夠提取非標準化信息的深度學習方法。
深度學習方法因其較深的模型結構,在復雜問題的解釋、信息提取上具有優勢,也逐漸應用于PPG信號的質量評估[14-17]。Naeini等[14]提出了一種基于卷積神經網絡(convolutional neural network,CNN)的質量評估方法。CNN結構采用196個卷積核長度為16的濾波器,經最大池化處理后,通過全連接層獲得“好”和“差”的2分類質量標簽,研究表明,通過質量評估提高了心率提取的準確率。Gao等[15]提出了一種基于長短時記憶網絡(long short-term memory,LSTM)的質量評估方法,采用從連續PPG信號上截取固定長度數據放入LSTM網絡的方式,實現數據的遍歷和模型的訓練,最后完成信號質量“高”和“低”的劃分。深度學習方法在PPG信號質量評估領域作出了有益的嘗試,但由于深度網絡參數較多,通常需要大量訓練樣本才能具有較好的質量評估性能和泛化能力。
綜上所述,PPG信號質量評估研究已取得了一定的成果,但仍存在一些問題亟待解決:① 從質量評估方法角度來說,基于信號特征的傳統機器學習方法簡便、高效,但準確率依賴特征提取的完備性。深度學習方法依靠較深的網絡結構,可實現信號質量信息的挖掘,但依賴大量樣本的訓練。② 從信號質量等級角度來說,不夠細致的質量劃分,不足以描述日常復雜干擾影響下的PPG信號質量,也不利于后續對含有干擾PPG信號的處理與分析。
因此,針對以上問題,本文提出融合多類特征與多尺度時序信息的質量評估方法。提取基于PPG信號的多類特征,以減少對樣本量的依賴;挖掘多尺度時序信息,以增加特征的完備性;融合多類特征與多尺度時序信息,以提高質量評估性能。為實現PPG信號的精細化處理與分析,根據干擾類型將信號質量劃分為5類。根據日常生活狀態設計靜止、運動、明顯干擾共7項試驗,通過實測數據驗證所提方法的有效性、準確性及小樣本性能,并與傳統機器學習和深度學習質量評估方法進行對比分析。
1 質量評估方法
本文融合多類特征與多尺度時序信息的質量評估方法如圖1所示(其中左上角圖片引用自本課題組既往文獻[18])。首先,提取有關PPG信號、明顯干擾的多類特征;然后,采用多尺度CNN描述不同尺度下PPG尺度信息,并采用雙向長短時記憶(bi-directional long short-term memory,BiLSTM)網絡提取多尺度時序信息;最后,融合多類特征與多尺度時序信息,通過線性輸出層實現PPG信號質量的劃分。

為抑制PPG信號中的工頻、高頻噪聲的影響,在提取多類特征和多尺度時序信息前,采用截止頻率為40 Hz的3階低通巴特沃斯濾波器對PPG信號進行預處理。
1.1 多類特征提取
為充分提取PPG信號及受干擾影響程度的信息,避免波形個體差異的影響并提升質量評估的性能,多類特征分別選擇PPG信號的波形、統計學、非線性、動態模板特征,以及明顯干擾的脈沖信號、隨機噪聲特征,共10項特征,如表1所示。

1.1.1 PPG信號特征
(1)波形特征:為避免個體差異對PPG信號波形特征的影響,選擇可反映PPG動態變化特點的幅值標準差(A_std)、基線總和(D)、上升時間標準差(RT_std)、下降時間標準差(DT_std)。如圖2所示為PPG信號波峰、波谷以及PPG信號相應波形特征示意圖,波峰、波谷由Billauer算法獲得[13],波形特征A_std、D、RT_std、DT_std可分別由式(1)~(4)計算得到,其中N為當前樣本中完整PPG信號周期的個數,i為第i個PPG信號周期。

![]() |
![]() |
![]() |
![]() |
(2)統計學特征:PPG信號的統計學特征選擇峰度(kurtosis,K)、偏度(skewness,S)[19-20],分別用于衡量信號分布的集中程度和不對稱程度,見式(5)~(6)。其中PPG為樣本信號,μ為信號均值,σ為信號方差,k3、k4分別為3階中心距和4階中心距。
![]() |
![]() |
(3)非線性特征:非線性特征選擇香農熵(shannon entropy,SE)用于評估PPG信號中的信息量[21-22],如式(7)所示。其中n為根據數據分布劃分的數據間隔個數。對于采樣點個數為M的PPG信號,n取值如式(8)所示,ppg_i為數據分布在第i個間隔的數據,P(·)為求概率符號。
![]() |
![]() |
(4)動態模板特征:提出采用動態模板描述PPG信號質量變化指標,避免固定模板易受不同受試者PPG信號波形差異的影響,以提高特征提取的有效性和準確性。如圖3所示,選取峰值點前、后各100個采樣點的數據,作為一個峰值信號段,計算樣本中所有峰值信號段的均值為本組樣本的模板,見式(9)。其中T(i)為PPG信號動態模板第i個點處的數據,N為峰值信號段的個數,PPG_j(i)表示第j個峰值信號段中,第i個點處的數據。因此,各峰值信號段與模板之間距離T_D由式(10)所示。

![]() |
![]() |
1.1.2 明顯干擾特征
(1)脈沖信號特征:脈沖信號是由于劇烈運動導致信號幅值超出采集設備量程,因此設定信號范圍為采集最大量程的4%~96%,脈沖信號特征記作IMPULSE,在范圍內IMPULSE值為0,否則為1。
(2)隨機噪聲特征:隨機噪聲使用脈搏信號變異系數(coefficient of variation,CV)進行檢測[23-24],如式(11)所示,其中PPG_std和PPG_mean分別為PPG信號的標準差和均值。
![]() |
1.2 多尺度時序信息提取
利用多個CNN[25-26]提取PPG信號不同尺度下的局部信息,再利用BiLSTM[27-28]網絡提取PPG信號多尺度的時序信息。
1.2.1 多尺度CNN網絡
本文為充分提取多尺度局部信息,采用卷積核尺寸不同的5個CNN模塊。為去除冗余信息,并防止梯度爆炸和消失,每個CNN模塊由1維CNN網絡、1維最大池化(max pooling,Maxpool)、批歸一化(batch normalization,BN)、線性整流函數(rectified linear unit,ReLU)激活函數構成,如圖1所示。
正常脈搏的搏動周期為30~180次/分,根據采樣頻率對應采樣點個數分別為450和100,為提取更豐富的脈搏信息,將采樣點范圍擴大到32~512。多尺度CNN卷積核尺寸分別選擇32、64、128、256、512,濾波器為8,步長為卷積核尺寸,卷積時不進行填充。為避免最大池化尺寸導致輸入特征權重存在較大差異,每個最大池化的尺寸統一為16。
1.2.2 BiLSTM網絡
利用BiLSTM網絡在時間序列數據上具有長時記憶信息的優勢,提取PPG信號多尺度的序列信息。
BiLSTM包括前向和后向LSTM網絡,主要由輸入門(it)、遺忘門(ft)、輸出門(ot)組成,在訓練過程中通過“門”實現信息的傳遞與丟棄,如圖4所示,其中ht為隱狀態,Ct為細胞狀態,σ(·)、tanh(·)分別為sigmoid和tanh激活函數[29]。

將合并之后的多尺度信息放入BiLSTM網絡訓練,合并數據維度為873。在保證準確率的基礎上降低BiLSTM模型的復雜度,網絡參數選擇1層堆疊,隱藏層節點數為64。
1.3 質量評估及網絡優化
PPG信號質量的輸出采用線性全連接層,其輸入數據分別由BiLSTM的輸出和多類特征組成,因此輸入維度為138,輸出維度為5,激活函數采用sigmoid函數。
為避免質量評估模型過擬合,在BiLSTM網絡采用dropout技術,在線性層采用L2正則。訓練過程中采用Adam優化器,損失函數采用交叉熵函數,學習率為0.000 5。
2 試驗設計
2.1 試驗數據采集
采用本課題組所研制的脈搏檢測系統[18]在血流灌注較為穩定且受運動影響較小的耳后進行PPG信號的檢測,實測圖如圖1所示。為了便于信號的處理與分析,降采樣至300 Hz。
2.2 試驗內容
試驗共招募31名成年受試者,17名男性,14名女性,年齡22~32歲,試驗前告知試驗內容并簽署試驗知情同意書,試驗過程按照《世界醫學協會赫爾辛基宣言》的要求進行。
試驗分別設計平躺、坐姿、站姿、慢走、慢跑、說話、明顯干擾7項試驗。平躺、坐姿、站姿試驗為靜止狀態,用于采集不同強度基線漂移影響下的PPG信號。說話、慢走、慢跑試驗為運動狀態,用于采集不同強度運動偽跡影響下的PPG信號。明顯干擾試驗主要采集傳感器佩戴或取下時的脈沖信號和無PPG信號的隨機噪聲。
2.3 質量標定
以干擾源及干擾強度作為依據標定PPG信號的質量,將主要干擾為基線漂移的靜態試驗(試驗1~3)的信號質量劃分q0和q1,主要干擾為運動偽跡的動態試驗(試驗4~6)的信號質量劃分q2和q3,明顯干擾的信號質量劃分為q4。如表2所示,每項試驗2 100組,7項試驗共14 700組。

2.4 試驗對比方法
為驗證所提模型的準確性和在小樣本數據上的性能,傳統機器學習對比方法分別選擇基于聚類、決策樹、神經網絡和經典分類器的k-最近鄰(k-nearest neighbors,KNN)、隨機森林(random forest,RF)、多層感知器(multilayer perception,MLP)、支持向量機(support vector machine,SVM),特征采用本文的多類特征。深度學習對比方法分別選擇文獻[14]、文獻[15]中的CNN和LSTM方法,通過調整結構中全連接層的維度,滿足樣本輸入維度和輸出質量類別的要求。試驗將70%的樣本作為訓練集,30%的樣本作為測試集,算法通過Scikit-Learn 1.0.2和Pytorch 1.10.1實現,不同質量評估方法參數采用網格搜索尋優,如表3所示。

2.5 模型性能評估指標
為了充分評價質量評估算法的性能,分別選擇準確率、敏感性、特異性、精確率和F1分數指標[30]。
3 試驗結果與分析
3.1 不同模型參數對模型的影響
3.1.1 不同尺度CNN參數及組合
如表4所示,在相同濾波器個數下,多尺度CNN組合準確率高于單尺度CNN;在相同尺度CNN組合下,濾波器8和16結果較為接近,高于濾波器為4的準確率。含有1 024尺度的組合準確率有所下降,其原因在于1 024卷積核長度已超出正常脈搏信號范圍,進一步驗證了多尺度CNN參數選擇的合理性。

3.1.2 不同BiLSTM參數
如表5所示,總體呈現出隱藏層節點數較小時(<64),堆疊層數的增加可提升準確率;當隱藏層節點數大于64時,堆疊層數的增加對準確率貢獻有限。隨著隱藏層節點數和堆疊層數的增加,增加的參數會影響算法在小樣本數據集上的性能。因此,在保證準確率的基礎上提升模型收斂速度,堆疊層數選擇為1,隱藏層節點數選擇為64。

3.1.3 不同學習率及丟棄率參數
如表6所示,學習率越大算法收斂速度越快,當學習率為0.000 1時準確率穩步提升但提升速率較慢,當學習率為0.005時模型迅速收斂,但準確率的波動較大。丟棄率的使用是為了避免算法出現過擬合并提升魯棒性,當丟棄率為0.5時準確率有明顯降低。結合算法的收斂速度和準確率,學習率和丟棄率分別選擇為0.000 5、0.2。

3.2 消融實驗
為驗證算法改進對質量評估性能的提升,以PPG信號直接輸入LSTM網絡為基線模型,進行消融實驗。本文主要進行了以下改進:① 改進1:采用多尺度時序信息替代PPG信號,以提高特征提取的完備性;② 改進2:融合多類特征用于質量評估,提供更豐富的PPG信號特征,并提升算法收斂速度;③ 改進3:采用BiLSTM替換LSTM,從前向、后向提取PPG信號的多尺度時序信息。
如表7所示,提出的每項改進均可提升算法的性能,對性能提升從大到小分別為改進2、改進1和改進3,且總體呈現出改進的組合數越多質量評估性能越高。所提的方法具有最高的準確率、敏感性、特異性、F1分數指標,保證了質量評估的有效性和準確性。

3.3 質量評估結果與對比
如表8所示,所提方法具有最高的準確率(94.21%),敏感性、特異性、精準率、F1分數指標均大于0.92,各項指標均好于其他方法。每類標簽下的性能指標詳見附件1和附件2。

q3樣本的準確劃分為本試驗難點。與傳統機器學習方法相比,所提方法q3質量評估敏感性提升約49%,F1分數提升約20%;由于CNN[14]、LSTM[15]將全部q3樣本錯分,導致敏感性、F1分數均為“nan”,精準率為0,如表9所示。

3.4 模型性能與對比
3.4.1 不同樣本量下性能
為驗證所提方法準確率與小樣本量下的性能,將14 700組樣本數據訓練集比例調整為10%、30%、50%、70%、90%,不同質量評估方法準確率如圖5所示。

與傳統機器學習方法相比,得益于多尺度時序信息的融合,所提方法在不同訓練集比例下均具有最高的準確率;與深度學習方法相比,得益于多類特征所提供的能夠快速分類的信息,所提方法在10%訓練樣本下,已具有穩定的質量評估性能。
3.4.2 學習曲線
為直觀反映所提方法的訓練過程及性能,對準確率和損失曲線進行分析,如圖6所示。由于本文方法采用了多類特征,有效提升了訓練初期的收斂速度,并依據多尺度時序信息,進一步降低了損失,因此,準確率、收斂速度、損失指標均好于CNN[14]、LSTM[15]方法。

3.4.3 不同信噪比下性能
為進一步驗證算法魯棒性,在特征及PPG信號上疊加高斯噪聲,并對不同質量評估方法進行性能分析。如表10所示,傳統機器學習方法和CNN[14]方法隨著信噪比的降低質量評估準確率有較大程度的降低,LSTM[15]準確率降低程度較小,說明含有噪聲的多類特征和PPG信號均會影響質量評估的準確率,而本文所提方法在不同信噪比下均具有最高的準確率且波動較小。

4 結論
本文提出采用融合多類特征與多尺度時序信息的質量評估方法,以解決傳統機器學習和深度學習方法在質量評估中存在的準確率不高、需大量訓練樣本的問題。相較于傳統機器學習和深度學習方法,所提方法在10%的訓練樣本下已具有穩定的質量評估性能,在不同樣本比例下均具有最高的準確率,且在質量q3樣本中的敏感性提升了49%,F1分數提升了20%。
綜上所述,本文提供了一種既能用于小樣本,又能提高準確率的質量評估方法,在質量劃分精細和質量較難準確判別的樣本上具有明顯優勢,為質量信息的深度挖掘及質量評估方法用于小樣本性能的提升提供了新的思路,為復雜干擾下PPG信號的精細化處理、分析提供了依據,為進一步臨床及日常對PPG信號所蘊含生理信息的準確提取與監測提供了可行方案。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:漆宇晟主要負責平臺的搭建、試驗的設計、算法的實現以及論文的撰寫;張愛華、馬玉潤主要負責試驗的整體安排以及論文的修訂;王惠東、李佳琪、陳誠負責數據的記錄與分析以及論文的修訂。
本文附件見本刊網站的電子版本(biomedeng.cn)。