引用本文: 田晶, 杜宇濤, 王鈺婧, 張雅婧, 閆晶晶, 韓清華, 張巖波. 他汀類藥物對慢性心衰預后的因果推斷研究. 中國循證醫學雜志, 2023, 23(6): 621-626. doi: 10.7507/1672-2531.202211137 復制
慢性心力衰竭是心血管疾病的終末階段,發病率高、預后差。《中國心血管病報告2021》表明,我國心衰患病率已上升至1.3%,5年全因死亡率高達55.4%[1],改善心衰預后成為亟待解決的重大問題。作為治療心血管疾病的重要手段之一,他汀類藥物對心衰患者的作用尚不明確[2]。近年來,隨著他汀類藥物成本下降,驗證其治療心衰的效用,以擴大應用范圍具有重要意義。
藥物的有效性評估與因果關系驗證通常基于隨機對照試驗(randomized controlled trial,RCT),通過嚴格的試驗條件,有效地控制混雜偏倚[3]。但滿足RCT實施條件需要大量的人力、物力支持,在日常診療中難以開展[4]。基于真實世界的醫療數據庫結合隨訪研究,可以很好地為該目的提供服務[5]。然而,傳統的分析方法無法解決真實世界研究的混雜因素,即時依性混雜和治療轉換問題[6]。逆概率加權(inverse probability weighting,IPW)和邊緣結構模型(marginal structural model,MSM)通過樣本加權的方式平衡混雜,可得到對處理因素效果評估的無偏分析[7]。隨著機器學習算法在真實世界復雜數據中的應用,人們開始用其提高因果推斷的準確性。其中,隨機森林采用有放回的方式重復自助采樣得到多個樣本,構建集成決策樹,可準確推斷因果關系[8]。因此,本研究擬融合機器學習的思想,采用隨機森林對概率進行評估,構建MSM,估計他汀類藥物對慢性心衰預后的因果效應,為其臨床應用提供依據。
1 資料與方法
1.1 研究對象
順序入選2018年1月至2020年12月山西省兩所醫院的慢性心力衰竭住院患者。患者納入標準為:年齡≥18歲,診斷為心力衰竭[9],紐約心臟協會(New York Heart Association,NYHA)心功能分級Ⅱ~Ⅳ級,近一個月接受心衰藥物及其他治療措施,自愿參與本項目且住院3次以上的患者。排除因妊娠、肝功能損傷等不能使用他汀類藥物的患者,伴發其他危及生命的疾病預期生存時間<1年及拒絕參加本項目的患者。本研究經山西醫科大學醫學倫理委員會審查批準(批準號:2018LL128),并在中國臨床試驗注冊中心注冊(注冊號:ChiCTR2100043337)。
1.2 數據收集
采用課題組自主設計的慢性心力衰竭患者的病例報告表(case reported form,CRF)收集患者住院信息,內容包括:患者基本情況(年齡、性別、家族史等)、共病(冠心病、高血壓、糖尿病等)、實驗室檢查(血常規、肝腎功能等)、影像學檢查(心臟彩超、冠脈造影等)、治療措施(藥物治療、非藥物治療)。以患者住院的氨基末端腦鈉尿肽(amino-terminal brain natriuretic peptide,NT-proBNP)、NYHA和射血分數(ejection fraction,EF)作為結局指標。
采用Epidata 13.0對數據進行雙錄入。采用R 3.6.2軟件進行數據清洗。刪除缺失比例超過30%的變量及缺失比例超過50%的個體。缺失未達到該比例的,根據具體情況采用回歸填補法和EM法對缺失值進行填補。本研究納入315例患者,經數據處理刪除18例患者。同時,刪除肌酸激酶、肌鈣蛋白、氧飽和度等17項研究變量。
1.3 混雜因素篩選
采用SPSS 26.0軟件進行數據分析。計量資料采用和中位數(四分位數間距)[M(QR)]描述,計數資料采用例數(%)進行描述。計量資料比較采用t檢驗或非參數秩和檢驗,計數資料比較采用χ2檢驗進行單因素篩選,檢驗水準α為0.05。采用Logistic回歸進行多因素篩選,α入為0.05,α出為0.10。
1.4 MSM構建
1.4.1 基本思想
假設每個個體都接受了處理因素的所有水平,此時直接估計不同處理水平結局事件發生的概率就可得到處理因素的真實效應,而不受到任何混雜因素的影響。其核心步驟在于通過IPW,賦予每個個體一定的權重,得到虛擬人群。將混雜因素水平相同的個體視為一個亞人群,在不同的亞人群中,處理因素水平分布相同。此時處理因素的選擇不受任何混雜因素影響,而處理因素與結局指標之間的關系與原人群一致。對這個虛擬人群進行分析,就可以得到處理因素的無偏估計效應[10]。
1.4.2 概率估計
在進行IPW之前,需要評估個體接受處理因素水平的概率。本研究創新性地采用隨機森林進行概率估計。
1.4.3 IPW
在概率估計的基礎上,進行IPW。本研究同時采用穩定權重(stable weight,SW)和截斷權重對個體進行加權。
SW:采用SW加權后能避免出現極端權重及因逆概率權重標準誤膨脹而引起的偏倚。
![]() |
其中,A(k)表示個體在k時間點是否接受他汀類藥物治療,X代表基線混雜因素,L代表時依性混雜因素。
截斷權重:另一種避免極端權重的做法,即將權重的極端值用其鄰近的截斷百分位數來代替。本研究截斷值采取1%、5%和10%[11]。
1.4.4 因果效應估計
在IPW構成的虛擬人群中,采用基于隨機森林的MSM估計他汀類藥物對心衰患者3個結局指標,即NT-proBNP、NYHA和EF的影響。
2 結果
2.1 患者基本情況
本研究共納入297名慢性心衰患者,平均年齡70.8±10.9歲,其中男性187(63.0%)例,女性110(37.0%)例。
2.2 混雜因素篩選
對患者3次住院數據進行混雜因素篩選。患者組間差異單變量分析結果見表1。Logistic回歸表明,同時對服用他汀類藥物和NT-proBNP水平產生影響的混雜因素為堿性磷酸酶(alkaline phosphatase,ALP)、肌酐(creatinine,Cr)、γ-谷氨酰轉肽酶(γ-glutamyl transpeptidase,γ-GT)、左心房前后徑(left atrial diameter,LA);同時對服用他汀類藥物和NYHA水平產生影響的混雜因素為ALP、Cr、LA;同時對服用他汀類藥物和EF水平產生影響的混雜因素為睡眠障礙、Cr、LA。

2.3 權重分布
采用隨機森林進行概率估計,并計算相應的SW,其權重分布見表2。結果表明,加權后的權重均數和中位數都靠近1,說明權重分布較好。依據權重分布,為避免極端權重值的影響,本研究采用SW和截斷權重聯合的方法,分別選取1%、5%及10%對權重進行截斷。

2.4 估計他汀類藥物對不同結局指標的影響
采用傳統的Logistic回歸分析表明,他汀類藥物對慢性心衰患者NT-proBNP水平無顯著影響;采用MSM結果表明,他汀類藥物顯著降低NT-proBNP[OR=0.699,95%CI(0.528,0.926),P=0.012]。說明時依性混雜因素影響了他汀類藥物對NT-proBNP作用效應的估計。然而,無論僅考慮基線混雜因素還是同時考慮時依性混雜因素,他汀類藥物對患者NYHA分級和EF均無顯著影響。結果見表3。

3 討論
作為心血管疾病的重要治療手段,他汀類藥物對心衰患者預后的作用尚不明確。本研究通過MSM,處理了時依性混雜因素和治療轉換在藥物效用分析過程中造成的偏倚,無偏估計了他汀類藥物對慢性心力衰竭患者NT-proBNP、NYHA分級和EF的因果效應。結果表明,他汀類藥物顯著降低心衰患者NT-proBNP水平,為他汀類藥物的臨床應用提供了證據。
本研究發現僅排除基線混雜時,他汀類藥物對患者NT-proBNP無影響;當排除隨時間變化產生的時依性混雜時,他汀類藥物顯著降低NT-proBNP。因而,時依性混雜在他汀類藥物的效用估計中有重要的干擾作用。MSM通過IPW的方式構建虛擬人群,保證虛擬人群中除干預變量外,其它變量均衡可比,在此基礎上利用反事實框架推斷處理效應(即他汀類藥物治療)與結局之間的關系,可以有效解決時依性混雜的影響,提高因果推斷效能[12]。而Logistic模型通過線性加權的方式,分析處理效應和結局之間的關系,無法控制縱向隨訪中的時依性混雜和治療轉移現象,因而導致虛假因果關系。此外,機器學習算法可處理電子病例中非線性、交互作用、高維度協變量等數據;并可自行對算法進行選擇和調整,從而規避模型設定錯誤的問題[13]。本研究采用機器學習中的隨機森林算法進行IPW,進一步提高了結果的準確性。
NT-proBNP是重要的心衰生物標志物,各指南已明確了其在診斷和預后預測中的重要作用[9]。與以往RCT研究一致[14-15],本研究通過MSM證實他汀類藥物能有效降低患者NT-proBNP水平。同時,不同于RCT研究只關注某個藥物,本研究通過真實世界數據指出所有他汀類藥物均可降低NT-proBNP,這可能為慢性心衰患者的治療方案提供思路。EF是評價心功能的重要指標。Broch等[16]研究表明,瑞舒伐他汀可以提高心衰患者EF。而Vrtovec通過RCT[17]證實,阿托伐他汀對患者EF無影響。本研究未發現他汀類藥物對慢性心衰患者EF有顯著影響,可能是由于未對他汀類藥物進行分類。此外,以往研究表明他汀類藥物對不同類型心衰的作用效果存在差異。Tsutamoto等[18]研究指出,他汀類藥物未影響非缺血性心肌病患者BNP及LVEF水平。但針對缺血性心肌病患者的研究表明,他汀類藥物可降低患者NT-proBNP水平,并提高LVEF[19-20]。我們將在進一步研究中對不同心衰患者進行亞組分析。
總之,本研究證實他汀類藥物能夠降低慢性心力衰竭患者NT-proBNP水平,且證明了MSM能夠有效處理時依性混雜因素和治療轉換問題。為他汀類藥物在心衰中的應用提供了依據,也為縱向觀察數據研究提供了可行的統計分析方法。
慢性心力衰竭是心血管疾病的終末階段,發病率高、預后差。《中國心血管病報告2021》表明,我國心衰患病率已上升至1.3%,5年全因死亡率高達55.4%[1],改善心衰預后成為亟待解決的重大問題。作為治療心血管疾病的重要手段之一,他汀類藥物對心衰患者的作用尚不明確[2]。近年來,隨著他汀類藥物成本下降,驗證其治療心衰的效用,以擴大應用范圍具有重要意義。
藥物的有效性評估與因果關系驗證通常基于隨機對照試驗(randomized controlled trial,RCT),通過嚴格的試驗條件,有效地控制混雜偏倚[3]。但滿足RCT實施條件需要大量的人力、物力支持,在日常診療中難以開展[4]。基于真實世界的醫療數據庫結合隨訪研究,可以很好地為該目的提供服務[5]。然而,傳統的分析方法無法解決真實世界研究的混雜因素,即時依性混雜和治療轉換問題[6]。逆概率加權(inverse probability weighting,IPW)和邊緣結構模型(marginal structural model,MSM)通過樣本加權的方式平衡混雜,可得到對處理因素效果評估的無偏分析[7]。隨著機器學習算法在真實世界復雜數據中的應用,人們開始用其提高因果推斷的準確性。其中,隨機森林采用有放回的方式重復自助采樣得到多個樣本,構建集成決策樹,可準確推斷因果關系[8]。因此,本研究擬融合機器學習的思想,采用隨機森林對概率進行評估,構建MSM,估計他汀類藥物對慢性心衰預后的因果效應,為其臨床應用提供依據。
1 資料與方法
1.1 研究對象
順序入選2018年1月至2020年12月山西省兩所醫院的慢性心力衰竭住院患者。患者納入標準為:年齡≥18歲,診斷為心力衰竭[9],紐約心臟協會(New York Heart Association,NYHA)心功能分級Ⅱ~Ⅳ級,近一個月接受心衰藥物及其他治療措施,自愿參與本項目且住院3次以上的患者。排除因妊娠、肝功能損傷等不能使用他汀類藥物的患者,伴發其他危及生命的疾病預期生存時間<1年及拒絕參加本項目的患者。本研究經山西醫科大學醫學倫理委員會審查批準(批準號:2018LL128),并在中國臨床試驗注冊中心注冊(注冊號:ChiCTR2100043337)。
1.2 數據收集
采用課題組自主設計的慢性心力衰竭患者的病例報告表(case reported form,CRF)收集患者住院信息,內容包括:患者基本情況(年齡、性別、家族史等)、共病(冠心病、高血壓、糖尿病等)、實驗室檢查(血常規、肝腎功能等)、影像學檢查(心臟彩超、冠脈造影等)、治療措施(藥物治療、非藥物治療)。以患者住院的氨基末端腦鈉尿肽(amino-terminal brain natriuretic peptide,NT-proBNP)、NYHA和射血分數(ejection fraction,EF)作為結局指標。
采用Epidata 13.0對數據進行雙錄入。采用R 3.6.2軟件進行數據清洗。刪除缺失比例超過30%的變量及缺失比例超過50%的個體。缺失未達到該比例的,根據具體情況采用回歸填補法和EM法對缺失值進行填補。本研究納入315例患者,經數據處理刪除18例患者。同時,刪除肌酸激酶、肌鈣蛋白、氧飽和度等17項研究變量。
1.3 混雜因素篩選
采用SPSS 26.0軟件進行數據分析。計量資料采用和中位數(四分位數間距)[M(QR)]描述,計數資料采用例數(%)進行描述。計量資料比較采用t檢驗或非參數秩和檢驗,計數資料比較采用χ2檢驗進行單因素篩選,檢驗水準α為0.05。采用Logistic回歸進行多因素篩選,α入為0.05,α出為0.10。
1.4 MSM構建
1.4.1 基本思想
假設每個個體都接受了處理因素的所有水平,此時直接估計不同處理水平結局事件發生的概率就可得到處理因素的真實效應,而不受到任何混雜因素的影響。其核心步驟在于通過IPW,賦予每個個體一定的權重,得到虛擬人群。將混雜因素水平相同的個體視為一個亞人群,在不同的亞人群中,處理因素水平分布相同。此時處理因素的選擇不受任何混雜因素影響,而處理因素與結局指標之間的關系與原人群一致。對這個虛擬人群進行分析,就可以得到處理因素的無偏估計效應[10]。
1.4.2 概率估計
在進行IPW之前,需要評估個體接受處理因素水平的概率。本研究創新性地采用隨機森林進行概率估計。
1.4.3 IPW
在概率估計的基礎上,進行IPW。本研究同時采用穩定權重(stable weight,SW)和截斷權重對個體進行加權。
SW:采用SW加權后能避免出現極端權重及因逆概率權重標準誤膨脹而引起的偏倚。
![]() |
其中,A(k)表示個體在k時間點是否接受他汀類藥物治療,X代表基線混雜因素,L代表時依性混雜因素。
截斷權重:另一種避免極端權重的做法,即將權重的極端值用其鄰近的截斷百分位數來代替。本研究截斷值采取1%、5%和10%[11]。
1.4.4 因果效應估計
在IPW構成的虛擬人群中,采用基于隨機森林的MSM估計他汀類藥物對心衰患者3個結局指標,即NT-proBNP、NYHA和EF的影響。
2 結果
2.1 患者基本情況
本研究共納入297名慢性心衰患者,平均年齡70.8±10.9歲,其中男性187(63.0%)例,女性110(37.0%)例。
2.2 混雜因素篩選
對患者3次住院數據進行混雜因素篩選。患者組間差異單變量分析結果見表1。Logistic回歸表明,同時對服用他汀類藥物和NT-proBNP水平產生影響的混雜因素為堿性磷酸酶(alkaline phosphatase,ALP)、肌酐(creatinine,Cr)、γ-谷氨酰轉肽酶(γ-glutamyl transpeptidase,γ-GT)、左心房前后徑(left atrial diameter,LA);同時對服用他汀類藥物和NYHA水平產生影響的混雜因素為ALP、Cr、LA;同時對服用他汀類藥物和EF水平產生影響的混雜因素為睡眠障礙、Cr、LA。

2.3 權重分布
采用隨機森林進行概率估計,并計算相應的SW,其權重分布見表2。結果表明,加權后的權重均數和中位數都靠近1,說明權重分布較好。依據權重分布,為避免極端權重值的影響,本研究采用SW和截斷權重聯合的方法,分別選取1%、5%及10%對權重進行截斷。

2.4 估計他汀類藥物對不同結局指標的影響
采用傳統的Logistic回歸分析表明,他汀類藥物對慢性心衰患者NT-proBNP水平無顯著影響;采用MSM結果表明,他汀類藥物顯著降低NT-proBNP[OR=0.699,95%CI(0.528,0.926),P=0.012]。說明時依性混雜因素影響了他汀類藥物對NT-proBNP作用效應的估計。然而,無論僅考慮基線混雜因素還是同時考慮時依性混雜因素,他汀類藥物對患者NYHA分級和EF均無顯著影響。結果見表3。

3 討論
作為心血管疾病的重要治療手段,他汀類藥物對心衰患者預后的作用尚不明確。本研究通過MSM,處理了時依性混雜因素和治療轉換在藥物效用分析過程中造成的偏倚,無偏估計了他汀類藥物對慢性心力衰竭患者NT-proBNP、NYHA分級和EF的因果效應。結果表明,他汀類藥物顯著降低心衰患者NT-proBNP水平,為他汀類藥物的臨床應用提供了證據。
本研究發現僅排除基線混雜時,他汀類藥物對患者NT-proBNP無影響;當排除隨時間變化產生的時依性混雜時,他汀類藥物顯著降低NT-proBNP。因而,時依性混雜在他汀類藥物的效用估計中有重要的干擾作用。MSM通過IPW的方式構建虛擬人群,保證虛擬人群中除干預變量外,其它變量均衡可比,在此基礎上利用反事實框架推斷處理效應(即他汀類藥物治療)與結局之間的關系,可以有效解決時依性混雜的影響,提高因果推斷效能[12]。而Logistic模型通過線性加權的方式,分析處理效應和結局之間的關系,無法控制縱向隨訪中的時依性混雜和治療轉移現象,因而導致虛假因果關系。此外,機器學習算法可處理電子病例中非線性、交互作用、高維度協變量等數據;并可自行對算法進行選擇和調整,從而規避模型設定錯誤的問題[13]。本研究采用機器學習中的隨機森林算法進行IPW,進一步提高了結果的準確性。
NT-proBNP是重要的心衰生物標志物,各指南已明確了其在診斷和預后預測中的重要作用[9]。與以往RCT研究一致[14-15],本研究通過MSM證實他汀類藥物能有效降低患者NT-proBNP水平。同時,不同于RCT研究只關注某個藥物,本研究通過真實世界數據指出所有他汀類藥物均可降低NT-proBNP,這可能為慢性心衰患者的治療方案提供思路。EF是評價心功能的重要指標。Broch等[16]研究表明,瑞舒伐他汀可以提高心衰患者EF。而Vrtovec通過RCT[17]證實,阿托伐他汀對患者EF無影響。本研究未發現他汀類藥物對慢性心衰患者EF有顯著影響,可能是由于未對他汀類藥物進行分類。此外,以往研究表明他汀類藥物對不同類型心衰的作用效果存在差異。Tsutamoto等[18]研究指出,他汀類藥物未影響非缺血性心肌病患者BNP及LVEF水平。但針對缺血性心肌病患者的研究表明,他汀類藥物可降低患者NT-proBNP水平,并提高LVEF[19-20]。我們將在進一步研究中對不同心衰患者進行亞組分析。
總之,本研究證實他汀類藥物能夠降低慢性心力衰竭患者NT-proBNP水平,且證明了MSM能夠有效處理時依性混雜因素和治療轉換問題。為他汀類藥物在心衰中的應用提供了依據,也為縱向觀察數據研究提供了可行的統計分析方法。