引用本文: 蔡真真, 陳媛, 林碧霞. 心血管疾病患者院內心臟驟停風險預測模型的系統評價. 中國循證醫學雜志, 2022, 22(10): 1175-1181. doi: 10.7507/1672-2531.202206065 復制
心臟驟停(cardiac arrest,CA)是各種原因所致心臟射血功能突然停止,造成全身循環中斷、呼吸停止和意識喪失,若不及時救治,將會造成全身組織器官尤其是大腦的不可逆性損害甚至死亡。從臨床角度來看,醫院內心臟驟停(in-hospital cardiac arrest,IHCA)最常見的定義是循環喪失,并通過胸外按壓、除顫或兩者同時進行復蘇[1]。IHCA的發生率、死亡率在全球范圍內居高不下。美國心臟協會的復蘇指南登記數據顯示,每1 000例的入院患者中有9至10例發生心臟驟停[2]。最常見類型(81%)是非休克性心律(即心搏停止或無脈電活動)。大約一半的IHCA發生在病房,其他發生在重癥監護室和手術室等[3]。但與院外心臟驟停和其他心腦血管疾病(如中風和心肌梗死)相比,IHCA受到的關注仍然不足。有研究表明,心血管疾病是發生IHCA首位原因,占比約為50%~60%[1]。有研究表明,IHCA并不是突然發生,62%的IHCA能夠被提前預測[4],隨著研究深入,心血管疾病患者發生IHCA的不同危險因素陸續被發現[1],但單一危險因素的提示作用不大,故常被醫護人員忽略。
風險預測模型可組合多個危險因素,來預測心血管疾病患者IHCA發生風險。一方面,它可幫助醫務人員及早識別高危人群,提高IHCA風險預警意識,并根據風險等級采取相應的預防措施。另一方面,它可使心血管疾病患者和家屬清楚了解IHCA發生風險,增進他們對相關工作的認知、配合和理解[5]。近年來,基于生命體征、人口學特征、實驗室檢查和影像學測量等因素,國內外已構建了不同的心血管疾病患者IHCA風險預測模型。然而,目前尚無研究對不同IHCA風險預測模型開展系統評價,一定程度上阻礙預測模型真正服務于臨床決策。為識別可靠預測模型,亟需系統的證據總結。因此,本研究對心血管疾病患者IHCA風險預測模型進行系統評價,以期為醫護人員、指南政策制定者等人群選擇合適的心血管疾病患者IHCA風險預測模型提供參考,并為預測模型的構建提供借鑒。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 年齡≥18歲的心血管疾病患者,不限種族、國籍和病程;② 研究類型為隊列研究或病例-對照研究;③ 研究內容為心血管疾病患者院內心臟驟停風險預測模型的構建;④ 明確了診斷院內心臟驟停主要的評估方法和步驟;⑤ 介紹了建模的過程及采用的統計學方法。
1.1.2 排除標準
① 只分析危險因素,未構建風險預測模型的研究;② 發生在院外的心臟驟停;③ 診斷模型或者預后模型;④ 結局包含多個終點指標,心臟驟停只是其中之一;⑤ 未描述模型構建過程或方法;⑥ 研究為模型的本土化適用性探究或預測效能的比較性研究;⑦ 研究為自動化預測模型的效果評價;⑧ 重復發表文獻;⑨ 未能獲取原文且摘要信息不全使得數據不完整而無法提取的文獻;⑩ 會議摘要、信件等非正式發表的文獻,或綜述、述評、動物研究等。
1.2 文獻檢索策略
計算機檢索CBM、CNKI、WanFang Data、PubMed、ScienceDirect、Web of Science、The Cochrane Library、Wiley Online Journals和Scopus數據庫,搜集關于心血管疾病患者院內心臟驟停風險預測模型的研究,檢索時限均從2010年1月至2022年7月。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。英文檢索詞包括:heart arrest、cardiac arrest、cardiopulmonary arrest、asystole*、prognos*、predict*、forecast*、risk*、factor*、validat*、identif*、model、case-comparison stud*、case-control stud*、case comparison stud*、case control stud*、case-referent stud*、case referent stud*、case-base stud*、case base stud*、cohort stud*、concurrent stud*、cohort analys*等。中文檢索詞包括:心臟停搏、心搏驟停、心跳驟停、心臟驟停、心肺驟停、心臟停止、預測模型、模型、危險因素、預測因子等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:第一作者、年份、國家或地區、研究類型、研究對象、統計學方法、模型相關數據(驗模方法及樣本量)、受試工作者曲線下面積(area under receiver operating characteristic curve,AUROC)、危險因素賦分及風險分層方法、預測因子個數及其名稱等。
1.4 納入研究的偏倚風險評價
由2名研究者使用PROBAST工具[6]獨立評價納入研究的偏倚風險并交叉核對,結果不一致時討論解決,或由通訊作者協助判斷。PROBAST涉及4個領域:研究對象、預測因素、結局和分析,共20個信號問題。根據PROBAST工具解讀的指導[7],每個信號問題可判斷為“是”、“可能是”、“可能不是”、“不是”或“未提供信息”,進而對每個領域的偏倚風險做出判斷,歸為“高”、“低”或“不清楚”。當所有領域都被判為低風險時,模型整體偏倚為低風險;只要有一個領域被判為高風險,整體偏倚風險為高風險[8]。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻8 121篇,經逐層篩選后,最終納入5個研究[9-13]。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本特征
納入研究的基本特征見表1。3個研究的研究對象為急性冠脈綜合征患者[9-10,13],1個研究為心源性胸痛患者[12],1個研究為心內科患者[11]。其中3個研究[10,12-13]運用十折交叉驗證法對建立的預測模型進行內部驗證;1個研究[9]采用時間驗證與外部驗證結合的方式對預測模型的預測效能進行評價,驗證模型的樣本量為6 388例;2個研究[11,13]進行了Hosmer-Lemeshow擬合優度檢驗,均未使用校準圖進行評價。4個研究建模AUROC或C統計量為0.720~0.896,1個研究報告的外部驗證AUROC為0.650。

2.3 納入研究的偏倚風險評價結果
納入研究的偏倚風險評價結果見表2。前3個領域存在的主要問題分別為:研究設計不恰當(使用病例-對照研究)(n=4);未提供預測因素的測量是否一致的信息(n=4);結局的測量方法不合適(n=4)及預測因素的測量與結局確定之間的時間間隔不合適(n=2)。最后一個分析領域問題較多,分別為:樣本量不足(n=4)、變量處理不當(n=4)、未提供缺失數據如何處理(n=2)、未提供對數據中復雜問題(如刪失、競爭風險、對照抽樣等)的處理(n=5)和模型表現評價不完整(n=5)。

2.4 納入模型的建模方法
對納入研究的建模方法進行分析,有2個研究[9,11]采用了Logistic回歸方法建模,2個研究[10,12]采用了決策樹,1個研究[13]采用LASSO回歸分析。在預測因子賦值方法上,2個模型采用各因子β系數除以最小β系數后按四舍五入取整數得到各因子分數,其平均AUROC為0.747。2個模型采用遞歸分區分析的決策樹,根據預測因子節點分類,分為高、中、低風險,其平均AUROC為0.869。1個模型采用諾模圖,根據因子風險得分確定高、中、低風險。詳見表1和表3。

2.5 納入模型的預測因子
在5個IHCA風險預測模型研究中,最多納入8個預測因子,最少納入5個。本研究對所有納入的預測因子進一步分析,歸納出IHCA的易感因素和速發因素兩類。結果發現,最為常見的IHCA易感因素為年齡和糖尿病。Killip分級和心肌肌鈣蛋白是速發因素中排名前兩位的預測因子。5個研究納入的預測因子具體情況見表3。
3 討論
目前,臨床對預測模型的構建和使用日漸受到重視,針對心血管疾病患者IHCA的風險預測模型已有多個。本系統評價納入了5個IHCA風險預測模型,研究對象集中在急性冠脈綜合征患者。但4個模型被評為高偏倚風險[10-13],1個模型被評為不清楚[9],模型構建的許多方法學細節仍需要引起研究者的注意。模型多采用Logistic回歸分析方法或決策樹建模,且所有模型建模的AUROC均大于0.7,模型的預測效果較好。但是,80%的模型沒有進行外部驗證,影響其外推應用,導致將模型服務于臨床決策時仍需慎重選擇。本研究結果提示,年齡、糖尿病、Killip分級和心肌肌鈣蛋白是IHCA風險預測模型中常用的預測因子。
風險預測模型的質量與研究設計、建模方法、統計分析等密切相關[14]。本研究中,納入的預測模型大部分研究設計不夠嚴謹,方法學質量評價方面結果整體欠佳。本研究納入的5個模型的AUROC在建模時均大于0.7,說明這些模型的區分性能較好。其中,Wu等[13]的模型預測效果最好,但需要注意的是,雖然以上模型預測效能較好,但模型的廣泛適用性和穩定性還有待進一步探索。
有3個研究[10,12-13]在構建之后采用十折交叉驗證法進行了內部驗證。在Shang等[11]和Wu等[13]的研究中,采用了Hosmer-Lemeshow檢驗來驗證模型的預測率和實際發生率的一致程度,結果顯示一致性較好。但是這4個模型[10-13]都未進行外部驗證。預測模型被推薦廣泛使用前,在外部人群中驗證是十分重要的。相對而言,Faxen等[9]的模型構建過程較為完整,其建模過程值得學習。該模型基于2008年至2014年瑞典心臟登記處[15]的大樣本預測急性冠脈綜合征患者發生IHCA的風險,雖然未進行內部驗證,但是由于該研究納入的IHCA事件人數足夠多,遠超過預測因子的數量,可忽略模型的過度擬合問題。該研究采用鏈式方程的多重插補法處理缺失數據。該模型使用2005年至2007年瑞典心臟登記處的數據進行了時間驗證,得到的C統計量為0.74。接著使用2008年至2013年英國心肌缺血國家審計項目[16]的數據進行外部驗證,得到的C統計量為0.65。說明該模型在瑞典人群之外的表現和適用性較差,可能與不同國家數據登記的內容、形式和數據資料完整性存在差異有關。
有3個研究[9,11,13]采用Logistic回歸法建立預測模型,其中有模型根據回歸系數β的權重為預測因子賦值,并使用Sullivan等[17]描述的積分系統開發風險-評分模型,簡化了基于復雜統計模型的風險估計,使模型更易于使用,有模型使用諾模圖展示評分工具的使用。2個研究[10,12]采用決策樹建立預測模型,使用遞歸分區分析法,根據預測因子節點進行危險分層,取得較好的區分值,且靈敏度和特異度均大于0.75。目前類似決策樹模型的機器學習法越來越多地應用于疾病多因子危險因素篩選與分析,能夠針對復雜的臨床問題提高預測準確性[18],特別是電子病歷系統的普及也為利用機器學習技術改善患者結局提供機會。本研究發現,與使用Logistic回歸法相比,決策樹模型取得的AUROC更高,Matthew等[18]和Pirracchio等[19]也發現在預測疾病惡化領域,機器學習法具有更高的準確性。但是與Mao等[20]的研究不一致,他們認為Logistic回歸法可與其他機器學習方法一樣準確或更準確。因此沒有一種方法在每種情況下都是最準確的,在不同研究領域和數據集的情況下可能會產生不同的結果。
另外,本研究揭示了目前心血管疾病患者IHCA風險預測模型模型構建和驗證中的一些方法學不足。許多研究的數據來源不合適,大部分采用病例-對照研究設計,雖然回顧性數據易于獲取,但在對照選取方面容易產生選擇性偏倚,且獲取既往信息時很難避免回憶性偏倚,信息的真實性和質量難以保證;大部分研究未提供預測因素的操作性定義,無法判斷測量方法、測量過程、測量時點是否一致,未報告盲法,容易產生信息偏倚,比如Killip分級、影像學結果解讀等,同樣影響數據的真實性;另外,有些研究的樣本量較小,嚴重降低模型的整體質量。足夠大的樣本量才能夠確保研究得到有價值、可靠的信息,因此可通過整合數據資源擴大樣本量或采用各種內部驗證法定量評估,例如bootstrap法;統計分析領域上存在更多值得關注的問題:在預測變量的處理上,多數研究未提供變量的賦值情況,特別是在將連續變量轉化為二分類變量時,未提供分類原則和依據;在缺失數據問題上,數據缺失情況及采用何種填補法處理均需要提供;還需要報道數據中的復雜問題,如刪失、競爭風險、對照抽樣等的正確處理。此外,由于本研究使用了近3年才發表的PROBAST工具進行偏倚風險評價,采用新的評價標準評估以往研究可能相對嚴格,但是有利于提高未來發表的預測模型原始研究的質量。
本研究發現年齡、糖尿病和Killip分級、心肌肌鈣蛋白分別是模型中納入較多的易感因素和速發因素。有流行病學調查顯示,IHCA發病率隨年齡增長而增加,不分性別、種族[21]。原因在于年齡越大,其心臟功能、儲備能力和抗應激能力均發生退化,導致一系列特殊病理生理改變;而且,老年人多數存在冠狀動脈粥樣硬化等心血管疾病,存在心肌供血不足、線粒體減少、膜電位受損等情況,心臟傳導系統處于不穩定狀態,易形成折返,這可能是年齡較大的心血管疾病患者IHCA高發原因[22-23]。除此之外,心血管疾病合并糖尿病也會提高IHCA發生風險。糖尿病常常合并血脂異常,且長期高糖狀態使微血管病變和局部缺血、缺氧,進一步造成心臟缺血、心肌損傷、瘢痕形成及房室復極異質性,增加心血管疾病患者IHCA發生的風險[24]。在速發因素方面,心力衰竭是IHCA發生的最重要原因[25]。Killip分級常用于臨床上評估急性心肌梗死患者心力衰竭的等級,分級越高代表心功能越差[10],對危險分層具有重要價值[26]。除此之外,心肌肌鈣蛋白是一種具有高度心肌特異性的亞型心肌鈣蛋白,是心肌損傷標志物之一,可在一定程度上反映心肌細胞受損情況[27]。心肌肌鈣蛋白數值越高,心肌損傷越嚴重,對心血管疾病患者的病情和預后具有較好的判斷效果[28]。臨床醫生針對高齡、患有糖尿病、Killip分級Ⅱ以上、心肌肌鈣蛋白異常的高危患者,應給予更多關注以早期識別IHCA風險,避免IHCA發生。
IHCA是可預防的,準確風險預測工具是保障患者安全的關鍵,因此,迫切需要研究以數據驅動的風險預測工具來幫助臨床醫師避免不良事件發生。基于系統評價結果,我們考量盡早識別心血管疾病患者IHCA的必要性和緊迫性,認為目前Wu等[13]的模型預測準確度較高,預測能力較好,其模型中的預測因子作為常規臨床評估的一部分,在三級醫院或者基層醫療機構都有測量,收集這些數據并不困難。同時建議將模型嵌入臨床預警信息系統,對預測指標進行監測,早期鑒別高風險患者。值得注意的是,本研究提示現有心血管疾病患者IHCA模型質量較低,原始研究質量仍有待提高。下一步,研究者可在數據來源、預測因素的選擇和測量、缺失數據處理和模型評價等方面提高研究質量,參考TRIPOD報告規范[29-30],在標題和摘要、前言、方法、結果、討論和其他信息6個部分,共22個方面進行客觀描述,提高研究報告的準確性和完整性。
本研究的局限性:① 本系統評價僅納入中、英文文獻,可能存在發表偏倚;② 目前納入的心血管疾病患者IHCA風險預測模型存在高偏倚風險;③ 由于研究對象和預測因素等方面的異質性,本研究沒有對不同研究結果進行定量分析;④ 本研究排除了結局指標為心臟死亡、心包填塞、腦血管意外、ICU轉入、栓塞性中風和植入性心臟復律除顫器治療等復合終點事件的模型,可能部分高質量的研究沒有被納入;⑤ 大部分模型缺少外部驗證;⑥ 心血管疾病患者院內心搏驟停風險預測模型的研究集中在心內科,心外科領域仍較少報道。
綜上所述,心血管疾病患者IHCA風險預測模型的預測效能較好,但是模型質量均有待提高,需在數據來源、預測因素選擇和測量及缺失數據處理和模型評價等方面提高方法學質量,或對現有模型進行外部驗證,以盡早識別可能發生IHCA的心血管疾病患者,提供高質量的臨床決策依據。
心臟驟停(cardiac arrest,CA)是各種原因所致心臟射血功能突然停止,造成全身循環中斷、呼吸停止和意識喪失,若不及時救治,將會造成全身組織器官尤其是大腦的不可逆性損害甚至死亡。從臨床角度來看,醫院內心臟驟停(in-hospital cardiac arrest,IHCA)最常見的定義是循環喪失,并通過胸外按壓、除顫或兩者同時進行復蘇[1]。IHCA的發生率、死亡率在全球范圍內居高不下。美國心臟協會的復蘇指南登記數據顯示,每1 000例的入院患者中有9至10例發生心臟驟停[2]。最常見類型(81%)是非休克性心律(即心搏停止或無脈電活動)。大約一半的IHCA發生在病房,其他發生在重癥監護室和手術室等[3]。但與院外心臟驟停和其他心腦血管疾病(如中風和心肌梗死)相比,IHCA受到的關注仍然不足。有研究表明,心血管疾病是發生IHCA首位原因,占比約為50%~60%[1]。有研究表明,IHCA并不是突然發生,62%的IHCA能夠被提前預測[4],隨著研究深入,心血管疾病患者發生IHCA的不同危險因素陸續被發現[1],但單一危險因素的提示作用不大,故常被醫護人員忽略。
風險預測模型可組合多個危險因素,來預測心血管疾病患者IHCA發生風險。一方面,它可幫助醫務人員及早識別高危人群,提高IHCA風險預警意識,并根據風險等級采取相應的預防措施。另一方面,它可使心血管疾病患者和家屬清楚了解IHCA發生風險,增進他們對相關工作的認知、配合和理解[5]。近年來,基于生命體征、人口學特征、實驗室檢查和影像學測量等因素,國內外已構建了不同的心血管疾病患者IHCA風險預測模型。然而,目前尚無研究對不同IHCA風險預測模型開展系統評價,一定程度上阻礙預測模型真正服務于臨床決策。為識別可靠預測模型,亟需系統的證據總結。因此,本研究對心血管疾病患者IHCA風險預測模型進行系統評價,以期為醫護人員、指南政策制定者等人群選擇合適的心血管疾病患者IHCA風險預測模型提供參考,并為預測模型的構建提供借鑒。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 年齡≥18歲的心血管疾病患者,不限種族、國籍和病程;② 研究類型為隊列研究或病例-對照研究;③ 研究內容為心血管疾病患者院內心臟驟停風險預測模型的構建;④ 明確了診斷院內心臟驟停主要的評估方法和步驟;⑤ 介紹了建模的過程及采用的統計學方法。
1.1.2 排除標準
① 只分析危險因素,未構建風險預測模型的研究;② 發生在院外的心臟驟停;③ 診斷模型或者預后模型;④ 結局包含多個終點指標,心臟驟停只是其中之一;⑤ 未描述模型構建過程或方法;⑥ 研究為模型的本土化適用性探究或預測效能的比較性研究;⑦ 研究為自動化預測模型的效果評價;⑧ 重復發表文獻;⑨ 未能獲取原文且摘要信息不全使得數據不完整而無法提取的文獻;⑩ 會議摘要、信件等非正式發表的文獻,或綜述、述評、動物研究等。
1.2 文獻檢索策略
計算機檢索CBM、CNKI、WanFang Data、PubMed、ScienceDirect、Web of Science、The Cochrane Library、Wiley Online Journals和Scopus數據庫,搜集關于心血管疾病患者院內心臟驟停風險預測模型的研究,檢索時限均從2010年1月至2022年7月。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。英文檢索詞包括:heart arrest、cardiac arrest、cardiopulmonary arrest、asystole*、prognos*、predict*、forecast*、risk*、factor*、validat*、identif*、model、case-comparison stud*、case-control stud*、case comparison stud*、case control stud*、case-referent stud*、case referent stud*、case-base stud*、case base stud*、cohort stud*、concurrent stud*、cohort analys*等。中文檢索詞包括:心臟停搏、心搏驟停、心跳驟停、心臟驟停、心肺驟停、心臟停止、預測模型、模型、危險因素、預測因子等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:第一作者、年份、國家或地區、研究類型、研究對象、統計學方法、模型相關數據(驗模方法及樣本量)、受試工作者曲線下面積(area under receiver operating characteristic curve,AUROC)、危險因素賦分及風險分層方法、預測因子個數及其名稱等。
1.4 納入研究的偏倚風險評價
由2名研究者使用PROBAST工具[6]獨立評價納入研究的偏倚風險并交叉核對,結果不一致時討論解決,或由通訊作者協助判斷。PROBAST涉及4個領域:研究對象、預測因素、結局和分析,共20個信號問題。根據PROBAST工具解讀的指導[7],每個信號問題可判斷為“是”、“可能是”、“可能不是”、“不是”或“未提供信息”,進而對每個領域的偏倚風險做出判斷,歸為“高”、“低”或“不清楚”。當所有領域都被判為低風險時,模型整體偏倚為低風險;只要有一個領域被判為高風險,整體偏倚風險為高風險[8]。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻8 121篇,經逐層篩選后,最終納入5個研究[9-13]。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本特征
納入研究的基本特征見表1。3個研究的研究對象為急性冠脈綜合征患者[9-10,13],1個研究為心源性胸痛患者[12],1個研究為心內科患者[11]。其中3個研究[10,12-13]運用十折交叉驗證法對建立的預測模型進行內部驗證;1個研究[9]采用時間驗證與外部驗證結合的方式對預測模型的預測效能進行評價,驗證模型的樣本量為6 388例;2個研究[11,13]進行了Hosmer-Lemeshow擬合優度檢驗,均未使用校準圖進行評價。4個研究建模AUROC或C統計量為0.720~0.896,1個研究報告的外部驗證AUROC為0.650。

2.3 納入研究的偏倚風險評價結果
納入研究的偏倚風險評價結果見表2。前3個領域存在的主要問題分別為:研究設計不恰當(使用病例-對照研究)(n=4);未提供預測因素的測量是否一致的信息(n=4);結局的測量方法不合適(n=4)及預測因素的測量與結局確定之間的時間間隔不合適(n=2)。最后一個分析領域問題較多,分別為:樣本量不足(n=4)、變量處理不當(n=4)、未提供缺失數據如何處理(n=2)、未提供對數據中復雜問題(如刪失、競爭風險、對照抽樣等)的處理(n=5)和模型表現評價不完整(n=5)。

2.4 納入模型的建模方法
對納入研究的建模方法進行分析,有2個研究[9,11]采用了Logistic回歸方法建模,2個研究[10,12]采用了決策樹,1個研究[13]采用LASSO回歸分析。在預測因子賦值方法上,2個模型采用各因子β系數除以最小β系數后按四舍五入取整數得到各因子分數,其平均AUROC為0.747。2個模型采用遞歸分區分析的決策樹,根據預測因子節點分類,分為高、中、低風險,其平均AUROC為0.869。1個模型采用諾模圖,根據因子風險得分確定高、中、低風險。詳見表1和表3。

2.5 納入模型的預測因子
在5個IHCA風險預測模型研究中,最多納入8個預測因子,最少納入5個。本研究對所有納入的預測因子進一步分析,歸納出IHCA的易感因素和速發因素兩類。結果發現,最為常見的IHCA易感因素為年齡和糖尿病。Killip分級和心肌肌鈣蛋白是速發因素中排名前兩位的預測因子。5個研究納入的預測因子具體情況見表3。
3 討論
目前,臨床對預測模型的構建和使用日漸受到重視,針對心血管疾病患者IHCA的風險預測模型已有多個。本系統評價納入了5個IHCA風險預測模型,研究對象集中在急性冠脈綜合征患者。但4個模型被評為高偏倚風險[10-13],1個模型被評為不清楚[9],模型構建的許多方法學細節仍需要引起研究者的注意。模型多采用Logistic回歸分析方法或決策樹建模,且所有模型建模的AUROC均大于0.7,模型的預測效果較好。但是,80%的模型沒有進行外部驗證,影響其外推應用,導致將模型服務于臨床決策時仍需慎重選擇。本研究結果提示,年齡、糖尿病、Killip分級和心肌肌鈣蛋白是IHCA風險預測模型中常用的預測因子。
風險預測模型的質量與研究設計、建模方法、統計分析等密切相關[14]。本研究中,納入的預測模型大部分研究設計不夠嚴謹,方法學質量評價方面結果整體欠佳。本研究納入的5個模型的AUROC在建模時均大于0.7,說明這些模型的區分性能較好。其中,Wu等[13]的模型預測效果最好,但需要注意的是,雖然以上模型預測效能較好,但模型的廣泛適用性和穩定性還有待進一步探索。
有3個研究[10,12-13]在構建之后采用十折交叉驗證法進行了內部驗證。在Shang等[11]和Wu等[13]的研究中,采用了Hosmer-Lemeshow檢驗來驗證模型的預測率和實際發生率的一致程度,結果顯示一致性較好。但是這4個模型[10-13]都未進行外部驗證。預測模型被推薦廣泛使用前,在外部人群中驗證是十分重要的。相對而言,Faxen等[9]的模型構建過程較為完整,其建模過程值得學習。該模型基于2008年至2014年瑞典心臟登記處[15]的大樣本預測急性冠脈綜合征患者發生IHCA的風險,雖然未進行內部驗證,但是由于該研究納入的IHCA事件人數足夠多,遠超過預測因子的數量,可忽略模型的過度擬合問題。該研究采用鏈式方程的多重插補法處理缺失數據。該模型使用2005年至2007年瑞典心臟登記處的數據進行了時間驗證,得到的C統計量為0.74。接著使用2008年至2013年英國心肌缺血國家審計項目[16]的數據進行外部驗證,得到的C統計量為0.65。說明該模型在瑞典人群之外的表現和適用性較差,可能與不同國家數據登記的內容、形式和數據資料完整性存在差異有關。
有3個研究[9,11,13]采用Logistic回歸法建立預測模型,其中有模型根據回歸系數β的權重為預測因子賦值,并使用Sullivan等[17]描述的積分系統開發風險-評分模型,簡化了基于復雜統計模型的風險估計,使模型更易于使用,有模型使用諾模圖展示評分工具的使用。2個研究[10,12]采用決策樹建立預測模型,使用遞歸分區分析法,根據預測因子節點進行危險分層,取得較好的區分值,且靈敏度和特異度均大于0.75。目前類似決策樹模型的機器學習法越來越多地應用于疾病多因子危險因素篩選與分析,能夠針對復雜的臨床問題提高預測準確性[18],特別是電子病歷系統的普及也為利用機器學習技術改善患者結局提供機會。本研究發現,與使用Logistic回歸法相比,決策樹模型取得的AUROC更高,Matthew等[18]和Pirracchio等[19]也發現在預測疾病惡化領域,機器學習法具有更高的準確性。但是與Mao等[20]的研究不一致,他們認為Logistic回歸法可與其他機器學習方法一樣準確或更準確。因此沒有一種方法在每種情況下都是最準確的,在不同研究領域和數據集的情況下可能會產生不同的結果。
另外,本研究揭示了目前心血管疾病患者IHCA風險預測模型模型構建和驗證中的一些方法學不足。許多研究的數據來源不合適,大部分采用病例-對照研究設計,雖然回顧性數據易于獲取,但在對照選取方面容易產生選擇性偏倚,且獲取既往信息時很難避免回憶性偏倚,信息的真實性和質量難以保證;大部分研究未提供預測因素的操作性定義,無法判斷測量方法、測量過程、測量時點是否一致,未報告盲法,容易產生信息偏倚,比如Killip分級、影像學結果解讀等,同樣影響數據的真實性;另外,有些研究的樣本量較小,嚴重降低模型的整體質量。足夠大的樣本量才能夠確保研究得到有價值、可靠的信息,因此可通過整合數據資源擴大樣本量或采用各種內部驗證法定量評估,例如bootstrap法;統計分析領域上存在更多值得關注的問題:在預測變量的處理上,多數研究未提供變量的賦值情況,特別是在將連續變量轉化為二分類變量時,未提供分類原則和依據;在缺失數據問題上,數據缺失情況及采用何種填補法處理均需要提供;還需要報道數據中的復雜問題,如刪失、競爭風險、對照抽樣等的正確處理。此外,由于本研究使用了近3年才發表的PROBAST工具進行偏倚風險評價,采用新的評價標準評估以往研究可能相對嚴格,但是有利于提高未來發表的預測模型原始研究的質量。
本研究發現年齡、糖尿病和Killip分級、心肌肌鈣蛋白分別是模型中納入較多的易感因素和速發因素。有流行病學調查顯示,IHCA發病率隨年齡增長而增加,不分性別、種族[21]。原因在于年齡越大,其心臟功能、儲備能力和抗應激能力均發生退化,導致一系列特殊病理生理改變;而且,老年人多數存在冠狀動脈粥樣硬化等心血管疾病,存在心肌供血不足、線粒體減少、膜電位受損等情況,心臟傳導系統處于不穩定狀態,易形成折返,這可能是年齡較大的心血管疾病患者IHCA高發原因[22-23]。除此之外,心血管疾病合并糖尿病也會提高IHCA發生風險。糖尿病常常合并血脂異常,且長期高糖狀態使微血管病變和局部缺血、缺氧,進一步造成心臟缺血、心肌損傷、瘢痕形成及房室復極異質性,增加心血管疾病患者IHCA發生的風險[24]。在速發因素方面,心力衰竭是IHCA發生的最重要原因[25]。Killip分級常用于臨床上評估急性心肌梗死患者心力衰竭的等級,分級越高代表心功能越差[10],對危險分層具有重要價值[26]。除此之外,心肌肌鈣蛋白是一種具有高度心肌特異性的亞型心肌鈣蛋白,是心肌損傷標志物之一,可在一定程度上反映心肌細胞受損情況[27]。心肌肌鈣蛋白數值越高,心肌損傷越嚴重,對心血管疾病患者的病情和預后具有較好的判斷效果[28]。臨床醫生針對高齡、患有糖尿病、Killip分級Ⅱ以上、心肌肌鈣蛋白異常的高危患者,應給予更多關注以早期識別IHCA風險,避免IHCA發生。
IHCA是可預防的,準確風險預測工具是保障患者安全的關鍵,因此,迫切需要研究以數據驅動的風險預測工具來幫助臨床醫師避免不良事件發生。基于系統評價結果,我們考量盡早識別心血管疾病患者IHCA的必要性和緊迫性,認為目前Wu等[13]的模型預測準確度較高,預測能力較好,其模型中的預測因子作為常規臨床評估的一部分,在三級醫院或者基層醫療機構都有測量,收集這些數據并不困難。同時建議將模型嵌入臨床預警信息系統,對預測指標進行監測,早期鑒別高風險患者。值得注意的是,本研究提示現有心血管疾病患者IHCA模型質量較低,原始研究質量仍有待提高。下一步,研究者可在數據來源、預測因素的選擇和測量、缺失數據處理和模型評價等方面提高研究質量,參考TRIPOD報告規范[29-30],在標題和摘要、前言、方法、結果、討論和其他信息6個部分,共22個方面進行客觀描述,提高研究報告的準確性和完整性。
本研究的局限性:① 本系統評價僅納入中、英文文獻,可能存在發表偏倚;② 目前納入的心血管疾病患者IHCA風險預測模型存在高偏倚風險;③ 由于研究對象和預測因素等方面的異質性,本研究沒有對不同研究結果進行定量分析;④ 本研究排除了結局指標為心臟死亡、心包填塞、腦血管意外、ICU轉入、栓塞性中風和植入性心臟復律除顫器治療等復合終點事件的模型,可能部分高質量的研究沒有被納入;⑤ 大部分模型缺少外部驗證;⑥ 心血管疾病患者院內心搏驟停風險預測模型的研究集中在心內科,心外科領域仍較少報道。
綜上所述,心血管疾病患者IHCA風險預測模型的預測效能較好,但是模型質量均有待提高,需在數據來源、預測因素選擇和測量及缺失數據處理和模型評價等方面提高方法學質量,或對現有模型進行外部驗證,以盡早識別可能發生IHCA的心血管疾病患者,提供高質量的臨床決策依據。