引用本文: 沈瑞環, 王旭, 魯中原. 疾病嚴重程度評分在心臟術后膿毒癥診斷及遠期預后預測中的價值. 中國胸心血管外科臨床雜志, 2022, 29(2): 219-227. doi: 10.7507/1007-4848.202007060 復制
膿毒癥(sepsis)是心臟術后患者再次轉入重癥監護室(intensive care unit,ICU)的重要原因[1],也是患者在 ICU 出現多器官衰竭和導致死亡的主要原因[2-3]。它被世界衛生組織認為是一個世界性的健康問題,估計每年在全球范圍內造成 600 萬人死亡[4-5]。大約 1/3 的 ICU 患者會在入住 ICU 期間發生膿毒癥,而且膿毒癥休克死亡率高達 50%[2]。早期診斷、抗生素應用和積極的液體復蘇是膿毒癥患者治療的重要手段,可有效降低死亡率[6]。
膿毒癥的定義在 2016 年再次發生變化,根據第三次國際共識對膿毒癥和膿毒癥休克的定義(the third international consensus definitions for sepsis and septic shock,sepsis-3)[7],膿毒癥標準的焦點轉向器官功能障礙的體征,而不再基于全身炎癥反應綜合征,器官衰竭在死亡率預測方面更好。這一定義將序貫器官衰竭評分(sequential organ failure assessment,SOFA)重新引入臨床應用[8]。
最初,SOFA 評分旨在依序評估危重膿毒癥患者器官功能障礙的嚴重程度,并在 16 個國家/地區的 40 個 ICU 中心的 1 449 例患者中得到驗證[9]。由于重癥患者通常會出現多器官功能障礙,因此 SOFA 也用于預測其它原因引起的器官衰竭患者的死亡率[10-13],如預測心臟手術或造血干細胞移植患者的死亡率[14-15]。其它評分系統還包括:急性生理學評分-Ⅲ(acute physiology score-Ⅲ,APS-Ⅲ)、簡化急性生理學評分(simplified acute physiology score,SAPS)、簡化急性生理學評分-Ⅱ(simplified acute physiology score-Ⅱ,SAPS-Ⅱ)、全身炎癥反應綜合征評分(systemic inflammation response score,SIRS)、logistic 器官功能障礙評分(logistic organ dysfunction score,LODS)、修正 logistic 器官功能障礙評分(modified logistic organ dysfunction score,MLODS)、牛津急性疾病嚴重程度評分(Oxford acute severity of illness score,OASIS)。
Le 等[16]認為,在膿毒癥患者的預后分層方面,SAPS 的性能與急性生理和慢性健康狀況評價系統(acute physiology,age,and chronic health evaluation,APACHE)內的 APS 評分系統相當,甚至更便于臨床實踐,因為它包含的變量較少。Moemen 等[17]也認為 SAPS-Ⅱ可用于危重患者(包括全身膿毒癥患者)的預后分層;Wang 等[18]通過多中心回顧性研究發現,LODS 能較好地預測中國醫院的 ICU 嚴重膿毒癥患者住院死亡率;Chen 等[19]的回顧性研究證實 OASIS 與 ICU 膿毒癥患者的預后存在顯著相關性。然而,SIRS 標準由于敏感性和特異性不足,在識別膿毒癥患者和風險分層的有效性方面受到質疑[20]。以上研究的人群大多集中在綜合 ICU,而本研究主要聚焦于心臟術后住 ICU 患者。
上述評分系統均由一套客觀的量化指標組成,用于評估疾病的嚴重程度和預后。研究[16-20]表明疾病的嚴重程度和患者的生理功能障礙可以揭示危重情況并預測死亡風險。早期判斷病情嚴重程度和預后對臨床決策和 ICU 資源分配至關重要,對死亡率較高的心臟術后患者尤為重要。本研究旨在評價不同疾病嚴重程度評分在心臟術后膿毒癥中的診斷價值及其在心臟術后患者遠期預后中的預測價值。
1 資料與方法
1.1 數據來源
這項研究使用 1.4 版本的重癥監護醫學信息數據庫-Ⅲ(Medical Information Mark for Intensive Care-Ⅲ,MIMIC-Ⅲ)[21]。MIMIC-Ⅲ數據庫是一個大型的、可自由獲取的數據庫,包括 2001~2012 年貝斯以色列女執事醫療中心(Beth Israel Deaconess Medical Center,BIDMC)ICU 5 萬多例患者健康相關的匿名數據。由麻省理工學院(Massachusetts Institute of Technology,MIT)、菲利普斯醫療保健(Phillips Healthcare)和 BIDMC 聯合開發。任何遵守數據使用協議并參加過“保護人類研究受試者”培訓的研究人員都可以使用該數據庫。作者在完成“保護人類研究受試者”培訓課程(認證號:37043738)后獲取訪問數據庫的資格。
1.2 臨床資料和分組
接受心內直視手術后入住心臟專科 ICU 的成年患者納入本回顧性研究。疾病診斷方法:根據 MIMIC-Ⅲ數據庫中提供的患者診斷信息進行判斷。納入標準:(1)年齡為 18~89 歲患者;(2)心臟手術包括單純冠狀動脈旁路移植術(coronary artery bypass grafting,CABG)或瓣膜重建/置換術,以及兩者結合,所有的擇期和緊急手術都包括在內。排除標準:(1)孕婦或哺乳期婦女;(2)ICU 期間應用體外膜肺氧合(extracorporeal membrane oxygenation,ECMO)或接受連續腎臟替代療法(continuous renal replacement therapy,CRRT);(3)合并獲得性免疫缺陷綜合征、淋巴瘤、轉移瘤、實體瘤、類風濕性關節炎、糖尿病、酗酒、物質濫用、抑郁癥、其它精神障礙、癱瘓以及其它神經系統疾病;(4)倘若患者有多次(≥2 次)入住 ICU 的記錄,則只將首次入住 ICU 記錄納入統計分析。
分組與分層:根據納入與排除標準,最終 6 638 例患者納入統計分析。根據國際疾病分類第 9 版臨床修訂本手術與操作(ICD-9-CM)編碼確定患者 ICU 期間是否出現膿毒癥(MIMIC-Ⅲ數據庫中收錄多種不同的膿毒癥診斷標準,對 ICU 患者進行膿毒癥的診斷)。本研究主要根據 Levy 等[22]建立的診斷標準診斷入選的患者是否出現心臟術后膿毒癥,并據此將本研究納入的患者分為非膿毒癥組(n=5 470)與膿毒癥組(n=1 168)。根據患者心臟術后 10 年是否存活,將患者分為生存組(n=4 893)與非生存組(n=1 745)。各評分系統的最佳閾值由 X-tile 3.6.1 程序確定,其統計學原理:在評估疾病嚴重程度評分大小與心臟術后患者的生存狀況的相關性過程中,通過取其最大χ2值和最小 P 值來確定最佳截斷值[23]。本研究按最佳截斷值對患者進行風險分層;大于最佳截斷值為高風險層,低于最佳截斷值則為低風險層。
1.3 數據提取
本研究通過使用結構化查詢語言(structure query language,SQL,代碼來自 MIMIC 數據庫的代碼庫 https://github.com/MIT-LCP/mimic-code)[24]以及 pgAdmin4 PostgreSQL 軟件(9.6 版)來進行數據提取[25]。提取患者以下信息:入住 ICU 時的年齡、性別、體重、手術緊急程度、入院診斷、ICU 期間是否被診斷為膿毒癥、機械通氣時間、入院時間、出院時間、入住 ICU 時間、轉出 ICU 時間、ICU 入住次數、總 ICU 住院時間、總住院時間、死亡標志(包括 ICU 死亡、院內死亡以及出院后死亡)以及相對應的死亡時間。此外,本研究根據代碼庫所提供的代碼提取每例患者的 SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、SIRS、LODS、MLODS、OASIS評分。以上疾病嚴重程度評分是在患者于 ICU 入院的最初 24 h 內計算所得。
在 MIMIC-Ⅲ數據庫中缺失數據很常見,因此本研究采用 EM(expectation maximization)算法進行插補。而且,在本研究中,每一項變量的丟失率均未超過 15%。
1.4 統計學分析
應用 SPSS 26.0 統計軟件、Stata MP 16、R 軟件 3.6.3(http://www.R-project.org)、X-tile 3.6.1 程序以及 MedCalc 19.2.6 對數據進行處理。連續變量用 Kolmogorow-Smirnov 檢驗進行正態性檢驗,正態分布的計量資料以均數±標準差(±s)描述,若不符合正態分布則以中位數及上下四分位數[M(P25,P75)]描述。分類變量以頻數和百分比(%)表示。連續變量的組間比較采用 t 檢驗或 Mann-Whitney U 檢驗,分類變量的組間比較采用 χ2 檢驗。非參數檢驗適用于非正態分布的數據。采用 DeLong 的方法比較每個評分系統的受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC),從而評價各評分系統區分膿毒癥的準確性[26]。通過 X-tile 程序確定各評分系統的最佳截斷值,然后按最佳截斷值對患者進行風險分層。最后,繪制 Kaplan-Meier 生存曲線以可視化地描述患者中、遠期生存狀況,并選用 log-rank 法檢驗兩組患者的生存曲線是否有差異。P≤0.05 為差異有統計學意義。
1.5 倫理審查
MIMIC-Ⅲ數據庫的建立得到了 MIT 和 BIDMC 機構審查委員會(Institutional Review Boards,IBR)的批準,認證號:37043738。由于原始的 MIMIC-Ⅲ數據收集不會影響患者安全,并且所有數據均根據《健康保險攜帶和責任法案》(Health Insurance Portability and Accountability Act,HIPAA)隱私規則進行了身份去識別化,因此 MIT 和 BIDMC 的 IBR 均豁免簽署知情同意書的要求。
2 結果
2.1 膿毒癥與非膿毒癥患者基線資料的比較
與非膿毒癥組相比,膿毒癥組的女性構成比較高、年齡較大、急診手術的構成比較高(P<0.001);SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、MLODS、LODS 及 OASIS 評分均高于非膿毒癥組(P<0.001);然而兩組患者在體重與 SIRS 評分方面的差異均無統計學意義(P>0.05);見表 1。


2.2 各評分系統區分膿毒癥的準確性比較
將 6 種評分系統的 AUC 進行多次比較,臨界 P 值調整為 0.05/6 并進行 Bonferroni 校正。與 SOFA 評分相比,APS-Ⅲ、SAPS-Ⅱ 和 LODS 評分的 AUC 較大(P<0.001),即其區分膿毒癥的準確性較高;見表 2、圖 1。


2.3 膿毒癥與非膿毒癥患者術后臨床結局比較
與非膿毒癥組相比,膿毒癥組機械通氣時間、ICU 住院時間、總住院時間均較長(P<0.001),ICU 內死亡及院內死亡率較高(P<0.001);而且膿毒癥組的 28 d、90 d、6 個月、1 年、3 年、5 年及 10 年總體生存率均低于非膿毒癥組(P<0.001);見表 3。

2.4 生存組與非生存組患者臨床資料比較
與非生存組相比,生存組的女性構成比較低(P<0.001),體重較重(P<0.001),年齡較小(P<0.001),擇期手術構成比較高(P<0.001);見表 4。非生存組的 SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、LODS、MLODS、OASIS 評分的高風險構成比均高于生存組(P<0.001),但兩組 SIRS 評分的高風險構成比差異無統計學意義(P=0.206)。SOFA[HR=2.50,95%CI(2.23,2.80),P<0.001]、SAPS[HR=2.93,95%CI(2.64,3.26),P<0.001]、SAPS-Ⅱ[HR=2.77,95%CI(2.51,3.04),P<0.001]、APS-Ⅲ[HR=2.90,95%CI(2.63,3.20),P<0.001]、LODS[HR=2.17,95%CI(1.97,2.38),P<0.001]、MLODS[HR=2.04,95%CI(1.86,2.25),P<0.001]、OASIS[HR=2.37,95%CI(2.16,2.60),P<0.001]評分的高風險層心臟手術患者術后 10 年總體生存率均低于低風險層患者,SIRS 評分的高低風險層患者術后 10 年總體生存率差異無統計學意義[HR=1.07,95%CI(0.96,1.20),P=0.230];見圖 2。




SOFA:序貫器官衰竭評分;SAPS:簡化急性生理學評分;APS:急性生理學評分;LODS:logistic 器官功能障礙評分;MLODS:修正 logistic 器官功能障礙評分;OASIS:牛津急性疾病嚴重程度評分;SIRS:全身炎癥反應綜合征評分
3 討論
在過去的半個世紀中,隨著醫療保健預防方面的重大進步以及診斷技術和治療方案的改進,人口預期壽命已大大延長。這些不斷變化的人口統計學特征已經對 ICU 產生了巨大影響,入院患者的平均年齡和 ICU 入院總數的增長速度超過醫療保健資源的增長速度[27]。從經過驗證的 ICU 量表中獲得的信息可能會在指導 ICU 醫生決策方面發揮越來越重要的作用,并可能在未來促進基于證據的有限醫療資源的配給。
迄今為止,許多研究[27-30]已經證實高齡對 ICU 結局存在負面影響。盡管高齡明顯與死亡率增加相關,但其它表示疾病嚴重程度的年齡相關因素比單獨年齡更能預測老年患者的 ICU 結局[31]。這些因素包括入院診斷、合并癥、手術緊急程度以及入 ICU 之前患者的功能狀態。常用的 ICU 預后評分模型包括 SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、SIRS、LODS、MLODS和OASIS。這些評分系統結合了年齡、性別、體重、其它生理學參數、合并癥、入院診斷、手術緊急狀態和格拉斯哥昏迷評分(Glasgow coma scale,CCS),可提供預測 ICU 死亡率的數值評分。
本研究通過 Kaplan-Meier 生存曲線及 log-rank 法檢驗各個疾病嚴重程度評分系統高、低風險組患者的 10 年總體生存率是否有差異,并沒有再將其它因素作為協變量考慮在內進行風險比的矯正。這是由于研究中的所有疾病嚴重程度評分系統均由一套經過多因素分析矯正的客觀量化指標組成。
本研究發現 SOFA[32]、APS-Ⅲ[33]、SAPS[31]、SAPS-Ⅱ[17]、LODS[17]、MLODS 以及 OASIS[19]評分系統對于預測心臟術后 10 年總體生存率具有良好的性能,而 SIRS 評分不具備此性能,這一發現與之前的研究[20, 34]一致,其原因為:SIRS 的標準[SIRS 標準定義:心率>90 次/min;呼吸頻率>20 次/min 或動脈二氧化碳分壓<32 mm Hg;體溫<36℃ 或>38℃;白細胞計數<4 000/mm3 或>12 000/mm3 或>10% 的細胞未成熟;SIRS 陽性被定義為評分≥2 分(滿分 4 分)[35]]還不夠具體,不足以識別具有高死亡風險的患者[36]。另一方面,疾病發展到器官功能障礙階段的膿毒癥患者有時可能不符合兩個 SIRS 標準。Kaukonen 等[20]的一項研究支持了這一假設,在這項研究中,每 8 例感染和器官功能障礙患者中就有 1 例不符合 SIRS 標準。
另外,值得一提的是,APS-Ⅲ評分在區分心臟術后膿毒癥能力方面優于 SOFA 評分。APS-Ⅲ評分系統是 APACHE-Ⅳ評分系統的一部分;APS 將患者的生理參數[37](包括生命體征、動脈血氣測量、CCS、血液樣本的實驗室檢查結果和尿量)合成為一個反映患者健康狀況的整數,值越高表明嚴重程度越高;而 SOFA 評分被提議專門用于膿毒癥[8]。但是,SOFA 最初是根據專家共識開發的,盡管 SOFA 評分已在隨后的研究中得到了廣泛的驗證,但由于其入選研究的病例混雜,故偏倚很大[21]。因此,與 SOFA 評分相比,APS-Ⅲ評分可能在單獨的 CABG 或瓣膜重建/置換術,以及兩者結合的心臟術后患者群體中區分膿毒癥的能力較強,但需要通過進一步的前瞻性研究提供充足的證據。
本研究存在以下三方面的局限性:第一,這項研究的研究對象只包括接受 CABG 和瓣膜手術患者,因此,本研究的結論可能不適用于接受其它心臟外科手術的患者。第二,這項研究為回顧性分析,可能會產生其固有的偏倚;第三,由于 MIMIC-Ⅲ數據庫僅包含患者的基線資料以及在 ICU 住院期間的臨床資料,患者術前與術中的臨床數據并未收錄到該數據庫中,因而難以識別納入本研究分析的患者是否存在術前感染。因此,需要通過前瞻性研究或回顧性分析臨床資料更為豐富的數據庫加以驗證和矯正。
總之,與 SOFA 評分相比,APS-Ⅲ評分可能在單獨的 CABG 或瓣膜重建/置換術,以及兩者結合的心臟術后患者群體中具有較高的膿毒癥診斷價值;除 SIRS 標準評分外,SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、LODS、MLODS 以及 OASIS 評分系統均可用于預測心臟術后患者的遠期預后。
利益沖突:無。
作者貢獻:沈瑞環負責論文設計、數據整理與分析以及論文初稿撰寫;王旭負責論文審閱與修改;魯中原負責論文部分設計。
膿毒癥(sepsis)是心臟術后患者再次轉入重癥監護室(intensive care unit,ICU)的重要原因[1],也是患者在 ICU 出現多器官衰竭和導致死亡的主要原因[2-3]。它被世界衛生組織認為是一個世界性的健康問題,估計每年在全球范圍內造成 600 萬人死亡[4-5]。大約 1/3 的 ICU 患者會在入住 ICU 期間發生膿毒癥,而且膿毒癥休克死亡率高達 50%[2]。早期診斷、抗生素應用和積極的液體復蘇是膿毒癥患者治療的重要手段,可有效降低死亡率[6]。
膿毒癥的定義在 2016 年再次發生變化,根據第三次國際共識對膿毒癥和膿毒癥休克的定義(the third international consensus definitions for sepsis and septic shock,sepsis-3)[7],膿毒癥標準的焦點轉向器官功能障礙的體征,而不再基于全身炎癥反應綜合征,器官衰竭在死亡率預測方面更好。這一定義將序貫器官衰竭評分(sequential organ failure assessment,SOFA)重新引入臨床應用[8]。
最初,SOFA 評分旨在依序評估危重膿毒癥患者器官功能障礙的嚴重程度,并在 16 個國家/地區的 40 個 ICU 中心的 1 449 例患者中得到驗證[9]。由于重癥患者通常會出現多器官功能障礙,因此 SOFA 也用于預測其它原因引起的器官衰竭患者的死亡率[10-13],如預測心臟手術或造血干細胞移植患者的死亡率[14-15]。其它評分系統還包括:急性生理學評分-Ⅲ(acute physiology score-Ⅲ,APS-Ⅲ)、簡化急性生理學評分(simplified acute physiology score,SAPS)、簡化急性生理學評分-Ⅱ(simplified acute physiology score-Ⅱ,SAPS-Ⅱ)、全身炎癥反應綜合征評分(systemic inflammation response score,SIRS)、logistic 器官功能障礙評分(logistic organ dysfunction score,LODS)、修正 logistic 器官功能障礙評分(modified logistic organ dysfunction score,MLODS)、牛津急性疾病嚴重程度評分(Oxford acute severity of illness score,OASIS)。
Le 等[16]認為,在膿毒癥患者的預后分層方面,SAPS 的性能與急性生理和慢性健康狀況評價系統(acute physiology,age,and chronic health evaluation,APACHE)內的 APS 評分系統相當,甚至更便于臨床實踐,因為它包含的變量較少。Moemen 等[17]也認為 SAPS-Ⅱ可用于危重患者(包括全身膿毒癥患者)的預后分層;Wang 等[18]通過多中心回顧性研究發現,LODS 能較好地預測中國醫院的 ICU 嚴重膿毒癥患者住院死亡率;Chen 等[19]的回顧性研究證實 OASIS 與 ICU 膿毒癥患者的預后存在顯著相關性。然而,SIRS 標準由于敏感性和特異性不足,在識別膿毒癥患者和風險分層的有效性方面受到質疑[20]。以上研究的人群大多集中在綜合 ICU,而本研究主要聚焦于心臟術后住 ICU 患者。
上述評分系統均由一套客觀的量化指標組成,用于評估疾病的嚴重程度和預后。研究[16-20]表明疾病的嚴重程度和患者的生理功能障礙可以揭示危重情況并預測死亡風險。早期判斷病情嚴重程度和預后對臨床決策和 ICU 資源分配至關重要,對死亡率較高的心臟術后患者尤為重要。本研究旨在評價不同疾病嚴重程度評分在心臟術后膿毒癥中的診斷價值及其在心臟術后患者遠期預后中的預測價值。
1 資料與方法
1.1 數據來源
這項研究使用 1.4 版本的重癥監護醫學信息數據庫-Ⅲ(Medical Information Mark for Intensive Care-Ⅲ,MIMIC-Ⅲ)[21]。MIMIC-Ⅲ數據庫是一個大型的、可自由獲取的數據庫,包括 2001~2012 年貝斯以色列女執事醫療中心(Beth Israel Deaconess Medical Center,BIDMC)ICU 5 萬多例患者健康相關的匿名數據。由麻省理工學院(Massachusetts Institute of Technology,MIT)、菲利普斯醫療保健(Phillips Healthcare)和 BIDMC 聯合開發。任何遵守數據使用協議并參加過“保護人類研究受試者”培訓的研究人員都可以使用該數據庫。作者在完成“保護人類研究受試者”培訓課程(認證號:37043738)后獲取訪問數據庫的資格。
1.2 臨床資料和分組
接受心內直視手術后入住心臟專科 ICU 的成年患者納入本回顧性研究。疾病診斷方法:根據 MIMIC-Ⅲ數據庫中提供的患者診斷信息進行判斷。納入標準:(1)年齡為 18~89 歲患者;(2)心臟手術包括單純冠狀動脈旁路移植術(coronary artery bypass grafting,CABG)或瓣膜重建/置換術,以及兩者結合,所有的擇期和緊急手術都包括在內。排除標準:(1)孕婦或哺乳期婦女;(2)ICU 期間應用體外膜肺氧合(extracorporeal membrane oxygenation,ECMO)或接受連續腎臟替代療法(continuous renal replacement therapy,CRRT);(3)合并獲得性免疫缺陷綜合征、淋巴瘤、轉移瘤、實體瘤、類風濕性關節炎、糖尿病、酗酒、物質濫用、抑郁癥、其它精神障礙、癱瘓以及其它神經系統疾病;(4)倘若患者有多次(≥2 次)入住 ICU 的記錄,則只將首次入住 ICU 記錄納入統計分析。
分組與分層:根據納入與排除標準,最終 6 638 例患者納入統計分析。根據國際疾病分類第 9 版臨床修訂本手術與操作(ICD-9-CM)編碼確定患者 ICU 期間是否出現膿毒癥(MIMIC-Ⅲ數據庫中收錄多種不同的膿毒癥診斷標準,對 ICU 患者進行膿毒癥的診斷)。本研究主要根據 Levy 等[22]建立的診斷標準診斷入選的患者是否出現心臟術后膿毒癥,并據此將本研究納入的患者分為非膿毒癥組(n=5 470)與膿毒癥組(n=1 168)。根據患者心臟術后 10 年是否存活,將患者分為生存組(n=4 893)與非生存組(n=1 745)。各評分系統的最佳閾值由 X-tile 3.6.1 程序確定,其統計學原理:在評估疾病嚴重程度評分大小與心臟術后患者的生存狀況的相關性過程中,通過取其最大χ2值和最小 P 值來確定最佳截斷值[23]。本研究按最佳截斷值對患者進行風險分層;大于最佳截斷值為高風險層,低于最佳截斷值則為低風險層。
1.3 數據提取
本研究通過使用結構化查詢語言(structure query language,SQL,代碼來自 MIMIC 數據庫的代碼庫 https://github.com/MIT-LCP/mimic-code)[24]以及 pgAdmin4 PostgreSQL 軟件(9.6 版)來進行數據提取[25]。提取患者以下信息:入住 ICU 時的年齡、性別、體重、手術緊急程度、入院診斷、ICU 期間是否被診斷為膿毒癥、機械通氣時間、入院時間、出院時間、入住 ICU 時間、轉出 ICU 時間、ICU 入住次數、總 ICU 住院時間、總住院時間、死亡標志(包括 ICU 死亡、院內死亡以及出院后死亡)以及相對應的死亡時間。此外,本研究根據代碼庫所提供的代碼提取每例患者的 SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、SIRS、LODS、MLODS、OASIS評分。以上疾病嚴重程度評分是在患者于 ICU 入院的最初 24 h 內計算所得。
在 MIMIC-Ⅲ數據庫中缺失數據很常見,因此本研究采用 EM(expectation maximization)算法進行插補。而且,在本研究中,每一項變量的丟失率均未超過 15%。
1.4 統計學分析
應用 SPSS 26.0 統計軟件、Stata MP 16、R 軟件 3.6.3(http://www.R-project.org)、X-tile 3.6.1 程序以及 MedCalc 19.2.6 對數據進行處理。連續變量用 Kolmogorow-Smirnov 檢驗進行正態性檢驗,正態分布的計量資料以均數±標準差(±s)描述,若不符合正態分布則以中位數及上下四分位數[M(P25,P75)]描述。分類變量以頻數和百分比(%)表示。連續變量的組間比較采用 t 檢驗或 Mann-Whitney U 檢驗,分類變量的組間比較采用 χ2 檢驗。非參數檢驗適用于非正態分布的數據。采用 DeLong 的方法比較每個評分系統的受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC),從而評價各評分系統區分膿毒癥的準確性[26]。通過 X-tile 程序確定各評分系統的最佳截斷值,然后按最佳截斷值對患者進行風險分層。最后,繪制 Kaplan-Meier 生存曲線以可視化地描述患者中、遠期生存狀況,并選用 log-rank 法檢驗兩組患者的生存曲線是否有差異。P≤0.05 為差異有統計學意義。
1.5 倫理審查
MIMIC-Ⅲ數據庫的建立得到了 MIT 和 BIDMC 機構審查委員會(Institutional Review Boards,IBR)的批準,認證號:37043738。由于原始的 MIMIC-Ⅲ數據收集不會影響患者安全,并且所有數據均根據《健康保險攜帶和責任法案》(Health Insurance Portability and Accountability Act,HIPAA)隱私規則進行了身份去識別化,因此 MIT 和 BIDMC 的 IBR 均豁免簽署知情同意書的要求。
2 結果
2.1 膿毒癥與非膿毒癥患者基線資料的比較
與非膿毒癥組相比,膿毒癥組的女性構成比較高、年齡較大、急診手術的構成比較高(P<0.001);SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、MLODS、LODS 及 OASIS 評分均高于非膿毒癥組(P<0.001);然而兩組患者在體重與 SIRS 評分方面的差異均無統計學意義(P>0.05);見表 1。


2.2 各評分系統區分膿毒癥的準確性比較
將 6 種評分系統的 AUC 進行多次比較,臨界 P 值調整為 0.05/6 并進行 Bonferroni 校正。與 SOFA 評分相比,APS-Ⅲ、SAPS-Ⅱ 和 LODS 評分的 AUC 較大(P<0.001),即其區分膿毒癥的準確性較高;見表 2、圖 1。


2.3 膿毒癥與非膿毒癥患者術后臨床結局比較
與非膿毒癥組相比,膿毒癥組機械通氣時間、ICU 住院時間、總住院時間均較長(P<0.001),ICU 內死亡及院內死亡率較高(P<0.001);而且膿毒癥組的 28 d、90 d、6 個月、1 年、3 年、5 年及 10 年總體生存率均低于非膿毒癥組(P<0.001);見表 3。

2.4 生存組與非生存組患者臨床資料比較
與非生存組相比,生存組的女性構成比較低(P<0.001),體重較重(P<0.001),年齡較小(P<0.001),擇期手術構成比較高(P<0.001);見表 4。非生存組的 SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、LODS、MLODS、OASIS 評分的高風險構成比均高于生存組(P<0.001),但兩組 SIRS 評分的高風險構成比差異無統計學意義(P=0.206)。SOFA[HR=2.50,95%CI(2.23,2.80),P<0.001]、SAPS[HR=2.93,95%CI(2.64,3.26),P<0.001]、SAPS-Ⅱ[HR=2.77,95%CI(2.51,3.04),P<0.001]、APS-Ⅲ[HR=2.90,95%CI(2.63,3.20),P<0.001]、LODS[HR=2.17,95%CI(1.97,2.38),P<0.001]、MLODS[HR=2.04,95%CI(1.86,2.25),P<0.001]、OASIS[HR=2.37,95%CI(2.16,2.60),P<0.001]評分的高風險層心臟手術患者術后 10 年總體生存率均低于低風險層患者,SIRS 評分的高低風險層患者術后 10 年總體生存率差異無統計學意義[HR=1.07,95%CI(0.96,1.20),P=0.230];見圖 2。




SOFA:序貫器官衰竭評分;SAPS:簡化急性生理學評分;APS:急性生理學評分;LODS:logistic 器官功能障礙評分;MLODS:修正 logistic 器官功能障礙評分;OASIS:牛津急性疾病嚴重程度評分;SIRS:全身炎癥反應綜合征評分
3 討論
在過去的半個世紀中,隨著醫療保健預防方面的重大進步以及診斷技術和治療方案的改進,人口預期壽命已大大延長。這些不斷變化的人口統計學特征已經對 ICU 產生了巨大影響,入院患者的平均年齡和 ICU 入院總數的增長速度超過醫療保健資源的增長速度[27]。從經過驗證的 ICU 量表中獲得的信息可能會在指導 ICU 醫生決策方面發揮越來越重要的作用,并可能在未來促進基于證據的有限醫療資源的配給。
迄今為止,許多研究[27-30]已經證實高齡對 ICU 結局存在負面影響。盡管高齡明顯與死亡率增加相關,但其它表示疾病嚴重程度的年齡相關因素比單獨年齡更能預測老年患者的 ICU 結局[31]。這些因素包括入院診斷、合并癥、手術緊急程度以及入 ICU 之前患者的功能狀態。常用的 ICU 預后評分模型包括 SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、SIRS、LODS、MLODS和OASIS。這些評分系統結合了年齡、性別、體重、其它生理學參數、合并癥、入院診斷、手術緊急狀態和格拉斯哥昏迷評分(Glasgow coma scale,CCS),可提供預測 ICU 死亡率的數值評分。
本研究通過 Kaplan-Meier 生存曲線及 log-rank 法檢驗各個疾病嚴重程度評分系統高、低風險組患者的 10 年總體生存率是否有差異,并沒有再將其它因素作為協變量考慮在內進行風險比的矯正。這是由于研究中的所有疾病嚴重程度評分系統均由一套經過多因素分析矯正的客觀量化指標組成。
本研究發現 SOFA[32]、APS-Ⅲ[33]、SAPS[31]、SAPS-Ⅱ[17]、LODS[17]、MLODS 以及 OASIS[19]評分系統對于預測心臟術后 10 年總體生存率具有良好的性能,而 SIRS 評分不具備此性能,這一發現與之前的研究[20, 34]一致,其原因為:SIRS 的標準[SIRS 標準定義:心率>90 次/min;呼吸頻率>20 次/min 或動脈二氧化碳分壓<32 mm Hg;體溫<36℃ 或>38℃;白細胞計數<4 000/mm3 或>12 000/mm3 或>10% 的細胞未成熟;SIRS 陽性被定義為評分≥2 分(滿分 4 分)[35]]還不夠具體,不足以識別具有高死亡風險的患者[36]。另一方面,疾病發展到器官功能障礙階段的膿毒癥患者有時可能不符合兩個 SIRS 標準。Kaukonen 等[20]的一項研究支持了這一假設,在這項研究中,每 8 例感染和器官功能障礙患者中就有 1 例不符合 SIRS 標準。
另外,值得一提的是,APS-Ⅲ評分在區分心臟術后膿毒癥能力方面優于 SOFA 評分。APS-Ⅲ評分系統是 APACHE-Ⅳ評分系統的一部分;APS 將患者的生理參數[37](包括生命體征、動脈血氣測量、CCS、血液樣本的實驗室檢查結果和尿量)合成為一個反映患者健康狀況的整數,值越高表明嚴重程度越高;而 SOFA 評分被提議專門用于膿毒癥[8]。但是,SOFA 最初是根據專家共識開發的,盡管 SOFA 評分已在隨后的研究中得到了廣泛的驗證,但由于其入選研究的病例混雜,故偏倚很大[21]。因此,與 SOFA 評分相比,APS-Ⅲ評分可能在單獨的 CABG 或瓣膜重建/置換術,以及兩者結合的心臟術后患者群體中區分膿毒癥的能力較強,但需要通過進一步的前瞻性研究提供充足的證據。
本研究存在以下三方面的局限性:第一,這項研究的研究對象只包括接受 CABG 和瓣膜手術患者,因此,本研究的結論可能不適用于接受其它心臟外科手術的患者。第二,這項研究為回顧性分析,可能會產生其固有的偏倚;第三,由于 MIMIC-Ⅲ數據庫僅包含患者的基線資料以及在 ICU 住院期間的臨床資料,患者術前與術中的臨床數據并未收錄到該數據庫中,因而難以識別納入本研究分析的患者是否存在術前感染。因此,需要通過前瞻性研究或回顧性分析臨床資料更為豐富的數據庫加以驗證和矯正。
總之,與 SOFA 評分相比,APS-Ⅲ評分可能在單獨的 CABG 或瓣膜重建/置換術,以及兩者結合的心臟術后患者群體中具有較高的膿毒癥診斷價值;除 SIRS 標準評分外,SOFA、APS-Ⅲ、SAPS、SAPS-Ⅱ、LODS、MLODS 以及 OASIS 評分系統均可用于預測心臟術后患者的遠期預后。
利益沖突:無。
作者貢獻:沈瑞環負責論文設計、數據整理與分析以及論文初稿撰寫;王旭負責論文審閱與修改;魯中原負責論文部分設計。