手術風險預測是指用國際上權威的數學模型來預測患者術后不良事件的發生率、手術死亡率等。對于高風險的心臟外科手術,心臟手術風險預測可以指導制定治療方案,規避術后并發癥發生風險,已逐漸引起心臟外科醫師的關注。心臟手術風險預測方法眾多,包括歐洲心臟手術風險預測法(the European System for Cardiac Operative Risk Evaluation,EuroSCORE)、加拿大安大略省心臟手術風險預測法(Ontario Province Risk,OPR)、美國胸外科醫師協會心臟手術風險預測法(the Society of Thoracic Surgeons score,STS score)、克利夫蘭心臟手術風險預測法(Cleveland model)、“質量測量和管理舉措”心臟手術風險預測法(Quality Measurement and Management Initiative,QMMI)、美國心臟病學院/美國心臟協會心臟手術風險預測法(American College of Cardiology/American Heart Association,ACC/AHA Guidelines for Coronary Artery Bypass Graft Surgery)以及中國冠狀動脈旁路移植術風險預測法(Sino-System for Coronary Operative Risk Evaluation,SinoSCORE)等。它們都是根據某一地域內上千或上萬例行心臟手術患者的數據而建立,由于數據來源存在地域性,不同預測方案的異質性,因此,當這些預測方法用來評價其他地域的病例時,往往會存在偏倚和異質性,如何避免偏差、提高預測效果是今后研究的主要目標。現對心臟手術風險預測方法的研究進展進行綜述。
引用本文: 張蔚然, 張石江, 邵永豐. 心臟手術風險預測方法的研究進展. 中國胸心血管外科臨床雜志, 2014, 21(3): 402-410. doi: 10.7507/1007-4848.20140109 復制
外科手術是一種有創治療疾病的方式,但有時創傷會引起身體機能的惡化,甚至導致重要器官功能衰竭,帶來與手術初衷相反的結果。術前對患者進行手術風險的全面評估是降低圍術期并發癥發生率和死亡率的有效措施[1]。手術風險評估是指在臨床實踐中,廣泛收集各種可能影響病情和預后的因子,再通過統計學方法篩選出與手術風險和預后密切相關的因素,通過建立數學模型對患者手術進行風險評估[2]。
手術風險預測是術前手術風險評估的一種量化形式,是依據患者術前的生理狀態、基礎疾病、麻醉和手術對機體的影響,數字量化評價風險水平的方法[1]。手術風險預測方法多達數十種,經常使用的有:生理改變-手術干擾程度對病死率影響的評估(A Physio-logical and Operative Severity Score for the enumeration of Mortality and Morbidity)、生理功能-手術應激-疾病綜合風險預測法[Estimation of Physiologic Ability and Surgical Stress(EPASS),with Preoperative Risk Score(PRS),Surgical Stress Score(SSS)and Comprehensive Risk Score(CRS)]、術后30 d病死率預測法(Predicting 30-Day Surgical Mortality)、老年患者手術死亡率預測法(Predicting Operative Mortality in Geriatric Patients)、多種疾病患者擇期手術死亡風險預測法(Mortality Risk in Patients with Coexisting Conditions Undergoing Elective Surgery)等[3-5]。
心臟手術因手術器官的特殊性、手術環節的復雜性以及手術技術的高要求性,圍手術期死亡率較高。因此,心臟外科醫師很早就重視手術風險預測的問題,進行了一些心臟手術風險預測的探索[6]。自1989年以來,國際醫學團體已制定出多種心臟手術風險預測方法,如最早的心血管手術風險預測法——Parsonnet心臟手術風險預測法(Parsonnet′s score)[7]、歐洲心臟手術風險預測法(the European System for Cardiac Operative Risk Evaluation,EuroSCORE)[8-9]、加拿大安大略省心臟手術風險預測法(Ontario Province Risk,OPR)[10]、美國胸外科醫師協會心臟手術風險預測法(the Society of Thoracic Surgeons score,STS score)[11]、克利夫蘭心臟手術風險預測法(Cleveland model)[12]、“質量測量和管理舉措”心臟手術風險預測法(Quality Measurement and Management Initiative,QMMI)[13]、美國心臟病學院/美國心臟協會心臟手術風險預測法(ACC/AHA Guidelines for Coronary Artery Bypass Graft Surgery)[14]以及中國冠狀動脈旁路移植術風險預測法(Sino-System for Coronary Operative Risk Evaluation,SinoSCORE)[15-16]。
我們以心臟外科手術風險評估為出發點,從心臟手術風險預測方法的建立和目前國內外主要心臟手術風險預測方法的研究和應用做一綜述。
1 心臟手術風險預測方法的建立
1.1 研究樣本的選擇
作為預測心臟手術風險的樣本,必須是行心臟直視手術的患者。單個樣本的數據是由患者的一般情況、心臟疾病情況、麻醉過程、手術過程和術后恢復過程等臨床資料組成,這些項目以統計數據形式記錄。大規模地收集完整的數據,才能進行進一步的分析。從Parsonnet′s score到SinoSCORE樣本選擇的經驗回顧,多中心、大樣本量(上萬例樣本)是良好的心臟手術風險預測方法的數據基礎。由于國內外手術風險預測均針對成人患者,因此,研究樣本還須排除非成人患者。為了研究的可信性,還須排除臨床資料收集不完全的患者。
1.2 研究終點的選擇
死亡率是應用最廣泛的結果指標之一[17]。Roques [8]在EuroSCORE項目中,定義死亡率為術后30 d內或術后醫院內發生的死亡。而國內SinoSCORE的研究終點選擇為手術死亡率,即所有發生在術后30 d內的死亡[17]。與死亡率相比較,發病率包含了眾多的異構參數,因此死亡率作為結果的預測價值較發病率高得多[18]。還有一些研究的終點使用術后惡性事件,如術后發生急性左心衰竭或右心衰竭、嚴重影響血流動力學穩定的心律失常、永久性神經系統損害、嚴重切口感染、呼吸功能不全和嚴重肺部感染等。但無法明確界定這些終點事件的概念,且觀察周期較長,不如死亡率直接、方便。
1.3 確定危險因素
危險因素與患者的病情和預后關系密切,影響手術死亡的各種潛在危險因素一般來自結合以往的文獻報道和專家學者的臨床專業知識和經驗[19]。常見的危險因素包括:年齡、性別、一般狀況、疾病的嚴重程度等。例如EuroSCORE和SinoSCORE的危險因素均包括患者的相關因素、心臟相關因素、手術相關因素三大類。心血管疾病存在與之發病相關的危險因素,如高血壓病、吸煙、肥胖、糖尿病以及平時進食蔬菜水果少、缺乏體力活動等。這些危險因素被研究者證實是心血管疾病的主要誘發因素,90%以上的心肌梗死都被歸因于此[20-23]。有研究表明,睡眠過少(<6 h/d)或過多(>9 h/d)是高血壓和代謝綜合征的獨立危險因素[24-26]。這些危險因素從不會獨立存在,多種因素之間常常互相聯系,相互影響,最終導致心血管疾病的發生[27-28]。
由于心臟手術風險預測方法的建立需要大樣本,并且入選的危險因素較多,需要注意產生各種偏倚,如入選偏倚、排除偏倚、臨床資料遺漏偏倚及混雜偏倚等。如何控制偏倚是風險預測可信度高的基礎。入選的危險因素首先要盡可能的客觀,診斷標準最好采用國際診斷標準,其次為國內統一標準,或全國性學術組織制定的診斷標準,以及高校教科書記載的有關診斷標準,或地方性學術組織制定的診斷標準;其次要盡可能地簡潔,但又不失代表性和典型性,便于錄入操作和分析[2]。
1.4 研究方法和評價
使用計算機軟件對收集的海量臨床資料進行統計學分析。完善的臨床資料由絕對數、標準位數或百分位數等數據的形式表現出來,數據的統計用辦公軟件來進行歸總、分類,最后用統計學軟件對數據進行分析。一般用χ2檢驗、Fisher′s精確檢驗來對數據進行統計分析。受試者工作特征曲線(receiver operating characteristic curve,ROC)被用來描繪不同的心臟手術風險預測方法,并通過計算曲線下面積(area under the receiver operating characteristics curve,AUC)來評價預測方法的識別度; 擬合優度檢驗(Hosmer-Lemeshow,H-L)被用來評價不同的心臟手術風險預測方法的校準度。
根據不同的心臟手術風險預測方法應用于同一個心臟手術患者群體可以計算出不同的預測死亡率,而對于一個明確的心臟手術患者群體實際死亡率是惟一的,如何評價預測死亡率與實際死亡率之間的關系,這就需要專業的醫學統計學方法。理想的心臟手術風險預測方法應具有良好的識別度和校準度。良好的識別度是指心臟手術風險預測方法有良好的區分死亡和生存患者的能力。識別度常用ROC來檢測,在ROC上,最靠近坐標圖左上方的點為敏感性和特異性均較高的臨界值。AUC越接近1,心臟手術風險預測方法的識別度越好;AUC越接近0.5,心臟手術風險預測方法的識別度越差。AUC大于0.7提示該心臟手術風險預測方法具有良好的識別度[29-31]。良好的校準度是指心臟手術風險預測方法的預測死亡率與實際死亡率相接近。校準度常用擬合優度檢驗(H-L)驗證模型。P>0.05顯示心臟手術風險預測方法對死亡率有較好的校準度[32]。
2 國內外主要心臟手術風險預測方法及其應用
2.1 歐洲心臟手術風險預測方法
EuroSCORE是根據1995年9~12月歐洲8個國家的128個心臟中心19 030例成人心血管手術病例資料而建立的心臟手術風險預測方法[
死亡率=e(β0+∑βi Xi)/1+e(β0+∑βi Xi)
e指自然對數,β0指回歸方程常數,β0=-4.789 594;βi指每個危險因素的系數;Xi在風險因素存在的情況下為1,不存在的情況下為0;年齡的Xi為小于或等于59歲,Xi=1,每增加1歲,Xi增加1。具體風險因素見表 1。

在歐洲心臟手術風險預測方法有19項之多[
死亡率=e (β0+∑βi Xi)/1+e (β0+∑βi Xi)
e指自然對數;β0指回歸方程常數,β0=-5.324 537;βi指每個危險因素的系數;Xi在風險因素存在的情況下為1,不存在的情況下為0;年齡的Xi為小于或等于60歲,Xi=1,每增加1歲,Xi增加1。具體風險因素見表 2。

與EuroSCORE相比較,EuroSCOREⅡ無Additivescore和Logistic score兩項計算結果,而是只用對數算法獲得預測死亡率一項結果。危險因素與舊版相比較,新增了糖尿病須胰島素治療項,腎功能的評價由舊版的血肌酐值變成了內生肌酐清除率,肺動脈高壓的評價具體到了中度或重度;舊版中的室間隔穿孔危險因素項在新版中已予以刪除。
EuroSCORE一經建立即在歐洲各國的心臟中心廣泛應用,曾獲得較高的評價;但近幾年由于醫療科技的發展,手術技術的成熟,使得原本病情很危重患者的存活變成可能,因此EuroSCORE被越來越多地評價為高估了患者的死亡率。Bhatti等[39]用Logistic EuroSCORE對9 995例心臟手術患者的臨床資料進行了研究,發現預測死亡率為5.7%,而實際死亡率為3.3%(χ2檢驗,P=0.02);Yap等[40]對8 331例單純行冠狀動脈旁路移植術(CABG)患者使用Logistic EuroSCORE進行風險預測,預測死亡率為8.76%,實際死亡率為3.2%(H-L:P<0.05)。EuroSCOREⅡ基于最近幾年患者的數據建立,因此,評分效果較好。Grant等[41]從2010年7月至2011年3月用EuroSCOREⅡ對英國41家醫院23 740例行心臟手術患者的臨床資料進行了研究,發現預測死亡率為3.4%,而實際死亡率為3.1%,AUC:0.808,表明EuroSCOREⅡ具有良好的識別度。
2.2 美國胸外科醫師協會心臟手術風險預測方法
STS score是美國胸外科醫師協會建立的用來預測心臟外科手術死亡率及并發癥發生率的心臟手術風險預測方法,與EuroSCORE一樣,是一個在線評分系統(http://riskcalc.sts.org/STSWebRiskCalc273/de.aspx),用來預測心臟外科手術患者的手術死亡率。美國胸外科醫師協會(STS)數據庫[
與EuroSCORE相比較,STS score似乎低估了圍手術期的風險[48]。Basraon等[49]通過1997~2008年間537例嚴重主動脈瓣狹窄行主動脈瓣置換術的數據比較了EuroSCORE與STS score,實際死亡率為5.9%,EuroSCORE與STS score的預測死亡率分別為15.6%和3.6%,得出結論:EuroSCORE校準度差(H-L:P<0.008),而STS score校準度較好;兩種評分的識別度均較好,但STS score更好(AUC:0.73)。Wang等[50]對2006~2011年間中國上海長海醫院3 479例心臟瓣膜手術的數據進行了EuroSCORE II、STS score評分,得出結論:STS score校準度好(H-L:P=0.126),EuroSCOREⅡ低估了風險(H-L:P<0.000 1);STS score識別度最好(AUC:0.706)
2.3 加拿大安大略省心臟手術風險預測方法
OPR[10]是建立在加拿大安大略省13 098例行心臟手術患者數據庫基礎上的心臟手術風險預測方法。1991年加拿大安大略省建立了全省范圍內等待心臟手術患者詳細資料的數據庫[51]。臨床資料來源于安大略省9個醫療機構中心,并由其中的1個中心于1991年4月開始收集并錄入。13 098例臨床資料被分為兩部分,6 213例資料(1991年4月1日至1992年3月31日之間手術)用來制定危險因素,建立心臟手術風險預測方法,6 885例資料(1992年4月1日至1993年3月31日之間手術)被用來評價這個心臟手術風險預測方法。
心臟手術風險預測方法的評分標準共6項:年齡、性別、左心室射血分數、手術緊急程度、既往CABG史以及手術類型。上述各項標準根據不同患者有相應分值對應,總分被設定為0~16分,分為3組,0~3分為低風險組,4~7分為中等風險組,≥8分為高風險組。預測結果包括術后院內死亡率、術后長期ICU停留率、術后長期住院率。
OPR簡單、高效,便于使用,但由于其數據來源僅局限于安大略省,因此適用性不廣泛。Antunes等[52]評價了4 567例行CABG患者的OPR預測結果,認為其高估了患者的術后死亡率(預測死亡率1.66%,實際死亡率0.96%,H-L:P<0.005)。
2.4 Parsonnet心臟手術風險預測方法
Parsonnet′s score由Parsonnet等[
2.5 克利夫蘭心臟手術風險預測方法
Cleveland model是1992年由克利夫蘭心臟中心建立的[12]。該心臟手術風險預測方法用來比較行CABG患者發病率和死亡率風險與疾病嚴重程度的關系。通過對該心臟中心5 051例患者的資料進行回顧性分析,來確定風險因素與圍手術期發病率及死亡率的關系。參與該項目的病例來自于1986年7月1日至1990年6月30日在該中心行CABG的患者。該心臟手術風險預測方法研究發現:與CABG死亡率高度相關的危險因素為:急診手術、圍手術期血肌酐高于168 μmol/L、嚴重左心室功能障礙、術前紅細胞壓積0.34、高齡、慢性肺部疾病、曾行血管外科手術、二次心臟手術、二尖瓣功能不全;與發病率高度相關的危險因素為糖尿病、體重低于65 kg、主動脈瓣狹窄、腦血管疾病。這些危險因素被劃分為0~6分,通過邏輯回歸方程建立加法模型來評分。該心臟手術風險預測方法可以用來預測CABG圍手術期發病率和死亡率。同Parsonnet′s score一樣,由于該心臟手術風險預測方法建立較早,且建模病例多是體外循環下CABG,目前對于死亡率的預測已較差。
2.6 “質量測量和管理舉措”心臟手術風險預測方法
QMMI心臟手術風險預測方法[13]來源于1993年8月至1995年10月在12個醫學中心行CABG的9 498例成人患者。該心臟手術風險預測方法用來預測行CABG患者的不良事件,不良事件被定義為死亡、腎功能衰竭、再次心肌梗死、心搏驟停、腦血管意外或昏迷。16個危險因素與不良后果獨立相關聯,每一項危險評分根據患者的情況不同分為2~12分,根據總分將患者分為6個危險等級。該心臟手術風險預測方法在識別度和校準度方面表現良好,因此可以用來準確預測CABG患者術后不良事件的發生率。Vanagas等[56]用QMMI、EuroSCORE來預測1 021例行CABG患者的死亡率,并進行了比較,結果表明QMMI有良好的敏感度(33.3%)、特異度(97.2%)、準確度(84.5%);EuroSCORE敏感度、特異度、準確度分別為20.7%、96.7%、72.2%。
2.7 中國冠狀動脈旁路移植術風險預測方法
由于國際上的心臟手術風險預測方法預測中國患者時常常會高估其手術死亡率[

SinoSCORE制定者們運用科學嚴謹的統計學方法對其預測功能進行評價,并與被歐洲視為“金標準”的EuroSCORE風險評分系統進行了比較。結果證明對于中國患者,SinoSCORE優于EuroSCORE,能更加準確地評估中國CABG患者院內死亡風險(H-L:P=0.7,AUC=0.8)[60]。同時,制定者們也用SinoSCORE和EuroSCORE對2007~2008年來自中國43個醫學中心的15 367例心瓣膜手術的病例進行了研究,得出同樣的結論:SinoSCORE優于EuroSCORE,能夠更加準確地評估中國心瓣膜手術患者的院內死亡風險(實際死亡率2.34%,additive、logistic EuroSCORE、SinoSCORE分別為3.71%、3.19%、3.66%,AUC分別為0.699、0.696、0.747,H-L分別為P=0.051、P<0.05、P=0.25)[61]。SinoSCORE在中國最大樣本數據庫——中國成人心臟外科數據庫中得到了很好的驗證。但中國成人心臟外科數據庫的數據來源于全中國多個醫療中心,且以北方患者的數據居多。由于我國醫療發展水平及經濟發展水平的不均衡性,手術數量和質量存在一定的差異,SinoSCORE用于預測單中心患者手術風險時,仍需進行驗證。
錢永軍等[62]用SinoSCORE預測華西醫院2 088例成人心臟手術后院內死亡風險(預測死亡率2.35%,實際死亡率2.25%;χ2=3.164,P=0.582;AUC:0.751),校準度與識別度均較好。廣東心血管病研究所郭惠明等[63]用SinoSCORE評價接受CABG和心瓣膜手術的2 462例成人心臟病患者,認為SinoSCORE表現出很好的校準度和識別度,可以用來預測廣東患者心臟外科手術后院內死亡(H-L:P=0.34,AUC:0.84)。
3 問題與展望
國內外的主要心臟手術風險預測方法在識別度和校準度方面仍存在一些問題,例如EuroSCORE、Parsonnet′s score等心臟手術風險預測方法的建立是基于20多年前的數據庫。這20多年間,心臟外科手術的技術水平及圍手術期處理能力都有了穩步提升,因此,對于患者手術風險預測將有所偏差;且研究終點通常為術后30 d內的死亡,既往文獻已經提出CABG術后的死亡事件可能發生較晚,甚至可能到術后3個月[64];由于地域、種族及生活方式等因素,EuroSCORE、STS score等并不能很好地預測中國患者心臟手術風險;SinoSCORE評分系統數據庫主要來源于我國北方,雖然有華西、廣東兩地的零星報道該心臟手術風險預測方法可以很好地預測當地患者的心臟手術風險,但能否預測中國其他地方心臟手術患者的手術風險仍待進一步研究。
隨著心臟外科手術開展的逐漸成熟,在平時的臨床工作中,從醫生和患者兩方面角度出發,通過心臟手術風險預測方法準確地預測個體死亡的需求已變得越來越迫切[65]。國外的心臟手術風險預測方法仍在迅速發展,多項關于風險評估的新危險因素被提出。Fellahi等[66]認為手術前B型利鈉肽(BNP)可以獨立地預測心臟手術風險,并且對心臟手術患者不良后果的預測要比EuroSCORE準確。虛弱(Frailty)作為預測生理年齡的一個間接指標,在老年心臟手術患者中逐漸受到重視[67],虛弱被認為可以作為預測心臟外科手術風險的獨立因素。
總之,過時的心臟手術風險預測方法應不斷地調整,以之適應臨床的需要。考慮到單一心臟手術風險預測方法的局限性,對同一心臟手術患者使用多種心臟手術風險預測方法進行手術風險預測,再加上新發現的獨立危險因素測定(如B型利鈉肽、虛弱測試)綜合考慮,以期提高心臟手術風險預測的識別度和校準度。
外科手術是一種有創治療疾病的方式,但有時創傷會引起身體機能的惡化,甚至導致重要器官功能衰竭,帶來與手術初衷相反的結果。術前對患者進行手術風險的全面評估是降低圍術期并發癥發生率和死亡率的有效措施[1]。手術風險評估是指在臨床實踐中,廣泛收集各種可能影響病情和預后的因子,再通過統計學方法篩選出與手術風險和預后密切相關的因素,通過建立數學模型對患者手術進行風險評估[2]。
手術風險預測是術前手術風險評估的一種量化形式,是依據患者術前的生理狀態、基礎疾病、麻醉和手術對機體的影響,數字量化評價風險水平的方法[1]。手術風險預測方法多達數十種,經常使用的有:生理改變-手術干擾程度對病死率影響的評估(A Physio-logical and Operative Severity Score for the enumeration of Mortality and Morbidity)、生理功能-手術應激-疾病綜合風險預測法[Estimation of Physiologic Ability and Surgical Stress(EPASS),with Preoperative Risk Score(PRS),Surgical Stress Score(SSS)and Comprehensive Risk Score(CRS)]、術后30 d病死率預測法(Predicting 30-Day Surgical Mortality)、老年患者手術死亡率預測法(Predicting Operative Mortality in Geriatric Patients)、多種疾病患者擇期手術死亡風險預測法(Mortality Risk in Patients with Coexisting Conditions Undergoing Elective Surgery)等[3-5]。
心臟手術因手術器官的特殊性、手術環節的復雜性以及手術技術的高要求性,圍手術期死亡率較高。因此,心臟外科醫師很早就重視手術風險預測的問題,進行了一些心臟手術風險預測的探索[6]。自1989年以來,國際醫學團體已制定出多種心臟手術風險預測方法,如最早的心血管手術風險預測法——Parsonnet心臟手術風險預測法(Parsonnet′s score)[7]、歐洲心臟手術風險預測法(the European System for Cardiac Operative Risk Evaluation,EuroSCORE)[8-9]、加拿大安大略省心臟手術風險預測法(Ontario Province Risk,OPR)[10]、美國胸外科醫師協會心臟手術風險預測法(the Society of Thoracic Surgeons score,STS score)[11]、克利夫蘭心臟手術風險預測法(Cleveland model)[12]、“質量測量和管理舉措”心臟手術風險預測法(Quality Measurement and Management Initiative,QMMI)[13]、美國心臟病學院/美國心臟協會心臟手術風險預測法(ACC/AHA Guidelines for Coronary Artery Bypass Graft Surgery)[14]以及中國冠狀動脈旁路移植術風險預測法(Sino-System for Coronary Operative Risk Evaluation,SinoSCORE)[15-16]。
我們以心臟外科手術風險評估為出發點,從心臟手術風險預測方法的建立和目前國內外主要心臟手術風險預測方法的研究和應用做一綜述。
1 心臟手術風險預測方法的建立
1.1 研究樣本的選擇
作為預測心臟手術風險的樣本,必須是行心臟直視手術的患者。單個樣本的數據是由患者的一般情況、心臟疾病情況、麻醉過程、手術過程和術后恢復過程等臨床資料組成,這些項目以統計數據形式記錄。大規模地收集完整的數據,才能進行進一步的分析。從Parsonnet′s score到SinoSCORE樣本選擇的經驗回顧,多中心、大樣本量(上萬例樣本)是良好的心臟手術風險預測方法的數據基礎。由于國內外手術風險預測均針對成人患者,因此,研究樣本還須排除非成人患者。為了研究的可信性,還須排除臨床資料收集不完全的患者。
1.2 研究終點的選擇
死亡率是應用最廣泛的結果指標之一[17]。Roques [8]在EuroSCORE項目中,定義死亡率為術后30 d內或術后醫院內發生的死亡。而國內SinoSCORE的研究終點選擇為手術死亡率,即所有發生在術后30 d內的死亡[17]。與死亡率相比較,發病率包含了眾多的異構參數,因此死亡率作為結果的預測價值較發病率高得多[18]。還有一些研究的終點使用術后惡性事件,如術后發生急性左心衰竭或右心衰竭、嚴重影響血流動力學穩定的心律失常、永久性神經系統損害、嚴重切口感染、呼吸功能不全和嚴重肺部感染等。但無法明確界定這些終點事件的概念,且觀察周期較長,不如死亡率直接、方便。
1.3 確定危險因素
危險因素與患者的病情和預后關系密切,影響手術死亡的各種潛在危險因素一般來自結合以往的文獻報道和專家學者的臨床專業知識和經驗[19]。常見的危險因素包括:年齡、性別、一般狀況、疾病的嚴重程度等。例如EuroSCORE和SinoSCORE的危險因素均包括患者的相關因素、心臟相關因素、手術相關因素三大類。心血管疾病存在與之發病相關的危險因素,如高血壓病、吸煙、肥胖、糖尿病以及平時進食蔬菜水果少、缺乏體力活動等。這些危險因素被研究者證實是心血管疾病的主要誘發因素,90%以上的心肌梗死都被歸因于此[20-23]。有研究表明,睡眠過少(<6 h/d)或過多(>9 h/d)是高血壓和代謝綜合征的獨立危險因素[24-26]。這些危險因素從不會獨立存在,多種因素之間常常互相聯系,相互影響,最終導致心血管疾病的發生[27-28]。
由于心臟手術風險預測方法的建立需要大樣本,并且入選的危險因素較多,需要注意產生各種偏倚,如入選偏倚、排除偏倚、臨床資料遺漏偏倚及混雜偏倚等。如何控制偏倚是風險預測可信度高的基礎。入選的危險因素首先要盡可能的客觀,診斷標準最好采用國際診斷標準,其次為國內統一標準,或全國性學術組織制定的診斷標準,以及高校教科書記載的有關診斷標準,或地方性學術組織制定的診斷標準;其次要盡可能地簡潔,但又不失代表性和典型性,便于錄入操作和分析[2]。
1.4 研究方法和評價
使用計算機軟件對收集的海量臨床資料進行統計學分析。完善的臨床資料由絕對數、標準位數或百分位數等數據的形式表現出來,數據的統計用辦公軟件來進行歸總、分類,最后用統計學軟件對數據進行分析。一般用χ2檢驗、Fisher′s精確檢驗來對數據進行統計分析。受試者工作特征曲線(receiver operating characteristic curve,ROC)被用來描繪不同的心臟手術風險預測方法,并通過計算曲線下面積(area under the receiver operating characteristics curve,AUC)來評價預測方法的識別度; 擬合優度檢驗(Hosmer-Lemeshow,H-L)被用來評價不同的心臟手術風險預測方法的校準度。
根據不同的心臟手術風險預測方法應用于同一個心臟手術患者群體可以計算出不同的預測死亡率,而對于一個明確的心臟手術患者群體實際死亡率是惟一的,如何評價預測死亡率與實際死亡率之間的關系,這就需要專業的醫學統計學方法。理想的心臟手術風險預測方法應具有良好的識別度和校準度。良好的識別度是指心臟手術風險預測方法有良好的區分死亡和生存患者的能力。識別度常用ROC來檢測,在ROC上,最靠近坐標圖左上方的點為敏感性和特異性均較高的臨界值。AUC越接近1,心臟手術風險預測方法的識別度越好;AUC越接近0.5,心臟手術風險預測方法的識別度越差。AUC大于0.7提示該心臟手術風險預測方法具有良好的識別度[29-31]。良好的校準度是指心臟手術風險預測方法的預測死亡率與實際死亡率相接近。校準度常用擬合優度檢驗(H-L)驗證模型。P>0.05顯示心臟手術風險預測方法對死亡率有較好的校準度[32]。
2 國內外主要心臟手術風險預測方法及其應用
2.1 歐洲心臟手術風險預測方法
EuroSCORE是根據1995年9~12月歐洲8個國家的128個心臟中心19 030例成人心血管手術病例資料而建立的心臟手術風險預測方法[
死亡率=e(β0+∑βi Xi)/1+e(β0+∑βi Xi)
e指自然對數,β0指回歸方程常數,β0=-4.789 594;βi指每個危險因素的系數;Xi在風險因素存在的情況下為1,不存在的情況下為0;年齡的Xi為小于或等于59歲,Xi=1,每增加1歲,Xi增加1。具體風險因素見表 1。

在歐洲心臟手術風險預測方法有19項之多[
死亡率=e (β0+∑βi Xi)/1+e (β0+∑βi Xi)
e指自然對數;β0指回歸方程常數,β0=-5.324 537;βi指每個危險因素的系數;Xi在風險因素存在的情況下為1,不存在的情況下為0;年齡的Xi為小于或等于60歲,Xi=1,每增加1歲,Xi增加1。具體風險因素見表 2。

與EuroSCORE相比較,EuroSCOREⅡ無Additivescore和Logistic score兩項計算結果,而是只用對數算法獲得預測死亡率一項結果。危險因素與舊版相比較,新增了糖尿病須胰島素治療項,腎功能的評價由舊版的血肌酐值變成了內生肌酐清除率,肺動脈高壓的評價具體到了中度或重度;舊版中的室間隔穿孔危險因素項在新版中已予以刪除。
EuroSCORE一經建立即在歐洲各國的心臟中心廣泛應用,曾獲得較高的評價;但近幾年由于醫療科技的發展,手術技術的成熟,使得原本病情很危重患者的存活變成可能,因此EuroSCORE被越來越多地評價為高估了患者的死亡率。Bhatti等[39]用Logistic EuroSCORE對9 995例心臟手術患者的臨床資料進行了研究,發現預測死亡率為5.7%,而實際死亡率為3.3%(χ2檢驗,P=0.02);Yap等[40]對8 331例單純行冠狀動脈旁路移植術(CABG)患者使用Logistic EuroSCORE進行風險預測,預測死亡率為8.76%,實際死亡率為3.2%(H-L:P<0.05)。EuroSCOREⅡ基于最近幾年患者的數據建立,因此,評分效果較好。Grant等[41]從2010年7月至2011年3月用EuroSCOREⅡ對英國41家醫院23 740例行心臟手術患者的臨床資料進行了研究,發現預測死亡率為3.4%,而實際死亡率為3.1%,AUC:0.808,表明EuroSCOREⅡ具有良好的識別度。
2.2 美國胸外科醫師協會心臟手術風險預測方法
STS score是美國胸外科醫師協會建立的用來預測心臟外科手術死亡率及并發癥發生率的心臟手術風險預測方法,與EuroSCORE一樣,是一個在線評分系統(http://riskcalc.sts.org/STSWebRiskCalc273/de.aspx),用來預測心臟外科手術患者的手術死亡率。美國胸外科醫師協會(STS)數據庫[
與EuroSCORE相比較,STS score似乎低估了圍手術期的風險[48]。Basraon等[49]通過1997~2008年間537例嚴重主動脈瓣狹窄行主動脈瓣置換術的數據比較了EuroSCORE與STS score,實際死亡率為5.9%,EuroSCORE與STS score的預測死亡率分別為15.6%和3.6%,得出結論:EuroSCORE校準度差(H-L:P<0.008),而STS score校準度較好;兩種評分的識別度均較好,但STS score更好(AUC:0.73)。Wang等[50]對2006~2011年間中國上海長海醫院3 479例心臟瓣膜手術的數據進行了EuroSCORE II、STS score評分,得出結論:STS score校準度好(H-L:P=0.126),EuroSCOREⅡ低估了風險(H-L:P<0.000 1);STS score識別度最好(AUC:0.706)
2.3 加拿大安大略省心臟手術風險預測方法
OPR[10]是建立在加拿大安大略省13 098例行心臟手術患者數據庫基礎上的心臟手術風險預測方法。1991年加拿大安大略省建立了全省范圍內等待心臟手術患者詳細資料的數據庫[51]。臨床資料來源于安大略省9個醫療機構中心,并由其中的1個中心于1991年4月開始收集并錄入。13 098例臨床資料被分為兩部分,6 213例資料(1991年4月1日至1992年3月31日之間手術)用來制定危險因素,建立心臟手術風險預測方法,6 885例資料(1992年4月1日至1993年3月31日之間手術)被用來評價這個心臟手術風險預測方法。
心臟手術風險預測方法的評分標準共6項:年齡、性別、左心室射血分數、手術緊急程度、既往CABG史以及手術類型。上述各項標準根據不同患者有相應分值對應,總分被設定為0~16分,分為3組,0~3分為低風險組,4~7分為中等風險組,≥8分為高風險組。預測結果包括術后院內死亡率、術后長期ICU停留率、術后長期住院率。
OPR簡單、高效,便于使用,但由于其數據來源僅局限于安大略省,因此適用性不廣泛。Antunes等[52]評價了4 567例行CABG患者的OPR預測結果,認為其高估了患者的術后死亡率(預測死亡率1.66%,實際死亡率0.96%,H-L:P<0.005)。
2.4 Parsonnet心臟手術風險預測方法
Parsonnet′s score由Parsonnet等[
2.5 克利夫蘭心臟手術風險預測方法
Cleveland model是1992年由克利夫蘭心臟中心建立的[12]。該心臟手術風險預測方法用來比較行CABG患者發病率和死亡率風險與疾病嚴重程度的關系。通過對該心臟中心5 051例患者的資料進行回顧性分析,來確定風險因素與圍手術期發病率及死亡率的關系。參與該項目的病例來自于1986年7月1日至1990年6月30日在該中心行CABG的患者。該心臟手術風險預測方法研究發現:與CABG死亡率高度相關的危險因素為:急診手術、圍手術期血肌酐高于168 μmol/L、嚴重左心室功能障礙、術前紅細胞壓積0.34、高齡、慢性肺部疾病、曾行血管外科手術、二次心臟手術、二尖瓣功能不全;與發病率高度相關的危險因素為糖尿病、體重低于65 kg、主動脈瓣狹窄、腦血管疾病。這些危險因素被劃分為0~6分,通過邏輯回歸方程建立加法模型來評分。該心臟手術風險預測方法可以用來預測CABG圍手術期發病率和死亡率。同Parsonnet′s score一樣,由于該心臟手術風險預測方法建立較早,且建模病例多是體外循環下CABG,目前對于死亡率的預測已較差。
2.6 “質量測量和管理舉措”心臟手術風險預測方法
QMMI心臟手術風險預測方法[13]來源于1993年8月至1995年10月在12個醫學中心行CABG的9 498例成人患者。該心臟手術風險預測方法用來預測行CABG患者的不良事件,不良事件被定義為死亡、腎功能衰竭、再次心肌梗死、心搏驟停、腦血管意外或昏迷。16個危險因素與不良后果獨立相關聯,每一項危險評分根據患者的情況不同分為2~12分,根據總分將患者分為6個危險等級。該心臟手術風險預測方法在識別度和校準度方面表現良好,因此可以用來準確預測CABG患者術后不良事件的發生率。Vanagas等[56]用QMMI、EuroSCORE來預測1 021例行CABG患者的死亡率,并進行了比較,結果表明QMMI有良好的敏感度(33.3%)、特異度(97.2%)、準確度(84.5%);EuroSCORE敏感度、特異度、準確度分別為20.7%、96.7%、72.2%。
2.7 中國冠狀動脈旁路移植術風險預測方法
由于國際上的心臟手術風險預測方法預測中國患者時常常會高估其手術死亡率[

SinoSCORE制定者們運用科學嚴謹的統計學方法對其預測功能進行評價,并與被歐洲視為“金標準”的EuroSCORE風險評分系統進行了比較。結果證明對于中國患者,SinoSCORE優于EuroSCORE,能更加準確地評估中國CABG患者院內死亡風險(H-L:P=0.7,AUC=0.8)[60]。同時,制定者們也用SinoSCORE和EuroSCORE對2007~2008年來自中國43個醫學中心的15 367例心瓣膜手術的病例進行了研究,得出同樣的結論:SinoSCORE優于EuroSCORE,能夠更加準確地評估中國心瓣膜手術患者的院內死亡風險(實際死亡率2.34%,additive、logistic EuroSCORE、SinoSCORE分別為3.71%、3.19%、3.66%,AUC分別為0.699、0.696、0.747,H-L分別為P=0.051、P<0.05、P=0.25)[61]。SinoSCORE在中國最大樣本數據庫——中國成人心臟外科數據庫中得到了很好的驗證。但中國成人心臟外科數據庫的數據來源于全中國多個醫療中心,且以北方患者的數據居多。由于我國醫療發展水平及經濟發展水平的不均衡性,手術數量和質量存在一定的差異,SinoSCORE用于預測單中心患者手術風險時,仍需進行驗證。
錢永軍等[62]用SinoSCORE預測華西醫院2 088例成人心臟手術后院內死亡風險(預測死亡率2.35%,實際死亡率2.25%;χ2=3.164,P=0.582;AUC:0.751),校準度與識別度均較好。廣東心血管病研究所郭惠明等[63]用SinoSCORE評價接受CABG和心瓣膜手術的2 462例成人心臟病患者,認為SinoSCORE表現出很好的校準度和識別度,可以用來預測廣東患者心臟外科手術后院內死亡(H-L:P=0.34,AUC:0.84)。
3 問題與展望
國內外的主要心臟手術風險預測方法在識別度和校準度方面仍存在一些問題,例如EuroSCORE、Parsonnet′s score等心臟手術風險預測方法的建立是基于20多年前的數據庫。這20多年間,心臟外科手術的技術水平及圍手術期處理能力都有了穩步提升,因此,對于患者手術風險預測將有所偏差;且研究終點通常為術后30 d內的死亡,既往文獻已經提出CABG術后的死亡事件可能發生較晚,甚至可能到術后3個月[64];由于地域、種族及生活方式等因素,EuroSCORE、STS score等并不能很好地預測中國患者心臟手術風險;SinoSCORE評分系統數據庫主要來源于我國北方,雖然有華西、廣東兩地的零星報道該心臟手術風險預測方法可以很好地預測當地患者的心臟手術風險,但能否預測中國其他地方心臟手術患者的手術風險仍待進一步研究。
隨著心臟外科手術開展的逐漸成熟,在平時的臨床工作中,從醫生和患者兩方面角度出發,通過心臟手術風險預測方法準確地預測個體死亡的需求已變得越來越迫切[65]。國外的心臟手術風險預測方法仍在迅速發展,多項關于風險評估的新危險因素被提出。Fellahi等[66]認為手術前B型利鈉肽(BNP)可以獨立地預測心臟手術風險,并且對心臟手術患者不良后果的預測要比EuroSCORE準確。虛弱(Frailty)作為預測生理年齡的一個間接指標,在老年心臟手術患者中逐漸受到重視[67],虛弱被認為可以作為預測心臟外科手術風險的獨立因素。
總之,過時的心臟手術風險預測方法應不斷地調整,以之適應臨床的需要。考慮到單一心臟手術風險預測方法的局限性,對同一心臟手術患者使用多種心臟手術風險預測方法進行手術風險預測,再加上新發現的獨立危險因素測定(如B型利鈉肽、虛弱測試)綜合考慮,以期提高心臟手術風險預測的識別度和校準度。