引用本文: 王昊陸, 王輝, 陳濤, 陳煒, 宋艷艷, 王堅. POSSUM和P-POSSUM評分系統預測肝膽手術風險價值的Meta分析. 中國循證醫學雜志, 2014, 14(4): 443-448. doi: 10.7507/1672-2531.20140077 復制
肝膽手術包括肝切除、膽管切除、膽腸吻合和肝移植等。此類手術的術后并發癥發生率和死亡率較高,治療難度較大;術后約6%的患者需要進入重癥監護室治療,死亡率約3.2% [1]。因此,早期準確地預測肝膽手術患者個體的術后并發癥發生率和死亡率,可盡早確定個體化治療方案,從而改善患者預后。
目前已有許多手術風險預測評分系統,其中計算死亡率和并發癥發生率的生理學和手術嚴重性評分(Physiologic and Operative Severity Score for the enUmeration of Mortality and Morbidity,POSSUM)于1991年發表,最常用于普外科手術[2]。這一評分使用了12項術前生理變量和6項手術變量來估算術后30天的死亡率和并發癥發生率。但POSSUM評分往往會高估低風險患者的術后死亡率,因此Whitelay等[3]改進了POSSUM評分,發明了P-POSSUM評分。至今已有POSSUM和P-POSSUM評分系統用于預測胃食管、結直腸、胰腺手術風險價值的相關Meta分析[4-6],且國內外已有多個研究在肝膽手術中使用POSSUM和P-POSSUM評分系統預測手術風險[7-20],但尚無統一結論。現已存在一套成熟的關于手術風險預測評分系統的研究方法,且國內肝臟手術患者和臨床研究明顯多于且優于國外。因此,我們對這些具有相同研究目的且相互獨立的研究結果進行合并分析,以此來綜合定量評價POSSUM和P-POSSUM評分系統預測肝膽手術風險的價值。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
前瞻性或回顧性、結局研究或研究預后的臨床決策規劃[7]。文種限中、英文。
1.1.2 研究對象
關于POSSUM和P-POSSUM評分系統;應用于肝膽手術(開放或腔鏡下肝切、膽腸吻合、膽管切除、膽管切開取石、肝臟移植)。
1.1.3 結局指標
并發癥發生率或死亡率(或可通過計算獲得);實發數與預測數(或可通過計算獲得)。
1.1.4 排除標準
①病例報道;②綜述或非原始數據的研究;③姑息性手術(如胃腸吻合);④小型手術(如因膽囊結石而行的膽囊切除術);⑤肝射頻消融術;⑥未提供死亡和并發癥的確切預測數和實發數(且無法通過提供的資料計算獲得)。
1.2 檢索策略
計算機檢索PubMed、The Cochrane Library(2013年第10期)、Science Citation Index、CNKI、WanFang Data和CBM數據庫,查找關于在肝膽手術中使用POSSUM和P-POSSUM評分系統的研究。檢索時限均為從1991年(首篇關于POSSUM文獻發表)至2013年10月。同時追溯納入文獻的參考文獻。中文檢索詞包括肝、膽、POSSUM,英文檢索詞包括hepatobiliary、hepatic、liver、hepatectomy、biliary、bile duct、gallbladder、cholangiocarcinoma、POSSUM。以CNKI和PubMed為例,其具體檢索策略見框1。
框?1?CNKI和PubMed檢索策略
#?1肝OR膽 #?2 POSSUM #?3 #1 AND #2 ? #1?hepatobiliary OR hepatic OR liver OR hepatectomy OR biliary OR bile duct OR gallbladder OR cholangiocarcinoma #2?POSSUM #3?#1 AND #2
1.3 文獻篩選、資料提取與質量評價
由2位評價員根據納入與排除標準獨立篩選文獻、提取資料并交叉核對。如遇疑問或分歧則通過與第三位評價員協商解決。提取內容包括:①一般資料:作者姓名、國家、文獻發表日期;②研究特征:樣本量、并發癥發生率和死亡率的定義、手術類型、統計方法;③研究結果:實際并發癥發生率(死亡率)、預測并發癥發生率(死亡率)、P值和文獻結論。然后根據牛津循證醫學中心評價標準對納入研究的方法學質量進行分級[7]。根據研究類型(系統評價、隨機對照試驗、隊列研究、臨床決策規則、病例系列報告、分樣驗證、結局研究以及專家觀點)、特征(同質性、隨訪率、研究人群和對照組)的不同,分為1a、1b、1c、2a、2b、2c、4、5共8個等級。
1.4 統計分析
所有統計采用Comprehensive Meta Analysis Version 2軟件(Biostat,Englewood,New Jersey)計算。POSSUM和P-POSSUM評分系統的準確率用符合率(實發數與預測數之比)表示。所有研究不論并發癥發生率或死亡率的定義是否完全一致,根據其樣本量進行加權,計算95%CI。加權符合率=1代表 100%準確;符合率 < 1表示評分系統高估了死亡率或并發癥發生率;符合率>1則表示評分系統低估了死亡率或并發癥發生率。
異質性采用I2進行判斷,I2>25%為存在異質性。若各研究結果間無顯著異質性,采用固定效應模型進行Meta分析,若各研究結果間存在顯著異質性,根據可能導致臨床異質性、方法學異質性的因素進行亞組分析(例如按照死亡率定義、研究性質分為不同亞組);若各研究結果間存在統計學異質性而無臨床異質性、方法學異質性,則采用隨機效應模型進行Meta分析。必要時采用敏感性分析。
2 結果
2.1 文獻檢索結果
初檢出相關文獻104篇,經逐層篩選后,最終納入10個研究[11-20]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
2.2.1 并發癥發生率
5個研究[12-15, 20](n=683)采用了POSSUM評分系統預測肝膽手術患者的術后并發癥發生率,均為回顧性研究。其中證據水平1b級共4個,2c級1個(表 1)。2個研究[12, 13]采用了原始POSSUM對于并發癥的定義來進行研究。不同研究的疾病和手術類型有所不同:1個研究[12]涉及肝膽手術;1個研究[14]涉及肝臟移植;2個研究[15, 20]涉及肝切;1個研究[13]涉及膽道系統腫瘤患者的手術,包括擴大膽囊切除到右三葉切除大小不等的手術。

2.2.2 死亡率
7個研究[13-17, 18, 20](n=1 291)采用了POSSUM評分系統預測肝膽手術患者的術后死亡率。其證據水平均為1b級,其中1個為前瞻性研究,6個為回顧性研究。6個研究[11, 16-20](n=1 793)采用了P-POSSUM評分系統預測肝膽手術患者的術后死亡率。其證據水平均為1b級,其中1個為前瞻性研究,5個為回顧性研究(表 2、3)。4個關于POSSUM的研究[14, 16-18]和4個關于P-POSSUM的研究[16-19]采用了院內死亡率進行分析,其余研究則采用了30天或60天死亡率[11, 13, 15, 20]。納入研究的手術方式主要為開腹肝切,1個僅涉及肝臟移植[14]。2個研究[13, 18]涉及膽道系統腫瘤患者的手術,包括擴大膽囊切除到右三葉切除大小不等的手術。


2.3 符合率的Meta分析結果
2.3.1 并發癥發生率
5個研究[12-15, 20](n=683)采用POSSUM預測了術后并發癥發生率,其加權O/ E=0.71,95%CI(0.60,0.81)(圖 2)。POSSUM預測并發癥發生率為26.7%~63.5%,而患者實際并發癥發生率為26.3%~40.9%。

2.3.2 死亡率
7個研究[13-17, 18, 20](n=1 291)采用POSSUM預測了術后死亡率,其加權O/E=0.42,95%CI(0.27,0.57)](圖 3);6個研究[11, 16-20](n=1 793)采用P-POSSUM預測了術后死亡率,其加權O/E=0.74,95%CI(0.53,0.95)(圖 4)。POSSUM預測死亡率為6.2%~27.8%,而患者實際死亡率為1.7%~11.2%。P-POSSUM預測死亡率為2.3%~9.4%,而患者實際死亡率為1.7%~6.6%。


根據納入研究對死亡率的不同定義行亞組分析,POSSUM評分系統中采用院內死亡率亞組的加權符合率低于采用術后30天死亡率亞組(加權符合率分別為0.31、0.52);P-POSSUM評分系統中采用院內死亡率亞組的加權符合率高于采用術后30天或60天死亡率亞組(加權符合率分別為0.75、0.61)。
根據納入研究的不同設計進行亞組分析,除1個前瞻性研究外,所有回顧性研究中POSSUM、P-POSSUM評分系統預測肝膽手術術后死亡的加權符合率分別為0.33、0.52。其中回顧性P-POSSUM評分系統研究的同質性較好,采用固定效應模型進行Meta分析,其余均采用隨機效應模型進行Meta分析。
3 討論
本研究中,我們系統評價了POSSUM和P-POSSUM評分系統在預測肝膽手術風險的價值。POSSUM評分系統對于肝膽手術風險的預測能力有限,其高估了術后并發癥發生率(加權符合率為0.71)和死亡率(加權符合率為0.42)。造成這一結果的主要原因為POSSUM評分系統于1991年發表,而僅在2004年以后應用于肝膽手術。13年間手術技術和圍手術期的管理均得到了較大提高,因此90年代初期的手術風險預測評分系統不再準確。其次,POSSUM評分系統不是一個針對特定疾病或特定手術方式的風險預測評分系統。已有報道在某些高難度、高風險的普外科手術中,POSSUM評分系統往往會高估術后并發癥發生率[13]。因此已有針對特定手術類型的改良POSSUM評分系統發表:例如針對血管外科手術的V-POSSUM、針對胃食管手術的O-POSSUM和針對結直腸手術的CR-POSSUM [4, 5]。另一個POSSUM評分系統高估肝膽手術并發癥發生率和死亡率的可能原因是,肝膽手術的危險因素與其他普外科手術不同。例如術前血清膽紅素是肝膽腫瘤的一個重要預后因素,卻不在POSSUM的12項術前生理變量中[13]。因此如果需要準確預測肝膽手術風險,應當改良現有的POSSUM評分系統。本研究發現,P-POSSUM評分系統預測肝膽手術術后死亡率的準確率(加權符合率為0.74)明顯高于原始的POSSUM評分系統(加權符合率為0.42),但其準確率仍低于針對特定手術類型的改良POSSUM評分系統(例如V-POSSUM、O-POSSUM和CR-POSSUM)。因此,研究并得出針對肝膽手術的改良POSSUM評分系統是今后的研究方向。
由于POSSUM和P-POSSUM評分系統對于肝膽手術風險的預測能力有限,目前的臨床應用中,POSSUM和P-POSSUM評分系統的預測結果僅能作為臨床治療的參考指標,而無法決定個體患者的治療方案。例如生理變量得分高的患者可以采用腸內營養、抗生素或膽道引流等干預措施來改善術前的一般情況。尤其是對于術前梗阻性黃疸、合并心肺疾病或營養不良的患者,術前干預對于確保手術安全性尤為重要[21]。
本系統評價存在一定的局限性:① Meta分析納入研究間存在異質性,導致異質性的原因可能為不同類型研究對術后并發癥、死亡率采用的定義不同,如部分納入文獻未采用原始POSSUM對并發癥的定義進行研究[2],可能對并發癥發生率、死亡率的加權統計產生偏差。②本系統評價的目的是明確POSSUM和P-POSSUM評分系統預測肝膽手術風險價值,而半數以上納入文獻僅研究了肝切這一特定類型的肝膽手術,可能會對最終的加權符合率產生一定影響。
總之,本系統評價結果顯示:POSSUM高估了肝膽手術的并發癥發生率,P-POSSUM預測肝膽手術術后死亡率的準確率明顯高于POSSUM,針對肝膽手術的改良POSSUM評分系統是今后的研究方向。
肝膽手術包括肝切除、膽管切除、膽腸吻合和肝移植等。此類手術的術后并發癥發生率和死亡率較高,治療難度較大;術后約6%的患者需要進入重癥監護室治療,死亡率約3.2% [1]。因此,早期準確地預測肝膽手術患者個體的術后并發癥發生率和死亡率,可盡早確定個體化治療方案,從而改善患者預后。
目前已有許多手術風險預測評分系統,其中計算死亡率和并發癥發生率的生理學和手術嚴重性評分(Physiologic and Operative Severity Score for the enUmeration of Mortality and Morbidity,POSSUM)于1991年發表,最常用于普外科手術[2]。這一評分使用了12項術前生理變量和6項手術變量來估算術后30天的死亡率和并發癥發生率。但POSSUM評分往往會高估低風險患者的術后死亡率,因此Whitelay等[3]改進了POSSUM評分,發明了P-POSSUM評分。至今已有POSSUM和P-POSSUM評分系統用于預測胃食管、結直腸、胰腺手術風險價值的相關Meta分析[4-6],且國內外已有多個研究在肝膽手術中使用POSSUM和P-POSSUM評分系統預測手術風險[7-20],但尚無統一結論。現已存在一套成熟的關于手術風險預測評分系統的研究方法,且國內肝臟手術患者和臨床研究明顯多于且優于國外。因此,我們對這些具有相同研究目的且相互獨立的研究結果進行合并分析,以此來綜合定量評價POSSUM和P-POSSUM評分系統預測肝膽手術風險的價值。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
前瞻性或回顧性、結局研究或研究預后的臨床決策規劃[7]。文種限中、英文。
1.1.2 研究對象
關于POSSUM和P-POSSUM評分系統;應用于肝膽手術(開放或腔鏡下肝切、膽腸吻合、膽管切除、膽管切開取石、肝臟移植)。
1.1.3 結局指標
并發癥發生率或死亡率(或可通過計算獲得);實發數與預測數(或可通過計算獲得)。
1.1.4 排除標準
①病例報道;②綜述或非原始數據的研究;③姑息性手術(如胃腸吻合);④小型手術(如因膽囊結石而行的膽囊切除術);⑤肝射頻消融術;⑥未提供死亡和并發癥的確切預測數和實發數(且無法通過提供的資料計算獲得)。
1.2 檢索策略
計算機檢索PubMed、The Cochrane Library(2013年第10期)、Science Citation Index、CNKI、WanFang Data和CBM數據庫,查找關于在肝膽手術中使用POSSUM和P-POSSUM評分系統的研究。檢索時限均為從1991年(首篇關于POSSUM文獻發表)至2013年10月。同時追溯納入文獻的參考文獻。中文檢索詞包括肝、膽、POSSUM,英文檢索詞包括hepatobiliary、hepatic、liver、hepatectomy、biliary、bile duct、gallbladder、cholangiocarcinoma、POSSUM。以CNKI和PubMed為例,其具體檢索策略見框1。
框?1?CNKI和PubMed檢索策略
#?1肝OR膽 #?2 POSSUM #?3 #1 AND #2 ? #1?hepatobiliary OR hepatic OR liver OR hepatectomy OR biliary OR bile duct OR gallbladder OR cholangiocarcinoma #2?POSSUM #3?#1 AND #2
1.3 文獻篩選、資料提取與質量評價
由2位評價員根據納入與排除標準獨立篩選文獻、提取資料并交叉核對。如遇疑問或分歧則通過與第三位評價員協商解決。提取內容包括:①一般資料:作者姓名、國家、文獻發表日期;②研究特征:樣本量、并發癥發生率和死亡率的定義、手術類型、統計方法;③研究結果:實際并發癥發生率(死亡率)、預測并發癥發生率(死亡率)、P值和文獻結論。然后根據牛津循證醫學中心評價標準對納入研究的方法學質量進行分級[7]。根據研究類型(系統評價、隨機對照試驗、隊列研究、臨床決策規則、病例系列報告、分樣驗證、結局研究以及專家觀點)、特征(同質性、隨訪率、研究人群和對照組)的不同,分為1a、1b、1c、2a、2b、2c、4、5共8個等級。
1.4 統計分析
所有統計采用Comprehensive Meta Analysis Version 2軟件(Biostat,Englewood,New Jersey)計算。POSSUM和P-POSSUM評分系統的準確率用符合率(實發數與預測數之比)表示。所有研究不論并發癥發生率或死亡率的定義是否完全一致,根據其樣本量進行加權,計算95%CI。加權符合率=1代表 100%準確;符合率 < 1表示評分系統高估了死亡率或并發癥發生率;符合率>1則表示評分系統低估了死亡率或并發癥發生率。
異質性采用I2進行判斷,I2>25%為存在異質性。若各研究結果間無顯著異質性,采用固定效應模型進行Meta分析,若各研究結果間存在顯著異質性,根據可能導致臨床異質性、方法學異質性的因素進行亞組分析(例如按照死亡率定義、研究性質分為不同亞組);若各研究結果間存在統計學異質性而無臨床異質性、方法學異質性,則采用隨機效應模型進行Meta分析。必要時采用敏感性分析。
2 結果
2.1 文獻檢索結果
初檢出相關文獻104篇,經逐層篩選后,最終納入10個研究[11-20]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
2.2.1 并發癥發生率
5個研究[12-15, 20](n=683)采用了POSSUM評分系統預測肝膽手術患者的術后并發癥發生率,均為回顧性研究。其中證據水平1b級共4個,2c級1個(表 1)。2個研究[12, 13]采用了原始POSSUM對于并發癥的定義來進行研究。不同研究的疾病和手術類型有所不同:1個研究[12]涉及肝膽手術;1個研究[14]涉及肝臟移植;2個研究[15, 20]涉及肝切;1個研究[13]涉及膽道系統腫瘤患者的手術,包括擴大膽囊切除到右三葉切除大小不等的手術。

2.2.2 死亡率
7個研究[13-17, 18, 20](n=1 291)采用了POSSUM評分系統預測肝膽手術患者的術后死亡率。其證據水平均為1b級,其中1個為前瞻性研究,6個為回顧性研究。6個研究[11, 16-20](n=1 793)采用了P-POSSUM評分系統預測肝膽手術患者的術后死亡率。其證據水平均為1b級,其中1個為前瞻性研究,5個為回顧性研究(表 2、3)。4個關于POSSUM的研究[14, 16-18]和4個關于P-POSSUM的研究[16-19]采用了院內死亡率進行分析,其余研究則采用了30天或60天死亡率[11, 13, 15, 20]。納入研究的手術方式主要為開腹肝切,1個僅涉及肝臟移植[14]。2個研究[13, 18]涉及膽道系統腫瘤患者的手術,包括擴大膽囊切除到右三葉切除大小不等的手術。


2.3 符合率的Meta分析結果
2.3.1 并發癥發生率
5個研究[12-15, 20](n=683)采用POSSUM預測了術后并發癥發生率,其加權O/ E=0.71,95%CI(0.60,0.81)(圖 2)。POSSUM預測并發癥發生率為26.7%~63.5%,而患者實際并發癥發生率為26.3%~40.9%。

2.3.2 死亡率
7個研究[13-17, 18, 20](n=1 291)采用POSSUM預測了術后死亡率,其加權O/E=0.42,95%CI(0.27,0.57)](圖 3);6個研究[11, 16-20](n=1 793)采用P-POSSUM預測了術后死亡率,其加權O/E=0.74,95%CI(0.53,0.95)(圖 4)。POSSUM預測死亡率為6.2%~27.8%,而患者實際死亡率為1.7%~11.2%。P-POSSUM預測死亡率為2.3%~9.4%,而患者實際死亡率為1.7%~6.6%。


根據納入研究對死亡率的不同定義行亞組分析,POSSUM評分系統中采用院內死亡率亞組的加權符合率低于采用術后30天死亡率亞組(加權符合率分別為0.31、0.52);P-POSSUM評分系統中采用院內死亡率亞組的加權符合率高于采用術后30天或60天死亡率亞組(加權符合率分別為0.75、0.61)。
根據納入研究的不同設計進行亞組分析,除1個前瞻性研究外,所有回顧性研究中POSSUM、P-POSSUM評分系統預測肝膽手術術后死亡的加權符合率分別為0.33、0.52。其中回顧性P-POSSUM評分系統研究的同質性較好,采用固定效應模型進行Meta分析,其余均采用隨機效應模型進行Meta分析。
3 討論
本研究中,我們系統評價了POSSUM和P-POSSUM評分系統在預測肝膽手術風險的價值。POSSUM評分系統對于肝膽手術風險的預測能力有限,其高估了術后并發癥發生率(加權符合率為0.71)和死亡率(加權符合率為0.42)。造成這一結果的主要原因為POSSUM評分系統于1991年發表,而僅在2004年以后應用于肝膽手術。13年間手術技術和圍手術期的管理均得到了較大提高,因此90年代初期的手術風險預測評分系統不再準確。其次,POSSUM評分系統不是一個針對特定疾病或特定手術方式的風險預測評分系統。已有報道在某些高難度、高風險的普外科手術中,POSSUM評分系統往往會高估術后并發癥發生率[13]。因此已有針對特定手術類型的改良POSSUM評分系統發表:例如針對血管外科手術的V-POSSUM、針對胃食管手術的O-POSSUM和針對結直腸手術的CR-POSSUM [4, 5]。另一個POSSUM評分系統高估肝膽手術并發癥發生率和死亡率的可能原因是,肝膽手術的危險因素與其他普外科手術不同。例如術前血清膽紅素是肝膽腫瘤的一個重要預后因素,卻不在POSSUM的12項術前生理變量中[13]。因此如果需要準確預測肝膽手術風險,應當改良現有的POSSUM評分系統。本研究發現,P-POSSUM評分系統預測肝膽手術術后死亡率的準確率(加權符合率為0.74)明顯高于原始的POSSUM評分系統(加權符合率為0.42),但其準確率仍低于針對特定手術類型的改良POSSUM評分系統(例如V-POSSUM、O-POSSUM和CR-POSSUM)。因此,研究并得出針對肝膽手術的改良POSSUM評分系統是今后的研究方向。
由于POSSUM和P-POSSUM評分系統對于肝膽手術風險的預測能力有限,目前的臨床應用中,POSSUM和P-POSSUM評分系統的預測結果僅能作為臨床治療的參考指標,而無法決定個體患者的治療方案。例如生理變量得分高的患者可以采用腸內營養、抗生素或膽道引流等干預措施來改善術前的一般情況。尤其是對于術前梗阻性黃疸、合并心肺疾病或營養不良的患者,術前干預對于確保手術安全性尤為重要[21]。
本系統評價存在一定的局限性:① Meta分析納入研究間存在異質性,導致異質性的原因可能為不同類型研究對術后并發癥、死亡率采用的定義不同,如部分納入文獻未采用原始POSSUM對并發癥的定義進行研究[2],可能對并發癥發生率、死亡率的加權統計產生偏差。②本系統評價的目的是明確POSSUM和P-POSSUM評分系統預測肝膽手術風險價值,而半數以上納入文獻僅研究了肝切這一特定類型的肝膽手術,可能會對最終的加權符合率產生一定影響。
總之,本系統評價結果顯示:POSSUM高估了肝膽手術的并發癥發生率,P-POSSUM預測肝膽手術術后死亡率的準確率明顯高于POSSUM,針對肝膽手術的改良POSSUM評分系統是今后的研究方向。