引用本文: 俞陽, 周奇, 張靜怡, 楊楠, 宋霄楊, 高玲玲, 馮映月, 陳耀龍. 痛風慢性期降尿酸治療的系統評價再評價. 中國循證醫學雜志, 2018, 18(12): 1368-1375. doi: 10.7507/1672-2531.201805027 復制
痛風是最常見的炎性關節病變之一,有研究顯示在過去的幾十年內痛風發病率不斷上升[1],患病率因國家不同在 1.7% 到 3.8% 不等[2-5]。痛風是由嘌呤代謝發生紊亂導致的疾病,臨床表現為高尿酸血癥、關節腫脹及繼發關節畸形、痛風石、痛風性急性關節炎反復發作等,嚴重時可累及腎臟。痛風慢性期降尿酸治療是痛風管理中的重要部分,良好的降尿酸治療可明顯改善預后,常用治療藥物包括別嘌醇、非布司他、苯溴馬隆和丙磺舒等。
針對痛風的慢性期降尿酸治療,當前依然存在許多問題尚未解決。國內外不同的指南對于降尿酸藥物選擇的優先性也存在一定的差異,例如 2016EULAR 指南[6]推薦別嘌醇為降尿酸治療的一線用藥,而 2012ACR 指南[7]則推薦別嘌醇和非布司他為一線用藥。另外,非布司他因心血管不良反應在美國退市的事件也引發了對降尿酸藥物安全性的廣泛關注。
系統評價再評價(overview of systematic reviews)是全面收集同一疾病或同一健康問題治療或病因、診斷、預后等方面的相關系統評價,進行綜合研究的一種方法,其可為證據使用者提供更為集中的高質量證據[8, 9]。截至目前,國內外已公開發表多篇痛風慢性期降尿酸治療的系統評價/Meta 分析文章,但其方法學質量和證據的可靠性尚不清楚,因此有必要對這些研究進行再評價。本研究將系統搜集相關痛風慢性降尿酸治療的系統評價/Meta 分析,客觀評價其方法學偏倚以及結論的可靠程度,以期為痛風的臨床管理提供證據綜合和決策依據,為降尿酸治療領域存在的問題和不確定性提供解決策略。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究設計
公開發表的痛風慢性期降尿酸治療的系統評價或 Meta 分析。
1.1.2 研究對象
診斷為痛風的患者,其性別、年齡、種族、發病時間和來源不限。
1.1.3 干預措施
試驗組和(或)對照組的干預措施至少涉及以下一種降尿酸藥物:別嘌醇、非布司他、苯溴馬隆、丙磺舒。
1.1.4 結局指標
血尿酸達標率、急性痛風發生率、不良反應發生率。
1.1.5 排除標準
① 重復發表的文獻;② 系統評價的計劃書;③ 未對納入的原始研究進行定量分析;④ 會議摘要、評論及傳統綜述;⑤ 非中、英文文獻。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、The Cochrane Library、Epistemonikos、CBM、WangFang Data 和 CNKI 數據庫,搜集公開發表的痛風慢性期降尿酸治療的系統評價/Meta 分析,檢索時限均為建庫至 2017 年 4 月 8 日。檢索采用主題詞和自由詞相結合的方式。英文檢索詞包括:gout、Hyperuricemia、meta-analysis、systematic review 等;中文檢索詞包括:痛風、高尿酸血癥、系統綜述、系統評價、Meta 分析、薈萃分析。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選及資料提取
由 2 名研究者獨立進行兩輪篩選,并根據預先設計好的 Excel 數據提取表進行數據提取,如遇分歧,討論解決或咨詢第三方。提取內容包括:① 基本信息,包括第一作者、發表(或更新)年份、診斷標準、干預/對照措施等;② 系統評價的方法學情況,包括文獻檢索、納入研究、研究樣本及對納入研究的方法學質量評價;③ 統計分析結果,主要是對各個結局指標的定量分析結果。
1.4 納入研究的方法學質量和證據質量評價
采用 AMSTAR 量表[10]對納入的系統評價進行方法學質量評價。采用 GRADE 工具進行證據質量評價[11, 12],包括偏倚風險、不直接性、不一致性、不精確性和發表偏倚五個降級因素及大效應量、劑量效應關系和負偏倚三個升級因素。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 1 152 篇,經逐層篩選,最終納入 11 篇系統評價[13-23]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入系統評價的基本特征
納入的 11 篇系統評價中 2 篇為 Cochrane 系統評價[16, 18]。6 篇為英文文獻[16-20, 22],5 篇中文文獻[13-15, 21, 23]。發表年份為 2009 年~2016 年,6 篇[18-23]為 2014 年及以后發表,占所有系統評價的 55%。11 篇系統評價中,所有系統評價均涉及別嘌醇,10 篇涉及非布司他[13, 14, 16-23],3 篇涉及苯溴馬隆[15, 18, 20],1 篇涉及丙磺舒[20]。幾乎所有系統評價均報告了納入的研究個數及樣本量,且說明了人群的血尿酸基線水平。納入系統評價中 10 篇[13-21, 23](91%)對納入原始研究進行了方法學質量評價,其中 8 篇[13-18, 21, 23]使用 Cochrane risk of bias 偏倚評估工具,2 篇[19, 20]使用其他評價工具。納入系統評價的基本特征見表 1。

2.3 納入系統評價的方法學質量
我們認為 AMSTAR 得分在 9~11 分的系統評價/Meta 分析為高質量,5~8 分的為中等質量,低于 5 分的為低質量[24]。方法學質量評價結果見表 2,其中 4 篇[14, 16, 18, 20]為高質量,7 篇[13, 15, 17, 19, 21-23]為中等質量。

亞組分析顯示,Cochrane 系統評價[16, 18]相對于非 Cochrane 系統評價[13-15, 17, 19-23],其 AMSTAR 總評分更高[MD=4.56,95%CI(3.42,5.70),P<0.000 01],差異有統計學意義。中文系統評價[13-15, 21, 23]相對于英文系統評價[16-20, 22],其 AMSTAR 總評分的差異無統計學意義[MD=?2.33,95%CI(?4.84,0.18),P=0.07]。
針對具體條目,8 篇系統評價[13-15, 17, 19, 21-23](73%)沒有提供前期設計方案;3 篇[15, 20, 22](27%)在納入研究的選擇和資料提取方面不具有可重復性;4 篇[15, 17, 21, 23](36%)在文獻檢索上存在漏洞;5 篇[13, 15, 21-23](45%)沒有在納入排除標準中考慮發表情況(如灰色文獻);7 篇[13-15, 17, 21-23](64%)沒有提供納入和排除的研究文獻清單;1 篇[22](9%)沒有評價和報告納入研究的科學性;7 篇[13, 17, 19-23](64%)沒有評估發表偏倚;6 篇[13, 15, 17, 19, 21, 23](55%)沒有說明利益沖突關系;所有系統評價均描述了納入研究的基本特征;所有系統評價納入研究的科學性都恰當地運用在結論的推導上;所有系統評價都恰當地合成了納入研究的結果。
2.4 主要結局指標和證據質量分級
見表 3。

2.4.1 血尿酸達標情況
10 篇系統評價[13, 14-19, 21-23]關注了降尿酸治療后血尿酸達標情況,其中 9 篇[13, 14, 16-19, 21-23]對比了別嘌醇和非布司他,2 篇[15, 18]對比了別嘌醇和苯溴馬隆。
別嘌醇 vs. 非布司他:所有系統評價均顯示非布司他在血尿酸達標這一指標上優于別嘌醇,5 篇系統評價[13, 14, 21-23]結果顯示非布司他組治療后血尿酸低于 6.0mg/dL 的患者數或比例優于別嘌呤組[RR=2.68,95%CI(2.26,3.17),P<0.000 01;RR=2.55,95%CI(2.32,2.80),P<0.000 01;RR=1.56,95%CI(1.22,2.00),P<0.001;OR=2.64,95%CI(1.74,4.01),P<0.000 01;RR=1.56,95%CI(1.46,1.66),P<0.000 01],系統評價證據質量分級為低、中、低、低、低。3 篇系統評價[16-18]結果顯示非布司他組治療后實現血尿酸低于 6.0mg/dL 的可能性高于別嘌醇組[RR=1.80,95%CI(1.55,2.09),P<0.000 01;RR=1.56,95%CI(1.22,2.00),P<0.000 01;RR=0.55,95%CI(0.48,0.63),P<0.000 01],系統評價證據質量分級均為低。另 1 篇系統評價[19]結果顯示非布司他組治療后未達到目標血尿酸水平的患者數少于別嘌醇組[RR=0.31,95%CI(0.24,0.39),P<0.000 01],系統評價證據質量分級為中等。
別嘌醇 vs. 苯溴馬隆:2 篇系統評價[15, 18]結果顯示兩組治療后血尿酸低于 6.0mg/dL 的患者比例差異無統計學意義[RR=1.21,95%CI(0.98,1.50),P=0.07;RR=0.79,95%CI(0.56,1.11),P=0.17],系統評價證據質量分級為極低和中。
2.4.2 急性痛風發作
6 篇系統評價[14, 16-18, 21, 23]關注了降尿酸治療后急性痛風發作這一指標,6 篇[14, 16-18, 21, 23]均對比了別嘌醇和非布司他,1 篇[18]還對比了別嘌醇和苯溴馬隆。
別嘌醇 vs. 非布司他:5 篇系統評價[14, 16, 18, 21, 23]結果顯示兩組的痛風急性發作的發生率差異無統計學意義[RR=1.02,95%CI(0.95,1.10),P=0.60;RR=1.12,95%CI(0.98,1.27),P=0.098;RR=0.89,95%CI(0.71,1.10),P=0.28;RR=1.11,95%CI(1.01,1.22),P=0.03;RR=1.02,95%CI(0.89,1.16),P=0.78],系統評價證據質量分級為低、高、低、低、中;而另 1 篇系統評價[17]結果顯示非布司他組痛風急性發作的發生率高于別嘌醇組[RR=1.16,95%CI(1.02,1.31),P=0.02],證據質量分級為低。
別嘌醇 vs. 苯溴馬隆:1 篇系統評價[18]結果顯示兩組痛風急性發作的發生率差異無統計學意義[RR=0.28,95%CI(0.01,6.58),P=0.43],證據質量評價結果為低。
2.4.3 不良反應
所有系統評價都關注了降尿酸治療干預的不良反應,其中 10 篇[13, 14, 16-23]對比了別嘌醇和非布司他,3 篇[15, 18, 20]對比了別嘌醇和苯溴馬隆,1 篇[20]對比了別嘌醇和丙磺舒。
別嘌醇 vs. 非布司他:8 篇系統評價[13, 16-19, 21-23]結果顯示非布司他組安全性優于別嘌醇組,總不良反應事件數或發生率低于別嘌醇組[RR=0.92,95%CI(0.87,0.97),P=0.003;RR=0.94,95%CI(0.89,0.99),P=0.023;RR=0.94,95%CI(0.90,0.99),P=0.01;RR=1.06,95%CI(1.01,1.12),P=0.022;RR=0.90,95%CI(0.85,0.96),P=0.001;RR=0.95,95%CI(0.90,0.99),P<0.05;OR=0.85,95%CI(0.75,0.97),P=0.01;RR=0.95,95%CI(0.91,0.99),P=0.03],系統評價證據質量分級為中、中、低、中、高、中、低、中;而另 2 篇系統評價[14, 20]結果顯示兩組間總不良反應事件數或發生率無統計學差異[RR=1.54,95%CI(0.94,2.55),P=0.09;RR=1.04,95%CI(0.98,1.11),P=0.957],系統評價證據質量分級為極低和低。
別嘌醇 vs. 苯溴馬隆:1 篇系統評價[15]結果顯示苯溴馬隆組不良反應發生率低于別嘌醇組[RR=0.44,95%CI(0.23,0.84),P=0.01],證據質量評價分級為低;而另 2 篇系統評價[18, 20]結果顯示兩組間總不良反應事件或安全性差異無統計學意義[RR=0.33,95%CI(0.07,1.57),P=0.17],系統評價證據質量評價分級均為低。
別嘌醇 vs. 丙磺舒:1 篇系統評價[20]結果顯示別嘌醇組的安全性優于丙磺舒,證據質量評價分級為中。
3 討論
本研究共納入 11 篇有關痛風慢性降尿酸治療的系統評價,涉及別嘌醇、非布司他、苯溴馬隆、丙磺舒四種藥物干預和安慰劑。降尿酸藥物按照作用的機制不同可分為兩類,一類是抑制尿酸生成的藥物,代表藥物如別嘌醇,一類是促尿酸排泄藥,代表藥物如苯溴馬隆[20]。本研究發現目前降尿酸藥物研究的熱點方向為別嘌醇和非布司他的有效性和安全性對比,91% 的系統評價關注了這兩種藥物。可是,研究人員對于苯溴馬隆和丙磺舒的關注度卻十分有限,相關系統評價稀少。降尿酸治療相關證據的質量水平普遍不高,運用 GRADE 工具針對單個結局指標對系統評價結論的可靠性進行評價發現,63% 的證據質量為低或極低,即系統評價的結論與真實療效有可能存在很大差異。
10 篇系統評價對比了別嘌醇和非布司他的有效性和安全性,所有系統評價的證據都顯示非布司他在血尿酸達標方面優于別嘌醇[13, 14, 16-23],但缺乏高質量證據的支持。多數系統評價(包括高質量證據)認為別嘌醇和非布司他兩者在降低急性痛風發作的發生率方面無明顯差異[14, 16, 18, 21, 23],然而也有低質量證據認為非布司他組急性發作率高于別嘌醇[17]。存在高質量證據支持非布司他的安全性優于別嘌醇[13, 16-19, 21-23],也有其他證據認為兩者沒有差異[14, 20]。需要指出的是,納入研究的干預措施復雜,不同系統評價進行數據分析時對異質性的處理方式并不完全一致。比如,非布司他的劑量存在多樣性,使用方式包括 40mg/d、80mg/d、120mg/d 和 240mg/d,一些系統評價根據劑量進行了亞組分析,另一些系統評價直接合并了不同劑量組的數據,還有一些系統評價僅分析和評價了常用劑量(80mg/d),這或許是不同系統評價結論不一致的原因之一。因此,臨床醫生在使用這些證據進行臨床決策時需特別注意劑量和用法差異對結局指標的影響。另外,一項最新的多中心雙盲試驗強調了非布司他存在心血管不良反應[25],這對非布司他的安全性提出了挑戰;相比別嘌醇,非布司他價格又相對昂貴,因此臨床考慮使用非布司他時應小心謹慎。
別嘌醇對比苯溴馬隆,少量證據顯示兩者在血尿酸達標和痛風急性發作方面無明顯差異,安全性方面苯溴馬隆或許更優[15, 18, 20]。別嘌醇對比丙磺舒,僅一篇系統評價顯示在安全性方面別嘌醇優于丙磺舒[20]。可是,這些結論的證據質量多為低或極低,可靠性有待更多高質量研究進一步確證。
本研究發現了目前痛風降尿酸治療領域相關系統評價的一些不足并總結了對未來研究的方向。首先,當前系統評價總體方法學質量不高,超過一半的系統評價評分低于 7 分。盡管系統評價被視為最佳的醫學證據形式,但并非所有系統評價都足夠可靠[26, 27]。系統評價應該有嚴格的質量控制措施,才能為臨床實踐和衛生決策提供偏倚最小和趨于真實的科學證據[28]。遺憾的是,我們并未發現系統評價的方法學質量在研究時間窗內有明顯改善,許多共性問題依然存在,例如沒有提供前期設計方案、沒有提供納入和排除的研究文獻清單以及沒有評估發表偏倚等。這些問題都可能會影響系統評價制定的嚴謹性和科學性,從而影響結果的真實性和可靠性。當前,Cochrane 系統評價的方法學是嚴謹和科學性的典范,值得其他系統評價參考和學習。其次,缺乏總結和分析苯溴馬隆和丙磺舒相關證據的系統評價。目前有關苯溴馬隆和丙磺舒的證據多為描述性,缺乏定量的合并,盡管 Meta 分析并不是系統評價所必須的,但如果數據能夠合并我們強烈建議進行合并,這將有利于讀者對結果的解釋和理解。再次,缺乏對特殊人群的研究。雖然別嘌醇的療效和安全性較為明確,目前多數臨床實踐指南[7, 29, 30]推薦其為降尿酸治療的一線用藥,但并不是所有患者都適合使用這類藥物,比如 HLA-B5801 基因型陽性的患者使用別嘌醇有可能發生嚴重的過敏反應,另外某些有合并癥患者(如慢性腎臟病患者)使用該藥時尚有其特殊性。因此,研究者除了關注一般人群,尚需重視對特殊人群的研究。此外,本研究還發現目前降尿酸治療各干預的優劣性缺乏系統而全面的比較。一個系統評價往往僅關注單一臨床問題,且不同的系統評價之間又缺乏統一的標準,導致系統評價間存在很大異質性,系統評價結果無法相互比較。針對降尿酸治療干預的多樣性特點(包括種類和劑量多樣性),今后研究人員可以開展更多系統比較各干預療效和安全性優劣的研究,例如制訂降尿酸治療的網狀 Meta 分析。
本研究存在的局限性:① 只納入了中英文文獻,其他語言的數據缺失可能對結果有影響;② 檢索時間截至 2017 年 4 月,證據的更新可能會對結果產生影響;③ 納入研究所包含的干預措施復雜,無法定量合并分析其效應值;④ 評價分析人員不可避免存在主觀性,可能導致偏倚。
綜上所述,痛風慢性降尿酸治療相關系統評價普遍關注別嘌醇和非布司他的有效性和安全性。中等質量證據顯示非布司他在血尿酸達標方面優于別嘌醇,高質量證據顯示兩者在急性痛風發生率方面無明顯差異,高質量證據顯示非布司他安全性優于別嘌醇。其他降尿酸干預尚缺乏來源于系統評價的高質量證據支持。系統評價的總體方法學質量不高,期待未來開展更多科學而嚴謹的研究,生產更多高質量證據,從而為痛風慢性治療和管理提供指導。
痛風是最常見的炎性關節病變之一,有研究顯示在過去的幾十年內痛風發病率不斷上升[1],患病率因國家不同在 1.7% 到 3.8% 不等[2-5]。痛風是由嘌呤代謝發生紊亂導致的疾病,臨床表現為高尿酸血癥、關節腫脹及繼發關節畸形、痛風石、痛風性急性關節炎反復發作等,嚴重時可累及腎臟。痛風慢性期降尿酸治療是痛風管理中的重要部分,良好的降尿酸治療可明顯改善預后,常用治療藥物包括別嘌醇、非布司他、苯溴馬隆和丙磺舒等。
針對痛風的慢性期降尿酸治療,當前依然存在許多問題尚未解決。國內外不同的指南對于降尿酸藥物選擇的優先性也存在一定的差異,例如 2016EULAR 指南[6]推薦別嘌醇為降尿酸治療的一線用藥,而 2012ACR 指南[7]則推薦別嘌醇和非布司他為一線用藥。另外,非布司他因心血管不良反應在美國退市的事件也引發了對降尿酸藥物安全性的廣泛關注。
系統評價再評價(overview of systematic reviews)是全面收集同一疾病或同一健康問題治療或病因、診斷、預后等方面的相關系統評價,進行綜合研究的一種方法,其可為證據使用者提供更為集中的高質量證據[8, 9]。截至目前,國內外已公開發表多篇痛風慢性期降尿酸治療的系統評價/Meta 分析文章,但其方法學質量和證據的可靠性尚不清楚,因此有必要對這些研究進行再評價。本研究將系統搜集相關痛風慢性降尿酸治療的系統評價/Meta 分析,客觀評價其方法學偏倚以及結論的可靠程度,以期為痛風的臨床管理提供證據綜合和決策依據,為降尿酸治療領域存在的問題和不確定性提供解決策略。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究設計
公開發表的痛風慢性期降尿酸治療的系統評價或 Meta 分析。
1.1.2 研究對象
診斷為痛風的患者,其性別、年齡、種族、發病時間和來源不限。
1.1.3 干預措施
試驗組和(或)對照組的干預措施至少涉及以下一種降尿酸藥物:別嘌醇、非布司他、苯溴馬隆、丙磺舒。
1.1.4 結局指標
血尿酸達標率、急性痛風發生率、不良反應發生率。
1.1.5 排除標準
① 重復發表的文獻;② 系統評價的計劃書;③ 未對納入的原始研究進行定量分析;④ 會議摘要、評論及傳統綜述;⑤ 非中、英文文獻。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、The Cochrane Library、Epistemonikos、CBM、WangFang Data 和 CNKI 數據庫,搜集公開發表的痛風慢性期降尿酸治療的系統評價/Meta 分析,檢索時限均為建庫至 2017 年 4 月 8 日。檢索采用主題詞和自由詞相結合的方式。英文檢索詞包括:gout、Hyperuricemia、meta-analysis、systematic review 等;中文檢索詞包括:痛風、高尿酸血癥、系統綜述、系統評價、Meta 分析、薈萃分析。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選及資料提取
由 2 名研究者獨立進行兩輪篩選,并根據預先設計好的 Excel 數據提取表進行數據提取,如遇分歧,討論解決或咨詢第三方。提取內容包括:① 基本信息,包括第一作者、發表(或更新)年份、診斷標準、干預/對照措施等;② 系統評價的方法學情況,包括文獻檢索、納入研究、研究樣本及對納入研究的方法學質量評價;③ 統計分析結果,主要是對各個結局指標的定量分析結果。
1.4 納入研究的方法學質量和證據質量評價
采用 AMSTAR 量表[10]對納入的系統評價進行方法學質量評價。采用 GRADE 工具進行證據質量評價[11, 12],包括偏倚風險、不直接性、不一致性、不精確性和發表偏倚五個降級因素及大效應量、劑量效應關系和負偏倚三個升級因素。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 1 152 篇,經逐層篩選,最終納入 11 篇系統評價[13-23]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入系統評價的基本特征
納入的 11 篇系統評價中 2 篇為 Cochrane 系統評價[16, 18]。6 篇為英文文獻[16-20, 22],5 篇中文文獻[13-15, 21, 23]。發表年份為 2009 年~2016 年,6 篇[18-23]為 2014 年及以后發表,占所有系統評價的 55%。11 篇系統評價中,所有系統評價均涉及別嘌醇,10 篇涉及非布司他[13, 14, 16-23],3 篇涉及苯溴馬隆[15, 18, 20],1 篇涉及丙磺舒[20]。幾乎所有系統評價均報告了納入的研究個數及樣本量,且說明了人群的血尿酸基線水平。納入系統評價中 10 篇[13-21, 23](91%)對納入原始研究進行了方法學質量評價,其中 8 篇[13-18, 21, 23]使用 Cochrane risk of bias 偏倚評估工具,2 篇[19, 20]使用其他評價工具。納入系統評價的基本特征見表 1。

2.3 納入系統評價的方法學質量
我們認為 AMSTAR 得分在 9~11 分的系統評價/Meta 分析為高質量,5~8 分的為中等質量,低于 5 分的為低質量[24]。方法學質量評價結果見表 2,其中 4 篇[14, 16, 18, 20]為高質量,7 篇[13, 15, 17, 19, 21-23]為中等質量。

亞組分析顯示,Cochrane 系統評價[16, 18]相對于非 Cochrane 系統評價[13-15, 17, 19-23],其 AMSTAR 總評分更高[MD=4.56,95%CI(3.42,5.70),P<0.000 01],差異有統計學意義。中文系統評價[13-15, 21, 23]相對于英文系統評價[16-20, 22],其 AMSTAR 總評分的差異無統計學意義[MD=?2.33,95%CI(?4.84,0.18),P=0.07]。
針對具體條目,8 篇系統評價[13-15, 17, 19, 21-23](73%)沒有提供前期設計方案;3 篇[15, 20, 22](27%)在納入研究的選擇和資料提取方面不具有可重復性;4 篇[15, 17, 21, 23](36%)在文獻檢索上存在漏洞;5 篇[13, 15, 21-23](45%)沒有在納入排除標準中考慮發表情況(如灰色文獻);7 篇[13-15, 17, 21-23](64%)沒有提供納入和排除的研究文獻清單;1 篇[22](9%)沒有評價和報告納入研究的科學性;7 篇[13, 17, 19-23](64%)沒有評估發表偏倚;6 篇[13, 15, 17, 19, 21, 23](55%)沒有說明利益沖突關系;所有系統評價均描述了納入研究的基本特征;所有系統評價納入研究的科學性都恰當地運用在結論的推導上;所有系統評價都恰當地合成了納入研究的結果。
2.4 主要結局指標和證據質量分級
見表 3。

2.4.1 血尿酸達標情況
10 篇系統評價[13, 14-19, 21-23]關注了降尿酸治療后血尿酸達標情況,其中 9 篇[13, 14, 16-19, 21-23]對比了別嘌醇和非布司他,2 篇[15, 18]對比了別嘌醇和苯溴馬隆。
別嘌醇 vs. 非布司他:所有系統評價均顯示非布司他在血尿酸達標這一指標上優于別嘌醇,5 篇系統評價[13, 14, 21-23]結果顯示非布司他組治療后血尿酸低于 6.0mg/dL 的患者數或比例優于別嘌呤組[RR=2.68,95%CI(2.26,3.17),P<0.000 01;RR=2.55,95%CI(2.32,2.80),P<0.000 01;RR=1.56,95%CI(1.22,2.00),P<0.001;OR=2.64,95%CI(1.74,4.01),P<0.000 01;RR=1.56,95%CI(1.46,1.66),P<0.000 01],系統評價證據質量分級為低、中、低、低、低。3 篇系統評價[16-18]結果顯示非布司他組治療后實現血尿酸低于 6.0mg/dL 的可能性高于別嘌醇組[RR=1.80,95%CI(1.55,2.09),P<0.000 01;RR=1.56,95%CI(1.22,2.00),P<0.000 01;RR=0.55,95%CI(0.48,0.63),P<0.000 01],系統評價證據質量分級均為低。另 1 篇系統評價[19]結果顯示非布司他組治療后未達到目標血尿酸水平的患者數少于別嘌醇組[RR=0.31,95%CI(0.24,0.39),P<0.000 01],系統評價證據質量分級為中等。
別嘌醇 vs. 苯溴馬隆:2 篇系統評價[15, 18]結果顯示兩組治療后血尿酸低于 6.0mg/dL 的患者比例差異無統計學意義[RR=1.21,95%CI(0.98,1.50),P=0.07;RR=0.79,95%CI(0.56,1.11),P=0.17],系統評價證據質量分級為極低和中。
2.4.2 急性痛風發作
6 篇系統評價[14, 16-18, 21, 23]關注了降尿酸治療后急性痛風發作這一指標,6 篇[14, 16-18, 21, 23]均對比了別嘌醇和非布司他,1 篇[18]還對比了別嘌醇和苯溴馬隆。
別嘌醇 vs. 非布司他:5 篇系統評價[14, 16, 18, 21, 23]結果顯示兩組的痛風急性發作的發生率差異無統計學意義[RR=1.02,95%CI(0.95,1.10),P=0.60;RR=1.12,95%CI(0.98,1.27),P=0.098;RR=0.89,95%CI(0.71,1.10),P=0.28;RR=1.11,95%CI(1.01,1.22),P=0.03;RR=1.02,95%CI(0.89,1.16),P=0.78],系統評價證據質量分級為低、高、低、低、中;而另 1 篇系統評價[17]結果顯示非布司他組痛風急性發作的發生率高于別嘌醇組[RR=1.16,95%CI(1.02,1.31),P=0.02],證據質量分級為低。
別嘌醇 vs. 苯溴馬隆:1 篇系統評價[18]結果顯示兩組痛風急性發作的發生率差異無統計學意義[RR=0.28,95%CI(0.01,6.58),P=0.43],證據質量評價結果為低。
2.4.3 不良反應
所有系統評價都關注了降尿酸治療干預的不良反應,其中 10 篇[13, 14, 16-23]對比了別嘌醇和非布司他,3 篇[15, 18, 20]對比了別嘌醇和苯溴馬隆,1 篇[20]對比了別嘌醇和丙磺舒。
別嘌醇 vs. 非布司他:8 篇系統評價[13, 16-19, 21-23]結果顯示非布司他組安全性優于別嘌醇組,總不良反應事件數或發生率低于別嘌醇組[RR=0.92,95%CI(0.87,0.97),P=0.003;RR=0.94,95%CI(0.89,0.99),P=0.023;RR=0.94,95%CI(0.90,0.99),P=0.01;RR=1.06,95%CI(1.01,1.12),P=0.022;RR=0.90,95%CI(0.85,0.96),P=0.001;RR=0.95,95%CI(0.90,0.99),P<0.05;OR=0.85,95%CI(0.75,0.97),P=0.01;RR=0.95,95%CI(0.91,0.99),P=0.03],系統評價證據質量分級為中、中、低、中、高、中、低、中;而另 2 篇系統評價[14, 20]結果顯示兩組間總不良反應事件數或發生率無統計學差異[RR=1.54,95%CI(0.94,2.55),P=0.09;RR=1.04,95%CI(0.98,1.11),P=0.957],系統評價證據質量分級為極低和低。
別嘌醇 vs. 苯溴馬隆:1 篇系統評價[15]結果顯示苯溴馬隆組不良反應發生率低于別嘌醇組[RR=0.44,95%CI(0.23,0.84),P=0.01],證據質量評價分級為低;而另 2 篇系統評價[18, 20]結果顯示兩組間總不良反應事件或安全性差異無統計學意義[RR=0.33,95%CI(0.07,1.57),P=0.17],系統評價證據質量評價分級均為低。
別嘌醇 vs. 丙磺舒:1 篇系統評價[20]結果顯示別嘌醇組的安全性優于丙磺舒,證據質量評價分級為中。
3 討論
本研究共納入 11 篇有關痛風慢性降尿酸治療的系統評價,涉及別嘌醇、非布司他、苯溴馬隆、丙磺舒四種藥物干預和安慰劑。降尿酸藥物按照作用的機制不同可分為兩類,一類是抑制尿酸生成的藥物,代表藥物如別嘌醇,一類是促尿酸排泄藥,代表藥物如苯溴馬隆[20]。本研究發現目前降尿酸藥物研究的熱點方向為別嘌醇和非布司他的有效性和安全性對比,91% 的系統評價關注了這兩種藥物。可是,研究人員對于苯溴馬隆和丙磺舒的關注度卻十分有限,相關系統評價稀少。降尿酸治療相關證據的質量水平普遍不高,運用 GRADE 工具針對單個結局指標對系統評價結論的可靠性進行評價發現,63% 的證據質量為低或極低,即系統評價的結論與真實療效有可能存在很大差異。
10 篇系統評價對比了別嘌醇和非布司他的有效性和安全性,所有系統評價的證據都顯示非布司他在血尿酸達標方面優于別嘌醇[13, 14, 16-23],但缺乏高質量證據的支持。多數系統評價(包括高質量證據)認為別嘌醇和非布司他兩者在降低急性痛風發作的發生率方面無明顯差異[14, 16, 18, 21, 23],然而也有低質量證據認為非布司他組急性發作率高于別嘌醇[17]。存在高質量證據支持非布司他的安全性優于別嘌醇[13, 16-19, 21-23],也有其他證據認為兩者沒有差異[14, 20]。需要指出的是,納入研究的干預措施復雜,不同系統評價進行數據分析時對異質性的處理方式并不完全一致。比如,非布司他的劑量存在多樣性,使用方式包括 40mg/d、80mg/d、120mg/d 和 240mg/d,一些系統評價根據劑量進行了亞組分析,另一些系統評價直接合并了不同劑量組的數據,還有一些系統評價僅分析和評價了常用劑量(80mg/d),這或許是不同系統評價結論不一致的原因之一。因此,臨床醫生在使用這些證據進行臨床決策時需特別注意劑量和用法差異對結局指標的影響。另外,一項最新的多中心雙盲試驗強調了非布司他存在心血管不良反應[25],這對非布司他的安全性提出了挑戰;相比別嘌醇,非布司他價格又相對昂貴,因此臨床考慮使用非布司他時應小心謹慎。
別嘌醇對比苯溴馬隆,少量證據顯示兩者在血尿酸達標和痛風急性發作方面無明顯差異,安全性方面苯溴馬隆或許更優[15, 18, 20]。別嘌醇對比丙磺舒,僅一篇系統評價顯示在安全性方面別嘌醇優于丙磺舒[20]。可是,這些結論的證據質量多為低或極低,可靠性有待更多高質量研究進一步確證。
本研究發現了目前痛風降尿酸治療領域相關系統評價的一些不足并總結了對未來研究的方向。首先,當前系統評價總體方法學質量不高,超過一半的系統評價評分低于 7 分。盡管系統評價被視為最佳的醫學證據形式,但并非所有系統評價都足夠可靠[26, 27]。系統評價應該有嚴格的質量控制措施,才能為臨床實踐和衛生決策提供偏倚最小和趨于真實的科學證據[28]。遺憾的是,我們并未發現系統評價的方法學質量在研究時間窗內有明顯改善,許多共性問題依然存在,例如沒有提供前期設計方案、沒有提供納入和排除的研究文獻清單以及沒有評估發表偏倚等。這些問題都可能會影響系統評價制定的嚴謹性和科學性,從而影響結果的真實性和可靠性。當前,Cochrane 系統評價的方法學是嚴謹和科學性的典范,值得其他系統評價參考和學習。其次,缺乏總結和分析苯溴馬隆和丙磺舒相關證據的系統評價。目前有關苯溴馬隆和丙磺舒的證據多為描述性,缺乏定量的合并,盡管 Meta 分析并不是系統評價所必須的,但如果數據能夠合并我們強烈建議進行合并,這將有利于讀者對結果的解釋和理解。再次,缺乏對特殊人群的研究。雖然別嘌醇的療效和安全性較為明確,目前多數臨床實踐指南[7, 29, 30]推薦其為降尿酸治療的一線用藥,但并不是所有患者都適合使用這類藥物,比如 HLA-B5801 基因型陽性的患者使用別嘌醇有可能發生嚴重的過敏反應,另外某些有合并癥患者(如慢性腎臟病患者)使用該藥時尚有其特殊性。因此,研究者除了關注一般人群,尚需重視對特殊人群的研究。此外,本研究還發現目前降尿酸治療各干預的優劣性缺乏系統而全面的比較。一個系統評價往往僅關注單一臨床問題,且不同的系統評價之間又缺乏統一的標準,導致系統評價間存在很大異質性,系統評價結果無法相互比較。針對降尿酸治療干預的多樣性特點(包括種類和劑量多樣性),今后研究人員可以開展更多系統比較各干預療效和安全性優劣的研究,例如制訂降尿酸治療的網狀 Meta 分析。
本研究存在的局限性:① 只納入了中英文文獻,其他語言的數據缺失可能對結果有影響;② 檢索時間截至 2017 年 4 月,證據的更新可能會對結果產生影響;③ 納入研究所包含的干預措施復雜,無法定量合并分析其效應值;④ 評價分析人員不可避免存在主觀性,可能導致偏倚。
綜上所述,痛風慢性降尿酸治療相關系統評價普遍關注別嘌醇和非布司他的有效性和安全性。中等質量證據顯示非布司他在血尿酸達標方面優于別嘌醇,高質量證據顯示兩者在急性痛風發生率方面無明顯差異,高質量證據顯示非布司他安全性優于別嘌醇。其他降尿酸干預尚缺乏來源于系統評價的高質量證據支持。系統評價的總體方法學質量不高,期待未來開展更多科學而嚴謹的研究,生產更多高質量證據,從而為痛風慢性治療和管理提供指導。