引用本文: 翁鴻, 王朝陽, 賀大林, 李勝, 彭雙鶴, 曾憲濤. 試驗序貫分析檢驗 Cochrane 泌尿外科學小組 Meta 分析假陽性結果的研究. 中國循證醫學雜志, 2017, 17(4): 458-462. doi: 10.7507/1672-2531.201607064 復制
證據是循證醫學的核心,基于隨機對照試驗(randomized controlled trial,RCT)的系統評價/Meta 分析被公認為是最高級別的證據[1,2]。但累積 Meta 分析的結論常常伴隨著錯誤的風險。系統誤差或偏倚可采用較好的研究設計來控制,而隨機誤差或結果的機遇卻不能完全避免。所以,隨機誤差的風險應該被識別和計算出來,從而進行控制。通常我們設定Ⅰ型錯誤(假陽性率)為 5%,Ⅱ型錯誤(假陰性)為 20%,當風險誤差小于上述標準時我們認為結論是穩定的。
隨著新研究的發表,Meta 分析進行累積更新,隨機誤差的風險也隨之增加[3]。Pogue 和 Yusuf[4]于 1997 年將成組序貫方法引入累積 Meta 分析,丹麥哥本哈根大學臨床試驗中心科研團隊發展了該方法,提出了試驗序貫分析(trial sequential analysis,TSA)方法[5-8]。本文主要采用 TSA 來分析 Cochrane 泌尿外科學小組的陽性結果的系統評價,探索 TSA 發現假陽性結果的能力。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準 選擇 Cochrane 泌尿外科學小組的具有陽性結果,并采用了 Meta 分析方法,結局指標為二分類數據的系統評價。
1.1.2 排除標準 基于結局指標的 Meta 分析所納入的研究數量小于 5 個。
1.2 文獻檢索
計算機檢索 The Cochrane Library(2016 年第 6 期),納入“Urology Group”的系統評價/Meta 分析。由于 The Cochrane Library 將 Cochrane 系統評價按小組類別已分類,故無需使用檢索詞,只需按小組類別進行查看即可。
1.3 文獻篩選和資料提取
由兩位研究者按納入與排除標準獨立篩選文獻和資料提取,若遇分歧,交由第三位研究者協助裁決。首先閱讀文題和摘要,按納入與排除標準排除明顯不符合納入標準的文獻后;進一步閱讀全文,確定最終納入文獻。采用自制的資料提取表提取資料,資料提取內容主要包括:第一作者、發表時間、干預措施、納入研究數量、結局指標、基于結局指標的 Meta 分析所需數據。
1.4 統計分析
由于不同的系統評價/Meta 分析采用的效應量有所不同,因此,我們統一采用風險比(RR)及其 95% 可信區間(CI)為效應量。若研究間存在異質性,則采用隨機效應模型進行 Meta 分析[5];反之,則采用固定效應模型。期望信息量(required information size,RIS)的計算采用先驗差異校正信息量(a priori diversity-adjusted information size,APDIS),定義相對危險度減少率(RRR)為 25%、α=0.05、β=0.2 來進行 APDIS 的估算和 TSA 界值的計算。采用 TSA 0.9β 軟件進行 Meta 分析和 TSA 分析[9],并提供 TSA 校正 95% CI。
2 結果
2.1 文獻篩選結果
The Cochrane Library 的“Urology Group”小組的系統評價共計 40 篇,經逐層篩選,最終納入 11 個 Meta 分析[10-20]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
納入研究的基本特征情況見表 1。

2.3 Meta 分析結果和 TSA 結果
Meta 分析結果和 TSA 結果見表 2。5 個 Meta 分析[10,13-16]采用隨機效應模型,6 個 Meta 分析采用固定效應模型[11,12,17-20]。TSA 結果顯示,共有 2 個 Meta 分析的累積信息量達到了 APDIS[14,17],并穿過了 TSA 界值線(圖 2);此外,還有 1 個 Meta 分析的累積信息量未達到 APDIS[18],但也穿過了 TSA 界值線,1 個 Meta 分析的累積信息量達到了 APDIS[11],但未穿過界值線,其 TSA 校正 95% CI 顯示結果為無統計學意義。其余 7 個 Meta 分析的累積 Z 曲線既未穿過 TSA 界值線,其累積信息量也未能達到 APIDS(圖 3)。總體結果顯示,11 個 Meta 分析中,有 8 個(72.7%)Meta 分析的結果可能是潛在的假陽性結果,尚需進一步研究進行驗證。



3 討論
本研究全面評價了 Cochrane 泌尿外科學小組的陽性系統評價結果,共計 11 項研究,包括 11 項 Meta 分析。研究結果顯示,11 個 Meta 分析中僅有 3 個 Meta 分析的結果穿過了 TSA 界值線,8 個 Meta 分析的結果可能是潛在的假陽性結果,當前的證據并不充分,尚需進一步開展相關研究進行驗證。本研究采用的先驗 RRR 為 25%,即估計的干預措施效應,相對來說較為寬泛,若先驗 RRR 定義為 15%,則結果可能會更為保守。
GRADE 系統中“不精確性”項表明,若研究的累積信息量不能達到 RIS(也稱最優信息樣本量),其證據質量會因其不精確性而降低[21-24]。因此,TSA 可以幫助 GRADE 系統來評判其“不精確性”。由于 TSA 不僅可以提供 RIS 的計算,還可以提供 TSA 界值,提前判斷該研究結論是否是假陽性結果,可以使得 GRADE 系統的“不精確性”項的評判更為完善,即 TSA 可以增加 GRADE 系統“不精確性”的精確性。
此外,本研究也表明,多數 Meta 分析的結果均為潛在的假陽性結果。因此,在制作 Meta 分析的同時,為了避免隨機誤差和增加結果的可信度,研究者應該對結果進行 TSA 分析,以明確該研究結果的可信度。
證據是循證醫學的核心,基于隨機對照試驗(randomized controlled trial,RCT)的系統評價/Meta 分析被公認為是最高級別的證據[1,2]。但累積 Meta 分析的結論常常伴隨著錯誤的風險。系統誤差或偏倚可采用較好的研究設計來控制,而隨機誤差或結果的機遇卻不能完全避免。所以,隨機誤差的風險應該被識別和計算出來,從而進行控制。通常我們設定Ⅰ型錯誤(假陽性率)為 5%,Ⅱ型錯誤(假陰性)為 20%,當風險誤差小于上述標準時我們認為結論是穩定的。
隨著新研究的發表,Meta 分析進行累積更新,隨機誤差的風險也隨之增加[3]。Pogue 和 Yusuf[4]于 1997 年將成組序貫方法引入累積 Meta 分析,丹麥哥本哈根大學臨床試驗中心科研團隊發展了該方法,提出了試驗序貫分析(trial sequential analysis,TSA)方法[5-8]。本文主要采用 TSA 來分析 Cochrane 泌尿外科學小組的陽性結果的系統評價,探索 TSA 發現假陽性結果的能力。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準 選擇 Cochrane 泌尿外科學小組的具有陽性結果,并采用了 Meta 分析方法,結局指標為二分類數據的系統評價。
1.1.2 排除標準 基于結局指標的 Meta 分析所納入的研究數量小于 5 個。
1.2 文獻檢索
計算機檢索 The Cochrane Library(2016 年第 6 期),納入“Urology Group”的系統評價/Meta 分析。由于 The Cochrane Library 將 Cochrane 系統評價按小組類別已分類,故無需使用檢索詞,只需按小組類別進行查看即可。
1.3 文獻篩選和資料提取
由兩位研究者按納入與排除標準獨立篩選文獻和資料提取,若遇分歧,交由第三位研究者協助裁決。首先閱讀文題和摘要,按納入與排除標準排除明顯不符合納入標準的文獻后;進一步閱讀全文,確定最終納入文獻。采用自制的資料提取表提取資料,資料提取內容主要包括:第一作者、發表時間、干預措施、納入研究數量、結局指標、基于結局指標的 Meta 分析所需數據。
1.4 統計分析
由于不同的系統評價/Meta 分析采用的效應量有所不同,因此,我們統一采用風險比(RR)及其 95% 可信區間(CI)為效應量。若研究間存在異質性,則采用隨機效應模型進行 Meta 分析[5];反之,則采用固定效應模型。期望信息量(required information size,RIS)的計算采用先驗差異校正信息量(a priori diversity-adjusted information size,APDIS),定義相對危險度減少率(RRR)為 25%、α=0.05、β=0.2 來進行 APDIS 的估算和 TSA 界值的計算。采用 TSA 0.9β 軟件進行 Meta 分析和 TSA 分析[9],并提供 TSA 校正 95% CI。
2 結果
2.1 文獻篩選結果
The Cochrane Library 的“Urology Group”小組的系統評價共計 40 篇,經逐層篩選,最終納入 11 個 Meta 分析[10-20]。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
納入研究的基本特征情況見表 1。

2.3 Meta 分析結果和 TSA 結果
Meta 分析結果和 TSA 結果見表 2。5 個 Meta 分析[10,13-16]采用隨機效應模型,6 個 Meta 分析采用固定效應模型[11,12,17-20]。TSA 結果顯示,共有 2 個 Meta 分析的累積信息量達到了 APDIS[14,17],并穿過了 TSA 界值線(圖 2);此外,還有 1 個 Meta 分析的累積信息量未達到 APDIS[18],但也穿過了 TSA 界值線,1 個 Meta 分析的累積信息量達到了 APDIS[11],但未穿過界值線,其 TSA 校正 95% CI 顯示結果為無統計學意義。其余 7 個 Meta 分析的累積 Z 曲線既未穿過 TSA 界值線,其累積信息量也未能達到 APIDS(圖 3)。總體結果顯示,11 個 Meta 分析中,有 8 個(72.7%)Meta 分析的結果可能是潛在的假陽性結果,尚需進一步研究進行驗證。



3 討論
本研究全面評價了 Cochrane 泌尿外科學小組的陽性系統評價結果,共計 11 項研究,包括 11 項 Meta 分析。研究結果顯示,11 個 Meta 分析中僅有 3 個 Meta 分析的結果穿過了 TSA 界值線,8 個 Meta 分析的結果可能是潛在的假陽性結果,當前的證據并不充分,尚需進一步開展相關研究進行驗證。本研究采用的先驗 RRR 為 25%,即估計的干預措施效應,相對來說較為寬泛,若先驗 RRR 定義為 15%,則結果可能會更為保守。
GRADE 系統中“不精確性”項表明,若研究的累積信息量不能達到 RIS(也稱最優信息樣本量),其證據質量會因其不精確性而降低[21-24]。因此,TSA 可以幫助 GRADE 系統來評判其“不精確性”。由于 TSA 不僅可以提供 RIS 的計算,還可以提供 TSA 界值,提前判斷該研究結論是否是假陽性結果,可以使得 GRADE 系統的“不精確性”項的評判更為完善,即 TSA 可以增加 GRADE 系統“不精確性”的精確性。
此外,本研究也表明,多數 Meta 分析的結果均為潛在的假陽性結果。因此,在制作 Meta 分析的同時,為了避免隨機誤差和增加結果的可信度,研究者應該對結果進行 TSA 分析,以明確該研究結果的可信度。