累積Meta分析可以有助于研究者做出對干預措施有效/無效的判斷,以及所獲得的證據是否足夠,然而這一過程中并沒有對重復檢驗進行校正,也沒有關注統計效能。序貫Meta分析的產生使得上述問題得以解決,被廣泛應用于循證臨床實踐和決策。目前有多種序貫Meta分析,不同方法具有不同的優缺點,其中試驗序貫分析(TSA)的方法學最為成熟,軟件操作也較為簡單;Whitehead雙三角檢驗的理論不如TSA完善,且操作也較難;半貝葉斯法則涉及到貝葉斯理論,更不易推廣。本文主要對當前的這三種主要的序貫Meta分析方法做一簡介。
引用本文: 翁鴻, 武珊珊, 張永剛, 靳英輝, 曹越, 曾憲濤. 序貫Meta分析方法學簡介. 中國循證醫學雜志, 2016, 16(10): 1216-1220. doi: 10.7507/1672-2531.20160184 復制
隨機對照試驗(randomized controlled trial,RCT)的Meta分析被認為是證據的最高級別 [1]。Meta分析采用系統、定量的方法合并多個具有相似性的研究,可增大樣本量,增強統計效能,增加效應量的精確度。但由于系統誤差(偏倚)和隨機誤差(機遇)的影響,Meta分析可能會得出假陽性結果或高估干預措施的效應量。此外,Cochrane協作網要求作者每2年對Meta分析進行更新,而隨著新研究的納入,也增加了檢驗次數,使得隨機誤差增大 [2]。
累積Meta分析常被用來觀察效應量隨特定順序(如發表時間等)變化的趨勢,判斷當前所獲得的證據是否足夠,以及新的同一主題的RCT是否應該進行 [3]。但累積Meta分析的過程未能對重復檢驗進行校正,也不能計算拒絕無效假設的統計檢驗效能。而重復檢驗會增加Ⅰ型錯誤風險 [3]。
序貫Meta分析(sequential meta-analysis,SMA)從整體層面上控制顯著性水平α(一般為0.05),按照時間順序依次納入試驗,將每納入的一次試驗當做一次期中分析(interim analysis)。當前主要的序貫Meta分析方法有:① 丹麥哥本哈根臨床試驗研究中心小組Wetterslev等 [4]提出的試驗序貫分析(trial sequential analysis,TSA);② van der Tweel和Bollen [5]推薦的Whitehead雙三角檢驗SMA;③ Higgins等[6]提出的半貝葉斯法。此外,還有Shuster和Neu [7]提出的Pocock法,該方法主要用于前瞻性分析,因此,本文暫不做討論。這三種主要的方法中,TSA的方法學較為成熟,且哥本哈根臨床試驗研究中心小組為其開發了相應的軟件,本團隊已對該軟件的操作做了相關闡述 [8],因此TSA在Meta分析中的應用最為廣泛;后兩者由于軟件以及方法學等因素,尚未能普及。這些方法各有優缺點,本文主要對這幾種方法做一簡介。
1 序貫Meta分析方法學基礎
1.1 序貫試驗
序貫試驗(sequential trial)又稱序貫分析(sequential analysis),由于該設計可以滿足帶有破壞性和危及安全性的試驗要求,其最初被用于軍火質量檢驗。序貫試驗可分為開放型和閉鎖型,根據目的不同可分為單向和雙向序貫試驗 [9]。圖 1為單向序貫試驗的序貫圖。

1.2 成組序貫試驗
傳統的序貫方法要求受試者逐對進入試驗,并且只有當得到該試驗結果并統計分析后才可確定結束試驗還是繼續下一個試驗 [10]。當得到試驗結果的時間較長時(如數周或數月),這種序貫方法就不適用了。而成組序貫試驗(group sequential analysis)可用于得到試驗結果的時間較長及整個試驗過程中分幾個時間段來重復分析試驗結果的情況。此外,成組序貫試驗不要求受試者必須配對。因此該方法既保留了傳統序貫方法的優點又避免其局限性,且正好與期中分析相配合。
該方法首先由Pocock于1977年提出 [11],在國外的藥物臨床試驗中應用較為廣泛。在這一分析過程中要進行多次重復顯著性檢驗,而這將增加Ⅰ型錯誤風險。因此,為使總的顯著性水平等于α,Pocock [11]提出了名義顯著性水平α',并規定每個階段檢驗的名義顯著性水平α'小于α。O’Brien和Fleming [12]提出在試驗的不同階段取不同的α',在早期應更嚴格,并定義檢驗統計量的方差與累積樣本大小成比例。此外,Slud和Wei [13]也提出了一種基于改進Wilcoxon統計量(漸進高斯分布)的方法。但這些方法都需要提前定義所需時段的次數,也就是分析的次數。Lan和DeMetes [14]于1983年提出了一種更為靈活的離散界值,僅需要提前定義一個單調遞增的α損耗函數α*(t),其公式為:
$\alpha *\left( t \right)=\left\{ \begin{matrix} 0 & \left( t=0 \right) \\ 2\left[ 1-\phi \left\{ {{Z}_{\alpha /2}}/ \right\} \right] & \left( 0\le t\le 1 \right) \\ \end{matrix} \right.$ |
其中是標準正態分布函數,當t=1時,α*(1) =α。
1.3 序貫方法引入累積Meta分析
Pogue和Yusuf [15]于1997年將Lan-DeMetes α損耗函數引入累積Meta分析,用該損耗函數來計算Meta分析的界值,同時提出了最優信息量(optional information size,OIS)的概念。計算OIS需要假設事件發生率和最小干預效果,公式為:
$N=2\times \frac{{{\left( {{Z}_{\alpha }}+{{Z}_{\beta }} \right)}^{2}}\times 2P*\left( 1-P* \right)}{{{\left( {{P}_{C}}-{{P}_{E}} \right)}^{2}}}$ |
其中P*=(PC+PE)/2,PC、PE分別為對照組和試驗組事件發生率,N即為OIS。
2 試驗序貫分析(TSA)
丹麥哥本哈根臨床試驗中心小組將Pogue和Yusuf的方法進行延伸,提出了TSA方法 [16-19],同時提出了期望信息量(required information size,RIS)的概念,并提供了多種用于估算RIS的方法,如累積信息量(accrued information size,AIS)、先驗信息量(a priori information size,APIS)、低偏倚信息量(low-bias information size,LBIS)、低偏倚異質性校正信息量(low-bias heterogeneity-adjusted information size,LBHIS)、差異校正信息量(diversity-adjusted information size,DIS)。關于TSA方法,國內已有學者進行了介紹,本文暫不做相關闡述,有興趣的讀者可參閱王權 [20, 21]、夏蕓 [22]、王歡 [23]等國內學者的相關研究。
當然,除了TSA軟件可以進行TSA界值圖的繪制外,其他軟件也可以,如Stata、Excel、SAS、R等軟件(如圖 2、3)。

(RRR=25%,

(RRR=25%,
3 Whitehead雙三角檢驗SMA
Whitehead雙三角檢驗SMA方法起源于單個原始RCT的研究設計 [24],在單個RCT的序貫分析中,分析的單位是單個病人,不通過α損耗函數來控制顯著性水平。Whitehead等 [25-27]將其引入累積Meta分析,分析單位為每一個RCT,也就是一組病人,采用統計量(Z,V)控制總的顯著性水平,該方法得到van der Tweel和Bollen的推廣 [5]。該方法具有以下特點 [25]:① 無需提前預估總體信息量,設置一組界值即可;② 具有終止無效假設的標準,當然TSA也具有這一特點;③ 可以量化統計效能;④ 點估計和區間估計都可進行多重檢驗校正;⑤ 可增加效率,即無效/有效假設均有接受的標準,可達到倫理學和經濟學上的優化。
在Whitehead雙三角檢驗SMA中,每個RCT具有兩個值:Zi和Vi,Zi不同于TSA中的檢驗統計量。Zi表示累積Meta分析中第i個研究試驗組觀察到的事件發生數與無效假設下試驗組事件期望值的差值,Vi表示表示在無效假設下Zi的方差。數據格式如表 1所示,則相應的Zi和Vi的計算方法為:
$\begin{align} & {{Z}_{i}}={{F}_{Ei}}-{{N}_{Ei}}{{F}_{i}}/{{N}_{i}}=\frac{{{N}_{CI}}{{F}_{Ei}}-{{N}_{Ei}}{{F}_{CI}}}{{{N}_{i}}} \\ & {{V}_{i}}=\frac{{{N}_{Ei}}{{N}_{CI}}{{S}_{i}}{{F}_{i}}}{N_{i}^{2}\left( {{N}_{i}}-1 \right)} \\ \end{align}$ |
根據表 1數據格式,第i個RCT的效應量ORi= PEi(1-PCi)/[PCi(1-PEi)],定義臨床療效θi=ln(ORi)。在進行Whitehead雙三角檢驗SMA分析前估計相關的臨床療效θR(=lnOR)。

Whitehead雙三角檢驗SMA方法的界值圖采用雙三角檢驗方法,由四條線組成,外部上界(U1)、下界(L1)和內部上界(U2)、下界(L2),分別表示為:U1:Z=a+cV;L1:Z=-a-cV;U2:Z=-a+3cV;L2:Z=a-3cV
其中系數a、c由Ⅰ型錯誤α、Ⅱ型錯誤β以及相關臨床效應θR共同決定。當α/2=β時,效應量δR截距a=(2/δR)log(1/α),斜率c=δR/4,坐標定為V=4a/δR、Z=2a;當α/2≠β時,效應量δR=2Uα/2θR/(Uα/2+Uβ)。若將截距a替換為,則這種校正方法被稱為“圣誕樹校正” [28]。
如圖 4所示,縱軸為Z,橫軸為V,綠色線條為U1,藍色線條為U2,紫色線條為L1,紅色線條為L2,若累積的研究坐標(Zi,Vi)超過U1或L1,則拒絕H0,即試驗組干預措施優于對照組干預措施;若超過U2或L2,則接受H0,即試驗組干預措施與對照組干預措施無差異;若沒有超過任何一條界值線,則表明當前的證據尚不足以得出結論,仍需進一步看展相關研究進行驗證。

4 半貝葉斯法
Higgins等 [6]提出了半貝葉斯法,與Whitehead雙三角檢驗SMA方法不同的是,半貝葉斯法基于(Z,V)平面(此方法的Z和V與上述方法不同),采用對稱的Z=±H、V=Vmax邊界以及縱軸作為矩形平面,該方法避免了積分計算。
假設估計效應為yi,真實效應為θi,相應的估計方差為vi,i為納入的研究數(i=1,…,k)。若θi=yi,vi=0,則倒γ先驗分布的異質性方差τ2與未知正態分布的方差共軛,且τ2與的后驗分布也為倒γ分布,那么納入tj(若開始納入研究數為2,則t1=2)個研究間的異質性方差為(其參數為η+(tj/2) 、λ+(tjτj2/2) ),采用DerSimonian-Laird法估計的方差為,則τ2的后驗均數為:
${{{\hat{\tau }}}^{2}}_{AB,j}=\frac{2\lambda +{{t}_{j}}\hat{\tau }_{DL,j}^{2}}{2\eta +{{t}_{j}}-2}=\frac{2\left( \eta -1 \right){{{\hat{\tau }}}^{2}}_{AB,0}+{{t}_{j}}\hat{\tau }_{DL,j}^{2}}{2\left( \eta -1 \right)+{{t}_{j}}}$ |
其中是先驗倒γ分布的均值。則后驗均值可被認為為τ2先驗估計的加權平均數,隨著納入研究數量的增加,先驗信息遞減。在隨機效應模型下,半貝葉斯法的Zj、Vj計算方法如下:
${{Z}_{j}}=\sum\nolimits_{i=1}^{{{t}_{j}}}{W_{AB,i}^{*}}{{Y}_{i}},{{V}_{j}}=\sum\nolimits_{i=1}^{{{t}_{j}}}{W}_{AB,i}^{*}$ |
其中,當納入研究夠多(即yi≈θi,vi=0)時,以及納入研究較少而導致高估τ2(與θi分布相比較,yi估計值的分布過度離散)時,該方法可以得到較好的結果。
5 小結
雖然序貫分析在單個研究中得到了廣泛的應用,但在Meta分析領域的應用仍不廣泛。有學者認為Meta分析不能控制新證據的產生,不能扮演終止標準,因此不能使用序貫方法,而Higgins等 [6]認為Meta分析常用于決策或檢驗某一干預措施當前是否存在最佳可信的證據,此外Meta分析的目的是為了促進合理的建議,而不是直接控制未來的研究,因此序貫分析方法對Meta分析的重要性等同于其對單個研究的重要性。
Brok等 [29]研究表明許多表面上已經明確的Meta分析結論可能是不明確的,他們分析了54篇具有陽性結果的Cochran新生兒方面的Meta分析,發現有39篇(72%)Meta分析沒有達到異質性校正信息量;這39篇Meta分析中,有19篇(49%)Meta分析的結論是不確定的。因此SMA可以較為完善地解決累積Meta分析的弊端,即重復檢驗造成的假陽性結果發生率增大,不僅提供了有效的終止標準,也提供了無效的終止標準。
但是,SMA的方法仍有一些需要解決的問題。TSA雖然發展較為迅速,但該方法估算信息量的方法有多種,有一定的差異,需要根據具體的文獻質量情況進行選擇,此外對相對危險度的估計也有一定的難度,需要研究者有較為深刻的理解才能正確的進行估算。此外,Kulinskaya和Wood指出,TSA僅考慮了研究信息量,而沒有考慮研究數量,并指出TSA在隨機效應Meta分析下的計算具有弊端 [30]。而其他方法由于方法學繁瑣及沒有便捷的操作軟件等因素的影響,導致其難以推廣應用。
我們推薦研究者在制作Meta分析時采用序貫分析的方法,這些方法各有優缺點,研究者可以根據自己掌握的情況進行適當選擇。制作SMA,從一定程度上可以幫助讀者對該Meta分析有一個更為全面的理解。
隨機對照試驗(randomized controlled trial,RCT)的Meta分析被認為是證據的最高級別 [1]。Meta分析采用系統、定量的方法合并多個具有相似性的研究,可增大樣本量,增強統計效能,增加效應量的精確度。但由于系統誤差(偏倚)和隨機誤差(機遇)的影響,Meta分析可能會得出假陽性結果或高估干預措施的效應量。此外,Cochrane協作網要求作者每2年對Meta分析進行更新,而隨著新研究的納入,也增加了檢驗次數,使得隨機誤差增大 [2]。
累積Meta分析常被用來觀察效應量隨特定順序(如發表時間等)變化的趨勢,判斷當前所獲得的證據是否足夠,以及新的同一主題的RCT是否應該進行 [3]。但累積Meta分析的過程未能對重復檢驗進行校正,也不能計算拒絕無效假設的統計檢驗效能。而重復檢驗會增加Ⅰ型錯誤風險 [3]。
序貫Meta分析(sequential meta-analysis,SMA)從整體層面上控制顯著性水平α(一般為0.05),按照時間順序依次納入試驗,將每納入的一次試驗當做一次期中分析(interim analysis)。當前主要的序貫Meta分析方法有:① 丹麥哥本哈根臨床試驗研究中心小組Wetterslev等 [4]提出的試驗序貫分析(trial sequential analysis,TSA);② van der Tweel和Bollen [5]推薦的Whitehead雙三角檢驗SMA;③ Higgins等[6]提出的半貝葉斯法。此外,還有Shuster和Neu [7]提出的Pocock法,該方法主要用于前瞻性分析,因此,本文暫不做討論。這三種主要的方法中,TSA的方法學較為成熟,且哥本哈根臨床試驗研究中心小組為其開發了相應的軟件,本團隊已對該軟件的操作做了相關闡述 [8],因此TSA在Meta分析中的應用最為廣泛;后兩者由于軟件以及方法學等因素,尚未能普及。這些方法各有優缺點,本文主要對這幾種方法做一簡介。
1 序貫Meta分析方法學基礎
1.1 序貫試驗
序貫試驗(sequential trial)又稱序貫分析(sequential analysis),由于該設計可以滿足帶有破壞性和危及安全性的試驗要求,其最初被用于軍火質量檢驗。序貫試驗可分為開放型和閉鎖型,根據目的不同可分為單向和雙向序貫試驗 [9]。圖 1為單向序貫試驗的序貫圖。

1.2 成組序貫試驗
傳統的序貫方法要求受試者逐對進入試驗,并且只有當得到該試驗結果并統計分析后才可確定結束試驗還是繼續下一個試驗 [10]。當得到試驗結果的時間較長時(如數周或數月),這種序貫方法就不適用了。而成組序貫試驗(group sequential analysis)可用于得到試驗結果的時間較長及整個試驗過程中分幾個時間段來重復分析試驗結果的情況。此外,成組序貫試驗不要求受試者必須配對。因此該方法既保留了傳統序貫方法的優點又避免其局限性,且正好與期中分析相配合。
該方法首先由Pocock于1977年提出 [11],在國外的藥物臨床試驗中應用較為廣泛。在這一分析過程中要進行多次重復顯著性檢驗,而這將增加Ⅰ型錯誤風險。因此,為使總的顯著性水平等于α,Pocock [11]提出了名義顯著性水平α',并規定每個階段檢驗的名義顯著性水平α'小于α。O’Brien和Fleming [12]提出在試驗的不同階段取不同的α',在早期應更嚴格,并定義檢驗統計量的方差與累積樣本大小成比例。此外,Slud和Wei [13]也提出了一種基于改進Wilcoxon統計量(漸進高斯分布)的方法。但這些方法都需要提前定義所需時段的次數,也就是分析的次數。Lan和DeMetes [14]于1983年提出了一種更為靈活的離散界值,僅需要提前定義一個單調遞增的α損耗函數α*(t),其公式為:
$\alpha *\left( t \right)=\left\{ \begin{matrix} 0 & \left( t=0 \right) \\ 2\left[ 1-\phi \left\{ {{Z}_{\alpha /2}}/ \right\} \right] & \left( 0\le t\le 1 \right) \\ \end{matrix} \right.$ |
其中是標準正態分布函數,當t=1時,α*(1) =α。
1.3 序貫方法引入累積Meta分析
Pogue和Yusuf [15]于1997年將Lan-DeMetes α損耗函數引入累積Meta分析,用該損耗函數來計算Meta分析的界值,同時提出了最優信息量(optional information size,OIS)的概念。計算OIS需要假設事件發生率和最小干預效果,公式為:
$N=2\times \frac{{{\left( {{Z}_{\alpha }}+{{Z}_{\beta }} \right)}^{2}}\times 2P*\left( 1-P* \right)}{{{\left( {{P}_{C}}-{{P}_{E}} \right)}^{2}}}$ |
其中P*=(PC+PE)/2,PC、PE分別為對照組和試驗組事件發生率,N即為OIS。
2 試驗序貫分析(TSA)
丹麥哥本哈根臨床試驗中心小組將Pogue和Yusuf的方法進行延伸,提出了TSA方法 [16-19],同時提出了期望信息量(required information size,RIS)的概念,并提供了多種用于估算RIS的方法,如累積信息量(accrued information size,AIS)、先驗信息量(a priori information size,APIS)、低偏倚信息量(low-bias information size,LBIS)、低偏倚異質性校正信息量(low-bias heterogeneity-adjusted information size,LBHIS)、差異校正信息量(diversity-adjusted information size,DIS)。關于TSA方法,國內已有學者進行了介紹,本文暫不做相關闡述,有興趣的讀者可參閱王權 [20, 21]、夏蕓 [22]、王歡 [23]等國內學者的相關研究。
當然,除了TSA軟件可以進行TSA界值圖的繪制外,其他軟件也可以,如Stata、Excel、SAS、R等軟件(如圖 2、3)。

(RRR=25%,

(RRR=25%,
3 Whitehead雙三角檢驗SMA
Whitehead雙三角檢驗SMA方法起源于單個原始RCT的研究設計 [24],在單個RCT的序貫分析中,分析的單位是單個病人,不通過α損耗函數來控制顯著性水平。Whitehead等 [25-27]將其引入累積Meta分析,分析單位為每一個RCT,也就是一組病人,采用統計量(Z,V)控制總的顯著性水平,該方法得到van der Tweel和Bollen的推廣 [5]。該方法具有以下特點 [25]:① 無需提前預估總體信息量,設置一組界值即可;② 具有終止無效假設的標準,當然TSA也具有這一特點;③ 可以量化統計效能;④ 點估計和區間估計都可進行多重檢驗校正;⑤ 可增加效率,即無效/有效假設均有接受的標準,可達到倫理學和經濟學上的優化。
在Whitehead雙三角檢驗SMA中,每個RCT具有兩個值:Zi和Vi,Zi不同于TSA中的檢驗統計量。Zi表示累積Meta分析中第i個研究試驗組觀察到的事件發生數與無效假設下試驗組事件期望值的差值,Vi表示表示在無效假設下Zi的方差。數據格式如表 1所示,則相應的Zi和Vi的計算方法為:
$\begin{align} & {{Z}_{i}}={{F}_{Ei}}-{{N}_{Ei}}{{F}_{i}}/{{N}_{i}}=\frac{{{N}_{CI}}{{F}_{Ei}}-{{N}_{Ei}}{{F}_{CI}}}{{{N}_{i}}} \\ & {{V}_{i}}=\frac{{{N}_{Ei}}{{N}_{CI}}{{S}_{i}}{{F}_{i}}}{N_{i}^{2}\left( {{N}_{i}}-1 \right)} \\ \end{align}$ |
根據表 1數據格式,第i個RCT的效應量ORi= PEi(1-PCi)/[PCi(1-PEi)],定義臨床療效θi=ln(ORi)。在進行Whitehead雙三角檢驗SMA分析前估計相關的臨床療效θR(=lnOR)。

Whitehead雙三角檢驗SMA方法的界值圖采用雙三角檢驗方法,由四條線組成,外部上界(U1)、下界(L1)和內部上界(U2)、下界(L2),分別表示為:U1:Z=a+cV;L1:Z=-a-cV;U2:Z=-a+3cV;L2:Z=a-3cV
其中系數a、c由Ⅰ型錯誤α、Ⅱ型錯誤β以及相關臨床效應θR共同決定。當α/2=β時,效應量δR截距a=(2/δR)log(1/α),斜率c=δR/4,坐標定為V=4a/δR、Z=2a;當α/2≠β時,效應量δR=2Uα/2θR/(Uα/2+Uβ)。若將截距a替換為,則這種校正方法被稱為“圣誕樹校正” [28]。
如圖 4所示,縱軸為Z,橫軸為V,綠色線條為U1,藍色線條為U2,紫色線條為L1,紅色線條為L2,若累積的研究坐標(Zi,Vi)超過U1或L1,則拒絕H0,即試驗組干預措施優于對照組干預措施;若超過U2或L2,則接受H0,即試驗組干預措施與對照組干預措施無差異;若沒有超過任何一條界值線,則表明當前的證據尚不足以得出結論,仍需進一步看展相關研究進行驗證。

4 半貝葉斯法
Higgins等 [6]提出了半貝葉斯法,與Whitehead雙三角檢驗SMA方法不同的是,半貝葉斯法基于(Z,V)平面(此方法的Z和V與上述方法不同),采用對稱的Z=±H、V=Vmax邊界以及縱軸作為矩形平面,該方法避免了積分計算。
假設估計效應為yi,真實效應為θi,相應的估計方差為vi,i為納入的研究數(i=1,…,k)。若θi=yi,vi=0,則倒γ先驗分布的異質性方差τ2與未知正態分布的方差共軛,且τ2與的后驗分布也為倒γ分布,那么納入tj(若開始納入研究數為2,則t1=2)個研究間的異質性方差為(其參數為η+(tj/2) 、λ+(tjτj2/2) ),采用DerSimonian-Laird法估計的方差為,則τ2的后驗均數為:
${{{\hat{\tau }}}^{2}}_{AB,j}=\frac{2\lambda +{{t}_{j}}\hat{\tau }_{DL,j}^{2}}{2\eta +{{t}_{j}}-2}=\frac{2\left( \eta -1 \right){{{\hat{\tau }}}^{2}}_{AB,0}+{{t}_{j}}\hat{\tau }_{DL,j}^{2}}{2\left( \eta -1 \right)+{{t}_{j}}}$ |
其中是先驗倒γ分布的均值。則后驗均值可被認為為τ2先驗估計的加權平均數,隨著納入研究數量的增加,先驗信息遞減。在隨機效應模型下,半貝葉斯法的Zj、Vj計算方法如下:
${{Z}_{j}}=\sum\nolimits_{i=1}^{{{t}_{j}}}{W_{AB,i}^{*}}{{Y}_{i}},{{V}_{j}}=\sum\nolimits_{i=1}^{{{t}_{j}}}{W}_{AB,i}^{*}$ |
其中,當納入研究夠多(即yi≈θi,vi=0)時,以及納入研究較少而導致高估τ2(與θi分布相比較,yi估計值的分布過度離散)時,該方法可以得到較好的結果。
5 小結
雖然序貫分析在單個研究中得到了廣泛的應用,但在Meta分析領域的應用仍不廣泛。有學者認為Meta分析不能控制新證據的產生,不能扮演終止標準,因此不能使用序貫方法,而Higgins等 [6]認為Meta分析常用于決策或檢驗某一干預措施當前是否存在最佳可信的證據,此外Meta分析的目的是為了促進合理的建議,而不是直接控制未來的研究,因此序貫分析方法對Meta分析的重要性等同于其對單個研究的重要性。
Brok等 [29]研究表明許多表面上已經明確的Meta分析結論可能是不明確的,他們分析了54篇具有陽性結果的Cochran新生兒方面的Meta分析,發現有39篇(72%)Meta分析沒有達到異質性校正信息量;這39篇Meta分析中,有19篇(49%)Meta分析的結論是不確定的。因此SMA可以較為完善地解決累積Meta分析的弊端,即重復檢驗造成的假陽性結果發生率增大,不僅提供了有效的終止標準,也提供了無效的終止標準。
但是,SMA的方法仍有一些需要解決的問題。TSA雖然發展較為迅速,但該方法估算信息量的方法有多種,有一定的差異,需要根據具體的文獻質量情況進行選擇,此外對相對危險度的估計也有一定的難度,需要研究者有較為深刻的理解才能正確的進行估算。此外,Kulinskaya和Wood指出,TSA僅考慮了研究信息量,而沒有考慮研究數量,并指出TSA在隨機效應Meta分析下的計算具有弊端 [30]。而其他方法由于方法學繁瑣及沒有便捷的操作軟件等因素的影響,導致其難以推廣應用。
我們推薦研究者在制作Meta分析時采用序貫分析的方法,這些方法各有優缺點,研究者可以根據自己掌握的情況進行適當選擇。制作SMA,從一定程度上可以幫助讀者對該Meta分析有一個更為全面的理解。