與傳統Meta分析相比,網狀Meta分析的混雜因素較多且處理更為困難。由于證據相互傳遞,異質性可能會被帶入間接比較中。因此,異質性的有效鑒別與正確處理備受關注。為保證網狀Meta分析結果的可靠性,方法學家提出一致性概念并給出一系列鑒別與處理方法。基于Bucher法的延伸,目前一致性鑒別與處理的方法已擴展至節點分析法、假設檢驗及兩步法等十余種量化措施。然而,由于方法學基本理論與側重點的差異以及統計效能的局限性,使得目前相關檢測與處理方法的力度仍不夠高效。因此,高效、簡潔、解釋度高的檢測與處理方法依舊需要進一步探索。
引用本文: 張超, 鄢金柱, 孫鳳, 劉晴, 郭毅, 曾憲濤. 網狀Meta分析一致性的鑒別與處理方法. 中國循證醫學雜志, 2014, 14(7): 884-888. doi: 10.7507/1672-2531.20140146 復制
在傳統Meta分析制作中,對于異質性的有效鑒別與正確處理將直接影響最終結果的可靠性[1]。相對于傳統Meta分析,網狀Meta分析綜合了多種復雜的措施,使得異質性的鑒別與處理顯得更加困難,因此結果可信度將因無法有效鑒別一致性而受到嚴重影響[1-3]。基于一致性可能產生于異質性的考慮,為進一步保證結果的可靠性,方法學家開始結合網狀Meta分析特點提出了一致性概念并給出一系列鑒別與處理方法。本文對當前鑒別與處理網狀Meta分析一致性的11種方法進行介紹。
1 一致性的概念與分類
在網狀Meta分析中,由于多因素與多干預措施等混雜因素的相互影響,使其結果的精確性與可靠性一直備受質疑。為保障網狀Meta分析證據的精確性與可靠性,方法學家相繼提出了一套鑒定思路,如相似性(similarity)、異質性(heterogeneity)、一致性(consistency)和傳遞性(transitivity)等[3-5]。
在傳統Meta分析中,通常將所有除隨機誤差以外所導致的結果差異稱為異質性,即不相似性。基于此理論,相關學者也將網狀Meta分析中不一致性歸類于異質性的范疇,即異質性會產生不一致性。在網狀Meta分析中,學術界認為各種外界干擾因素均會對直接與間接比較結果產生影響。因此,與傳統Meta分析不同,在網狀Meta分析中一致性是指直接與間接比較結果的相似度[4, 5]。可分為方向或大小一致性,目前主要依據大小的一致性進行鑒定,如Bucher法等;也有學者提出可分為環不一致性與設計不一致性[4, 6-8]。方向不一致性是指直、間接比較反映利益措施不同,為定性分析,常用于目測直、間接比較間方向上的差異;大小不一致性是指直、間接比較的統計學差異,為定量分析,該方法使用最為廣泛;環不一致性是指以多種措施構成“環”為基礎的不一致性檢驗,通常被認為是構成不一致性的基礎;設計不一致性是指已制定參照措施的前提下,基于研究試驗措施不同而產生的不一致性,其時常與“環不一致性”概念存在界限不清,但其組成成分中包含“環不一致性”,常見于“兩步法”。一致性鑒別實質就是分別匯總直接與間接比較結果后進行單一的定性或定量分析,但基于合并推算的理念、方法及統計效能等差異,可能導致結果間存在差異。
一致性的提出為鑒定網狀Meta分析的證據相似性提供了另一種思路,在現有統計學效能下對間接證據可靠性給予了一定保障,也是網狀Meta分析制作流程中必不可少的步驟之一。
2 一致性的鑒別與處理
伴隨著方法學的不斷進展,一致性鑒別的難題也取得了一定突破。目前,一致性鑒別大致可分為客觀與主觀鑒別方法,下文將對這些方法的名稱及其特點進行簡介。
2.1 基本特征比較
在網狀Meta分析中,干預措施及混雜因素多等特點致使納入研究間的相似性或可比性鑒定顯得十分困難。眾所周知,各種混雜因素的盲目合并會導致結果的異質性明顯,其無疑會導致結果間的不一致性,致使結果不真實。
通過對納入研究的基本特征(basic characteristics)進行比較,可以在一定程度上進行異質性的判斷[9, 10]。網狀Meta分析中使用基本特征比較的方法對混雜因素進行比較與傳統Meta分析基本一致。顯然,該方法屬于定性的法,通常給予定性評估。
2.2 治療效應修飾符—協變量
在網狀Meta分析中,各種因素的相互作用時常會發生,這也是在制作網狀Meta分析當中較為棘手的部分之一;同時,這可能導致直間接結果的不一致性。因此,凡是存在明顯干預因素或研究間的相互作用時,均應及時進行校正以換取真實結果。
通常對于干預協變量(covariates)的鑒定與處理,當前已采用亞組分析及多元回歸的方法較為常見[11]。亞組分析與傳統Meta分析是相同的;回歸在傳統Meta分析中類似于簡單回歸,而在網狀Meta分析中則采用的是多元回歸,當前最常用的軟件為R軟件與Stata軟件[1, 12-19]。
2.3 參照措施比較
在網狀Meta分析中,間接比較的基礎就是基于兩種措施間存在共同比較措施,即擁有相同的參照組。因此,參照措施(referent group)的選定,對于間接比較的結果將會產生一定的影響,進而影響到結果一致性[20]。
在參照措施的選定方面,當前通常選擇使用頻次高、相似性好等措施作為參照基線,如安慰劑(placebo)。當沒有安慰劑時,可以根據上述標準結合納入研究的實際情況進行確定,并可考慮更換參照措施并比較更換前后的結果進行判斷。
2.4 節點分析
傳統Meta分析中,當懷疑某個研究占整個研究結果的比重較大時,往往會對其進行剔除以檢驗結果的穩定性;或者采用逐個依次剔除納入研究檢驗結果的穩定性。在網狀Meta分析中,除了剔除大比重研究外,還需依據環臂來進行研究臂的剔除以檢驗結果的穩定性[21, 22],該方法常應用于貝葉斯模型當中,常用軟件為BUGS軟件與ADDIS軟件等[1, 23, 24]。
環臂(loop-arm)是指網狀關系圖中的每一個節點(node),因此該方法亦稱為“節點分析”。
2.5 不一致性模型
在網狀Meta分析制作時,通常采用一致性模型(consistency models),也即假定直接比較與間接比較結果是一致的,但往往該假設不令人滿意。因此,有學者提出使用不一致性模型(inconsistency models)來進行結果的模擬[25, 26]。該模型最大貢獻在于其將不一致性參數引入模型中,從而在理論上避免干預因素對結果的影響。
假設a vs. b與a vs. c為直接比較,那么b vs. c就為間接比較[27],則一致性與不一致性模型的基本理念如下:
一致性模型:dbc=dac-dab;
不一致性模型:dbc=dac-dab + wbc;
其中,wbc為不一致性參數。
該方法當前最常用的軟件為BUGS軟件與ADDIS軟件等[1, 23, 24]。
2.6 假設檢驗
將直接比較結果與間接比較結果進行對比分析是鑒定一致性最直接與最佳的方式。因此,假設檢驗(Hypothesis test)就是從獲取直接比較與間接比較結果間的差異后再依據統計Z值檢驗來驗證其是否具有統計學意義[6, 28]。
假設檢驗的具體操作步驟如下:
(1)計算不一致性效應量與方差:
效應量:ubc=dbc dir + din bcd
方差: var(ubc)=var(dbcdir ) + var(dbc ind)
(2)進行統計檢驗:
Z值檢驗: $ {Z_{bc}}=\frac{{{u_{bc}}}}{{\sqrt {{\mathop{\rm var}} \left({{u_{bc}}} \right)} }}$
上述計算的Z值再經過相應的標準正態分布轉換成對應的p值即可。由于該方法需要獲取最終的直間接結果,因此適合于單一3臂環的研究。
當出現超過3臂環時,對于不一致性的效應量與方差的獲取,則采用以下方式進行:
(1)計算平均效應量:
匯總平均效應量: ${{\bar d}_{bk}}=\frac{{\sum\nolimits_{n=1}^N {\bar d_{bk}^n} /v_{bk}^n}}{{\sum\nolimits_{n=1}^N 1 /v_{bk}^n}}$
公式中N為相應配對證據來源總數,n為證據來源的序號,b和k均為相應治療的下標。該計算公式使用的方法為倒方差分析法。
(2)進行統計檢驗:
卡方檢驗: $ \sum\nolimits_{n=1}^N {{{\left({d_{bk}^n-{{\bar d}_{bk}}} \right)}^2}/} v_{bk}^n$
該公式是以(N-1)為自由度的卡方檢驗來予以鑒定的。
該方法當前最常用的軟件為R軟件[1, 12-17, 24]。
2.7 回測法
為克服上述假設檢驗統計方法中直接與間接比較結果獲取難度的缺陷,現今方法學家轉而從最終的網狀結果與直接比較結果開始予以倒退的方式來實現間接比較結果的獲取,即“回測法(back transformation method)” [29-30]。
回測法的最大優點在于避免了間接比較中過多的中間環節,為操作者提供了極大便利。其具體操作步驟如下:
(1)計算不一致性效應量與方差:
效應量: $ d_{bk}^{ind}=\left({\frac{{d_{bk}^{NMA}}}{{v_{bk}^{NMA}}}-\frac{{d_{bk}^{dir}}}{{d_{bk}^{dir}}}} \right) \times v_{bk}^{ind}$
方差:vbk ind=1 / (1 / vbk NMA-1 / vbk dir)
公式中b與k下標分別為相應的干預措施;d為相應的效應量;v為相應的方差;dir、ind及NMA上標分別表示直接、間接及網狀結果所對應的效應量與方差。
(2)進行統計檢驗:
該部分與2.6中單一環(3臂環)的統計分析一致。
該方法當前最常用的軟件為R軟件[1, 12-17, 24]。
2.8 多維測量法
多維測量法(multidimensional scaling)的主要思路是利用將網狀Meta分析最終各節點的結果依次在圖形中進行展示,再通過觀察配對兩節點的距離與相應間接比較節點間距離來進行相應檢驗[31]。
該方法配對比較部分使用倒方差法進行,擬合值采用加權最小二乘法進行優化運算。具體如下:
(1)計算配對節點距離:
配對節點間效應量: ${{\bar d}_{ij}}=\frac{{\sum\nolimits_{k \in {k_{ij}}} {{d_{ij, k}}/\sigma _{ij, k}^2} }}{{\sum\nolimits_{k \in {k_{ij}}} {1/\sigma _{ij, k}^2} }}$
配對節點間距離: $\left| {{{\bar d}_{ij}}} \right|$
(2)直接與間接比較節點差異:
$\begin{array}{*{20}{c}} {\sum {{w_{ij}}} }\\ {i \ne j,{n_{ij}} > 0} \end{array}{\left( {d_{ij}^* - {d_{ij}}} \right)^2}$ |
(3)擬合節點定位:
$\begin{array}{*{20}{c}} {\sum {{w_{ij}}} }\\ {i \ne j,{n_{ij}} > 0} \end{array}{\left( {\sqrt {{{\left( {{x_i} - {x_j}} \right)}^2} + {{\left( {{y_i} - {y_j}} \right)}^2}} - {d_{ij}}} \right)^2}$ |
在完成上述節點的相關計算后,基于參考節點固定于認為定義“原點”并依據直接比較與直-間接間的差異,通過計算優化模擬采用應力函數并最終形成一個2維空間圖形,使得直-間接比較的所有干預措施都在于統一平面上。若直接-間接平面近似于同一平面,可視直間接比較具有一致性;反之亦然。
該方法當前最常用的軟件為R軟件或其他制圖軟件[1, 12-17, 24]。
2.9 兩步法
兩步法(two-stage approach)的基本步驟分為配對比較與網狀分析,其中網狀分析采用最小二乘法擬合[25, 32]。
在一致性檢驗的部分,兩步法可以提供兩種檢驗方式,分別為似然比檢驗(likelihood ratio test)與殘差檢驗(residual test)。
2.9.1 似然比檢驗
該檢驗通常默認基于一致性模型進行擬合,其統計測試是依據“H-T+1”為自由度的卡方檢驗來進行的,具體如下:
$\hat d_0^T\left( {W - WX{{\left( {{X^T}WX} \right)}^{ - 1}}{X^T}W} \right){d_0}$ |
該方法中H為矩陣長度,T為干預措施數量,為采用最小二乘法擬合之后的效應量矩陣,W為方差-協方差矩陣,X為設計后一致性方程矩陣。
2.9.2 殘差檢驗
殘差檢驗就是計算擬合直接比較結果與網狀結果之間的偏差基于正態假設性檢驗來分析一致性概況。具體如下:
${R^*} = \frac{{\hat d_0^T - {X^T}{{\left( {{X^T}WX} \right)}^{ - 1}}{X^T}W}}{{{{\left( {{W^{ - 1/2}}\left( {1 - {W^{1/2}}X{{\left( {{X^T}WX} \right)}^{ - 1}}{X^T}{W^{ - 1/2}}} \right){W^{ - 1/2}}} \right)}^{ - 1/2}}}}$ |
若R*在(-1.96,196)之間視為一致性好,否則視為非一致性。
2.10 圖形理論法
圖形理論法(graph-theoretical method)使用的是電網的基本原理,將電力學基本知識融入到網狀Meta分析中[33]。該方法將效應量對應電壓、效應量權重對應電流、方差對應電阻等。其中,一致性的檢驗使用卡方檢驗的Q統計來進行鑒定,具體操作可參考《R軟件netmeta程序包在網狀Meta分析中的運用》一文[17]。
2.11 析因方差分析法
析因方差分析法(Factorial analysis-of-variance methods)[34]是基于方差分析的基本原理,在網狀Meta分析中考慮每一個處理因素對試驗效應的主效應或者對兩個和更多處理因素的相互作用進行分析的一種方法。該法可方便地檢測和定位網狀Meta分析中的不一致性。
(1)兩步方差分析模型:
S×T=S+T+S.T,(G/S)×T=G+G.S+T+G.T+G.S.T。
在網狀Meta分析中G為試驗組、試驗類型及設計類型,S為研究和試驗,T為治療方法。上式中S×T是某一種治療方法在某一個試驗中的預期值,S是在其試驗中的主效應值,T是某種治療方法的主效應值,S.T是不同試驗不一致性的模型。第一步反映了試驗嵌套在設計之中。第二步是第一步方差分析模型的延伸。然后使用Wald檢驗和卡方檢驗來反應不一致性,即第一步中的S.T,第二步中的G.S.T。
(2)不一致性來源的定位:
在此兩步分析方差模型中引入新的變量D,D1即為第一個試驗的一個新變量,至此D1和G就有了層次關系,G就嵌套在D1中,評估不一致性的模型即可表達為:
$\left( {\frac{{{D_1}}}{G}} \right) \cdot T = {D_{1 \cdot }}T + {D_{1 \cdot }}G \cdot T$ |
兩邊同時變形,應用Wilkinson和Payne語法和嵌套[35]進去的因子D1、G和S,完整的模型如下:
$\left( {\frac{{{D_1}}}{{\frac{G}{S}}}} \right) \times T = {D_1} + {D_{1 \cdot }}G + {D_{1 \cdot }}G \cdot S + T + {D_{1 \cdot }}T + {D_{1 \cdot }}G \cdot T + {D_{1 \cdot }}G \cdot S.T$ |
同理,不同的試驗設計,D的下標就不同。用固定效應模型和隨機效應模型計算出D1.G.S.T值,同時將其進行Wald檢驗和卡方檢驗。若Wald檢驗值越大,對應卡方檢驗值越小,則提示該研究存在明顯不一致性;反之,則提示一致性較好。
該方法用SAS [36]、R [1, 12-17, 24]和Stata [18]軟件中的線性混合模型即可很容易地完成。
3 結語
網狀Meta分析從最初萌芽[2]至今,已有十幾年歷程,方法學上眾多難點也已有不同程度的突破。一致性的檢驗,對于保證網狀Meta分析結論的可靠性起著關鍵性作用。當然,在一致性檢驗與處理方面卻仍有待完善。
當前認為,混雜因素是導致異質性產生的重要因素之一。不一致性的主要來源與異質性來源基本相似。因此,相關研究者將一致性歸類于異質性,甚者認為:異質性似于“原因”,一致性似于“結果”,故在統計方法學上,時常無法嚴格區分兩者界限。這也使得無論是對其進行鑒別還是處理,乃至最終結果的解釋都較為困難。
本文對當前建議的11種鑒別一致性的方法進行了介紹,可以看出,任何一種方法均有其局限性;換句話說,當前尚無一種最完善的方法出現。然而,有效鑒別及處理混雜因素是保證網狀Meta分析證據可靠性的重要環節。因此,建議網狀Meta分析制作者在制作網狀Meta分析時考慮選擇一種或兩種方法來鑒別及處理異質性。這樣既可為后續開展異質性鑒別方法的研究打下基礎,還可以為當前該方面提供最佳證據。正如循證醫學所強調證據為“當前最佳” [37],使用當前已有的方法是需要的。
在傳統Meta分析制作中,對于異質性的有效鑒別與正確處理將直接影響最終結果的可靠性[1]。相對于傳統Meta分析,網狀Meta分析綜合了多種復雜的措施,使得異質性的鑒別與處理顯得更加困難,因此結果可信度將因無法有效鑒別一致性而受到嚴重影響[1-3]。基于一致性可能產生于異質性的考慮,為進一步保證結果的可靠性,方法學家開始結合網狀Meta分析特點提出了一致性概念并給出一系列鑒別與處理方法。本文對當前鑒別與處理網狀Meta分析一致性的11種方法進行介紹。
1 一致性的概念與分類
在網狀Meta分析中,由于多因素與多干預措施等混雜因素的相互影響,使其結果的精確性與可靠性一直備受質疑。為保障網狀Meta分析證據的精確性與可靠性,方法學家相繼提出了一套鑒定思路,如相似性(similarity)、異質性(heterogeneity)、一致性(consistency)和傳遞性(transitivity)等[3-5]。
在傳統Meta分析中,通常將所有除隨機誤差以外所導致的結果差異稱為異質性,即不相似性。基于此理論,相關學者也將網狀Meta分析中不一致性歸類于異質性的范疇,即異質性會產生不一致性。在網狀Meta分析中,學術界認為各種外界干擾因素均會對直接與間接比較結果產生影響。因此,與傳統Meta分析不同,在網狀Meta分析中一致性是指直接與間接比較結果的相似度[4, 5]。可分為方向或大小一致性,目前主要依據大小的一致性進行鑒定,如Bucher法等;也有學者提出可分為環不一致性與設計不一致性[4, 6-8]。方向不一致性是指直、間接比較反映利益措施不同,為定性分析,常用于目測直、間接比較間方向上的差異;大小不一致性是指直、間接比較的統計學差異,為定量分析,該方法使用最為廣泛;環不一致性是指以多種措施構成“環”為基礎的不一致性檢驗,通常被認為是構成不一致性的基礎;設計不一致性是指已制定參照措施的前提下,基于研究試驗措施不同而產生的不一致性,其時常與“環不一致性”概念存在界限不清,但其組成成分中包含“環不一致性”,常見于“兩步法”。一致性鑒別實質就是分別匯總直接與間接比較結果后進行單一的定性或定量分析,但基于合并推算的理念、方法及統計效能等差異,可能導致結果間存在差異。
一致性的提出為鑒定網狀Meta分析的證據相似性提供了另一種思路,在現有統計學效能下對間接證據可靠性給予了一定保障,也是網狀Meta分析制作流程中必不可少的步驟之一。
2 一致性的鑒別與處理
伴隨著方法學的不斷進展,一致性鑒別的難題也取得了一定突破。目前,一致性鑒別大致可分為客觀與主觀鑒別方法,下文將對這些方法的名稱及其特點進行簡介。
2.1 基本特征比較
在網狀Meta分析中,干預措施及混雜因素多等特點致使納入研究間的相似性或可比性鑒定顯得十分困難。眾所周知,各種混雜因素的盲目合并會導致結果的異質性明顯,其無疑會導致結果間的不一致性,致使結果不真實。
通過對納入研究的基本特征(basic characteristics)進行比較,可以在一定程度上進行異質性的判斷[9, 10]。網狀Meta分析中使用基本特征比較的方法對混雜因素進行比較與傳統Meta分析基本一致。顯然,該方法屬于定性的法,通常給予定性評估。
2.2 治療效應修飾符—協變量
在網狀Meta分析中,各種因素的相互作用時常會發生,這也是在制作網狀Meta分析當中較為棘手的部分之一;同時,這可能導致直間接結果的不一致性。因此,凡是存在明顯干預因素或研究間的相互作用時,均應及時進行校正以換取真實結果。
通常對于干預協變量(covariates)的鑒定與處理,當前已采用亞組分析及多元回歸的方法較為常見[11]。亞組分析與傳統Meta分析是相同的;回歸在傳統Meta分析中類似于簡單回歸,而在網狀Meta分析中則采用的是多元回歸,當前最常用的軟件為R軟件與Stata軟件[1, 12-19]。
2.3 參照措施比較
在網狀Meta分析中,間接比較的基礎就是基于兩種措施間存在共同比較措施,即擁有相同的參照組。因此,參照措施(referent group)的選定,對于間接比較的結果將會產生一定的影響,進而影響到結果一致性[20]。
在參照措施的選定方面,當前通常選擇使用頻次高、相似性好等措施作為參照基線,如安慰劑(placebo)。當沒有安慰劑時,可以根據上述標準結合納入研究的實際情況進行確定,并可考慮更換參照措施并比較更換前后的結果進行判斷。
2.4 節點分析
傳統Meta分析中,當懷疑某個研究占整個研究結果的比重較大時,往往會對其進行剔除以檢驗結果的穩定性;或者采用逐個依次剔除納入研究檢驗結果的穩定性。在網狀Meta分析中,除了剔除大比重研究外,還需依據環臂來進行研究臂的剔除以檢驗結果的穩定性[21, 22],該方法常應用于貝葉斯模型當中,常用軟件為BUGS軟件與ADDIS軟件等[1, 23, 24]。
環臂(loop-arm)是指網狀關系圖中的每一個節點(node),因此該方法亦稱為“節點分析”。
2.5 不一致性模型
在網狀Meta分析制作時,通常采用一致性模型(consistency models),也即假定直接比較與間接比較結果是一致的,但往往該假設不令人滿意。因此,有學者提出使用不一致性模型(inconsistency models)來進行結果的模擬[25, 26]。該模型最大貢獻在于其將不一致性參數引入模型中,從而在理論上避免干預因素對結果的影響。
假設a vs. b與a vs. c為直接比較,那么b vs. c就為間接比較[27],則一致性與不一致性模型的基本理念如下:
一致性模型:dbc=dac-dab;
不一致性模型:dbc=dac-dab + wbc;
其中,wbc為不一致性參數。
該方法當前最常用的軟件為BUGS軟件與ADDIS軟件等[1, 23, 24]。
2.6 假設檢驗
將直接比較結果與間接比較結果進行對比分析是鑒定一致性最直接與最佳的方式。因此,假設檢驗(Hypothesis test)就是從獲取直接比較與間接比較結果間的差異后再依據統計Z值檢驗來驗證其是否具有統計學意義[6, 28]。
假設檢驗的具體操作步驟如下:
(1)計算不一致性效應量與方差:
效應量:ubc=dbc dir + din bcd
方差: var(ubc)=var(dbcdir ) + var(dbc ind)
(2)進行統計檢驗:
Z值檢驗: $ {Z_{bc}}=\frac{{{u_{bc}}}}{{\sqrt {{\mathop{\rm var}} \left({{u_{bc}}} \right)} }}$
上述計算的Z值再經過相應的標準正態分布轉換成對應的p值即可。由于該方法需要獲取最終的直間接結果,因此適合于單一3臂環的研究。
當出現超過3臂環時,對于不一致性的效應量與方差的獲取,則采用以下方式進行:
(1)計算平均效應量:
匯總平均效應量: ${{\bar d}_{bk}}=\frac{{\sum\nolimits_{n=1}^N {\bar d_{bk}^n} /v_{bk}^n}}{{\sum\nolimits_{n=1}^N 1 /v_{bk}^n}}$
公式中N為相應配對證據來源總數,n為證據來源的序號,b和k均為相應治療的下標。該計算公式使用的方法為倒方差分析法。
(2)進行統計檢驗:
卡方檢驗: $ \sum\nolimits_{n=1}^N {{{\left({d_{bk}^n-{{\bar d}_{bk}}} \right)}^2}/} v_{bk}^n$
該公式是以(N-1)為自由度的卡方檢驗來予以鑒定的。
該方法當前最常用的軟件為R軟件[1, 12-17, 24]。
2.7 回測法
為克服上述假設檢驗統計方法中直接與間接比較結果獲取難度的缺陷,現今方法學家轉而從最終的網狀結果與直接比較結果開始予以倒退的方式來實現間接比較結果的獲取,即“回測法(back transformation method)” [29-30]。
回測法的最大優點在于避免了間接比較中過多的中間環節,為操作者提供了極大便利。其具體操作步驟如下:
(1)計算不一致性效應量與方差:
效應量: $ d_{bk}^{ind}=\left({\frac{{d_{bk}^{NMA}}}{{v_{bk}^{NMA}}}-\frac{{d_{bk}^{dir}}}{{d_{bk}^{dir}}}} \right) \times v_{bk}^{ind}$
方差:vbk ind=1 / (1 / vbk NMA-1 / vbk dir)
公式中b與k下標分別為相應的干預措施;d為相應的效應量;v為相應的方差;dir、ind及NMA上標分別表示直接、間接及網狀結果所對應的效應量與方差。
(2)進行統計檢驗:
該部分與2.6中單一環(3臂環)的統計分析一致。
該方法當前最常用的軟件為R軟件[1, 12-17, 24]。
2.8 多維測量法
多維測量法(multidimensional scaling)的主要思路是利用將網狀Meta分析最終各節點的結果依次在圖形中進行展示,再通過觀察配對兩節點的距離與相應間接比較節點間距離來進行相應檢驗[31]。
該方法配對比較部分使用倒方差法進行,擬合值采用加權最小二乘法進行優化運算。具體如下:
(1)計算配對節點距離:
配對節點間效應量: ${{\bar d}_{ij}}=\frac{{\sum\nolimits_{k \in {k_{ij}}} {{d_{ij, k}}/\sigma _{ij, k}^2} }}{{\sum\nolimits_{k \in {k_{ij}}} {1/\sigma _{ij, k}^2} }}$
配對節點間距離: $\left| {{{\bar d}_{ij}}} \right|$
(2)直接與間接比較節點差異:
$\begin{array}{*{20}{c}} {\sum {{w_{ij}}} }\\ {i \ne j,{n_{ij}} > 0} \end{array}{\left( {d_{ij}^* - {d_{ij}}} \right)^2}$ |
(3)擬合節點定位:
$\begin{array}{*{20}{c}} {\sum {{w_{ij}}} }\\ {i \ne j,{n_{ij}} > 0} \end{array}{\left( {\sqrt {{{\left( {{x_i} - {x_j}} \right)}^2} + {{\left( {{y_i} - {y_j}} \right)}^2}} - {d_{ij}}} \right)^2}$ |
在完成上述節點的相關計算后,基于參考節點固定于認為定義“原點”并依據直接比較與直-間接間的差異,通過計算優化模擬采用應力函數并最終形成一個2維空間圖形,使得直-間接比較的所有干預措施都在于統一平面上。若直接-間接平面近似于同一平面,可視直間接比較具有一致性;反之亦然。
該方法當前最常用的軟件為R軟件或其他制圖軟件[1, 12-17, 24]。
2.9 兩步法
兩步法(two-stage approach)的基本步驟分為配對比較與網狀分析,其中網狀分析采用最小二乘法擬合[25, 32]。
在一致性檢驗的部分,兩步法可以提供兩種檢驗方式,分別為似然比檢驗(likelihood ratio test)與殘差檢驗(residual test)。
2.9.1 似然比檢驗
該檢驗通常默認基于一致性模型進行擬合,其統計測試是依據“H-T+1”為自由度的卡方檢驗來進行的,具體如下:
$\hat d_0^T\left( {W - WX{{\left( {{X^T}WX} \right)}^{ - 1}}{X^T}W} \right){d_0}$ |
該方法中H為矩陣長度,T為干預措施數量,為采用最小二乘法擬合之后的效應量矩陣,W為方差-協方差矩陣,X為設計后一致性方程矩陣。
2.9.2 殘差檢驗
殘差檢驗就是計算擬合直接比較結果與網狀結果之間的偏差基于正態假設性檢驗來分析一致性概況。具體如下:
${R^*} = \frac{{\hat d_0^T - {X^T}{{\left( {{X^T}WX} \right)}^{ - 1}}{X^T}W}}{{{{\left( {{W^{ - 1/2}}\left( {1 - {W^{1/2}}X{{\left( {{X^T}WX} \right)}^{ - 1}}{X^T}{W^{ - 1/2}}} \right){W^{ - 1/2}}} \right)}^{ - 1/2}}}}$ |
若R*在(-1.96,196)之間視為一致性好,否則視為非一致性。
2.10 圖形理論法
圖形理論法(graph-theoretical method)使用的是電網的基本原理,將電力學基本知識融入到網狀Meta分析中[33]。該方法將效應量對應電壓、效應量權重對應電流、方差對應電阻等。其中,一致性的檢驗使用卡方檢驗的Q統計來進行鑒定,具體操作可參考《R軟件netmeta程序包在網狀Meta分析中的運用》一文[17]。
2.11 析因方差分析法
析因方差分析法(Factorial analysis-of-variance methods)[34]是基于方差分析的基本原理,在網狀Meta分析中考慮每一個處理因素對試驗效應的主效應或者對兩個和更多處理因素的相互作用進行分析的一種方法。該法可方便地檢測和定位網狀Meta分析中的不一致性。
(1)兩步方差分析模型:
S×T=S+T+S.T,(G/S)×T=G+G.S+T+G.T+G.S.T。
在網狀Meta分析中G為試驗組、試驗類型及設計類型,S為研究和試驗,T為治療方法。上式中S×T是某一種治療方法在某一個試驗中的預期值,S是在其試驗中的主效應值,T是某種治療方法的主效應值,S.T是不同試驗不一致性的模型。第一步反映了試驗嵌套在設計之中。第二步是第一步方差分析模型的延伸。然后使用Wald檢驗和卡方檢驗來反應不一致性,即第一步中的S.T,第二步中的G.S.T。
(2)不一致性來源的定位:
在此兩步分析方差模型中引入新的變量D,D1即為第一個試驗的一個新變量,至此D1和G就有了層次關系,G就嵌套在D1中,評估不一致性的模型即可表達為:
$\left( {\frac{{{D_1}}}{G}} \right) \cdot T = {D_{1 \cdot }}T + {D_{1 \cdot }}G \cdot T$ |
兩邊同時變形,應用Wilkinson和Payne語法和嵌套[35]進去的因子D1、G和S,完整的模型如下:
$\left( {\frac{{{D_1}}}{{\frac{G}{S}}}} \right) \times T = {D_1} + {D_{1 \cdot }}G + {D_{1 \cdot }}G \cdot S + T + {D_{1 \cdot }}T + {D_{1 \cdot }}G \cdot T + {D_{1 \cdot }}G \cdot S.T$ |
同理,不同的試驗設計,D的下標就不同。用固定效應模型和隨機效應模型計算出D1.G.S.T值,同時將其進行Wald檢驗和卡方檢驗。若Wald檢驗值越大,對應卡方檢驗值越小,則提示該研究存在明顯不一致性;反之,則提示一致性較好。
該方法用SAS [36]、R [1, 12-17, 24]和Stata [18]軟件中的線性混合模型即可很容易地完成。
3 結語
網狀Meta分析從最初萌芽[2]至今,已有十幾年歷程,方法學上眾多難點也已有不同程度的突破。一致性的檢驗,對于保證網狀Meta分析結論的可靠性起著關鍵性作用。當然,在一致性檢驗與處理方面卻仍有待完善。
當前認為,混雜因素是導致異質性產生的重要因素之一。不一致性的主要來源與異質性來源基本相似。因此,相關研究者將一致性歸類于異質性,甚者認為:異質性似于“原因”,一致性似于“結果”,故在統計方法學上,時常無法嚴格區分兩者界限。這也使得無論是對其進行鑒別還是處理,乃至最終結果的解釋都較為困難。
本文對當前建議的11種鑒別一致性的方法進行了介紹,可以看出,任何一種方法均有其局限性;換句話說,當前尚無一種最完善的方法出現。然而,有效鑒別及處理混雜因素是保證網狀Meta分析證據可靠性的重要環節。因此,建議網狀Meta分析制作者在制作網狀Meta分析時考慮選擇一種或兩種方法來鑒別及處理異質性。這樣既可為后續開展異質性鑒別方法的研究打下基礎,還可以為當前該方面提供最佳證據。正如循證醫學所強調證據為“當前最佳” [37],使用當前已有的方法是需要的。