在頭對頭直接比較證據缺乏的情況下,采用間接比較(ITC)與網狀Meta分析對多種干預措施進行比較是近年興起的一種統計學方法。迄今為止,其理論體系仍在完善之中。本文主要從基本概念、方法假設、有效性影響因素以及分析軟件等方面對其發展動態進行簡要介紹與總結,以幫助研究者更好地理解該方法,并推動其在證據生產中的使用。
引用本文: 劉國偉, 于莉莉, 賈洪霞, 顧欣. 系統評價中的間接比較與網狀Meta分析方法研究進展. 中國循證醫學雜志, 2014, 14(10): 1276-1280. doi: 10.7507/1672-2531.20140205 復制
多年來,基于嚴格設計的隨機對照試驗(RCT)直接比較(direct comparison)或稱為頭對頭比較(head to head comparison)的系統評價被公認為評價干預措施療效的最佳方法,其所采用的針對兩組研究結果比較的定量合成方法即是傳統的Meta分析方法[1, 2]。其通過對多個直接比較研究的合并,獲得一個綜合的估計結果,可以克服單個小樣本研究的缺陷,提高統計檢驗效能,尤其是當各研究結果不一致時,Meta分析有助于判斷一種干預措施的利弊。此外,若要開展兩種干預措施效果比較(A vs. B)的Meta分析,但未找到A vs. B直接比較的RCT,而有A vs. C與B vs. C比較的RCT,此時若將C作為共同對照,借助A vs. C與B vs. C的比較結果,間接得到A vs. B的效果,稱之為間接比較(indirect comparison,ITC)[3]。
在具體臨床實踐中,臨床醫生或決策者通常需要對多種干預措施進行比較,證據網絡中既有頭對頭比較的直接證據,也有間接比較的證據,這種將直接證據與間接證據合并進行分析的方法稱之為網狀Meta分析(network meta-analysis)[4]。
迄今為止,國內外關于Meta分析方法的研究已有超過30年的歷史[5]。ITC與網狀Meta分析,作為一門新興的、用于循證醫學的統計學方法,近年來逐漸受到臨床研究者、流行病學家、藥學家以及統計學家的關注與青睞[6, 7],國內也有部分學者開始致力于該方法的理論與應用研究[8-16]。以下,我們將從間接比較與網狀Meta分析的處理網絡模型、三個基本假設、內部有效性與外部有效性影響因素、分析軟件等幾方面對其研究現狀及發展動態作簡要概括。
1 ITC與網狀Meta分析的處理網絡模型
在臨床決策實踐中,ITC與網狀Meta分析的應用雖不及傳統Meta分析方法廣泛,但其應用的案例數量及證據網絡的復雜程度不斷增加(圖 1、圖 2)。


以上兩圖顯示了一個漸進復雜的ITC與網狀Meta分析的證據網絡:
(1)每個圓圈及其中的字母代表一種干預措施;
(2)連接兩個圓圈之間的線條代表一個或多個RCT;
(3)圓圈之間無線條連接代表無直接比較的RCT。
圖 1和圖 2中所示的證據網絡均來自于已發表的ITC與網狀Meta分析的研究實例[17-20]。以圖 1(i)與圖 2(i)為例,同樣包括A、B、C三種處理,不同的是圖 1(i)中沒有B vs. C頭對頭直接比較的RCT,而圖 2(i)中B vs. C既有直接證據又有間接證據。
羅列的模型最多僅包含了7種處理,而在實際的臨床研究中常常見到包括十幾種甚至幾十種干預措施的比較[21],且一些研究中不僅包含兩臂RCT,還包含三臂或多臂RCT。這不但增加了統計分析模型的復雜性,更增加了偏倚風險,對于此種類型的ITC或網狀Meta分析結果,如何評價其有效性尚待進一步研究。
2 三個基本假設[3 ]
ITC與網狀Meta分析涉及三個基本假設:①同質性假設;②相似性假設;③一致性假設。當傳統Meta分析合并相同的處理比較時(如所有RCT均是A vs. B的比較),其往往基于一個假設,既研究結果間的同質性假設。這是因為每一個RCT中A與B之間的隨機化并不意味著所有RCT的隨機化。因此,每一個RCT因為研究本身特征與受試者特征的不同而不同。如果這些特征又恰巧是影響A與B效應的混雜因素,則研究被認為是異質的。
ITC與網狀Meta分析中的RCT包含多種處理比較的類型。例如,在ITC中,如果A vs. B試驗與A vs. C試驗在效應影響因素方面具有相似性,C與B的相對處理效應dBC才可以通過B與A的效應估計dAB與C與A的效應估計dAC得到:dBC=dAC-dAB。這稱為ITC中的相似性假設。當網狀Meta分析對直接比較與間接比較的證據進行合并時,非常重要的一點是間接比較沒有偏倚,且直接比較與間接比較無差別,這就是所謂的直接比較與間接比較的一致性假設。
由此可見,同質性假設是基于同一種處理比較類型的不同研究間,相似性假設是指不同的處理比較類型之間,而一致性假設是基于直接比較與間接比較之間。圖 3、圖 4更加直觀的表達了相似性假設與一致性假設。
在傳統Meta分析中,習慣通過95%CI的重合程度、I2大小與異質性檢驗來識別同一種類型比較的不同研究結果間的異質性大小。如果存在異質性,一般采用隨機效應模型對效應量進行合并或作亞組分析。而在ITC與網狀Meta分析中,三個假設的關系變得更加復雜,相似性與一致性已經不能借助統計學檢驗的統計顯著性與否簡單排除,更需綜合考慮流行病學專家及臨床專家的意見。此外,即使傳統Meta分析中研究結果間存在非常大的異質性,而相似性假設與一致性假設也可能成立;換句話說,即使相似性假設與一致性假設均不成立,而傳統Meta分析中的各個研究結果間也未必一定存在異質性。關于這一點,下文中的圖 5、圖 6中將會有更加直觀的表述,在此不再贅述。


3 內部有效性與外部有效性
ITC與網狀Meta分析的內部有效性是指其結果的真實性以及在分析中對偏倚的解釋。內部有效性一般與三方面因素有關:①對證據網絡中研究的正確識別;②單個RCT的研究質量;③導致違背相似性與一致性假設的混雜偏倚的程度。而研究的外部有效性本質上受證據網絡中RCT外部有效性所限,主要是指ITC與網狀Meta分析的結果能夠推論的范圍。國內外文獻中對于有效性的討論大多是指的內部有效性。
所謂效應影響因素[2, 4]是指研究本身或受試者與處理效應有關的某些特征。因為ITC與網狀Meta分析包括多個不同處理比較類型的不同試驗,效應影響因素的分布不僅存在于某個特定的比較中(如傳統兩處理比較的Meta分析,稱為異質性),還存在于不同比較類型之間(稱為非相似性或非一致性)。ITC與網狀Meta分析中處理效應變異的來源主要有三種:①真實的研究內部的處理效應變異;②某個特定的處理比較類型中,真實的研究間的處理效應變異;③真實的比較間的處理效應變異。效應影響因素分布不均衡,ITC與網狀Meta分析的結果就會出現偏倚,從而影響其結果的有效性。反之,ITC與網狀Meta分析則會與傳統的兩處理比較的Meta分析一樣有效。圖 5、圖 6分別直觀呈現了ITC結果無偏與有偏的兩種情況。
上圖中,AB(i)、AC(i)分別代表A vs. B試驗與A vs. C試驗各研究無異質性存在,因為效應影響因素即疾病嚴重程度的比例在各研究間相同;AB(ii)、AC(ii)分別代表A vs. B試驗與A vs. C試驗各研究有異質性存在,因為效應影響因素疾病嚴重程度的比例在各研究間不同;但基于A vs. B試驗與A vs. C試驗ITC與網狀Meta分析的結果是無偏的,因為無論研究間是否存在異質性,A vs. B試驗與A vs. C試驗的效應影響因素分布相同,具有相似性。
與圖 5中相似,AB(i)、AC(i)分別代表A vs. B試驗與A vs. C試驗各研究結果間無異質性存在,AB(ii)、AC(ii)分別代表A vs. B試驗與A vs. C試驗各研究有異質性存在。但基于A vs. B試驗與A vs. C試驗ITC與網狀Meta分析的結果卻是有偏的,因為無論研究結果間是否存在異質性,A vs. B試驗與A vs. C試驗的效應影響因素分布不同,不具有相似性。
由此可見,效應影響因素在直接比較的研究間分布不均衡,間接比較的結果有可能是無偏倚的;反之,效應影響因素在直接比較的研究間分布均衡,間接比較的結果依然有可能是有偏倚的。相對于傳統Meta分析,效應影響因素作用的識別以及偏倚風險的評估在ITC與網狀Meta分析中更具挑戰性。傳統的兩處理Meta分析僅有一個合并效應估計,而在ITC與網狀Meta分析中不只一個效應估計。因此,當任何一個獨立的研究存在偏倚,在傳統Meta分析中可能僅影響一個合并效應,而對于ITC與網狀Meta分析,則會影響到多個的合并效應估計。ITC與網狀Meta分析的偏倚風險是否一定大于傳統Meta分析?間接比較能否清洗掉某種在頭對頭Meta分析中也無法識別的偏倚?網狀Meta分析能否為識別與調整納入研究的偏倚提供一種潛在的方法?這些問題依然是未來方法學研究的重點,也是評價ITC與網狀Meta分析有效性必須面對和慎重考慮的問題。
4 統計分析模型與分析軟件
對于ITC與網狀Meta分析,目前最常用的統計分析方法為頻數法(又稱Bucher’s方法)與Bayesian方法[22, 23]。
4.1 頻數法間接比較模型(AITC)
基于頻數的方法又稱為Bucher’s方法,假定處理A與B的比較結果為dAB,處理A與C的比較結果為dAC,處理A作為一個共同對照,調整的處理B與C間接比較的結果為:
$d_{BC}^{Ind} = {d_{AB}} - {d_{AC}}$ |
其方差為
$Var\left( {d_{BC}^{Ind}} \right) = Var\left( {{d_{AB}}} \right) + Var\left( {{d_{AC}}} \right)$ |
當處理A vs. B與處理A vs. C的比較存在多個試驗時,利用傳統Meta分析的固定效應或隨機效應模型先將其結果進行合并,然后將dAB與dAC的合并估計值代入AITC模型中。
4.2 頻數法網狀Meta分析模型(CFMTC)
在頻數法的網狀Meta分析模型中,可以將AITC模型中間接比較的結果與直接比較的結果進行合并,并利用相應的方差倒數進行加權。
4.3 Bayesian網狀Meta分析模型(CBMTC)
假定有幾個處理(A、B、C、D等)在一個證據網絡中被比較,首先需要選擇一個處理(如處理A)作為參照處理,在每一個研究中,也需要擬定一個處理作為基本處理(如B),下面即為基于一致性假設的Bayesian方法的網狀Meta分析模型:
${\theta _{kt}} = \left\{ \begin{array}{l} {\mu _{kb}}\;\;\;\;\;\;\;\;\;\;\;\;\;\;b = A,B,C,D \ldots \ldots ift = b\\ {\mu _{kb}} + {\delta _{kbt}}\;\;\;\;\;\;t = B,C,D \ldots \ldots ift在b之后 \end{array} \right.$ |
$\begin{array}{l} {\delta _{kbt}} \sim N\left( {{d_{bt}},{\tau ^2}} \right)\\ {d_{bt}} = {d_{At}} - {d_{Ab}}\;\;\;{d_{AA}} = 0 \end{array}$ |
θkt為處理t在第k個研究中的結果,θbt為處理b在第k個研究中的結果,而δkbt是處理t與b在第k個研究中相比較的相對效應。δkbt假定服從均數為dbt,方差為τ2的正態分布。
以上介紹的AITC、CFMTC及CBMTC三個模型均是在假定一致性假設成立的基礎上,即假定來自于處理B與C直接比較的結果等同于建立在共同比較A基礎上的處理B與C間接比較的結果。考慮到一致性假設可能不成立的情況,也有研究者提出一些隨機的非一致性模型或對一致性進行統計學檢驗的方法。此外,很多情況下,ITC與網狀Meta分析經常包含一些三臂或多臂的試驗,有文獻表明,實際上有約1/4的隨機試驗大于兩臂。多臂試驗使得非一致性的來源更加廣泛,也使得證據網絡更加錯綜復雜。當前,關于各種ITC與網狀Meta分析統計模型的Ⅰ類錯誤大小、效能與精確度比較以及非一致性的建模方法依然是統計學家與臨床流行病學家研究與關注的熱點問題[24]。
此外,單純ITC的Meta分析較為簡單,未調整的采用RevMan、CMA軟件即可完成,調整的ITC分析可以采用專用ITC軟件、R以及Stata軟件計算。當前尚無完美呈現網狀Meta分析的統計軟件,一般多采用WinBUGS軟件[25]、R軟件以及Stata軟件聯合完成。這樣的操作對于非統計專業的人員來說難度較大。所以,研發既方便用戶使用,又兼顧統計的復雜性并提供內置的方法論指導的新的網狀Meta分析軟件十分必要。
綜上所述,雖然Meta分析方法在成長與發展中不斷受到質疑與挑戰,但近20年來仍然得到迅猛發展,循證醫學、Meta分析等詞匯在短短十幾年內風靡整個醫學界。毋庸置疑,Meta分析已經成為臨床醫生與科研工作者用于臨床決策的一門不可或缺的技術。ITC與網狀Meta分析作為傳統Meta分析方法的拓展,一方面其突破了傳統方法僅限于兩處理直接比較的限制,可以將多個處理以及間接比較的證據進行合并,更符合臨床決策的實際,對于臨床決策具有更重要的價值,其成功應用必然會使循證醫學的發展步入一個新的階段;另一方面,其不但繼承傳統Meta分析依然存在的方法學挑戰,而且因其包含多個干預措施的比較而增加了其復雜性。所以,醫學界對于ITC與網狀Meta分析的接受程度取決于其方法學的成熟程度以及對證據合并結果的有效性。如何從方法假設、研究選擇、偏倚風險與證據質量評估、統計分析模型以及報告標準等方面探討ITC與網狀Meta分析結果有效性的影響因素,進而探索研究有效性評估的綜合評價方法,總結制定ITC與網狀Meta分析應用中的注意事項及指導原則。無論對于微觀層面的具體應用(如臨床研究中非劣效設計的界值確定,指導臨床決策的制定等),還是宏觀層面的循證醫學發展,都具有重要的理論和現實意義。
多年來,基于嚴格設計的隨機對照試驗(RCT)直接比較(direct comparison)或稱為頭對頭比較(head to head comparison)的系統評價被公認為評價干預措施療效的最佳方法,其所采用的針對兩組研究結果比較的定量合成方法即是傳統的Meta分析方法[1, 2]。其通過對多個直接比較研究的合并,獲得一個綜合的估計結果,可以克服單個小樣本研究的缺陷,提高統計檢驗效能,尤其是當各研究結果不一致時,Meta分析有助于判斷一種干預措施的利弊。此外,若要開展兩種干預措施效果比較(A vs. B)的Meta分析,但未找到A vs. B直接比較的RCT,而有A vs. C與B vs. C比較的RCT,此時若將C作為共同對照,借助A vs. C與B vs. C的比較結果,間接得到A vs. B的效果,稱之為間接比較(indirect comparison,ITC)[3]。
在具體臨床實踐中,臨床醫生或決策者通常需要對多種干預措施進行比較,證據網絡中既有頭對頭比較的直接證據,也有間接比較的證據,這種將直接證據與間接證據合并進行分析的方法稱之為網狀Meta分析(network meta-analysis)[4]。
迄今為止,國內外關于Meta分析方法的研究已有超過30年的歷史[5]。ITC與網狀Meta分析,作為一門新興的、用于循證醫學的統計學方法,近年來逐漸受到臨床研究者、流行病學家、藥學家以及統計學家的關注與青睞[6, 7],國內也有部分學者開始致力于該方法的理論與應用研究[8-16]。以下,我們將從間接比較與網狀Meta分析的處理網絡模型、三個基本假設、內部有效性與外部有效性影響因素、分析軟件等幾方面對其研究現狀及發展動態作簡要概括。
1 ITC與網狀Meta分析的處理網絡模型
在臨床決策實踐中,ITC與網狀Meta分析的應用雖不及傳統Meta分析方法廣泛,但其應用的案例數量及證據網絡的復雜程度不斷增加(圖 1、圖 2)。


以上兩圖顯示了一個漸進復雜的ITC與網狀Meta分析的證據網絡:
(1)每個圓圈及其中的字母代表一種干預措施;
(2)連接兩個圓圈之間的線條代表一個或多個RCT;
(3)圓圈之間無線條連接代表無直接比較的RCT。
圖 1和圖 2中所示的證據網絡均來自于已發表的ITC與網狀Meta分析的研究實例[17-20]。以圖 1(i)與圖 2(i)為例,同樣包括A、B、C三種處理,不同的是圖 1(i)中沒有B vs. C頭對頭直接比較的RCT,而圖 2(i)中B vs. C既有直接證據又有間接證據。
羅列的模型最多僅包含了7種處理,而在實際的臨床研究中常常見到包括十幾種甚至幾十種干預措施的比較[21],且一些研究中不僅包含兩臂RCT,還包含三臂或多臂RCT。這不但增加了統計分析模型的復雜性,更增加了偏倚風險,對于此種類型的ITC或網狀Meta分析結果,如何評價其有效性尚待進一步研究。
2 三個基本假設[3 ]
ITC與網狀Meta分析涉及三個基本假設:①同質性假設;②相似性假設;③一致性假設。當傳統Meta分析合并相同的處理比較時(如所有RCT均是A vs. B的比較),其往往基于一個假設,既研究結果間的同質性假設。這是因為每一個RCT中A與B之間的隨機化并不意味著所有RCT的隨機化。因此,每一個RCT因為研究本身特征與受試者特征的不同而不同。如果這些特征又恰巧是影響A與B效應的混雜因素,則研究被認為是異質的。
ITC與網狀Meta分析中的RCT包含多種處理比較的類型。例如,在ITC中,如果A vs. B試驗與A vs. C試驗在效應影響因素方面具有相似性,C與B的相對處理效應dBC才可以通過B與A的效應估計dAB與C與A的效應估計dAC得到:dBC=dAC-dAB。這稱為ITC中的相似性假設。當網狀Meta分析對直接比較與間接比較的證據進行合并時,非常重要的一點是間接比較沒有偏倚,且直接比較與間接比較無差別,這就是所謂的直接比較與間接比較的一致性假設。
由此可見,同質性假設是基于同一種處理比較類型的不同研究間,相似性假設是指不同的處理比較類型之間,而一致性假設是基于直接比較與間接比較之間。圖 3、圖 4更加直觀的表達了相似性假設與一致性假設。
在傳統Meta分析中,習慣通過95%CI的重合程度、I2大小與異質性檢驗來識別同一種類型比較的不同研究結果間的異質性大小。如果存在異質性,一般采用隨機效應模型對效應量進行合并或作亞組分析。而在ITC與網狀Meta分析中,三個假設的關系變得更加復雜,相似性與一致性已經不能借助統計學檢驗的統計顯著性與否簡單排除,更需綜合考慮流行病學專家及臨床專家的意見。此外,即使傳統Meta分析中研究結果間存在非常大的異質性,而相似性假設與一致性假設也可能成立;換句話說,即使相似性假設與一致性假設均不成立,而傳統Meta分析中的各個研究結果間也未必一定存在異質性。關于這一點,下文中的圖 5、圖 6中將會有更加直觀的表述,在此不再贅述。


3 內部有效性與外部有效性
ITC與網狀Meta分析的內部有效性是指其結果的真實性以及在分析中對偏倚的解釋。內部有效性一般與三方面因素有關:①對證據網絡中研究的正確識別;②單個RCT的研究質量;③導致違背相似性與一致性假設的混雜偏倚的程度。而研究的外部有效性本質上受證據網絡中RCT外部有效性所限,主要是指ITC與網狀Meta分析的結果能夠推論的范圍。國內外文獻中對于有效性的討論大多是指的內部有效性。
所謂效應影響因素[2, 4]是指研究本身或受試者與處理效應有關的某些特征。因為ITC與網狀Meta分析包括多個不同處理比較類型的不同試驗,效應影響因素的分布不僅存在于某個特定的比較中(如傳統兩處理比較的Meta分析,稱為異質性),還存在于不同比較類型之間(稱為非相似性或非一致性)。ITC與網狀Meta分析中處理效應變異的來源主要有三種:①真實的研究內部的處理效應變異;②某個特定的處理比較類型中,真實的研究間的處理效應變異;③真實的比較間的處理效應變異。效應影響因素分布不均衡,ITC與網狀Meta分析的結果就會出現偏倚,從而影響其結果的有效性。反之,ITC與網狀Meta分析則會與傳統的兩處理比較的Meta分析一樣有效。圖 5、圖 6分別直觀呈現了ITC結果無偏與有偏的兩種情況。
上圖中,AB(i)、AC(i)分別代表A vs. B試驗與A vs. C試驗各研究無異質性存在,因為效應影響因素即疾病嚴重程度的比例在各研究間相同;AB(ii)、AC(ii)分別代表A vs. B試驗與A vs. C試驗各研究有異質性存在,因為效應影響因素疾病嚴重程度的比例在各研究間不同;但基于A vs. B試驗與A vs. C試驗ITC與網狀Meta分析的結果是無偏的,因為無論研究間是否存在異質性,A vs. B試驗與A vs. C試驗的效應影響因素分布相同,具有相似性。
與圖 5中相似,AB(i)、AC(i)分別代表A vs. B試驗與A vs. C試驗各研究結果間無異質性存在,AB(ii)、AC(ii)分別代表A vs. B試驗與A vs. C試驗各研究有異質性存在。但基于A vs. B試驗與A vs. C試驗ITC與網狀Meta分析的結果卻是有偏的,因為無論研究結果間是否存在異質性,A vs. B試驗與A vs. C試驗的效應影響因素分布不同,不具有相似性。
由此可見,效應影響因素在直接比較的研究間分布不均衡,間接比較的結果有可能是無偏倚的;反之,效應影響因素在直接比較的研究間分布均衡,間接比較的結果依然有可能是有偏倚的。相對于傳統Meta分析,效應影響因素作用的識別以及偏倚風險的評估在ITC與網狀Meta分析中更具挑戰性。傳統的兩處理Meta分析僅有一個合并效應估計,而在ITC與網狀Meta分析中不只一個效應估計。因此,當任何一個獨立的研究存在偏倚,在傳統Meta分析中可能僅影響一個合并效應,而對于ITC與網狀Meta分析,則會影響到多個的合并效應估計。ITC與網狀Meta分析的偏倚風險是否一定大于傳統Meta分析?間接比較能否清洗掉某種在頭對頭Meta分析中也無法識別的偏倚?網狀Meta分析能否為識別與調整納入研究的偏倚提供一種潛在的方法?這些問題依然是未來方法學研究的重點,也是評價ITC與網狀Meta分析有效性必須面對和慎重考慮的問題。
4 統計分析模型與分析軟件
對于ITC與網狀Meta分析,目前最常用的統計分析方法為頻數法(又稱Bucher’s方法)與Bayesian方法[22, 23]。
4.1 頻數法間接比較模型(AITC)
基于頻數的方法又稱為Bucher’s方法,假定處理A與B的比較結果為dAB,處理A與C的比較結果為dAC,處理A作為一個共同對照,調整的處理B與C間接比較的結果為:
$d_{BC}^{Ind} = {d_{AB}} - {d_{AC}}$ |
其方差為
$Var\left( {d_{BC}^{Ind}} \right) = Var\left( {{d_{AB}}} \right) + Var\left( {{d_{AC}}} \right)$ |
當處理A vs. B與處理A vs. C的比較存在多個試驗時,利用傳統Meta分析的固定效應或隨機效應模型先將其結果進行合并,然后將dAB與dAC的合并估計值代入AITC模型中。
4.2 頻數法網狀Meta分析模型(CFMTC)
在頻數法的網狀Meta分析模型中,可以將AITC模型中間接比較的結果與直接比較的結果進行合并,并利用相應的方差倒數進行加權。
4.3 Bayesian網狀Meta分析模型(CBMTC)
假定有幾個處理(A、B、C、D等)在一個證據網絡中被比較,首先需要選擇一個處理(如處理A)作為參照處理,在每一個研究中,也需要擬定一個處理作為基本處理(如B),下面即為基于一致性假設的Bayesian方法的網狀Meta分析模型:
${\theta _{kt}} = \left\{ \begin{array}{l} {\mu _{kb}}\;\;\;\;\;\;\;\;\;\;\;\;\;\;b = A,B,C,D \ldots \ldots ift = b\\ {\mu _{kb}} + {\delta _{kbt}}\;\;\;\;\;\;t = B,C,D \ldots \ldots ift在b之后 \end{array} \right.$ |
$\begin{array}{l} {\delta _{kbt}} \sim N\left( {{d_{bt}},{\tau ^2}} \right)\\ {d_{bt}} = {d_{At}} - {d_{Ab}}\;\;\;{d_{AA}} = 0 \end{array}$ |
θkt為處理t在第k個研究中的結果,θbt為處理b在第k個研究中的結果,而δkbt是處理t與b在第k個研究中相比較的相對效應。δkbt假定服從均數為dbt,方差為τ2的正態分布。
以上介紹的AITC、CFMTC及CBMTC三個模型均是在假定一致性假設成立的基礎上,即假定來自于處理B與C直接比較的結果等同于建立在共同比較A基礎上的處理B與C間接比較的結果。考慮到一致性假設可能不成立的情況,也有研究者提出一些隨機的非一致性模型或對一致性進行統計學檢驗的方法。此外,很多情況下,ITC與網狀Meta分析經常包含一些三臂或多臂的試驗,有文獻表明,實際上有約1/4的隨機試驗大于兩臂。多臂試驗使得非一致性的來源更加廣泛,也使得證據網絡更加錯綜復雜。當前,關于各種ITC與網狀Meta分析統計模型的Ⅰ類錯誤大小、效能與精確度比較以及非一致性的建模方法依然是統計學家與臨床流行病學家研究與關注的熱點問題[24]。
此外,單純ITC的Meta分析較為簡單,未調整的采用RevMan、CMA軟件即可完成,調整的ITC分析可以采用專用ITC軟件、R以及Stata軟件計算。當前尚無完美呈現網狀Meta分析的統計軟件,一般多采用WinBUGS軟件[25]、R軟件以及Stata軟件聯合完成。這樣的操作對于非統計專業的人員來說難度較大。所以,研發既方便用戶使用,又兼顧統計的復雜性并提供內置的方法論指導的新的網狀Meta分析軟件十分必要。
綜上所述,雖然Meta分析方法在成長與發展中不斷受到質疑與挑戰,但近20年來仍然得到迅猛發展,循證醫學、Meta分析等詞匯在短短十幾年內風靡整個醫學界。毋庸置疑,Meta分析已經成為臨床醫生與科研工作者用于臨床決策的一門不可或缺的技術。ITC與網狀Meta分析作為傳統Meta分析方法的拓展,一方面其突破了傳統方法僅限于兩處理直接比較的限制,可以將多個處理以及間接比較的證據進行合并,更符合臨床決策的實際,對于臨床決策具有更重要的價值,其成功應用必然會使循證醫學的發展步入一個新的階段;另一方面,其不但繼承傳統Meta分析依然存在的方法學挑戰,而且因其包含多個干預措施的比較而增加了其復雜性。所以,醫學界對于ITC與網狀Meta分析的接受程度取決于其方法學的成熟程度以及對證據合并結果的有效性。如何從方法假設、研究選擇、偏倚風險與證據質量評估、統計分析模型以及報告標準等方面探討ITC與網狀Meta分析結果有效性的影響因素,進而探索研究有效性評估的綜合評價方法,總結制定ITC與網狀Meta分析應用中的注意事項及指導原則。無論對于微觀層面的具體應用(如臨床研究中非劣效設計的界值確定,指導臨床決策的制定等),還是宏觀層面的循證醫學發展,都具有重要的理論和現實意義。