引用本文: 姚明宏, 李玲, 任燕, 賈玉龍, 鄒康, 孫鑫. 罕見事件不同 Meta 分析方法的統計性能評價. 中國循證醫學雜志, 2021, 21(3): 367-372. doi: 10.7507/1672-2531.202011055 復制
隨機對照試驗(randomized controlled trial,RCT)是評價治療效應的金標準。在治療結局發生率很低時,由于單個研究的樣本量有限,事件發生數非常小,這通常被稱為罕見事件。甚至在一些情況下出現事件發生數為零的情形,通常將這種未觀察到事件的研究稱為零事件研究[1]。根據零事件發生的組別又可分為單臂零事件和雙臂零事件。
Meta 分析通過累積來自多個研究的樣本量和發生例數,可以合并處理罕見事件的效應量。但傳統 Meta 分析方法基于倒方差加權理論合并各研究的效應值,但因無法估計單臂或雙臂零事件研究的效應值,故基于倒方差加權的 Meta 分析無法實現效應值合并[2]。本文梳理常見的罕見事件不同 Meta 分析方法,通過設定多種場景,采用 Monte-Carlo 模擬評價不同方法的統計性能,旨在為正確選擇罕見事件 Meta 分析方法提供依據。
1 常見用于罕見事件效應值合并研究的 Meta 分析方法
假定 yij 為研究 i 中組 j 發生數,ni 為研究 i 組 j 中的觀察人數,對照組和試驗組的 j 的取值分別為 0 和 1。yi 為研究 i 中試驗組和對照組的事件發生總數, 為研究 i 中組 j 的事件發生率。罕見事件通常屬于二分類結局變量,本研究采用比值比(odds ratio,OR)描述各研究的效應值[3]。每個研究的效應值的估計值為
,
為
對應的方差。標準的隨機效應 Meta 分析假定
服從均值為
,方差為
的正態分布;
服從均值為
,方差為
的正態分布,
反應了不同研究間效應的異質性。本研究只關注兩組的比較,見公式(1)和(2)。
目前常見的罕見事件效應值合并的 Meta 分析方法如下。
1.1 連續性校正
傳統的隨機效應 Meta 分析模型為正態-正態分布模型[4]。針對出現零事件的研究,Plackett 等[5]提出采用連續性校正法進行校正,具體做法為對零事件研究中的每個分類的事件數均添加 0.5,用以近似估算效應量。再采用傳統的正態-正態分布模型對結果進行合并。
![]() |
![]() |
1.2 Peto 法
Peto 法是一種基于固定效應模型假設的方法,它是利用試驗組實際觀察到的發生例數與其期望發生例數的差值而構建的加權指數模型,用以估算不同研究合并的效應值[6]。Peto 法合并效應值及其方差的計算公式分別見公式(3)和(4)。
![]() |
![]() |
1.3 Mantel-Haenszel 法
Mantel-Haenszel(M-H)法最開始用于分層數據效應量的整合,后逐漸用于 Meta 分析效應量的合并。其合并效應值及其方差的計算公式分別見公式(5)和(6)[7],其中,
,
,
。M-H 法為對零事件研究中每個分類的事件數均添加 0.5。
![]() |
![]() |
1.4 廣義線性混合效應模型
傳統的 Meta 分析采用“兩步法”估計效應量,即先估計每個研究的效應,再對每個研究的效應進行合并。與傳統 Meta 分析方法不同,廣義線性混合效應模型采用“一步法”,在多水平模型的框架下估計不同研究之間合并的效應值,即研究內個體當作 1 水平,研究當作 2 水平,不僅考慮研究內個體間的變異,也考慮不同研究間的變異。Jackson 等[8]模擬比較了 7 種隨機效應的廣義線性混合效應模型的統計性能,根據分析結果,本研究選用其文章中的模型 4。模型設定見公式(7),
,則
![]() |
1.5 貝葉斯 logistic 回歸模型
貝葉斯統計分析的基本原理在于根據最新觀察到的數據更新既有參數信息。在貝葉斯分析中,對于每個感興趣的待估參數如合并效應值 θ 和異質性參數,給定一個先驗分布,通常先驗分布的設定為模糊先驗或弱信息先驗[9]。在出現單臂或雙臂零事件時,因貝葉斯 Meta 分析模型可納入先驗信息,在不對原始數據進行校正的情況下,獲得待估參數的后驗分布。常見的罕見事件貝葉斯 Meta 分析模型為貝葉斯 logistic 模型,模型設定見公式(8),其中
,
。
![]() |
μi 為研究 i 的基線風險。xij 為指示函數,試驗組的時候取值為 0.5,對照組的時候取值為?0.5。先驗參數的設定參考 Günhan 等[10]的研究,即,
,
。
2 模擬場景設置
當 OR=1 時,通常視為無效應;OR<2 為輕微效應,OR 在 2~5 為中等效應;OR≥5 為強效應。根據 Xu[11]和 Cheng[12]等的研究,進一步考慮多種效應大小的場景,OR 的設定分別為 1、2、3、4 和 5。根據罕見事件發生率的定義,參考 Günhan 等[10]的研究,對照組的發生率服從區間為(0.005,0.05)的均勻分布。試驗組的發生率由公式(9)獲得,pc 為對照組發生率,pt 為試驗組發生率。參考 Xu 等[11]的研究,異質性參數 tau=0.2、0.4、0.6、0.8 和 1.0,反應異質性從低到高的情形。根據 Jackson 等[13]的研究,每個 Meta 分析中研究的個數設定為 10 個。Meta 分析中每個研究對照組的樣本量服從均數為 5、標準差為 1 的對數正態分布[14],對照組和試驗組研究的樣本量假定為 1∶1[12]。具體的參數設置見表 1,每個模擬場景的次數為 5 000 次。采用 R 軟件(版本為 4.0.0)進行 Monte-Carlo 模擬和統計分析。

![]() |
3 不同 Meta 分析方法的模擬結果評估
采用以下 3 個指標評價不同 Meta 分析方法的效果:①絕對百分比誤差,指估計值與真實值之間差值的絕對值占真實值的百分比。該指標代表系統誤差,越接近 0,性能越好。② 均方根誤差(root mean squared error,RMSE),估計值與真實值偏差的平方和觀測次數比值的平方根。該指標是一個綜合反應估計結果準確性和精確性的指標,不同方法進行比較時,該指標越小越好。③ 區間覆蓋率,得到的區間包含總體參數值次數的比例,用于衡量區間估計的準確性。該指標值越接近事先設定的置信或可信度(本文設置為 95% 置信或可信區間),性能越好。
4 模擬結果
在不同的模擬場景下,不同方法的絕對百分比誤差、RMSE 和區間覆蓋率的結果分別見圖 1、圖 2 和圖 3。總體上看,隨著各研究的異質性不斷增大,各方法的統計性能均變差;在異質性較小時(tau=0.2),各方法的統計性能均非常接近;異質性參數在 0.4 到 1 時,各方法的統計性能存在明顯差異。



針對絕對百分比誤差,由圖 1 結果可知,隨著異質性參數的不斷增大,各方法估計結果的絕對百分比誤差也不斷增大。當 tau=0.2,OR=1、OR=2 和 OR=3 時,各方法的絕對百分比誤差非常接近;而當 OR=4 和 OR=5 時,Peto 法的絕對百分比誤差明顯高于其它方法。針對不同的效應值,在異質性參數為 0.4 到 0.8 時,M-H 法估計結果所產生的絕對百分比誤差均明顯高于其他方法,而連續性校正、貝葉斯 logistic 回歸模型和廣義線性混合效應模型的絕對百分比誤差接近。
針對 RMSE,由圖 2 結果可知,在不同效應量和異質性參數下,M-H 法估計結果所產生的 RMSE 均明顯高于其他方法;隨著異質性參數的不斷增大,各方法估計結果的 RMSE 也不斷增大。當 OR=1 和 OR=2 時,連續性校正、貝葉斯 logistic 回歸模型和廣義線性混合效應模型的 RMSE 接近,并低于 Peto 法。而當 OR=3、OR=4 和 OR=5 時,貝葉斯 logistic 回歸模型和廣義線性混合效應模型的 RMSE 高于連續性校正和 Peto 法。
針對區間覆蓋率,由圖 3 結果可知,在不同效應量和異質性參數下,貝葉斯 logistic 模型的區間覆蓋率均明顯高于其他方法;隨著異質性參數的不斷增大,各方法估計結果的區間覆蓋率不斷減小。當 OR=1 時,M-H 法和 Peto 法的區間覆蓋率的結果接近,但明顯低于連續性校正、貝葉斯 logistic 回歸模型和廣義線性混合效應模型的結果。當 OR=2、OR=3、OR=4 和 OR=5 時,貝葉斯 logistic 回歸模型、連續性校正、廣義混合線性效應模型、Peto 法和 M-H 法的區間覆蓋率依次降低。
5 討論
本研究針對罕見事件 Meta 分析方法,設定多種場景,采用 Monte-Carlo 模擬方法,通過絕對百分比誤差、RMSE 和區間覆蓋率 3 個指標評價各種分析方法的統計性能。研究結果表明,當各研究結果的異質性較低時,除 Peto 法外,其余四種方法的統計性能較為接近;隨著研究結果的異質性的增加,各方法的統計性能均變差,但貝葉斯 logistic 回歸模型、廣義線性混合效應模型和連續性校正的統計性能明顯高于 M-H 法和 Peto 法。
既往 Meta 分析均主要關注零事件研究納入與否對估計結果的影響。針對含零事件研究效應值的合并,在實際應用時,存在兩種不同的處理即分析時是否應該納入含零事件的研究。傳統分析方法和軟件如 RevMan、Stata 和 R 軟件的 metafor 程序包等均默認排除零事件的研究。近年來越來越多的模擬研究結果表明,合并分析時不應將零事件研究排除[11, 12, 15],如 Xu 等[11]對時間為 2003 年到 2018 年發表在 The Cochrane Library 上的含零事件效應值合并的 Meta 分析模擬結果表明排除雙臂零事件研究可能會改變 Meta 分析的結論。
目前,較少有研究關注不同場景下,不同罕見事件 Meta 分析方法的統計性能。如針對廣義線性混合效應模型,Jackson 等[8]模擬比較了 7 種隨機效應的廣義線性混合效應模型的統計效能。Cheng 等[12]比較了 M-H 法、倒方差法和 Peto 法在處理零事件時的統計性能,未考慮廣義線性混合效應模型和貝葉斯 logistic 回歸模型的統計性能。Günhan 等[10]僅比較了廣義線性混合效應模型和貝葉斯 logistic 回歸模型。我們在前期研究的基礎上進行了擴展,設定了更加廣泛的場景,使其研究結論具有更好的代表性。
本研究模擬結果提示不宜采用 M-H 法和 Peto 法作為罕見事件研究效應值合并的首選 Meta 分析方法。根據 Zhou 等[16]的文獻調查分析結果,針對罕見事件的合并方案,M-H 法、Peto 法和連續性校正是最常用于罕見事件的效應量合并方法。但本研究結果顯示,總體上來看,除極個別場景外,M-H 法和 Peto 法的統計性能均低于其余三種方法。M-H 法針對零事件研究,默認添加 0.5 對結果進行校正,但該方法引入了一定的偏倚,隨機效應模型的設定并不能減輕引入的偏倚對結果的影響[17]。Peto 法屬于固定效應模型,當各研究結果存在明顯的異質性時,其統計性能較差;且在實際進行 Meta 分析時,針對罕見事件研究效應值合并,難以準確估計各研究之間效應的異質性[18],使用 Peto 法進行效應量的合并存在風險。
本研究和既往研究結果均表明,貝葉斯 logistic 回歸模型在處理罕見事件研究效應值合并時具有良好的統計性能。本研究結果提示,針對不同異質性參數和效應量,貝葉斯 logistic 回歸模型、廣義線性混合效應模型和連續性校正的絕對百分比誤差和 RMSE 結果接近,但貝葉斯 logistic 回歸模型的區間覆蓋率高于上述兩種方法。Günhan 等[10]結果表明,無論是單臂零事件研究還是雙臂零事件研究,貝葉斯 logistic 回歸模型的統計性能均優于廣義線性混合效應模型。此外,目前已有專用的 R 包 MetaStan 用于貝葉斯 logistic 回歸模型的實現。綜上,基于當前模擬研究結果和以上討論,我們推薦貝葉斯 logistic 回歸模型作為罕見事件研究效應值合并的 Meta 分析首選方法。
本研究存在以下不足:① 本研究僅考慮了效應量為 OR 時各統計分析方法在不同場景下的統計性能,并未考慮針對二分類事件的其他效應量如風險比(risk ratio,RR)和風險差(risk difference,RD)的不同統計分析方法的性能。② 存在其他的罕見且含零事件 Meta 分析方法,如逆正弦轉換法、貝葉斯 Beta-Binomial 模型等。鑒于在研究中廣泛使用的程度,本研究并未比較這些方法的統計性能。③ 本研究并未比較對照組和試驗組不同樣本比例和含零事件比例時,各方法的統計性能。
綜上所述,本研究發現不同場景下,貝葉斯 logistic 回歸模型、廣義線性混合效應模型和連續性校正的絕對百分比誤差和均方根誤差結果接近,但區間覆蓋率貝葉斯 logistic 回歸模型更高。Mantel-Haenszel 法和 Peto 法在不同場景下的統計性能較差。推薦采用貝葉斯 logistic 回歸模型作為罕見事件效應值合并的 Meta 分析首選方法。
隨機對照試驗(randomized controlled trial,RCT)是評價治療效應的金標準。在治療結局發生率很低時,由于單個研究的樣本量有限,事件發生數非常小,這通常被稱為罕見事件。甚至在一些情況下出現事件發生數為零的情形,通常將這種未觀察到事件的研究稱為零事件研究[1]。根據零事件發生的組別又可分為單臂零事件和雙臂零事件。
Meta 分析通過累積來自多個研究的樣本量和發生例數,可以合并處理罕見事件的效應量。但傳統 Meta 分析方法基于倒方差加權理論合并各研究的效應值,但因無法估計單臂或雙臂零事件研究的效應值,故基于倒方差加權的 Meta 分析無法實現效應值合并[2]。本文梳理常見的罕見事件不同 Meta 分析方法,通過設定多種場景,采用 Monte-Carlo 模擬評價不同方法的統計性能,旨在為正確選擇罕見事件 Meta 分析方法提供依據。
1 常見用于罕見事件效應值合并研究的 Meta 分析方法
假定 yij 為研究 i 中組 j 發生數,ni 為研究 i 組 j 中的觀察人數,對照組和試驗組的 j 的取值分別為 0 和 1。yi 為研究 i 中試驗組和對照組的事件發生總數, 為研究 i 中組 j 的事件發生率。罕見事件通常屬于二分類結局變量,本研究采用比值比(odds ratio,OR)描述各研究的效應值[3]。每個研究的效應值的估計值為
,
為
對應的方差。標準的隨機效應 Meta 分析假定
服從均值為
,方差為
的正態分布;
服從均值為
,方差為
的正態分布,
反應了不同研究間效應的異質性。本研究只關注兩組的比較,見公式(1)和(2)。
目前常見的罕見事件效應值合并的 Meta 分析方法如下。
1.1 連續性校正
傳統的隨機效應 Meta 分析模型為正態-正態分布模型[4]。針對出現零事件的研究,Plackett 等[5]提出采用連續性校正法進行校正,具體做法為對零事件研究中的每個分類的事件數均添加 0.5,用以近似估算效應量。再采用傳統的正態-正態分布模型對結果進行合并。
![]() |
![]() |
1.2 Peto 法
Peto 法是一種基于固定效應模型假設的方法,它是利用試驗組實際觀察到的發生例數與其期望發生例數的差值而構建的加權指數模型,用以估算不同研究合并的效應值[6]。Peto 法合并效應值及其方差的計算公式分別見公式(3)和(4)。
![]() |
![]() |
1.3 Mantel-Haenszel 法
Mantel-Haenszel(M-H)法最開始用于分層數據效應量的整合,后逐漸用于 Meta 分析效應量的合并。其合并效應值及其方差的計算公式分別見公式(5)和(6)[7],其中,
,
,
。M-H 法為對零事件研究中每個分類的事件數均添加 0.5。
![]() |
![]() |
1.4 廣義線性混合效應模型
傳統的 Meta 分析采用“兩步法”估計效應量,即先估計每個研究的效應,再對每個研究的效應進行合并。與傳統 Meta 分析方法不同,廣義線性混合效應模型采用“一步法”,在多水平模型的框架下估計不同研究之間合并的效應值,即研究內個體當作 1 水平,研究當作 2 水平,不僅考慮研究內個體間的變異,也考慮不同研究間的變異。Jackson 等[8]模擬比較了 7 種隨機效應的廣義線性混合效應模型的統計性能,根據分析結果,本研究選用其文章中的模型 4。模型設定見公式(7),
,則
![]() |
1.5 貝葉斯 logistic 回歸模型
貝葉斯統計分析的基本原理在于根據最新觀察到的數據更新既有參數信息。在貝葉斯分析中,對于每個感興趣的待估參數如合并效應值 θ 和異質性參數,給定一個先驗分布,通常先驗分布的設定為模糊先驗或弱信息先驗[9]。在出現單臂或雙臂零事件時,因貝葉斯 Meta 分析模型可納入先驗信息,在不對原始數據進行校正的情況下,獲得待估參數的后驗分布。常見的罕見事件貝葉斯 Meta 分析模型為貝葉斯 logistic 模型,模型設定見公式(8),其中
,
。
![]() |
μi 為研究 i 的基線風險。xij 為指示函數,試驗組的時候取值為 0.5,對照組的時候取值為?0.5。先驗參數的設定參考 Günhan 等[10]的研究,即,
,
。
2 模擬場景設置
當 OR=1 時,通常視為無效應;OR<2 為輕微效應,OR 在 2~5 為中等效應;OR≥5 為強效應。根據 Xu[11]和 Cheng[12]等的研究,進一步考慮多種效應大小的場景,OR 的設定分別為 1、2、3、4 和 5。根據罕見事件發生率的定義,參考 Günhan 等[10]的研究,對照組的發生率服從區間為(0.005,0.05)的均勻分布。試驗組的發生率由公式(9)獲得,pc 為對照組發生率,pt 為試驗組發生率。參考 Xu 等[11]的研究,異質性參數 tau=0.2、0.4、0.6、0.8 和 1.0,反應異質性從低到高的情形。根據 Jackson 等[13]的研究,每個 Meta 分析中研究的個數設定為 10 個。Meta 分析中每個研究對照組的樣本量服從均數為 5、標準差為 1 的對數正態分布[14],對照組和試驗組研究的樣本量假定為 1∶1[12]。具體的參數設置見表 1,每個模擬場景的次數為 5 000 次。采用 R 軟件(版本為 4.0.0)進行 Monte-Carlo 模擬和統計分析。

![]() |
3 不同 Meta 分析方法的模擬結果評估
采用以下 3 個指標評價不同 Meta 分析方法的效果:①絕對百分比誤差,指估計值與真實值之間差值的絕對值占真實值的百分比。該指標代表系統誤差,越接近 0,性能越好。② 均方根誤差(root mean squared error,RMSE),估計值與真實值偏差的平方和觀測次數比值的平方根。該指標是一個綜合反應估計結果準確性和精確性的指標,不同方法進行比較時,該指標越小越好。③ 區間覆蓋率,得到的區間包含總體參數值次數的比例,用于衡量區間估計的準確性。該指標值越接近事先設定的置信或可信度(本文設置為 95% 置信或可信區間),性能越好。
4 模擬結果
在不同的模擬場景下,不同方法的絕對百分比誤差、RMSE 和區間覆蓋率的結果分別見圖 1、圖 2 和圖 3。總體上看,隨著各研究的異質性不斷增大,各方法的統計性能均變差;在異質性較小時(tau=0.2),各方法的統計性能均非常接近;異質性參數在 0.4 到 1 時,各方法的統計性能存在明顯差異。



針對絕對百分比誤差,由圖 1 結果可知,隨著異質性參數的不斷增大,各方法估計結果的絕對百分比誤差也不斷增大。當 tau=0.2,OR=1、OR=2 和 OR=3 時,各方法的絕對百分比誤差非常接近;而當 OR=4 和 OR=5 時,Peto 法的絕對百分比誤差明顯高于其它方法。針對不同的效應值,在異質性參數為 0.4 到 0.8 時,M-H 法估計結果所產生的絕對百分比誤差均明顯高于其他方法,而連續性校正、貝葉斯 logistic 回歸模型和廣義線性混合效應模型的絕對百分比誤差接近。
針對 RMSE,由圖 2 結果可知,在不同效應量和異質性參數下,M-H 法估計結果所產生的 RMSE 均明顯高于其他方法;隨著異質性參數的不斷增大,各方法估計結果的 RMSE 也不斷增大。當 OR=1 和 OR=2 時,連續性校正、貝葉斯 logistic 回歸模型和廣義線性混合效應模型的 RMSE 接近,并低于 Peto 法。而當 OR=3、OR=4 和 OR=5 時,貝葉斯 logistic 回歸模型和廣義線性混合效應模型的 RMSE 高于連續性校正和 Peto 法。
針對區間覆蓋率,由圖 3 結果可知,在不同效應量和異質性參數下,貝葉斯 logistic 模型的區間覆蓋率均明顯高于其他方法;隨著異質性參數的不斷增大,各方法估計結果的區間覆蓋率不斷減小。當 OR=1 時,M-H 法和 Peto 法的區間覆蓋率的結果接近,但明顯低于連續性校正、貝葉斯 logistic 回歸模型和廣義線性混合效應模型的結果。當 OR=2、OR=3、OR=4 和 OR=5 時,貝葉斯 logistic 回歸模型、連續性校正、廣義混合線性效應模型、Peto 法和 M-H 法的區間覆蓋率依次降低。
5 討論
本研究針對罕見事件 Meta 分析方法,設定多種場景,采用 Monte-Carlo 模擬方法,通過絕對百分比誤差、RMSE 和區間覆蓋率 3 個指標評價各種分析方法的統計性能。研究結果表明,當各研究結果的異質性較低時,除 Peto 法外,其余四種方法的統計性能較為接近;隨著研究結果的異質性的增加,各方法的統計性能均變差,但貝葉斯 logistic 回歸模型、廣義線性混合效應模型和連續性校正的統計性能明顯高于 M-H 法和 Peto 法。
既往 Meta 分析均主要關注零事件研究納入與否對估計結果的影響。針對含零事件研究效應值的合并,在實際應用時,存在兩種不同的處理即分析時是否應該納入含零事件的研究。傳統分析方法和軟件如 RevMan、Stata 和 R 軟件的 metafor 程序包等均默認排除零事件的研究。近年來越來越多的模擬研究結果表明,合并分析時不應將零事件研究排除[11, 12, 15],如 Xu 等[11]對時間為 2003 年到 2018 年發表在 The Cochrane Library 上的含零事件效應值合并的 Meta 分析模擬結果表明排除雙臂零事件研究可能會改變 Meta 分析的結論。
目前,較少有研究關注不同場景下,不同罕見事件 Meta 分析方法的統計性能。如針對廣義線性混合效應模型,Jackson 等[8]模擬比較了 7 種隨機效應的廣義線性混合效應模型的統計效能。Cheng 等[12]比較了 M-H 法、倒方差法和 Peto 法在處理零事件時的統計性能,未考慮廣義線性混合效應模型和貝葉斯 logistic 回歸模型的統計性能。Günhan 等[10]僅比較了廣義線性混合效應模型和貝葉斯 logistic 回歸模型。我們在前期研究的基礎上進行了擴展,設定了更加廣泛的場景,使其研究結論具有更好的代表性。
本研究模擬結果提示不宜采用 M-H 法和 Peto 法作為罕見事件研究效應值合并的首選 Meta 分析方法。根據 Zhou 等[16]的文獻調查分析結果,針對罕見事件的合并方案,M-H 法、Peto 法和連續性校正是最常用于罕見事件的效應量合并方法。但本研究結果顯示,總體上來看,除極個別場景外,M-H 法和 Peto 法的統計性能均低于其余三種方法。M-H 法針對零事件研究,默認添加 0.5 對結果進行校正,但該方法引入了一定的偏倚,隨機效應模型的設定并不能減輕引入的偏倚對結果的影響[17]。Peto 法屬于固定效應模型,當各研究結果存在明顯的異質性時,其統計性能較差;且在實際進行 Meta 分析時,針對罕見事件研究效應值合并,難以準確估計各研究之間效應的異質性[18],使用 Peto 法進行效應量的合并存在風險。
本研究和既往研究結果均表明,貝葉斯 logistic 回歸模型在處理罕見事件研究效應值合并時具有良好的統計性能。本研究結果提示,針對不同異質性參數和效應量,貝葉斯 logistic 回歸模型、廣義線性混合效應模型和連續性校正的絕對百分比誤差和 RMSE 結果接近,但貝葉斯 logistic 回歸模型的區間覆蓋率高于上述兩種方法。Günhan 等[10]結果表明,無論是單臂零事件研究還是雙臂零事件研究,貝葉斯 logistic 回歸模型的統計性能均優于廣義線性混合效應模型。此外,目前已有專用的 R 包 MetaStan 用于貝葉斯 logistic 回歸模型的實現。綜上,基于當前模擬研究結果和以上討論,我們推薦貝葉斯 logistic 回歸模型作為罕見事件研究效應值合并的 Meta 分析首選方法。
本研究存在以下不足:① 本研究僅考慮了效應量為 OR 時各統計分析方法在不同場景下的統計性能,并未考慮針對二分類事件的其他效應量如風險比(risk ratio,RR)和風險差(risk difference,RD)的不同統計分析方法的性能。② 存在其他的罕見且含零事件 Meta 分析方法,如逆正弦轉換法、貝葉斯 Beta-Binomial 模型等。鑒于在研究中廣泛使用的程度,本研究并未比較這些方法的統計性能。③ 本研究并未比較對照組和試驗組不同樣本比例和含零事件比例時,各方法的統計性能。
綜上所述,本研究發現不同場景下,貝葉斯 logistic 回歸模型、廣義線性混合效應模型和連續性校正的絕對百分比誤差和均方根誤差結果接近,但區間覆蓋率貝葉斯 logistic 回歸模型更高。Mantel-Haenszel 法和 Peto 法在不同場景下的統計性能較差。推薦采用貝葉斯 logistic 回歸模型作為罕見事件效應值合并的 Meta 分析首選方法。