網狀Meta分析的發展促使多種干預措施的對比得以實現,目前已有眾多研究報道了其實施過程,但當前國內研究對其結果解釋則鮮有提及。本文對網狀Meta分析中的軌跡圖、密度圖、Brooks-Gelman-Rubin診斷圖、排序概率表與排序概率圖、累積排序概率圖與累積排序概率圖下面積、網狀圖進行解讀,以期為網狀Meta分析的研究提供參考和幫助。
引用本文: 易躍雄, 張蔚, 劉小媛, 張娟, 朱定軍, 呂瓊瑩. 網狀Meta分析圖形結果解讀. 中國循證醫學雜志, 2015, 15(1): 103-109. doi: 10.7507/1672-2531.20150018 復制
隨著醫學研究的深入,干預措施已逐漸呈多樣化發展。面對多種干預措施,受限于兩兩對比的傳統Meta分析已不能為選擇最優干預措施提供有效的方法學支持,而網狀Meta分析的提出 [
1 軟件、程序包的安裝及數據準備
R軟件與gemtc程序包的安裝方法及數據處理過程請參照《R軟件gemtc程序包在網狀Meta分析中的應用》一文 [7]。由于本文所調用的軟件為Winbugs軟件,并且數據計算基于隨機模型,因此本文將model及mtc.run語句改寫為model <- mtc.model(network,type = "consistency",factor = 2.5,n.chain = 3,linearModel="random")和results <-mtc.run(model,sampler ="R2WinBUGS",n.adapt = 5000,n.iter = 20000,thin = 1) 。為與前文保持一致,本文選取干預措施G與干預措施I之間的比較為例解釋。因suraplot函數未體現累積排序概率圖下面積的結果,本文將suraplot函數改寫,加入累積排序概率圖下面積值以進一步解釋結果。
2 網狀Meta分析的結果分析及解讀
2.1 軌跡圖(trace plot)
軌跡圖為一種在迭代計算過程中表現MCMC鏈波動過程的圖,可因迭代次數及預設分布不同而表現為不同形式,用于診斷模型的收斂程度(convergence)。通過軌跡圖形可了解各條馬爾科夫鏈-蒙特卡羅鏈(Markov Chain Monte Carlo chain,MCMC chain)在計算過程中是否達到穩定及良好的重疊,以判斷模型收斂程度是否滿意 [8, 9]。滿意的收斂取決于足夠的迭代次數,在軌跡圖中表現為各條MCMC鏈相互重疊,視覺觀察不能識別任何一條鏈的迭代過程 [10]。我們將通過不同的預迭代次數及迭代運算次數進行說明 [11],具體參數如表 1所示。

如圖 1a所示,我們先將預迭代次數及迭代次數設定為0和50,結果顯示各條MCMC鏈未明顯擬合,肉眼可識別單條鏈的波動,收斂程度差。此時預迭代次數及迭代運算次數均不足,應增加預迭代及迭代次數。

圖 1b為保留0次預迭代,增加迭代次數至2 000的結果。與圖 1a比較,圖形起始部分各條鏈經幾十次運算后達到穩定,并相互重疊,但重疊面積僅占鏈波動范圍的小部分,收斂程度仍不滿意。由于迭代運算中需使初始值效應最小化,達到穩定前的數據則需剔除。因此,需增加預迭代及迭代次數,尤其是預迭代次數。
圖 1c為預迭代次數及迭代次數設定為1 000及50的結果。與圖 1b比較,圖形起始部分的各條鏈已呈現相互重疊趨勢,但由于迭代運算次數不足,肉眼仍可識別單條鏈的擺動,尤其在1 020~1 040次處明顯。因此,此時需增加預迭代及迭代次數,尤其是迭代的次數。
圖 1d為預迭代次數及迭代次數增加至5 000的結果。各MCMC鏈從起始部分達到明顯融合,但整體重疊面積僅占鏈波動范圍的小部分。此時迭代計算次數仍不足,收斂程度不滿意,仍需增加迭代次數。
圖 1e預迭代次數及迭代次數設定為5 000及20 000的結果。各條MCMC鏈從起始部分已達到穩定融合,并且在后續計算中重疊面積占鏈波動范圍的大部分,且肉眼不能識別單條鏈的波動,收斂程度滿意。
2.2 密度圖(density plot)
密度圖為一種表現參數的后驗數值的分布形態圖,其作用與軌跡圖一致,均用于診斷模型的程度 [12]。密度圖的評估方法為在預先設定分布的基礎上,經過數值模擬計算后,觀察后驗數值的分布形態是否與預設分布一致 [13]。Bandwidth值可作為定量評估,其值越小,表示參數后驗數值的分布范圍與預設分布范圍的差距越小。經足夠迭代運算后,Bandwidth趨向于0并達到穩定 [14]。Bandwidth值則與迭代運算次數相關,而后驗數據分布形態與預迭代次數相關 [15]。良好的收斂在密度圖中表現為一條基本符合模型預設分布的平滑曲線,并且曲線分布及Bandwidth值達到穩定 [16]。密度圖的解釋本文仍以不同迭代次數的計算進行說明,具體參數見表 2所示。模型代碼可通過命令行cat(model$code)來獲取,通過模型可獲知干預措施G與干預措施I的對比預設分布為正態分布(d.G.I~dnorm(0,prior.prec))。各圖中的N值代表迭代次數,Bandwidth值代表后驗分布與先驗分布的差距程度。

對比圖 2a與圖 2b的圖形及計算結果可見:① 兩者的曲線分布均呈現偏態分布,并可見雙峰,且Bandwidth值為0.109 7與0.113 4,與預設分布差距偏大。② 兩者的計算結果中均值、95%CI相差較大(mean(a)=0.451 0,95%CI(a)= -0.122 7~1.067 5;mean(b)=0.3741 1,95%CI(b)= -0.175 3~0.914 5),計算結果不穩定。此時模型收斂程度差,應增加預迭代次數及迭代計算次數。

如圖 2c所示,我們先將迭代次數增加至5 000次。與圖 2b對比,曲線形態進一步趨向正態分布,且Bandwidth值下降至0.038 74,與預設分布差距明顯減小,且計算結果較圖 2b進一步集中(mean(c)=0.334 7,95%CI(c)= -0.154 81~0.826 0)。但曲線仍可見雙峰,曲線分布仍可能受初始值影響,模型收斂程度不滿意。此時需增加預迭代次數。
圖 2d為將預迭代次數增加至5 000次的結果。圖中曲線形態已由圖 2c的雙峰變為單峰,分布形態已接近正態分布。由于迭代次數不變,因此Bandwidth值變化較小(Bandwidth(d)=0.038 85)。與圖 2c計算結果對比,mean及95%CI值變化較小(mean(d)=0.343 5,95%CI(d)= -0.151 81~0.840 6)。但由于n.adapt=5 000及n.iter=5 000的軌跡圖顯示收斂不滿意,因此仍需增加迭代次數。
如圖 2e所示,我們將迭代次數增加至20 000次。此時圖形分布已呈正態分布,與預設分布差距進一步縮小(Bandwidth(e)=0.029 55)。且與圖 2d對比,計算結果已基本穩定(mean(e)=0.3443,95%CI(e)= -0.152 20~0.840 6)。此時模型收斂程度滿意。
為進一步評估模型收斂滿意度,我們將迭代次數增加值40 000次,如圖 2f所示。此時曲線分布與圖 2e對比無明顯變化,Bandwidth值(Bandwidth(e)=0.025 7)及計算結果(mean(f)=0.342 0,95%CI(f)= -0.156 70~0.838 0)變化較小,可判斷n.adapt=5 000及n.inter=20 000下模型收斂程度滿意。
2.3 Brooks-Gelman-Rubin診斷圖(Brooks-Gelman-Rubin diagnosis plot)
Brooks-Gelman-Rubin診斷圖為一種結合基于區間的圖形評估和規模縮減因子(potential scale reduction factor,PSRF) [17]定量分析的診斷模型收斂程度的圖形,最先由Brooks和Gelman等 [18]提出。圖形評估方法為每次迭代均計算出縮減因子(shrink factor)的中位值及97.5%值,經過n次迭代后形成曲線并觀察曲線是否相互擬合并持續穩定 [19]。而PSRF的計算方法為將所有MCMC鏈最后一次迭代的結果進行分析,將鏈中與鏈間的變量相互對比。PSRF值趨向于1提示模型收斂滿意。Brooks和Gelman指出PSRF值低于1.2可予以接受 [18],但gemtc程序包作者Valkenhoef等 [17]建議將PSRF值限定于1到1.05之間(1<PSRF≤ 1.05)則更為合理。根據Brooks和Gelman的建議 [19],滿意的收斂需同時滿足3個條件:① 縮減因子的中位值經n次迭代計算后趨向于1并達到穩定;② 縮減因子的97.5%經n次迭代計算后趨向于1并達到穩定;③ PSRF值趨向于1。本文仍以不同迭代次數進行計算,具體參數如表 3所示。由于Brooks-Gelman-Rubin診斷圖需迭代50次以上才能得出,因此本文以n.iter = 500為起始。PSRF值的結果可由gelman.diag(results)得出。

如圖 3a所示,在經過預迭代100次及迭代500后,縮減因子(shrink factor)的中位值及97.5%值始終在波動,并未相互融合并趨向于1,PSRF值為1.18,提示模型收斂程度差。

圖 3b為與迭代次數及迭代次數各增加10倍(n.adapt=1 000,n.iter=5 000)的結果。圖形顯示縮減因子的中位值及97.5%值仍在波動,在計算3 000次后呈現擬合趨勢,但并未相互擬合。雖然此時PSRF接近于1(PSRF=1.02),但并未達到3個條件同時滿意。因此模型收斂程度雖較圖 3a改善,但仍不滿意。
圖 3c為n.adapt = 5 000,n.iter = 20 000結果,結果顯示經過5 000次預迭代后縮減因子的中位值及97.5%值迅速趨向于1并達到穩定,且PSRF值為1,提示模型收斂程度滿意。
在使用Brooks-Gelman-Rubin診斷方法時切忌單純使用PSRF值來評估收斂是否滿意。以圖 2b為例,當計算至3 000次時,此時的PSRF值接近于1(PSRF=1.02),但縮減因子的中位值及97.5%在后續的計算中仍在波動,且未相互擬合。若在計算3 000次時以PSRF=1.02判斷收斂滿意,可得出偏倚的結果。因此使用Brooks-Gelman-Rubin方法診斷模型收斂滿意度時需同時滿足上述的3個條件。
2.4 排序概率表與排序概率圖(Rank probabilities and rankogram)
表 4為經過n.adapt=5 000與n.iter=20 000迭代后的排序概率數據,數據可由命令ranks <- rank.probability(results,preferred direction = 1)獲取。排序概率表(rank probabilities)由行數與列數等于總干預數的表格組成(本文中總干預數為14),首行為排序,首列為干預措施,表格中的數據為排序概率,其表示干預措施排列在第n位的概率 [20]。表中數據以橫向形式閱讀,以干預措施A和B為例,干預措施A排第1~11位的概率均接近于0,排第12位的概率為0.3%,排第13位的概率為6.6%,排第14位的概率為93.2%。而干預措施B排序概率分別為:第1位0.5%,2位1.2%,3位2.5%,4位4.1%,5位5.8%,6位7.2%,7位8.7%,8位10.2%,9位11.3%,10位12.3%,11位13.7%,12位14.0%,13位8.6%,14位0.0%。結合整個排序概率表,可知干預措施A排最后一位的可能較大,但具體排序仍需進一步分析。

排序概率圖(rankogram)以柱狀圖或曲線圖形式表示各干預的排序概率,可允許研究者進行直觀評估 [21]。當干預措施之間差異較大時,排序概率圖可幫助研究者較快預判最優或最劣干預措施。圖 4為以柱狀圖表達的排序概率圖。

2.5 累積排序概率圖與累積排序概率圖下面積(cumulative ranking plot and surface under the cumulative ranking)
在比較多種干預措施進行后,研究者便可獲知最優干預 [22]。但若最優干預無法獲取、難以實施或價格昂貴時,研究者便需考慮最優干預以外的干預措施 [18]。累積排序概率圖與累積排序概率圖下面積可幫助研究者決策。表 5為排序概率數據的累積概率數據,根據累積數據可制作出各干預措施的累積排序概率圖(cumulative ranking plot)并計算其累積排序概率圖下面積(surface under the cumulative ranking,SUCRA)。SUCRA為匯總累積排序概率的指標,其計算公式為SUCRAj = ,其中j為干預措施,b為排序,a為總干預數,cumj,b為干預措施j在排序b的累積概率 [23]。SUCRA的值介于0與1之間(0≤ SUCRA≤ 1),當SUCRA為1時提示干預措施絕對有效,而為0時則提示干預措施絕對無效 [24]。根據SUCRA值的大小可進行干預措施優劣的排序 [25]。圖 5為各干預措施的累積排序概率圖及相應SUCRA值,結果顯示干預C的SUCRA值最高(81.42%),其次為干預F(78.88%),以此類推,可得出干預措施的排序為C、F、H、I、D、L、J、K、B、E、G、A。


2.6 網狀關系圖(network plot)
當較多干預措施納入網狀Meta分析時,僅依靠數據可能難以識別各干預間的對比關系,而網狀關系圖的出現則使得此問題得到解決。經典網狀關系圖的描繪方式最先由Fruchterman與Reingold等 [26]學者提出,其特點包括:① 各個頂點均勻分布;② 盡量減少線條交叉;③ 各線條長度均勻;④ 反映固有的對稱性;⑤ 與展示框架配對。圖 6為gemtc包繪制出的網狀關系圖,其描繪方式符合以上提點。目前國內已有文獻介紹網狀關系圖的構建及解釋,具體繪制過程及解讀可參考《網狀Meta分析中網狀關系圖的繪制》一文 [27]。

3 結語
本文闡述了基于gemtc程序包與sucraplot函數的網狀Meta分析相關結果的解讀過程。軌跡圖、密度圖及Brooks-Gelman-Rubin診斷圖均可對模型收斂程度進行診斷。軌跡圖與密度圖的判斷基于視覺評估,其主觀成分較Brooks-Gelman-Rubin診斷圖大。而Brooks-Gelman-Rubin診斷圖則提供了圖形與PSRF值以進行定性及定量判斷,以此為基礎的收斂程度評估結果較為準確及客觀,但判斷模型是否達到收斂時需同時考慮上述的3個條件。排序概率圖的優勢在于可為研究者提供干預措施排序的初步判斷,但擁有較高排序概率的干預措施并不一定為最有效的,仍有許多不確定因素可干擾排序,如可靠區間(credible intervals)的寬度。若單純以排序概率判斷干預的優劣,可能得出錯誤的結論 [28]。SUCRA的優勢在于其可將大量的數據融合于若干個簡單數據,簡化了干預措施療效判斷的過程。但當療效評估尺度不一致時,使用SUCRA可導致錯誤的結論 [23]。網狀關系圖可幫助研究者快速了解干預措施的對比關系,避免因數據繁雜而影響判斷。
基于網狀Meta分析模型的復雜性,網狀Meta分析的結果與其模型選擇的分布、迭代計算次數是否足夠、初始值的設定等密切相關,因此網狀模型需根據納入數據的類型及意義慎重選擇,而結果的解讀同樣需小心謹慎。
隨著醫學研究的深入,干預措施已逐漸呈多樣化發展。面對多種干預措施,受限于兩兩對比的傳統Meta分析已不能為選擇最優干預措施提供有效的方法學支持,而網狀Meta分析的提出 [
1 軟件、程序包的安裝及數據準備
R軟件與gemtc程序包的安裝方法及數據處理過程請參照《R軟件gemtc程序包在網狀Meta分析中的應用》一文 [7]。由于本文所調用的軟件為Winbugs軟件,并且數據計算基于隨機模型,因此本文將model及mtc.run語句改寫為model <- mtc.model(network,type = "consistency",factor = 2.5,n.chain = 3,linearModel="random")和results <-mtc.run(model,sampler ="R2WinBUGS",n.adapt = 5000,n.iter = 20000,thin = 1) 。為與前文保持一致,本文選取干預措施G與干預措施I之間的比較為例解釋。因suraplot函數未體現累積排序概率圖下面積的結果,本文將suraplot函數改寫,加入累積排序概率圖下面積值以進一步解釋結果。
2 網狀Meta分析的結果分析及解讀
2.1 軌跡圖(trace plot)
軌跡圖為一種在迭代計算過程中表現MCMC鏈波動過程的圖,可因迭代次數及預設分布不同而表現為不同形式,用于診斷模型的收斂程度(convergence)。通過軌跡圖形可了解各條馬爾科夫鏈-蒙特卡羅鏈(Markov Chain Monte Carlo chain,MCMC chain)在計算過程中是否達到穩定及良好的重疊,以判斷模型收斂程度是否滿意 [8, 9]。滿意的收斂取決于足夠的迭代次數,在軌跡圖中表現為各條MCMC鏈相互重疊,視覺觀察不能識別任何一條鏈的迭代過程 [10]。我們將通過不同的預迭代次數及迭代運算次數進行說明 [11],具體參數如表 1所示。

如圖 1a所示,我們先將預迭代次數及迭代次數設定為0和50,結果顯示各條MCMC鏈未明顯擬合,肉眼可識別單條鏈的波動,收斂程度差。此時預迭代次數及迭代運算次數均不足,應增加預迭代及迭代次數。

圖 1b為保留0次預迭代,增加迭代次數至2 000的結果。與圖 1a比較,圖形起始部分各條鏈經幾十次運算后達到穩定,并相互重疊,但重疊面積僅占鏈波動范圍的小部分,收斂程度仍不滿意。由于迭代運算中需使初始值效應最小化,達到穩定前的數據則需剔除。因此,需增加預迭代及迭代次數,尤其是預迭代次數。
圖 1c為預迭代次數及迭代次數設定為1 000及50的結果。與圖 1b比較,圖形起始部分的各條鏈已呈現相互重疊趨勢,但由于迭代運算次數不足,肉眼仍可識別單條鏈的擺動,尤其在1 020~1 040次處明顯。因此,此時需增加預迭代及迭代次數,尤其是迭代的次數。
圖 1d為預迭代次數及迭代次數增加至5 000的結果。各MCMC鏈從起始部分達到明顯融合,但整體重疊面積僅占鏈波動范圍的小部分。此時迭代計算次數仍不足,收斂程度不滿意,仍需增加迭代次數。
圖 1e預迭代次數及迭代次數設定為5 000及20 000的結果。各條MCMC鏈從起始部分已達到穩定融合,并且在后續計算中重疊面積占鏈波動范圍的大部分,且肉眼不能識別單條鏈的波動,收斂程度滿意。
2.2 密度圖(density plot)
密度圖為一種表現參數的后驗數值的分布形態圖,其作用與軌跡圖一致,均用于診斷模型的程度 [12]。密度圖的評估方法為在預先設定分布的基礎上,經過數值模擬計算后,觀察后驗數值的分布形態是否與預設分布一致 [13]。Bandwidth值可作為定量評估,其值越小,表示參數后驗數值的分布范圍與預設分布范圍的差距越小。經足夠迭代運算后,Bandwidth趨向于0并達到穩定 [14]。Bandwidth值則與迭代運算次數相關,而后驗數據分布形態與預迭代次數相關 [15]。良好的收斂在密度圖中表現為一條基本符合模型預設分布的平滑曲線,并且曲線分布及Bandwidth值達到穩定 [16]。密度圖的解釋本文仍以不同迭代次數的計算進行說明,具體參數見表 2所示。模型代碼可通過命令行cat(model$code)來獲取,通過模型可獲知干預措施G與干預措施I的對比預設分布為正態分布(d.G.I~dnorm(0,prior.prec))。各圖中的N值代表迭代次數,Bandwidth值代表后驗分布與先驗分布的差距程度。

對比圖 2a與圖 2b的圖形及計算結果可見:① 兩者的曲線分布均呈現偏態分布,并可見雙峰,且Bandwidth值為0.109 7與0.113 4,與預設分布差距偏大。② 兩者的計算結果中均值、95%CI相差較大(mean(a)=0.451 0,95%CI(a)= -0.122 7~1.067 5;mean(b)=0.3741 1,95%CI(b)= -0.175 3~0.914 5),計算結果不穩定。此時模型收斂程度差,應增加預迭代次數及迭代計算次數。

如圖 2c所示,我們先將迭代次數增加至5 000次。與圖 2b對比,曲線形態進一步趨向正態分布,且Bandwidth值下降至0.038 74,與預設分布差距明顯減小,且計算結果較圖 2b進一步集中(mean(c)=0.334 7,95%CI(c)= -0.154 81~0.826 0)。但曲線仍可見雙峰,曲線分布仍可能受初始值影響,模型收斂程度不滿意。此時需增加預迭代次數。
圖 2d為將預迭代次數增加至5 000次的結果。圖中曲線形態已由圖 2c的雙峰變為單峰,分布形態已接近正態分布。由于迭代次數不變,因此Bandwidth值變化較小(Bandwidth(d)=0.038 85)。與圖 2c計算結果對比,mean及95%CI值變化較小(mean(d)=0.343 5,95%CI(d)= -0.151 81~0.840 6)。但由于n.adapt=5 000及n.iter=5 000的軌跡圖顯示收斂不滿意,因此仍需增加迭代次數。
如圖 2e所示,我們將迭代次數增加至20 000次。此時圖形分布已呈正態分布,與預設分布差距進一步縮小(Bandwidth(e)=0.029 55)。且與圖 2d對比,計算結果已基本穩定(mean(e)=0.3443,95%CI(e)= -0.152 20~0.840 6)。此時模型收斂程度滿意。
為進一步評估模型收斂滿意度,我們將迭代次數增加值40 000次,如圖 2f所示。此時曲線分布與圖 2e對比無明顯變化,Bandwidth值(Bandwidth(e)=0.025 7)及計算結果(mean(f)=0.342 0,95%CI(f)= -0.156 70~0.838 0)變化較小,可判斷n.adapt=5 000及n.inter=20 000下模型收斂程度滿意。
2.3 Brooks-Gelman-Rubin診斷圖(Brooks-Gelman-Rubin diagnosis plot)
Brooks-Gelman-Rubin診斷圖為一種結合基于區間的圖形評估和規模縮減因子(potential scale reduction factor,PSRF) [17]定量分析的診斷模型收斂程度的圖形,最先由Brooks和Gelman等 [18]提出。圖形評估方法為每次迭代均計算出縮減因子(shrink factor)的中位值及97.5%值,經過n次迭代后形成曲線并觀察曲線是否相互擬合并持續穩定 [19]。而PSRF的計算方法為將所有MCMC鏈最后一次迭代的結果進行分析,將鏈中與鏈間的變量相互對比。PSRF值趨向于1提示模型收斂滿意。Brooks和Gelman指出PSRF值低于1.2可予以接受 [18],但gemtc程序包作者Valkenhoef等 [17]建議將PSRF值限定于1到1.05之間(1<PSRF≤ 1.05)則更為合理。根據Brooks和Gelman的建議 [19],滿意的收斂需同時滿足3個條件:① 縮減因子的中位值經n次迭代計算后趨向于1并達到穩定;② 縮減因子的97.5%經n次迭代計算后趨向于1并達到穩定;③ PSRF值趨向于1。本文仍以不同迭代次數進行計算,具體參數如表 3所示。由于Brooks-Gelman-Rubin診斷圖需迭代50次以上才能得出,因此本文以n.iter = 500為起始。PSRF值的結果可由gelman.diag(results)得出。

如圖 3a所示,在經過預迭代100次及迭代500后,縮減因子(shrink factor)的中位值及97.5%值始終在波動,并未相互融合并趨向于1,PSRF值為1.18,提示模型收斂程度差。

圖 3b為與迭代次數及迭代次數各增加10倍(n.adapt=1 000,n.iter=5 000)的結果。圖形顯示縮減因子的中位值及97.5%值仍在波動,在計算3 000次后呈現擬合趨勢,但并未相互擬合。雖然此時PSRF接近于1(PSRF=1.02),但并未達到3個條件同時滿意。因此模型收斂程度雖較圖 3a改善,但仍不滿意。
圖 3c為n.adapt = 5 000,n.iter = 20 000結果,結果顯示經過5 000次預迭代后縮減因子的中位值及97.5%值迅速趨向于1并達到穩定,且PSRF值為1,提示模型收斂程度滿意。
在使用Brooks-Gelman-Rubin診斷方法時切忌單純使用PSRF值來評估收斂是否滿意。以圖 2b為例,當計算至3 000次時,此時的PSRF值接近于1(PSRF=1.02),但縮減因子的中位值及97.5%在后續的計算中仍在波動,且未相互擬合。若在計算3 000次時以PSRF=1.02判斷收斂滿意,可得出偏倚的結果。因此使用Brooks-Gelman-Rubin方法診斷模型收斂滿意度時需同時滿足上述的3個條件。
2.4 排序概率表與排序概率圖(Rank probabilities and rankogram)
表 4為經過n.adapt=5 000與n.iter=20 000迭代后的排序概率數據,數據可由命令ranks <- rank.probability(results,preferred direction = 1)獲取。排序概率表(rank probabilities)由行數與列數等于總干預數的表格組成(本文中總干預數為14),首行為排序,首列為干預措施,表格中的數據為排序概率,其表示干預措施排列在第n位的概率 [20]。表中數據以橫向形式閱讀,以干預措施A和B為例,干預措施A排第1~11位的概率均接近于0,排第12位的概率為0.3%,排第13位的概率為6.6%,排第14位的概率為93.2%。而干預措施B排序概率分別為:第1位0.5%,2位1.2%,3位2.5%,4位4.1%,5位5.8%,6位7.2%,7位8.7%,8位10.2%,9位11.3%,10位12.3%,11位13.7%,12位14.0%,13位8.6%,14位0.0%。結合整個排序概率表,可知干預措施A排最后一位的可能較大,但具體排序仍需進一步分析。

排序概率圖(rankogram)以柱狀圖或曲線圖形式表示各干預的排序概率,可允許研究者進行直觀評估 [21]。當干預措施之間差異較大時,排序概率圖可幫助研究者較快預判最優或最劣干預措施。圖 4為以柱狀圖表達的排序概率圖。

2.5 累積排序概率圖與累積排序概率圖下面積(cumulative ranking plot and surface under the cumulative ranking)
在比較多種干預措施進行后,研究者便可獲知最優干預 [22]。但若最優干預無法獲取、難以實施或價格昂貴時,研究者便需考慮最優干預以外的干預措施 [18]。累積排序概率圖與累積排序概率圖下面積可幫助研究者決策。表 5為排序概率數據的累積概率數據,根據累積數據可制作出各干預措施的累積排序概率圖(cumulative ranking plot)并計算其累積排序概率圖下面積(surface under the cumulative ranking,SUCRA)。SUCRA為匯總累積排序概率的指標,其計算公式為SUCRAj = ,其中j為干預措施,b為排序,a為總干預數,cumj,b為干預措施j在排序b的累積概率 [23]。SUCRA的值介于0與1之間(0≤ SUCRA≤ 1),當SUCRA為1時提示干預措施絕對有效,而為0時則提示干預措施絕對無效 [24]。根據SUCRA值的大小可進行干預措施優劣的排序 [25]。圖 5為各干預措施的累積排序概率圖及相應SUCRA值,結果顯示干預C的SUCRA值最高(81.42%),其次為干預F(78.88%),以此類推,可得出干預措施的排序為C、F、H、I、D、L、J、K、B、E、G、A。


2.6 網狀關系圖(network plot)
當較多干預措施納入網狀Meta分析時,僅依靠數據可能難以識別各干預間的對比關系,而網狀關系圖的出現則使得此問題得到解決。經典網狀關系圖的描繪方式最先由Fruchterman與Reingold等 [26]學者提出,其特點包括:① 各個頂點均勻分布;② 盡量減少線條交叉;③ 各線條長度均勻;④ 反映固有的對稱性;⑤ 與展示框架配對。圖 6為gemtc包繪制出的網狀關系圖,其描繪方式符合以上提點。目前國內已有文獻介紹網狀關系圖的構建及解釋,具體繪制過程及解讀可參考《網狀Meta分析中網狀關系圖的繪制》一文 [27]。

3 結語
本文闡述了基于gemtc程序包與sucraplot函數的網狀Meta分析相關結果的解讀過程。軌跡圖、密度圖及Brooks-Gelman-Rubin診斷圖均可對模型收斂程度進行診斷。軌跡圖與密度圖的判斷基于視覺評估,其主觀成分較Brooks-Gelman-Rubin診斷圖大。而Brooks-Gelman-Rubin診斷圖則提供了圖形與PSRF值以進行定性及定量判斷,以此為基礎的收斂程度評估結果較為準確及客觀,但判斷模型是否達到收斂時需同時考慮上述的3個條件。排序概率圖的優勢在于可為研究者提供干預措施排序的初步判斷,但擁有較高排序概率的干預措施并不一定為最有效的,仍有許多不確定因素可干擾排序,如可靠區間(credible intervals)的寬度。若單純以排序概率判斷干預的優劣,可能得出錯誤的結論 [28]。SUCRA的優勢在于其可將大量的數據融合于若干個簡單數據,簡化了干預措施療效判斷的過程。但當療效評估尺度不一致時,使用SUCRA可導致錯誤的結論 [23]。網狀關系圖可幫助研究者快速了解干預措施的對比關系,避免因數據繁雜而影響判斷。
基于網狀Meta分析模型的復雜性,網狀Meta分析的結果與其模型選擇的分布、迭代計算次數是否足夠、初始值的設定等密切相關,因此網狀模型需根據納入數據的類型及意義慎重選擇,而結果的解讀同樣需小心謹慎。