引用本文: 謝緯華, 戴品遠, 孫金芳, 王莉娜, 余小金. 基于增強型漏斗圖與試驗序貫分析的 Meta 分析結果穩定性評價. 中國循證醫學雜志, 2020, 20(6): 713-718. doi: 10.7507/1672-2531.201910150 復制
Meta 分析是證據累積的過程,因此證據的強度和異質性均可用于反映當前證據的穩定性。后續研究結果的納入可能會改變先前 Meta 分析的效應量估計與異質性,從而改變 Meta 分析的結論[1, 2]。因此,對 Meta 分析結果穩定性的評價對于 Meta 分析結論的合理推廣和應用具有重要意義。
試驗序貫分析(trial sequential analysis,TSA)是將成組序貫設計中提前終止和期中分析的思想引入 Meta 分析。基于估計的期望信息量(required information size,RIS)來判斷當前 Meta 分析所納入研究的樣本量是否足夠[3]。在未達到 RIS 時,采用調高的檢驗統計量界值即 TSA 監測限或調低的界值即無效限來做結論以控制假陽性或假陰性。TSA 可定量評價基于當前證據結論的穩定性[4, 5]。
漏斗圖是 Meta 分析常用的評價發表偏倚的工具[6],比較直觀和易于理解,為研究者所熟知和常規應用。近年來,漏斗圖在 Meta 分析結果穩定性評價中的拓展應用開始受到關注[7, 8],但在實際系統評價和 Meta 分析中的應用仍寥寥無幾。
Palmer 等[9]在經典漏斗圖基礎上增加基于不同統計學顯著性水平的輪廓線,進而分析漏斗圖不對稱性的來源是發表偏倚還是異質性,并將其稱為輪廓增強型漏斗圖。Langan 等[10]借鑒了經典漏斗圖與上述輪廓增強型漏斗圖的思想,在經典漏斗圖的基礎上增加顯著性輪廓線與異質性輪廓線,提出擴展型漏斗圖的概念,用于探討后續研究納入對當前 Meta 分析結果顯著性和異質性的潛在影響,從而反映當前 Meta 分析的穩定性。本研究將輪廓增強型漏斗圖與擴展型漏斗圖 2 種統稱為增強型漏斗圖。
本研究將以已發表的 Meta 分析結果為例,探討增強型漏斗圖與 TSA 在評估 Meta 分析結果穩定性時的應用,為 Meta 分析結果的事后評價及系統評價的完整框架提供方法學支持。
1 資料與方法
1.1 數據來源
數據來源于 Yuan 等[11]的 Meta 分析,該研究共納入 21 篇文獻(24 個研究),包含 1 704 例研究人群,其中試驗組 866 例,對照組 838 例,分別分析了綠茶攝入對超重或肥胖人群甘油三酯、總膽固醇、低密度脂蛋白和高密度脂蛋白等的影響,但未對 Meta 分析結果的穩定性進行評價。
1.2 增強型漏斗圖
1.2.1 效應量顯著性穩定性評價
用于效應量顯著性的穩定性評價時,所謂顯著性輪廓線是在假設納入后續新的研究后更新 Meta 分析的合并效應量之 95% 可信區間上、下限分別等于無效值(如均數差 0),構建后續新研究的效應量(X 軸)與標準誤(Y 軸)的函數關系,并繪制漏斗圖[10]。根據不同的顯著性水平可繪制不同的輪廓線。顯著性輪廓線將圖域分為無效區域(兩組差異無統計學意義)、優效區域(試驗組效果優于對照組)和劣效區域(試驗組效果劣于對照組)。若后續新增研究落入無效區域,更新的 Meta 分析結果將會無統計學意義;若新增研究落入優效區域時,更新的 Meta 分析結果將會證實試驗組的效果優于對照組;若新增研究落入劣效區域,更新的 Meta 分析結果將會提示試驗組的效果劣于對照組。該步驟采用 R 3.6.1 軟件“extfunnel”包 1.3 完成。
1.2.2 研究間異質性穩定性評價
用于研究間異質性穩定性評價時,所謂異質性輪廓線是在假設加入新研究后的一系列異質性參數(如I2)下,構建后續新研究的效應量(X 軸)與標準誤(Y 軸)之間的函數關系,并繪制漏斗圖[10]。如果有研究出現在比當前異質性更高的輪廓線上時,未來新研究的加入可能會增大異質性;若出現在當前異質性對應的輪廓線區域之內,則異質性不變或減小。該步驟也可采用 R 3.6.1 軟件“extfunnel”包 1.3 完成。
1.2.3 漏斗圖不對稱性原因分析
經典的漏斗圖以合并效應量為中心構造其期望的 95% 可信區間,繪制交叉的輪廓線。輪廓增強型漏斗圖構造以無效值(如均數差 0)為中心的不同可信度(或者不同顯著性水平,如 0.01、0.05、0.1)的可信區間,繪制相應的交叉輪廓線[9]。輪廓線將圖域劃分為不同顯著性水平的區域。當漏斗圖存在明顯的不對稱性時,通過剪補法[12]獲取為校正不對稱性而需要補充的研究,并呈現在圖中。若補充的研究落入無統計學意義區域,提示不對稱性是由發表偏倚造成的;若補充的研究落入有統計學意義區域,提示不對稱性可能來源于發表偏倚以外的異質性原因。同時,本研究采用 Begg’s 檢驗和 Egger’s 檢驗對發表偏倚進行定量檢驗,當 P≤0.05 時,提示可能存在發表偏倚。該步驟采用 R 3.6.1 軟件“meta”包 4.9-7 完成。
當研究間異質性較大時(I2>40%),效應量顯著性穩定性評價、研究間異質性穩定性評價、漏斗圖不對稱性原因分析均采用隨機效應模型進行 Meta 分析;否則,采用固定效應模型。
1.3 TSA 圖
設定一類錯誤 α 為 0.05、二類錯誤 β 為 0.2,基于現有 Meta 分析估計的效應量和標準誤估計 RIS、TSA 監測限和無效限。基于累積 Meta 分析計算效應量假設檢驗的累積 Z 統計量。基于估算的 4 個參數構建 TSA 圖。當納入研究總樣本量達到 RIS 后,提示當前 Meta 分析納入的樣本量足夠;當總樣本量未達到 RIS 時,若累積 Z 值曲線穿過 TSA 監測限或無效限,提示結果穩定;當總樣本量未達到 RIS,且累積 Z 值曲線未穿過 TSA 監測限或無效限時,提示仍需累積更多證據來驗證結果。TSA 步驟采用 TSA v0.9.5.10 beta 軟件完成[3]。
2 結果
2.1 效應量顯著性穩定性分析
圖 1 為綠茶攝入對超重或肥胖人群甘油三酯、總膽固醇、低密度脂蛋白和高密度脂蛋白等指標的 Meta 分析結果的增強型漏斗圖。圖 1a~d 中空白區域、藍色區域和黃色區域分別代表了無效區域、優效區域和劣效區域。

圖 1a 顯示在甘油三酯水平方面,試驗組與對照組差異無統計學意義[MD=?7.02,95%CI=(?14.58,0.54)]。當前有 5 個研究出現在藍色區域(優效區域),提示后續研究出現在該區域的可能性較大,這可能改變 Meta 分析結果為試驗組的甘油三酯水平低于對照組,且差異有統計學意義,即當前 Meta 分析結果未達到穩定狀態。
圖 1b 顯示試驗組的總膽固醇水平低于常規護理組[MD=?3.38,95%CI=(?6.42,?0.33)],兩組差異有統計學意義。當前有 2 個研究落入空白區域,提示后續研究有一定幾率落入該區域,此時 Meta 分析結果將有可能從有統計學意義變為無統計學意義。
圖 1c 顯示試驗組的低密度脂蛋白水平低于對照組[MD=?5.29,95%CI=(?7.92,?2.66)],兩組差異有統計學意義。目前所有研究均集中在藍色區域(優效區域),且黃色區域與空白區域所占面積較小,提示后續研究出現在黃色區域或空白區域的概率較小,即當前 Meta 分析結果趨于穩定。
圖 1d 顯示在高密度脂蛋白水平方面,試驗組與對照組差異無統計學意義[MD=1.13,95%CI=(?0.24,2.51)]。當前有 1 個研究出現在藍色區域(優效區域)且部分研究出現在空白區域與藍色區域交界處附近,提示后續新研究有可能改變 Meta 分析結果為試驗組高密度脂蛋白高于對照組,且差異有統計學意義。
2.2 研究間異質性穩定性分析
圖 2 為綠茶對目標人群各指標的研究間異質性(以 I2 表示)的增強型漏斗圖。圖 2a~d 中不同顏色線型的線條分別對應不同的異質性,黑色實線對應當前異質性大小。

甘油三酯水平結果在現有研究間存在輕微的異質性(I2=29%)。個別研究出現在當前異質性輪廓線與 40% 異質性輪廓線之間,提示后續新研究可能會顯著增大異質性,當前研究間的異質性未達到穩定狀態(圖 2a)。
不同研究的總膽固醇水平無明顯異質性(I2=0%),沒有研究分布在高異質性區域,2 個研究分布在 0% 輪廓線與 10% 輪廓線之間,提示后續研究可能會使異質性輕微增加,但當前研究間異質性已趨于穩定(圖 2b)。
不同研究的低密度脂蛋白的異質性穩定性分析與總膽固醇相似(圖 2c)。
不同研究的高密度脂蛋白水平存在明顯異質性(I2=53%),個別研究分布在更高異質性區域(53%~60% 和 60%~70%),提示后續研究結果仍有較大可能使研究間異質性進一步增加(圖 2d)。
2.3 漏斗圖不對稱性原因分析
Begg’s 檢驗和 Egger’s 檢驗均未發現當前 Meta 分析存在明顯發表偏倚(表 1)。同時,本研究結果顯示低密度脂蛋白與高密度脂蛋白的經典漏斗圖未發現明顯的不對稱性,而甘油三酯與總膽固醇的漏斗圖存在明顯的不對稱性。圖 3 為甘油三酯與總膽固醇漏斗圖的輪廓增強型漏斗圖。圖中的實心散點表示現有研究,空心散點表示采用剪補法獲得的校正不對稱性所需的補充研究。黃色區域、棕色區域、藍色區域和空白區域分別表示不同顯著性水平區域,即 P<0.01、0.01<P<0.05、0.05<P<0.1、P>0.1,前三個區域統稱為有統計學意義區域,最后一個區域稱為無統計學意義區域。


可看出,對當前甘油三酯水平的 Meta 分析結果需要至少補充 7 個研究(空心散點)才能消除不對稱性(圖 3a)。而需補充的 7 個研究有 4 個分布在有統計學意義區域,3 個分布在無統計學意義區域,這提示漏斗圖的不對稱性不僅由發表偏倚引起,可能還包括了異質性原因。
對當前總膽固醇水平的 Meta 分析結果需要補充 3 個研究(空心散點)才能消除不對稱性(圖 3b)。需補充的 3 個研究中 2 個分布在左下空白區域,1 個分布在藍色區域(0.05<P<0.1),提示發表偏倚可能是造成該漏斗圖不對稱的主要原因。
2.4 TSA 結果
圖 4 為甘油三酯和低密度脂蛋白水平的 TSA 結果。甘油三酯水平 Meta 分析結果的累積 Z 值曲線未達到 RIS(4 434),且未穿過 TSA 監測限或無效限,提示目前證據量不足,Meta 分析結果未穩定,仍需更多證據支持(圖 4a)。總膽固醇與高密度脂蛋白水平的 TSA 結果與之類似。僅低密度脂蛋白水平的累積 Z 值曲線穿過 TSA 監測限,且達到 RIS(728),提示 Meta 分析結果已穩定(圖 4b)。

3 討論
本研究基于 Meta 分析數據實例結合增強型漏斗圖和 TSA 較為全面地評價了 Meta 分析結果的穩定性,具有較強的實際意義。系統評價與 Meta 分析結果被看作是一種累積多項獨立研究的較高等級的證據,但證據的不斷更新又是科學研究的重要特征,因此 Meta 分析結果的穩定性評價對于在不同研究情形下得出科學的結論有實際意義[10, 13]。
本研究中增強型漏斗圖與 TSA 得到的結果具有較好的一致性。增強型漏斗圖的顯著性穩定性分析提示后續新增研究結果可能會改變甘油三酯、總膽固醇與高密度脂蛋白水平的合并效應量的大小與顯著性,而低密度脂蛋白水平的 Meta 分析結論較為穩定。TSA 的結果也顯示甘油三酯、總膽固醇和高密度脂蛋白的 Meta 分析結果尚未穩定,而低密度脂蛋白的 Meta 分析結果已穩定。但二者所得出的結論的關系在不同研究中仍有待探索。
我們認為,增強型漏斗圖與 TSA 在評價當前累積證據穩定性時可相互印證、相互補充。增強型漏斗圖與 TSA 分別基于不同的角度對當前 Meta 分析的穩定性進行判斷。前者主要用于分析漏斗圖不對稱的原因,及納入后續研究結果后對當前 Meta 分析顯著性和異質性的潛在影響。而 TSA 通過 RIS 與檢驗顯著性水平的調整來反映當前累積證據量是否足夠,并進而評價當前 Meta 分析的穩定性。而且,兩種分析均可提供直觀的可視化圖形,易于理解。若研究證據較強,理論上兩種方法的結論應該一致。考慮到研究的隨機性,當證據強度不足的時候,可能會出現兩種方法得出的穩定性評價結果不一致的情況,此時與整個 Meta 分析下結論的原則一致,需要謹慎做出結論。因此,結合兩種方法可構建良好的 Meta 分析穩定性評價體系,對 Meta 分析結果給出科學、客觀的評價。
本研究所采用的增強型漏斗圖與 TSA 均存在一定的局限性:① 當增強型漏斗圖用于分析 Meta 分析顯著性穩定性時,該方法假定加入新研究的 Meta 分析合并模型與原 Meta 分析所采用模型相同。而新研究的加入可能會改變研究間的異質性,從而影響 Meta 分析模型的選擇。② TSA 及其軟件仍有待發展。用于 TSA 的主要軟件 TSA(v0.9.5.10 beta),僅提供一種計算 TSA 監測限的方法(O’Brien-Fleming 損耗函數)[3]。目前 Stata 的“metacumbounds”命令可對二分類與生存數據進行 TSA,且有不同的 RIS 算法及 TSA 監測限的不同損耗函數設置[14, 15],但因對方法的理解問題并未被普遍應用。
聯合增強型漏斗圖和 TSA 可從證據的量、推斷誤差控制及未來研究的潛在影響等角度評價當前 Meta 分析結果的穩定性,較好地補充了系統評價和 Meta 分析的完整方法體系,但方法應用的方便性和可解釋性仍有局限性,預計將會在越來越多的系統評價和 Meta 分析中應用和完善。
Meta 分析是證據累積的過程,因此證據的強度和異質性均可用于反映當前證據的穩定性。后續研究結果的納入可能會改變先前 Meta 分析的效應量估計與異質性,從而改變 Meta 分析的結論[1, 2]。因此,對 Meta 分析結果穩定性的評價對于 Meta 分析結論的合理推廣和應用具有重要意義。
試驗序貫分析(trial sequential analysis,TSA)是將成組序貫設計中提前終止和期中分析的思想引入 Meta 分析。基于估計的期望信息量(required information size,RIS)來判斷當前 Meta 分析所納入研究的樣本量是否足夠[3]。在未達到 RIS 時,采用調高的檢驗統計量界值即 TSA 監測限或調低的界值即無效限來做結論以控制假陽性或假陰性。TSA 可定量評價基于當前證據結論的穩定性[4, 5]。
漏斗圖是 Meta 分析常用的評價發表偏倚的工具[6],比較直觀和易于理解,為研究者所熟知和常規應用。近年來,漏斗圖在 Meta 分析結果穩定性評價中的拓展應用開始受到關注[7, 8],但在實際系統評價和 Meta 分析中的應用仍寥寥無幾。
Palmer 等[9]在經典漏斗圖基礎上增加基于不同統計學顯著性水平的輪廓線,進而分析漏斗圖不對稱性的來源是發表偏倚還是異質性,并將其稱為輪廓增強型漏斗圖。Langan 等[10]借鑒了經典漏斗圖與上述輪廓增強型漏斗圖的思想,在經典漏斗圖的基礎上增加顯著性輪廓線與異質性輪廓線,提出擴展型漏斗圖的概念,用于探討后續研究納入對當前 Meta 分析結果顯著性和異質性的潛在影響,從而反映當前 Meta 分析的穩定性。本研究將輪廓增強型漏斗圖與擴展型漏斗圖 2 種統稱為增強型漏斗圖。
本研究將以已發表的 Meta 分析結果為例,探討增強型漏斗圖與 TSA 在評估 Meta 分析結果穩定性時的應用,為 Meta 分析結果的事后評價及系統評價的完整框架提供方法學支持。
1 資料與方法
1.1 數據來源
數據來源于 Yuan 等[11]的 Meta 分析,該研究共納入 21 篇文獻(24 個研究),包含 1 704 例研究人群,其中試驗組 866 例,對照組 838 例,分別分析了綠茶攝入對超重或肥胖人群甘油三酯、總膽固醇、低密度脂蛋白和高密度脂蛋白等的影響,但未對 Meta 分析結果的穩定性進行評價。
1.2 增強型漏斗圖
1.2.1 效應量顯著性穩定性評價
用于效應量顯著性的穩定性評價時,所謂顯著性輪廓線是在假設納入后續新的研究后更新 Meta 分析的合并效應量之 95% 可信區間上、下限分別等于無效值(如均數差 0),構建后續新研究的效應量(X 軸)與標準誤(Y 軸)的函數關系,并繪制漏斗圖[10]。根據不同的顯著性水平可繪制不同的輪廓線。顯著性輪廓線將圖域分為無效區域(兩組差異無統計學意義)、優效區域(試驗組效果優于對照組)和劣效區域(試驗組效果劣于對照組)。若后續新增研究落入無效區域,更新的 Meta 分析結果將會無統計學意義;若新增研究落入優效區域時,更新的 Meta 分析結果將會證實試驗組的效果優于對照組;若新增研究落入劣效區域,更新的 Meta 分析結果將會提示試驗組的效果劣于對照組。該步驟采用 R 3.6.1 軟件“extfunnel”包 1.3 完成。
1.2.2 研究間異質性穩定性評價
用于研究間異質性穩定性評價時,所謂異質性輪廓線是在假設加入新研究后的一系列異質性參數(如I2)下,構建后續新研究的效應量(X 軸)與標準誤(Y 軸)之間的函數關系,并繪制漏斗圖[10]。如果有研究出現在比當前異質性更高的輪廓線上時,未來新研究的加入可能會增大異質性;若出現在當前異質性對應的輪廓線區域之內,則異質性不變或減小。該步驟也可采用 R 3.6.1 軟件“extfunnel”包 1.3 完成。
1.2.3 漏斗圖不對稱性原因分析
經典的漏斗圖以合并效應量為中心構造其期望的 95% 可信區間,繪制交叉的輪廓線。輪廓增強型漏斗圖構造以無效值(如均數差 0)為中心的不同可信度(或者不同顯著性水平,如 0.01、0.05、0.1)的可信區間,繪制相應的交叉輪廓線[9]。輪廓線將圖域劃分為不同顯著性水平的區域。當漏斗圖存在明顯的不對稱性時,通過剪補法[12]獲取為校正不對稱性而需要補充的研究,并呈現在圖中。若補充的研究落入無統計學意義區域,提示不對稱性是由發表偏倚造成的;若補充的研究落入有統計學意義區域,提示不對稱性可能來源于發表偏倚以外的異質性原因。同時,本研究采用 Begg’s 檢驗和 Egger’s 檢驗對發表偏倚進行定量檢驗,當 P≤0.05 時,提示可能存在發表偏倚。該步驟采用 R 3.6.1 軟件“meta”包 4.9-7 完成。
當研究間異質性較大時(I2>40%),效應量顯著性穩定性評價、研究間異質性穩定性評價、漏斗圖不對稱性原因分析均采用隨機效應模型進行 Meta 分析;否則,采用固定效應模型。
1.3 TSA 圖
設定一類錯誤 α 為 0.05、二類錯誤 β 為 0.2,基于現有 Meta 分析估計的效應量和標準誤估計 RIS、TSA 監測限和無效限。基于累積 Meta 分析計算效應量假設檢驗的累積 Z 統計量。基于估算的 4 個參數構建 TSA 圖。當納入研究總樣本量達到 RIS 后,提示當前 Meta 分析納入的樣本量足夠;當總樣本量未達到 RIS 時,若累積 Z 值曲線穿過 TSA 監測限或無效限,提示結果穩定;當總樣本量未達到 RIS,且累積 Z 值曲線未穿過 TSA 監測限或無效限時,提示仍需累積更多證據來驗證結果。TSA 步驟采用 TSA v0.9.5.10 beta 軟件完成[3]。
2 結果
2.1 效應量顯著性穩定性分析
圖 1 為綠茶攝入對超重或肥胖人群甘油三酯、總膽固醇、低密度脂蛋白和高密度脂蛋白等指標的 Meta 分析結果的增強型漏斗圖。圖 1a~d 中空白區域、藍色區域和黃色區域分別代表了無效區域、優效區域和劣效區域。

圖 1a 顯示在甘油三酯水平方面,試驗組與對照組差異無統計學意義[MD=?7.02,95%CI=(?14.58,0.54)]。當前有 5 個研究出現在藍色區域(優效區域),提示后續研究出現在該區域的可能性較大,這可能改變 Meta 分析結果為試驗組的甘油三酯水平低于對照組,且差異有統計學意義,即當前 Meta 分析結果未達到穩定狀態。
圖 1b 顯示試驗組的總膽固醇水平低于常規護理組[MD=?3.38,95%CI=(?6.42,?0.33)],兩組差異有統計學意義。當前有 2 個研究落入空白區域,提示后續研究有一定幾率落入該區域,此時 Meta 分析結果將有可能從有統計學意義變為無統計學意義。
圖 1c 顯示試驗組的低密度脂蛋白水平低于對照組[MD=?5.29,95%CI=(?7.92,?2.66)],兩組差異有統計學意義。目前所有研究均集中在藍色區域(優效區域),且黃色區域與空白區域所占面積較小,提示后續研究出現在黃色區域或空白區域的概率較小,即當前 Meta 分析結果趨于穩定。
圖 1d 顯示在高密度脂蛋白水平方面,試驗組與對照組差異無統計學意義[MD=1.13,95%CI=(?0.24,2.51)]。當前有 1 個研究出現在藍色區域(優效區域)且部分研究出現在空白區域與藍色區域交界處附近,提示后續新研究有可能改變 Meta 分析結果為試驗組高密度脂蛋白高于對照組,且差異有統計學意義。
2.2 研究間異質性穩定性分析
圖 2 為綠茶對目標人群各指標的研究間異質性(以 I2 表示)的增強型漏斗圖。圖 2a~d 中不同顏色線型的線條分別對應不同的異質性,黑色實線對應當前異質性大小。

甘油三酯水平結果在現有研究間存在輕微的異質性(I2=29%)。個別研究出現在當前異質性輪廓線與 40% 異質性輪廓線之間,提示后續新研究可能會顯著增大異質性,當前研究間的異質性未達到穩定狀態(圖 2a)。
不同研究的總膽固醇水平無明顯異質性(I2=0%),沒有研究分布在高異質性區域,2 個研究分布在 0% 輪廓線與 10% 輪廓線之間,提示后續研究可能會使異質性輕微增加,但當前研究間異質性已趨于穩定(圖 2b)。
不同研究的低密度脂蛋白的異質性穩定性分析與總膽固醇相似(圖 2c)。
不同研究的高密度脂蛋白水平存在明顯異質性(I2=53%),個別研究分布在更高異質性區域(53%~60% 和 60%~70%),提示后續研究結果仍有較大可能使研究間異質性進一步增加(圖 2d)。
2.3 漏斗圖不對稱性原因分析
Begg’s 檢驗和 Egger’s 檢驗均未發現當前 Meta 分析存在明顯發表偏倚(表 1)。同時,本研究結果顯示低密度脂蛋白與高密度脂蛋白的經典漏斗圖未發現明顯的不對稱性,而甘油三酯與總膽固醇的漏斗圖存在明顯的不對稱性。圖 3 為甘油三酯與總膽固醇漏斗圖的輪廓增強型漏斗圖。圖中的實心散點表示現有研究,空心散點表示采用剪補法獲得的校正不對稱性所需的補充研究。黃色區域、棕色區域、藍色區域和空白區域分別表示不同顯著性水平區域,即 P<0.01、0.01<P<0.05、0.05<P<0.1、P>0.1,前三個區域統稱為有統計學意義區域,最后一個區域稱為無統計學意義區域。


可看出,對當前甘油三酯水平的 Meta 分析結果需要至少補充 7 個研究(空心散點)才能消除不對稱性(圖 3a)。而需補充的 7 個研究有 4 個分布在有統計學意義區域,3 個分布在無統計學意義區域,這提示漏斗圖的不對稱性不僅由發表偏倚引起,可能還包括了異質性原因。
對當前總膽固醇水平的 Meta 分析結果需要補充 3 個研究(空心散點)才能消除不對稱性(圖 3b)。需補充的 3 個研究中 2 個分布在左下空白區域,1 個分布在藍色區域(0.05<P<0.1),提示發表偏倚可能是造成該漏斗圖不對稱的主要原因。
2.4 TSA 結果
圖 4 為甘油三酯和低密度脂蛋白水平的 TSA 結果。甘油三酯水平 Meta 分析結果的累積 Z 值曲線未達到 RIS(4 434),且未穿過 TSA 監測限或無效限,提示目前證據量不足,Meta 分析結果未穩定,仍需更多證據支持(圖 4a)。總膽固醇與高密度脂蛋白水平的 TSA 結果與之類似。僅低密度脂蛋白水平的累積 Z 值曲線穿過 TSA 監測限,且達到 RIS(728),提示 Meta 分析結果已穩定(圖 4b)。

3 討論
本研究基于 Meta 分析數據實例結合增強型漏斗圖和 TSA 較為全面地評價了 Meta 分析結果的穩定性,具有較強的實際意義。系統評價與 Meta 分析結果被看作是一種累積多項獨立研究的較高等級的證據,但證據的不斷更新又是科學研究的重要特征,因此 Meta 分析結果的穩定性評價對于在不同研究情形下得出科學的結論有實際意義[10, 13]。
本研究中增強型漏斗圖與 TSA 得到的結果具有較好的一致性。增強型漏斗圖的顯著性穩定性分析提示后續新增研究結果可能會改變甘油三酯、總膽固醇與高密度脂蛋白水平的合并效應量的大小與顯著性,而低密度脂蛋白水平的 Meta 分析結論較為穩定。TSA 的結果也顯示甘油三酯、總膽固醇和高密度脂蛋白的 Meta 分析結果尚未穩定,而低密度脂蛋白的 Meta 分析結果已穩定。但二者所得出的結論的關系在不同研究中仍有待探索。
我們認為,增強型漏斗圖與 TSA 在評價當前累積證據穩定性時可相互印證、相互補充。增強型漏斗圖與 TSA 分別基于不同的角度對當前 Meta 分析的穩定性進行判斷。前者主要用于分析漏斗圖不對稱的原因,及納入后續研究結果后對當前 Meta 分析顯著性和異質性的潛在影響。而 TSA 通過 RIS 與檢驗顯著性水平的調整來反映當前累積證據量是否足夠,并進而評價當前 Meta 分析的穩定性。而且,兩種分析均可提供直觀的可視化圖形,易于理解。若研究證據較強,理論上兩種方法的結論應該一致。考慮到研究的隨機性,當證據強度不足的時候,可能會出現兩種方法得出的穩定性評價結果不一致的情況,此時與整個 Meta 分析下結論的原則一致,需要謹慎做出結論。因此,結合兩種方法可構建良好的 Meta 分析穩定性評價體系,對 Meta 分析結果給出科學、客觀的評價。
本研究所采用的增強型漏斗圖與 TSA 均存在一定的局限性:① 當增強型漏斗圖用于分析 Meta 分析顯著性穩定性時,該方法假定加入新研究的 Meta 分析合并模型與原 Meta 分析所采用模型相同。而新研究的加入可能會改變研究間的異質性,從而影響 Meta 分析模型的選擇。② TSA 及其軟件仍有待發展。用于 TSA 的主要軟件 TSA(v0.9.5.10 beta),僅提供一種計算 TSA 監測限的方法(O’Brien-Fleming 損耗函數)[3]。目前 Stata 的“metacumbounds”命令可對二分類與生存數據進行 TSA,且有不同的 RIS 算法及 TSA 監測限的不同損耗函數設置[14, 15],但因對方法的理解問題并未被普遍應用。
聯合增強型漏斗圖和 TSA 可從證據的量、推斷誤差控制及未來研究的潛在影響等角度評價當前 Meta 分析結果的穩定性,較好地補充了系統評價和 Meta 分析的完整方法體系,但方法應用的方便性和可解釋性仍有局限性,預計將會在越來越多的系統評價和 Meta 分析中應用和完善。