試驗序貫分析(trial sequential analysis,TSA)可發現看似具有明確結果的 Meta 分析的不確定性,主要是通過提供期望信息量及 TSA 界值來進行判斷。TSA 中信息量的計算方法有多種,本文簡要介紹 TSA 中 4 種信息量的計算方法,以期為讀者在制作 Meta 分析時能更好地運用 TSA 提供參考。
引用本文: 翁鴻, 郭成城, 呂軍, 孟詳喻, 郭中強, 曾憲濤. 試驗序貫分析之信息量的計算. 中國循證醫學雜志, 2017, 17(1): 113-116. doi: 10.7507/1672-2531.201607061 復制
累積 Meta 分析(cumulative meta-analysis)隨著新研究的納入會增大隨機誤差和Ⅰ型錯誤率,因此眾多學者推薦采用試驗序貫分析(trial sequential analysis,TSA)來判斷 Meta 分析的結果是否為假陽性或假陰性結果[1-4]。在干預性研究中,隨機對照試驗的 Meta 分析結果被認為是最高級別的證據[5-7],其樣本量應該不少于一個具有足夠統計學效能的隨機對照試驗[2,8]。
期望信息量[1](required information size,RIS)或最優信息量[9](optimal information size,OIS)的計算主要基于對照組事件發生率、最小干預效應、可接受的最大Ⅰ型(α)和Ⅱ型(β)錯誤率。當觀察到的信息量,即累積信息量(accrued information size,AIS)小于 RIS 或 OIS 時,干預效應估計值的不確定性和獲得假陽性結果的風險(Ⅰ型錯誤)就會隨之上升。GRADE 系統中關于證據降級標準中指出,若系統評價的 AIS 未達到OIS,則因其不精確性而降低證據質量級別[10-14]。
TSA 主要通過提供 RIS 和界值來判斷 Meta 分析的結果是否是確定性的,類似于單個隨機對照試驗的期中監測界值(interim monitoring boundary)[2]。TSA中提供了多種計算信息量的方法,如 AIS、先驗信息量(a priori information size,APIS)、低偏倚信息量(low-bias information size,LBIS)、低偏倚異質性校正信息量(low-bias heterogeneity-adjusted information size,LBHIS)、低偏倚差異校正信息量(low-bias diversity-adjusted information size,LBDIS)等。TSA 界值的計算是基于信息量的,因此,不同信息量的計算方法會得出不同的 TSA 界值。本文采用一篇 Cochrane 系統評價[15]為例展示 TSA 中信息量的計算方法,其數據如表 1 所示,統計軟件采用 Stata 12.0 軟件。

1 累積信息量
累積信息量(AIS)即為納入研究的總體累積樣本量,根據 Meta 分析所累積的樣本量,假設一個先驗的相對危險度減少率(relative risk reduction,RRR)和α 來計算檢驗效能。基于 AIS 的 TSA 界值圖如圖 1 所示,圖 1 中橫軸為 AIS,縱軸為Z 統計量,紅色虛線為基于 AIS 的 TSA 界值曲線,藍色實線為累積Z 曲線。從圖中數據可知 AIS=1 569,RRR=15%,α= 5%,統計效能(power)為 56%;且累積 Z 曲線不僅穿過了傳統界值線(Z=1.96),也穿過了基于 AIS 的 TSA 界值線,證明試驗組干預措施確實優于對照組干預措施。但其統計效能也相對不足(power = 56%)。

2 先驗信息量及先驗差異校正信息量
先驗信息量(AIPS)需先定義最小干預效應,估計RRR 值。此處定義 RRR=15%,α=5%,β=20%,則統計效能(power)=1–β=80%。APIS 的計算公式如下:
$ \begin{aligned} APIS & = 2 \times {\left( {{Z_{1 - \alpha /2}} + {Z_{1 - \beta }}} \right)^2} \times 2 \times \frac{{{\sigma ^2}}}{{{\delta ^2}}} \\ & = \frac{{4{\sigma ^2}}}{{{\delta ^2}}}{\left( {{Z_{1 - \alpha /2}} + {Z_{1 - \beta }}} \right)^2} \end{aligned} $ |
對于二分類數據, , , ,PC、PE分別表示對照組事件發生率、試驗組事件發生率,PC 從納入 Meta 分析的研究中進行計算,PE需要先驗 RRR 值進行計算:PE=PC(1–RRR)。
先驗差異校正信息量(APDIS)是根據 APIS 值進行差異性校正,校正方法為 APIS 乘以異質性校正因子(heterogeneity-adjusted factor,AF):
$ {{APDIS}} = {{APIS}} \times {{AF}} $ |
$ AF = \frac{1}{{1 - H}} = \frac{1}{{1 - {D^2}}} $ |
TSA 手冊建議[16]若研究間異質性較低(H=D2=25%)時,AF=1.33;研究間異質性為中度(H=D2=50%)時,AF=2.00;研究間異質性較高(H=D2=75%)時,AF=4.00。
基于 APIS 的 TSA 界值圖如圖 2 所示。基于RRR=15%,α=0.05,β=0.2,得到的APIS = 2 743。圖 2 中顯示,累積 Z 曲線雖然未到達 APIS 線,但穿過了傳統界值線(Z=1.96),也穿過了基于 APIS 的 TSA 界值線,證明試驗組干預措施確實優于對照組干預措施。

3 低偏倚信息量
低偏倚信息量(LBIS)是從納入研究中選取低偏倚風險的研究進行計算 RRR(RRR=1-RR),丹麥哥本哈根臨床試驗中心科研團隊建議低風險偏倚的評價主要看納入研究是否進行了充足的分配隱藏[2]。然后在與定義的α、β 來計算信息量 LBIS。
基于 LBIS 的 TSA 界值圖如圖 3 所示。定義α=0.05,β=0.2,從低風險研究中計算出的 RRR=40%,得到 LBIS=470。圖 3 中顯示,累積 Z 曲線越過了傳統界值線(Z=1.96)和基于 LBIS 的 TSA 界值線,也到達了 LBIS,證明試驗組干預措施確實優于對照組干預措施。

4 低偏倚異質性校正信息量
低偏倚異質性校正信息量(LBHIS)是基于低偏倚風險研究的異質性校正信息量,由于固定效應模型和隨機效應模型下異質性組成不同,固定效應模型下的方差為組內方差,隨機效應模型下的方差為組內和組間方差之和,因此固定效應模型和隨機效應模型的信息量有所不同:
$ {N_F} = \frac{{4\sigma _F^2}}{{{\delta ^2}}}{\left( {{Z_{1 - \alpha /2}} + {Z_{1 - \beta }}} \right)^2} $ |
$ {N_R} = \frac{{4\sigma _R^2}}{{{\delta ^2}}}{\left( {{Z_{1 - \alpha /2}} + {Z_{1 - \beta }}} \right)^2} $ |
、 分別為固定效應模型和隨機效應模型下的方差,NF、NR 分別為固定效應模型和隨機效應模型下的信息量,那么校正因子 AF 為:
$ AF = \frac{{{N_R}}}{{{N_F}}} = \frac{{\left( {\sigma _F^2 + {\tau ^2}} \right)/k}}{{\sigma _F^2/k}} = \frac{{\left( {\sigma _F^2 + {\tau ^2}} \right)}}{{\sigma _F^2}} = \frac{1}{{1 - {I^2}}} $ |
LBHIS的計算方法為:
$ LBHIS = LBIS \times AF = LBIS \times \frac{1}{{1 - {I^2}}} $ |
I2為納入研究間異質性。基于 LBHIS 的 TSA 界值圖如圖 4 所示。細心的讀者可以發現圖 3 與圖 4 相同,這是因為由于納入研究間的異質性I2=0%,所以 LBIS=LBHIS。圖形的解讀同 LBIS。

5 小結
TSA 方法中提供了多種計算信息量的方法,而信息量不僅與 RIS 有關,還與 TSA 界值有關,不同信息量的 TSA 界值有所不同,但其結果均一致[17,18]。從圖 1、2、3 中可看出,基于 AIS 和 APIS 的 TSA 界值圖前期較為嚴格。讀者在進行 TSA 操作時,應該仔細分析納入研究的情況,尤其是風險偏倚情況,Wetterslev等[2]推薦主要評價分配隱藏是否充分。若納入研究質量較高,低風險偏倚研究數目較多,則推薦采用 LBIS 或者是 LBHIS 進行計算信息量和繪制 TSA 界值圖;若納入研究質量均較低,則推薦采用 AIS 或 APIS 進行計算信息量及繪制 TSA 界值圖,若研究者欲采用 APIS,還需正確選取 RRR,因 RRR 的選取也是 TSA 的重要因素。
累積 Meta 分析(cumulative meta-analysis)隨著新研究的納入會增大隨機誤差和Ⅰ型錯誤率,因此眾多學者推薦采用試驗序貫分析(trial sequential analysis,TSA)來判斷 Meta 分析的結果是否為假陽性或假陰性結果[1-4]。在干預性研究中,隨機對照試驗的 Meta 分析結果被認為是最高級別的證據[5-7],其樣本量應該不少于一個具有足夠統計學效能的隨機對照試驗[2,8]。
期望信息量[1](required information size,RIS)或最優信息量[9](optimal information size,OIS)的計算主要基于對照組事件發生率、最小干預效應、可接受的最大Ⅰ型(α)和Ⅱ型(β)錯誤率。當觀察到的信息量,即累積信息量(accrued information size,AIS)小于 RIS 或 OIS 時,干預效應估計值的不確定性和獲得假陽性結果的風險(Ⅰ型錯誤)就會隨之上升。GRADE 系統中關于證據降級標準中指出,若系統評價的 AIS 未達到OIS,則因其不精確性而降低證據質量級別[10-14]。
TSA 主要通過提供 RIS 和界值來判斷 Meta 分析的結果是否是確定性的,類似于單個隨機對照試驗的期中監測界值(interim monitoring boundary)[2]。TSA中提供了多種計算信息量的方法,如 AIS、先驗信息量(a priori information size,APIS)、低偏倚信息量(low-bias information size,LBIS)、低偏倚異質性校正信息量(low-bias heterogeneity-adjusted information size,LBHIS)、低偏倚差異校正信息量(low-bias diversity-adjusted information size,LBDIS)等。TSA 界值的計算是基于信息量的,因此,不同信息量的計算方法會得出不同的 TSA 界值。本文采用一篇 Cochrane 系統評價[15]為例展示 TSA 中信息量的計算方法,其數據如表 1 所示,統計軟件采用 Stata 12.0 軟件。

1 累積信息量
累積信息量(AIS)即為納入研究的總體累積樣本量,根據 Meta 分析所累積的樣本量,假設一個先驗的相對危險度減少率(relative risk reduction,RRR)和α 來計算檢驗效能。基于 AIS 的 TSA 界值圖如圖 1 所示,圖 1 中橫軸為 AIS,縱軸為Z 統計量,紅色虛線為基于 AIS 的 TSA 界值曲線,藍色實線為累積Z 曲線。從圖中數據可知 AIS=1 569,RRR=15%,α= 5%,統計效能(power)為 56%;且累積 Z 曲線不僅穿過了傳統界值線(Z=1.96),也穿過了基于 AIS 的 TSA 界值線,證明試驗組干預措施確實優于對照組干預措施。但其統計效能也相對不足(power = 56%)。

2 先驗信息量及先驗差異校正信息量
先驗信息量(AIPS)需先定義最小干預效應,估計RRR 值。此處定義 RRR=15%,α=5%,β=20%,則統計效能(power)=1–β=80%。APIS 的計算公式如下:
$ \begin{aligned} APIS & = 2 \times {\left( {{Z_{1 - \alpha /2}} + {Z_{1 - \beta }}} \right)^2} \times 2 \times \frac{{{\sigma ^2}}}{{{\delta ^2}}} \\ & = \frac{{4{\sigma ^2}}}{{{\delta ^2}}}{\left( {{Z_{1 - \alpha /2}} + {Z_{1 - \beta }}} \right)^2} \end{aligned} $ |
對于二分類數據, , , ,PC、PE分別表示對照組事件發生率、試驗組事件發生率,PC 從納入 Meta 分析的研究中進行計算,PE需要先驗 RRR 值進行計算:PE=PC(1–RRR)。
先驗差異校正信息量(APDIS)是根據 APIS 值進行差異性校正,校正方法為 APIS 乘以異質性校正因子(heterogeneity-adjusted factor,AF):
$ {{APDIS}} = {{APIS}} \times {{AF}} $ |
$ AF = \frac{1}{{1 - H}} = \frac{1}{{1 - {D^2}}} $ |
TSA 手冊建議[16]若研究間異質性較低(H=D2=25%)時,AF=1.33;研究間異質性為中度(H=D2=50%)時,AF=2.00;研究間異質性較高(H=D2=75%)時,AF=4.00。
基于 APIS 的 TSA 界值圖如圖 2 所示。基于RRR=15%,α=0.05,β=0.2,得到的APIS = 2 743。圖 2 中顯示,累積 Z 曲線雖然未到達 APIS 線,但穿過了傳統界值線(Z=1.96),也穿過了基于 APIS 的 TSA 界值線,證明試驗組干預措施確實優于對照組干預措施。

3 低偏倚信息量
低偏倚信息量(LBIS)是從納入研究中選取低偏倚風險的研究進行計算 RRR(RRR=1-RR),丹麥哥本哈根臨床試驗中心科研團隊建議低風險偏倚的評價主要看納入研究是否進行了充足的分配隱藏[2]。然后在與定義的α、β 來計算信息量 LBIS。
基于 LBIS 的 TSA 界值圖如圖 3 所示。定義α=0.05,β=0.2,從低風險研究中計算出的 RRR=40%,得到 LBIS=470。圖 3 中顯示,累積 Z 曲線越過了傳統界值線(Z=1.96)和基于 LBIS 的 TSA 界值線,也到達了 LBIS,證明試驗組干預措施確實優于對照組干預措施。

4 低偏倚異質性校正信息量
低偏倚異質性校正信息量(LBHIS)是基于低偏倚風險研究的異質性校正信息量,由于固定效應模型和隨機效應模型下異質性組成不同,固定效應模型下的方差為組內方差,隨機效應模型下的方差為組內和組間方差之和,因此固定效應模型和隨機效應模型的信息量有所不同:
$ {N_F} = \frac{{4\sigma _F^2}}{{{\delta ^2}}}{\left( {{Z_{1 - \alpha /2}} + {Z_{1 - \beta }}} \right)^2} $ |
$ {N_R} = \frac{{4\sigma _R^2}}{{{\delta ^2}}}{\left( {{Z_{1 - \alpha /2}} + {Z_{1 - \beta }}} \right)^2} $ |
、 分別為固定效應模型和隨機效應模型下的方差,NF、NR 分別為固定效應模型和隨機效應模型下的信息量,那么校正因子 AF 為:
$ AF = \frac{{{N_R}}}{{{N_F}}} = \frac{{\left( {\sigma _F^2 + {\tau ^2}} \right)/k}}{{\sigma _F^2/k}} = \frac{{\left( {\sigma _F^2 + {\tau ^2}} \right)}}{{\sigma _F^2}} = \frac{1}{{1 - {I^2}}} $ |
LBHIS的計算方法為:
$ LBHIS = LBIS \times AF = LBIS \times \frac{1}{{1 - {I^2}}} $ |
I2為納入研究間異質性。基于 LBHIS 的 TSA 界值圖如圖 4 所示。細心的讀者可以發現圖 3 與圖 4 相同,這是因為由于納入研究間的異質性I2=0%,所以 LBIS=LBHIS。圖形的解讀同 LBIS。

5 小結
TSA 方法中提供了多種計算信息量的方法,而信息量不僅與 RIS 有關,還與 TSA 界值有關,不同信息量的 TSA 界值有所不同,但其結果均一致[17,18]。從圖 1、2、3 中可看出,基于 AIS 和 APIS 的 TSA 界值圖前期較為嚴格。讀者在進行 TSA 操作時,應該仔細分析納入研究的情況,尤其是風險偏倚情況,Wetterslev等[2]推薦主要評價分配隱藏是否充分。若納入研究質量較高,低風險偏倚研究數目較多,則推薦采用 LBIS 或者是 LBHIS 進行計算信息量和繪制 TSA 界值圖;若納入研究質量均較低,則推薦采用 AIS 或 APIS 進行計算信息量及繪制 TSA 界值圖,若研究者欲采用 APIS,還需正確選取 RRR,因 RRR 的選取也是 TSA 的重要因素。