本文介紹了 Meta 分析中不同亞組的合并效應量比較的 2 種統計方法,并通過實例演示采用 R 軟件對不同類型的數據(二分類和連續型變量)進行 Z 檢驗和 Meta 回歸分析,以解釋不同亞組的合并效應量比較方法的異同。
引用本文: 張天嵩, 張蘇賢. 如何實現 Meta 分析中不同亞組合并效應量的比較. 中國循證醫學雜志, 2017, 17(12): 1465-1470. doi: 10.7507/1672-2531.201705103 復制
Meta 分析作為一種匯總多個研究結果進行總體效應評價的科學研究方法,已廣泛應用于社會和醫學科學研究中[1]。亞組分析是 Meta 分析中的常用技術之一,可將全部數據按研究或個體特征分成不同亞組進行分析,被用于探索 Meta 分析異質性來源或用于回答特定患者、干預類型、研究設計類型等有關的特殊問題[2, 3],其也可對不同亞組合并效應量進行相互比較[2]。目前國內尚缺乏不同亞組合并效應量比較的方法學文章。本文結合實例,詳細介紹如何利用 R 軟件對不同類型的數據(二分類和連續型變量)進行亞組合并效應量的比較。
1 資料與方法
1.1 數據來源
1.1.1 二分類數據
數據來源于 Ellis 等[4]的文獻,共納入 18 個原始研究。主要評估老年綜合評估的有效性,研究終點為居家生活,根據老年綜合評估方法分為 Ward 和 Team 兩個亞組。數據按表 1 所示格式輸入 EXCEL 中,命名為 Ellis.xlsx 存儲于 C 盤根目錄下以備分析,其中“studyid”和“study”分別表示研究 ID 和研究名稱,“event1、total1、event2、total2”分別表示每個研究中兩組研究對象事件發生人數和總人數,“subgroups”表示按干預類型分亞組,分別為“Ward”和“Team”。

1.1.2 連續型數據
數據來源于魯華鵬等[5]的文獻,共納入 19 個原始研究。主要評估肝移植術后糖尿病的危險因素。本文選取了以年齡為危險因素的 Meta 分析數據為示例,共分為亞洲、美洲、歐洲三個亞組。數據按表 2 所示格式輸入 excel 中,命名為 Lu.xlsx 存儲于 C 盤根目錄下以備分析,其中“studyid”和“study”分別表示研究 ID 和研究名稱,“mean1、sd1、n1、mean2、sd2、n2”分別表示每個研究中兩組研究對象年齡均數和標準差、人數,“subgroups”表示按研究人群分亞組,分為“Asian”、“American”、“European”。

1.2 檢驗方法和模型
1.2.1 Z 檢驗
假設 Meta 分析中兩個亞組的合并效應量分別為 μ1 和 μ2(可為比數比、危險比、風險比等的對數尺度,均數差、標化均數差等),相應的標準誤分別為 se1 和 se2,則兩亞組合并效應量的差
,相應標準誤為
,則 95%CI 為
;而
,Z 服從正態分布,則雙尾檢驗相應
(其中
為標準正態累積分布)[6]。該方法適用于兩個亞組的效應量比較。
1.2.2 Meta 回歸
Meta 回歸是另一個可選擇的方法[3]。假設納入 Meta 分析中的研究 i 的效應量為
,相應標準誤為
,研究間方差為
,則隨機效應 Meta 回歸模型為
[7],其中
為研究 i 中
協變量向量值,β 為
向量系數。該方法適用于兩個及以上亞組的 Meta 分析數據:在應用時需根據研究目的選擇是設定 1 個共同亞組作為參照,還是進行各亞組間的兩兩比較,以此決定是否需要對 P 值進行校正。
1.3 模型擬合
首先進行經典 Meta 分析及亞組分析,然后進行 Wald 檢驗和 Meta 回歸分析。本文采用 R 軟件進行分析,由 R(v3.30)軟件的 metafor(v1.9-9)包聯合部分 R 軟件底層函數來實現,其中 escalc()函數估計每個研究的效應量及相應標準誤,以 rma.uni()函數進行 Meta 分析,pnorm()函數計算 P 值,rma.mv()函數進行 Meta 回歸分析[8, 9]。在進行多個不同亞組效應量的兩兩比較時,用 p.adjust()函數對 P 值進行校正。
此外,使用前有兩點注意:① metafor 并非 R 軟件底層包,在使用前需安裝該包。安裝方法為:在聯網情況下,在 R 軟件控制臺中輸入 install.packages(“metafor”,dependencies=TRUE)即可自動完成安裝。為便于讀入.xlsx 格式文件,還需要再安裝 xlxs 包[10],方法同前。② 實例中數據類型為二分類,而 metafor 包報告的效應量 OR 為對數尺度,可采用 exp()函數或 predict()獲得指數結果。對二分類數據(含兩個亞組)采用 R 軟件實現 Z 檢驗及 Meta 回歸模型代碼及主要解釋如框 1所示,對連續型數據(含三個亞組)采用 R 軟件實現 Meta 回歸代碼如框 2 所示。


2 結果
2.1 經典 Meta 分析和亞組分析
兩個實例經典 Meta 分析結果如表 3 所示。從 Ellis 數據中可發現兩亞組合并效應量 95%CI 沒有重疊,提示兩者差異有統計學意義。
2.2 兩個亞組效應量的比較
如表 4 所示,可發現 Z 檢驗和 Meta 回歸獲得的結果完全一致,均提示兩亞組間合并效應量差異有統計學意義,P=0.001 9。

2.3 三個亞組效應量的比較
以某一亞組為參照,與其他亞組比較的結果見表 5。三個亞組間兩兩比較的結果見表 6。比較結果顯示,“Asian”亞組和“European”亞組相對于“American”亞組,術后糖尿病組患者較非糖尿病組患者年齡更高。


3 討論
Meta 分析是從一系列研究獲得合成結果的過程,有時需要比較不同亞組合并效應量的差異。假設研究者獲得了兩個不同亞組的合并效應量,如果要比較亞組之間效應量是否不同,最簡單的方法是觀察兩個亞組合并效應量的 95%CI 是否重疊即可,如無重疊則可認為差異有統計學意義[3]。
Z 檢驗是常用的定量比較不同亞組合并效應量的方法。需要注意的是,亞組內合并選擇的效應模型原則與經典 Meta 分析相同,本文中選擇了隨機效應模型。但亞組間模型選擇需結合要回答的問題來考慮,如實例中要回答的問題是“‘Ward’和‘Team’之間在治療效應方面有何不同?”,因為問題關于兩種不同干預,亞組是“固定”而不是“隨機”,所以本文 Z 檢驗采用固定效應模型是恰當的。
Meta 回歸也是一個簡單可行的方法,一般采用隨機效應模型[3]。兩個亞組的 Meta 分析,將某一因素變為二分類指示器將所有研究分為兩類進行分析,從中獲得的回歸系數是結局變量(干預效應)如何隨解釋變量(不同亞組)單位的增加而改變的量[3],因此,對于兩個亞組只有一個解釋變量,回歸系數的指數正是兩者干預效應的差值。采用 Meta 回歸模型檢驗亞組間差異,隨機效應模型比固定效應模型更為適合,因后者易出現假陽性結果[3]。
Meta 回歸模型可擴展到多個亞組,如按某一因素將納入研究分為 K 個亞組,則可以構造 K-1 個啞變量(只能取 0 和 1),然后指定某一亞組作為參考,回歸系數則是每個亞組的合并效應與指定參考亞組的差異,每個回歸系數的 P 值表示是否該差異存在統計學意義[3]。如果對不同亞組合并效應量進行兩兩比較,需分別指定不同亞組作為參照,由于涉及到多重比較,還需對獲得的 P 值進行校正。多重檢驗 P 值校正方法很多,最經典的方法是 Bonferroni 法,其思想比較簡單:假設 Meta 分析中有 m 個亞組,則將常用的 α 檢驗水準(0.05)變為 0.05/m,或者設定常用 α=0.05,直接以 m×P 值(α=0.05),然后和 0.05 進行比較,該校正方法可以減少第一類錯誤概率,但增加第二類錯誤概率。因此,有學者提出在醫療保健領域研究中,推薦 FDR(False positive rate)校正作為 Bonferroni 校正的替代策略[11],本文示例分析則采用上述兩種方法。此外,R 軟件的 p.adjuest()函數提供了多種多重比較 P 值校正的方法,且比較容易實現,建議使用。
R、Stata、SAS 等軟件均可實現 Z 檢驗的 Meta 回歸分析,限于篇幅和考慮到 R 軟件的自由性、功能性、相對易用性等因素,本文只演示了 R 軟件 metafor 等相關擴展包,有興趣的讀者可使用其他軟件來實現。要注意的是,對于 Z 檢驗需進行經典 Meta 分析和亞組分析,以獲得相應統計量。
Meta 分析作為一種匯總多個研究結果進行總體效應評價的科學研究方法,已廣泛應用于社會和醫學科學研究中[1]。亞組分析是 Meta 分析中的常用技術之一,可將全部數據按研究或個體特征分成不同亞組進行分析,被用于探索 Meta 分析異質性來源或用于回答特定患者、干預類型、研究設計類型等有關的特殊問題[2, 3],其也可對不同亞組合并效應量進行相互比較[2]。目前國內尚缺乏不同亞組合并效應量比較的方法學文章。本文結合實例,詳細介紹如何利用 R 軟件對不同類型的數據(二分類和連續型變量)進行亞組合并效應量的比較。
1 資料與方法
1.1 數據來源
1.1.1 二分類數據
數據來源于 Ellis 等[4]的文獻,共納入 18 個原始研究。主要評估老年綜合評估的有效性,研究終點為居家生活,根據老年綜合評估方法分為 Ward 和 Team 兩個亞組。數據按表 1 所示格式輸入 EXCEL 中,命名為 Ellis.xlsx 存儲于 C 盤根目錄下以備分析,其中“studyid”和“study”分別表示研究 ID 和研究名稱,“event1、total1、event2、total2”分別表示每個研究中兩組研究對象事件發生人數和總人數,“subgroups”表示按干預類型分亞組,分別為“Ward”和“Team”。

1.1.2 連續型數據
數據來源于魯華鵬等[5]的文獻,共納入 19 個原始研究。主要評估肝移植術后糖尿病的危險因素。本文選取了以年齡為危險因素的 Meta 分析數據為示例,共分為亞洲、美洲、歐洲三個亞組。數據按表 2 所示格式輸入 excel 中,命名為 Lu.xlsx 存儲于 C 盤根目錄下以備分析,其中“studyid”和“study”分別表示研究 ID 和研究名稱,“mean1、sd1、n1、mean2、sd2、n2”分別表示每個研究中兩組研究對象年齡均數和標準差、人數,“subgroups”表示按研究人群分亞組,分為“Asian”、“American”、“European”。

1.2 檢驗方法和模型
1.2.1 Z 檢驗
假設 Meta 分析中兩個亞組的合并效應量分別為 μ1 和 μ2(可為比數比、危險比、風險比等的對數尺度,均數差、標化均數差等),相應的標準誤分別為 se1 和 se2,則兩亞組合并效應量的差
,相應標準誤為
,則 95%CI 為
;而
,Z 服從正態分布,則雙尾檢驗相應
(其中
為標準正態累積分布)[6]。該方法適用于兩個亞組的效應量比較。
1.2.2 Meta 回歸
Meta 回歸是另一個可選擇的方法[3]。假設納入 Meta 分析中的研究 i 的效應量為
,相應標準誤為
,研究間方差為
,則隨機效應 Meta 回歸模型為
[7],其中
為研究 i 中
協變量向量值,β 為
向量系數。該方法適用于兩個及以上亞組的 Meta 分析數據:在應用時需根據研究目的選擇是設定 1 個共同亞組作為參照,還是進行各亞組間的兩兩比較,以此決定是否需要對 P 值進行校正。
1.3 模型擬合
首先進行經典 Meta 分析及亞組分析,然后進行 Wald 檢驗和 Meta 回歸分析。本文采用 R 軟件進行分析,由 R(v3.30)軟件的 metafor(v1.9-9)包聯合部分 R 軟件底層函數來實現,其中 escalc()函數估計每個研究的效應量及相應標準誤,以 rma.uni()函數進行 Meta 分析,pnorm()函數計算 P 值,rma.mv()函數進行 Meta 回歸分析[8, 9]。在進行多個不同亞組效應量的兩兩比較時,用 p.adjust()函數對 P 值進行校正。
此外,使用前有兩點注意:① metafor 并非 R 軟件底層包,在使用前需安裝該包。安裝方法為:在聯網情況下,在 R 軟件控制臺中輸入 install.packages(“metafor”,dependencies=TRUE)即可自動完成安裝。為便于讀入.xlsx 格式文件,還需要再安裝 xlxs 包[10],方法同前。② 實例中數據類型為二分類,而 metafor 包報告的效應量 OR 為對數尺度,可采用 exp()函數或 predict()獲得指數結果。對二分類數據(含兩個亞組)采用 R 軟件實現 Z 檢驗及 Meta 回歸模型代碼及主要解釋如框 1所示,對連續型數據(含三個亞組)采用 R 軟件實現 Meta 回歸代碼如框 2 所示。


2 結果
2.1 經典 Meta 分析和亞組分析
兩個實例經典 Meta 分析結果如表 3 所示。從 Ellis 數據中可發現兩亞組合并效應量 95%CI 沒有重疊,提示兩者差異有統計學意義。
2.2 兩個亞組效應量的比較
如表 4 所示,可發現 Z 檢驗和 Meta 回歸獲得的結果完全一致,均提示兩亞組間合并效應量差異有統計學意義,P=0.001 9。

2.3 三個亞組效應量的比較
以某一亞組為參照,與其他亞組比較的結果見表 5。三個亞組間兩兩比較的結果見表 6。比較結果顯示,“Asian”亞組和“European”亞組相對于“American”亞組,術后糖尿病組患者較非糖尿病組患者年齡更高。


3 討論
Meta 分析是從一系列研究獲得合成結果的過程,有時需要比較不同亞組合并效應量的差異。假設研究者獲得了兩個不同亞組的合并效應量,如果要比較亞組之間效應量是否不同,最簡單的方法是觀察兩個亞組合并效應量的 95%CI 是否重疊即可,如無重疊則可認為差異有統計學意義[3]。
Z 檢驗是常用的定量比較不同亞組合并效應量的方法。需要注意的是,亞組內合并選擇的效應模型原則與經典 Meta 分析相同,本文中選擇了隨機效應模型。但亞組間模型選擇需結合要回答的問題來考慮,如實例中要回答的問題是“‘Ward’和‘Team’之間在治療效應方面有何不同?”,因為問題關于兩種不同干預,亞組是“固定”而不是“隨機”,所以本文 Z 檢驗采用固定效應模型是恰當的。
Meta 回歸也是一個簡單可行的方法,一般采用隨機效應模型[3]。兩個亞組的 Meta 分析,將某一因素變為二分類指示器將所有研究分為兩類進行分析,從中獲得的回歸系數是結局變量(干預效應)如何隨解釋變量(不同亞組)單位的增加而改變的量[3],因此,對于兩個亞組只有一個解釋變量,回歸系數的指數正是兩者干預效應的差值。采用 Meta 回歸模型檢驗亞組間差異,隨機效應模型比固定效應模型更為適合,因后者易出現假陽性結果[3]。
Meta 回歸模型可擴展到多個亞組,如按某一因素將納入研究分為 K 個亞組,則可以構造 K-1 個啞變量(只能取 0 和 1),然后指定某一亞組作為參考,回歸系數則是每個亞組的合并效應與指定參考亞組的差異,每個回歸系數的 P 值表示是否該差異存在統計學意義[3]。如果對不同亞組合并效應量進行兩兩比較,需分別指定不同亞組作為參照,由于涉及到多重比較,還需對獲得的 P 值進行校正。多重檢驗 P 值校正方法很多,最經典的方法是 Bonferroni 法,其思想比較簡單:假設 Meta 分析中有 m 個亞組,則將常用的 α 檢驗水準(0.05)變為 0.05/m,或者設定常用 α=0.05,直接以 m×P 值(α=0.05),然后和 0.05 進行比較,該校正方法可以減少第一類錯誤概率,但增加第二類錯誤概率。因此,有學者提出在醫療保健領域研究中,推薦 FDR(False positive rate)校正作為 Bonferroni 校正的替代策略[11],本文示例分析則采用上述兩種方法。此外,R 軟件的 p.adjuest()函數提供了多種多重比較 P 值校正的方法,且比較容易實現,建議使用。
R、Stata、SAS 等軟件均可實現 Z 檢驗的 Meta 回歸分析,限于篇幅和考慮到 R 軟件的自由性、功能性、相對易用性等因素,本文只演示了 R 軟件 metafor 等相關擴展包,有興趣的讀者可使用其他軟件來實現。要注意的是,對于 Z 檢驗需進行經典 Meta 分析和亞組分析,以獲得相應統計量。