SAS被譽為國際上數據處理和統計分析領域的標準軟件,也是實現Meta分析的優秀軟件之一,但其程序編寫復雜且難度較大,要求使用者具備較強的編程功底。評價顯著性檢驗的統計效能是Meta分析的重要步驟,為更好地使用SAS軟件,美國南佛羅里達大學的Guy Cafri等共同研發了一款專用于實現Meta分析統計效能計算的SAS宏命令(%metapower)。該宏命令可實現Meta分析整體結果、異質性和亞組分析統計效能的計算,簡潔易操作,本文結合實例對該宏命令進行介紹。
引用本文: 田旭, 曾子, 毛智, 周權, 曾憲濤, 王燕, 宋國敏. 應用SAS軟件宏命令實現Meta分析統計效能計算. 中國循證醫學雜志, 2015, 15(1): 110-115. doi: 10.7507/1672-2531.20150019 復制
Meta分析是將同一主題的多項同質研究采用定量手段加以合并以得出總體結果的一種統計學方法 [1],其目的是對干預/暴露是否有意義進行顯著性檢驗,因此保證研究的統計效能至關重要 [2]。原始研究統計效能的重要性已被公認,但因缺乏相應的計算方法 [3]使得Meta分析顯著性檢驗中很少考慮統計效能 [4]。為此Hedges與Pigott基于SAS軟件開發了一套用于Meta分析統計效能計算的程序,因其對使用者要求較高而難于常規推廣 [2, 5]。為實現Meta分析統計效能在SAS軟件中的便捷計算,并提高系統評價與Meta分析制作者對顯著性檢驗中統計效能的關注度,美國南佛羅里達大學的Cafri等 [6]在2009年共同開發了專門用于實現Meta分析統計效能計算的SAS宏,即“metapower宏”。目前,包括筆者團隊在內的大多作者都采用Power and Precision和G*Power等軟件實現原始研究和Meta分析的效能計算 [7, 8],國內尚無介紹SAS 宏命令實現Meta分析統計效能的文章。本文以Yakoob等 [9]發表的文章中的部分數據(表 1)為例,介紹應用SAS軟件%metapower宏命令實現Meta分析統計效能的過程。

1 SAS軟件及SAS宏簡介
SAS(statistical analysis system)軟件是目前國際上最具影響力的統計軟件之一,具有完備的數據訪問、管理、分析和呈現功能,目前最高版本為9.3版 [10]。SAS軟件主要靠輸入代碼編程驅動,故SAS軟件的應用要求使用者具備較高的專業知識,而利用SAS軟件的宏可以減少在完成一些共同任務時必須輸入的文本量,也可以使程序模塊化,使程序具有易讀、便于修改、移植、方便重復使用的優點 [11]。
SAS宏是一段編輯好的程序,用戶可以在提交SAS程序或SAS命令行中調用 [11]。利用%macro語句開始一個宏,同時給出這個宏的名字,如:%macro yxtx;用%mend語句結束一個宏,其后給出宏的名字,如%mend yxtx。放一個百分數符號(%)在宏名字的前面可以調用一個宏,如%yxtx。宏命令括號內的變量稱為宏參數,用戶可以直接為宏參數賦值,也可在調用宏時指定參數值 [10, 11]。
2 metapower宏簡介
metapower宏是專門用于實現Meta分析統計效能計算的SAS宏 [
該宏適用于傳統的二分類/連續型數據Meta分析、異質性檢驗、亞組分析及Meta回歸等的統計效能計算,使用者只需對效能計算類型加以界定即可完成特定的效能分析。在SAS軟件中,Meta分析統計效能計算的所有過程都被整合在metapower宏中,用戶只需對作宏參數進行賦值,即可方便獲取各種所需結果。metapower宏的主要參數介紹如下:
%metapower (test=,model=,raw_data=,alpha=,tau2=,heterogeneity=,n1=,n2=,k=,eff_type=,T=,Dataset=,B=,v=,x=,es=,p=,weight=)
其中test指定效能計算類型(M:平均效應量;QT:異質性檢驗;contrast:亞組分析/組檢差異性檢驗;QB:分類中介變量檢驗;QW:分類變量不同水平異質性檢驗;Reg:多項混合檢驗與回歸系數檢驗;QE:回歸分析的異質性檢驗);model指定不同的Meta合并模型(固定或隨機效應模型);raw_data指定效能計算是否基于原始數據;alpha指定顯著性檢驗水準;tau2指定研究間方差(如果未提供,指定該值為99,此時可以指定異質性比值),如果提供了原始數據,基于這些數據,程序可自動估算研究間方差作為錄入參數,如果未指定原始數據,則需要指定tau2或者heterogenity比值,這兩個值可源于合理的猜測;heterogeneity指定研究間方差與研究內誤差比值(可按照Hedges和Pigott的經驗法,指定該比值為0.333、0.667和1對應于低、中、高的異質性);n1/n2指定納入研究的平均樣本量,基于效應指標d的統計效能計算,需同時提供n1和n2,基于效應指標r或z的統計效能計算則只需n1,而對于效應指標OR,需在一般研究水平指定比值對數的方差(如,式中a-d對應于四個表中的單位頻數);k指定納入合并研究數;eff_type指定效應指標(d:標準化均數差,r:相關系數,z:相關系數的Fisher轉換值,or:比值比的對數值);T指定特定效應指標下合并效應量的平均大小(,其中權重 ,νi為效應量方差,Ti為第i項研究的效應量,k為納入合并研究數);Dataset指定SAS數據集;B從標準化回歸系數集中指定一個參數;v從包含研究效應量方差的外部數據集中指定一個或多個參數;x從包含回歸分析預測變量值的外部數據集中指定一個或多個參數(等同于設計矩陣);es從包含單個研究效應量的外部數據集中指定一個或多個參數;p為絕對數據模型中,分析殘差變量時的分類變量數或回歸分析模型中,殘差變量檢驗時的預測變量數;weight為亞組分析時,從各組權重賦值構成的數據集中指定一個參數。
3 數據準備
基于SAS系統,各個統計學分析程序只能對SAS數據集中的數據進行處理,所以如何將數據轉換成SAS數據集是SAS進行統計分析的基礎。如何選取易于解釋、能夠準確反映不同研究間結局指標關聯程度的合并效應量指標是實現Meta分析的關鍵。效應量指標的選擇依據數據類型的不同而變化,故為實現結局的可解釋性,組間比較及組間合并對不同研究效應指標進行標準化尤為重要。在社會和醫學領域,最常用的標準化效應量指標包括標準化均數效應量(d)、相關系數(r)、r的Fisher轉化值(z)及比值比的對數轉化值(logOR)。
對于連續型數據,常采用d作為效應量指標,其計算公式如下:
$d=\frac{{{{\bar{M}}}^{T}}-{{{\bar{M}}}^{C}}}{{{S}_{within}}}$ |
式中,為干預組效應量均數,為對照組效應量均數,Swithin為組內標準差(Swithin = ,式中nT、nC和ST、SC分別為干預組和對照組樣本量及標準差)。d值的抽樣不一致性可用方差(v)進行解釋,其計算公式如下:
如果研究的兩組樣本量已知,可以通過單個效應量值計算v值。因為d近似服從真實效應的正態分布,因此也可用效應量的95%可信區間/標準差/標準誤計算v值。
對于二分類數據,比值比的對數值(logOR)是常用的效應量指標,其計算公式如下:
$v=\frac{{{n}^{T}}+{{n}^{C}}}{{{n}^{T}}{{n}^{C}}}+\frac{{{d}^{2}}}{2\left( {{n}^{T}}+{{n}^{C}} \right)}$ |
式中,pT和pC分別指干預組和對照組事件發生率,logOR的抽樣不一致性用其方差(v)表示,計算公式如下:
$\log OR=\log \left[ \frac{{{p}^{T}}/\left( 1-{{p}^{T}} \right)}{{{p}^{C}}/\left( 1-{{p}^{C}} \right)} \right]=\log \left[ \frac{{{p}^{T}}/\left( 1-{{p}^{C}} \right)}{{{p}^{C}}/\left( 1-{{p}^{T}} \right)} \right]$ |
式中,nP和nC表示干預組和對照組的樣本量。logOR近似服從真實效應的正態分布,可用效應量的95%可信區間/標準差/標準誤計算v值。OR指標系還包括相對危險度(relative risk,RR)和風險差(risk difference,RD),對于二分類數據效應指標測量的具體論述參考專業統計教材。
對于連續型變量或效應量結局指標,相關和相關系數也常被作為效應量指標。鑒于相關系數(correlation coefficient)多數情況下不服從正態分布,因此通常將其經過Fisher轉換(z),使其近似服從正態分布,具體轉化公式如下:
$z=\frac{1}{2}\ln \left[ \frac{1+r}{1-r} \right]$ |
式中,r為相關系數,不同類型檢驗對應r的計算參見統計教材。z值的抽樣不一致性用其方差(v)表示,計算如下:
$v=\frac{1}{n-3}$ |
式中,n為研究樣本量,該值也服從于其真實效應的正態分布,也可通過d和logOR的v轉化公式計算抽樣不一致性方差。
盡管對于不同數據類型合并選取不同的效應指標,然而各效應指標可以實現相互轉化。logOR及相應方差(vlogOR)與d值及對應方差(vd)相互轉化公式如下:
$d=\log OR\times \frac{\sqrt{3}}{\pi },{{v}_{d}}={{v}_{\log OR}}\times \frac{3}{{{\pi }^{2}}}$ |
r及對應方差(vr)轉化為d值及vd公式如下:
$d=\frac{2r}{\sqrt{1-{{r}^{2}}}},{{v}_{d}}=\frac{4{{v}_{r}}}{{{\left( 1-{{r}^{2}} \right)}^{3}}}$ |
d值及vd轉化為r及vr公式如下:
$r=\frac{d}{\sqrt{{{d}^{2}}+a}},{{v}_{r}}=\frac{{{a}^{2}}{{v}_{d}}}{{{\left( {{d}^{2}}+a \right)}^{3}}}$ |
式中,a表示校正因子,其值決定于兩組樣本量(a = )。
基于本次示例數據的類型(二分類數據),使用前需要先行將效應量(effect size,es)對應轉化為宏參數effect_type效應指標所對應的log OR值,標準誤(SE)轉化為方差(v)(v = SE2)。示例數據轉換完成后(表 2),錄入格式如下:
data yxtx1;
input es v;
cards;
0.015 0.003136
-0.035 0.011236
-0.174 2.099601
-0.009 0.358801
-0.105 0.3249
;
run;
至此,以“yxtx1”為名的SAS數據集就被建立了。需要注意的是,標點符號均為英文狀態下輸入。

4 在metapower宏中實現統計效能計算
4.1 計算平均效應量統計效能
基于3錄入的SAS數據集,先將下載好的%metapower宏讀入SAS軟件,運行一下,再根據2介紹內容對%metapower宏參數進行如下指定:
%metapower(test='M',model='random',raw_data='yes',alpha=.05,tau2=99,heterogeneity=99,n1=99,n2=99,k=99,eff_type='or',T=0.09531018,Dataset=yxtx1,B=NA,v=v,x=NA,es=es,p=NA,weight=NA);
run;
該命令中需注意T值的計算,其值為合并效應量的平均大小,鑒于原文中合并效應量為1,求取自然對數值為0,因此原作者分別取值1.1、1.2和1.3進行效能計算。本文演示只取1.1進行統計效能計算。基于上述宏命令,SAS軟件自動返回的結果(圖 1)中,可以發現基于納入的5項研究的Meta分析平均效應量的統計效能為49.2%。

4.2 計算異質性檢驗統計效能
基于3錄入的SAS數據集,先將下載好的%metapower宏讀入SAS軟件,運行一下,再根據2介紹內容對%metapower宏參數進行如下指定:
%metapower(test='QT',model='random',raw_data='yes',alpha=.05,tau2=99,heterogeneity=99,n1=99,n2=99,k=99,eff_type='or',T=0.09531018,Dataset=yxtx1,B=NA,v=v,x=NA,es=es,p=NA,weight=NA);
run;
SAS軟件自動返回的結果(圖 2)中,可以發現基于納入的5項研究的Meta分析異質性檢驗的統計效能為85.7%。

4.3 計算亞組分析統計效能
在Meta分析時,通常會依據納入研究的臨床特征或方法學差異進行亞組分析,因此對Meta亞組分析的統計效能加以計算實為必要,以明確亞組間差異。與總體合并Meta分析不同,亞組Meta分析合并效應量的平均值(T)為各組效應量的加權和(G= c1T1 + c2T2 + c3T3 + … + cpTp,式中系數c之和為0,例如四個亞組,那么可以界定為c1=1,c2=0,c3=0,c4= -1)。根據表 2中的數據及亞組分組標準,錄入格式如下:
data yxtx2;
input es1 v1 es2 v2 T weight;
cards;
0.015 0.003136 -0.035 0.011236 0.050772326 1
-0.174 2.099601 -0.009 0.358801 0.000000000 -1
. . -0.105 0.3249 . .
;
run;
基于上述SAS數據集,先將下載好的%metapower宏讀入SAS軟件,運行一下,再根據2介紹內容對%metapower宏參數進行如下指定:
%metapower(test='contrast',model='random',raw_data='yes',alpha=.05,tau2=99,heterogeneity=99,n1=99,n2=99,k=99,eff_type='or',T=T,Dataset=yxtx2,B=NA,v=v1 v2,x=NA,es=es1 es2,p=NA,weight=weight);
run;
SAS軟件自動返回的結果(圖 3)中,可以發現基于納入的5項研究的Meta分析進行亞組分析的統計效能為7.2%。

5 討論
Meta分析的統計效能計算類似于原始研究的效能分析,評價顯著性檢驗的統計效能是Meta分析計劃書的一部分 [12]。然而至今系統評價/Meta分析制作者仍很少關注Meta分析顯著性檢驗時的統計學效能計算 [13],造成這一問題的原因主要為缺乏計算Meta分析統計效能的方法和Meta分析的檢驗效能高于原始研究這一普遍認識 [14]。當前國內外針對原始研究和Meta分析統計效能計算主要使用G*Power等軟件,但此類軟件并未考慮Meta分析合并模型,在統計效能計算方面存在一定不足 [15]。
目前,SAS軟件可用于實現二分類數據和連續型數據的Meta分析 [16],也可用于實現診斷準確性試驗 [17]和網狀Meta分析 [18],還可用于計算Meta分析的統計效能 [11]。SAS軟件編程用于Meta分析統計效能計算能夠克服上述不足,但由于對使用者的編程水平等要求較高而難于常規推廣,Cafri等 [6]基于編程開發的SAS宏(metapower)可以輕松實現不同合并模型、不同效應指標的統計效能計算。盡管SAS宏簡化了Meta分析統計效能的計算過程,研究者仍應盡量多地搜集納入合并研究的相關信息,以保證參數估算的準確性,最終實現統計效能的精確估計。
統計效能的估算固然重要,但不能簡單地假設Meta分析具有高的檢驗效能,而應該對其統計效能進行計算以保證合并結果的可信度 [19]。例如一項研究表明Cochrane系統評價數據庫中收錄的系統評價所包含的中位研究數為6 [20],在此種情況下檢驗中等大小的統計效能常常低于80%[21]。第二,盡管在某些情況下可通過放寬納入標準納入足夠多的研究以保證Meta分析具備足夠的統計學效能,然而隨著納入標準的改變,Meta分析最初擬定解決的問題也隨之變化,故多數情況下忠于原始問題要強于為了實現足夠的檢驗效能而改變納入標準 [22]。第三,當納入研究不足以開展一項Meta分析時應放棄合并,除非納入研究能保證Meta分析達到足夠的檢驗效能。總之,更多地關注納入研究及Meta分析的統計效能,有助于改善Meta分析的質量,促使Meta分析的效果真正等同于多中心、大樣本、高質量的原始研究(如隨機對照試驗)的結果。
Meta分析是將同一主題的多項同質研究采用定量手段加以合并以得出總體結果的一種統計學方法 [1],其目的是對干預/暴露是否有意義進行顯著性檢驗,因此保證研究的統計效能至關重要 [2]。原始研究統計效能的重要性已被公認,但因缺乏相應的計算方法 [3]使得Meta分析顯著性檢驗中很少考慮統計效能 [4]。為此Hedges與Pigott基于SAS軟件開發了一套用于Meta分析統計效能計算的程序,因其對使用者要求較高而難于常規推廣 [2, 5]。為實現Meta分析統計效能在SAS軟件中的便捷計算,并提高系統評價與Meta分析制作者對顯著性檢驗中統計效能的關注度,美國南佛羅里達大學的Cafri等 [6]在2009年共同開發了專門用于實現Meta分析統計效能計算的SAS宏,即“metapower宏”。目前,包括筆者團隊在內的大多作者都采用Power and Precision和G*Power等軟件實現原始研究和Meta分析的效能計算 [7, 8],國內尚無介紹SAS 宏命令實現Meta分析統計效能的文章。本文以Yakoob等 [9]發表的文章中的部分數據(表 1)為例,介紹應用SAS軟件%metapower宏命令實現Meta分析統計效能的過程。

1 SAS軟件及SAS宏簡介
SAS(statistical analysis system)軟件是目前國際上最具影響力的統計軟件之一,具有完備的數據訪問、管理、分析和呈現功能,目前最高版本為9.3版 [10]。SAS軟件主要靠輸入代碼編程驅動,故SAS軟件的應用要求使用者具備較高的專業知識,而利用SAS軟件的宏可以減少在完成一些共同任務時必須輸入的文本量,也可以使程序模塊化,使程序具有易讀、便于修改、移植、方便重復使用的優點 [11]。
SAS宏是一段編輯好的程序,用戶可以在提交SAS程序或SAS命令行中調用 [11]。利用%macro語句開始一個宏,同時給出這個宏的名字,如:%macro yxtx;用%mend語句結束一個宏,其后給出宏的名字,如%mend yxtx。放一個百分數符號(%)在宏名字的前面可以調用一個宏,如%yxtx。宏命令括號內的變量稱為宏參數,用戶可以直接為宏參數賦值,也可在調用宏時指定參數值 [10, 11]。
2 metapower宏簡介
metapower宏是專門用于實現Meta分析統計效能計算的SAS宏 [
該宏適用于傳統的二分類/連續型數據Meta分析、異質性檢驗、亞組分析及Meta回歸等的統計效能計算,使用者只需對效能計算類型加以界定即可完成特定的效能分析。在SAS軟件中,Meta分析統計效能計算的所有過程都被整合在metapower宏中,用戶只需對作宏參數進行賦值,即可方便獲取各種所需結果。metapower宏的主要參數介紹如下:
%metapower (test=,model=,raw_data=,alpha=,tau2=,heterogeneity=,n1=,n2=,k=,eff_type=,T=,Dataset=,B=,v=,x=,es=,p=,weight=)
其中test指定效能計算類型(M:平均效應量;QT:異質性檢驗;contrast:亞組分析/組檢差異性檢驗;QB:分類中介變量檢驗;QW:分類變量不同水平異質性檢驗;Reg:多項混合檢驗與回歸系數檢驗;QE:回歸分析的異質性檢驗);model指定不同的Meta合并模型(固定或隨機效應模型);raw_data指定效能計算是否基于原始數據;alpha指定顯著性檢驗水準;tau2指定研究間方差(如果未提供,指定該值為99,此時可以指定異質性比值),如果提供了原始數據,基于這些數據,程序可自動估算研究間方差作為錄入參數,如果未指定原始數據,則需要指定tau2或者heterogenity比值,這兩個值可源于合理的猜測;heterogeneity指定研究間方差與研究內誤差比值(可按照Hedges和Pigott的經驗法,指定該比值為0.333、0.667和1對應于低、中、高的異質性);n1/n2指定納入研究的平均樣本量,基于效應指標d的統計效能計算,需同時提供n1和n2,基于效應指標r或z的統計效能計算則只需n1,而對于效應指標OR,需在一般研究水平指定比值對數的方差(如,式中a-d對應于四個表中的單位頻數);k指定納入合并研究數;eff_type指定效應指標(d:標準化均數差,r:相關系數,z:相關系數的Fisher轉換值,or:比值比的對數值);T指定特定效應指標下合并效應量的平均大小(,其中權重 ,νi為效應量方差,Ti為第i項研究的效應量,k為納入合并研究數);Dataset指定SAS數據集;B從標準化回歸系數集中指定一個參數;v從包含研究效應量方差的外部數據集中指定一個或多個參數;x從包含回歸分析預測變量值的外部數據集中指定一個或多個參數(等同于設計矩陣);es從包含單個研究效應量的外部數據集中指定一個或多個參數;p為絕對數據模型中,分析殘差變量時的分類變量數或回歸分析模型中,殘差變量檢驗時的預測變量數;weight為亞組分析時,從各組權重賦值構成的數據集中指定一個參數。
3 數據準備
基于SAS系統,各個統計學分析程序只能對SAS數據集中的數據進行處理,所以如何將數據轉換成SAS數據集是SAS進行統計分析的基礎。如何選取易于解釋、能夠準確反映不同研究間結局指標關聯程度的合并效應量指標是實現Meta分析的關鍵。效應量指標的選擇依據數據類型的不同而變化,故為實現結局的可解釋性,組間比較及組間合并對不同研究效應指標進行標準化尤為重要。在社會和醫學領域,最常用的標準化效應量指標包括標準化均數效應量(d)、相關系數(r)、r的Fisher轉化值(z)及比值比的對數轉化值(logOR)。
對于連續型數據,常采用d作為效應量指標,其計算公式如下:
$d=\frac{{{{\bar{M}}}^{T}}-{{{\bar{M}}}^{C}}}{{{S}_{within}}}$ |
式中,為干預組效應量均數,為對照組效應量均數,Swithin為組內標準差(Swithin = ,式中nT、nC和ST、SC分別為干預組和對照組樣本量及標準差)。d值的抽樣不一致性可用方差(v)進行解釋,其計算公式如下:
如果研究的兩組樣本量已知,可以通過單個效應量值計算v值。因為d近似服從真實效應的正態分布,因此也可用效應量的95%可信區間/標準差/標準誤計算v值。
對于二分類數據,比值比的對數值(logOR)是常用的效應量指標,其計算公式如下:
$v=\frac{{{n}^{T}}+{{n}^{C}}}{{{n}^{T}}{{n}^{C}}}+\frac{{{d}^{2}}}{2\left( {{n}^{T}}+{{n}^{C}} \right)}$ |
式中,pT和pC分別指干預組和對照組事件發生率,logOR的抽樣不一致性用其方差(v)表示,計算公式如下:
$\log OR=\log \left[ \frac{{{p}^{T}}/\left( 1-{{p}^{T}} \right)}{{{p}^{C}}/\left( 1-{{p}^{C}} \right)} \right]=\log \left[ \frac{{{p}^{T}}/\left( 1-{{p}^{C}} \right)}{{{p}^{C}}/\left( 1-{{p}^{T}} \right)} \right]$ |
式中,nP和nC表示干預組和對照組的樣本量。logOR近似服從真實效應的正態分布,可用效應量的95%可信區間/標準差/標準誤計算v值。OR指標系還包括相對危險度(relative risk,RR)和風險差(risk difference,RD),對于二分類數據效應指標測量的具體論述參考專業統計教材。
對于連續型變量或效應量結局指標,相關和相關系數也常被作為效應量指標。鑒于相關系數(correlation coefficient)多數情況下不服從正態分布,因此通常將其經過Fisher轉換(z),使其近似服從正態分布,具體轉化公式如下:
$z=\frac{1}{2}\ln \left[ \frac{1+r}{1-r} \right]$ |
式中,r為相關系數,不同類型檢驗對應r的計算參見統計教材。z值的抽樣不一致性用其方差(v)表示,計算如下:
$v=\frac{1}{n-3}$ |
式中,n為研究樣本量,該值也服從于其真實效應的正態分布,也可通過d和logOR的v轉化公式計算抽樣不一致性方差。
盡管對于不同數據類型合并選取不同的效應指標,然而各效應指標可以實現相互轉化。logOR及相應方差(vlogOR)與d值及對應方差(vd)相互轉化公式如下:
$d=\log OR\times \frac{\sqrt{3}}{\pi },{{v}_{d}}={{v}_{\log OR}}\times \frac{3}{{{\pi }^{2}}}$ |
r及對應方差(vr)轉化為d值及vd公式如下:
$d=\frac{2r}{\sqrt{1-{{r}^{2}}}},{{v}_{d}}=\frac{4{{v}_{r}}}{{{\left( 1-{{r}^{2}} \right)}^{3}}}$ |
d值及vd轉化為r及vr公式如下:
$r=\frac{d}{\sqrt{{{d}^{2}}+a}},{{v}_{r}}=\frac{{{a}^{2}}{{v}_{d}}}{{{\left( {{d}^{2}}+a \right)}^{3}}}$ |
式中,a表示校正因子,其值決定于兩組樣本量(a = )。
基于本次示例數據的類型(二分類數據),使用前需要先行將效應量(effect size,es)對應轉化為宏參數effect_type效應指標所對應的log OR值,標準誤(SE)轉化為方差(v)(v = SE2)。示例數據轉換完成后(表 2),錄入格式如下:
data yxtx1;
input es v;
cards;
0.015 0.003136
-0.035 0.011236
-0.174 2.099601
-0.009 0.358801
-0.105 0.3249
;
run;
至此,以“yxtx1”為名的SAS數據集就被建立了。需要注意的是,標點符號均為英文狀態下輸入。

4 在metapower宏中實現統計效能計算
4.1 計算平均效應量統計效能
基于3錄入的SAS數據集,先將下載好的%metapower宏讀入SAS軟件,運行一下,再根據2介紹內容對%metapower宏參數進行如下指定:
%metapower(test='M',model='random',raw_data='yes',alpha=.05,tau2=99,heterogeneity=99,n1=99,n2=99,k=99,eff_type='or',T=0.09531018,Dataset=yxtx1,B=NA,v=v,x=NA,es=es,p=NA,weight=NA);
run;
該命令中需注意T值的計算,其值為合并效應量的平均大小,鑒于原文中合并效應量為1,求取自然對數值為0,因此原作者分別取值1.1、1.2和1.3進行效能計算。本文演示只取1.1進行統計效能計算。基于上述宏命令,SAS軟件自動返回的結果(圖 1)中,可以發現基于納入的5項研究的Meta分析平均效應量的統計效能為49.2%。

4.2 計算異質性檢驗統計效能
基于3錄入的SAS數據集,先將下載好的%metapower宏讀入SAS軟件,運行一下,再根據2介紹內容對%metapower宏參數進行如下指定:
%metapower(test='QT',model='random',raw_data='yes',alpha=.05,tau2=99,heterogeneity=99,n1=99,n2=99,k=99,eff_type='or',T=0.09531018,Dataset=yxtx1,B=NA,v=v,x=NA,es=es,p=NA,weight=NA);
run;
SAS軟件自動返回的結果(圖 2)中,可以發現基于納入的5項研究的Meta分析異質性檢驗的統計效能為85.7%。

4.3 計算亞組分析統計效能
在Meta分析時,通常會依據納入研究的臨床特征或方法學差異進行亞組分析,因此對Meta亞組分析的統計效能加以計算實為必要,以明確亞組間差異。與總體合并Meta分析不同,亞組Meta分析合并效應量的平均值(T)為各組效應量的加權和(G= c1T1 + c2T2 + c3T3 + … + cpTp,式中系數c之和為0,例如四個亞組,那么可以界定為c1=1,c2=0,c3=0,c4= -1)。根據表 2中的數據及亞組分組標準,錄入格式如下:
data yxtx2;
input es1 v1 es2 v2 T weight;
cards;
0.015 0.003136 -0.035 0.011236 0.050772326 1
-0.174 2.099601 -0.009 0.358801 0.000000000 -1
. . -0.105 0.3249 . .
;
run;
基于上述SAS數據集,先將下載好的%metapower宏讀入SAS軟件,運行一下,再根據2介紹內容對%metapower宏參數進行如下指定:
%metapower(test='contrast',model='random',raw_data='yes',alpha=.05,tau2=99,heterogeneity=99,n1=99,n2=99,k=99,eff_type='or',T=T,Dataset=yxtx2,B=NA,v=v1 v2,x=NA,es=es1 es2,p=NA,weight=weight);
run;
SAS軟件自動返回的結果(圖 3)中,可以發現基于納入的5項研究的Meta分析進行亞組分析的統計效能為7.2%。

5 討論
Meta分析的統計效能計算類似于原始研究的效能分析,評價顯著性檢驗的統計效能是Meta分析計劃書的一部分 [12]。然而至今系統評價/Meta分析制作者仍很少關注Meta分析顯著性檢驗時的統計學效能計算 [13],造成這一問題的原因主要為缺乏計算Meta分析統計效能的方法和Meta分析的檢驗效能高于原始研究這一普遍認識 [14]。當前國內外針對原始研究和Meta分析統計效能計算主要使用G*Power等軟件,但此類軟件并未考慮Meta分析合并模型,在統計效能計算方面存在一定不足 [15]。
目前,SAS軟件可用于實現二分類數據和連續型數據的Meta分析 [16],也可用于實現診斷準確性試驗 [17]和網狀Meta分析 [18],還可用于計算Meta分析的統計效能 [11]。SAS軟件編程用于Meta分析統計效能計算能夠克服上述不足,但由于對使用者的編程水平等要求較高而難于常規推廣,Cafri等 [6]基于編程開發的SAS宏(metapower)可以輕松實現不同合并模型、不同效應指標的統計效能計算。盡管SAS宏簡化了Meta分析統計效能的計算過程,研究者仍應盡量多地搜集納入合并研究的相關信息,以保證參數估算的準確性,最終實現統計效能的精確估計。
統計效能的估算固然重要,但不能簡單地假設Meta分析具有高的檢驗效能,而應該對其統計效能進行計算以保證合并結果的可信度 [19]。例如一項研究表明Cochrane系統評價數據庫中收錄的系統評價所包含的中位研究數為6 [20],在此種情況下檢驗中等大小的統計效能常常低于80%[21]。第二,盡管在某些情況下可通過放寬納入標準納入足夠多的研究以保證Meta分析具備足夠的統計學效能,然而隨著納入標準的改變,Meta分析最初擬定解決的問題也隨之變化,故多數情況下忠于原始問題要強于為了實現足夠的檢驗效能而改變納入標準 [22]。第三,當納入研究不足以開展一項Meta分析時應放棄合并,除非納入研究能保證Meta分析達到足夠的檢驗效能。總之,更多地關注納入研究及Meta分析的統計效能,有助于改善Meta分析的質量,促使Meta分析的效果真正等同于多中心、大樣本、高質量的原始研究(如隨機對照試驗)的結果。