Meta分析時常需采用同一研究中多個亞組的均值及標準差計算獲得未分亞組的均數及標準差,本文介紹了合并多亞組標準差的方法及其推導過程。首先指出一種合并亞組標準差的錯誤方法,并指出該方法是對測量學中同一對象多組測量結果標準差合并公式的誤用,并不適用于Meta分析中合并多亞組標準差計算,同時探討了其計算誤差及對Meta分析結論可能產生的影響。在本文的實例中,錯誤公式在某些條件下可導致較大的計算誤差,從而導致研究結論出現偏差。其后我們進行了公式推導,得出的正確公式在進行多亞組標準差合并時不需滿足其他條件,如不計舍入誤差,計算結果就是整體標準差。根據該公式我們對錯誤方法進行了誤差分析,指出影響其計算準確性的條件。在今后的Meta分析中,建議采用本文推薦的公式進行多亞組標準差合并計算,以避免錯誤方法使Meta分析結果出現偏差
引用本文: 張冰, 康潔, 陳曉明. Meta分析多亞組標準差合并方法探討. 中國循證醫學雜志, 2016, 16(7): 851-854. doi: 10.7507/1672-2531.20160130 復制
1 Meta分析亞組計量資料合并存在的問題
Meta分析時,常需將一個原始研究不同亞組計量資料的均值與標準差進行合并,以便同未行亞組劃分的其他原始研究進行下一步合并分析。如Kaplowitz等[1]在評價Trabectome手術治療青光眼療效的Meta分析中,納入了Klamann等[2]發表的一篇原始研究。在Klamann等[2]的研究中,研究者將納入患者按疾病類型分為了原發性開角型青光眼(primary open-angle glaucoma,POAG)、假剝脫性青光眼(pseudoexfoliation glaucoma,PEX)及色素性青光眼(pigmentary glaucoma,PG)三個亞組,每個亞組又按是否進行了術前選擇性激光小梁成形(selective laser trabeculoplasty,SLT)分為兩個小亞組,并僅分別報告了基線數據及隨訪結果(其中基線數據見表 1)。而納入Meta分析的其他原始研究多數并未劃分亞組并報告亞組數據。這導致此研究結果無法直接與其他原始研究結果進行合并。為解決這一問題,一種可行的做法是將各亞組作為獨立的子研究分別納入。如Kaplowitz等[1]還納入了Ting等[3]發表的原始研究,該研究有POAG和PEX兩個亞組,在Meta分析時被看作兩個獨立的研究與其他研究進行合并。但這種做法要求各亞組和其他研究具有同質性,但因亞組劃分往往基于疾病差異,存在的臨床異質性導致無法通過同質性檢驗,因而上述做法理論上來說并不嚴密。因此,很多研究者嘗試通過不同公式將同一研究中不同亞組結果合并。我們以Klamann [2]研究的基線數據為例,能否通過公式計算將表 1中的6個亞組數據合并為1個總的眼壓值呢?本文將具體討論亞組合并中標準差合并問題(均值合并問題較為簡單,不行討論)。

此外,我們選擇兩篇[4, 5]既給出了亞組數據又給出了總體數據的原始研究文獻(表 2),用以驗證不同亞組合并公式計算的結果是否出現偏差。

2 一種常見的錯誤計算方法及來源
一種常見于網絡用來合并標準差的方法如下式(1)[6-7],假設原始研究共分為m個亞組,其中,第i亞組樣本量為ni,該亞組標準差為SDi,總體標準差為SDT;(1’)是(1)在兩亞組情形下的形式:
$ S{D_T} = \sqrt {\frac{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} }}{{\left( {\sum\nolimits_{i = 1}^m {{n_i} - m} } \right)}}} $ |
$ S{D_T} = \sqrt {\frac{{\left( {{n_1} - 1} \right)SD_1^2 + \left( {{n_2} - 1} \right)SD_2^2}}{{{n_1} + {n_2} - 2}}} $ |
選取表 2中Belovay等[4]的亞組數據進行驗算,式(1)計算準確。選取表 2中Toteberg-Harms等[5]研究進行驗算,式(1)計算相對誤差卻達(5.3-2.9)/5.3=45%,顯示使用式(1)合并不同亞組標準差具有限制條件。
此外,我們對原始研究數據進行構建,發現采用式(1)合并標準差后可能導致Meta分析結果出現偏差甚至錯誤。表 3模擬數據顯示,如果研究1未行亞組劃分,研究2根據疾病特點等劃分為A、B兩個亞組。研究1報道數據為干預組結果為4.5±1.0,對照組結果為4.0±1.0;研究2報道數據為:A亞組干預組結果為1.4±1.0,對照組為1.5±1.0,B亞組干預組結果為4.6±1.0,對照組為1.5±1.0。這時我們通過逐一計算表 3中數據,可確定研究2干預組和對照組的總計結果為3.0±2.0,1.5±0.9(但讀者無法通過發表的文獻獲得這一數據)。將計算出的研究2的總計結果與研究1進行Meta分析,結果為MD=0.8[95%CI(-0.2,1.7)](I2=0),兩組差異無統計學意義。然而使用式(1)合并研究2報道的A、B亞組數據,則干預組及對照組總計結果分別為3.0±1.0,1.5±1.0,再與研究1進行Meta分析,合并后的結果為MD=1.0[95%CI(0.2,1.8)](I2=33%),顯示兩組差異有統計學意義,可能導致結論出錯。

其實,式(1)原本是測量學中的公式,可在測量學專業書籍及文獻中查到[8],其適用于對同一對象多組測量結果的合并,因這多組測量針對的是同一對象,其測量的真值(Truth-value)是相同的,(ni-1)SDi2項實際上是第i組測量的方差,各組方差加和后再除以總共m組測量的總自由度∑i=1mni-m
3 推導正確公式及應用舉例
下面推導合并多亞組標準差的正確公式(假設共有m個亞組,第i亞組樣本量為ni,均值為
$ \begin{array}{c} \left( {\sum\limits_{i = 1}^m {{n_i} - 1} } \right)SD_T^2 = \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{x_{ij}} - \overline {{x_T}} } \right)}^2}} } = \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{x_{ij}} - {{\bar x}_i} + {{\bar x}_i} - \overline {{x_T}} } \right)}^2}} } \\ = \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{x_{ij}} - {{\bar x}_i}} \right)}^2}} } + \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} } \\ + 2\sum\limits_{i = 1}^m {\left[ {\left( {{{\bar x}_i} - \overline {{x_T}} } \right)\left( {\sum\limits_{j = 1}^{{n_i}} {{x_{ij}} - {n_i}{{\bar x}_i}} } \right)} \right]} \\ = \sum\limits_{i = 1}^m {\left( {{n_i} - 1} \right)} SD_i^2 + \sum\limits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} \end{array} $ |
$ S{D_T} = \sqrt {\frac{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} + \sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}{{\left( {\sum\nolimits_{i = 1}^m {{n_i} - 1} } \right)}}} $ |
我們并未檢索到上述推導過程在其他文獻及經典循證醫學、醫學統計學書籍[9-11]中有所報道,但檢索到了報道公式(2)在兩個亞組情形下的文獻[12]和書籍[11],即下面的式(2’),但它們均未注明所用公式出處及推導過程。
$ S{D_T} = \sqrt {\frac{{\left( {{n_1} - 1} \right)SD_1^2 + \left( {{n_2} - 1} \right)SD_2^2 + \frac{{{n_1}{n_2}}}{{{n_1} + {n_2}}}{{\left( {{{\bar x}_1} - {{\bar x}_2}} \right)}^2}}}{{{n_1} + {n_2} - 1}}} $ |
因公式(2)的整個推導過程均為等價變換,所以不需要滿足其他附加條件即可直接使用,表 2列出了使用公式(2)合并標準差的結果,可見計算所得就等于實際總體標準差(對Toteberg-Harms研究[5]計算結果2%左右的相對誤差來自舍入誤差)。
現在,我們回到文章開頭的問題,采用正確公式合并表 1 [2]中6個亞組的基線結果,總體均值
$ \sqrt {\frac{{\left( {14 \times {{3.99}^2} + 11 \times {{4.64}^2} + \cdots + 9 \times {{4.85}^2}} \right) + 15 \times {{\left( {17.80 - 21.09} \right)}^2} + \cdots + 9 \times {{\left( {19.00 - 21.09} \right)}^2}}}{{\left( {15 + 12 + 15 + 12 + 10 + 10 - 1} \right)}}} $ |
4 誤差分析
前文已提出在循證醫學中使用公式(1)源于不了解其使用前提,而公式(1)的使用具有限制條件。下面進行公式(1)的誤差分析,假設公式(2)計算的總體標準差為SDT(也即真實值),使用公式(1)計算結果為SDT’,顯然越接近0,公式(1)計算結果越準確,將公式(1)、(2)代入,在總樣本量不太小的情況下,∑i=1mni-m近似認為等于∑i=1mni-1,整理得到(中間計算過程略):
$ \begin{array}{c} 1 - {\left( {\frac{{S{D_T}^\prime }}{{S{D_T}}}} \right)^2} \approx \frac{{\sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} + \sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}\\ = \frac{1}{{1 + \frac{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} }}{{\sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}}} \end{array} $ |
欲使接近0,需滿足∑i=1m(ni-1)SDi2 >> ∑i=1mni(
$ \begin{array}{l} 1 - {\left( {\frac{{S{D_T}^\prime }}{{S{D_T}}}} \right)^2} = \frac{{S{D_T} + S{D_T}^\prime }}{{S{D_T}}}\frac{{S{D_T} - S{D_T}^\prime }}{{S{D_T}}}\\ \approx 2\frac{{S{D_T} - S{D_T}^\prime }}{{S{D_T}}} \le 2 \times 5\% = 10\% \\ \frac{1}{{1 + \frac{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} }}{{\sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}}} \le 10\% \\ \left( {\sum\limits_{i = 1}^m {{n_i} - 1} } \right)SD_i^2 \ge 9\sum\limits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} \end{array} $ |
即當∑i=1m(ni-1)SDi2為∑i=1mni(
5 討論
在進行Meta分析時,常需合并連續型變量不同亞組均值、標準差,但據筆者所知,尚未有文獻系統報道過這一問題。這看似很小的問題,如前所述,如果方法選擇錯誤,可能導致較大的計算誤差,甚至影響到Meta分析結果的準確性。因循證醫學、統計書籍較少涉及該內容[9-11],而二次研究文獻一般也未報道這一中間過程,導致研究者常求助網絡,而式(1)是最易找到的錯誤公式[6-7]。由于式(1)常計算誤差較小,筆者通過產生100組、每組兩亞組、每亞組10個數據隨機數據的方法進行檢驗(具體文中未給出),發現有91組計算相對誤差小于5%。從而導致研究者認為公式(1)可用于所有標準差合并運算。但通過本文舉例,大家可看到,在實際研究中,采用式(1)合并標準差可能產生較大誤差,甚至可能導致錯誤的Meta分析結論。同時考慮到式(1)來源于測量學中對同一對象多組測量結果的合并[8],因此,式(1)應用于Meta分析合并多亞組標準差是一種誤用,并不合適。事實上,在要求相對誤差小于5%的前提下,只有在∑i=1m(ni-1)SDi2為∑i=1mni(
公式(2)整個推導過程均為等價變形,不要求滿足其他附加條件,可直接用來計算各亞組合并標準差的結果,如不考慮舍入誤差,計算所得等于總體標準差,且計算過程并不復雜。雖然有少數書籍報道了公式(2)在兩亞組情形下的形式(2’),并指出更多亞組可先將兩亞組合并為一組再與其他亞組合并,但在亞組較多時,計算過程會比直接使用公式(2)計算繁瑣得多,而且因未給出推導過程,不利于讀者深入掌握這一公式。雖然很多讀者對公式(2)比較陌生,但其推導過程核心思想與大家非常熟悉的數理統計學中方差分析的核心思想是相通的,即總變異的分解,將總體變異分解到組內變異與組間變異中,感興趣的讀者可參閱統計學專業書籍方差分析相關章節公式推導過程[10],與本文公式(2)推導過程進行比較,相信會對公式(2)的推導有更加深入的理解。
綜上所述,我們推薦使用公式(2)進行合并多亞組標準差運算,除舍入誤差,其計算結果就等于總體標準差。同時,因式(1)應用于循證醫學合并標準差運算是一種誤用,存在計算不準確甚至影響Meta分析結果的風險,不應這樣使用。
1 Meta分析亞組計量資料合并存在的問題
Meta分析時,常需將一個原始研究不同亞組計量資料的均值與標準差進行合并,以便同未行亞組劃分的其他原始研究進行下一步合并分析。如Kaplowitz等[1]在評價Trabectome手術治療青光眼療效的Meta分析中,納入了Klamann等[2]發表的一篇原始研究。在Klamann等[2]的研究中,研究者將納入患者按疾病類型分為了原發性開角型青光眼(primary open-angle glaucoma,POAG)、假剝脫性青光眼(pseudoexfoliation glaucoma,PEX)及色素性青光眼(pigmentary glaucoma,PG)三個亞組,每個亞組又按是否進行了術前選擇性激光小梁成形(selective laser trabeculoplasty,SLT)分為兩個小亞組,并僅分別報告了基線數據及隨訪結果(其中基線數據見表 1)。而納入Meta分析的其他原始研究多數并未劃分亞組并報告亞組數據。這導致此研究結果無法直接與其他原始研究結果進行合并。為解決這一問題,一種可行的做法是將各亞組作為獨立的子研究分別納入。如Kaplowitz等[1]還納入了Ting等[3]發表的原始研究,該研究有POAG和PEX兩個亞組,在Meta分析時被看作兩個獨立的研究與其他研究進行合并。但這種做法要求各亞組和其他研究具有同質性,但因亞組劃分往往基于疾病差異,存在的臨床異質性導致無法通過同質性檢驗,因而上述做法理論上來說并不嚴密。因此,很多研究者嘗試通過不同公式將同一研究中不同亞組結果合并。我們以Klamann [2]研究的基線數據為例,能否通過公式計算將表 1中的6個亞組數據合并為1個總的眼壓值呢?本文將具體討論亞組合并中標準差合并問題(均值合并問題較為簡單,不行討論)。

此外,我們選擇兩篇[4, 5]既給出了亞組數據又給出了總體數據的原始研究文獻(表 2),用以驗證不同亞組合并公式計算的結果是否出現偏差。

2 一種常見的錯誤計算方法及來源
一種常見于網絡用來合并標準差的方法如下式(1)[6-7],假設原始研究共分為m個亞組,其中,第i亞組樣本量為ni,該亞組標準差為SDi,總體標準差為SDT;(1’)是(1)在兩亞組情形下的形式:
$ S{D_T} = \sqrt {\frac{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} }}{{\left( {\sum\nolimits_{i = 1}^m {{n_i} - m} } \right)}}} $ |
$ S{D_T} = \sqrt {\frac{{\left( {{n_1} - 1} \right)SD_1^2 + \left( {{n_2} - 1} \right)SD_2^2}}{{{n_1} + {n_2} - 2}}} $ |
選取表 2中Belovay等[4]的亞組數據進行驗算,式(1)計算準確。選取表 2中Toteberg-Harms等[5]研究進行驗算,式(1)計算相對誤差卻達(5.3-2.9)/5.3=45%,顯示使用式(1)合并不同亞組標準差具有限制條件。
此外,我們對原始研究數據進行構建,發現采用式(1)合并標準差后可能導致Meta分析結果出現偏差甚至錯誤。表 3模擬數據顯示,如果研究1未行亞組劃分,研究2根據疾病特點等劃分為A、B兩個亞組。研究1報道數據為干預組結果為4.5±1.0,對照組結果為4.0±1.0;研究2報道數據為:A亞組干預組結果為1.4±1.0,對照組為1.5±1.0,B亞組干預組結果為4.6±1.0,對照組為1.5±1.0。這時我們通過逐一計算表 3中數據,可確定研究2干預組和對照組的總計結果為3.0±2.0,1.5±0.9(但讀者無法通過發表的文獻獲得這一數據)。將計算出的研究2的總計結果與研究1進行Meta分析,結果為MD=0.8[95%CI(-0.2,1.7)](I2=0),兩組差異無統計學意義。然而使用式(1)合并研究2報道的A、B亞組數據,則干預組及對照組總計結果分別為3.0±1.0,1.5±1.0,再與研究1進行Meta分析,合并后的結果為MD=1.0[95%CI(0.2,1.8)](I2=33%),顯示兩組差異有統計學意義,可能導致結論出錯。

其實,式(1)原本是測量學中的公式,可在測量學專業書籍及文獻中查到[8],其適用于對同一對象多組測量結果的合并,因這多組測量針對的是同一對象,其測量的真值(Truth-value)是相同的,(ni-1)SDi2項實際上是第i組測量的方差,各組方差加和后再除以總共m組測量的總自由度∑i=1mni-m
3 推導正確公式及應用舉例
下面推導合并多亞組標準差的正確公式(假設共有m個亞組,第i亞組樣本量為ni,均值為
$ \begin{array}{c} \left( {\sum\limits_{i = 1}^m {{n_i} - 1} } \right)SD_T^2 = \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{x_{ij}} - \overline {{x_T}} } \right)}^2}} } = \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{x_{ij}} - {{\bar x}_i} + {{\bar x}_i} - \overline {{x_T}} } \right)}^2}} } \\ = \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{x_{ij}} - {{\bar x}_i}} \right)}^2}} } + \sum\limits_{i = 1}^m {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} } \\ + 2\sum\limits_{i = 1}^m {\left[ {\left( {{{\bar x}_i} - \overline {{x_T}} } \right)\left( {\sum\limits_{j = 1}^{{n_i}} {{x_{ij}} - {n_i}{{\bar x}_i}} } \right)} \right]} \\ = \sum\limits_{i = 1}^m {\left( {{n_i} - 1} \right)} SD_i^2 + \sum\limits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} \end{array} $ |
$ S{D_T} = \sqrt {\frac{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} + \sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}{{\left( {\sum\nolimits_{i = 1}^m {{n_i} - 1} } \right)}}} $ |
我們并未檢索到上述推導過程在其他文獻及經典循證醫學、醫學統計學書籍[9-11]中有所報道,但檢索到了報道公式(2)在兩個亞組情形下的文獻[12]和書籍[11],即下面的式(2’),但它們均未注明所用公式出處及推導過程。
$ S{D_T} = \sqrt {\frac{{\left( {{n_1} - 1} \right)SD_1^2 + \left( {{n_2} - 1} \right)SD_2^2 + \frac{{{n_1}{n_2}}}{{{n_1} + {n_2}}}{{\left( {{{\bar x}_1} - {{\bar x}_2}} \right)}^2}}}{{{n_1} + {n_2} - 1}}} $ |
因公式(2)的整個推導過程均為等價變換,所以不需要滿足其他附加條件即可直接使用,表 2列出了使用公式(2)合并標準差的結果,可見計算所得就等于實際總體標準差(對Toteberg-Harms研究[5]計算結果2%左右的相對誤差來自舍入誤差)。
現在,我們回到文章開頭的問題,采用正確公式合并表 1 [2]中6個亞組的基線結果,總體均值
$ \sqrt {\frac{{\left( {14 \times {{3.99}^2} + 11 \times {{4.64}^2} + \cdots + 9 \times {{4.85}^2}} \right) + 15 \times {{\left( {17.80 - 21.09} \right)}^2} + \cdots + 9 \times {{\left( {19.00 - 21.09} \right)}^2}}}{{\left( {15 + 12 + 15 + 12 + 10 + 10 - 1} \right)}}} $ |
4 誤差分析
前文已提出在循證醫學中使用公式(1)源于不了解其使用前提,而公式(1)的使用具有限制條件。下面進行公式(1)的誤差分析,假設公式(2)計算的總體標準差為SDT(也即真實值),使用公式(1)計算結果為SDT’,顯然越接近0,公式(1)計算結果越準確,將公式(1)、(2)代入,在總樣本量不太小的情況下,∑i=1mni-m近似認為等于∑i=1mni-1,整理得到(中間計算過程略):
$ \begin{array}{c} 1 - {\left( {\frac{{S{D_T}^\prime }}{{S{D_T}}}} \right)^2} \approx \frac{{\sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} + \sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}\\ = \frac{1}{{1 + \frac{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} }}{{\sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}}} \end{array} $ |
欲使接近0,需滿足∑i=1m(ni-1)SDi2 >> ∑i=1mni(
$ \begin{array}{l} 1 - {\left( {\frac{{S{D_T}^\prime }}{{S{D_T}}}} \right)^2} = \frac{{S{D_T} + S{D_T}^\prime }}{{S{D_T}}}\frac{{S{D_T} - S{D_T}^\prime }}{{S{D_T}}}\\ \approx 2\frac{{S{D_T} - S{D_T}^\prime }}{{S{D_T}}} \le 2 \times 5\% = 10\% \\ \frac{1}{{1 + \frac{{\sum\nolimits_{i = 1}^m {\left( {{n_i} - 1} \right)SD_i^2} }}{{\sum\nolimits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} }}}} \le 10\% \\ \left( {\sum\limits_{i = 1}^m {{n_i} - 1} } \right)SD_i^2 \ge 9\sum\limits_{i = 1}^m {{n_i}{{\left( {{{\bar x}_i} - \overline {{x_T}} } \right)}^2}} \end{array} $ |
即當∑i=1m(ni-1)SDi2為∑i=1mni(
5 討論
在進行Meta分析時,常需合并連續型變量不同亞組均值、標準差,但據筆者所知,尚未有文獻系統報道過這一問題。這看似很小的問題,如前所述,如果方法選擇錯誤,可能導致較大的計算誤差,甚至影響到Meta分析結果的準確性。因循證醫學、統計書籍較少涉及該內容[9-11],而二次研究文獻一般也未報道這一中間過程,導致研究者常求助網絡,而式(1)是最易找到的錯誤公式[6-7]。由于式(1)常計算誤差較小,筆者通過產生100組、每組兩亞組、每亞組10個數據隨機數據的方法進行檢驗(具體文中未給出),發現有91組計算相對誤差小于5%。從而導致研究者認為公式(1)可用于所有標準差合并運算。但通過本文舉例,大家可看到,在實際研究中,采用式(1)合并標準差可能產生較大誤差,甚至可能導致錯誤的Meta分析結論。同時考慮到式(1)來源于測量學中對同一對象多組測量結果的合并[8],因此,式(1)應用于Meta分析合并多亞組標準差是一種誤用,并不合適。事實上,在要求相對誤差小于5%的前提下,只有在∑i=1m(ni-1)SDi2為∑i=1mni(
公式(2)整個推導過程均為等價變形,不要求滿足其他附加條件,可直接用來計算各亞組合并標準差的結果,如不考慮舍入誤差,計算所得等于總體標準差,且計算過程并不復雜。雖然有少數書籍報道了公式(2)在兩亞組情形下的形式(2’),并指出更多亞組可先將兩亞組合并為一組再與其他亞組合并,但在亞組較多時,計算過程會比直接使用公式(2)計算繁瑣得多,而且因未給出推導過程,不利于讀者深入掌握這一公式。雖然很多讀者對公式(2)比較陌生,但其推導過程核心思想與大家非常熟悉的數理統計學中方差分析的核心思想是相通的,即總變異的分解,將總體變異分解到組內變異與組間變異中,感興趣的讀者可參閱統計學專業書籍方差分析相關章節公式推導過程[10],與本文公式(2)推導過程進行比較,相信會對公式(2)的推導有更加深入的理解。
綜上所述,我們推薦使用公式(2)進行合并多亞組標準差運算,除舍入誤差,其計算結果就等于總體標準差。同時,因式(1)應用于循證醫學合并標準差運算是一種誤用,存在計算不準確甚至影響Meta分析結果的風險,不應這樣使用。