本文簡要介紹在 Meta 分析中如何使用樣本中位數、最小值和最大值等綜合統計量(summary statistics)來估算連續性數據的樣本均數與標準差的方法,并選取了一組真實的案例數據估算樣本均數與標準差,以作示例。
引用本文: 羅德惠, 萬翔, 劉際明, 童鐵軍. 如何實現從樣本量、中位數、極值或四分位數到均數與標準差的轉換. 中國循證醫學雜志, 2017, 17(11): 1350-1356. doi: 10.7507/1672-2531.201706060 復制
循證醫學(evidence-based medicine,EBM)將臨床證據、個人經驗與患者的實際狀況相結合科學地作出了合理的醫療決策。其中,臨床證據是循證醫學的核心,其主要來源于大樣本的臨床隨機對照試驗(randomized controlled trial,RCT)及系統評價(systematic review)或 Meta 分析。其中,系統評價或 Meta 分析的結果則是公認的最高級別的證據[1]。在 Meta 分析中,針對連續性數據較為廣泛的使用方法是通過加權均數差(weighted mean difference,WMD)將多個相似臨床試驗里報告的樣本均值和標準差綜合起來計算統計量。然而,不少研究只報道了樣本中位數、最大值和最小值,或者第一和第三四分位數。針對這類情況,研究人員首先需要根據這些綜合統計量來估算樣本均數與標準差,然后再采用轉換過的樣本均數和標準差進行 Meta 分析。本文介紹近年來關于從綜合統計量來估算樣本均值與方差的幾種常用方法,以便讀者參考和運用。
對于如何準確地估計樣本均數和標準差,較為出名的方法是 Hozo 等[2]在 2005 年提出的使用中位數和極值進行估算的方法。截止 2017 年 9 月 5 號,該文章在 Google Scholar 上已有 1 931 次引用,其中 2014~2017 年就高達 1 430 次。由此可見連續性數據的處理方法在循證醫學領域受到了高度關注。2014 年底,Wan 等[3]指出 Hozo 等[2]針對樣本標準差的估算方法存在較大偏差,故對標準差的估算方法進行了改進。他們的估算方法同樣也得到了較高的關注,發表至今在 Google Scholar 上已有 200 次引用。而對于樣本均數的估算,Luo 等[4]又提出了最優均數的估算方法。根據 Wan 等[3]和 Luo 等[4]文章,他們從理論和實際應用層面都已證明 Hozo 等[2]的估算方法存在較大誤差,并不能準確地計算出樣本均數和標準差。雖然,目前在循證醫學領域中對于樣本均數和標準差的估算方法的推廣也得到了很多研究學者的重視,如劉海寧等[5]和侯曉雯等[6]均發表了較為詳細的估算方法的回顧。但因其文章發表較早,他們主要推廣的仍然是 Hozo 等[2]的方法,未了解和詳細介紹最新發表的估算方法。基于此,本文系統介紹目前最新、最準確的樣本均數與標準差估算方法,為讀者處理連續性數據提供更新的概念,促進其在實際應用中根據不同情況靈活使用均數和標準差估計方法。
1 數學符號定義
本文主要介紹了兩種常用情況下樣本均值與標準差的現有估算方法及其優缺點,并對案例[7]數據采用 Luo 等[4]及 Wan 等[3]的方法分別進行樣本均值和標準差的估算。通過數據分析的結果,幫助讀者使用最新的估計量進行 Meta 分析。
在 Meta 分析中,常用的綜合統計量有 5 個,即統計中常提及的五數概括法(5-number summary)。為保持敘述的一致性,針對樣本量為 n 的數據,我們用下面的字母來分別表示數據的 5 個綜合統計量:
![]() |
在研究報告中,以上綜合統計量不一定會全部提供。根據實際情況,我們考慮以下兩種最常見情況:
![]() |
另外,我們用(b–a)代表樣本全距(range),(a+b)/2 代表全距中點(mid-range),(q3–q1)代表四分位距(interquartile range,IQR)和用(q1+q3)/2 代表中樞紐(midhinge 或 mid-quartile range)[8]。一般來說,樣本全距和四分位距常用來估計數據的總體標準差,而全距中點和中樞紐則用來估計總體均值。
值得一提的是,在 Meta 分析中,還有一種不常見的情況,即同時報告了以上 5 個綜合統計量,為此 Bland 等[9]在 2014 年對 Hozo 等[2]的方法進行了拓展,得到了相應的樣本均值和標準差的估計量。Wan 等[3]與 Luo 等[4]也在文章中對 Bland 等[9]的估計方法進行了改良與完善。由于篇幅的原因,本文將不再對此種情況的換算做過多介紹,讀者如有興趣,可自行查閱相關文章。
2 針對 S1 的樣本均值與標準差估計方法
2.1 Hozo 等[2 ]針對 S1 的樣本均值與標準差估計方法
在
中,對于樣本量為 n 的均值的估算,Hozo 等[2]提出了以下公式:
![]() |
對于標準差,Hozo 等[2]也提出了與上述公式相似的分段算法:
![]() |
在上述公式中,
和 SD 分別代表樣本均值和標準差。以上兩個公式是目前最為廣泛應用在 Meta 分析中的估算方法。然而,Hozo 等[2]并沒有直接將樣本量(n)的信息放入到估計量的計算中,反而是根據樣本量大小來將公式分段,這可能使得估計量不夠準確,尤其是當樣本量靠近分段點時,估計誤差較大。
2.2 Wan 等[3 ]的樣本標準差估計方法
Wan 等[3]優化了樣本標準差的估算方法。他們假設樣本數據服從正態分布,從而運用次序統計量的性質進行樣本標準差的估算。
假設
的樣本量為 n,并且服從正態分布
。
則表示這個樣本的次序統計量。為計算簡便,他們設樣本量為 n=4Q+1,Q≥1 是一個正整數。根據以上假設,五數概括法的綜合統計量可以表示為
、
、
、
、
。另外,Wan 等[3]在文中將變量表示為
,而次序統計量則表示為
、
。其中,變量
服從標準正態分布 N(0,1),而
則是其相應的次序統計量。根據以上的設定以及次序統計量的期望值定義[10],S1 中的樣本標準差估計方法為:
![]() |
其中,
是 Blom 等[11]所提出的服從標準正態分布的次序統計量
的期望值的近似方法[11]。α=0.375 則是 Blom 等[11]建議的適用于實際運用的參數值。根據這一近似方法,Wan 等[3]將樣本標準差的估計進一步延伸到了 S2。
2.3 Luo 等[4 ]的最優樣本均值估計方法
Luo 等[2]將隨著樣本量而平緩改變的權重加入到計算中,使得樣本均值的估計更加準確。他們沿用了 Wan 等[3]的變量設定,提出了以下關于樣本均值估計的最優方法。
對于 S1,Luo 等[4]給全距中點(a+b)/2 和中位數 m 分別賦予了總和為 1 的權重。通過一系列簡化后,樣本均值的估計量為:
![]() |
相比 Hozo 等[2]的估計量,Luo 等[4]的樣本均值估計量由于引入了隨著樣本量的變化而平穩變化的權重,使得估計量對于實際問題有更強的適應性,因此可更為準確地估算樣本均值。
2.4 數據實例演示
為幫助讀者更為直觀地理解和運用以上估算方法,我們將用一個數據實例進行演示。針對 S1 我們節選 Nnoaham 等[12]于 2008 年發表關于檢測感染肺結核的風險與人體中血清維生素 D 水平較低的相互影響的 Meta 分析中的部分數據,進行樣本均數與標準差估算的演示,并比較不同估算方法所得的結果。所選數據如下表 1 所示。

表 1 的數據均符合 S1,我們運用 Hozo 等[2]、Wan 等[3]和 Luo 等[4]的估算方法分別進行樣本均數與標準差的估算。同時,我們還將展示如何使用 Wan 等[3]和 Luo 等[4]文中提供的已編譯好公式的在線計算器(http://www.comp.hkbu.edu.hk/~xwan/ median2mean.html)進行估算,并對不同方法所得的結果進行比較。
由于在線公式計算器每次只能輸入單組的數據,因此考慮到文章篇幅的原因,下圖 1 僅展示案例 1,Davis 等[13]中的 Cases 數據計算結果對比。如圖 1 所示,讀者只需要在黃色空格內填上對應的信息,然后點“Calculate”按鈕就可以得到在當前情況下,運用不同的估計量計算出的樣本均數與標準差對應的估計值,方便讀者進行對比。從圖 1 中我們能清楚地看到,使用 Hozo 等[2]和 Luo 等[4]的均數估計方法得出的結果有 4.4 nmol/L 的差異;使用 Hozo 等[2]、Wan 等[3]的標準差估計方法所得的結果也有近 2 nmol/L 的差異。而由于 Wan 等[3]和 Luo 等[4]均在其文中從理論與模擬實驗中均證明了他們的方法比 Hozo 等[2]的更為精確可信,因此讀者在使用在線計算器時,應以 Luo 等[4]的樣本均數估計值及 Wan 等[3]的標準差估計值為準。

3 針對 S2 的樣本均值與標準差估計方法
3.1 Wan 等[3 ]的樣本標準差估計方法
對于
,樣本標準差的估計量為:
![]() |
針對 S2,Wan 等[3]提出了相應的樣本標準差估計量方法,該方法不僅運用了次序統計量的重要性質,同時包含了樣本量的信息,比之前方法更為準確與實用。
3.2 Luo 等[4 ]的最優樣本均值估計方法
Luo 等[4]假設中樞紐(q1+q3)/2 和中位數 m 分別隨著樣本量變化而穩定改變,并設定總和為 1 的權重,簡化后最終得到以下公式:
![]() |
3.3 數據實例演示
針對 S2,我們節選了 Kotani 等[16]于 2017 年發表的關于腹主動脈瘤患者體內脂蛋白水平含量的 Meta 分析中的部分數據進行樣本均數與標準差估算的演示,并比較不同估計方法所得的結果。所選數據如表 2 所示。

表 2 的數據均符合 S2,我們將運用 Luo 等[4]和 Wan 等[3]的估計方法分別進行樣本均數與標準差的估算。同樣地,我們將展示如何使用原文中提供的在線公式計算器進行估算。

與上一章節相同,由于在線公式計算器每次只能輸入單組數據,且考慮到文章篇幅的原因,下圖 2 僅展示案例 1,Sofi 等[17]中的 Cases 數據計算結果對比。與上一情況相似,讀者只需要在圖 2 所示的黃色空格內填上需要轉換的信息,然后點“Calculate”按鈕就可以馬上樣本均數與標準差的估計值。由于 S2 目前只有 Luo 等[4]與 Wan 等[3]分別提出了樣本均數和標準差的相應估計量,因此在線公式計算器并未提供其他估計量用作對比。
值得一提的是,Wan 等[3]和 Luo 等[4]不只推出了更新、更準確的估算方法,他們分別在文中提供了帶有計算公式的 Excel 表格和相應的在線公式計算器,方便讀者隨時使用。同時,Excel 表格與在線計算器都包含了每一情況下的舊估算方法和新估算方法得出的結果,讀者在使用同時還可以自行比對。
4 數據分析案例
針對樣本均值與標準差估算方法,為讓讀者能更清楚地針對實際情況采用相應的估計量,我們選用一組真實數據,運用 Luo 等[4]和 Wan 等[3]的估計量分別進行樣本均值與標準差的轉換估算,并進行簡單的 Meta 分析。數據介紹與估算結果均記錄在表 3 中,Meta 分析的森林圖則見圖 3。
4.1 數據介紹
所用數據節選至 Rocha 等[7]于 2016 年發表的關于植物甾醇對炎癥標記物影響的 Meta 分析。原文中作者提取了來自 20 個 RCT 的數據,每一個研究均報告了基線值和隨訪的最終值。我們只節選了其中的 10 個 RCT 的隨訪最終值的數據進行計算。所選數據如下表 3 所示。其中共有 5 組數據需要進行樣本均值與標準查的轉換:數據 1[20]、5[24]報告的是樣本中位數、最大值與最小值,符合 S1 的情況;數據 2[21]、3[22]、4[23]提供的是中位數、第一與第三四分位數,符合 S2 的情況。表 3 中的樣本均值與標準差分別由 Luo 等[4]提出的公式(4)、(6)和 Wan 等[3]提出的公式(3)、(5)計算所得。

4.2 Meta 分析結果
根據表 3 所提供的數據,我們繪制了森林圖(圖 3)。總體看來,所選的 10 個研究間異質性較高(I2=56%,P=0.01)。總體均數差為負值,且處于較低效應的范圍[MD=–0.12,95%CI(–0.34,0.10)][30]。也就是說,在隨訪終期,血漿 CRP 水平值會稍有降低。對于每一組案例,Athyros 等[25]的均數差最小且處于較高負面效應的范圍;而 Gagliardi 等[20]的均數差最大,處于中等正面效應的范圍。由于大部分所選案例都得出負值的效應,總體效應相對較小且為負面效應也是合理的。但納入研究仍然有效應量為正數的情況,因此所得結論的可信度還需要進一步的研究分析,此處僅做計算示范,將不再詳細討論。

5 結論
Meta 分析是循證醫學分析中的常用方法。在運用 Meta 分析去判斷某種藥物或治療方法是否有效時,需綜合多個相似研究中所報告的樣本均值與標準差來計算該種藥物或者治療方法的效應量。然而,在許多醫學研究中只提供樣本中位數、最小值與最大值、第一和第三四分位點這5個綜合統計量或者其中一部分。因此,要進一步計算 Meta 分析的效應量,研究者需要先將綜合統計量轉化為樣本均值與標準差。目前,針對這一問題所提出的樣本均值與標準差的估計方法只有少數幾種,其中最為廣泛使用的是 Hozo 等[2]在 2005 年所提出的使用樣本中位數、最大值和最小值的樣本均值與標準差的估計量,至 2014 年,Bland[9]才在 Hozo 等[2]的基礎上提出了新估計方法,但也僅將 Hozo 等[2]的方法延用到5個綜合統計量都提供情況。然而,Hozo 等[2]和 Bland[9]的估計方法有很大的缺陷,那就是并沒有使用到樣本量信息。在兩者基礎上,Wan 等[3]在 2014 年針對 3 種醫學報告常見的情況,運用次序統計量,大大改良了樣本標準差的估計量。之后,Luo 等[4]沿用 Wan 等[3]的變量設定,優化并完善了三種常見情況的樣本均值估計量。
在本文中,我們主要針對循證醫學中最為常見的兩種情況,只提供樣本中位數、最小值和最大值;或只提供樣本中位數、第一和第三四分位數,節選了 Nnoaham 等[12]關于檢測感染肺結核的風險與人體中血清維生素 D 水平較低的相互影響的 Meta 分析中的部分數據,及 Kotani 等[16]關于腹主動脈瘤患者體內脂蛋白水平含量的 Meta 分析中的部分數據,使用 Luo 等[4]和 Wan[3]等提供的在線公式計算器對其進行樣本均數和標準差的估算演示,以讓讀者更清晰地理解如何運用本文中介紹的方法。而對于 5 個綜合統計量都提供的情況,本文沒有進行介紹,有興趣的讀者可自行閱讀相關的文章。另外,本文還使用了 Rocha 等[7]文中關于植物甾醇對炎癥標記物影響的 Meta 分析中所使用的部分數據作示例,運用 Luo 等[4]和 Wan[3]估計方法分別進行樣本均值和標準差的轉化,并對其結果進行簡單分析。
綜上,本文對 2005 年至今關于樣本均值與標準差的估計方法的最新進展進行了系統地回顧,運用實際數據進行示范,旨在讓研究學者們可根據實際情況估算出均數和標準差,完成 Meta 分析。
循證醫學(evidence-based medicine,EBM)將臨床證據、個人經驗與患者的實際狀況相結合科學地作出了合理的醫療決策。其中,臨床證據是循證醫學的核心,其主要來源于大樣本的臨床隨機對照試驗(randomized controlled trial,RCT)及系統評價(systematic review)或 Meta 分析。其中,系統評價或 Meta 分析的結果則是公認的最高級別的證據[1]。在 Meta 分析中,針對連續性數據較為廣泛的使用方法是通過加權均數差(weighted mean difference,WMD)將多個相似臨床試驗里報告的樣本均值和標準差綜合起來計算統計量。然而,不少研究只報道了樣本中位數、最大值和最小值,或者第一和第三四分位數。針對這類情況,研究人員首先需要根據這些綜合統計量來估算樣本均數與標準差,然后再采用轉換過的樣本均數和標準差進行 Meta 分析。本文介紹近年來關于從綜合統計量來估算樣本均值與方差的幾種常用方法,以便讀者參考和運用。
對于如何準確地估計樣本均數和標準差,較為出名的方法是 Hozo 等[2]在 2005 年提出的使用中位數和極值進行估算的方法。截止 2017 年 9 月 5 號,該文章在 Google Scholar 上已有 1 931 次引用,其中 2014~2017 年就高達 1 430 次。由此可見連續性數據的處理方法在循證醫學領域受到了高度關注。2014 年底,Wan 等[3]指出 Hozo 等[2]針對樣本標準差的估算方法存在較大偏差,故對標準差的估算方法進行了改進。他們的估算方法同樣也得到了較高的關注,發表至今在 Google Scholar 上已有 200 次引用。而對于樣本均數的估算,Luo 等[4]又提出了最優均數的估算方法。根據 Wan 等[3]和 Luo 等[4]文章,他們從理論和實際應用層面都已證明 Hozo 等[2]的估算方法存在較大誤差,并不能準確地計算出樣本均數和標準差。雖然,目前在循證醫學領域中對于樣本均數和標準差的估算方法的推廣也得到了很多研究學者的重視,如劉海寧等[5]和侯曉雯等[6]均發表了較為詳細的估算方法的回顧。但因其文章發表較早,他們主要推廣的仍然是 Hozo 等[2]的方法,未了解和詳細介紹最新發表的估算方法。基于此,本文系統介紹目前最新、最準確的樣本均數與標準差估算方法,為讀者處理連續性數據提供更新的概念,促進其在實際應用中根據不同情況靈活使用均數和標準差估計方法。
1 數學符號定義
本文主要介紹了兩種常用情況下樣本均值與標準差的現有估算方法及其優缺點,并對案例[7]數據采用 Luo 等[4]及 Wan 等[3]的方法分別進行樣本均值和標準差的估算。通過數據分析的結果,幫助讀者使用最新的估計量進行 Meta 分析。
在 Meta 分析中,常用的綜合統計量有 5 個,即統計中常提及的五數概括法(5-number summary)。為保持敘述的一致性,針對樣本量為 n 的數據,我們用下面的字母來分別表示數據的 5 個綜合統計量:
![]() |
在研究報告中,以上綜合統計量不一定會全部提供。根據實際情況,我們考慮以下兩種最常見情況:
![]() |
另外,我們用(b–a)代表樣本全距(range),(a+b)/2 代表全距中點(mid-range),(q3–q1)代表四分位距(interquartile range,IQR)和用(q1+q3)/2 代表中樞紐(midhinge 或 mid-quartile range)[8]。一般來說,樣本全距和四分位距常用來估計數據的總體標準差,而全距中點和中樞紐則用來估計總體均值。
值得一提的是,在 Meta 分析中,還有一種不常見的情況,即同時報告了以上 5 個綜合統計量,為此 Bland 等[9]在 2014 年對 Hozo 等[2]的方法進行了拓展,得到了相應的樣本均值和標準差的估計量。Wan 等[3]與 Luo 等[4]也在文章中對 Bland 等[9]的估計方法進行了改良與完善。由于篇幅的原因,本文將不再對此種情況的換算做過多介紹,讀者如有興趣,可自行查閱相關文章。
2 針對 S1 的樣本均值與標準差估計方法
2.1 Hozo 等[2 ]針對 S1 的樣本均值與標準差估計方法
在
中,對于樣本量為 n 的均值的估算,Hozo 等[2]提出了以下公式:
![]() |
對于標準差,Hozo 等[2]也提出了與上述公式相似的分段算法:
![]() |
在上述公式中,
和 SD 分別代表樣本均值和標準差。以上兩個公式是目前最為廣泛應用在 Meta 分析中的估算方法。然而,Hozo 等[2]并沒有直接將樣本量(n)的信息放入到估計量的計算中,反而是根據樣本量大小來將公式分段,這可能使得估計量不夠準確,尤其是當樣本量靠近分段點時,估計誤差較大。
2.2 Wan 等[3 ]的樣本標準差估計方法
Wan 等[3]優化了樣本標準差的估算方法。他們假設樣本數據服從正態分布,從而運用次序統計量的性質進行樣本標準差的估算。
假設
的樣本量為 n,并且服從正態分布
。
則表示這個樣本的次序統計量。為計算簡便,他們設樣本量為 n=4Q+1,Q≥1 是一個正整數。根據以上假設,五數概括法的綜合統計量可以表示為
、
、
、
、
。另外,Wan 等[3]在文中將變量表示為
,而次序統計量則表示為
、
。其中,變量
服從標準正態分布 N(0,1),而
則是其相應的次序統計量。根據以上的設定以及次序統計量的期望值定義[10],S1 中的樣本標準差估計方法為:
![]() |
其中,
是 Blom 等[11]所提出的服從標準正態分布的次序統計量
的期望值的近似方法[11]。α=0.375 則是 Blom 等[11]建議的適用于實際運用的參數值。根據這一近似方法,Wan 等[3]將樣本標準差的估計進一步延伸到了 S2。
2.3 Luo 等[4 ]的最優樣本均值估計方法
Luo 等[2]將隨著樣本量而平緩改變的權重加入到計算中,使得樣本均值的估計更加準確。他們沿用了 Wan 等[3]的變量設定,提出了以下關于樣本均值估計的最優方法。
對于 S1,Luo 等[4]給全距中點(a+b)/2 和中位數 m 分別賦予了總和為 1 的權重。通過一系列簡化后,樣本均值的估計量為:
![]() |
相比 Hozo 等[2]的估計量,Luo 等[4]的樣本均值估計量由于引入了隨著樣本量的變化而平穩變化的權重,使得估計量對于實際問題有更強的適應性,因此可更為準確地估算樣本均值。
2.4 數據實例演示
為幫助讀者更為直觀地理解和運用以上估算方法,我們將用一個數據實例進行演示。針對 S1 我們節選 Nnoaham 等[12]于 2008 年發表關于檢測感染肺結核的風險與人體中血清維生素 D 水平較低的相互影響的 Meta 分析中的部分數據,進行樣本均數與標準差估算的演示,并比較不同估算方法所得的結果。所選數據如下表 1 所示。

表 1 的數據均符合 S1,我們運用 Hozo 等[2]、Wan 等[3]和 Luo 等[4]的估算方法分別進行樣本均數與標準差的估算。同時,我們還將展示如何使用 Wan 等[3]和 Luo 等[4]文中提供的已編譯好公式的在線計算器(http://www.comp.hkbu.edu.hk/~xwan/ median2mean.html)進行估算,并對不同方法所得的結果進行比較。
由于在線公式計算器每次只能輸入單組的數據,因此考慮到文章篇幅的原因,下圖 1 僅展示案例 1,Davis 等[13]中的 Cases 數據計算結果對比。如圖 1 所示,讀者只需要在黃色空格內填上對應的信息,然后點“Calculate”按鈕就可以得到在當前情況下,運用不同的估計量計算出的樣本均數與標準差對應的估計值,方便讀者進行對比。從圖 1 中我們能清楚地看到,使用 Hozo 等[2]和 Luo 等[4]的均數估計方法得出的結果有 4.4 nmol/L 的差異;使用 Hozo 等[2]、Wan 等[3]的標準差估計方法所得的結果也有近 2 nmol/L 的差異。而由于 Wan 等[3]和 Luo 等[4]均在其文中從理論與模擬實驗中均證明了他們的方法比 Hozo 等[2]的更為精確可信,因此讀者在使用在線計算器時,應以 Luo 等[4]的樣本均數估計值及 Wan 等[3]的標準差估計值為準。

3 針對 S2 的樣本均值與標準差估計方法
3.1 Wan 等[3 ]的樣本標準差估計方法
對于
,樣本標準差的估計量為:
![]() |
針對 S2,Wan 等[3]提出了相應的樣本標準差估計量方法,該方法不僅運用了次序統計量的重要性質,同時包含了樣本量的信息,比之前方法更為準確與實用。
3.2 Luo 等[4 ]的最優樣本均值估計方法
Luo 等[4]假設中樞紐(q1+q3)/2 和中位數 m 分別隨著樣本量變化而穩定改變,并設定總和為 1 的權重,簡化后最終得到以下公式:
![]() |
3.3 數據實例演示
針對 S2,我們節選了 Kotani 等[16]于 2017 年發表的關于腹主動脈瘤患者體內脂蛋白水平含量的 Meta 分析中的部分數據進行樣本均數與標準差估算的演示,并比較不同估計方法所得的結果。所選數據如表 2 所示。

表 2 的數據均符合 S2,我們將運用 Luo 等[4]和 Wan 等[3]的估計方法分別進行樣本均數與標準差的估算。同樣地,我們將展示如何使用原文中提供的在線公式計算器進行估算。

與上一章節相同,由于在線公式計算器每次只能輸入單組數據,且考慮到文章篇幅的原因,下圖 2 僅展示案例 1,Sofi 等[17]中的 Cases 數據計算結果對比。與上一情況相似,讀者只需要在圖 2 所示的黃色空格內填上需要轉換的信息,然后點“Calculate”按鈕就可以馬上樣本均數與標準差的估計值。由于 S2 目前只有 Luo 等[4]與 Wan 等[3]分別提出了樣本均數和標準差的相應估計量,因此在線公式計算器并未提供其他估計量用作對比。
值得一提的是,Wan 等[3]和 Luo 等[4]不只推出了更新、更準確的估算方法,他們分別在文中提供了帶有計算公式的 Excel 表格和相應的在線公式計算器,方便讀者隨時使用。同時,Excel 表格與在線計算器都包含了每一情況下的舊估算方法和新估算方法得出的結果,讀者在使用同時還可以自行比對。
4 數據分析案例
針對樣本均值與標準差估算方法,為讓讀者能更清楚地針對實際情況采用相應的估計量,我們選用一組真實數據,運用 Luo 等[4]和 Wan 等[3]的估計量分別進行樣本均值與標準差的轉換估算,并進行簡單的 Meta 分析。數據介紹與估算結果均記錄在表 3 中,Meta 分析的森林圖則見圖 3。
4.1 數據介紹
所用數據節選至 Rocha 等[7]于 2016 年發表的關于植物甾醇對炎癥標記物影響的 Meta 分析。原文中作者提取了來自 20 個 RCT 的數據,每一個研究均報告了基線值和隨訪的最終值。我們只節選了其中的 10 個 RCT 的隨訪最終值的數據進行計算。所選數據如下表 3 所示。其中共有 5 組數據需要進行樣本均值與標準查的轉換:數據 1[20]、5[24]報告的是樣本中位數、最大值與最小值,符合 S1 的情況;數據 2[21]、3[22]、4[23]提供的是中位數、第一與第三四分位數,符合 S2 的情況。表 3 中的樣本均值與標準差分別由 Luo 等[4]提出的公式(4)、(6)和 Wan 等[3]提出的公式(3)、(5)計算所得。

4.2 Meta 分析結果
根據表 3 所提供的數據,我們繪制了森林圖(圖 3)。總體看來,所選的 10 個研究間異質性較高(I2=56%,P=0.01)。總體均數差為負值,且處于較低效應的范圍[MD=–0.12,95%CI(–0.34,0.10)][30]。也就是說,在隨訪終期,血漿 CRP 水平值會稍有降低。對于每一組案例,Athyros 等[25]的均數差最小且處于較高負面效應的范圍;而 Gagliardi 等[20]的均數差最大,處于中等正面效應的范圍。由于大部分所選案例都得出負值的效應,總體效應相對較小且為負面效應也是合理的。但納入研究仍然有效應量為正數的情況,因此所得結論的可信度還需要進一步的研究分析,此處僅做計算示范,將不再詳細討論。

5 結論
Meta 分析是循證醫學分析中的常用方法。在運用 Meta 分析去判斷某種藥物或治療方法是否有效時,需綜合多個相似研究中所報告的樣本均值與標準差來計算該種藥物或者治療方法的效應量。然而,在許多醫學研究中只提供樣本中位數、最小值與最大值、第一和第三四分位點這5個綜合統計量或者其中一部分。因此,要進一步計算 Meta 分析的效應量,研究者需要先將綜合統計量轉化為樣本均值與標準差。目前,針對這一問題所提出的樣本均值與標準差的估計方法只有少數幾種,其中最為廣泛使用的是 Hozo 等[2]在 2005 年所提出的使用樣本中位數、最大值和最小值的樣本均值與標準差的估計量,至 2014 年,Bland[9]才在 Hozo 等[2]的基礎上提出了新估計方法,但也僅將 Hozo 等[2]的方法延用到5個綜合統計量都提供情況。然而,Hozo 等[2]和 Bland[9]的估計方法有很大的缺陷,那就是并沒有使用到樣本量信息。在兩者基礎上,Wan 等[3]在 2014 年針對 3 種醫學報告常見的情況,運用次序統計量,大大改良了樣本標準差的估計量。之后,Luo 等[4]沿用 Wan 等[3]的變量設定,優化并完善了三種常見情況的樣本均值估計量。
在本文中,我們主要針對循證醫學中最為常見的兩種情況,只提供樣本中位數、最小值和最大值;或只提供樣本中位數、第一和第三四分位數,節選了 Nnoaham 等[12]關于檢測感染肺結核的風險與人體中血清維生素 D 水平較低的相互影響的 Meta 分析中的部分數據,及 Kotani 等[16]關于腹主動脈瘤患者體內脂蛋白水平含量的 Meta 分析中的部分數據,使用 Luo 等[4]和 Wan[3]等提供的在線公式計算器對其進行樣本均數和標準差的估算演示,以讓讀者更清晰地理解如何運用本文中介紹的方法。而對于 5 個綜合統計量都提供的情況,本文沒有進行介紹,有興趣的讀者可自行閱讀相關的文章。另外,本文還使用了 Rocha 等[7]文中關于植物甾醇對炎癥標記物影響的 Meta 分析中所使用的部分數據作示例,運用 Luo 等[4]和 Wan[3]估計方法分別進行樣本均值和標準差的轉化,并對其結果進行簡單分析。
綜上,本文對 2005 年至今關于樣本均值與標準差的估計方法的最新進展進行了系統地回顧,運用實際數據進行示范,旨在讓研究學者們可根據實際情況估算出均數和標準差,完成 Meta 分析。