劑量-反應關系模型在流行病學領域應用廣泛,在循證醫學領域,其也得到了廣泛應用。劑量-反應Meta分析對于原始研究數據的依賴度較高,但原始研究常因未提供所需有效數據而給分析帶來困難。通過向原始研究作者索取數據的途徑效率與應答率均較低,因此,缺失值估計及轉換顯得尤為重要。本文歸納了幾種常見缺失值,并就如何使用已有信息進行缺失值估計及效應指標轉換進行探討。
引用本文: 徐暢, 劉同族, 鄺心穎, 張永剛, 翁虹, 張超. 劑量-反應Meta分析模型中缺失值的評估及效應指標的轉換. 中國循證醫學雜志, 2015, 15(8): 984-987. doi: 10.7507/1672-2531.20150164 復制
流行病學中,通常需要探討某些潛在危險因素暴露水平與疾病的關系,即劑量-反應關系(dose-response relationship)[1]。劑量-反應關系是指對應結局指標隨著暴露因素/水平的增加或降低而對應產生變化的趨勢 [2]。劑量-反應關系模型在循證醫學也已得到廣泛使用,目前得到認可的方法有兩種,其一為限制性立方樣條法 [3],其二為靈活分段多項式法 [4]。無論何種方法,對于二次研究,都依賴于原始研究提供的數據。許多原始研究因各種各樣的原因并未提供所需的標準格式數據,而通過向原始作者索取數據的途徑效率低,且大部分作者并未給予回復。此種情況下,許多作者選擇剔除該研究,或者改用統計效能極低的分層模型或者二分法模型 [4]。實際上,大部分缺失值是可以進行估算的。本文就如何使用原始研究提供的信息進行缺失值的估計進行討論。
1 基本概念與歸類
1.1 基本數據信息
劑量-反應Meta分析所需提取的數據信息應包含以下幾種:暴露水平(dose);各層暴露水平下對應的效應量及其95%置信區間(confidence interval,CI),通常為比值比(OR)或相對危險度(RR);各層暴露水平下發生例數及總人數或總人年數 [3, 5],如表 1。對于效應量,盡可能提取控制混雜因素最多的那個結果 [6]。關于基礎及延伸知識,請參閱《應用 STATA做Meta分析》一書相關章節及參考文獻 [4]的論述。
其中,SE表示標準誤,Za/2表示檢驗水準,Reference表示參照組。為方便后續計算,假設C、T分別表示整體發生例數及總人數,即:
$C={{N}_{1}}+{{N}_{2}}+{{N}_{3}}+{{N}_{4}}$ |
$T={{M}_{1}}+{{M}_{2}}+{{M}_{3}}+{{M}_{4}}~$ |
當然,此處T也可以表示總人年數,所計算的則是累積發病率之比,但在劑量-反應Meta分析中,我們默認比值比、相對危險度等指標均為同一指標,即相對危險度 [3]。
1.2 常見缺失值匯總
因病例-對照研究及隊列研究缺失值估算方法一致,此處不再對其進行劃分。表 1中除了ID一欄外任意一種數據缺失,都無法將該研究納入劑量-反應Meta分析模型進行合并。我們把缺失情況歸納為以下幾種:① 發生例數和(或)總人數或總人年數的缺失,往往文中只給出不同暴露水平對應的相對危險度(或比值比,風險比);② 暴露水平缺失,如部分原始研究會以低、中、高進行定性描述,并未給出相應定量數值,或者只給出形如表 1中(sleep duration)暴露范圍,并不給出均值或中位數分布;③ 置信區間的缺失,如部分研究只給出校正后的RR,但未提供置信區間。

1.3 常見非常規效應指標匯總
對于病例-對照或巢式病例-對照(又稱病例-隊列)研究,使用的效應量為比值比,而隊列研究使用的為相對危險度或風險比,對應置信區間通常取95%。然而,部分原始研究中,可能使用不常見的效應量。常見的非常規效應量有:① 浮動絕對危險(floating absolute risk,FAR),該指標是計算置信區間的一種方法,相對于傳統RR,不用人為選擇對照組,能直接比較多水平影響因素任意兩水平的相對危險 [7, 8],但采用該法通常參考組的FAR并非為1,而導致無法納入劑量-反應Meta分析模型進行合并;② 置信區間并非為95%,即未取a=0.05的檢驗水準,而是提供90%或99%或其他范圍置信區間,若直接合并將引入較大偏倚;③ 同時納入病例-對照和隊列研究時,效應指標不一致,如部分研究使用RR,部分研究使用OR或HR。
2 缺失值估算及效應量轉換方法
2.1 缺失值的估算
對于原始研究的缺失數據,目前較為常用的估算方法如下:
① 各層發生例數缺失:在總人數/總人年數已知的情況下,可通過整體發生例數(C)、各層總人數/人年數、RR進行推算 [8],以上述表格為例,基本公式如下:
${{N}_{2}}=R{{R}_{2}}\times {{M}_{1}}/{{N}_{1}}{{M}_{2}}$ |
${{N}_{3}}=R{{R}_{3}}\times {{M}_{1}}/{{N}_{1}}{{M}_{3}}$ |
${{N}_{4}}=R{{R}_{4}}\times {{M}_{1}}/{{N}_{1}}{{M}_{4}}$ |
$C={{N}_{1}}+{{N}_{2}}+{{N}_{3}}+{{N}_{4}}$ |
② 各層總人數/人年數缺失:可假設各個分層的總人數/人年數相等,將整體總人數除以分層即可得每層總人數/人年數 [8],公式表示即:
${{M}_{1}}={{M}_{2}}={{M}_{3}}={{M}_{4}}=T/4$ |
③ 兩者均缺失:可先通過估算每層總人數/人年數,再通過RR進行推算 [8],結合公式(1),(3)~(6)即可;
④ 暴露水平缺失:若只給出定性描述,目前尚無有效方法進行估算;若給出暴露范圍,但未給出暴露平均水平或中位數,對于閉合區間,可取該區間上限、下限的中點作為暴露水平;對于開放區間(僅有上限端點A1,或者下限端點A2),如表 1中第一組和最后一組,可將上限端點A1除以1.5,而下限端點A2乘以1.5,也可以相鄰組的區間長度為該組的區間長度,然后取中點當作平均暴露水平 [9, 10],以上限端點為例,第一組置信區間下限估算值如下:
$[{{A}_{1}}-({{A}_{2}}-{{A}_{1}})]$ |
⑤ 置信區間缺失:可通過各層發生例數和總人數/人年數計算粗略的標準誤,之后將該標準誤除以1.5,再根據標準誤計算置信區間,即為近似的、校正后的置信區間 [11],以SE2為例公式如下:
$S{{E}_{2Crude}}=\sqrt{1/{{M}_{1}}+1/{{M}_{2}}+1/{{N}_{1}}+1/{{N}_{2}}}$ |
$S{{E}_{2adjusted}}=S{{E}_{2Crude}}/1.5$ |
⑥ 若合并數據信息都缺失,如僅有RR及置信區間,則建議不將該研究納入劑量-反應模型合并,此時可選擇分層模型或二分法模型。
2.2 效應指標的轉換
對于浮動絕對危險,Orsini [11]提供了一種轉換方法,能夠準確地將FAR及其浮動置信區間轉換成為常用的RR及相應置信區間。假設FAR法下的參考劑量對應的FAR為FRR1,則第二、三、四組的FAR分別為FRR2、FRR3、FRR4,對應的效應量為SEF。以FRR2向RR2的換算,該方法公式如下:
$R{{R}_{2}}=FR{{R}_{2}}/FR{{R}_{1}}$ |
$S{{E}_{2}}=\sqrt{{{\left( S{{E}_{2}}^{F} \right)}^{2}}+{{\left( S{{E}_{1}}^{F} \right)}^{2}}}$ |
Orsini N還提供了該計算公式用于Stata軟件的程序,感興趣的研究者可以參考其原文獻進行研究。
對于置信區間問題,若原始研究提供的為90%或99%或其他置信區間,可先通過置信區間上下限計算出標準誤,然后選取以α=0.05的檢驗水準,以計算得出的標準誤計算95%置信區間,計算標準誤的公式如下:
$SE=(UCL-LCI/(2\times {{Z}_{a/2}})\text{ })~$ |
本處UCI和LCI分別表示原置信區間的上限及下限,Za/2則應選取原始研究所提供的原置信區間對應的檢驗水準。
當出現效應指標不一致的情況時,通常做法是將OR、RR、HR直接視為RR [3],也可通過如下公式 [12]將OR轉換成為RR:
$RR=OR/[(1-P/i{{>}_{0}})\text{ }+(P/i{{>}_{0}}\times OR)]$ |
公式中的P0表示非暴露組的結局指標發生率。值得注意的是,原始研究為病例-對照或病例-隊列研究才有OR這個指標,因此,存在暴露組與非暴露組之分。而對應效應量,則可用如下公式進行換算:
$SE\text{ }logRR=SE\text{ }logOR\times \left( logRR/logOR \right)$ |
3 討論
劑量-反應Meta分析的方法經過近20年發展,已較為完善,在探討暴露水平與特定疾病關系中應用日益廣泛。本文介紹了進行劑量-反應Meta分析時常見的缺失值類型及其估算方法,以及常見不同效應指標的轉換方法,旨在為劑量-反應Meta分析的制作提供方法學參考。本文涉及的公式不僅適用于觀察性研究,部分也適用于隨機對照試驗。
缺失值及效應指標不一致是劑量-反應Meta分析乃至整個Meta分析體系中非常重要并棘手的問題,并且目前的相關研究并不完善。上述估算及轉換方法雖然在許多主流高質量雜志中廣泛應用,但仍缺乏有力證據證實其準確性,計算的結果可能會存在一定偏差 [13]。再者,基于IPD數據的Meta分析模型已經被提出,越來越多的數據開放權限,基于IPD數據的Meta分析能夠提供更高證據等級的結果,在一定程度上會限制上述方法的使用及推廣。上述方法需要結合多篇相關Meta分析進行演示,且多數Meta分析并未提供原始數據,故我們未進行實例演示,操作者可結合相關實例自行演算。
獲取原始數據依舊是處理缺失數據的金標準,然而在原始研究未提供充足的數據,并無法通過其他渠道獲得時,上述缺失值估計仍然非常實用。在使用過程中,針對上述存在的缺陷,建議進行一些穩定性檢驗 [14],以觀察這些估算及變換是否會對整體結果產生明顯影響。
總之,無論是基于原始數據,還是基于估算數據,仍有許多問題尚待解決,在實際操作中應靈活運用各種手段,以獲取更準確的信息,生產更可靠的證據,來指導臨床實踐。
流行病學中,通常需要探討某些潛在危險因素暴露水平與疾病的關系,即劑量-反應關系(dose-response relationship)[1]。劑量-反應關系是指對應結局指標隨著暴露因素/水平的增加或降低而對應產生變化的趨勢 [2]。劑量-反應關系模型在循證醫學也已得到廣泛使用,目前得到認可的方法有兩種,其一為限制性立方樣條法 [3],其二為靈活分段多項式法 [4]。無論何種方法,對于二次研究,都依賴于原始研究提供的數據。許多原始研究因各種各樣的原因并未提供所需的標準格式數據,而通過向原始作者索取數據的途徑效率低,且大部分作者并未給予回復。此種情況下,許多作者選擇剔除該研究,或者改用統計效能極低的分層模型或者二分法模型 [4]。實際上,大部分缺失值是可以進行估算的。本文就如何使用原始研究提供的信息進行缺失值的估計進行討論。
1 基本概念與歸類
1.1 基本數據信息
劑量-反應Meta分析所需提取的數據信息應包含以下幾種:暴露水平(dose);各層暴露水平下對應的效應量及其95%置信區間(confidence interval,CI),通常為比值比(OR)或相對危險度(RR);各層暴露水平下發生例數及總人數或總人年數 [3, 5],如表 1。對于效應量,盡可能提取控制混雜因素最多的那個結果 [6]。關于基礎及延伸知識,請參閱《應用 STATA做Meta分析》一書相關章節及參考文獻 [4]的論述。
其中,SE表示標準誤,Za/2表示檢驗水準,Reference表示參照組。為方便后續計算,假設C、T分別表示整體發生例數及總人數,即:
$C={{N}_{1}}+{{N}_{2}}+{{N}_{3}}+{{N}_{4}}$ |
$T={{M}_{1}}+{{M}_{2}}+{{M}_{3}}+{{M}_{4}}~$ |
當然,此處T也可以表示總人年數,所計算的則是累積發病率之比,但在劑量-反應Meta分析中,我們默認比值比、相對危險度等指標均為同一指標,即相對危險度 [3]。
1.2 常見缺失值匯總
因病例-對照研究及隊列研究缺失值估算方法一致,此處不再對其進行劃分。表 1中除了ID一欄外任意一種數據缺失,都無法將該研究納入劑量-反應Meta分析模型進行合并。我們把缺失情況歸納為以下幾種:① 發生例數和(或)總人數或總人年數的缺失,往往文中只給出不同暴露水平對應的相對危險度(或比值比,風險比);② 暴露水平缺失,如部分原始研究會以低、中、高進行定性描述,并未給出相應定量數值,或者只給出形如表 1中(sleep duration)暴露范圍,并不給出均值或中位數分布;③ 置信區間的缺失,如部分研究只給出校正后的RR,但未提供置信區間。

1.3 常見非常規效應指標匯總
對于病例-對照或巢式病例-對照(又稱病例-隊列)研究,使用的效應量為比值比,而隊列研究使用的為相對危險度或風險比,對應置信區間通常取95%。然而,部分原始研究中,可能使用不常見的效應量。常見的非常規效應量有:① 浮動絕對危險(floating absolute risk,FAR),該指標是計算置信區間的一種方法,相對于傳統RR,不用人為選擇對照組,能直接比較多水平影響因素任意兩水平的相對危險 [7, 8],但采用該法通常參考組的FAR并非為1,而導致無法納入劑量-反應Meta分析模型進行合并;② 置信區間并非為95%,即未取a=0.05的檢驗水準,而是提供90%或99%或其他范圍置信區間,若直接合并將引入較大偏倚;③ 同時納入病例-對照和隊列研究時,效應指標不一致,如部分研究使用RR,部分研究使用OR或HR。
2 缺失值估算及效應量轉換方法
2.1 缺失值的估算
對于原始研究的缺失數據,目前較為常用的估算方法如下:
① 各層發生例數缺失:在總人數/總人年數已知的情況下,可通過整體發生例數(C)、各層總人數/人年數、RR進行推算 [8],以上述表格為例,基本公式如下:
${{N}_{2}}=R{{R}_{2}}\times {{M}_{1}}/{{N}_{1}}{{M}_{2}}$ |
${{N}_{3}}=R{{R}_{3}}\times {{M}_{1}}/{{N}_{1}}{{M}_{3}}$ |
${{N}_{4}}=R{{R}_{4}}\times {{M}_{1}}/{{N}_{1}}{{M}_{4}}$ |
$C={{N}_{1}}+{{N}_{2}}+{{N}_{3}}+{{N}_{4}}$ |
② 各層總人數/人年數缺失:可假設各個分層的總人數/人年數相等,將整體總人數除以分層即可得每層總人數/人年數 [8],公式表示即:
${{M}_{1}}={{M}_{2}}={{M}_{3}}={{M}_{4}}=T/4$ |
③ 兩者均缺失:可先通過估算每層總人數/人年數,再通過RR進行推算 [8],結合公式(1),(3)~(6)即可;
④ 暴露水平缺失:若只給出定性描述,目前尚無有效方法進行估算;若給出暴露范圍,但未給出暴露平均水平或中位數,對于閉合區間,可取該區間上限、下限的中點作為暴露水平;對于開放區間(僅有上限端點A1,或者下限端點A2),如表 1中第一組和最后一組,可將上限端點A1除以1.5,而下限端點A2乘以1.5,也可以相鄰組的區間長度為該組的區間長度,然后取中點當作平均暴露水平 [9, 10],以上限端點為例,第一組置信區間下限估算值如下:
$[{{A}_{1}}-({{A}_{2}}-{{A}_{1}})]$ |
⑤ 置信區間缺失:可通過各層發生例數和總人數/人年數計算粗略的標準誤,之后將該標準誤除以1.5,再根據標準誤計算置信區間,即為近似的、校正后的置信區間 [11],以SE2為例公式如下:
$S{{E}_{2Crude}}=\sqrt{1/{{M}_{1}}+1/{{M}_{2}}+1/{{N}_{1}}+1/{{N}_{2}}}$ |
$S{{E}_{2adjusted}}=S{{E}_{2Crude}}/1.5$ |
⑥ 若合并數據信息都缺失,如僅有RR及置信區間,則建議不將該研究納入劑量-反應模型合并,此時可選擇分層模型或二分法模型。
2.2 效應指標的轉換
對于浮動絕對危險,Orsini [11]提供了一種轉換方法,能夠準確地將FAR及其浮動置信區間轉換成為常用的RR及相應置信區間。假設FAR法下的參考劑量對應的FAR為FRR1,則第二、三、四組的FAR分別為FRR2、FRR3、FRR4,對應的效應量為SEF。以FRR2向RR2的換算,該方法公式如下:
$R{{R}_{2}}=FR{{R}_{2}}/FR{{R}_{1}}$ |
$S{{E}_{2}}=\sqrt{{{\left( S{{E}_{2}}^{F} \right)}^{2}}+{{\left( S{{E}_{1}}^{F} \right)}^{2}}}$ |
Orsini N還提供了該計算公式用于Stata軟件的程序,感興趣的研究者可以參考其原文獻進行研究。
對于置信區間問題,若原始研究提供的為90%或99%或其他置信區間,可先通過置信區間上下限計算出標準誤,然后選取以α=0.05的檢驗水準,以計算得出的標準誤計算95%置信區間,計算標準誤的公式如下:
$SE=(UCL-LCI/(2\times {{Z}_{a/2}})\text{ })~$ |
本處UCI和LCI分別表示原置信區間的上限及下限,Za/2則應選取原始研究所提供的原置信區間對應的檢驗水準。
當出現效應指標不一致的情況時,通常做法是將OR、RR、HR直接視為RR [3],也可通過如下公式 [12]將OR轉換成為RR:
$RR=OR/[(1-P/i{{>}_{0}})\text{ }+(P/i{{>}_{0}}\times OR)]$ |
公式中的P0表示非暴露組的結局指標發生率。值得注意的是,原始研究為病例-對照或病例-隊列研究才有OR這個指標,因此,存在暴露組與非暴露組之分。而對應效應量,則可用如下公式進行換算:
$SE\text{ }logRR=SE\text{ }logOR\times \left( logRR/logOR \right)$ |
3 討論
劑量-反應Meta分析的方法經過近20年發展,已較為完善,在探討暴露水平與特定疾病關系中應用日益廣泛。本文介紹了進行劑量-反應Meta分析時常見的缺失值類型及其估算方法,以及常見不同效應指標的轉換方法,旨在為劑量-反應Meta分析的制作提供方法學參考。本文涉及的公式不僅適用于觀察性研究,部分也適用于隨機對照試驗。
缺失值及效應指標不一致是劑量-反應Meta分析乃至整個Meta分析體系中非常重要并棘手的問題,并且目前的相關研究并不完善。上述估算及轉換方法雖然在許多主流高質量雜志中廣泛應用,但仍缺乏有力證據證實其準確性,計算的結果可能會存在一定偏差 [13]。再者,基于IPD數據的Meta分析模型已經被提出,越來越多的數據開放權限,基于IPD數據的Meta分析能夠提供更高證據等級的結果,在一定程度上會限制上述方法的使用及推廣。上述方法需要結合多篇相關Meta分析進行演示,且多數Meta分析并未提供原始數據,故我們未進行實例演示,操作者可結合相關實例自行演算。
獲取原始數據依舊是處理缺失數據的金標準,然而在原始研究未提供充足的數據,并無法通過其他渠道獲得時,上述缺失值估計仍然非常實用。在使用過程中,針對上述存在的缺陷,建議進行一些穩定性檢驗 [14],以觀察這些估算及變換是否會對整體結果產生明顯影響。
總之,無論是基于原始數據,還是基于估算數據,仍有許多問題尚待解決,在實際操作中應靈活運用各種手段,以獲取更準確的信息,生產更可靠的證據,來指導臨床實踐。