作為一種有效的系統評價方法,劑量-反應Meta分析被廣泛用于探討自變量與因變量之間的因果關系,并且多基于觀察性研究。觀察性研究樣本量大,進行Meta分析時可提供較為充分的統計效能。但由于自身設計問題,觀察性研究容易混入多種偏倚,而這些偏倚可能會影響最終結果,導致其偏離真實值。因方法學上的盲區,當前并無特定針對劑量-反應Meta分析的偏倚校正方法,本文借鑒觀察性研究Meta分析中的偏倚校正方法,通過調整后將其應用于劑量-反應Meta分析模型中,并對各類校正方法的優缺點進行歸納比較。
引用本文: 徐暢, 張超, 鄺心穎, 原瑞霞, 翁鴻, 牛玉明. 劑量-反應Meta分析系列之非隨機誤差導致的偏倚的處理方法. 中國循證醫學雜志, 2016, 16(4): 488-491. doi: 10.7507/1672-2531.20160075 復制
由于本身設計問題,觀察性研究容易混入多種偏倚,而這些偏倚會影響最終結果的可信度 [1, 2]。在劑量-反應Meta分析中,存在同樣的問題,傳統的模型擬合方法只考慮隨機誤差,因此多數劑量-反應Meta分析使用的是固定效應模型。隨著方法學的發展,隨機效應模型也被應用于劑量-反應Meta分析中,彌補了上述不足 [3]。但其并未解決最根本的問題——觀察性研究,合并結果時,采用倒方差法進行Meta分析有待商榷,因為這一方法只考慮樣本量大小而忽視了觀察性研究中各種其他偏倚對該研究可信度的影響。目前針對觀察性研究中存在的偏倚問題的思路可總結為三種:其一忽略其影響,其二為定性描述,其三則為定量描述并校正 [4]。因方法學上的盲區,當前并無特定針對劑量-反應Meta分析的偏倚校正方法,本文借鑒觀察性研究Meta分析中偏倚校正方法,通過調整后將其應用于劑量-反應Meta分析模型中,對該問題處理的各種方法進行總結并概括。
1 偏倚的類型
按照Cochrane Handbook 5.0.1版本上的定義,偏倚是指系統誤差,或者通俗解釋為結果或結論偏離真實值 [5]。Thompson等 [6]對觀察性研究的偏倚來源分成兩大類,一類為內部偏倚,另一類為外部偏倚。內部偏倚反映研究質量,它包括選擇性偏倚(包括納入排除標準、納入人群基線水平)、混雜偏倚(包括混雜因素的選擇、測量、校正、校正方法等)、暴露偏倚(暴露測量是否合適、方法/時間是否客觀正確等)、結果偏倚(包括報告偏倚,測量偏倚等)、其他偏倚(統計學分析是否正確)。而外部偏倚則反映目標設置的普遍性,包括人群偏倚(研究中納入人群特征是否符合目標人群)、暴露偏倚(研究中的暴露是否符合目標暴露)、結果偏倚(研究中結局指標是否符合目標結局)、時間刻度偏倚(隨訪時間是否符合目標隨訪年限)。下文我們將對劑量-反應Meta分析中偏倚的常用處理方法進行介紹。
2 偏倚的定性描述
2.1 量表評價
劑量-反應Meta分析大多基于觀察性研究,特別是隊列研究及病例對照研究。觀察性研究有多種量表(清單或條目)對其質量進行評價,以便對潛在偏倚進行半定量描述。據統計,當前有97種工具可用于觀察性研究設計,包括46種量表和51種清單,其中 21.88%適用于隊列研究,13.54%適用于病例對照研究,5.21%適用于橫斷面研究 [7, 8]。目前最為廣泛使用的量表為NOS量表(Newcastle-Ottawa Scale) [9],該量表分為病例-對照研究及隊列研究兩個部分,未針對橫斷面研究。另一種常用量表為CASP清單 [7],適用于病例-對照研究及隊列研究。Combie橫斷面研究評價工具 [7]則適用于橫斷面研究的質量評價,但目前橫斷面研究并未涉及劑量-反應Meta分析的內容。
通過系統評價員對納入研究進行質量評價,讀者可大致了解納入研究的質量狀況及該Meta分析結果的可信程度。
2.2 亞組或敏感性分析
亞組分析或敏感性分析需要建立在量表評價的基礎上,通過量表評分對納入研究進行分組,例如分為高質量、中等質量以及低質量,然后進行亞組分析或對剔除低質量文獻進行敏感性分析,探討不同研究質量的文獻合并后的結果是否相近或具有差異 [4],從而讓系統評價員及讀者更清楚地判斷低質量文獻對整體結果是否有較大影響。
3 偏倚的定量描述和校正
偏倚的定量校正有多種方法,包括使用質量分數加權法,先驗偏倚判斷、似然函數法等,本處引入并探討其中兩種較為常用的方法。
3.1 先驗校正法
據Thompson等 [6]對觀察性研究偏倚校正的處理方法,對劑量-反應Meta分析,偏倚的校正可通過引入一個新的元素,ξ,表示非隨機誤差。模型通過消除非隨機誤差對效應量的影響,達到校正作用。該方法意在從單個研究中先校正可能的外在偏倚,即非隨機誤差偏倚,然后對這些校正后的參數進行合并,從而保證結果更準確。
在擬合自變量與因變量劑量-反應關系時,通常假設一個二次多項式模型 [10]:
$In\left( R{{R}_{i}} \right)\text{ }=~{{\beta }_{1i}}{{x}_{i}}+~{{\beta }_{2i}}{{x}_{i}}^{2}+~{{\varepsilon }_{i}}$ |
其中,In(RRi)是感興趣的結局風險,xi是每層暴露水平,εi是隨機誤差。考慮各種非隨機誤差ξ,公式(1)寫為:
$In\left( R{{R}_{i}} \right)\text{ }=~{{\beta }_{1i}}{{x}_{i}}+~{{\beta }_{2i}}{{x}_{i}}^{2}+{{\varepsilon }_{i}}+{{\xi }_{i}}$ |
ξ包括人群偏倚、干預偏倚等各種偏倚,且大小和方向未知。因為各種非隨機誤差對結果的影響不可忽略,若在模型中對其校正,In(RRi)的期望值不再是β1ixi2 + β2ixi2,而是:
$In(R{{R}_{i}})\text{ }=~{{\beta }_{1i}}{{x}_{i}}^{2}~+~{{\beta }_{2i}}{{x}_{i}}^{2}~+~{{\xi }_{i}}$ |
以矩陣形式表示:
$Y\text{ }=\text{ }X\beta ~+~\varepsilon ~+~\xi ~$ |
使用最小二乘法,思想為使殘差平方和最小化 [11]。殘差平方和計算公式為:
$S(\beta )\text{ }=\text{ }(Y\text{ }-\text{ }X\beta ~-~\xi )'\text{ }(Y\text{ }-\text{ }X\beta ~-~\xi )$ |
函數的極值一般出現在一階導數為0處,因此,對上述公式求偏導數:
$\begin{align} & \frac{\partial S\left( \beta \right)}{\partial \beta }=\frac{\partial }{\partial \beta }\left[ \left( Y-X\beta -~\xi \right)'(Y\text{ }-\text{ }X\beta ~-~\xi ) \right] \\ & =\frac{\partial }{\partial \beta }\left( Y'Y-Y'X\beta -Y'\xi -X'\beta 'Y+X'\beta 'X\beta \right. \\ & \left. X'\beta '\xi -\xi Y+\xi X\beta +\xi \xi \right) \\ & =-X'Y-X\beta Y'+X\beta X+\xi X' \\ & =0 \\ \end{align}$ |
即得到我們需要求得的待估參數:
$\hat{\beta }=\text{ }[(Y'\text{ }-\text{ }X'\text{ }-~\xi ')\text{ }X\left] ^{\left( -1 \right)}\text{ } \right[X'\text{ }(\xi ~-\text{ }Y)]$ |
問題關鍵是求解ξ。其一,ξ的大小和方向未知,并且關于ξ的大小,衡量較為復雜 [5];其二,ξ包括多種潛在偏倚,是將這些偏倚放在一起考慮還是分開考慮,放在一起考慮的問題在于多種偏倚因為方向大小不一,可能會產生抵消反應;分開考慮則需要考慮到各種偏倚的交互作用,這將使模型非常復雜。Thompson等 [6]曾提出一種辦法,先將ξ中各種潛在偏倚分開量化,最后將這些偏倚加權合并。具體做法為通過引入先驗信息來對潛在偏倚量化,即預先請方法學專家分別對某種偏倚進行主觀評估,以百分比來衡量該研究偏倚對結果影響的程度和方向,并給出其66.7%置信區間,最后將這些偏倚加權合并為最終的。
3.2 權重校正法
經典劑量-反應Meta分析方法是通過合并納入研究中每篇研究潛在趨勢的參數,最后獲得一個加權合并的多項式函數模型,通過指定暴露劑量即可計算出相應效應量。在合并過程中,使用的是倒方差法。我們可以從傳統倒方差法中加入先驗偏倚權重,通過權重來校正倒方差法計算的權重,先驗偏倚權重理解為不同研究的偏倚大小影響該研究的權重。
在此種方法下,通過對倒方差法進行改進,加入偏倚風險這一變量,使得權重重新按照樣本量和偏倚大小兩個變量來分配,最終結果更偏向于大樣本量、低偏倚風險的研究,而對模型進行校正。該方法最初由GreenLand等 [12]提出,并應用于觀察性研究Meta分析。
該方法的問題在于將所有偏倚放在一起考慮并量化整體偏倚大小,以及如何將偏倚大小與方差的值進行標準化。因為在自然狀態下,這兩個值是不具可比性的,因此也無法進行量化分配。問題二為比例分配,在存在兩個變量的情況下,如何分配他們各自的權重,即樣本量在權重計算中占多大比例,偏倚風險占多大比例。對于這兩個問題,有一種簡單的處理辦法。具體為將質量評價量表系統與方差權重進行歸一化,也即對原來的倒方差計算出的權重繼續通過質量評分系統加權。這種辦法的有效性取決于納入研究的質量。
4 忽略偏倚
4.1 忽略偏倚
忽略偏倚也是一種常見方法 [4]。實際上,大多數定性描述方法均采用忽略偏倚的方法,盡管可以通過量表或亞組分析等手段進行相關分析,但無法將偏倚對結果的影響進行校正;而一些偏倚本身也很難避免,并且在一些方法學并不完善的Meta分析類別中(如劑量-反應Meta分析),除了常規的偏倚存在,仍有一些統計學方法或數據估算導致的偏倚,這些偏倚暫時無法消除,因而對其進行忽略。
4.2 放棄Meta分析
當納入研究質量等級較低,并且納入研究數目和樣本量不占優勢的情況下,可考慮放棄Meta分析,尤其對于劑量-反應Meta分析 [4, 5]。因為回歸模型需要較大樣本量才能保證充足的統計效能,當統計效能較小時,合并的結果把握度不高,加之研究中存在多種偏倚的影響,這樣的結果并無太大實際價值,可考慮放棄Meta分析。這在一定程度上也節約了醫療資源。
5 討論
本文介紹了劑量-反應Meta分析中常見的偏倚種類及常用處理方法,首次將定量校正方法應用于劑量-反應Meta分析偏倚的處理。這些方法也適用于其他基于觀察性研究Meta分析偏倚的處理,如基因多態性Meta分析等。
本文引入的兩種定量校正方法各有其優缺點,合并前校正的方法通過方法學家的先驗評估可以更準確地描述各種偏倚的大小及方向,通過定量的偏倚去校正結果,再將校正的結果進行合并,在一定程度上能很好地消除潛在偏倚的影響。然而通過人為的先驗評估又會引入測量偏倚,這種評估方式很大程度上依賴于主觀經驗判斷,因此可能存在錯誤的評估而導致校正無效 [6];并且極大地耗費人力資源。通過改變權重校正可以在一定程度上避免人為因素干擾,但它需要依賴于各種質量評價量表的準確性,量表的使用也存在一定主觀性;其次通過權重校正較大程度上依賴于納入研究的質量,若納入研究質量均不高,此種方法則無明顯作用,若納入研究有部分質量較高且樣本量大,則結果會偏向于這部分研究。
定性描述偏倚或忽略偏倚也是常用的處理方式,但并不能從本質上消除潛在偏倚對Meta分析結果的影響,屬于偏“保守”的方法。在實際應用中,推薦優先使用定量校正方法,估計偏倚對結果的影響程度,更能反映結果的可靠性。
偏倚的處理無論在基于隨機對照試驗的Meta分析(包括網狀Meta分析)還是基于觀察性研究的Meta分析均是當前的難點。定性描述和定量校正均是可選的方法,偏倚處理的方法選擇需要根據實際情況,如外部人力、物力資源或內在臨床意義,最終的目的均是盡可能降低偏倚對結果的影響。
由于本身設計問題,觀察性研究容易混入多種偏倚,而這些偏倚會影響最終結果的可信度 [1, 2]。在劑量-反應Meta分析中,存在同樣的問題,傳統的模型擬合方法只考慮隨機誤差,因此多數劑量-反應Meta分析使用的是固定效應模型。隨著方法學的發展,隨機效應模型也被應用于劑量-反應Meta分析中,彌補了上述不足 [3]。但其并未解決最根本的問題——觀察性研究,合并結果時,采用倒方差法進行Meta分析有待商榷,因為這一方法只考慮樣本量大小而忽視了觀察性研究中各種其他偏倚對該研究可信度的影響。目前針對觀察性研究中存在的偏倚問題的思路可總結為三種:其一忽略其影響,其二為定性描述,其三則為定量描述并校正 [4]。因方法學上的盲區,當前并無特定針對劑量-反應Meta分析的偏倚校正方法,本文借鑒觀察性研究Meta分析中偏倚校正方法,通過調整后將其應用于劑量-反應Meta分析模型中,對該問題處理的各種方法進行總結并概括。
1 偏倚的類型
按照Cochrane Handbook 5.0.1版本上的定義,偏倚是指系統誤差,或者通俗解釋為結果或結論偏離真實值 [5]。Thompson等 [6]對觀察性研究的偏倚來源分成兩大類,一類為內部偏倚,另一類為外部偏倚。內部偏倚反映研究質量,它包括選擇性偏倚(包括納入排除標準、納入人群基線水平)、混雜偏倚(包括混雜因素的選擇、測量、校正、校正方法等)、暴露偏倚(暴露測量是否合適、方法/時間是否客觀正確等)、結果偏倚(包括報告偏倚,測量偏倚等)、其他偏倚(統計學分析是否正確)。而外部偏倚則反映目標設置的普遍性,包括人群偏倚(研究中納入人群特征是否符合目標人群)、暴露偏倚(研究中的暴露是否符合目標暴露)、結果偏倚(研究中結局指標是否符合目標結局)、時間刻度偏倚(隨訪時間是否符合目標隨訪年限)。下文我們將對劑量-反應Meta分析中偏倚的常用處理方法進行介紹。
2 偏倚的定性描述
2.1 量表評價
劑量-反應Meta分析大多基于觀察性研究,特別是隊列研究及病例對照研究。觀察性研究有多種量表(清單或條目)對其質量進行評價,以便對潛在偏倚進行半定量描述。據統計,當前有97種工具可用于觀察性研究設計,包括46種量表和51種清單,其中 21.88%適用于隊列研究,13.54%適用于病例對照研究,5.21%適用于橫斷面研究 [7, 8]。目前最為廣泛使用的量表為NOS量表(Newcastle-Ottawa Scale) [9],該量表分為病例-對照研究及隊列研究兩個部分,未針對橫斷面研究。另一種常用量表為CASP清單 [7],適用于病例-對照研究及隊列研究。Combie橫斷面研究評價工具 [7]則適用于橫斷面研究的質量評價,但目前橫斷面研究并未涉及劑量-反應Meta分析的內容。
通過系統評價員對納入研究進行質量評價,讀者可大致了解納入研究的質量狀況及該Meta分析結果的可信程度。
2.2 亞組或敏感性分析
亞組分析或敏感性分析需要建立在量表評價的基礎上,通過量表評分對納入研究進行分組,例如分為高質量、中等質量以及低質量,然后進行亞組分析或對剔除低質量文獻進行敏感性分析,探討不同研究質量的文獻合并后的結果是否相近或具有差異 [4],從而讓系統評價員及讀者更清楚地判斷低質量文獻對整體結果是否有較大影響。
3 偏倚的定量描述和校正
偏倚的定量校正有多種方法,包括使用質量分數加權法,先驗偏倚判斷、似然函數法等,本處引入并探討其中兩種較為常用的方法。
3.1 先驗校正法
據Thompson等 [6]對觀察性研究偏倚校正的處理方法,對劑量-反應Meta分析,偏倚的校正可通過引入一個新的元素,ξ,表示非隨機誤差。模型通過消除非隨機誤差對效應量的影響,達到校正作用。該方法意在從單個研究中先校正可能的外在偏倚,即非隨機誤差偏倚,然后對這些校正后的參數進行合并,從而保證結果更準確。
在擬合自變量與因變量劑量-反應關系時,通常假設一個二次多項式模型 [10]:
$In\left( R{{R}_{i}} \right)\text{ }=~{{\beta }_{1i}}{{x}_{i}}+~{{\beta }_{2i}}{{x}_{i}}^{2}+~{{\varepsilon }_{i}}$ |
其中,In(RRi)是感興趣的結局風險,xi是每層暴露水平,εi是隨機誤差。考慮各種非隨機誤差ξ,公式(1)寫為:
$In\left( R{{R}_{i}} \right)\text{ }=~{{\beta }_{1i}}{{x}_{i}}+~{{\beta }_{2i}}{{x}_{i}}^{2}+{{\varepsilon }_{i}}+{{\xi }_{i}}$ |
ξ包括人群偏倚、干預偏倚等各種偏倚,且大小和方向未知。因為各種非隨機誤差對結果的影響不可忽略,若在模型中對其校正,In(RRi)的期望值不再是β1ixi2 + β2ixi2,而是:
$In(R{{R}_{i}})\text{ }=~{{\beta }_{1i}}{{x}_{i}}^{2}~+~{{\beta }_{2i}}{{x}_{i}}^{2}~+~{{\xi }_{i}}$ |
以矩陣形式表示:
$Y\text{ }=\text{ }X\beta ~+~\varepsilon ~+~\xi ~$ |
使用最小二乘法,思想為使殘差平方和最小化 [11]。殘差平方和計算公式為:
$S(\beta )\text{ }=\text{ }(Y\text{ }-\text{ }X\beta ~-~\xi )'\text{ }(Y\text{ }-\text{ }X\beta ~-~\xi )$ |
函數的極值一般出現在一階導數為0處,因此,對上述公式求偏導數:
$\begin{align} & \frac{\partial S\left( \beta \right)}{\partial \beta }=\frac{\partial }{\partial \beta }\left[ \left( Y-X\beta -~\xi \right)'(Y\text{ }-\text{ }X\beta ~-~\xi ) \right] \\ & =\frac{\partial }{\partial \beta }\left( Y'Y-Y'X\beta -Y'\xi -X'\beta 'Y+X'\beta 'X\beta \right. \\ & \left. X'\beta '\xi -\xi Y+\xi X\beta +\xi \xi \right) \\ & =-X'Y-X\beta Y'+X\beta X+\xi X' \\ & =0 \\ \end{align}$ |
即得到我們需要求得的待估參數:
$\hat{\beta }=\text{ }[(Y'\text{ }-\text{ }X'\text{ }-~\xi ')\text{ }X\left] ^{\left( -1 \right)}\text{ } \right[X'\text{ }(\xi ~-\text{ }Y)]$ |
問題關鍵是求解ξ。其一,ξ的大小和方向未知,并且關于ξ的大小,衡量較為復雜 [5];其二,ξ包括多種潛在偏倚,是將這些偏倚放在一起考慮還是分開考慮,放在一起考慮的問題在于多種偏倚因為方向大小不一,可能會產生抵消反應;分開考慮則需要考慮到各種偏倚的交互作用,這將使模型非常復雜。Thompson等 [6]曾提出一種辦法,先將ξ中各種潛在偏倚分開量化,最后將這些偏倚加權合并。具體做法為通過引入先驗信息來對潛在偏倚量化,即預先請方法學專家分別對某種偏倚進行主觀評估,以百分比來衡量該研究偏倚對結果影響的程度和方向,并給出其66.7%置信區間,最后將這些偏倚加權合并為最終的。
3.2 權重校正法
經典劑量-反應Meta分析方法是通過合并納入研究中每篇研究潛在趨勢的參數,最后獲得一個加權合并的多項式函數模型,通過指定暴露劑量即可計算出相應效應量。在合并過程中,使用的是倒方差法。我們可以從傳統倒方差法中加入先驗偏倚權重,通過權重來校正倒方差法計算的權重,先驗偏倚權重理解為不同研究的偏倚大小影響該研究的權重。
在此種方法下,通過對倒方差法進行改進,加入偏倚風險這一變量,使得權重重新按照樣本量和偏倚大小兩個變量來分配,最終結果更偏向于大樣本量、低偏倚風險的研究,而對模型進行校正。該方法最初由GreenLand等 [12]提出,并應用于觀察性研究Meta分析。
該方法的問題在于將所有偏倚放在一起考慮并量化整體偏倚大小,以及如何將偏倚大小與方差的值進行標準化。因為在自然狀態下,這兩個值是不具可比性的,因此也無法進行量化分配。問題二為比例分配,在存在兩個變量的情況下,如何分配他們各自的權重,即樣本量在權重計算中占多大比例,偏倚風險占多大比例。對于這兩個問題,有一種簡單的處理辦法。具體為將質量評價量表系統與方差權重進行歸一化,也即對原來的倒方差計算出的權重繼續通過質量評分系統加權。這種辦法的有效性取決于納入研究的質量。
4 忽略偏倚
4.1 忽略偏倚
忽略偏倚也是一種常見方法 [4]。實際上,大多數定性描述方法均采用忽略偏倚的方法,盡管可以通過量表或亞組分析等手段進行相關分析,但無法將偏倚對結果的影響進行校正;而一些偏倚本身也很難避免,并且在一些方法學并不完善的Meta分析類別中(如劑量-反應Meta分析),除了常規的偏倚存在,仍有一些統計學方法或數據估算導致的偏倚,這些偏倚暫時無法消除,因而對其進行忽略。
4.2 放棄Meta分析
當納入研究質量等級較低,并且納入研究數目和樣本量不占優勢的情況下,可考慮放棄Meta分析,尤其對于劑量-反應Meta分析 [4, 5]。因為回歸模型需要較大樣本量才能保證充足的統計效能,當統計效能較小時,合并的結果把握度不高,加之研究中存在多種偏倚的影響,這樣的結果并無太大實際價值,可考慮放棄Meta分析。這在一定程度上也節約了醫療資源。
5 討論
本文介紹了劑量-反應Meta分析中常見的偏倚種類及常用處理方法,首次將定量校正方法應用于劑量-反應Meta分析偏倚的處理。這些方法也適用于其他基于觀察性研究Meta分析偏倚的處理,如基因多態性Meta分析等。
本文引入的兩種定量校正方法各有其優缺點,合并前校正的方法通過方法學家的先驗評估可以更準確地描述各種偏倚的大小及方向,通過定量的偏倚去校正結果,再將校正的結果進行合并,在一定程度上能很好地消除潛在偏倚的影響。然而通過人為的先驗評估又會引入測量偏倚,這種評估方式很大程度上依賴于主觀經驗判斷,因此可能存在錯誤的評估而導致校正無效 [6];并且極大地耗費人力資源。通過改變權重校正可以在一定程度上避免人為因素干擾,但它需要依賴于各種質量評價量表的準確性,量表的使用也存在一定主觀性;其次通過權重校正較大程度上依賴于納入研究的質量,若納入研究質量均不高,此種方法則無明顯作用,若納入研究有部分質量較高且樣本量大,則結果會偏向于這部分研究。
定性描述偏倚或忽略偏倚也是常用的處理方式,但并不能從本質上消除潛在偏倚對Meta分析結果的影響,屬于偏“保守”的方法。在實際應用中,推薦優先使用定量校正方法,估計偏倚對結果的影響程度,更能反映結果的可靠性。
偏倚的處理無論在基于隨機對照試驗的Meta分析(包括網狀Meta分析)還是基于觀察性研究的Meta分析均是當前的難點。定性描述和定量校正均是可選的方法,偏倚處理的方法選擇需要根據實際情況,如外部人力、物力資源或內在臨床意義,最終的目的均是盡可能降低偏倚對結果的影響。