協變量是指受試者在接受不同干預措施前,研究者預計的、會對主要變量分析產生重要影響的因素,是臨床試驗設計和分析時必須考慮的問題之一。在臨床試驗設計時,應盡可能充分考慮對協變量的控制,可采用隨機分組、分層隨機化、限定協變量取值的方法使其在組間達到均衡可比。在分析時,可根據主要結果變量和協變量的類型,選擇協方差分析、分層分析、線性或廣義線性模型等方法進行校正。本研究介紹在確證性臨床試驗中,如何在設計方案和統計分析計劃中事先明確協變量,預先規定主要統計模型來控制協變量。
引用本文: 黃麗紅, 陳峰. 臨床試驗中協變量的處理. 中國循證醫學雜志, 2019, 19(12): 1498-1502. doi: 10.7507/1672-2531.201905066 復制
2019 年 4 月美國食品藥品監督管理局(Food and Drug Administration,FDA)發布了臨床試驗中針對連續性結果變量的協變量校正指導原則(草案)[1],再次強調協變量在確證性臨床試驗分析中的重要性,以及如何正確分析協變量。
事實上,早在 1998 年,人用藥品注冊技術要求國際協調會(The International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use,ICH)在 E9文件[2]中就明確提出,進行臨床試驗需考慮協變量對結果的影響。尤其是對結果有重要影響的協變量,必須在設計時考慮其組間的均衡性,并采用合適的統計分析方法進行校正,以提高估計精度。2015 年,歐洲藥品監督管理局(European Medicines Agency,EMA)也頒布了專門的技術指南,詳細論述了協變量控制的意義、校正方法及如何正確應用[3]。本文從醫學統計學角度討論臨床試驗在設計、分析時如何正確處理協變量。
1 協變量的定義
協變量是指不同干預措施前,研究者預計的、會對主要變量分析產生重要影響的因素。這類變量可以是定性,也可以是定量的,抑或是等級資料。其可以是人口統計學指標如年齡、體重、種族/民族等;也可以是一些疾病預后因素如疾病分型、病程或病情嚴重程度;當然還有一些其它因素如研究中心或研究者等。上述臨床試驗的基線信息均可以看作協變量[4],是臨床試驗設計和分析時必須要考慮的問題之一。隨機化后測量的變量,由于可能受到處理因素的影響,不作為協變量考慮。
2 設計時協變量的控制
協變量在組間的不均衡可能導致分析結果偏倚。因此,應盡可能在設計時充分考慮對協變量進行控制[5],使其在組間達到均衡可比。在設計時協變量控制有如下幾種方法。
2.1 隨機分組
要使基線(已知的或未知的)在各處理組間達到均衡,最好的辦法是使用隨機分組。理論上,在樣本量足夠大時,通過完全隨機分組,各種因素(已知的和未知的)在各處理組間的分布趨于均衡。
2.2 分層隨機化
按協變量取值進行分層隨機化。在樣本量不是很大時,即使通過簡單隨機分組,也不一定能確保各因素在各處理組間的分布達到期望的均衡狀態。此時,可以按照協變量進行分層,采用分層隨機化保證一些重要協變量在組間分布的均衡。但分層因素不宜太多,一般考慮最重要的 1~3 個因素,每個因素 2~3 個水平。
2.3 限定協變量的取值
在納入標準中限定個體協變量的取值范圍,使所有受試者具有相同或相近的協變量值。但該法由于限制了受試者的條件,特別是當限制的取值范圍太小時,所得結果無法外推,因此其應用范圍有限。
3 分析時協變量的控制
組間協變量不均衡會導致結論的錯誤。即使協變量在組間是均衡的,也需要采用合適的統計分析方法校正,以提高估計準確度和精度。如不校正或錯誤校正,可能對試驗結果產生影響。尤其當個體協變量的變異較大,或協變量與結果變量的相關性較大時。因此,臨床試驗進行分析時需對協變量加以控制和調整。
根據協變量的性質和需考慮的協變量數目的不同,需采用不同的方法對協變量進行校正[6]:當主要結果變量為連續性指標時,可采用協方差分析(analysis of covariance,ANCOVA);當主要結果變量和協變量是分類指標時,可采用分層分析;當有多個協變量需要考慮時,常采用相應的線性模型或廣義線性模型進行校正。
3.1 初步調整
在評價主要終點指標時,如果其基線取值是連續性變量,往往要考慮基線值的大小對預后的影響。常用的方法是計算觀察指標相對于基線的變化值,即治療后觀測值與基線值的差值,包括絕對差值或相對差值[7]。
用 y0 表示觀察指標的基線值,y1 表示治療后觀察指標的測量值,ymin 表示觀察指標理論上的最小取值,ymax 表示觀察指標理論上的最大取值。
絕對差值表示相對于基線治療后數值變化:
(當觀測值越小越好時)或
(當觀測值越大越好時)
絕對差值常用于線性變化的變量。但是,有些觀察指標的變化不是線性的。此時需要使用相對差值,表示相對于基線治療后變化的比值。
當觀測值越小越好時: 或
其中, 表示治療后減少的最大數值。
當觀測值越大越好時: 或
其中, 表示治療后增加的最大數值。
而上述初步調整并沒有調整到位,在分析時仍需要對基線進行校正。不妨設基線、組別與治療后觀察指標的關系為:
![]() |
如果采用絕對差值 y=y1?y0 為結果變量,則上述關系可表示為:
![]() |
可見,只要系數 γ 不等于 1,基線 y0 的影響就不能通過簡單計算絕對差值來消除。
3.2 協方差分析法
當主要結果變量是連續性指標,協變量是連續性指標或分類指標時,對協變量的校正可采用協方差分析或一般線性模型[8]。此時,如果協變量是連續的,要求協變量與結果變量間的關系是線性的,且協變量與結果變量關系在試驗組和對照組的關系相同。
隨機分組已使協變量在各組的分布均衡可比,此時是否還需要校正協變量呢?答案是肯定的。因為協變量將影響結果變量,即結果變量的部分變異來自協變量,如果能扣除協變量的影響,將提高組間比較的檢驗效能。
設基線、組別與結果變量的關系為:
![]() |
基線與結果變量間的關系在試驗組和對照組相同,則無論是試驗組還是對照組,y 的方差均為:
![]() |
這里,基線 y0 的方差為 ,殘差方差為
。如果考慮扣除基線 y0 的影響,則校正后 y 的方差為
,減少了
。
例如,在一個減肥試驗中,減肥的效果除與處理因素有關外,還與受試者試驗前基線體重有一定關系(圖 1,個體原始數據見表 1),基線體重越重,減肥效果越好。如果不扣除基線體重的影響,則結果變量(體重降低值,kg)的方差為 12.96 kg2,試驗組比對照組平均多降低 1.77 kg,95%CI 為(?0.51,4.04)kg,兩組直接比較的結果是 t=1.571 4,P=0.124 4;而在校正基線的影響后,結果變量的方差為 9.12 kg2,兩組校正均數之差為 2.88 kg,95%CI 為(0.87,4.90)kg,協方差分析的結果是 F=7.86,P=0.008。


3.3 分層分析法
分層分析是控制協變量的基本方法之一,此時協變量是分類變量,如果協變量是連續性變量,則需要分類化。選擇具體分層分析方法時要考慮結果變量的類型。當主要結果變量是分類指標時,對協變量的校正可采用 Cochran-Mantel-Haenszel(CMH)檢驗進行分層分析;當結果變量為生存時間時,可用分層 log-rank 檢驗、分層 Cox 模型等。值得注意的是,分層分析的缺點在于一次只能考慮一個分層因素。如有更多的分層因素需要采用模型法。分層分析的結果常用森林圖表示,不同分層之間的差別一目了然。
3.4 模型校正法
當有多個協變量需要考慮時,常采用相應的統計學模型進行校正。一般而言,當結果變量為連續性指標時,采用一般線性模型;當結果變量為二分類時,采用 logistic 回歸;當結果為有序分類變量時,采用有序結果的累積比數 logistic 回歸;當結果變量是生存變量時,采用 Cox 比例風險模型;當結果變量是事件發生數時,采用 poisson 回歸模型等。此時,若協變量為二分類變量,則以 0?1 形式納入模型進行分析;若協變量為多分類變量時,需用啞變量(dummy variables)形式納入模型;當協變量為連續性變量時,可以直接納入模型(如果是線性關系)或變為分類資料(二分類、等級分類)后納入模型。
在應用模型時,需檢查模型假設的有效性。例如,應用 Cox 比例風險模型時,等比例風險的假設尤為重要;應用廣義線性模型和非線性模型時,需關注極端離群值對結果的可能影響等。
4 討論
4.1 協變量處理的統計學考慮
4.1.1 關于基線
在臨床隨機對照試驗中,由于試驗組和對照組來自同一總體,因此,只要正確應用隨機化分組,兩組基線分布理論上均衡。此時,若個別指標相差較大,可認為是隨機誤差。因此,沒有必要對基線進行統計學檢驗。ICH E9 文件中對此也沒有相應的要求。從統計學角度看,假設檢驗的原假設是試驗組與對照組基線相同,不拒絕原假設也不等于就能說明它們來自同一總體。此外,在研究設計時也沒有考慮基線檢驗的把握度。因此,在隨機對照試驗中沒有必要對不同處理組間基線進行比較。
在隨機化后,即使組間具有均衡性,也同樣在分析時需要對基線進行校正,以提高檢驗效能。隨機化后,如果發現組間基線不均衡,此時采用協方差分析或其他校正方法,一方面校正基線對結局的影響,另一方面可以校正基線的不均衡[9, 10]。
需要注意的是,與隨機化后處理有關的變量,不能作為協變量。特別是隨機化后的一些變量的測量值往往不能作為協變量。
4.1.2 區組與分層因素
臨床試驗中采用區組隨機化,一方面是從管理角度上考慮,另一方面可以控制季節等因素對試驗結果的影響。由于區組數較多,區組因素一般不作為協變量,這與 Fisher 提出的區組設計中的區組有所不同。
采用分層隨機分組可以用于確保各處理組間協變量(分層因素)的均衡。在分析時,所有分層因素通常被作為協變量納入主要分析模型中。
在臨床上已經確認變量與所研究的主要結局有密切關聯,則該變量應視為主要分析中的協變量,并在試驗方案中明確。在試驗方案中明確的協變量,在分析時均應納入主要分析模型中,無論該協變量在組間是否均衡及是否有統計學意義,尤其是在確證性臨床試驗中。確證性臨床試驗中,對協變量進行校正,其目的不是關注協變量在我們的研究中是否有統計學意義,也不可像流行病學觀察性研究那樣,把沒有統計學意義的變量剔除后再進行分析。
多中心試驗中,如果按中心分層進行隨機,主要分析模型中亦需考慮將中心作為協變量,一方面考慮中心效應,另一方面校正中心效應。當然,當中心數較多,或每個中心的受試者數量較少時,一般不分析中心效應。
4.1.3 變量變換與缺失數據
當主要變量的基線是連續性變量,或由連續性變量計算而來,無論主要變量的形式是原始觀察值,還是相對基線的變化值(絕對的或相對的),抑或由此計算得到的分類變量(例如,有效或無效),模型中均需包含其基線作為協變量。
在沒有充分的理由或先驗的前提下,協變量一般以簡單的線性形式或二分類后放入模型,必要時對協變量進行變量變換。選擇復雜形式或對協變量進行變量變換后放入模型,需要有充分的理由。FDA 的 2019 年最新指導原則[1]中指出,即使協變量與結果變量的關系是非線性的,以線性方式放入模型校正,也能提高檢驗效能。
假設協變量 x 與結果變量 y 的關系分別為線性、二次方和指數函數(以 e 為底)三種情形,協變量 x 的 β 系數為 0.5,1.0,2.0(每組相對應 x?y 相關系數為 0.45、0.71、0.89),假設協變量 x 在組間是均衡的,x~N(0,1),殘差 ε~N(0,1)。上述三種情形各模擬 1 000 次,得到以下模擬試驗結果(表 2)。從結果可知:在 x 與 y 為非線性關系(二次方和指數函數)時,將 x 以線性方式放入模型校正(模型 2),均能不同程度地提高檢驗效能,但 x 與 y 的相關程度對結果有一定影響,相關程度越高對檢驗效能影響越大。當 x 以正確關系放入模型校正(模型 3),檢驗效能最高,受 x 與 y 的相關程度的影響較小。

在基線數據缺失情況下,可以采用適當的統計方法對基線數據進行填補。但是所用填補方法需要事先在方案中確定,不能根據分析結果選擇填補方法,并進行敏感性分析。
4.1.4 交互作用
在一般情況下,主要分析中不考慮協變量與處理的交互作用。但是,如果由于專業上的知識和經驗,確需考慮交互作用,則在設計時需要考慮交互作用的檢驗效能,以及按協變量分層后亞組分析的把握度。如果協變量與處理組存在交互作用,意味著干預措施的效果因人而異,這對于精準醫療有一定指導意義。此時如果協方差分析結果顯示試驗組優于對照組,結論仍然有效。
4.2 非隨機對照研究中協變量的處理
在非隨機對照臨床試驗中,試驗組和對照組往往來自不同總體,即使兩組所考慮的基線無統計學差異,也不能說明組間均衡,因為試驗中沒有考慮的或沒有測量的特征指標是否均衡不得而知,其結論具有一定的不確定性。
此時,對于已經考慮的特征指標除了上述傳統的協方差分析、分層分析、模型校正外,還可采用匹配法、傾向性評分法(propensity score,PS)[11]及疾病風險評分法(disease risk score,DRS)[12]等對協變量進行匹配、分層和調整。對于沒有考慮或沒有測量的特征指標,可采用工具變量法(instrumental variable,IV)[13]、雙重差分模型(difference-in-differences,DiD)[14]、本底事件率比校正法(prior event rate ratio adjustment,PERR)[15]等加以控制。但是,這些方法只是不得已而為之的權宜之計,僅提供了在現有條件下能夠做到的最好途徑。
4.3 結果報告
包含在主要分析模型中的協變量(包括相應的變量變換和理由),應在試驗方案和統計分析計劃中事先明確。協變量不宜太多。在方案中明確定義、正確分析、合理解釋,將有助于讀者和審評人員對結果的判斷。由于可能存在許多其它的有效分析,只有預先指定的分析方法的結果最為可信。
分析報告中建議同時給出校正和不校正協變量的結果,以評價結果的穩健性。如果協變量是分類變量,則給出不同分類時亞組分析的結果。當協變量是連續性變量時,也可以先對其基線分類化,再給出亞組結果。
當校正分析和未校正分析得到不同結果時,需要小心和合理地解釋。因此,選擇合適的協變量和預先規定好主要統計模型就至關重要。
2019 年 4 月美國食品藥品監督管理局(Food and Drug Administration,FDA)發布了臨床試驗中針對連續性結果變量的協變量校正指導原則(草案)[1],再次強調協變量在確證性臨床試驗分析中的重要性,以及如何正確分析協變量。
事實上,早在 1998 年,人用藥品注冊技術要求國際協調會(The International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use,ICH)在 E9文件[2]中就明確提出,進行臨床試驗需考慮協變量對結果的影響。尤其是對結果有重要影響的協變量,必須在設計時考慮其組間的均衡性,并采用合適的統計分析方法進行校正,以提高估計精度。2015 年,歐洲藥品監督管理局(European Medicines Agency,EMA)也頒布了專門的技術指南,詳細論述了協變量控制的意義、校正方法及如何正確應用[3]。本文從醫學統計學角度討論臨床試驗在設計、分析時如何正確處理協變量。
1 協變量的定義
協變量是指不同干預措施前,研究者預計的、會對主要變量分析產生重要影響的因素。這類變量可以是定性,也可以是定量的,抑或是等級資料。其可以是人口統計學指標如年齡、體重、種族/民族等;也可以是一些疾病預后因素如疾病分型、病程或病情嚴重程度;當然還有一些其它因素如研究中心或研究者等。上述臨床試驗的基線信息均可以看作協變量[4],是臨床試驗設計和分析時必須要考慮的問題之一。隨機化后測量的變量,由于可能受到處理因素的影響,不作為協變量考慮。
2 設計時協變量的控制
協變量在組間的不均衡可能導致分析結果偏倚。因此,應盡可能在設計時充分考慮對協變量進行控制[5],使其在組間達到均衡可比。在設計時協變量控制有如下幾種方法。
2.1 隨機分組
要使基線(已知的或未知的)在各處理組間達到均衡,最好的辦法是使用隨機分組。理論上,在樣本量足夠大時,通過完全隨機分組,各種因素(已知的和未知的)在各處理組間的分布趨于均衡。
2.2 分層隨機化
按協變量取值進行分層隨機化。在樣本量不是很大時,即使通過簡單隨機分組,也不一定能確保各因素在各處理組間的分布達到期望的均衡狀態。此時,可以按照協變量進行分層,采用分層隨機化保證一些重要協變量在組間分布的均衡。但分層因素不宜太多,一般考慮最重要的 1~3 個因素,每個因素 2~3 個水平。
2.3 限定協變量的取值
在納入標準中限定個體協變量的取值范圍,使所有受試者具有相同或相近的協變量值。但該法由于限制了受試者的條件,特別是當限制的取值范圍太小時,所得結果無法外推,因此其應用范圍有限。
3 分析時協變量的控制
組間協變量不均衡會導致結論的錯誤。即使協變量在組間是均衡的,也需要采用合適的統計分析方法校正,以提高估計準確度和精度。如不校正或錯誤校正,可能對試驗結果產生影響。尤其當個體協變量的變異較大,或協變量與結果變量的相關性較大時。因此,臨床試驗進行分析時需對協變量加以控制和調整。
根據協變量的性質和需考慮的協變量數目的不同,需采用不同的方法對協變量進行校正[6]:當主要結果變量為連續性指標時,可采用協方差分析(analysis of covariance,ANCOVA);當主要結果變量和協變量是分類指標時,可采用分層分析;當有多個協變量需要考慮時,常采用相應的線性模型或廣義線性模型進行校正。
3.1 初步調整
在評價主要終點指標時,如果其基線取值是連續性變量,往往要考慮基線值的大小對預后的影響。常用的方法是計算觀察指標相對于基線的變化值,即治療后觀測值與基線值的差值,包括絕對差值或相對差值[7]。
用 y0 表示觀察指標的基線值,y1 表示治療后觀察指標的測量值,ymin 表示觀察指標理論上的最小取值,ymax 表示觀察指標理論上的最大取值。
絕對差值表示相對于基線治療后數值變化:
(當觀測值越小越好時)或
(當觀測值越大越好時)
絕對差值常用于線性變化的變量。但是,有些觀察指標的變化不是線性的。此時需要使用相對差值,表示相對于基線治療后變化的比值。
當觀測值越小越好時: 或
其中, 表示治療后減少的最大數值。
當觀測值越大越好時: 或
其中, 表示治療后增加的最大數值。
而上述初步調整并沒有調整到位,在分析時仍需要對基線進行校正。不妨設基線、組別與治療后觀察指標的關系為:
![]() |
如果采用絕對差值 y=y1?y0 為結果變量,則上述關系可表示為:
![]() |
可見,只要系數 γ 不等于 1,基線 y0 的影響就不能通過簡單計算絕對差值來消除。
3.2 協方差分析法
當主要結果變量是連續性指標,協變量是連續性指標或分類指標時,對協變量的校正可采用協方差分析或一般線性模型[8]。此時,如果協變量是連續的,要求協變量與結果變量間的關系是線性的,且協變量與結果變量關系在試驗組和對照組的關系相同。
隨機分組已使協變量在各組的分布均衡可比,此時是否還需要校正協變量呢?答案是肯定的。因為協變量將影響結果變量,即結果變量的部分變異來自協變量,如果能扣除協變量的影響,將提高組間比較的檢驗效能。
設基線、組別與結果變量的關系為:
![]() |
基線與結果變量間的關系在試驗組和對照組相同,則無論是試驗組還是對照組,y 的方差均為:
![]() |
這里,基線 y0 的方差為 ,殘差方差為
。如果考慮扣除基線 y0 的影響,則校正后 y 的方差為
,減少了
。
例如,在一個減肥試驗中,減肥的效果除與處理因素有關外,還與受試者試驗前基線體重有一定關系(圖 1,個體原始數據見表 1),基線體重越重,減肥效果越好。如果不扣除基線體重的影響,則結果變量(體重降低值,kg)的方差為 12.96 kg2,試驗組比對照組平均多降低 1.77 kg,95%CI 為(?0.51,4.04)kg,兩組直接比較的結果是 t=1.571 4,P=0.124 4;而在校正基線的影響后,結果變量的方差為 9.12 kg2,兩組校正均數之差為 2.88 kg,95%CI 為(0.87,4.90)kg,協方差分析的結果是 F=7.86,P=0.008。


3.3 分層分析法
分層分析是控制協變量的基本方法之一,此時協變量是分類變量,如果協變量是連續性變量,則需要分類化。選擇具體分層分析方法時要考慮結果變量的類型。當主要結果變量是分類指標時,對協變量的校正可采用 Cochran-Mantel-Haenszel(CMH)檢驗進行分層分析;當結果變量為生存時間時,可用分層 log-rank 檢驗、分層 Cox 模型等。值得注意的是,分層分析的缺點在于一次只能考慮一個分層因素。如有更多的分層因素需要采用模型法。分層分析的結果常用森林圖表示,不同分層之間的差別一目了然。
3.4 模型校正法
當有多個協變量需要考慮時,常采用相應的統計學模型進行校正。一般而言,當結果變量為連續性指標時,采用一般線性模型;當結果變量為二分類時,采用 logistic 回歸;當結果為有序分類變量時,采用有序結果的累積比數 logistic 回歸;當結果變量是生存變量時,采用 Cox 比例風險模型;當結果變量是事件發生數時,采用 poisson 回歸模型等。此時,若協變量為二分類變量,則以 0?1 形式納入模型進行分析;若協變量為多分類變量時,需用啞變量(dummy variables)形式納入模型;當協變量為連續性變量時,可以直接納入模型(如果是線性關系)或變為分類資料(二分類、等級分類)后納入模型。
在應用模型時,需檢查模型假設的有效性。例如,應用 Cox 比例風險模型時,等比例風險的假設尤為重要;應用廣義線性模型和非線性模型時,需關注極端離群值對結果的可能影響等。
4 討論
4.1 協變量處理的統計學考慮
4.1.1 關于基線
在臨床隨機對照試驗中,由于試驗組和對照組來自同一總體,因此,只要正確應用隨機化分組,兩組基線分布理論上均衡。此時,若個別指標相差較大,可認為是隨機誤差。因此,沒有必要對基線進行統計學檢驗。ICH E9 文件中對此也沒有相應的要求。從統計學角度看,假設檢驗的原假設是試驗組與對照組基線相同,不拒絕原假設也不等于就能說明它們來自同一總體。此外,在研究設計時也沒有考慮基線檢驗的把握度。因此,在隨機對照試驗中沒有必要對不同處理組間基線進行比較。
在隨機化后,即使組間具有均衡性,也同樣在分析時需要對基線進行校正,以提高檢驗效能。隨機化后,如果發現組間基線不均衡,此時采用協方差分析或其他校正方法,一方面校正基線對結局的影響,另一方面可以校正基線的不均衡[9, 10]。
需要注意的是,與隨機化后處理有關的變量,不能作為協變量。特別是隨機化后的一些變量的測量值往往不能作為協變量。
4.1.2 區組與分層因素
臨床試驗中采用區組隨機化,一方面是從管理角度上考慮,另一方面可以控制季節等因素對試驗結果的影響。由于區組數較多,區組因素一般不作為協變量,這與 Fisher 提出的區組設計中的區組有所不同。
采用分層隨機分組可以用于確保各處理組間協變量(分層因素)的均衡。在分析時,所有分層因素通常被作為協變量納入主要分析模型中。
在臨床上已經確認變量與所研究的主要結局有密切關聯,則該變量應視為主要分析中的協變量,并在試驗方案中明確。在試驗方案中明確的協變量,在分析時均應納入主要分析模型中,無論該協變量在組間是否均衡及是否有統計學意義,尤其是在確證性臨床試驗中。確證性臨床試驗中,對協變量進行校正,其目的不是關注協變量在我們的研究中是否有統計學意義,也不可像流行病學觀察性研究那樣,把沒有統計學意義的變量剔除后再進行分析。
多中心試驗中,如果按中心分層進行隨機,主要分析模型中亦需考慮將中心作為協變量,一方面考慮中心效應,另一方面校正中心效應。當然,當中心數較多,或每個中心的受試者數量較少時,一般不分析中心效應。
4.1.3 變量變換與缺失數據
當主要變量的基線是連續性變量,或由連續性變量計算而來,無論主要變量的形式是原始觀察值,還是相對基線的變化值(絕對的或相對的),抑或由此計算得到的分類變量(例如,有效或無效),模型中均需包含其基線作為協變量。
在沒有充分的理由或先驗的前提下,協變量一般以簡單的線性形式或二分類后放入模型,必要時對協變量進行變量變換。選擇復雜形式或對協變量進行變量變換后放入模型,需要有充分的理由。FDA 的 2019 年最新指導原則[1]中指出,即使協變量與結果變量的關系是非線性的,以線性方式放入模型校正,也能提高檢驗效能。
假設協變量 x 與結果變量 y 的關系分別為線性、二次方和指數函數(以 e 為底)三種情形,協變量 x 的 β 系數為 0.5,1.0,2.0(每組相對應 x?y 相關系數為 0.45、0.71、0.89),假設協變量 x 在組間是均衡的,x~N(0,1),殘差 ε~N(0,1)。上述三種情形各模擬 1 000 次,得到以下模擬試驗結果(表 2)。從結果可知:在 x 與 y 為非線性關系(二次方和指數函數)時,將 x 以線性方式放入模型校正(模型 2),均能不同程度地提高檢驗效能,但 x 與 y 的相關程度對結果有一定影響,相關程度越高對檢驗效能影響越大。當 x 以正確關系放入模型校正(模型 3),檢驗效能最高,受 x 與 y 的相關程度的影響較小。

在基線數據缺失情況下,可以采用適當的統計方法對基線數據進行填補。但是所用填補方法需要事先在方案中確定,不能根據分析結果選擇填補方法,并進行敏感性分析。
4.1.4 交互作用
在一般情況下,主要分析中不考慮協變量與處理的交互作用。但是,如果由于專業上的知識和經驗,確需考慮交互作用,則在設計時需要考慮交互作用的檢驗效能,以及按協變量分層后亞組分析的把握度。如果協變量與處理組存在交互作用,意味著干預措施的效果因人而異,這對于精準醫療有一定指導意義。此時如果協方差分析結果顯示試驗組優于對照組,結論仍然有效。
4.2 非隨機對照研究中協變量的處理
在非隨機對照臨床試驗中,試驗組和對照組往往來自不同總體,即使兩組所考慮的基線無統計學差異,也不能說明組間均衡,因為試驗中沒有考慮的或沒有測量的特征指標是否均衡不得而知,其結論具有一定的不確定性。
此時,對于已經考慮的特征指標除了上述傳統的協方差分析、分層分析、模型校正外,還可采用匹配法、傾向性評分法(propensity score,PS)[11]及疾病風險評分法(disease risk score,DRS)[12]等對協變量進行匹配、分層和調整。對于沒有考慮或沒有測量的特征指標,可采用工具變量法(instrumental variable,IV)[13]、雙重差分模型(difference-in-differences,DiD)[14]、本底事件率比校正法(prior event rate ratio adjustment,PERR)[15]等加以控制。但是,這些方法只是不得已而為之的權宜之計,僅提供了在現有條件下能夠做到的最好途徑。
4.3 結果報告
包含在主要分析模型中的協變量(包括相應的變量變換和理由),應在試驗方案和統計分析計劃中事先明確。協變量不宜太多。在方案中明確定義、正確分析、合理解釋,將有助于讀者和審評人員對結果的判斷。由于可能存在許多其它的有效分析,只有預先指定的分析方法的結果最為可信。
分析報告中建議同時給出校正和不校正協變量的結果,以評價結果的穩健性。如果協變量是分類變量,則給出不同分類時亞組分析的結果。當協變量是連續性變量時,也可以先對其基線分類化,再給出亞組結果。
當校正分析和未校正分析得到不同結果時,需要小心和合理地解釋。因此,選擇合適的協變量和預先規定好主要統計模型就至關重要。