本文介紹校正協變量的ROC曲線的原理、相對優勢、應用場景及R軟件實現方法。相較于傳統的單變量ROC曲線,校正協變量的ROC曲線具有明顯的方法學優勢和更廣闊的應用場景,能幫助更科學地評價標志物預測分類結局指標的能力,應在實踐研究中推廣應用。
引用本文: 吳家瑋, 劉嘉浩, 陳琪, 秦宇辰. 校正協變量的ROC曲線在評價標志物預測分類準確性中的應用. 中國循證醫學雜志, 2022, 22(9): 1085-1089. doi: 10.7507/1672-2531.202202023 復制
醫學的快速發展幫助人們不斷深化對疾病病因和病理生理過程的認識,許多參與疾病發生、發展和影響其預后的標志物被相繼發現,并在疾病早期診斷、療效評估、安全性評價和結局預測等方面發揮重要作用[1]。在使用標志物幫助判定檢測對象是否發生目標事件(如患病、死亡等)時[2],需要預先設定一系列的閾值及判定規則,當標志物取值高于/低于某個閾值時即判定研究對象是否患病。常采用受試者工作特征曲線(receiver operating characteristic curve,ROC)從準確性角度評價單個標志物的分類預測能力,將標志物在所有可能閾值下判斷結果的真陽性率(靈敏度)和假陽性率(1?特異度)標注于二維坐標系即得該曲線[3]。該曲線源于病例組和對照組兩組標志物分布形態間的分離度,曲線下面積(area under curve,AUC)可定量評價標志物分類預測的準確性和實際效用[4]。
然而,標志物的實際效用常受到其他協變量的影響,如檢測方法、樣本采集存儲方式、檢測中心、受試者基線情況等[5-7]。例如,前列腺特異性抗原(prostate specific antigen,PSA)已被廣泛用于前列腺癌篩查[8],但人體PSA取值水平往往隨著年齡增長而升高,而年齡越大前列腺癌的患病風險越高,故年齡本身也是前列腺癌篩查需考慮的重要因素[9]。若僅采用傳統的單變量ROC曲線,所得結果實際合并了其他協變量的效用,最終導致診斷結果并不準確。此時應采用統計方法剔除協變量影響,以更準確評價標志物的分類準確性。本文將介紹一種已在實踐中廣泛應用的校正協變量的ROC曲線模型[10],并基于R軟件使用半參數方法實現該模型,以期幫助臨床研究者更方便、準確地評估標志物的分類準確性和實用價值。
1 方法介紹
1.1 基本原理
ROC曲線可用標準化后的目標事件發生組(case)標志物的累計分布函數來表達,標準化依據為目標事件未發生組(control)標志物的分布特征[11]。假設連續型資料的標志物為Y,D=1表示case組,D=0表示control組,F()表示control組中Y的累積分布函數,YD表示case組中各觀測的標志物取值,PVD表示標準化后的case組標志物取值(也即percentile values,PV),則有,表示標準化后的case組各觀測對象標志物取值。在特定假陽性率f下的ROC曲線可表達為:
![]() |
此時,假設存在協變量Z,可影響control組的標志物Y分布,例如:Z表示研究中心,研究中心1招募的受試者標志物水平高于研究中心0中受試者的標志物水平
。此時,無論協變量Z與目標事件D是否相關,表達式(1)表示的ROC曲線已不能準確描述評價該標志物的分類準確性[6]。Janes和Pepe于2009年首次提出一種校正協變量的ROC曲線,其基本思想是在由協變量Z確定的層內,分層計算標志物Y的分類表現。該方法的表達式為:
![]() |
上式(2)與未校正協變量Z的ROC表達式(1)的唯一區別體現在,以control組為參照時,對case組標志物取值進行標準化的計算方式。當協變量Z取特定值時,case組的標志物取值需以control組中協變量Z值相同的研究對象的標志物取值為參照進行標準化,得到。校正協變量的ROC曲線實際是對不同協變量取值下的ROC曲線的加權平均,權重等于每個協變量取值分層下目標事件發生數所占的比例[10,12]。
1.2 校正協變量的ROC估計步驟
估計校正協變量的ROC主要有以下兩個步驟:
① 在control組中建立協變量Z與標志物Y分布間的函數關系式FZ,即明確協變量Z如何作用于Y,再利用該函數式于case組中計算每個觀察對象i的標準化后的標志物取值PV,即)。FZ可按協變量Z分層采用經驗方法估計,也可考慮指定協變量Z線性作用于標志物Y。
② 估計case組中各觀測對象PV值的累積分布函數。該累計分布函數可采用經驗方法估計得到,也可通過假定的參數分布得到。估計校正協變量的ROC曲線的詳盡步驟方法可參見Janes和Pepe的相關研究[10,13]。
1.3 校正協變量的ROC曲線的應用場景
依據協變量Z的不同性質,校正協變量的ROC曲線有如下三類應用場景:
① 協變量Z與標志物Y和目標事件D均相關,也即協變量Z為混雜因素,若使用傳統的單變量ROC曲線評價標志物Y的分類準確性將得到有偏的結果,可能過高或過低估計標志物的實際效用,此時應采用校正協變量的ROC曲線移除混雜協變量Z的影響以更準確評價標志物Y的分類準確性。
② 協變量Z僅與標志物Y相關,獨立于目標事件D。此時,協變量Z取不同值獲得的各條基于特定協變量的ROC曲線與校正協變量的ROC曲線相同,均可用于評價標志物Y的分類能力。但未校正協變量的ROC曲線會低估該標志物的分類能力[6]。
③ 協變量Z取不同值時,標志物Y的分類能力不同,也即ROC曲線不同。例如不同試樣處理方式下,標志物Y可能具有不同的分類能力。此時協變量Z不再是應排除的可引入偏倚的混雜因素,其可影響標志物分類能力本身就是值得探索的客觀規律。這種情況下,協變量Z類似于流行病學研究中常提到的效應修飾因子[14],應在協變量Z取不同值時分別獲得基于特定協變量的ROC曲線,用以全面表達、評估該標志物的分類能力。此種情況下,實踐中仍常有估計校正協變量的ROC曲線的需求。一方面,實際數據中協變量Z和標志物Y間常有一定相關性,即上述②場景,故仍有必要估計校正協變量的ROC曲線。此時校正協變量的ROC實際表達了該標志物在協變量Z不同取值下分類能力的平均水平。為方便理解,假設協變量Z是二分類變量,此時校正協變量的ROC曲線在圖形上應位于不同協變量Z取值下的ROC曲線的中間位置。另一方面,當研究樣本量較少時,可能不能以足夠的精度估計出基于特定協變量的ROC曲線,而采用校正協變量的ROC曲線仍可獲得一個可靠的預測分類能力的評價結果[6]。
2 實例應用及R軟件實現
Janes和Pepe開發的Stata軟件包“roccurve”可方便實現其所提出的校正協變量的ROC曲線。鑒于Stata為付費軟件,為更好推廣該方法在實踐研究中應用,此部分將介紹如何使用R軟件的“ROCnReg”包來實現校正協變量的ROC曲線并解釋其結果。
2.1 實例介紹
實例數據來自Wu等研究[15]中的226例訓練集數據,該研究旨在開發一個臨床預測模型,對經順鉑輔助化療的上尿路上皮癌患者在微創根治性腎輸尿管切除術后,腎功能不全不良結局發生情況進行預測。術后腎功能不全定義為患者術后腎小球濾過率eGFR<50 mL/min/1.73 m2。既往研究顯示,患者術前eGFR水平常可作為預測術后腎功能不全等不良結局發生的標志物[16-19]。本實例應用將基于該研究的226例訓練集數據,分別使用傳統的ROC曲線和校正協變量的ROC曲線評價,患者術前eGFR(標志物)對術后腎功能不全不良結局發生情況的預測分類能力。校正協變量的ROC曲線考慮年齡、性別、BMI、是否患有糖尿病四個可能對腎功能不全結局發生產生影響的基線協變量。
2.2 R軟件實現
R軟件包“ROCnReg”中的AROC.sp函數可實現校正協變量的ROC曲線分析,pooledROC.emp可實現傳統的單變量ROC曲線。使用這兩個函數實現兩類ROC曲線分析的五個步驟及相應的R代碼如下。
2.2.1 安裝并載入分析所需的R軟件包
#下載安裝"ROCnReg"包
install.packages("ROCnReg")
#下載安裝"rio"
install.packages("rio")
#載入"ROCnReg"包用于ROC分析
library("ROCnReg")
#載入"rio"包用于讀入Excel數據
library("rio")
2.2.2 導入整理后的待分析數據
使用“rio”包中的import()函數導入EXCEL案例數據training group中的“整理后數據”數據表單。
#讀入案例數據
dat<-import("training group.xls",sheet="整理后數據")
2.2.3 構建校正協變量的ROC曲線
使用“ROCnReg”包中的AROC.sp()函數構建校正協變量的ROC曲線Covaradj_ROC,通過該函數中的formula.h參數設定標志物[術前腎小球濾過率(PREOPERATIVEeGFR)]和需校正的協變量[年齡(AGE)、性別(GENDER)、BMI和是否患有糖尿病(DIABETES)]。通過group參數設定二分類結局指標(outcome),outcome=1表示術后發生腎功能不全,outcome=0表示術后未發生腎功能不全。再通過tag.h設定結局指標中control組的取值,為保證輸出的ROC曲線在對角線左上方,需選擇標志物平均值或中位數水平低的一組為control組。本例中,由于術后發生腎功能不全患者的術前腎小球濾過率平均水平更低,故設定outcome=1為control組,即tag.h=1。其余參數的設定方式及意義詳見代碼注釋內容。
#構建校正協變量的ROC曲線Covaradj_ROC,術前腎小球濾過率PREOPERATIVEeGFR為標志物,需校正協變量為年齡、性別、BMI、是否患有糖尿病
Covaradj_ROC<-AROC.sp(formula.h = PREOPERATIVEeGFR ~ AGE+GENDER+BMI
+DIABETES,
#設定需預測判定的二分類結局指標
group = "outcome",
#設定control組的二分類標識號
tag.h = 1,
#指定分析數據集dat
data = dat,
#指定在control組中建立擬校正協變量與標志物分布間的函數關系式的方法
#可選"empirical"(經驗法估計)或"normal"(線性模型)
est.cdf.h = "empirical",
#設定假陽性值數列,用于估計校正協變量的ROC曲線,取值需在0至1間
p = seq(0,1,length=101))
2.2.4 構建傳統單變量ROC曲線
使用“ROCnReg”包中的pooledROC.emp()函數構建傳統單變量ROC曲線Pooled_ROC,通過marker參數設定標志物,group參數設定二分局結局指標為outcome,tag.h參數設定結局變量中control組的取值,取值確定方法同步驟2.2.3。
#構建傳統的單變量ROC曲線模型Pooled_ROC
Pooled_ROC <- pooledROC.emp(marker = "PREOPERATIVEeGFR", group = "outcome",tag.h = 1, data = dat, p = seq(0,1,l=101))
2.2.5 輸出兩類ROC曲線的分析結果
使用summary()函數讓R軟件輸出校正協變量的ROC曲線Covaradj_ROC和傳統單變量ROC曲線Pooled_ROC,并單獨提取出兩個ROC曲線下面積AUC值及95%置信區間。
#輸出校正協變量的ROC曲線和傳統的單變量ROC曲線的分析結果
summary(Covaradj_ROC)
summary(Pooled_ROC)
#獲取兩類ROC曲線下面積AUC值及95% CI
Covaradj_ROC$AUC
Pooled_ROC$AUC
2.3 結果解釋
基于此226例訓練集數據,分別使用傳統的單變量ROC曲線和校正協變量的ROC曲線評價術前eGFR對術后腎功能不全不良結局發生情況的預測分類能力。分析結果如圖1所示,傳統的單變量ROC曲線為實線,校正協變量的ROC曲線為虛線。由圖1可知,校正協變量的ROC曲線下面積AUC值及95%可信區間為0.617(0.541,0.699),傳統的單變量ROC曲線下面積AUC值及95%可信區間為0.669(0.602,0.734),校正協變量的ROC曲線的AUC值低于傳統的單變量ROC曲線。這意味著,校正年齡、性別、BMI、是否患有糖尿病4個基線協變量后,術前eGFR對術后腎功能不全不良結局發生的預測分類能力有所下降,AUC值由未校正時的0.669下降至0.617,提示應考慮這4個協變量對結局預測的影響,以更科學準確地評價術前eGFR對術后腎功能不全預后的預測能力。

3 討論
校正協變量的ROC曲線具有傳統的單變量ROC曲線的核心優點,如不依賴原始測度單位、方便不同量綱的標志物間的評價比較、可全面展示所有可能閾值下標志物的分類能力等,同時又能有效解決當協變量與標志物存在相關性時,傳統的單變量ROC曲線可能有偏的問題。相較于基于特定協變量的ROC曲線,校正協變量的ROC曲線可得到一條綜合的ROC曲線,可解決當協變量取值水平較多時,因存在多條基于特定協變量的ROC曲線而加大結果解釋和傳播難度的問題,同時也能規避小樣本研究中,基于特定協變量的ROC曲線常遇到的估計精度不足的問題。當然,當協變量是效應修正因子時,仍需采用基于特定協變量的ROC曲線以全面描述、評價標志物在不同協變量取值下的區分能力和判定目標事件發生的最優閾值,從而更好指導臨床實踐。在實際操作中,我們建議探索所有基線協變量和標志物間的關聯關系,若關聯顯著則應考慮校正。也可將校正后的ROC曲線和未校正的ROC曲線進行比較以觀察曲線形態是否發生較大改變。需注意的是,某些協變量自身也有助于預測判斷目標事件,此時也應考慮是否可將其和標志物聯合,以期更準確預測判斷目標事件是否發生,例如用Logistic或COX回歸模型將年齡等協變量和PSA聯合構建預測前列腺癌的臨床預測模型[20-21]。本文所介紹校正協變量的ROC曲線的核心作用在于科學、準確表達并處理基線協變量對評價標志物自身分類能力的影響,這與聯合預測的方法不同。
雖然校正協變量的ROC曲線有諸多優點,但其在有關標志物分類預測能力評價的國內研究中并不常見,可能源于其基本原理較難理解,并且方法實現門檻較高。本文嘗試簡化介紹了該方法的基本原理和估計步驟,基于開源R軟件講授了軟件實現方法,以期能為該方法在醫療研究領域中的推廣應用提供參考。如有需要,可聯系通訊作者獲得本文的R代碼或基于實例應用背景的模擬數據。
聲明 無利益沖突。
醫學的快速發展幫助人們不斷深化對疾病病因和病理生理過程的認識,許多參與疾病發生、發展和影響其預后的標志物被相繼發現,并在疾病早期診斷、療效評估、安全性評價和結局預測等方面發揮重要作用[1]。在使用標志物幫助判定檢測對象是否發生目標事件(如患病、死亡等)時[2],需要預先設定一系列的閾值及判定規則,當標志物取值高于/低于某個閾值時即判定研究對象是否患病。常采用受試者工作特征曲線(receiver operating characteristic curve,ROC)從準確性角度評價單個標志物的分類預測能力,將標志物在所有可能閾值下判斷結果的真陽性率(靈敏度)和假陽性率(1?特異度)標注于二維坐標系即得該曲線[3]。該曲線源于病例組和對照組兩組標志物分布形態間的分離度,曲線下面積(area under curve,AUC)可定量評價標志物分類預測的準確性和實際效用[4]。
然而,標志物的實際效用常受到其他協變量的影響,如檢測方法、樣本采集存儲方式、檢測中心、受試者基線情況等[5-7]。例如,前列腺特異性抗原(prostate specific antigen,PSA)已被廣泛用于前列腺癌篩查[8],但人體PSA取值水平往往隨著年齡增長而升高,而年齡越大前列腺癌的患病風險越高,故年齡本身也是前列腺癌篩查需考慮的重要因素[9]。若僅采用傳統的單變量ROC曲線,所得結果實際合并了其他協變量的效用,最終導致診斷結果并不準確。此時應采用統計方法剔除協變量影響,以更準確評價標志物的分類準確性。本文將介紹一種已在實踐中廣泛應用的校正協變量的ROC曲線模型[10],并基于R軟件使用半參數方法實現該模型,以期幫助臨床研究者更方便、準確地評估標志物的分類準確性和實用價值。
1 方法介紹
1.1 基本原理
ROC曲線可用標準化后的目標事件發生組(case)標志物的累計分布函數來表達,標準化依據為目標事件未發生組(control)標志物的分布特征[11]。假設連續型資料的標志物為Y,D=1表示case組,D=0表示control組,F()表示control組中Y的累積分布函數,YD表示case組中各觀測的標志物取值,PVD表示標準化后的case組標志物取值(也即percentile values,PV),則有,表示標準化后的case組各觀測對象標志物取值。在特定假陽性率f下的ROC曲線可表達為:
![]() |
此時,假設存在協變量Z,可影響control組的標志物Y分布,例如:Z表示研究中心,研究中心1招募的受試者標志物水平高于研究中心0中受試者的標志物水平
。此時,無論協變量Z與目標事件D是否相關,表達式(1)表示的ROC曲線已不能準確描述評價該標志物的分類準確性[6]。Janes和Pepe于2009年首次提出一種校正協變量的ROC曲線,其基本思想是在由協變量Z確定的層內,分層計算標志物Y的分類表現。該方法的表達式為:
![]() |
上式(2)與未校正協變量Z的ROC表達式(1)的唯一區別體現在,以control組為參照時,對case組標志物取值進行標準化的計算方式。當協變量Z取特定值時,case組的標志物取值需以control組中協變量Z值相同的研究對象的標志物取值為參照進行標準化,得到。校正協變量的ROC曲線實際是對不同協變量取值下的ROC曲線的加權平均,權重等于每個協變量取值分層下目標事件發生數所占的比例[10,12]。
1.2 校正協變量的ROC估計步驟
估計校正協變量的ROC主要有以下兩個步驟:
① 在control組中建立協變量Z與標志物Y分布間的函數關系式FZ,即明確協變量Z如何作用于Y,再利用該函數式于case組中計算每個觀察對象i的標準化后的標志物取值PV,即)。FZ可按協變量Z分層采用經驗方法估計,也可考慮指定協變量Z線性作用于標志物Y。
② 估計case組中各觀測對象PV值的累積分布函數。該累計分布函數可采用經驗方法估計得到,也可通過假定的參數分布得到。估計校正協變量的ROC曲線的詳盡步驟方法可參見Janes和Pepe的相關研究[10,13]。
1.3 校正協變量的ROC曲線的應用場景
依據協變量Z的不同性質,校正協變量的ROC曲線有如下三類應用場景:
① 協變量Z與標志物Y和目標事件D均相關,也即協變量Z為混雜因素,若使用傳統的單變量ROC曲線評價標志物Y的分類準確性將得到有偏的結果,可能過高或過低估計標志物的實際效用,此時應采用校正協變量的ROC曲線移除混雜協變量Z的影響以更準確評價標志物Y的分類準確性。
② 協變量Z僅與標志物Y相關,獨立于目標事件D。此時,協變量Z取不同值獲得的各條基于特定協變量的ROC曲線與校正協變量的ROC曲線相同,均可用于評價標志物Y的分類能力。但未校正協變量的ROC曲線會低估該標志物的分類能力[6]。
③ 協變量Z取不同值時,標志物Y的分類能力不同,也即ROC曲線不同。例如不同試樣處理方式下,標志物Y可能具有不同的分類能力。此時協變量Z不再是應排除的可引入偏倚的混雜因素,其可影響標志物分類能力本身就是值得探索的客觀規律。這種情況下,協變量Z類似于流行病學研究中常提到的效應修飾因子[14],應在協變量Z取不同值時分別獲得基于特定協變量的ROC曲線,用以全面表達、評估該標志物的分類能力。此種情況下,實踐中仍常有估計校正協變量的ROC曲線的需求。一方面,實際數據中協變量Z和標志物Y間常有一定相關性,即上述②場景,故仍有必要估計校正協變量的ROC曲線。此時校正協變量的ROC實際表達了該標志物在協變量Z不同取值下分類能力的平均水平。為方便理解,假設協變量Z是二分類變量,此時校正協變量的ROC曲線在圖形上應位于不同協變量Z取值下的ROC曲線的中間位置。另一方面,當研究樣本量較少時,可能不能以足夠的精度估計出基于特定協變量的ROC曲線,而采用校正協變量的ROC曲線仍可獲得一個可靠的預測分類能力的評價結果[6]。
2 實例應用及R軟件實現
Janes和Pepe開發的Stata軟件包“roccurve”可方便實現其所提出的校正協變量的ROC曲線。鑒于Stata為付費軟件,為更好推廣該方法在實踐研究中應用,此部分將介紹如何使用R軟件的“ROCnReg”包來實現校正協變量的ROC曲線并解釋其結果。
2.1 實例介紹
實例數據來自Wu等研究[15]中的226例訓練集數據,該研究旨在開發一個臨床預測模型,對經順鉑輔助化療的上尿路上皮癌患者在微創根治性腎輸尿管切除術后,腎功能不全不良結局發生情況進行預測。術后腎功能不全定義為患者術后腎小球濾過率eGFR<50 mL/min/1.73 m2。既往研究顯示,患者術前eGFR水平常可作為預測術后腎功能不全等不良結局發生的標志物[16-19]。本實例應用將基于該研究的226例訓練集數據,分別使用傳統的ROC曲線和校正協變量的ROC曲線評價,患者術前eGFR(標志物)對術后腎功能不全不良結局發生情況的預測分類能力。校正協變量的ROC曲線考慮年齡、性別、BMI、是否患有糖尿病四個可能對腎功能不全結局發生產生影響的基線協變量。
2.2 R軟件實現
R軟件包“ROCnReg”中的AROC.sp函數可實現校正協變量的ROC曲線分析,pooledROC.emp可實現傳統的單變量ROC曲線。使用這兩個函數實現兩類ROC曲線分析的五個步驟及相應的R代碼如下。
2.2.1 安裝并載入分析所需的R軟件包
#下載安裝"ROCnReg"包
install.packages("ROCnReg")
#下載安裝"rio"
install.packages("rio")
#載入"ROCnReg"包用于ROC分析
library("ROCnReg")
#載入"rio"包用于讀入Excel數據
library("rio")
2.2.2 導入整理后的待分析數據
使用“rio”包中的import()函數導入EXCEL案例數據training group中的“整理后數據”數據表單。
#讀入案例數據
dat<-import("training group.xls",sheet="整理后數據")
2.2.3 構建校正協變量的ROC曲線
使用“ROCnReg”包中的AROC.sp()函數構建校正協變量的ROC曲線Covaradj_ROC,通過該函數中的formula.h參數設定標志物[術前腎小球濾過率(PREOPERATIVEeGFR)]和需校正的協變量[年齡(AGE)、性別(GENDER)、BMI和是否患有糖尿病(DIABETES)]。通過group參數設定二分類結局指標(outcome),outcome=1表示術后發生腎功能不全,outcome=0表示術后未發生腎功能不全。再通過tag.h設定結局指標中control組的取值,為保證輸出的ROC曲線在對角線左上方,需選擇標志物平均值或中位數水平低的一組為control組。本例中,由于術后發生腎功能不全患者的術前腎小球濾過率平均水平更低,故設定outcome=1為control組,即tag.h=1。其余參數的設定方式及意義詳見代碼注釋內容。
#構建校正協變量的ROC曲線Covaradj_ROC,術前腎小球濾過率PREOPERATIVEeGFR為標志物,需校正協變量為年齡、性別、BMI、是否患有糖尿病
Covaradj_ROC<-AROC.sp(formula.h = PREOPERATIVEeGFR ~ AGE+GENDER+BMI
+DIABETES,
#設定需預測判定的二分類結局指標
group = "outcome",
#設定control組的二分類標識號
tag.h = 1,
#指定分析數據集dat
data = dat,
#指定在control組中建立擬校正協變量與標志物分布間的函數關系式的方法
#可選"empirical"(經驗法估計)或"normal"(線性模型)
est.cdf.h = "empirical",
#設定假陽性值數列,用于估計校正協變量的ROC曲線,取值需在0至1間
p = seq(0,1,length=101))
2.2.4 構建傳統單變量ROC曲線
使用“ROCnReg”包中的pooledROC.emp()函數構建傳統單變量ROC曲線Pooled_ROC,通過marker參數設定標志物,group參數設定二分局結局指標為outcome,tag.h參數設定結局變量中control組的取值,取值確定方法同步驟2.2.3。
#構建傳統的單變量ROC曲線模型Pooled_ROC
Pooled_ROC <- pooledROC.emp(marker = "PREOPERATIVEeGFR", group = "outcome",tag.h = 1, data = dat, p = seq(0,1,l=101))
2.2.5 輸出兩類ROC曲線的分析結果
使用summary()函數讓R軟件輸出校正協變量的ROC曲線Covaradj_ROC和傳統單變量ROC曲線Pooled_ROC,并單獨提取出兩個ROC曲線下面積AUC值及95%置信區間。
#輸出校正協變量的ROC曲線和傳統的單變量ROC曲線的分析結果
summary(Covaradj_ROC)
summary(Pooled_ROC)
#獲取兩類ROC曲線下面積AUC值及95% CI
Covaradj_ROC$AUC
Pooled_ROC$AUC
2.3 結果解釋
基于此226例訓練集數據,分別使用傳統的單變量ROC曲線和校正協變量的ROC曲線評價術前eGFR對術后腎功能不全不良結局發生情況的預測分類能力。分析結果如圖1所示,傳統的單變量ROC曲線為實線,校正協變量的ROC曲線為虛線。由圖1可知,校正協變量的ROC曲線下面積AUC值及95%可信區間為0.617(0.541,0.699),傳統的單變量ROC曲線下面積AUC值及95%可信區間為0.669(0.602,0.734),校正協變量的ROC曲線的AUC值低于傳統的單變量ROC曲線。這意味著,校正年齡、性別、BMI、是否患有糖尿病4個基線協變量后,術前eGFR對術后腎功能不全不良結局發生的預測分類能力有所下降,AUC值由未校正時的0.669下降至0.617,提示應考慮這4個協變量對結局預測的影響,以更科學準確地評價術前eGFR對術后腎功能不全預后的預測能力。

3 討論
校正協變量的ROC曲線具有傳統的單變量ROC曲線的核心優點,如不依賴原始測度單位、方便不同量綱的標志物間的評價比較、可全面展示所有可能閾值下標志物的分類能力等,同時又能有效解決當協變量與標志物存在相關性時,傳統的單變量ROC曲線可能有偏的問題。相較于基于特定協變量的ROC曲線,校正協變量的ROC曲線可得到一條綜合的ROC曲線,可解決當協變量取值水平較多時,因存在多條基于特定協變量的ROC曲線而加大結果解釋和傳播難度的問題,同時也能規避小樣本研究中,基于特定協變量的ROC曲線常遇到的估計精度不足的問題。當然,當協變量是效應修正因子時,仍需采用基于特定協變量的ROC曲線以全面描述、評價標志物在不同協變量取值下的區分能力和判定目標事件發生的最優閾值,從而更好指導臨床實踐。在實際操作中,我們建議探索所有基線協變量和標志物間的關聯關系,若關聯顯著則應考慮校正。也可將校正后的ROC曲線和未校正的ROC曲線進行比較以觀察曲線形態是否發生較大改變。需注意的是,某些協變量自身也有助于預測判斷目標事件,此時也應考慮是否可將其和標志物聯合,以期更準確預測判斷目標事件是否發生,例如用Logistic或COX回歸模型將年齡等協變量和PSA聯合構建預測前列腺癌的臨床預測模型[20-21]。本文所介紹校正協變量的ROC曲線的核心作用在于科學、準確表達并處理基線協變量對評價標志物自身分類能力的影響,這與聯合預測的方法不同。
雖然校正協變量的ROC曲線有諸多優點,但其在有關標志物分類預測能力評價的國內研究中并不常見,可能源于其基本原理較難理解,并且方法實現門檻較高。本文嘗試簡化介紹了該方法的基本原理和估計步驟,基于開源R軟件講授了軟件實現方法,以期能為該方法在醫療研究領域中的推廣應用提供參考。如有需要,可聯系通訊作者獲得本文的R代碼或基于實例應用背景的模擬數據。
聲明 無利益沖突。