風險預測模型可預測個體的疾病風險,對疾病預防、治療和預后管理等決策有重要價值。現有風險預測模型多僅使用單一時間截面的變量數據的靜態模型,未考慮疾病進展過程中的諸多變化而導致預測準確性受限。動態預測模型可納入隨訪期間同一指標的重復測量的縱向數據,捕捉個體特征隨時間的縱向變化趨勢,描述個體疾病風險的動態軌跡并提高模型的預測精度,然而其目前在醫學研究中的應用仍然較少。本文總結目前常用的風險預測動態模型:聯合模型、界標模型和貝葉斯動態模型,介紹各自應用場景、優缺點和軟件實現并進行比較,以期為未來動態預測模型在醫學研究中的應用提供方法學參考。
引用本文: 宋若齊, 吳疏桐, 王闖世. 醫學研究中常見動態預測模型方法介紹. 中國循證醫學雜志, 2022, 22(10): 1224-1232. doi: 10.7507/1672-2531.202205137 復制
風險預測模型(risk prediction model)是醫學研究中的熱點,其基于個體或患者現有信息,預測未來時點感興趣的結局事件發生的風險[1]。風險預測模型不僅可指導臨床實踐,如對心血管疾病的高風險人群早期給予降脂治療預防心血管重大事件發生[2];還可用于群體水平的疾病防控,指導公共衛生決策,如提倡戒煙限酒、合理膳食等。目前,不論是預測疾病發生風險或預后風險,從統計的角度,已構建的風險預測模型多為靜態模型(static model),指僅使用個體單一時間截面的信息預測未來某一時點結局事件的風險[3]。靜態模型通常使用基線(如個體研究入組、患者確診或開始治療等具有臨床意義的時間點采集)的預測因子數據(個體特征、診療信息等),并借助合適的統計學模型(如logistic模型或Cox模型等)將基線數據與結局事件關聯起來。但是,越來越多的研究顯示靜態風險預測模型存在諸多不足[4-7]。
首先,預測因子會隨時間變化。在疾病進展過程中預測因子往往并非恒定,而是呈現動態變化軌跡;但靜態模型僅使用單一時點數據,是一次性校準的模型。因此,靜態模型無法利用預測因子的縱向變化更新預測結果,可能導致延遲甚至錯誤的決策。其次,預測因子與結局的關聯可能會改變,而靜態模型如Cox模型則需滿足比例風險(proportional hazard,PH)假定,即預測因素對結局的影響隨時間保持恒定,當PH假定不成立時可能產生具有誤導性或錯誤的結論[7]。另外,隨訪過程中可能出現高預測價值的新因素,會削弱基線因素與結局的關聯導致預測有偏。總體而言,靜態模型無法處理上述隨時間推移而產生的諸多變化,導致預測性能降低,常表現為校準度欠佳,被稱為“校準漂移”(calibration drift)[8]。
針對靜態預測模型的不足,有研究者提出通過聯合預測因子的基線和縱向數據捕捉個體特征隨時間變化的動態預測模型(dynamic prediction model)[9],這類模型可使用隨訪獲取的預測因子數據更新風險預測值,實現動態預測。與靜態模型相比,其優勢主要有2點:① 提高預測精度[10-12];② 描繪個體風險隨時間的動態軌跡[3]。既往研究顯示,即使是基于電子健康檔案(更易獲取縱向數據)的預測模型研究,僅不到9%考慮了預測因子的時變性[10]。近年來動態預測模型在醫學研究中受到廣泛關注,但國內尚缺乏其應用,亦未見系統的方法學介紹。通過系統檢索與回顧現有動態預測模型相關研究,本文介紹和比較目前常用的動態預測模型方法:聯合模型方法(joint modeling approach,JM)、界標法(landmark analysis approach)和貝葉斯動態模型(Bayesian dynamic model),旨在為未來動態預測模型的應用研究提供方法學參考。
以“dynamic Bayesian model”、“dynamic prediction model”和“dynamic prediction”為關鍵詞在PubMed上進行檢索,限制查詢框為標題/摘要,檢索時限從建庫至2021年10月19日,檢索到298篇英文文獻,追溯參考文獻檢索另外發現25篇文獻,共計323篇。對去重后的263篇文獻進行篩選,剔除無關文獻,最終納入189篇文獻,其中方法學相關文章83篇,應用類文章106篇,文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
1 模型介紹
1.1 聯合模型方法
1.1.1 基本原理
聯合模型方法是分別對重復測量的縱向數據和時間-事件的生存數據建模,并通過一定的關聯結構/函數“連接”2個子模型。最早在1997年由Wulfsohn和Tsiatis提出,用于同時處理艾滋病研究中的重復測量的CD4+T淋巴細胞計數和生存數據[13],是目前最常用的動態預測模型之一。隨后經過擴展,多用于腫瘤患者的預后研究中分析重復測量的生物標志物數據,代表性研究如Taylor等人[14]利用前列腺癌癥患者的前列腺特異性抗原數據,通過聯合模型來動態預測接受放療后患者前列腺癌復發情況。其中共享隨機效應模型(shared random effects model,SREM)目前應用較多,通過共享隨機效應連接線性混合模型和Cox比例風險模型(proportional hazards model)[15],除常見的共享隨機效應模型,聯合模型還存在其他形式,常見的關聯結構如時依斜率、累計效應等[16]。但值得注意的是,大部分的模型優化僅針對縱向子模型[15]。本文以SREM為例進行介紹。
1.1.2 模型構建與參數估計
假設每個受試者存在理想化數據
,其中
是事件時間,
是基線協變量的向量,
是所有時間u≥0時的縱向反應過程,基于這些數據及衍生變量可得出:① 闡明縱向反應的變化模式,例如用
和
估計平均縱向反應的特性及其與協變量的關系;② 闡明縱向過程、生存和協變量之間的關聯,例如用比例風險模型描述
之間的關系。但實際模型構建時往往更復雜,例如涉及到時間u的縱向反應,對于受試者i的數據收集往往并非連續性,而是間斷性在時間集合
上收集,且
;觀測值
與真實值
間存在誤差
,但實際使用時只考慮將觀測值
代入計算;因刪失情況存在而不能收集到所有受試者的
等[15]。因此在實際情況下,通過以下設定來構建聯合模型:
![]() |
表示第i個受試者被觀察到的事件發生時間,
為刪失時間;
為事件發生指標,其中I為指數函數。
![]() |
表示在時間集合上收集的縱向數據
且
。
聯合模型由兩個關聯的子模型組成:一個包括縱向反應過程;另一個包括事件時間
。其聯合分布的觀測數據集可表示為:
,且
被認為是獨立于每個受試者i的,表明對每個受試者來說疾病發展過程是獨立的。
對于縱向反應過程,一個標準的方法是用特定受試者與時間無關的隨機效應的向量來描述
的特征。一般形式可表示為:
![]() |
其中是關于時間u的函數向量,可假設為線性函數或非線性函數[15]。這種普遍的形式規定了理想狀態下縱向過程應遵循一個平滑的軌跡。此外,也會考慮在公式中加入一個獨立于
和
(即基線協變量的q維向量)的
項,且
是均值為0的隨機過程,有助于更精確地捕捉軌跡的特征,但實施起來更為復雜,因此多數文獻中都集中采用公式(1)的形式。
對于事件時間,常用Cox比例風險模型來描述,也可被定義為包括隨機效應作為預測因素的模型。在標準比例風險模型中,假設協變量與時間無關,那么Cox比例風險模型為:
![]() |
代表基線風險函數,
為治療相關指標、疾病史等,
為對應的回歸系數向量。在實際應用中,通過加入與時間相關的關聯參數使縱向過程與生存過程相連接。
最常見的聯合模型是共享隨機效應模型,其中縱向子模型一般用線性混合模型來定義。取個體,設
,
,
,
與前文定義一致。
為固定效應矩陣的行向量,β為對應的固定效應的系數,
為隨機效應矩陣的行向量,
為對應的隨機效應的系數,服從均值為0,非結構化協方差矩陣為∑的多變量正態分布。
是殘余誤差的向量且假定為獨立的正態分布,其方差矩陣為
,且假定殘余誤差與隨機效應無關。觀察到的縱向結果值用
表示,則公式如下:
![]() |
令縱向子模型中的,則
,表示
到時間點t之前縱向過程的記錄。假定α是縱向數據的回歸系數,關聯參數,即假設在時間t事件發生的風險取決于真實的縱向軌跡
,通過其在時間t的值,可將2個子模型聯系起來。那么對于生存子模型,將Cox比例風險模型擴展為含有與時間相關的變量的模型,也叫做Andersen-Gill模型,公式如下:
![]() |
α的大小表示縱向數據與風險函數關聯性的強弱。若α=0,則聯合模型將簡化為兩個獨立的模型。具體來說,表示基線協變量
每增加1個單位的風險比,而
表示
每增加1個單位的風險比。
構建一般Cox比例風險模型時,通常不指定基線風險函數,避免錯誤指定生存時間分布而帶來的影響。而聯合模型中,需要明確地定義
,常用的有已知參數分布的風險函數、分段常數等[13]。
聯合模型參數估計的方法主要是限制性極大似然方法(restricted maximum likelihood method,REML)和馬爾可夫鏈蒙特卡洛(Markov Chain Monte Carlo algorithm,MCMC)的貝葉斯方法,本文主要對共享隨機效應模型常使用的限制性極大似然方法進行介紹。
關于限制性極大似然方法,假設與時間無關的隨機效應的系數 為縱向數據和生存數據聯合的基礎,則在隨機效應模型中,可解釋縱向數據和生存數據之間的關聯,也可解釋縱向數據中重復測量結果之間的相關性[16]。可得到似然函數公式(5)。
θ為縱向子模型和生存子模型中的定義的全部參數向量。其中是縱向結果
的概率密度函數且均數為
,協方差為
。
是隨機效應
的概率密度函數且均數為0,協方差為
。
是生存子模型中在觀察時間
定義的風險函數。由此,可通過迭代算法獲得最大似然估計,例如EM或Newton-Raphson算法[17]。
另外,還可從聯合模型得到個體結局發生風險的動態預測。根據截至時間s收集到的事件結果、協變量
和
,通過蒙特卡羅方法近似定義中的后驗分布可預測個體在時間s和s+t之間的事件發生概率,在本文中不再進行更加詳細的公式介紹。
1.1.3 結果解讀
與一般模型類似,獲得模型參數估計值后,可判斷協變量和事件之間是否存在顯著關聯,即根據協變量的系數的P值是否小于0.05。如果P<0.05,則可認為存在顯著關聯,聯合模型中該協變量的單位增加對應相應事件發生風險增加
倍。
1.1.4 應用場景
應用聯合模型的數據特點主要為:① 存在數據重復測量的過程;② 縱向數據測量的過程和生存過程之間存在潛在關系。聯合模型大部分可能的形式擴展多存在于縱向子模型中,往往需要對數據做相應假設來滿足模型的使用條件進而應用在更多領域。
1.1.5 優缺點
與在Cox模型中運用依時協變量相比,聯合模型方法具有以下優點[3,18]:① 可同時對縱向數據和生存數據建模。② 考慮了重復測量過程中被感興趣事件截斷的情況,并處理了縱向結果的變異性。③ 生存結果和重復測量的軌跡之間可存在更復雜的關聯,比如因果關聯、在縱向模型中包括樣條式或者分數多項式等。
但聯合模型法需要一些簡單的假設作為前提(如比例風險、隨機效應的數量等),而實際情況的假設和參數估計往往更加復雜,若要分析更大的數據集,需要進一步研究開發除MCMC和極大似然以外的更合適的參數估計的方法[19],因此在實踐中可能仍然難以廣泛應用,這會增加模型參數估計和預測的計算需求。
1.1.6 軟件實現
R語言中,JM、joineR和JMbayes都可用于擬合聯合模型;SAS中可采用PROC NLMIXED進行擬合;Stata中可運用stjm命令擬合基本的聯合模型。
1.2 界標法
1.2.1 基本原理
界標法也是動態生存分析常用方法之一,最初由Anderson等人[20]在1983年引入臨床腫瘤學研究,作為存在時依協變量的Cox模型的一種替代方法,評估復發的晚期癌癥患者的治療效果。隨后van Houweilingen[21-22]將該模型推廣至縱向數據的動態生存分析,補充改進了參數估計并提出超級模型的概念,并應用于急性淋巴性白血病患者骨髓移植后的生存預后研究。界標法是在隨訪期間指定一個界標時間點(landmark time),針對在界標時間點存活或仍有風險的個體組成的子樣本建立生存模型(如Cox比例風險模型),預測界標時間點后的生存概率[23]。簡單來說,界標法將界標
![]() |
時間點之前的所有死亡或發生結局事件的個體剔除并假定在設定的界標時間段內自變量對結局風險的影響恒定。界標時間點可設置1個或多個,基于每個界標時間點建立風險人群集,進行生存分析,形成由多個預測模型組成的超級預測模型(super prediction model)[24],使得預測的風險比率隨界標時間的變化而平穩地變化,并提高條件生存概率估計的準確性和合理性。一般來說,界標點的選擇取決于研究目的[3]和預測的時間范圍(prediction horizon),即界標時間點與預測終點的時間間隔。當時間間隔過小,則為短期預測,不適用于慢性疾病;若時間間隔過大,則為長期預測,對于縱向信息變化敏感的臨床事件難以實現準確預測[25]。
1.2.2 模型構建與參數估計
對于受試者i,設,
,
,
,
與公式(2)中定義一致,
為縱向或依時變量,
表示隨訪
時該受試者的縱向變量的值,且X與Z所含變量相互獨立。基于預先設定的界標時間
和預測窗口
(prediction window),選擇在
時處于風險狀態的人群,建立預測風險人群集
,在對
時段后發生的事件做刪失處理后,預測
至
時段個體事件發生的風險。界標法采用Cox回歸模型,數學表達式為:
![]() |
仍為風險函數,但為基于界標時間
,t時刻的條件函數,根據界標時間的基線風險估計得到。與聯合模型不同,通常不需要指定其分布。
公式(7)中的值由所含變量和界標時間決定。由于縱向變量的重復測量時間并不一定恰好在界標時間點上,
進入模型的取值有2種:使用界標時間點或界標時間點前的最近一次觀察值,即樸素界標模型(na?ve landmark model)[14],但該方法并未考慮縱向變量從基線到
時的變化軌跡和
前最后一次測量值與
的時間差。所以,另一種方法為二階段界標模型(two-stage landmark model),首先利用線性混合模型估計
時
的取值[14],建立滿足條件的受試者數據集
,并采用偏似然法(partial likelihood)估計參數擬合Cox模型。利用Breslow估計,可得到
時存活的受試者j和至少存活到
時的個體動態生存概率
[6]:
![]() |
其中,
![]() |
當考慮多個界標時間時,重復上述過程,針對每個界標時間
,建立相應的預測數據集
,即
仍存活的受試者。基于這些數據集,我們可創建一個“超級預測數據集”(super prediction dataset),并建立超級預測模型[9]:
![]() |
相比于標準界標模型,縱向協變量的回歸系數為平滑函數,依賴于界標時間。
的存在也使得基線風險隨界標時間平滑變化,不需要針對每個界標時間假設不同的基線風險。換而言之,β與θ函數的存在將多個獨立的Cox模型平滑地拼接組成一個整體,并可通過調整θ的函數形式,比如指示函數或線性函數[9],優化模型的預測性能。對于超級預測模型,參數估計采用偽偏對數似然估計法(pseudo partial log-likelihood)[22]。超級預測模型可進一步擴展為非風險比例模型[26],或應用于病因別的風險競爭模型[27]。
1.2.3 結果解讀
界標模型估計的預測因素的風險比(hazard ratio,HR)是從界標時間開始至預測終點
的平均風險比
,而非
時刻的瞬時風險比,因此,估計暴露因素與特定時間點結局間的關聯時,界標分析只能給出間接結果[28]。例如,當設定界標時間為1年,預測終點為3年,通過界標模型可估計1~3年這2年內的平均風險比
;當設定界標時間為2年且預測終點不變,若估計的平均風險比
小于
,則可推斷:預測因子在1~2年間對結局發生風險的影響比在2~3年間更大。
1.2.4 應用場景
界標分析通過設定界標時間無偏估計生存概率,其應用場景根據研究目的可分成3種:時間-事件概率估計、風險比估計與統計檢驗、基于界標時間的受試者分類[29]。前兩種在動態預測研究中較常見,第三種多用來解決真實世界隊列研究中存在的永恒時間偏差(immortal time bias)問題[20]。
1.2.5 優缺點
界標法優點有:① 前提假設較少。通過選取界標時間點使每段界標時間內滿足PH假設,從而解決整體PH假設不成立的問題。界標法不考慮協變量的測量誤差,因此不需要數據滿足與誤差相關的隨機效應假設。此外,與聯合模型相比,界標模型無需假定變量的變化軌跡函數[30]。② 計算量及復雜度低。基于分段的縱向信息和較少的假設進行參數估計,降低計算量和復雜性,更容易實現。③ 可處理新增變量與風險人群集變化。不同時間點的風險人群集與混雜因素都可能發生變化。采用基線預測因子的高危患者預測模型只適用于基線的研究人群,當需要對隨訪期間某個時間點未發生結局事件的患者進行再次預測時,原來的預測模型并不適用,因為基線與該時間點的高危人群可能不同,一些受試者可能因結局事件或其他原因而退出[31]。同時,隨訪過程中也會出現基線或研究開始時未出現的混雜因素。界標模型可通過分段建模,在每個界標時間建立特定的風險人群集,并通過改變每段模型納入的預測因子,以消除混雜因素和風險人群集改變對預測結果產生的影響。
界標法缺點有:① 界標時間點選擇隨意。目前關于界標時間點的設定缺少統一的標準[3],實際中往往根據研究實際情況(如有臨床意義的時間)設置。如:根據高危人群的變化節點來設定界標時間[32]或將隨訪時間點設定為界標時間,這使得界標法預測結果存在數據驅動的可能性[31]。同時,對于沒有明確定義基線時間或左刪失的數據信息,界標時間點的選擇和模型的建立都存在挑戰[22]。② 可能導致偏倚的因素較多,如界標模型不考慮測量誤差,由于觀察值和真實值存在差異從而導致偏倚。
1.2.6 軟件實現
由于標準界標方法只需要將Cox模型的風險人群集劃分成不同的子集,因此,所有可實現Cox回歸的工具均可開展界標分析[14],實施簡便。比如R語言的dypred和coxph函數,這兩個函數亦可實現超級預測模型;SAS中PROC PHREG或SPSS基于不同界標時間分別構建Cox回歸模型等。
1.3 貝葉斯動態模型
貝葉斯動態模型主要可分為2類:一類是利用貝葉斯算法替代限制性最大似然參數估計方法(restricted maximum likelihood estimation,RMLE)進行參數估計,如貝葉斯聯合模型(Bayesian joint model)。另一類是利用與界標法相似的核心思想,將時間分段,通過前一時段的參數分布(先驗)和當前數據獲得后一時段參數的分布(后驗),實現動態預測,如貝葉斯動態生存模型(Bayesian dynamic survival model,BDSM)[33]。
貝葉斯聯合模型作為聯合模型的一種改進,使得模型能夠通過參數的先驗分布納入既往研究的信息,提高參數估計精度及可解釋性[34]。該方法主要用來估計未知的固定效應系數和子模型間的關聯參數[35],但也有研究使用該方法估計縱向模型中的隨機效應參數,為描述縱向軌跡提供更大的靈活度。
貝葉斯動態生存模型最早由Gamerman在20世紀80年代末提出[33],使用貝葉斯估計界標模型中縱向變量的系數,根據設定的界標時間點,利用前一時間段時變系數分布(先驗)估計后一時段系數分布(后驗),并計算生存函數。對于BDSM,個體i的風險函數與界標模型相同,見公式(7),并采用貝葉斯理論估計模型中的參數及基線風險函數。
貝葉斯方法的核心問題就是對動態模型的參數估計。參數的先驗估計、后驗的平均值及參數的演化關系通常是由MCMC算法實現的,該算法將隨機效應視作刪失數據[36],并通過不同的抽樣方法從后驗分布中抽取樣本,觀察其穩定分布[35]。然而,貝葉斯動態生存模型結構復雜、參數量大及參數間存在關聯性,在實際應用中存在收斂問題(converging problem)[37]。針對該收斂問題,目前主要有2種解決方法:塊狀抽樣(block sampling)和Metropolis-Hastings算法[38]。
2 模型比較
上述動態預測模型方法均可彌補靜態模型無法隨預測因子變化而變化的不足,其中貝葉斯動態模型是依賴于其他模型和貝葉斯算法的一類模型,因此這里僅對聯合模型(以共享隨機效應模型為例)與界標模型進行比較,它們在使用的信息量、模型假設、計算復雜度[30]和應用范圍[24]等均有不同,具體見表1。

3 案例分析
3.1 聯合模型案例
3.1.1 數據來源
對伊拉斯謨大學醫學中心的275例主動脈瓣或主動脈根部置換術后存活的患者進行21年的隨訪[39]。收集所有患者每2.5年的瓣膜功能(主動脈梯度)的數據,共進行1 228次超聲心動圖測量,主動脈梯度(mmHg)為連續變量,結局指標為再手術和死亡。
3.1.2 研究方法
擬使用重復測量的瓣膜功能數據預測患者生存情況,同時對僅使用最后一次測量數據的Cox模型和考慮到主動脈瓣功能變化而采用重復測量數據的聯合模型進行比較[39]。
3.1.3 結果分析
如表2所示,對于再手術風險,Cox模型顯示較高的主動脈梯度與再手術的風險增加有關。然而在聯合模型中,主動脈梯度與再手術風險之間的關聯強度更大。對于死亡風險,Cox模型顯示年齡大和主動脈梯度低與死亡風險增加有關。而在聯合模型中,主動脈梯度與死亡風險沒有顯著性關聯。

3.1.4 討論
心臟瓣膜介入治療后發生死亡或再手術的風險是臨床關注重點,本例中Cox模型忽略患者主動脈瓣功能術后的可能變化,從而引入偏倚;而術后相關參數的重復測量數量帶有疾病進展的重要信息,故考慮使用聯合模型可更準確地分析重復測量的主動脈瓣膜功能對預后的影響。
3.2 界標模型案例
3.2.1 數據來源
糖尿病預防計劃收集的1 027例接受二甲雙胍干預的2型糖尿病高危人群的數據[40]。其中,實驗室數據包含基線、基線后6個月及基線后5年每年隨訪時的空腹血糖和血紅蛋白測量值。計算基線及其后各時點測量的實驗室數值與基線時的變化值用于模型預測。
3.2.2 研究方法
擬基于人口學、實驗室數據等構建2型糖尿病高危個體的預測模型[40]。分別建立靜態Cox模型(基于基線數據)和動態界標模型(基于多次隨訪數據),并比較兩種模型的預測能力(免于糖尿病的存活)。動態界標模型中界標時間點設定為基線、基線后1、2、3年,預測的時間范圍設為2年。使用受試者工作特征曲線下面積評估模型區分度,Brier分數和Hosmer-Lemeshow檢驗評價模型校準度,并使用重分類改善指數(net reclassification improvement,NRI)量化模型預測差異。
3.2.3 結果分析
Hosmer-Lemeshow檢驗顯示各個界標時點界標模型擬合度均較好(P值>0.05),而靜態模型存在擬合度不理想的情況。2年和3年界標模型的Brier分數低于靜態模型,且差異具有統計學意義,提示預測校準度更好。雖然AUC和NRI結果亦顯示界標模型更優,但與靜態模型差異無統計學意義(表3)。

3.2.4 討論
該案例使用隨訪期間多次空腹血糖和血紅蛋白的測量值,構建動態界標預測模型,結果顯示其預測性能(尤其校準度)優于靜態模型,能夠改善靜態模型“校準度漂移”的問題,有助于針對個體進行更精準的臨床決策,具有臨床意義。此外,界標模型考慮到不同的界標時間點處于風險中人群的變化。
4 展望
動態預測模型能夠利用變量的時變信息更新風險預測結果,對動態精準識別高風險個體和及時采取干預措施有重要價值。國內目前關于動態預測模型的介紹和應用還較少,隨著醫療大數據的發展,其在醫學研究中會得到更廣泛的應用。本文從方法學角度介紹和比較了現有的3種動態預測方法,以期為動態預測模型的未來應用提供方法學參考。
風險預測模型(risk prediction model)是醫學研究中的熱點,其基于個體或患者現有信息,預測未來時點感興趣的結局事件發生的風險[1]。風險預測模型不僅可指導臨床實踐,如對心血管疾病的高風險人群早期給予降脂治療預防心血管重大事件發生[2];還可用于群體水平的疾病防控,指導公共衛生決策,如提倡戒煙限酒、合理膳食等。目前,不論是預測疾病發生風險或預后風險,從統計的角度,已構建的風險預測模型多為靜態模型(static model),指僅使用個體單一時間截面的信息預測未來某一時點結局事件的風險[3]。靜態模型通常使用基線(如個體研究入組、患者確診或開始治療等具有臨床意義的時間點采集)的預測因子數據(個體特征、診療信息等),并借助合適的統計學模型(如logistic模型或Cox模型等)將基線數據與結局事件關聯起來。但是,越來越多的研究顯示靜態風險預測模型存在諸多不足[4-7]。
首先,預測因子會隨時間變化。在疾病進展過程中預測因子往往并非恒定,而是呈現動態變化軌跡;但靜態模型僅使用單一時點數據,是一次性校準的模型。因此,靜態模型無法利用預測因子的縱向變化更新預測結果,可能導致延遲甚至錯誤的決策。其次,預測因子與結局的關聯可能會改變,而靜態模型如Cox模型則需滿足比例風險(proportional hazard,PH)假定,即預測因素對結局的影響隨時間保持恒定,當PH假定不成立時可能產生具有誤導性或錯誤的結論[7]。另外,隨訪過程中可能出現高預測價值的新因素,會削弱基線因素與結局的關聯導致預測有偏。總體而言,靜態模型無法處理上述隨時間推移而產生的諸多變化,導致預測性能降低,常表現為校準度欠佳,被稱為“校準漂移”(calibration drift)[8]。
針對靜態預測模型的不足,有研究者提出通過聯合預測因子的基線和縱向數據捕捉個體特征隨時間變化的動態預測模型(dynamic prediction model)[9],這類模型可使用隨訪獲取的預測因子數據更新風險預測值,實現動態預測。與靜態模型相比,其優勢主要有2點:① 提高預測精度[10-12];② 描繪個體風險隨時間的動態軌跡[3]。既往研究顯示,即使是基于電子健康檔案(更易獲取縱向數據)的預測模型研究,僅不到9%考慮了預測因子的時變性[10]。近年來動態預測模型在醫學研究中受到廣泛關注,但國內尚缺乏其應用,亦未見系統的方法學介紹。通過系統檢索與回顧現有動態預測模型相關研究,本文介紹和比較目前常用的動態預測模型方法:聯合模型方法(joint modeling approach,JM)、界標法(landmark analysis approach)和貝葉斯動態模型(Bayesian dynamic model),旨在為未來動態預測模型的應用研究提供方法學參考。
以“dynamic Bayesian model”、“dynamic prediction model”和“dynamic prediction”為關鍵詞在PubMed上進行檢索,限制查詢框為標題/摘要,檢索時限從建庫至2021年10月19日,檢索到298篇英文文獻,追溯參考文獻檢索另外發現25篇文獻,共計323篇。對去重后的263篇文獻進行篩選,剔除無關文獻,最終納入189篇文獻,其中方法學相關文章83篇,應用類文章106篇,文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
1 模型介紹
1.1 聯合模型方法
1.1.1 基本原理
聯合模型方法是分別對重復測量的縱向數據和時間-事件的生存數據建模,并通過一定的關聯結構/函數“連接”2個子模型。最早在1997年由Wulfsohn和Tsiatis提出,用于同時處理艾滋病研究中的重復測量的CD4+T淋巴細胞計數和生存數據[13],是目前最常用的動態預測模型之一。隨后經過擴展,多用于腫瘤患者的預后研究中分析重復測量的生物標志物數據,代表性研究如Taylor等人[14]利用前列腺癌癥患者的前列腺特異性抗原數據,通過聯合模型來動態預測接受放療后患者前列腺癌復發情況。其中共享隨機效應模型(shared random effects model,SREM)目前應用較多,通過共享隨機效應連接線性混合模型和Cox比例風險模型(proportional hazards model)[15],除常見的共享隨機效應模型,聯合模型還存在其他形式,常見的關聯結構如時依斜率、累計效應等[16]。但值得注意的是,大部分的模型優化僅針對縱向子模型[15]。本文以SREM為例進行介紹。
1.1.2 模型構建與參數估計
假設每個受試者存在理想化數據
,其中
是事件時間,
是基線協變量的向量,
是所有時間u≥0時的縱向反應過程,基于這些數據及衍生變量可得出:① 闡明縱向反應的變化模式,例如用
和
估計平均縱向反應的特性及其與協變量的關系;② 闡明縱向過程、生存和協變量之間的關聯,例如用比例風險模型描述
之間的關系。但實際模型構建時往往更復雜,例如涉及到時間u的縱向反應,對于受試者i的數據收集往往并非連續性,而是間斷性在時間集合
上收集,且
;觀測值
與真實值
間存在誤差
,但實際使用時只考慮將觀測值
代入計算;因刪失情況存在而不能收集到所有受試者的
等[15]。因此在實際情況下,通過以下設定來構建聯合模型:
![]() |
表示第i個受試者被觀察到的事件發生時間,
為刪失時間;
為事件發生指標,其中I為指數函數。
![]() |
表示在時間集合上收集的縱向數據
且
。
聯合模型由兩個關聯的子模型組成:一個包括縱向反應過程;另一個包括事件時間
。其聯合分布的觀測數據集可表示為:
,且
被認為是獨立于每個受試者i的,表明對每個受試者來說疾病發展過程是獨立的。
對于縱向反應過程,一個標準的方法是用特定受試者與時間無關的隨機效應的向量來描述
的特征。一般形式可表示為:
![]() |
其中是關于時間u的函數向量,可假設為線性函數或非線性函數[15]。這種普遍的形式規定了理想狀態下縱向過程應遵循一個平滑的軌跡。此外,也會考慮在公式中加入一個獨立于
和
(即基線協變量的q維向量)的
項,且
是均值為0的隨機過程,有助于更精確地捕捉軌跡的特征,但實施起來更為復雜,因此多數文獻中都集中采用公式(1)的形式。
對于事件時間,常用Cox比例風險模型來描述,也可被定義為包括隨機效應作為預測因素的模型。在標準比例風險模型中,假設協變量與時間無關,那么Cox比例風險模型為:
![]() |
代表基線風險函數,
為治療相關指標、疾病史等,
為對應的回歸系數向量。在實際應用中,通過加入與時間相關的關聯參數使縱向過程與生存過程相連接。
最常見的聯合模型是共享隨機效應模型,其中縱向子模型一般用線性混合模型來定義。取個體,設
,
,
,
與前文定義一致。
為固定效應矩陣的行向量,β為對應的固定效應的系數,
為隨機效應矩陣的行向量,
為對應的隨機效應的系數,服從均值為0,非結構化協方差矩陣為∑的多變量正態分布。
是殘余誤差的向量且假定為獨立的正態分布,其方差矩陣為
,且假定殘余誤差與隨機效應無關。觀察到的縱向結果值用
表示,則公式如下:
![]() |
令縱向子模型中的,則
,表示
到時間點t之前縱向過程的記錄。假定α是縱向數據的回歸系數,關聯參數,即假設在時間t事件發生的風險取決于真實的縱向軌跡
,通過其在時間t的值,可將2個子模型聯系起來。那么對于生存子模型,將Cox比例風險模型擴展為含有與時間相關的變量的模型,也叫做Andersen-Gill模型,公式如下:
![]() |
α的大小表示縱向數據與風險函數關聯性的強弱。若α=0,則聯合模型將簡化為兩個獨立的模型。具體來說,表示基線協變量
每增加1個單位的風險比,而
表示
每增加1個單位的風險比。
構建一般Cox比例風險模型時,通常不指定基線風險函數,避免錯誤指定生存時間分布而帶來的影響。而聯合模型中,需要明確地定義
,常用的有已知參數分布的風險函數、分段常數等[13]。
聯合模型參數估計的方法主要是限制性極大似然方法(restricted maximum likelihood method,REML)和馬爾可夫鏈蒙特卡洛(Markov Chain Monte Carlo algorithm,MCMC)的貝葉斯方法,本文主要對共享隨機效應模型常使用的限制性極大似然方法進行介紹。
關于限制性極大似然方法,假設與時間無關的隨機效應的系數 為縱向數據和生存數據聯合的基礎,則在隨機效應模型中,可解釋縱向數據和生存數據之間的關聯,也可解釋縱向數據中重復測量結果之間的相關性[16]。可得到似然函數公式(5)。
θ為縱向子模型和生存子模型中的定義的全部參數向量。其中是縱向結果
的概率密度函數且均數為
,協方差為
。
是隨機效應
的概率密度函數且均數為0,協方差為
。
是生存子模型中在觀察時間
定義的風險函數。由此,可通過迭代算法獲得最大似然估計,例如EM或Newton-Raphson算法[17]。
另外,還可從聯合模型得到個體結局發生風險的動態預測。根據截至時間s收集到的事件結果、協變量
和
,通過蒙特卡羅方法近似定義中的后驗分布可預測個體在時間s和s+t之間的事件發生概率,在本文中不再進行更加詳細的公式介紹。
1.1.3 結果解讀
與一般模型類似,獲得模型參數估計值后,可判斷協變量和事件之間是否存在顯著關聯,即根據協變量的系數的P值是否小于0.05。如果P<0.05,則可認為存在顯著關聯,聯合模型中該協變量的單位增加對應相應事件發生風險增加
倍。
1.1.4 應用場景
應用聯合模型的數據特點主要為:① 存在數據重復測量的過程;② 縱向數據測量的過程和生存過程之間存在潛在關系。聯合模型大部分可能的形式擴展多存在于縱向子模型中,往往需要對數據做相應假設來滿足模型的使用條件進而應用在更多領域。
1.1.5 優缺點
與在Cox模型中運用依時協變量相比,聯合模型方法具有以下優點[3,18]:① 可同時對縱向數據和生存數據建模。② 考慮了重復測量過程中被感興趣事件截斷的情況,并處理了縱向結果的變異性。③ 生存結果和重復測量的軌跡之間可存在更復雜的關聯,比如因果關聯、在縱向模型中包括樣條式或者分數多項式等。
但聯合模型法需要一些簡單的假設作為前提(如比例風險、隨機效應的數量等),而實際情況的假設和參數估計往往更加復雜,若要分析更大的數據集,需要進一步研究開發除MCMC和極大似然以外的更合適的參數估計的方法[19],因此在實踐中可能仍然難以廣泛應用,這會增加模型參數估計和預測的計算需求。
1.1.6 軟件實現
R語言中,JM、joineR和JMbayes都可用于擬合聯合模型;SAS中可采用PROC NLMIXED進行擬合;Stata中可運用stjm命令擬合基本的聯合模型。
1.2 界標法
1.2.1 基本原理
界標法也是動態生存分析常用方法之一,最初由Anderson等人[20]在1983年引入臨床腫瘤學研究,作為存在時依協變量的Cox模型的一種替代方法,評估復發的晚期癌癥患者的治療效果。隨后van Houweilingen[21-22]將該模型推廣至縱向數據的動態生存分析,補充改進了參數估計并提出超級模型的概念,并應用于急性淋巴性白血病患者骨髓移植后的生存預后研究。界標法是在隨訪期間指定一個界標時間點(landmark time),針對在界標時間點存活或仍有風險的個體組成的子樣本建立生存模型(如Cox比例風險模型),預測界標時間點后的生存概率[23]。簡單來說,界標法將界標
![]() |
時間點之前的所有死亡或發生結局事件的個體剔除并假定在設定的界標時間段內自變量對結局風險的影響恒定。界標時間點可設置1個或多個,基于每個界標時間點建立風險人群集,進行生存分析,形成由多個預測模型組成的超級預測模型(super prediction model)[24],使得預測的風險比率隨界標時間的變化而平穩地變化,并提高條件生存概率估計的準確性和合理性。一般來說,界標點的選擇取決于研究目的[3]和預測的時間范圍(prediction horizon),即界標時間點與預測終點的時間間隔。當時間間隔過小,則為短期預測,不適用于慢性疾病;若時間間隔過大,則為長期預測,對于縱向信息變化敏感的臨床事件難以實現準確預測[25]。
1.2.2 模型構建與參數估計
對于受試者i,設,
,
,
,
與公式(2)中定義一致,
為縱向或依時變量,
表示隨訪
時該受試者的縱向變量的值,且X與Z所含變量相互獨立。基于預先設定的界標時間
和預測窗口
(prediction window),選擇在
時處于風險狀態的人群,建立預測風險人群集
,在對
時段后發生的事件做刪失處理后,預測
至
時段個體事件發生的風險。界標法采用Cox回歸模型,數學表達式為:
![]() |
仍為風險函數,但為基于界標時間
,t時刻的條件函數,根據界標時間的基線風險估計得到。與聯合模型不同,通常不需要指定其分布。
公式(7)中的值由所含變量和界標時間決定。由于縱向變量的重復測量時間并不一定恰好在界標時間點上,
進入模型的取值有2種:使用界標時間點或界標時間點前的最近一次觀察值,即樸素界標模型(na?ve landmark model)[14],但該方法并未考慮縱向變量從基線到
時的變化軌跡和
前最后一次測量值與
的時間差。所以,另一種方法為二階段界標模型(two-stage landmark model),首先利用線性混合模型估計
時
的取值[14],建立滿足條件的受試者數據集
,并采用偏似然法(partial likelihood)估計參數擬合Cox模型。利用Breslow估計,可得到
時存活的受試者j和至少存活到
時的個體動態生存概率
[6]:
![]() |
其中,
![]() |
當考慮多個界標時間時,重復上述過程,針對每個界標時間
,建立相應的預測數據集
,即
仍存活的受試者。基于這些數據集,我們可創建一個“超級預測數據集”(super prediction dataset),并建立超級預測模型[9]:
![]() |
相比于標準界標模型,縱向協變量的回歸系數為平滑函數,依賴于界標時間。
的存在也使得基線風險隨界標時間平滑變化,不需要針對每個界標時間假設不同的基線風險。換而言之,β與θ函數的存在將多個獨立的Cox模型平滑地拼接組成一個整體,并可通過調整θ的函數形式,比如指示函數或線性函數[9],優化模型的預測性能。對于超級預測模型,參數估計采用偽偏對數似然估計法(pseudo partial log-likelihood)[22]。超級預測模型可進一步擴展為非風險比例模型[26],或應用于病因別的風險競爭模型[27]。
1.2.3 結果解讀
界標模型估計的預測因素的風險比(hazard ratio,HR)是從界標時間開始至預測終點
的平均風險比
,而非
時刻的瞬時風險比,因此,估計暴露因素與特定時間點結局間的關聯時,界標分析只能給出間接結果[28]。例如,當設定界標時間為1年,預測終點為3年,通過界標模型可估計1~3年這2年內的平均風險比
;當設定界標時間為2年且預測終點不變,若估計的平均風險比
小于
,則可推斷:預測因子在1~2年間對結局發生風險的影響比在2~3年間更大。
1.2.4 應用場景
界標分析通過設定界標時間無偏估計生存概率,其應用場景根據研究目的可分成3種:時間-事件概率估計、風險比估計與統計檢驗、基于界標時間的受試者分類[29]。前兩種在動態預測研究中較常見,第三種多用來解決真實世界隊列研究中存在的永恒時間偏差(immortal time bias)問題[20]。
1.2.5 優缺點
界標法優點有:① 前提假設較少。通過選取界標時間點使每段界標時間內滿足PH假設,從而解決整體PH假設不成立的問題。界標法不考慮協變量的測量誤差,因此不需要數據滿足與誤差相關的隨機效應假設。此外,與聯合模型相比,界標模型無需假定變量的變化軌跡函數[30]。② 計算量及復雜度低。基于分段的縱向信息和較少的假設進行參數估計,降低計算量和復雜性,更容易實現。③ 可處理新增變量與風險人群集變化。不同時間點的風險人群集與混雜因素都可能發生變化。采用基線預測因子的高危患者預測模型只適用于基線的研究人群,當需要對隨訪期間某個時間點未發生結局事件的患者進行再次預測時,原來的預測模型并不適用,因為基線與該時間點的高危人群可能不同,一些受試者可能因結局事件或其他原因而退出[31]。同時,隨訪過程中也會出現基線或研究開始時未出現的混雜因素。界標模型可通過分段建模,在每個界標時間建立特定的風險人群集,并通過改變每段模型納入的預測因子,以消除混雜因素和風險人群集改變對預測結果產生的影響。
界標法缺點有:① 界標時間點選擇隨意。目前關于界標時間點的設定缺少統一的標準[3],實際中往往根據研究實際情況(如有臨床意義的時間)設置。如:根據高危人群的變化節點來設定界標時間[32]或將隨訪時間點設定為界標時間,這使得界標法預測結果存在數據驅動的可能性[31]。同時,對于沒有明確定義基線時間或左刪失的數據信息,界標時間點的選擇和模型的建立都存在挑戰[22]。② 可能導致偏倚的因素較多,如界標模型不考慮測量誤差,由于觀察值和真實值存在差異從而導致偏倚。
1.2.6 軟件實現
由于標準界標方法只需要將Cox模型的風險人群集劃分成不同的子集,因此,所有可實現Cox回歸的工具均可開展界標分析[14],實施簡便。比如R語言的dypred和coxph函數,這兩個函數亦可實現超級預測模型;SAS中PROC PHREG或SPSS基于不同界標時間分別構建Cox回歸模型等。
1.3 貝葉斯動態模型
貝葉斯動態模型主要可分為2類:一類是利用貝葉斯算法替代限制性最大似然參數估計方法(restricted maximum likelihood estimation,RMLE)進行參數估計,如貝葉斯聯合模型(Bayesian joint model)。另一類是利用與界標法相似的核心思想,將時間分段,通過前一時段的參數分布(先驗)和當前數據獲得后一時段參數的分布(后驗),實現動態預測,如貝葉斯動態生存模型(Bayesian dynamic survival model,BDSM)[33]。
貝葉斯聯合模型作為聯合模型的一種改進,使得模型能夠通過參數的先驗分布納入既往研究的信息,提高參數估計精度及可解釋性[34]。該方法主要用來估計未知的固定效應系數和子模型間的關聯參數[35],但也有研究使用該方法估計縱向模型中的隨機效應參數,為描述縱向軌跡提供更大的靈活度。
貝葉斯動態生存模型最早由Gamerman在20世紀80年代末提出[33],使用貝葉斯估計界標模型中縱向變量的系數,根據設定的界標時間點,利用前一時間段時變系數分布(先驗)估計后一時段系數分布(后驗),并計算生存函數。對于BDSM,個體i的風險函數與界標模型相同,見公式(7),并采用貝葉斯理論估計模型中的參數及基線風險函數。
貝葉斯方法的核心問題就是對動態模型的參數估計。參數的先驗估計、后驗的平均值及參數的演化關系通常是由MCMC算法實現的,該算法將隨機效應視作刪失數據[36],并通過不同的抽樣方法從后驗分布中抽取樣本,觀察其穩定分布[35]。然而,貝葉斯動態生存模型結構復雜、參數量大及參數間存在關聯性,在實際應用中存在收斂問題(converging problem)[37]。針對該收斂問題,目前主要有2種解決方法:塊狀抽樣(block sampling)和Metropolis-Hastings算法[38]。
2 模型比較
上述動態預測模型方法均可彌補靜態模型無法隨預測因子變化而變化的不足,其中貝葉斯動態模型是依賴于其他模型和貝葉斯算法的一類模型,因此這里僅對聯合模型(以共享隨機效應模型為例)與界標模型進行比較,它們在使用的信息量、模型假設、計算復雜度[30]和應用范圍[24]等均有不同,具體見表1。

3 案例分析
3.1 聯合模型案例
3.1.1 數據來源
對伊拉斯謨大學醫學中心的275例主動脈瓣或主動脈根部置換術后存活的患者進行21年的隨訪[39]。收集所有患者每2.5年的瓣膜功能(主動脈梯度)的數據,共進行1 228次超聲心動圖測量,主動脈梯度(mmHg)為連續變量,結局指標為再手術和死亡。
3.1.2 研究方法
擬使用重復測量的瓣膜功能數據預測患者生存情況,同時對僅使用最后一次測量數據的Cox模型和考慮到主動脈瓣功能變化而采用重復測量數據的聯合模型進行比較[39]。
3.1.3 結果分析
如表2所示,對于再手術風險,Cox模型顯示較高的主動脈梯度與再手術的風險增加有關。然而在聯合模型中,主動脈梯度與再手術風險之間的關聯強度更大。對于死亡風險,Cox模型顯示年齡大和主動脈梯度低與死亡風險增加有關。而在聯合模型中,主動脈梯度與死亡風險沒有顯著性關聯。

3.1.4 討論
心臟瓣膜介入治療后發生死亡或再手術的風險是臨床關注重點,本例中Cox模型忽略患者主動脈瓣功能術后的可能變化,從而引入偏倚;而術后相關參數的重復測量數量帶有疾病進展的重要信息,故考慮使用聯合模型可更準確地分析重復測量的主動脈瓣膜功能對預后的影響。
3.2 界標模型案例
3.2.1 數據來源
糖尿病預防計劃收集的1 027例接受二甲雙胍干預的2型糖尿病高危人群的數據[40]。其中,實驗室數據包含基線、基線后6個月及基線后5年每年隨訪時的空腹血糖和血紅蛋白測量值。計算基線及其后各時點測量的實驗室數值與基線時的變化值用于模型預測。
3.2.2 研究方法
擬基于人口學、實驗室數據等構建2型糖尿病高危個體的預測模型[40]。分別建立靜態Cox模型(基于基線數據)和動態界標模型(基于多次隨訪數據),并比較兩種模型的預測能力(免于糖尿病的存活)。動態界標模型中界標時間點設定為基線、基線后1、2、3年,預測的時間范圍設為2年。使用受試者工作特征曲線下面積評估模型區分度,Brier分數和Hosmer-Lemeshow檢驗評價模型校準度,并使用重分類改善指數(net reclassification improvement,NRI)量化模型預測差異。
3.2.3 結果分析
Hosmer-Lemeshow檢驗顯示各個界標時點界標模型擬合度均較好(P值>0.05),而靜態模型存在擬合度不理想的情況。2年和3年界標模型的Brier分數低于靜態模型,且差異具有統計學意義,提示預測校準度更好。雖然AUC和NRI結果亦顯示界標模型更優,但與靜態模型差異無統計學意義(表3)。

3.2.4 討論
該案例使用隨訪期間多次空腹血糖和血紅蛋白的測量值,構建動態界標預測模型,結果顯示其預測性能(尤其校準度)優于靜態模型,能夠改善靜態模型“校準度漂移”的問題,有助于針對個體進行更精準的臨床決策,具有臨床意義。此外,界標模型考慮到不同的界標時間點處于風險中人群的變化。
4 展望
動態預測模型能夠利用變量的時變信息更新風險預測結果,對動態精準識別高風險個體和及時采取干預措施有重要價值。國內目前關于動態預測模型的介紹和應用還較少,隨著醫療大數據的發展,其在醫學研究中會得到更廣泛的應用。本文從方法學角度介紹和比較了現有的3種動態預測方法,以期為動態預測模型的未來應用提供方法學參考。