目的驗證不同變量選擇方法對臨床預測模型性能的影響。方法從MIMIC數據庫中提取了3組樣本數據集(急性心肌梗塞組、膿毒癥組和腦出血組),用COX回歸的直接進入、逐步向前、逐步向后、LASSO、嶺回歸、基于隨機森林的變量重要性六種方法,選出的不同方法的最優變量集構建模型,通過C指數、受試者工作特征曲線下面積(AUC值)和校準曲線,比較組內和組間的結果差異。結果6種變量選擇方法篩選的變量及數目各不相同,但不管是組內還是組間,并沒有顯示出哪種方法有明顯提高模型性能的優勢。結論在使用變量選擇方法建立臨床預測模型前應首先明確研究目的并判斷數據的類型,結合醫學知識選擇合適的方法。