• 第三軍醫大學新橋醫院循證醫學與臨床流行病學中心(重慶 400037);
導出 下載 收藏 掃碼 引用

目的探討多因素Logistic回歸分析中自變量篩選及逐步回歸方法選擇應注意的問題。方法針對冠心病危險因素病例對照調查數據(年齡X1、高血壓史X2、高血壓家族史X3、吸煙X4、高血脂史X5、動物脂肪攝入X6、體重指數X7、A型性格X8、冠心病Y),采用6種逐步回歸變量篩選方法,進行多因素Logistic回歸分析,比較不同方法篩選危險因素的差異性。結果單因素分析可見,冠心病組與非冠心病組的年齡分布無明顯差異(P=0.116),而多因素Logistic回歸分析顯示,相對于65歲以上人群,低年齡組為保護因素[OR<45=0.100,(0.000,0.484),P=0.020;OR45~54=0.051,(0.003,0.975),P=0.048]。將年齡定義為分類變量進行分析,篩選出的冠心病危險因素為動物脂肪攝入X6、A型性格X8、高血壓史X5和年齡X1P<0.05);同時將年齡X1當作連續性變量進行分析,結果顯示年齡X1無統計學意義(P=0.053)。6種逐步回歸變量篩選方法得到的共同的危險因素是動物脂肪攝入X6、A型性格X8;向前-條件、向前-LR、向前-Wald法另篩選出高血脂史X5為危險因素;向后-條件、向后-LR法另篩選出高血壓家族史X3和年齡X1為危險因素,向后-Wald法篩另篩選出高血壓史X2為危險因素。結論多因素Logistic回歸分析應采用逐步回歸方法,對全部變量進行分析,包括單因素分析無統計意義的自變量;把多分類變量當作連續性變量進行分析,會損失部分信息,甚至可能漏掉重要的危險因素;當幾種逐步回歸變量篩選方法得到的危險因素不同時,最好結合臨床和流行病學的意義以及生物學機制等專業知識,選擇較為合理的結果。

引用本文: 許汝福. Logistic回歸變量篩選及回歸方法選擇實例分析. 中國循證醫學雜志, 2016, 16(11): 1360-1364. doi: 10.7507/1672-2531.20160205 復制

  • 上一篇

    大鼠燒傷模型構建實驗的系統評價