引用本文: 文天才, 劉保延, 張艷寧. 缺血性腦卒中患者 31 天內非計劃性再入院風險因素研究:隨機森林模型. 中國循證醫學雜志, 2019, 19(5): 532-538. doi: 10.7507/1672-2531.201809094 復制
據世界衛生組織報告,腦卒中在全球死亡原因中排名第二位,2016 年約 600 萬人死于腦卒中[1]。另據《中國心血管病報告 2017》報告,中國現患腦卒中患者約 1 300 萬[2]。2015 年我國因腦出血和腦梗死發生的平均住院費用分別為 1.71 和 0.92 萬元[3],比 2004 年上升 18.9% 和 24.96%,為社會和家庭帶來沉重的經濟負擔[4]。而腦卒中患者短期內的非計劃再入院不僅導致更多的醫療支出,還會導致更高的患者死亡風險[5, 6]。
對于腦卒中患者來說,發生 31 天內非計劃性再入院可能意味著其在首次因腦卒中住院期間未達到良好的治療效果[7]。因此,國際上將非計劃性再入院作為評價醫療質量的有效指標[8]。我國衛生部發布的《三級綜合醫院醫療質量管理與控制指標(2011 版)》也明確將腦卒中 31 天內再入院率列為重點病程監測指標[9, 10]。腦卒中患者再入院原因通常包括二次中風、感染和心腦血管疾病等疾病相關因素[7, 11-13]。除此之外,一些社會和家庭因素(例如家庭財務狀況)也可能對腦卒中患者 31 天內非計劃性再入院有影響[14]。為此,本研究將從疾病相關因素、醫療環境、患者家庭因素等不同方面分析其對腦卒中患者 31 天內非計劃性再入院的影響。
目前對于危險因素的統計分析方法,常規使用 Logistic 回歸模型。但本研究中由于影響醫療過程的因素較多,且相互之間關系錯綜復雜,傳統的 Logistic 回歸在處理存在多重共線性數據資料時存在偏倚。而隨機森林算法作為新興的機器學習算法,具有可處理各類資料、自動偵測變量間交互作用、綜合考慮各因素對結局變量的影響并進行重要性評分等多重優勢[15]。因此,本研究選取北京市 24 家醫院缺血性腦卒中住院患者數據,采用隨機森林算法模型來分析患者個體特征、合并疾病、醫療環境和患者財務等各類因素對缺血性腦卒中患者 31 天內非計劃性再入院的影響。
1 資料與方法
1.1 數據來源
搜集 2015~2016 年期間首次因腦卒中在北京市 24 家醫院住院的患者住院病歷首頁數據。患者納入標準:① 入院時年齡在 18~100 歲之間;② 主要診斷為缺血性腦卒中(ICD-10 編碼 I63);③ 出院后追蹤 31 天內是否存在再次入院記錄,如有,其首要診斷必須是與腦卒中發病或后遺癥等有關的疾病;④ 排除首次腦卒中住院后死亡患者。
1.2 統計分析
1.2.1 單因素分析
采用 R 軟件 3.4.3 版本進行數據分析。按 31 天內有無非計劃性再入院記錄分為兩組。對分類變量進行卡方檢驗,對數值變量按其分布選擇參數或非參數檢驗。
1.2.2 多因素分析
將單因素分析結果中兩組差異有統計學(P<0.05)或臨床意義的變量納入多因素分析,利用 R 軟件包 random forest 4.6-12 構建隨機森林分類模型,并將 Logistic 回歸與隨機森林模型結果進行相互驗證。隨機森林模型的基本原理是通過自助法(bootstrap)重采樣技術,從不斷放回的原始數據集 N 中重復隨機抽取 n 個樣本生成新的數據集來構成決策樹,然后重復以上步驟生成 m 棵決策樹組成隨機森林,新數據的分類結果按每棵分類樹投票多少形成的分數而定。
在本研究中,隨機森林模型的構建過程:① 針對全部 m 個自變量,由系統分別隨機選取 1、2、3···m 個自變量,共建立 m 個模型,比較 m 個模型應變量(是否發生 31 天內非計劃再入院)的預測值與實際值,選擇錯誤率最小的取值 mi 作為模型分裂屬性 mtry 的參數值;② 以 mtry=mi 重新建立模型,觀察模型中決策樹的棵數 ntree 與模型錯誤率的關系,確定模型趨于穩定時的 ntree 值;③ 依據最終確定的 mtry 和 ntree 值訓練生成最終隨機森林模型;④ 利用隨機森林軟件包中自帶的 importance()函數對所有自變量的平均精確度和平均基尼系數進行分析,觀察并確定對 31 天內非計劃再入院最具影響的部分自變量;⑤ 利用 partialPlot()函數分析重要自變量對 31 天內非計劃再入院的邊際影響。
2 結果
2.1 數據整體情況
共收集到 3 473 例首次因缺血性腦卒中入院治療患者的數據,其中多數患者為男性、已婚、退(離)休人員。患者年齡中位數為 71 歲;醫療費用支付方式以城鎮職工基本醫療保險為主;大部患者在三級醫院就診;合并高血壓人數最多;住院天數中位數為 15 天;出院方式以醫囑離院或轉院為主。
2.2 單因素分析結果
將所有患者按是否發生 31 天內非計劃性再入院事件分為兩組,其中 960 例患者(27.64%)在 31 天內非計劃再入院。兩組患者年齡均主要分布在 60~80 歲,住院天數集中在 10~20 天,且均呈偏態分布(圖 1)。

卡方檢驗或 Mann-Whitney U 檢驗結果顯示,兩組患者在年齡、職業、醫療費用支付方式、就診醫院級別、合并疾病(糖尿病除外)、住院天數、是否使用臨床路徑、是否手術和出院方式方面均存在差異(表 1)。

2.3 多因素分析結果
2.3.1 不同影響因素的重要性
將單因素分析中兩組差異有統計學意義的自變量,包括年齡、職業、醫療費用支付方式、就診醫院級別、高血壓、脂代謝異常、心臟相關疾病、住院天數、是否使用臨床路徑、是否手術和出院方式納入多因素分析。同時考慮到不同入院途徑可能反映疾病的嚴重程度,而是否合并糖尿病在臨床上屬于腦卒中的危險因素,因此將不同入院途徑和是否合并糖尿病納入隨機森林模型進行建模。在隨機森林建模過程中,當分裂度 mtry=8 時模型錯誤率達到最小,當子數棵數 ntree=100 時模型趨于穩定。在最終建立的模型中,綜合各變量對于模型預測的精確度(>10)和基尼系數(>100)兩個參數可以看出,住院天數、年齡、醫療費用支付方式、醫院等級和職業這 5 個變量對缺血性腦卒中患者是否出現 31 天非計劃性再入院有較大影響(圖 2)。

2.3.2 不同影響因素的邊際影響
通過對上述 5 個最重要的影響因素進行邊際影響分析發現:① 當患者住院天數在 10 天以內時,住院時間越短風險越高;當住院天數在 10~30 天時,住院時間越長風險越高;當住院天數大于 30 天后,病情穩定再入院風險最低;② 當患者年齡小于 75 歲時,年齡越大風險越低,但 75 歲以后趨勢相反;③ 三級醫院就診患者再入院風險高于二級醫院就診患者;④ 公費醫療支付患者再入院風險更高,其次是自費、其他社會保險和其他費用支付方式;⑤ 從患者職業來看,企事業單位職工、工人和無業人員的 31 天非計劃性再入院風險排前三位(圖 3)。

醫院等級(2:二級,3:三級);醫療費用支付方式(1:城鎮職工基本醫療保險,2:城鎮居民基本醫療保險,3:新型農村合作醫療,4:公費,5:自費,6:其他社會保險,9:其他);職業[1:企事業單位職工,2:工人,3:農民,4:無業人員,5:退(離)休人員,9:其他]
2.3.3 Logistic 回歸與隨機森林模型結果比較
將同樣的因素納入 Logistic 回歸模型后,其結果與隨機森林分析結果相比,整體趨勢基本一致。對于年齡和住院天數兩個連續性變量,均隨著數值增加風險降低,與隨機森林模型中邊際影響分析結果一致。除醫療費用支付方式和職業中個別水平間相對風險與隨機森林結果有少量差異外,多數水平間差異與隨機森林分析結果一致。
3 討論
本研究結果顯示,住院天數長短對缺血性卒中患者再入院有著非常重要的影響,且呈非線性趨勢。即住院天數在一個月內時,10 天左右的住院患者出院后再入院風險最低,而住院天數更短或更長都會增加再入院風險。這種現象可能與缺血性腦卒中的自然病程有非常重要的關系。中華醫學會發布的腦梗死臨床路徑中,腦梗死患者的標準住院日一般為 7~10 天[16, 17],表明通過改善腦血管循環等常規治療 10 天后,大部分患者病情穩定并可達到臨床出院標準。但對于病情危重者,例如意識障礙、呼吸循環衰竭或因其它系統疾病既往病情加重等需要進入 ICU 或外科手術者其住院時間會相應延長。同時,住院時間過短將導致缺血性卒中并未得到良好治療,從而增加再入院風險,例如某些醫院為了提高病床周轉率而使患者提前出院[18, 19]。而對于首次住院超過 10 天、小于 30 天的患者,因其本身疾病病情較危重,也提高了其 31 天內非計劃再入院風險。另外,住院天數超過 30 天的患者基本集中在無 31 天內非計劃性再入院一組中,說明住院天數達到 30 天以后,其病情已趨于穩定,再入院風險達到最低。這也提示我們,雖然臨床路徑中規定腦卒中住院天數為 7~10 天,但在這個時點上達到臨床出院標準并不代表其病情已經完全穩定,還需要轉入下級醫院或康復機構來繼續治療或康復。對于離院后直接進行家庭護理的患者,應對家屬進行腦卒中護理培訓,以減少再入院的風險。
從患者年齡看,越年輕的患者再入院風險越高。其原因可能是這部份人群伴有腦卒中危險因素者的比例更高,例如高血壓、糖尿病、肥胖和吸煙史等[20-22]。據中國慢性病前瞻性研究項目[23]報告,35~39 歲人群中 12.6% 患有高血壓且未得到有效控制,18~39 歲人群中糖尿病知曉率僅為 5%,而在所有人群中糖尿病的治療和控制率也非常低[24]。2010 年一項中國成人煙草使用情況調查研究表明,2002~2010 年,40~59 歲人群的吸煙率增長了 70%,但其他年齡人群吸煙率并未發生明顯變化[25]。本研究發現,在有 31 天非計劃性再入院的人群中,60 歲以下人群所占比例(23.5%)要略高于無 31 天非計劃性再入院組(19.4%)。這提示我們應該加強對腦卒中高風險人群,尤其是年輕人群的早期教育和干預,使其認識到腦卒中對健康帶來的危害并及早改變不良生活方式和行為來降低再次腦卒中入院風險。
此外,醫院等級、醫療費用支付方式、職業和是否手術也影響 31 天非計劃再入院。本研究中,腦卒中患者多來自于三級醫院,三級醫院就診患者的病情程度往往較二級醫院更加危重,因此增加了其非計劃再入院風險。對于醫療費用支付方式,公費患者因其具有更高的醫療保障,在未限定住院日的情況下會趨向于住院時間更長[26],但在醫保規定有住院時間限制時,其可能通過短期內再入院以獲得更多醫療服務。對于職業而言,在職職工風險更高,可能與其年齡更小再入院風險越高有關。而農民的再入院風險較低可能與其經濟條件和主動就醫意識有關。目前各地區新型農村合作醫療中,住院費用報銷比例差別較大,二級醫院報銷比例約 30~40%,三級醫院約 20~30%,這對于例均治療費用上萬的腦卒中患者家庭來說,仍然是極大的負擔,可能使其因經濟負擔而放棄治療[27]。
本研究由于多個因素之間存在較為復雜的關系,例如住院天數和離院方式可能與患者的醫療付費方式相關,而醫療付費方式又與其職業相關。尤其是患者的醫療保障方式對其就醫行為有顯著影響,保障能力較弱的支付方式,如自費或新農合患者趨向于更節省費用的醫療行為[28],可能導致盡量減少住院天數或非醫囑離院。不同因素的交互作用會對多因素分析結果造成干擾,相較于 Logistic 回歸,隨機森林模型可不考慮因素之間的多重共線性問題[15]。同時,本研究實際上是一個分類問題,而隨機森林算法內部由多棵決策樹組成,更適宜于處理分類問題。另外,隨機森林也不需要對特征進行歸一化,有較強的抗干擾能力,可在大量缺失數據情況下進行數據分析。因此,利用隨機森林模型進行缺血性腦卒中患者 31 天非計劃性再入院風險分析,其結果具有更高的可靠性。
本研究的局限性。由于本研究數據均來源于病歷首頁數據,缺少有關缺血性腦卒中患者的人口學資料、病史、病程記錄和治療結局等詳細資料,可能對分析結果產生一定影響。這也提示未來研究要更多納入與疾病本身和治療過程有關的數據,以便為臨床和醫療管理決策提供更有價值的證據。
總之,本研究采用隨機森林模型分析影響缺血性腦卒中患者 31 天內非計劃再入院的危險因素,既包括疾病診療相關因素又包括社會環境因素。本研究結果提示對缺血性腦卒中患者出院標準的判定,要嚴格以病情是否穩定為依據,排除因醫院績效管理規定導致的再入院風險。同時,對于缺血性腦卒中的治療和護理,還應考慮其家庭和經濟等因素,避免非疾病因素對疾病治療效果產生的不利影響。
據世界衛生組織報告,腦卒中在全球死亡原因中排名第二位,2016 年約 600 萬人死于腦卒中[1]。另據《中國心血管病報告 2017》報告,中國現患腦卒中患者約 1 300 萬[2]。2015 年我國因腦出血和腦梗死發生的平均住院費用分別為 1.71 和 0.92 萬元[3],比 2004 年上升 18.9% 和 24.96%,為社會和家庭帶來沉重的經濟負擔[4]。而腦卒中患者短期內的非計劃再入院不僅導致更多的醫療支出,還會導致更高的患者死亡風險[5, 6]。
對于腦卒中患者來說,發生 31 天內非計劃性再入院可能意味著其在首次因腦卒中住院期間未達到良好的治療效果[7]。因此,國際上將非計劃性再入院作為評價醫療質量的有效指標[8]。我國衛生部發布的《三級綜合醫院醫療質量管理與控制指標(2011 版)》也明確將腦卒中 31 天內再入院率列為重點病程監測指標[9, 10]。腦卒中患者再入院原因通常包括二次中風、感染和心腦血管疾病等疾病相關因素[7, 11-13]。除此之外,一些社會和家庭因素(例如家庭財務狀況)也可能對腦卒中患者 31 天內非計劃性再入院有影響[14]。為此,本研究將從疾病相關因素、醫療環境、患者家庭因素等不同方面分析其對腦卒中患者 31 天內非計劃性再入院的影響。
目前對于危險因素的統計分析方法,常規使用 Logistic 回歸模型。但本研究中由于影響醫療過程的因素較多,且相互之間關系錯綜復雜,傳統的 Logistic 回歸在處理存在多重共線性數據資料時存在偏倚。而隨機森林算法作為新興的機器學習算法,具有可處理各類資料、自動偵測變量間交互作用、綜合考慮各因素對結局變量的影響并進行重要性評分等多重優勢[15]。因此,本研究選取北京市 24 家醫院缺血性腦卒中住院患者數據,采用隨機森林算法模型來分析患者個體特征、合并疾病、醫療環境和患者財務等各類因素對缺血性腦卒中患者 31 天內非計劃性再入院的影響。
1 資料與方法
1.1 數據來源
搜集 2015~2016 年期間首次因腦卒中在北京市 24 家醫院住院的患者住院病歷首頁數據。患者納入標準:① 入院時年齡在 18~100 歲之間;② 主要診斷為缺血性腦卒中(ICD-10 編碼 I63);③ 出院后追蹤 31 天內是否存在再次入院記錄,如有,其首要診斷必須是與腦卒中發病或后遺癥等有關的疾病;④ 排除首次腦卒中住院后死亡患者。
1.2 統計分析
1.2.1 單因素分析
采用 R 軟件 3.4.3 版本進行數據分析。按 31 天內有無非計劃性再入院記錄分為兩組。對分類變量進行卡方檢驗,對數值變量按其分布選擇參數或非參數檢驗。
1.2.2 多因素分析
將單因素分析結果中兩組差異有統計學(P<0.05)或臨床意義的變量納入多因素分析,利用 R 軟件包 random forest 4.6-12 構建隨機森林分類模型,并將 Logistic 回歸與隨機森林模型結果進行相互驗證。隨機森林模型的基本原理是通過自助法(bootstrap)重采樣技術,從不斷放回的原始數據集 N 中重復隨機抽取 n 個樣本生成新的數據集來構成決策樹,然后重復以上步驟生成 m 棵決策樹組成隨機森林,新數據的分類結果按每棵分類樹投票多少形成的分數而定。
在本研究中,隨機森林模型的構建過程:① 針對全部 m 個自變量,由系統分別隨機選取 1、2、3···m 個自變量,共建立 m 個模型,比較 m 個模型應變量(是否發生 31 天內非計劃再入院)的預測值與實際值,選擇錯誤率最小的取值 mi 作為模型分裂屬性 mtry 的參數值;② 以 mtry=mi 重新建立模型,觀察模型中決策樹的棵數 ntree 與模型錯誤率的關系,確定模型趨于穩定時的 ntree 值;③ 依據最終確定的 mtry 和 ntree 值訓練生成最終隨機森林模型;④ 利用隨機森林軟件包中自帶的 importance()函數對所有自變量的平均精確度和平均基尼系數進行分析,觀察并確定對 31 天內非計劃再入院最具影響的部分自變量;⑤ 利用 partialPlot()函數分析重要自變量對 31 天內非計劃再入院的邊際影響。
2 結果
2.1 數據整體情況
共收集到 3 473 例首次因缺血性腦卒中入院治療患者的數據,其中多數患者為男性、已婚、退(離)休人員。患者年齡中位數為 71 歲;醫療費用支付方式以城鎮職工基本醫療保險為主;大部患者在三級醫院就診;合并高血壓人數最多;住院天數中位數為 15 天;出院方式以醫囑離院或轉院為主。
2.2 單因素分析結果
將所有患者按是否發生 31 天內非計劃性再入院事件分為兩組,其中 960 例患者(27.64%)在 31 天內非計劃再入院。兩組患者年齡均主要分布在 60~80 歲,住院天數集中在 10~20 天,且均呈偏態分布(圖 1)。

卡方檢驗或 Mann-Whitney U 檢驗結果顯示,兩組患者在年齡、職業、醫療費用支付方式、就診醫院級別、合并疾病(糖尿病除外)、住院天數、是否使用臨床路徑、是否手術和出院方式方面均存在差異(表 1)。

2.3 多因素分析結果
2.3.1 不同影響因素的重要性
將單因素分析中兩組差異有統計學意義的自變量,包括年齡、職業、醫療費用支付方式、就診醫院級別、高血壓、脂代謝異常、心臟相關疾病、住院天數、是否使用臨床路徑、是否手術和出院方式納入多因素分析。同時考慮到不同入院途徑可能反映疾病的嚴重程度,而是否合并糖尿病在臨床上屬于腦卒中的危險因素,因此將不同入院途徑和是否合并糖尿病納入隨機森林模型進行建模。在隨機森林建模過程中,當分裂度 mtry=8 時模型錯誤率達到最小,當子數棵數 ntree=100 時模型趨于穩定。在最終建立的模型中,綜合各變量對于模型預測的精確度(>10)和基尼系數(>100)兩個參數可以看出,住院天數、年齡、醫療費用支付方式、醫院等級和職業這 5 個變量對缺血性腦卒中患者是否出現 31 天非計劃性再入院有較大影響(圖 2)。

2.3.2 不同影響因素的邊際影響
通過對上述 5 個最重要的影響因素進行邊際影響分析發現:① 當患者住院天數在 10 天以內時,住院時間越短風險越高;當住院天數在 10~30 天時,住院時間越長風險越高;當住院天數大于 30 天后,病情穩定再入院風險最低;② 當患者年齡小于 75 歲時,年齡越大風險越低,但 75 歲以后趨勢相反;③ 三級醫院就診患者再入院風險高于二級醫院就診患者;④ 公費醫療支付患者再入院風險更高,其次是自費、其他社會保險和其他費用支付方式;⑤ 從患者職業來看,企事業單位職工、工人和無業人員的 31 天非計劃性再入院風險排前三位(圖 3)。

醫院等級(2:二級,3:三級);醫療費用支付方式(1:城鎮職工基本醫療保險,2:城鎮居民基本醫療保險,3:新型農村合作醫療,4:公費,5:自費,6:其他社會保險,9:其他);職業[1:企事業單位職工,2:工人,3:農民,4:無業人員,5:退(離)休人員,9:其他]
2.3.3 Logistic 回歸與隨機森林模型結果比較
將同樣的因素納入 Logistic 回歸模型后,其結果與隨機森林分析結果相比,整體趨勢基本一致。對于年齡和住院天數兩個連續性變量,均隨著數值增加風險降低,與隨機森林模型中邊際影響分析結果一致。除醫療費用支付方式和職業中個別水平間相對風險與隨機森林結果有少量差異外,多數水平間差異與隨機森林分析結果一致。
3 討論
本研究結果顯示,住院天數長短對缺血性卒中患者再入院有著非常重要的影響,且呈非線性趨勢。即住院天數在一個月內時,10 天左右的住院患者出院后再入院風險最低,而住院天數更短或更長都會增加再入院風險。這種現象可能與缺血性腦卒中的自然病程有非常重要的關系。中華醫學會發布的腦梗死臨床路徑中,腦梗死患者的標準住院日一般為 7~10 天[16, 17],表明通過改善腦血管循環等常規治療 10 天后,大部分患者病情穩定并可達到臨床出院標準。但對于病情危重者,例如意識障礙、呼吸循環衰竭或因其它系統疾病既往病情加重等需要進入 ICU 或外科手術者其住院時間會相應延長。同時,住院時間過短將導致缺血性卒中并未得到良好治療,從而增加再入院風險,例如某些醫院為了提高病床周轉率而使患者提前出院[18, 19]。而對于首次住院超過 10 天、小于 30 天的患者,因其本身疾病病情較危重,也提高了其 31 天內非計劃再入院風險。另外,住院天數超過 30 天的患者基本集中在無 31 天內非計劃性再入院一組中,說明住院天數達到 30 天以后,其病情已趨于穩定,再入院風險達到最低。這也提示我們,雖然臨床路徑中規定腦卒中住院天數為 7~10 天,但在這個時點上達到臨床出院標準并不代表其病情已經完全穩定,還需要轉入下級醫院或康復機構來繼續治療或康復。對于離院后直接進行家庭護理的患者,應對家屬進行腦卒中護理培訓,以減少再入院的風險。
從患者年齡看,越年輕的患者再入院風險越高。其原因可能是這部份人群伴有腦卒中危險因素者的比例更高,例如高血壓、糖尿病、肥胖和吸煙史等[20-22]。據中國慢性病前瞻性研究項目[23]報告,35~39 歲人群中 12.6% 患有高血壓且未得到有效控制,18~39 歲人群中糖尿病知曉率僅為 5%,而在所有人群中糖尿病的治療和控制率也非常低[24]。2010 年一項中國成人煙草使用情況調查研究表明,2002~2010 年,40~59 歲人群的吸煙率增長了 70%,但其他年齡人群吸煙率并未發生明顯變化[25]。本研究發現,在有 31 天非計劃性再入院的人群中,60 歲以下人群所占比例(23.5%)要略高于無 31 天非計劃性再入院組(19.4%)。這提示我們應該加強對腦卒中高風險人群,尤其是年輕人群的早期教育和干預,使其認識到腦卒中對健康帶來的危害并及早改變不良生活方式和行為來降低再次腦卒中入院風險。
此外,醫院等級、醫療費用支付方式、職業和是否手術也影響 31 天非計劃再入院。本研究中,腦卒中患者多來自于三級醫院,三級醫院就診患者的病情程度往往較二級醫院更加危重,因此增加了其非計劃再入院風險。對于醫療費用支付方式,公費患者因其具有更高的醫療保障,在未限定住院日的情況下會趨向于住院時間更長[26],但在醫保規定有住院時間限制時,其可能通過短期內再入院以獲得更多醫療服務。對于職業而言,在職職工風險更高,可能與其年齡更小再入院風險越高有關。而農民的再入院風險較低可能與其經濟條件和主動就醫意識有關。目前各地區新型農村合作醫療中,住院費用報銷比例差別較大,二級醫院報銷比例約 30~40%,三級醫院約 20~30%,這對于例均治療費用上萬的腦卒中患者家庭來說,仍然是極大的負擔,可能使其因經濟負擔而放棄治療[27]。
本研究由于多個因素之間存在較為復雜的關系,例如住院天數和離院方式可能與患者的醫療付費方式相關,而醫療付費方式又與其職業相關。尤其是患者的醫療保障方式對其就醫行為有顯著影響,保障能力較弱的支付方式,如自費或新農合患者趨向于更節省費用的醫療行為[28],可能導致盡量減少住院天數或非醫囑離院。不同因素的交互作用會對多因素分析結果造成干擾,相較于 Logistic 回歸,隨機森林模型可不考慮因素之間的多重共線性問題[15]。同時,本研究實際上是一個分類問題,而隨機森林算法內部由多棵決策樹組成,更適宜于處理分類問題。另外,隨機森林也不需要對特征進行歸一化,有較強的抗干擾能力,可在大量缺失數據情況下進行數據分析。因此,利用隨機森林模型進行缺血性腦卒中患者 31 天非計劃性再入院風險分析,其結果具有更高的可靠性。
本研究的局限性。由于本研究數據均來源于病歷首頁數據,缺少有關缺血性腦卒中患者的人口學資料、病史、病程記錄和治療結局等詳細資料,可能對分析結果產生一定影響。這也提示未來研究要更多納入與疾病本身和治療過程有關的數據,以便為臨床和醫療管理決策提供更有價值的證據。
總之,本研究采用隨機森林模型分析影響缺血性腦卒中患者 31 天內非計劃再入院的危險因素,既包括疾病診療相關因素又包括社會環境因素。本研究結果提示對缺血性腦卒中患者出院標準的判定,要嚴格以病情是否穩定為依據,排除因醫院績效管理規定導致的再入院風險。同時,對于缺血性腦卒中的治療和護理,還應考慮其家庭和經濟等因素,避免非疾病因素對疾病治療效果產生的不利影響。