引用本文: 陳苗, 陳青, 尹曉清. 隨機森林的集成分類算法對心胸外科ICU患者譫妄風險的預測分析. 中國胸心血管外科臨床雜志, 2022, 29(7): 886-891. doi: 10.7507/1007-4848.202105058 復制
由于ICU患者在治療過程中需面對封閉環境、被動依從和死亡恐懼等情況,會產生一系列的心理精神綜合征[1],其中發生在認知和注意力方面的急性障礙稱為ICU譫妄[2],特別是在心胸外科ICU,有很多患者會出現ICU譫妄。國外的一項調查研究[3]發現,在ICU內住院的老年患者發生譫妄的風險約為49%,其中一半以上的患者會發展成永久性譫妄。這不僅延長住院時間和增加住院費用,還對患者的康復和以后生活造成不良影響[4]。因此有效預防ICU譫妄發生具有重大的意義,目前國內外常用多因素回歸分析預測ICU譫妄發生風險[5],這種方法對ICU譫妄的發生有一定預測作用,但由于特異度偏低會影響預測結果[6],而且容易剔除一些與病情嚴重程度有關的因素導致結果偏差[7]。隨機森林是一種比較新的機器學習模型,主要是利用多棵樹對樣本進行訓練并預測的一種分類器[8]。目前廣泛應用在疾病風險預測及預后中,它在處理數據過程中可混合多種因素分析處理,提高預測精度[9],但在預測心胸外科ICU患者發生譫妄風險中應用較少。本研究分析和對比了隨機森林的集成分類算法和多因素回歸分析模型下對心胸外科ICU發生譫妄風險的預測效能,現報道如下。
1 資料與方法
1.1 臨床資料
納入標準:(1)年齡18~80歲;(2)住ICU治療>24 h;(3)患者家屬知情同意并能配合整個試驗。排除標準:(1)合并有精神病史或嚴重心理疾病者;(2)合并有急性腦血管疾病或腦腫瘤等其它影響腦功能的疾病;(3)嚴重的聽力障礙或病情嚴重無法進行譫妄評估者;(4)臨床資料和結局缺失。
納入2019年6月—2020年12月于我院心胸外科ICU住院的360例患者為研究對象,其中男 193 例、女 167 例,年齡 18~80(56.45±9.33)歲。根據患者住院期間是否發生譫妄分為譫妄組和對照組。
1.2 方法
1.2.1 多因素 logistic回歸分析模型構建
通過分析比較兩組患者的臨床資料,包括年齡、性別、住院時間、文化程度、心率、血壓、吸煙飲酒史、伴隨疾病(糖尿病、高血壓、高脂血癥等)、急性生理學和慢性健康狀況評分系統Ⅱ(acute physiology and chronic health evaluationⅡ,APACHEⅡ)得分[10]、是否有身體約束、是否有機械輔助通氣等之間的差異。以P≤0.05的單因素分析結果作為自變量,以結局作為因變量(0=無ICU譫妄,1=有ICU譫妄),把自變量和因變量進行二分類的逐步多因素logistic回歸分析,構建出模型。
1.2.2 隨機森林的集成分類算法模型的構建
隨機森林的集成分類算法采集了住院患者疾病臨床資料,包括年齡、性別、住院時間等數據集,將其隨機分割為80%和20%分別用于構建及驗證預測模型。本研究樣本量總數為360個,分為結局變量和解釋變量。其中結局變量是指研究對象是否發生ICU譫妄,這是決策進行分類的最終目的,解釋變量選用的是可引起患者發生ICU譫妄的一系列相關危險因素,包括年齡、住院時間、APACHEⅡ得分、是否行機械輔助通氣、是否有身體約束和使用鎮靜藥物情況,用于對結局變量進行分類。本研究建立隨機森林模型的步驟分為:(1)用Bootstrap自助法在原始數據中有放回的抽取出n個訓練樣本后建立出n棵樹,這n棵樹組成一個隨機森林,用來進行數據綜合判別及分類;(2)在生成樹過程中,從每棵樹的節點處在所有變量中隨機抽取m個變量,通過此m個變量選擇出分類能力最強的變量進行數據分類;(3)在Bootstrap中剩余的未被抽取的數據為測試樣本,主要用來驗證每棵樹的性能。
1.3 兩種模型的對比
采用受試者工作特征(receiver operating characteristic,ROC)曲線分別計算下多因素logistic回歸分析模型和隨機森林的集成分類算法模型兩種模型的曲線下面積(area under the curve,AUC)和Hosmer-Lemeshow擬合優度來檢驗評估模型的分辨力及校準度。根據約登指數,確定預測模型的靈敏度、特異度等。
1.4 觀察指標和結局
(1)兩組臨床資料:包括年齡、性別、住院時間、文化程度、心率、血壓、吸煙飲酒史、伴隨疾病(糖尿病、高血壓、高脂血癥等);(2)結局:觀察患者在心胸外科ICU治療過程中是否發生譫妄,符合ICU譫妄的診斷標準[11]。主要根據ICU意識模糊評估法(confusion assessment method for the intensive care unit,CAM-ICU)進行譫妄的評估,2次/d(分別在上午8~10點和下午6~8點進行),每次評估時間約為2 min。CAM-ICU可分4方面,包括意識狀態的急性改變或反復波動、注意缺損、思維混亂和意識清晰度改變。陽性標準是患者同時存在急性改變或反復波動和注意缺損,如果再出現思維混亂或意識清晰度改變的任意一條,表示患者有ICU譫妄。
1.5 統計學分析
所有數據均用SPSS 22.0進行分析。正態分布的計量資料用均數±標準差(±s)表示,組間比較采用獨立樣本t檢驗;不服從正態分布的計量資料采用中位數(上下四分位數)[M(P25,P75)]表示,組間比較用Wilcoxon秩和檢驗。計數資料用例數(%)表示,組間比較采用χ2檢驗,等級資料用Spearman相關分析檢驗。影響心胸外科ICU患者發生譫妄的各相關因素用多因素logistic回歸分析,進行了向前有條件法比較。用Python(3.7.3)語言ScikitLearn機器學習庫中Random Forsest Classifier算法建立預測ICU譫妄的隨機森林模型;用ROC曲線進行預測效能比較,其中AUC采用Z檢驗。P≤0.05為差異有統計學意義。
1.6 倫理審查
本研究經湖南中醫藥大學第一附屬醫院倫理委員會審批,批準號:HN-LL-LW-2022-014。經患者家屬同意后簽署知情同意書。
2 結果
2.1 結局觀察
納入研究360例患者中有19例患者在治療過程中間出現轉院或死亡,按病例脫落計算,剩余341例患者中有165例住院過程中發生了ICU譫妄,發生率為48.39%(165/341),為譫妄組;176例未發生ICU譫妄,為對照組。
2.2 兩組臨床資料對比
兩組性別、文化水平等一般資料差異無統計學意義(P>0.05);但譫妄組年齡大、住院時間長,APACHEⅡ得分、機械輔助通氣所占比例、身體約束所占比例和使用鎮靜藥物所占比例均高于對照組(P<0.05);見表1。


2.3 影響心胸外科ICU患者譫妄發生風險的多因素logistic回歸分析
多因素logistic回歸分析顯示,年齡(OR=1.162)、住院時間(OR=1.238)、APACHEⅡ得分(OR=1.057)、機械輔助通氣(OR=1.329)、身體約束(OR=1.345)和使用鎮靜藥物(OR=1.630)是心胸外科ICU患者譫妄發生風險的獨立危險因素;見表2。共線性分析顯示,納入多因素Logistic回歸的因素間無顯著共線性(擬合優度檢驗χ2=5.464 ,P=0.707),提示模型擬優度較高。

2.4 隨機森林模型的變量重要性分析
根據隨機森林模型預測精度平均下降量對隨機森林模型各變量的重要程度進行排序,排名在前的重要預測變量為:年齡、住院時間、APACHEⅡ得分、機械輔助通氣、身體約束和使用鎮靜藥物;見圖1~2。

APACHEⅡ:急性生理學和慢性健康狀況評分系統Ⅱ

APACHEⅡ:急性生理學和慢性健康狀況評分系統Ⅱ
2.5 預測心胸外科 ICU 患者發生譫妄風險的隨機森林的集成分類算法模型構建
使用梯度提升回歸樹算法對隨機森林模型進行調參,隨著決策樹數目的不斷增大,從20棵決策樹開始,擴展的隨機森林算法的誤差(均方差)逐漸趨于平緩,表明隨機森林算法的泛化能力逐漸增強,而決策樹數目過大后誤差呈升高趨勢。所以設置每片森林的決策樹數目為20棵,即在訓練每片隨機森林時,構建20棵不同的決策樹;見圖3。

2.6 兩種預測模型診斷效能對比
隨機森林的集成分類算法其診斷效能明顯高于多因素logistic回歸分析的診斷效能,其中隨機森林的集成分類算法AUC為0.87,多因素logistic回歸分析模型下AUC為0.79。其中,隨機森林模型的F1-score為0.874,準確率為88.24%,敏感度為90.91%,特異度為85.71%,陽性預測值為85.71%,陰性預測值為90.91%;見圖4。

3 討論
臨床上將發生在ICU住院患者中的譫妄稱為ICU譫妄,多發生在危重癥患者和老年患者中[12],嚴重影響了患者心理和生理健康,延緩了預后[13]。如何改善預后、提高患者生活質量是改善和預防ICU譫妄的重點,特別是早期預防對ICU譫妄患者預后意義重大。
在本試驗中,納入研究患者中有165例發生了ICU譫妄,發生率為48.39%,符合流行病學規律[3],也說明了在我院心胸外科ICU中,患者譫妄的發生率很高,對患者預后和出院后生活質量均有很大的不良影響。因此,早期預測對ICU患者意義重大。觀察兩組的臨床資料,性別、文化水平等差異無統計學意義,但譫妄組患者年齡大,住院時間長,APACHEⅡ得分、機械輔助通氣所占比例、身體約束所占比例和使用鎮靜藥物所占比例均高于對照組。說明了上述因素在ICU譫妄的發生過程中起了重要的作用。ICU譫妄主要是大腦功能改變引起的一種意識障礙的表現[14]。年齡越大的患者腦功能減退越多、腦血流量越少,且容易合并腦梗死、冠心病等慢性病病史[15],當入住心胸外科ICU時,受到周圍環境和病情等多種因素刺激后發生ICU譫妄的比例越高。國外的一項研究[16]也證明了ICU中年齡越大的患者ICU譫妄發病率越高。而隨著住院時間延長,患者受ICU中的環境影響越大,對自身疾病可能引起死亡的恐懼越高[17],越容易導致患者發生ICU譫妄。特別是心胸外科ICU中,患者術前身體狀況一般較好、意識清楚,受心胸外科ICU內環境的影響較大。APACHEⅡ得分在ICU中應用廣泛,主要是用來評估患者疾病嚴重程度的一項評分,分數越高,病情越嚴重, 越容易引起多器官功能減退甚至衰竭,引起ICU譫妄[18]。有研究[19]證明:APACHEⅡ得分、感染是ICU譫妄發生的獨立危險因素,和本文結果相符。而應用了機械輔助通氣的患者其肺通氣功能受損,血中氧氣及二氧化碳等多種物質含量均發生變化,導致了腦供氧減少,容易損傷腦細胞,引起腦功能退化[20],導致ICU譫妄的發生。身體約束會增加患者對周圍環境的恐懼感,引起患者心理變化,進而影響腦功能,引起ICU譫妄。鎮靜藥物是精神類藥物,通過作用于腦神經,抑制中樞神經的活性,起到鎮靜催眠的作用,有時會大量應用于心胸外科ICU患者身上,容易損傷患者的腦神經功能,引起腦功能的退化[21],導致ICU譫妄。
將各因素分別納入多因素logistic回歸分析和隨機森林的集成分類算法,可見年齡、住院時間、APACHEⅡ得分、機械輔助通氣、身體約束和使用鎮靜藥物是心胸外科ICU患者發生譫妄風險的獨立危險因素。而對隨機森林模型各變量的重要程度排序上,年齡、住院時間、APACHEⅡ得分、機械輔助通氣、身體約束和使用鎮靜藥物排名最靠前。證明了年齡、住院時間、APACHEⅡ得分、機械輔助通氣、身體約束和使用鎮靜藥物是導致ICU譫妄發生的重要因素。通過ROC曲線對比兩種分析方法的診斷效能,可見隨機森林的集成分類算法的診斷效能明顯高于多因素logistic回歸分析。主要是隨機森林算法能對醫學數據中的混雜數據、缺失值或離群值及較高維度的數據進行有效地處理,然后通過多個決策樹對數據進行綜合分類,并進行關聯性檢驗、預測和解釋,這些處理過程不易出現過擬合,使得預測的精度更加準確[22],提高了疾病的診斷效能。現今臨床上常用的預測風險分析多為多因素logistic回歸分析,可通過探討引發疾病的相關危險因素,分析出各危險因素預測疾病發生的風險,對早期診斷疾病有一定價值,但是當候選的風險因素較多且出現部分因子缺失時會引起預測結果的偏差。而隨機森林算法是隨著計算機功能的發展以及大數據應用和分析逐漸健全而新發展出的機器學習模型[23]。在診斷疾病的基本概念、應用場景、研究思路、大數據背景下的建模與驗證、性能評價及報告規范等方面均有不同程度的的探索,提高了診斷效能,較傳統的神經網絡模型又減少了數據計算量,有良好的應用價值[24]。隋偉靜等[25]的研究也證明了在分析ICU譫妄風險的相關預測模型中,隨機森林算法顯示出高度的準確性,而包含有年齡、機械輔助通氣等危險因素的預測模型與發生ICU譫妄風險有密切關系,有助于臨床提供早期干預。
綜上所述,隨機森林的集成分類算法分析預測心胸外科ICU患者發生譫妄的診斷效能更高,可于臨床推廣應用,有助于早期識別和加強護理高危患者。但本研究還存在單中心、小樣本的局限性,還需要多中心、大樣本數據對模型進行進一步優化,并應用外部數據進一步驗證模型的效果。
利益沖突:無。
作者貢獻:陳苗負責數據收集,文章撰寫、修改;陳青負責研究設計、文章修改;尹曉清負責數據收集、文章修改。
由于ICU患者在治療過程中需面對封閉環境、被動依從和死亡恐懼等情況,會產生一系列的心理精神綜合征[1],其中發生在認知和注意力方面的急性障礙稱為ICU譫妄[2],特別是在心胸外科ICU,有很多患者會出現ICU譫妄。國外的一項調查研究[3]發現,在ICU內住院的老年患者發生譫妄的風險約為49%,其中一半以上的患者會發展成永久性譫妄。這不僅延長住院時間和增加住院費用,還對患者的康復和以后生活造成不良影響[4]。因此有效預防ICU譫妄發生具有重大的意義,目前國內外常用多因素回歸分析預測ICU譫妄發生風險[5],這種方法對ICU譫妄的發生有一定預測作用,但由于特異度偏低會影響預測結果[6],而且容易剔除一些與病情嚴重程度有關的因素導致結果偏差[7]。隨機森林是一種比較新的機器學習模型,主要是利用多棵樹對樣本進行訓練并預測的一種分類器[8]。目前廣泛應用在疾病風險預測及預后中,它在處理數據過程中可混合多種因素分析處理,提高預測精度[9],但在預測心胸外科ICU患者發生譫妄風險中應用較少。本研究分析和對比了隨機森林的集成分類算法和多因素回歸分析模型下對心胸外科ICU發生譫妄風險的預測效能,現報道如下。
1 資料與方法
1.1 臨床資料
納入標準:(1)年齡18~80歲;(2)住ICU治療>24 h;(3)患者家屬知情同意并能配合整個試驗。排除標準:(1)合并有精神病史或嚴重心理疾病者;(2)合并有急性腦血管疾病或腦腫瘤等其它影響腦功能的疾病;(3)嚴重的聽力障礙或病情嚴重無法進行譫妄評估者;(4)臨床資料和結局缺失。
納入2019年6月—2020年12月于我院心胸外科ICU住院的360例患者為研究對象,其中男 193 例、女 167 例,年齡 18~80(56.45±9.33)歲。根據患者住院期間是否發生譫妄分為譫妄組和對照組。
1.2 方法
1.2.1 多因素 logistic回歸分析模型構建
通過分析比較兩組患者的臨床資料,包括年齡、性別、住院時間、文化程度、心率、血壓、吸煙飲酒史、伴隨疾病(糖尿病、高血壓、高脂血癥等)、急性生理學和慢性健康狀況評分系統Ⅱ(acute physiology and chronic health evaluationⅡ,APACHEⅡ)得分[10]、是否有身體約束、是否有機械輔助通氣等之間的差異。以P≤0.05的單因素分析結果作為自變量,以結局作為因變量(0=無ICU譫妄,1=有ICU譫妄),把自變量和因變量進行二分類的逐步多因素logistic回歸分析,構建出模型。
1.2.2 隨機森林的集成分類算法模型的構建
隨機森林的集成分類算法采集了住院患者疾病臨床資料,包括年齡、性別、住院時間等數據集,將其隨機分割為80%和20%分別用于構建及驗證預測模型。本研究樣本量總數為360個,分為結局變量和解釋變量。其中結局變量是指研究對象是否發生ICU譫妄,這是決策進行分類的最終目的,解釋變量選用的是可引起患者發生ICU譫妄的一系列相關危險因素,包括年齡、住院時間、APACHEⅡ得分、是否行機械輔助通氣、是否有身體約束和使用鎮靜藥物情況,用于對結局變量進行分類。本研究建立隨機森林模型的步驟分為:(1)用Bootstrap自助法在原始數據中有放回的抽取出n個訓練樣本后建立出n棵樹,這n棵樹組成一個隨機森林,用來進行數據綜合判別及分類;(2)在生成樹過程中,從每棵樹的節點處在所有變量中隨機抽取m個變量,通過此m個變量選擇出分類能力最強的變量進行數據分類;(3)在Bootstrap中剩余的未被抽取的數據為測試樣本,主要用來驗證每棵樹的性能。
1.3 兩種模型的對比
采用受試者工作特征(receiver operating characteristic,ROC)曲線分別計算下多因素logistic回歸分析模型和隨機森林的集成分類算法模型兩種模型的曲線下面積(area under the curve,AUC)和Hosmer-Lemeshow擬合優度來檢驗評估模型的分辨力及校準度。根據約登指數,確定預測模型的靈敏度、特異度等。
1.4 觀察指標和結局
(1)兩組臨床資料:包括年齡、性別、住院時間、文化程度、心率、血壓、吸煙飲酒史、伴隨疾病(糖尿病、高血壓、高脂血癥等);(2)結局:觀察患者在心胸外科ICU治療過程中是否發生譫妄,符合ICU譫妄的診斷標準[11]。主要根據ICU意識模糊評估法(confusion assessment method for the intensive care unit,CAM-ICU)進行譫妄的評估,2次/d(分別在上午8~10點和下午6~8點進行),每次評估時間約為2 min。CAM-ICU可分4方面,包括意識狀態的急性改變或反復波動、注意缺損、思維混亂和意識清晰度改變。陽性標準是患者同時存在急性改變或反復波動和注意缺損,如果再出現思維混亂或意識清晰度改變的任意一條,表示患者有ICU譫妄。
1.5 統計學分析
所有數據均用SPSS 22.0進行分析。正態分布的計量資料用均數±標準差(±s)表示,組間比較采用獨立樣本t檢驗;不服從正態分布的計量資料采用中位數(上下四分位數)[M(P25,P75)]表示,組間比較用Wilcoxon秩和檢驗。計數資料用例數(%)表示,組間比較采用χ2檢驗,等級資料用Spearman相關分析檢驗。影響心胸外科ICU患者發生譫妄的各相關因素用多因素logistic回歸分析,進行了向前有條件法比較。用Python(3.7.3)語言ScikitLearn機器學習庫中Random Forsest Classifier算法建立預測ICU譫妄的隨機森林模型;用ROC曲線進行預測效能比較,其中AUC采用Z檢驗。P≤0.05為差異有統計學意義。
1.6 倫理審查
本研究經湖南中醫藥大學第一附屬醫院倫理委員會審批,批準號:HN-LL-LW-2022-014。經患者家屬同意后簽署知情同意書。
2 結果
2.1 結局觀察
納入研究360例患者中有19例患者在治療過程中間出現轉院或死亡,按病例脫落計算,剩余341例患者中有165例住院過程中發生了ICU譫妄,發生率為48.39%(165/341),為譫妄組;176例未發生ICU譫妄,為對照組。
2.2 兩組臨床資料對比
兩組性別、文化水平等一般資料差異無統計學意義(P>0.05);但譫妄組年齡大、住院時間長,APACHEⅡ得分、機械輔助通氣所占比例、身體約束所占比例和使用鎮靜藥物所占比例均高于對照組(P<0.05);見表1。


2.3 影響心胸外科ICU患者譫妄發生風險的多因素logistic回歸分析
多因素logistic回歸分析顯示,年齡(OR=1.162)、住院時間(OR=1.238)、APACHEⅡ得分(OR=1.057)、機械輔助通氣(OR=1.329)、身體約束(OR=1.345)和使用鎮靜藥物(OR=1.630)是心胸外科ICU患者譫妄發生風險的獨立危險因素;見表2。共線性分析顯示,納入多因素Logistic回歸的因素間無顯著共線性(擬合優度檢驗χ2=5.464 ,P=0.707),提示模型擬優度較高。

2.4 隨機森林模型的變量重要性分析
根據隨機森林模型預測精度平均下降量對隨機森林模型各變量的重要程度進行排序,排名在前的重要預測變量為:年齡、住院時間、APACHEⅡ得分、機械輔助通氣、身體約束和使用鎮靜藥物;見圖1~2。

APACHEⅡ:急性生理學和慢性健康狀況評分系統Ⅱ

APACHEⅡ:急性生理學和慢性健康狀況評分系統Ⅱ
2.5 預測心胸外科 ICU 患者發生譫妄風險的隨機森林的集成分類算法模型構建
使用梯度提升回歸樹算法對隨機森林模型進行調參,隨著決策樹數目的不斷增大,從20棵決策樹開始,擴展的隨機森林算法的誤差(均方差)逐漸趨于平緩,表明隨機森林算法的泛化能力逐漸增強,而決策樹數目過大后誤差呈升高趨勢。所以設置每片森林的決策樹數目為20棵,即在訓練每片隨機森林時,構建20棵不同的決策樹;見圖3。

2.6 兩種預測模型診斷效能對比
隨機森林的集成分類算法其診斷效能明顯高于多因素logistic回歸分析的診斷效能,其中隨機森林的集成分類算法AUC為0.87,多因素logistic回歸分析模型下AUC為0.79。其中,隨機森林模型的F1-score為0.874,準確率為88.24%,敏感度為90.91%,特異度為85.71%,陽性預測值為85.71%,陰性預測值為90.91%;見圖4。

3 討論
臨床上將發生在ICU住院患者中的譫妄稱為ICU譫妄,多發生在危重癥患者和老年患者中[12],嚴重影響了患者心理和生理健康,延緩了預后[13]。如何改善預后、提高患者生活質量是改善和預防ICU譫妄的重點,特別是早期預防對ICU譫妄患者預后意義重大。
在本試驗中,納入研究患者中有165例發生了ICU譫妄,發生率為48.39%,符合流行病學規律[3],也說明了在我院心胸外科ICU中,患者譫妄的發生率很高,對患者預后和出院后生活質量均有很大的不良影響。因此,早期預測對ICU患者意義重大。觀察兩組的臨床資料,性別、文化水平等差異無統計學意義,但譫妄組患者年齡大,住院時間長,APACHEⅡ得分、機械輔助通氣所占比例、身體約束所占比例和使用鎮靜藥物所占比例均高于對照組。說明了上述因素在ICU譫妄的發生過程中起了重要的作用。ICU譫妄主要是大腦功能改變引起的一種意識障礙的表現[14]。年齡越大的患者腦功能減退越多、腦血流量越少,且容易合并腦梗死、冠心病等慢性病病史[15],當入住心胸外科ICU時,受到周圍環境和病情等多種因素刺激后發生ICU譫妄的比例越高。國外的一項研究[16]也證明了ICU中年齡越大的患者ICU譫妄發病率越高。而隨著住院時間延長,患者受ICU中的環境影響越大,對自身疾病可能引起死亡的恐懼越高[17],越容易導致患者發生ICU譫妄。特別是心胸外科ICU中,患者術前身體狀況一般較好、意識清楚,受心胸外科ICU內環境的影響較大。APACHEⅡ得分在ICU中應用廣泛,主要是用來評估患者疾病嚴重程度的一項評分,分數越高,病情越嚴重, 越容易引起多器官功能減退甚至衰竭,引起ICU譫妄[18]。有研究[19]證明:APACHEⅡ得分、感染是ICU譫妄發生的獨立危險因素,和本文結果相符。而應用了機械輔助通氣的患者其肺通氣功能受損,血中氧氣及二氧化碳等多種物質含量均發生變化,導致了腦供氧減少,容易損傷腦細胞,引起腦功能退化[20],導致ICU譫妄的發生。身體約束會增加患者對周圍環境的恐懼感,引起患者心理變化,進而影響腦功能,引起ICU譫妄。鎮靜藥物是精神類藥物,通過作用于腦神經,抑制中樞神經的活性,起到鎮靜催眠的作用,有時會大量應用于心胸外科ICU患者身上,容易損傷患者的腦神經功能,引起腦功能的退化[21],導致ICU譫妄。
將各因素分別納入多因素logistic回歸分析和隨機森林的集成分類算法,可見年齡、住院時間、APACHEⅡ得分、機械輔助通氣、身體約束和使用鎮靜藥物是心胸外科ICU患者發生譫妄風險的獨立危險因素。而對隨機森林模型各變量的重要程度排序上,年齡、住院時間、APACHEⅡ得分、機械輔助通氣、身體約束和使用鎮靜藥物排名最靠前。證明了年齡、住院時間、APACHEⅡ得分、機械輔助通氣、身體約束和使用鎮靜藥物是導致ICU譫妄發生的重要因素。通過ROC曲線對比兩種分析方法的診斷效能,可見隨機森林的集成分類算法的診斷效能明顯高于多因素logistic回歸分析。主要是隨機森林算法能對醫學數據中的混雜數據、缺失值或離群值及較高維度的數據進行有效地處理,然后通過多個決策樹對數據進行綜合分類,并進行關聯性檢驗、預測和解釋,這些處理過程不易出現過擬合,使得預測的精度更加準確[22],提高了疾病的診斷效能。現今臨床上常用的預測風險分析多為多因素logistic回歸分析,可通過探討引發疾病的相關危險因素,分析出各危險因素預測疾病發生的風險,對早期診斷疾病有一定價值,但是當候選的風險因素較多且出現部分因子缺失時會引起預測結果的偏差。而隨機森林算法是隨著計算機功能的發展以及大數據應用和分析逐漸健全而新發展出的機器學習模型[23]。在診斷疾病的基本概念、應用場景、研究思路、大數據背景下的建模與驗證、性能評價及報告規范等方面均有不同程度的的探索,提高了診斷效能,較傳統的神經網絡模型又減少了數據計算量,有良好的應用價值[24]。隋偉靜等[25]的研究也證明了在分析ICU譫妄風險的相關預測模型中,隨機森林算法顯示出高度的準確性,而包含有年齡、機械輔助通氣等危險因素的預測模型與發生ICU譫妄風險有密切關系,有助于臨床提供早期干預。
綜上所述,隨機森林的集成分類算法分析預測心胸外科ICU患者發生譫妄的診斷效能更高,可于臨床推廣應用,有助于早期識別和加強護理高危患者。但本研究還存在單中心、小樣本的局限性,還需要多中心、大樣本數據對模型進行進一步優化,并應用外部數據進一步驗證模型的效果。
利益沖突:無。
作者貢獻:陳苗負責數據收集,文章撰寫、修改;陳青負責研究設計、文章修改;尹曉清負責數據收集、文章修改。