引用本文: 劉春桃, 付敏, 陳希, 楊波. 無創通氣失敗風險預測模型的研究進展. 中國呼吸與危重監護雜志, 2022, 21(9): 678-684. doi: 10.7507/1671-6205.202204056 復制
隨著無創通氣的發展和其循證醫學證據的積累,無創通氣的使用率逐年增加[1-2]。在重癥監護治療病房(intensive care unit,ICU)中,無創通氣作為呼吸衰竭患者的首選治療手段占比達24%[2]。國內外指南也強烈推薦將無創通氣用于慢性阻塞性肺疾病(簡稱慢阻肺)急性加重、急性左心衰竭、免疫抑制等患者,也可選擇性用于重癥肺炎、急性呼吸窘迫綜合征(acute respiratory distress syndrome,ARDS)等患者[3-7]。但在臨床實踐中,并非所有患者在使用無創通氣的過程中均可受益,在無創通氣受益有限時最終被認定為無創通氣失敗。無創通氣失敗指在無創通氣后需要氣管插管或者死亡[8]。無創通氣失敗率從5%到50%不等[1, 9-12],并且由于無創通氣失敗導致氣管插管而死亡的患者高達30%,高于一開始就接受機械通氣的患者的病死率[1]。在Ⅱ型呼吸衰竭患者中,無創通氣失敗者的院內病死率比初始直接行有創通氣的患者更高(27%比23%,P<0.01)[1]。在Ⅰ型呼吸衰竭患者中,無創通氣失敗者的院內病死率也比初始直接行有創通氣的患者高(38.4%比31.3%,P<0.01)[13]。由此可見,在進行無創通氣治療時應盡早識別無創通氣治療失敗的高風險人群,進而降低無創通氣的失敗率。近年來有許多學者構建了無創通氣失敗風險預測模型用于評估和篩查高風險人群,現將近年有關無創通氣失敗風險預測模型的研究進展綜述如下。
1 無創通氣失敗的危險因素
近年來,國內外關于無創通氣失敗的危險因素研究主要包括以下6個方面。(1)一般因素:年齡>65歲的患者無創通氣失敗率約為年齡≤65歲的16倍[14]。對于新生兒,6個月以下的年齡,無創通氣失敗率更高[15]。在癌癥患者中,男性患者無創通氣失敗率是女性的2.58倍[16];而在老年急性呼吸衰竭患者中,男性無創通氣失敗率是女性的1.067倍[17]。患者體重指數(body mass index,BMI)越低,越容易出現無創通氣失敗[18]。然而有研究指出,BMI≥25 kg/m2是心臟手術拔管后急性呼吸衰竭患者無創通氣成功的預測因子[19]。(2)生命體征及意識:無創通氣前,血壓下降是患者無創通氣失敗的重要預測因子之一[20-22],而當收縮壓<90 mm Hg(1 mm Hg=0.133 kPa)出現休克時,禁忌使用無創通氣[23]。心率及呼吸頻率的增加會增加無創通氣治療失敗的風險[22, 24-25]。低格拉斯哥昏迷量表(Glasgow coma scale,GCS)評分與無創通氣失敗相關[21, 26-28]。(3)血氣分析:患者氧合指數越低,越容易發生無創通氣失敗[29-31]。肺泡–動脈氧分壓差增高者其無創通氣失敗風險增高[29]。pH水平較低者更容易出現無創通氣失敗[21-22]。動脈血二氧化碳分壓水平較低患者其無創通氣失敗發生風險較高[32]。(4)實驗室指標及影像學檢查:在慢阻肺患者,較高的C反應蛋白及降鈣素原是無創通氣失敗的獨立危險因素,兩者的最佳截斷值分別為15.0 g/L及0.31 μg/L[33]。腦鈉肽≥3350 pg/mL的急性心源性肺水腫患者其無創通氣失敗率是腦鈉肽<3350 pg/mL者的39.63倍[34]。胸部X線檢查示病變浸潤象限數量的增加是無創通氣失敗的獨立危險因素[35-38]。(5)合并癥:合并多器官功能衰竭、肺炎者更容易發生無創通氣失敗[19-20]。合并活動性腫瘤、腎功能衰竭等同樣會提高無創通氣的失敗率[39-40]。(6)臨床評分:序貫器官衰竭評分≥5分的低氧血癥性急性呼吸衰竭患者無創通氣失敗的風險是序貫器官衰竭評分<5分患者的3.3倍[13]。簡明急性生理學評分Ⅲ得分越高,無創通氣越容易失敗[16]。Chawla等[20]研究發現,對于急性呼吸窘迫綜合征患者,無創通氣失敗組在急性生理與慢性健康評分Ⅱ得分上高于無創通氣成功組。Custodero等[17]通過COX回歸分析指出多維預后指數評分對無創通氣失敗有很好的鑒別能力(β=7.821,P<0.05)。當多維預后指數評分≥0.84時,其風險預測值將大于70.5%。多維預后指數評分是基于老年綜合評估衍生的評分指數,其包括日常生活能力、認知功能、營養風險評估、活動能力、壓力性損傷風險評估、用藥情況、居住狀況共8個領域,可用于預測老年患者的死亡風險和預后[41]。這些因素可為無創通氣失敗風險預測模型的構建提供參考依據。
2 基于傳統統計學方法構建的無創通氣失敗風險預測模型
2.1 基于Logistic回歸
2.1.1 Ⅰ型呼吸衰竭
(1)Duan等[25]構建的模型:Duan等[25]于2017年應用前瞻性觀察研究法,以2011年6月—2014年6月入院的449例Ⅰ型呼吸衰竭患者為模型組,以2014年7月至2016年6月入院的358例患者為驗證組,采用Logistic回歸分析,確定了5項預測因素,即心率(Heart rate)、酸中毒(Acidosis,通過pH評估)、意識(Consciousness)、氧合情況(Oxygenation,通過PaO2/FiO2評估)、呼吸頻率(Respiratory rate),構建出Ⅰ型呼吸衰竭患者早期無創通氣失敗的風險預測模型。為提高模型在臨床中的實用性,該研究還在此基礎上創建了簡易評分表,簡稱為HACOR指數評分表,其總分為0~25分,以HACOR指數5分作為判斷閾值,>5分預示患者無創通氣失敗風險高。建模組和驗證組的受試者操作特征曲線下面積(area under the receiver operator characteristic curve,AUC)分別為0.88、0.91,敏感性分別為72.6%、75.9%,特異性分別為90.2%、92.6%,準確性分別為81.8%、86.0%,這表明HACOR評分對無創通氣失敗具有良好的預測能力。研究還發現該量表預測患者無創通氣失敗的AUC在無創通氣1 h、12 h、24 h和48 h分別為0.89、0.87、0.88、0.87,敏感性分別為73.9%、66.9%、61.5%、60.3%,特異性分別為91.4%、92.3%、93.4%、95.6%,準確性分別為83.7%、82.3%、82.3%、84.2%,這意味著該量表可以進行單個時點的評估。此外,此量表也可進行連續動態的評估,若患者在無創通氣過程中總分逐漸下降說明無創通氣有效,若總分在上升或是無變化則說明無創通氣效果不佳。該研究創建了首個早期無創通氣失敗的風險預測模型,并將模型轉換為臨床使用的評分表,預測變量中包含的預測指標均客觀且易獲取,可在床旁快速評估,為醫護人員早期識別、預防無創通氣失敗提供了高效、簡便的篩查工具,可作為Ⅰ型呼吸衰竭患者無創通氣失敗風險預測工具。Carrillo等[42]于2020年將HACOP指數評分表應用于2748例低氧性急性呼吸衰竭患者中,該量表在預測低氧性急性呼吸衰竭患者無創通氣失敗在不同時段的AUC均大于0.8,敏感性大于66%,特異性大于85%,說明該評分表在外部驗證中有良好的預測能力,具有一定的外推性。
(2)Shu等[43]構建的模型:2022年,Shu等[43]構建了適用于急性呼吸窘迫綜合征患者的無創通氣失敗風險評估模型。該研究前瞻性調查17個ICU共306例急性呼吸窘迫綜合征患者的相關資料,以241例患者作為模型構建組,以65例患者作為模型驗證組,采用最小絕對收縮和Lasso回歸相結合的方法進行特征選擇,并根據多元Logistic回歸分析結果篩選出6個風險因素,分別為年齡、無創通氣1~2 h后呼吸頻率、無創通氣1~2 h后PaO2/FiO2、非肺序貫器官衰竭評分、是否存在感染性休克、是否存在肺內源性ARDS,并對各個風險因素賦予一定的分值,總分為0~18分,風險評分≥5.5分為最佳截斷值,從而得出ARDS患者無創通氣失敗風險預測模型。模型構建組的AUC為0.84,敏感性為79%,特異性為74%,驗證組的AUC為0.81,說明模型的預區分度良好。但該研究僅報告了模型驗證組的AUC,未報告驗證組的敏感性及特異性,且未進行擬合優度檢驗;僅進行模型內部驗證,未進行外部臨床驗證,因此模型預測的準確性和適用性有待進一步研究。
(3)Luo等[34]構建的模型:2017年,Luo等[34]前瞻性地納入了2012年3月—2015年3月118例急性心源性肺水腫患者的人口統計學、生命體征、血氣分析值、急性心源性肺水腫原因、病史、實驗室指標、急性生理和慢性健康評估Ⅱ評分、心功能分級、左心室射血分數、GCS評分和呼吸困難評分等,以無創通氣失敗為主要結局變量,通過多變量Logistic回歸顯示心功能分級、左心室射血分數、B型利鈉肽以及24小時液體平衡情況是無創通氣治療失敗的獨立風險因素。該研究根據這些獨立危險因素建立了預測模型,該模型的AUC為0.97,敏感性為86%,特異性為99%,陽性預測值為97%,陰性預測值為92%,模型預測的正確率為94%,表明模型的區分度和預測能力較佳。此預測模型存在不足之處:① 樣本量較少,存在選擇偏倚,缺少如行冠脈造影等可能影響無創通氣的專科數據;② 文獻回顧發現,此模型尚未見推廣和臨床應用。
2.1.2 Ⅱ型呼吸衰竭
(1)Quigley等[44]構建的模型:Quigley等[44]回顧性收集2016年11月—2018年3月使用無創通氣的急性高碳酸血癥呼吸衰竭患者的相關資料,以無創通氣后進行機械通氣或死亡為結局指標,采用逐步Logistic回歸分析篩選出5個風險因素,分別為年齡≥70歲、白細胞計數≥15×109/L、是否存在慢阻肺、是否存在急性肺水腫以及肌酐≥310 μmol/L,并對每個變量賦予一定分值,總分為0~29分,總分越高,無創通氣失敗的風險越大。該模型的AUC為0.75(95%可信區間0.67~0.84),且經Hosmer-Lemeshow檢驗該模型擁有良好的區分度和一致性(χ2=2.96,P=0.8)。該研究將預測結果與Martinez-Urbistondo等[45]修訂的無創通氣患者簡明急性生理學評分3(Simplified Acute Physiology Score 3 Customised for Noninvasive Ventilation,SAPS3-CNIV)工具進行比較,結果發現該風險預測模型具有更好的判別性能,且該模型僅包含5個變量,而SAPS3-CNIV為34個。相對來說,Quigley等[44]構建的模型評分簡單,易于操作,在臨床實際工作中易于展開。然而在該研究尚未報道特異性與敏感性,且未被其他學者驗證,模型的預測能力還需要進一步探討。
(2)Duan等[46]構建的模型:Duan等[46]在Ⅰ型呼吸衰竭患者無創通氣失敗風險預測模型的基礎上,采用前瞻性研究方法,同樣以心率、酸中毒、意識、氧合情況和呼吸頻率建立Ⅱ型呼吸衰竭患者無創通氣失敗的風險預測模型,并轉換為HACOR指數評分表,其總分為0~27分。該模型在構建組(AUC=0.90、敏感性=70.2%、特異性=92.6%)、內部驗證組(AUC=0.89、敏感性=77.1%、特異性=93.5%)和外部驗證組(AUC=0.71、敏感性=62.9%、特異性=75.8%)均具有良好的預測效能。與Ⅰ型呼吸衰竭患者的HACOR指數比較,Ⅱ型呼吸衰竭患者的HACOR指數納入的是相同變量,但二者各個變量的賦值權重不同,詳細賦值見表1。與Ⅰ型呼吸衰竭類似,以HACOR指數5分為判斷閾值,>5分即為無創通氣失敗高風險患者,分值越高預示患者無創通氣失敗的風險也就越大。該量表同樣可在床旁快速評估,也可以連續動態地評估患者無創通氣的療效。Ding等[47]將該指數評分表應用于高風險、非慢阻肺的慢性呼吸衰竭急性加重患者中,HACOR指數評分表在無創通氣治療開始時、治療1~2 h、治療12 h和治療24 h的AUC分別為0.69、0.91、0.91、0.94;敏感性分別為68%、90%、82%、100%;特異性分別為61%、85%、91%、76%,顯示該指數評分表具有較好的臨床預測價值,可在臨床上進行推廣。

(3)丁偉超等[48]構建的模型:2021年我國學者丁偉超等[48]回顧性分析2015年1月—2019年12月入住急診ICU行無創通氣的78例慢阻肺急性加重患者的臨床資料,將經過無創通氣后呼吸好轉、血氣指標改善、排痰順利等患者納入無創通氣成功組,無創通氣后憋喘、血氣指標等無改善或進行性加重需行氣管插管者納入無創通氣失敗組,經過二元logistics回歸分析初步建立慢阻肺急性加重患者無創通氣失敗風險預測模型。受試者操作特征曲線分析顯示,二氧化碳分壓聯合白蛋白水平的AUC為0.840(95%可信區間0.737~0.944),敏感性86.7%,特異性81.2%,其預測能力優于單一指標[48]。但是該模型納入的預測指標、病例樣本量均較少,在一定程度上降低了模型的預測性能;且尚未進行外部驗證,也缺乏擬合優度檢驗檢驗,模型的預測效能未能進行客觀評價。
2.2 基于COX風險回歸
李錄等[38]于2021年回顧性分析100例急性高碳酸血癥呼吸衰竭患者的臨床資料,以行無創通氣后出現插管指征為結局指標,初步建立急性高碳酸血癥呼吸衰竭患者無創通氣失敗風險預測模型。采用COX比例回歸分析建立風險預測模型:無創通氣治療失敗風險指數=0.808X1(心率≥120次/min)+1.067X2(胸部X線片示病變浸潤≥3個象限)+1.79X3(合并重癥肺炎)+0.675X4(SAPSⅡ≥34分),根據風險比值(hazard ratio,HR)推斷,合并重癥肺炎是無創通氣治療失敗最重要的危險因素。該研究將風險模型評分進行分層:分值0~1分為低危,1~2分為中危,≥2分為高危,為今后降低急性低氧性呼吸衰竭患者無創通氣失敗制定干預措施提供了參考依據。該評估模型的AUC為0.882(95%可信區間0.817~0.948),提示該模型預測效能中等。但是該研究未報告敏感性和特異性結果,僅進行模型內部驗證,未進行外部臨床驗證,其在臨床中的應用效果如何有待考究。
3 基于機器學習算法構建的無創通氣失敗風險預測模型
3.1 基于梯度推進機模型
2021年,Feng等[49]報道了應用時間梯度提升模型(time updated light gradient boosting machine model,TULightGBM)構建晚期無創通氣失敗的預測模型。TULightGBM模型采用多個LightGBM模型作為子模型,子模型通過可變的數據采樣窗口獲得的子集進行訓練,該模型由4個部分組成:輸入層、基礎模型、集成層和輸出層。在輸入層,按給定的時間段加載臨床數據。基礎模型負責預測每個時期的患者狀態,集成層負責組合每個基本模式的結果,最后在輸出層生成無創通氣晚期失敗的預測結果,并隨無創通氣的時間進程進行更新。該研究基于美國大型重癥醫療數據MIMIC-Ⅲ,納入5653例患者的數據,提取了人口統計學、生命體征及以及具有時間序列特征的生理生化數據共26個變量作為輸入變量,設計數據采樣間隔時間分別為8 h、16 h、24 h、36 h、48 h,然后以患者無創通氣48 h后失敗為輸出變量構建集成模型。該模型分別選擇60%、20%和20%的數據集作為訓練集、驗證集和測試集。結果發現,在基礎模型中,與Logistic回歸(logistic regression,LR)、人工神經網絡(artificial neural network,ANN)、隨機森林(random forest,RF)、極限梯度提升(extreme gradient boosting,XGBoost)相比,LightGBM更適合預測患者晚期無創通氣失敗,其AUC為0.8323(LR:0.6960,ANN:0.7533,RF:0.8039,XGBoost:0.8301),預測性能較好。研究還發現,與長短時記憶遞歸神經網絡(long short term memory network,LSTM)方法建模的預測結果進行比較,隨著試驗時間的推移,TULightGBM集成模型的AUC、敏感性、特異性和準確性的所有值均呈不斷增加的趨勢。具體而言,TULightGBM在5個采樣時間的AUC動態測試結果分別為0.8323、0.8435、0.8576、0.8886和0.9123,其敏感性分別為0.7475、0.7753、0.7651、0.8005和0.8207,特異性分別為0.7479、0.7500、0.7611、0.7942和0.8164,準確性分別為0.7476、0.7618、0.7629、0.7972和0.8184,結果均優于LSTM。該研究創建了首個無創通氣晚期失敗的風險預測模型,并具備較好的預測準確性。但構建此類模型需要大量的樣本數據作支撐,隨著5G時代及大數據共享時代的到來,構建基于公共健康大數據的風險預測模型,促進風險精準預測與管理是當今醫療的發展趨勢[50],可為此類模型的構建提供強有力的支持。該研究提出的模型僅在MIMIC-III數據集上進行了測試,需要通過外部數據庫和臨床試驗進行前瞻性評估。
3.2 基于決策樹模型
2017年西班牙學者Rodriguez等[13]報告了針對流感患者無創通氣失敗的風險預測工具,研究分析了在西班牙重癥醫學會前瞻性數據庫中共1898例入住ICU流感患者的相關資料,包括人口學特征、實驗室指標、序貫器官衰竭評估(sequential organ failure assessment,SOFA)、急性生理學和慢性健康狀況評價Ⅱ(acute physiology and chronic health evaluation Ⅱ,APACHEⅡ)、肺部浸潤數量、合并疾病等。根據單因素分析篩選流感患者無創通氣失敗的差異變量,將其納入決策樹交互檢測模型進行分析。結果發現,決策生長樹3層,共7個終末節點,篩選出3個解釋變量,其中第一層為SOFA評分、第二層為肺部浸潤數量和是否合并慢阻肺,模型預測的準確性為70%。但在該研究中,并未報告模型的AUC、敏感性、特異性,其預測性能如何還有待進一步研究。
3.3 基于貝葉斯參數模型
2019年Weng等[51]通過分析四川省人民醫院呼吸內科2016年—2018年144例慢阻肺患者無創通氣使用療效的數據,采用決策樹的梯度提升機算法(gradient boosting decision tree,GBDT)與貝葉斯參數相結合的數據挖掘方法形成基于性別、年齡、病程、呼吸頻率、pH、氧分壓、二氧化碳分壓和白蛋白的預測模型,并在機器學習庫scikit-learn生成的兩個隨機2類分類模擬數據集中進行了驗證,結結果發現該研究所構模型(準確率為0.8667、精確率為0.9000、召回率為0.9500),比使用 GBDT與Logistic 回歸建模(準確率為0.8250、精確率為0.8667、召回率為0.9333)、使用GBDT與支持向量建模(準確率為0.7833、精確率為0.8167、召回率為0.9500)的預測準確性更佳,且在模擬數據1、模擬數據2中同樣具有較高的預測性能。該研究結果所構建的慢阻肺患者無創通氣失敗預測模型,預測指標包含患者一般資料、生命體征及實驗室檢查,納入危險因素比較全面,但其建模的樣本量較少,未來還需要在不同的數據庫中進一步驗證該模型的適用性,以增加臨床應用價值。
3.4 基于堆疊集成算法
2022年,Liang等[52]報道了一項基于堆疊集成算法和自動編碼器構建無創通氣失敗預測模型的研究。該研究回顧性分析2 495例慢阻肺患者的數據,在入院時和無創通氣1 h后收集了患者的人口統計學、疾病診斷、既往病史、生命體征和生理參數等預測變量。該研究在特征生成階段利用LSTM自動編碼器自動提取具有時間序列的數據,并將其添加到數據集中,在建模階段將邏輯回歸、隨機森林、Catboost與疊加集成算法相結合以構建預測模型,在此階段所提出的預測模型采用Catboost、隨機森林和邏輯回歸作為基礎學習者,邏輯回歸作為元學習器。將每個基礎學習者的預測概率連接起來,形成一個新的訓練集來訓練元學習者。該模型隨機選取1996例患者作為訓練集,499例患者作為測試集,結果發現其AUC為0.915、準確率為0.882、F1為0.794、召回率為0.776、精確率為0.814,預測準確性能較好。研究還發現,與隨機森林、回歸分析、Catboost、支持向量、GBDT、XGBOOST、LightGBM方法建模的預測結果進行比較,把長短時記憶遞歸神經網絡模型與Catboost、隨機森林、邏輯回歸堆疊相結合的集成算法構建預測模型所得的的預測結果更優。該模型有效解決了具有時間序列特征的數據時間間隔較長而被遺漏的問題,并且充分考慮了連續變量在無創通氣失敗時間中的預測作用,避免了人為主觀將連續變量分類處理的影響,尤其適用于病情變化快和不穩定的ICU患者,因此無創通氣失敗預測的精準度更高。但是該模型仍然有待改善:操作方法比較復雜,缺乏外部驗證,其臨床使用效果如何還需要其他研究予以確定。
4 結語
無創通氣失敗的發生是年齡、心率、pH等多種因素共同作用的結果。國內外就無創通氣失敗風險預測模型的相關研究開展較多,納入危險因素較全面,研究方法多元化,模型預測性能較高。但大部分風險預測模型缺乏臨床驗證,危險因素多為分類變量,缺乏連續變量;且無創通氣是應用技術要求較高的技術,各地應用水平差別較大,無創通氣不同的鏈接方式在不同疾病致呼吸衰竭患者中的應用效果有一定差異[53],因此何種模型能更好的預測無創通氣失敗,尚無統一結論。
數據庫是建立有效風險預測模型的前提,也是預測模型準確性的可靠保證[54]。無創通氣技術應用要求高,其風險預測模型的建立更需要多中心數據支撐。因此,建議下一步的研究可建立多中心、大樣本、規范化的無創通氣數據共享平臺,對大樣本數據資料進行長時間的分析與研究,在此基礎上構建適用于中國人群的無創通氣失敗風險預測模型;并隨著地域的變化、時間的推移不斷調試修正,建立起在一定時期和地域內相對理想的預測模型或評分系統。此外,將基于大數據的預測模型結合信息技術構建在線風險計算網絡平臺,并不斷擴大其應用范圍,有望為醫務人員提供智能、實時、有效的預測工具,進而實現無創通氣失敗的早期預警和分級管理,以期減少無創通氣失敗的發生,提高患者生存率及預后。
利益沖突:本文不涉及任何利益沖突。
隨著無創通氣的發展和其循證醫學證據的積累,無創通氣的使用率逐年增加[1-2]。在重癥監護治療病房(intensive care unit,ICU)中,無創通氣作為呼吸衰竭患者的首選治療手段占比達24%[2]。國內外指南也強烈推薦將無創通氣用于慢性阻塞性肺疾病(簡稱慢阻肺)急性加重、急性左心衰竭、免疫抑制等患者,也可選擇性用于重癥肺炎、急性呼吸窘迫綜合征(acute respiratory distress syndrome,ARDS)等患者[3-7]。但在臨床實踐中,并非所有患者在使用無創通氣的過程中均可受益,在無創通氣受益有限時最終被認定為無創通氣失敗。無創通氣失敗指在無創通氣后需要氣管插管或者死亡[8]。無創通氣失敗率從5%到50%不等[1, 9-12],并且由于無創通氣失敗導致氣管插管而死亡的患者高達30%,高于一開始就接受機械通氣的患者的病死率[1]。在Ⅱ型呼吸衰竭患者中,無創通氣失敗者的院內病死率比初始直接行有創通氣的患者更高(27%比23%,P<0.01)[1]。在Ⅰ型呼吸衰竭患者中,無創通氣失敗者的院內病死率也比初始直接行有創通氣的患者高(38.4%比31.3%,P<0.01)[13]。由此可見,在進行無創通氣治療時應盡早識別無創通氣治療失敗的高風險人群,進而降低無創通氣的失敗率。近年來有許多學者構建了無創通氣失敗風險預測模型用于評估和篩查高風險人群,現將近年有關無創通氣失敗風險預測模型的研究進展綜述如下。
1 無創通氣失敗的危險因素
近年來,國內外關于無創通氣失敗的危險因素研究主要包括以下6個方面。(1)一般因素:年齡>65歲的患者無創通氣失敗率約為年齡≤65歲的16倍[14]。對于新生兒,6個月以下的年齡,無創通氣失敗率更高[15]。在癌癥患者中,男性患者無創通氣失敗率是女性的2.58倍[16];而在老年急性呼吸衰竭患者中,男性無創通氣失敗率是女性的1.067倍[17]。患者體重指數(body mass index,BMI)越低,越容易出現無創通氣失敗[18]。然而有研究指出,BMI≥25 kg/m2是心臟手術拔管后急性呼吸衰竭患者無創通氣成功的預測因子[19]。(2)生命體征及意識:無創通氣前,血壓下降是患者無創通氣失敗的重要預測因子之一[20-22],而當收縮壓<90 mm Hg(1 mm Hg=0.133 kPa)出現休克時,禁忌使用無創通氣[23]。心率及呼吸頻率的增加會增加無創通氣治療失敗的風險[22, 24-25]。低格拉斯哥昏迷量表(Glasgow coma scale,GCS)評分與無創通氣失敗相關[21, 26-28]。(3)血氣分析:患者氧合指數越低,越容易發生無創通氣失敗[29-31]。肺泡–動脈氧分壓差增高者其無創通氣失敗風險增高[29]。pH水平較低者更容易出現無創通氣失敗[21-22]。動脈血二氧化碳分壓水平較低患者其無創通氣失敗發生風險較高[32]。(4)實驗室指標及影像學檢查:在慢阻肺患者,較高的C反應蛋白及降鈣素原是無創通氣失敗的獨立危險因素,兩者的最佳截斷值分別為15.0 g/L及0.31 μg/L[33]。腦鈉肽≥3350 pg/mL的急性心源性肺水腫患者其無創通氣失敗率是腦鈉肽<3350 pg/mL者的39.63倍[34]。胸部X線檢查示病變浸潤象限數量的增加是無創通氣失敗的獨立危險因素[35-38]。(5)合并癥:合并多器官功能衰竭、肺炎者更容易發生無創通氣失敗[19-20]。合并活動性腫瘤、腎功能衰竭等同樣會提高無創通氣的失敗率[39-40]。(6)臨床評分:序貫器官衰竭評分≥5分的低氧血癥性急性呼吸衰竭患者無創通氣失敗的風險是序貫器官衰竭評分<5分患者的3.3倍[13]。簡明急性生理學評分Ⅲ得分越高,無創通氣越容易失敗[16]。Chawla等[20]研究發現,對于急性呼吸窘迫綜合征患者,無創通氣失敗組在急性生理與慢性健康評分Ⅱ得分上高于無創通氣成功組。Custodero等[17]通過COX回歸分析指出多維預后指數評分對無創通氣失敗有很好的鑒別能力(β=7.821,P<0.05)。當多維預后指數評分≥0.84時,其風險預測值將大于70.5%。多維預后指數評分是基于老年綜合評估衍生的評分指數,其包括日常生活能力、認知功能、營養風險評估、活動能力、壓力性損傷風險評估、用藥情況、居住狀況共8個領域,可用于預測老年患者的死亡風險和預后[41]。這些因素可為無創通氣失敗風險預測模型的構建提供參考依據。
2 基于傳統統計學方法構建的無創通氣失敗風險預測模型
2.1 基于Logistic回歸
2.1.1 Ⅰ型呼吸衰竭
(1)Duan等[25]構建的模型:Duan等[25]于2017年應用前瞻性觀察研究法,以2011年6月—2014年6月入院的449例Ⅰ型呼吸衰竭患者為模型組,以2014年7月至2016年6月入院的358例患者為驗證組,采用Logistic回歸分析,確定了5項預測因素,即心率(Heart rate)、酸中毒(Acidosis,通過pH評估)、意識(Consciousness)、氧合情況(Oxygenation,通過PaO2/FiO2評估)、呼吸頻率(Respiratory rate),構建出Ⅰ型呼吸衰竭患者早期無創通氣失敗的風險預測模型。為提高模型在臨床中的實用性,該研究還在此基礎上創建了簡易評分表,簡稱為HACOR指數評分表,其總分為0~25分,以HACOR指數5分作為判斷閾值,>5分預示患者無創通氣失敗風險高。建模組和驗證組的受試者操作特征曲線下面積(area under the receiver operator characteristic curve,AUC)分別為0.88、0.91,敏感性分別為72.6%、75.9%,特異性分別為90.2%、92.6%,準確性分別為81.8%、86.0%,這表明HACOR評分對無創通氣失敗具有良好的預測能力。研究還發現該量表預測患者無創通氣失敗的AUC在無創通氣1 h、12 h、24 h和48 h分別為0.89、0.87、0.88、0.87,敏感性分別為73.9%、66.9%、61.5%、60.3%,特異性分別為91.4%、92.3%、93.4%、95.6%,準確性分別為83.7%、82.3%、82.3%、84.2%,這意味著該量表可以進行單個時點的評估。此外,此量表也可進行連續動態的評估,若患者在無創通氣過程中總分逐漸下降說明無創通氣有效,若總分在上升或是無變化則說明無創通氣效果不佳。該研究創建了首個早期無創通氣失敗的風險預測模型,并將模型轉換為臨床使用的評分表,預測變量中包含的預測指標均客觀且易獲取,可在床旁快速評估,為醫護人員早期識別、預防無創通氣失敗提供了高效、簡便的篩查工具,可作為Ⅰ型呼吸衰竭患者無創通氣失敗風險預測工具。Carrillo等[42]于2020年將HACOP指數評分表應用于2748例低氧性急性呼吸衰竭患者中,該量表在預測低氧性急性呼吸衰竭患者無創通氣失敗在不同時段的AUC均大于0.8,敏感性大于66%,特異性大于85%,說明該評分表在外部驗證中有良好的預測能力,具有一定的外推性。
(2)Shu等[43]構建的模型:2022年,Shu等[43]構建了適用于急性呼吸窘迫綜合征患者的無創通氣失敗風險評估模型。該研究前瞻性調查17個ICU共306例急性呼吸窘迫綜合征患者的相關資料,以241例患者作為模型構建組,以65例患者作為模型驗證組,采用最小絕對收縮和Lasso回歸相結合的方法進行特征選擇,并根據多元Logistic回歸分析結果篩選出6個風險因素,分別為年齡、無創通氣1~2 h后呼吸頻率、無創通氣1~2 h后PaO2/FiO2、非肺序貫器官衰竭評分、是否存在感染性休克、是否存在肺內源性ARDS,并對各個風險因素賦予一定的分值,總分為0~18分,風險評分≥5.5分為最佳截斷值,從而得出ARDS患者無創通氣失敗風險預測模型。模型構建組的AUC為0.84,敏感性為79%,特異性為74%,驗證組的AUC為0.81,說明模型的預區分度良好。但該研究僅報告了模型驗證組的AUC,未報告驗證組的敏感性及特異性,且未進行擬合優度檢驗;僅進行模型內部驗證,未進行外部臨床驗證,因此模型預測的準確性和適用性有待進一步研究。
(3)Luo等[34]構建的模型:2017年,Luo等[34]前瞻性地納入了2012年3月—2015年3月118例急性心源性肺水腫患者的人口統計學、生命體征、血氣分析值、急性心源性肺水腫原因、病史、實驗室指標、急性生理和慢性健康評估Ⅱ評分、心功能分級、左心室射血分數、GCS評分和呼吸困難評分等,以無創通氣失敗為主要結局變量,通過多變量Logistic回歸顯示心功能分級、左心室射血分數、B型利鈉肽以及24小時液體平衡情況是無創通氣治療失敗的獨立風險因素。該研究根據這些獨立危險因素建立了預測模型,該模型的AUC為0.97,敏感性為86%,特異性為99%,陽性預測值為97%,陰性預測值為92%,模型預測的正確率為94%,表明模型的區分度和預測能力較佳。此預測模型存在不足之處:① 樣本量較少,存在選擇偏倚,缺少如行冠脈造影等可能影響無創通氣的專科數據;② 文獻回顧發現,此模型尚未見推廣和臨床應用。
2.1.2 Ⅱ型呼吸衰竭
(1)Quigley等[44]構建的模型:Quigley等[44]回顧性收集2016年11月—2018年3月使用無創通氣的急性高碳酸血癥呼吸衰竭患者的相關資料,以無創通氣后進行機械通氣或死亡為結局指標,采用逐步Logistic回歸分析篩選出5個風險因素,分別為年齡≥70歲、白細胞計數≥15×109/L、是否存在慢阻肺、是否存在急性肺水腫以及肌酐≥310 μmol/L,并對每個變量賦予一定分值,總分為0~29分,總分越高,無創通氣失敗的風險越大。該模型的AUC為0.75(95%可信區間0.67~0.84),且經Hosmer-Lemeshow檢驗該模型擁有良好的區分度和一致性(χ2=2.96,P=0.8)。該研究將預測結果與Martinez-Urbistondo等[45]修訂的無創通氣患者簡明急性生理學評分3(Simplified Acute Physiology Score 3 Customised for Noninvasive Ventilation,SAPS3-CNIV)工具進行比較,結果發現該風險預測模型具有更好的判別性能,且該模型僅包含5個變量,而SAPS3-CNIV為34個。相對來說,Quigley等[44]構建的模型評分簡單,易于操作,在臨床實際工作中易于展開。然而在該研究尚未報道特異性與敏感性,且未被其他學者驗證,模型的預測能力還需要進一步探討。
(2)Duan等[46]構建的模型:Duan等[46]在Ⅰ型呼吸衰竭患者無創通氣失敗風險預測模型的基礎上,采用前瞻性研究方法,同樣以心率、酸中毒、意識、氧合情況和呼吸頻率建立Ⅱ型呼吸衰竭患者無創通氣失敗的風險預測模型,并轉換為HACOR指數評分表,其總分為0~27分。該模型在構建組(AUC=0.90、敏感性=70.2%、特異性=92.6%)、內部驗證組(AUC=0.89、敏感性=77.1%、特異性=93.5%)和外部驗證組(AUC=0.71、敏感性=62.9%、特異性=75.8%)均具有良好的預測效能。與Ⅰ型呼吸衰竭患者的HACOR指數比較,Ⅱ型呼吸衰竭患者的HACOR指數納入的是相同變量,但二者各個變量的賦值權重不同,詳細賦值見表1。與Ⅰ型呼吸衰竭類似,以HACOR指數5分為判斷閾值,>5分即為無創通氣失敗高風險患者,分值越高預示患者無創通氣失敗的風險也就越大。該量表同樣可在床旁快速評估,也可以連續動態地評估患者無創通氣的療效。Ding等[47]將該指數評分表應用于高風險、非慢阻肺的慢性呼吸衰竭急性加重患者中,HACOR指數評分表在無創通氣治療開始時、治療1~2 h、治療12 h和治療24 h的AUC分別為0.69、0.91、0.91、0.94;敏感性分別為68%、90%、82%、100%;特異性分別為61%、85%、91%、76%,顯示該指數評分表具有較好的臨床預測價值,可在臨床上進行推廣。

(3)丁偉超等[48]構建的模型:2021年我國學者丁偉超等[48]回顧性分析2015年1月—2019年12月入住急診ICU行無創通氣的78例慢阻肺急性加重患者的臨床資料,將經過無創通氣后呼吸好轉、血氣指標改善、排痰順利等患者納入無創通氣成功組,無創通氣后憋喘、血氣指標等無改善或進行性加重需行氣管插管者納入無創通氣失敗組,經過二元logistics回歸分析初步建立慢阻肺急性加重患者無創通氣失敗風險預測模型。受試者操作特征曲線分析顯示,二氧化碳分壓聯合白蛋白水平的AUC為0.840(95%可信區間0.737~0.944),敏感性86.7%,特異性81.2%,其預測能力優于單一指標[48]。但是該模型納入的預測指標、病例樣本量均較少,在一定程度上降低了模型的預測性能;且尚未進行外部驗證,也缺乏擬合優度檢驗檢驗,模型的預測效能未能進行客觀評價。
2.2 基于COX風險回歸
李錄等[38]于2021年回顧性分析100例急性高碳酸血癥呼吸衰竭患者的臨床資料,以行無創通氣后出現插管指征為結局指標,初步建立急性高碳酸血癥呼吸衰竭患者無創通氣失敗風險預測模型。采用COX比例回歸分析建立風險預測模型:無創通氣治療失敗風險指數=0.808X1(心率≥120次/min)+1.067X2(胸部X線片示病變浸潤≥3個象限)+1.79X3(合并重癥肺炎)+0.675X4(SAPSⅡ≥34分),根據風險比值(hazard ratio,HR)推斷,合并重癥肺炎是無創通氣治療失敗最重要的危險因素。該研究將風險模型評分進行分層:分值0~1分為低危,1~2分為中危,≥2分為高危,為今后降低急性低氧性呼吸衰竭患者無創通氣失敗制定干預措施提供了參考依據。該評估模型的AUC為0.882(95%可信區間0.817~0.948),提示該模型預測效能中等。但是該研究未報告敏感性和特異性結果,僅進行模型內部驗證,未進行外部臨床驗證,其在臨床中的應用效果如何有待考究。
3 基于機器學習算法構建的無創通氣失敗風險預測模型
3.1 基于梯度推進機模型
2021年,Feng等[49]報道了應用時間梯度提升模型(time updated light gradient boosting machine model,TULightGBM)構建晚期無創通氣失敗的預測模型。TULightGBM模型采用多個LightGBM模型作為子模型,子模型通過可變的數據采樣窗口獲得的子集進行訓練,該模型由4個部分組成:輸入層、基礎模型、集成層和輸出層。在輸入層,按給定的時間段加載臨床數據。基礎模型負責預測每個時期的患者狀態,集成層負責組合每個基本模式的結果,最后在輸出層生成無創通氣晚期失敗的預測結果,并隨無創通氣的時間進程進行更新。該研究基于美國大型重癥醫療數據MIMIC-Ⅲ,納入5653例患者的數據,提取了人口統計學、生命體征及以及具有時間序列特征的生理生化數據共26個變量作為輸入變量,設計數據采樣間隔時間分別為8 h、16 h、24 h、36 h、48 h,然后以患者無創通氣48 h后失敗為輸出變量構建集成模型。該模型分別選擇60%、20%和20%的數據集作為訓練集、驗證集和測試集。結果發現,在基礎模型中,與Logistic回歸(logistic regression,LR)、人工神經網絡(artificial neural network,ANN)、隨機森林(random forest,RF)、極限梯度提升(extreme gradient boosting,XGBoost)相比,LightGBM更適合預測患者晚期無創通氣失敗,其AUC為0.8323(LR:0.6960,ANN:0.7533,RF:0.8039,XGBoost:0.8301),預測性能較好。研究還發現,與長短時記憶遞歸神經網絡(long short term memory network,LSTM)方法建模的預測結果進行比較,隨著試驗時間的推移,TULightGBM集成模型的AUC、敏感性、特異性和準確性的所有值均呈不斷增加的趨勢。具體而言,TULightGBM在5個采樣時間的AUC動態測試結果分別為0.8323、0.8435、0.8576、0.8886和0.9123,其敏感性分別為0.7475、0.7753、0.7651、0.8005和0.8207,特異性分別為0.7479、0.7500、0.7611、0.7942和0.8164,準確性分別為0.7476、0.7618、0.7629、0.7972和0.8184,結果均優于LSTM。該研究創建了首個無創通氣晚期失敗的風險預測模型,并具備較好的預測準確性。但構建此類模型需要大量的樣本數據作支撐,隨著5G時代及大數據共享時代的到來,構建基于公共健康大數據的風險預測模型,促進風險精準預測與管理是當今醫療的發展趨勢[50],可為此類模型的構建提供強有力的支持。該研究提出的模型僅在MIMIC-III數據集上進行了測試,需要通過外部數據庫和臨床試驗進行前瞻性評估。
3.2 基于決策樹模型
2017年西班牙學者Rodriguez等[13]報告了針對流感患者無創通氣失敗的風險預測工具,研究分析了在西班牙重癥醫學會前瞻性數據庫中共1898例入住ICU流感患者的相關資料,包括人口學特征、實驗室指標、序貫器官衰竭評估(sequential organ failure assessment,SOFA)、急性生理學和慢性健康狀況評價Ⅱ(acute physiology and chronic health evaluation Ⅱ,APACHEⅡ)、肺部浸潤數量、合并疾病等。根據單因素分析篩選流感患者無創通氣失敗的差異變量,將其納入決策樹交互檢測模型進行分析。結果發現,決策生長樹3層,共7個終末節點,篩選出3個解釋變量,其中第一層為SOFA評分、第二層為肺部浸潤數量和是否合并慢阻肺,模型預測的準確性為70%。但在該研究中,并未報告模型的AUC、敏感性、特異性,其預測性能如何還有待進一步研究。
3.3 基于貝葉斯參數模型
2019年Weng等[51]通過分析四川省人民醫院呼吸內科2016年—2018年144例慢阻肺患者無創通氣使用療效的數據,采用決策樹的梯度提升機算法(gradient boosting decision tree,GBDT)與貝葉斯參數相結合的數據挖掘方法形成基于性別、年齡、病程、呼吸頻率、pH、氧分壓、二氧化碳分壓和白蛋白的預測模型,并在機器學習庫scikit-learn生成的兩個隨機2類分類模擬數據集中進行了驗證,結結果發現該研究所構模型(準確率為0.8667、精確率為0.9000、召回率為0.9500),比使用 GBDT與Logistic 回歸建模(準確率為0.8250、精確率為0.8667、召回率為0.9333)、使用GBDT與支持向量建模(準確率為0.7833、精確率為0.8167、召回率為0.9500)的預測準確性更佳,且在模擬數據1、模擬數據2中同樣具有較高的預測性能。該研究結果所構建的慢阻肺患者無創通氣失敗預測模型,預測指標包含患者一般資料、生命體征及實驗室檢查,納入危險因素比較全面,但其建模的樣本量較少,未來還需要在不同的數據庫中進一步驗證該模型的適用性,以增加臨床應用價值。
3.4 基于堆疊集成算法
2022年,Liang等[52]報道了一項基于堆疊集成算法和自動編碼器構建無創通氣失敗預測模型的研究。該研究回顧性分析2 495例慢阻肺患者的數據,在入院時和無創通氣1 h后收集了患者的人口統計學、疾病診斷、既往病史、生命體征和生理參數等預測變量。該研究在特征生成階段利用LSTM自動編碼器自動提取具有時間序列的數據,并將其添加到數據集中,在建模階段將邏輯回歸、隨機森林、Catboost與疊加集成算法相結合以構建預測模型,在此階段所提出的預測模型采用Catboost、隨機森林和邏輯回歸作為基礎學習者,邏輯回歸作為元學習器。將每個基礎學習者的預測概率連接起來,形成一個新的訓練集來訓練元學習者。該模型隨機選取1996例患者作為訓練集,499例患者作為測試集,結果發現其AUC為0.915、準確率為0.882、F1為0.794、召回率為0.776、精確率為0.814,預測準確性能較好。研究還發現,與隨機森林、回歸分析、Catboost、支持向量、GBDT、XGBOOST、LightGBM方法建模的預測結果進行比較,把長短時記憶遞歸神經網絡模型與Catboost、隨機森林、邏輯回歸堆疊相結合的集成算法構建預測模型所得的的預測結果更優。該模型有效解決了具有時間序列特征的數據時間間隔較長而被遺漏的問題,并且充分考慮了連續變量在無創通氣失敗時間中的預測作用,避免了人為主觀將連續變量分類處理的影響,尤其適用于病情變化快和不穩定的ICU患者,因此無創通氣失敗預測的精準度更高。但是該模型仍然有待改善:操作方法比較復雜,缺乏外部驗證,其臨床使用效果如何還需要其他研究予以確定。
4 結語
無創通氣失敗的發生是年齡、心率、pH等多種因素共同作用的結果。國內外就無創通氣失敗風險預測模型的相關研究開展較多,納入危險因素較全面,研究方法多元化,模型預測性能較高。但大部分風險預測模型缺乏臨床驗證,危險因素多為分類變量,缺乏連續變量;且無創通氣是應用技術要求較高的技術,各地應用水平差別較大,無創通氣不同的鏈接方式在不同疾病致呼吸衰竭患者中的應用效果有一定差異[53],因此何種模型能更好的預測無創通氣失敗,尚無統一結論。
數據庫是建立有效風險預測模型的前提,也是預測模型準確性的可靠保證[54]。無創通氣技術應用要求高,其風險預測模型的建立更需要多中心數據支撐。因此,建議下一步的研究可建立多中心、大樣本、規范化的無創通氣數據共享平臺,對大樣本數據資料進行長時間的分析與研究,在此基礎上構建適用于中國人群的無創通氣失敗風險預測模型;并隨著地域的變化、時間的推移不斷調試修正,建立起在一定時期和地域內相對理想的預測模型或評分系統。此外,將基于大數據的預測模型結合信息技術構建在線風險計算網絡平臺,并不斷擴大其應用范圍,有望為醫務人員提供智能、實時、有效的預測工具,進而實現無創通氣失敗的早期預警和分級管理,以期減少無創通氣失敗的發生,提高患者生存率及預后。
利益沖突:本文不涉及任何利益沖突。