譫妄是老年住院患者中常見的并發癥,會導致患者認知功能下降,增加老年人失能、跌倒、死亡等風險,造成沉重的社會負擔。雖然目前已有多種床旁譫妄篩查量表,但譫妄臨床漏診率依舊居高不下,這可能與譫妄具有急性波動性、常于夜間發病的特點有關。隨著電子病歷智能化和自動化的日漸發展,已有研究探索了通過電子病歷識別譫妄患者,這為譫妄的診斷和預防提供了重要幫助。本文就電子病歷識別譫妄的研究現狀進行回顧與總結,并對該方法的發展前景進行展望,以期為智能化診斷譫妄提供依據和奠定基礎。
引用本文: 趙艷莉, 陳齡, 岳冀蓉. 基于電子病歷識別譫妄的研究現狀與展望. 生物醫學工程學雜志, 2020, 37(1): 185-188. doi: 10.7507/1001-5515.201909048 復制
引言
譫妄是一種多種原因引起的常見于老年住院患者的急性腦器質性精神障礙,主要表現為急性發作的意識紊亂,通常伴注意力不集中、思維混亂以及感覺、知覺功能的異常[1]。有研究顯示老年住院患者入院時譫妄發生率為 31%,住院期間譫妄發生率為 3%~45%[2-5]。譫妄的發生不僅會造成死亡率增加、住院時間延長、認知功能/軀體功能下降,還會增加醫療費用和加重照顧者負擔[6-12]。因此提高譫妄識別率并及時干預,可以改善譫妄的不良預后[13-16]。
目前國內外有多種用于譫妄的評定量表,主要有意識模糊評估法(Confusion Assessment Method,CAM)、記憶譫妄評定量表(Memorial Delirium Assessment Scale,MDAS)、3 分鐘譫妄診斷評估(3-Minute Diagnostic Interview for CAM-defined Delirium,3D-CAM)、譫妄評定量表(Delirium Rating Scale,DRS)等。其中 CAM 量表是使用最廣泛的譫妄篩查工具,Inouye 等[17]研究發現該量表的敏感度為 94%~100%,特異度為 90%~95%,具有較好的信效度。但是,由于譫妄具有急性起病和病情反復波動的特點,而 CAM 量表為床旁評估工具,難以動態掌握反復波動的病情,因此該量表篩查譫妄的準確性依賴于評估員的培訓程度和評估水平。此外在實際工作中臨床醫生的工作量較大,以至于難以及時發現譫妄,故譫妄漏診率仍較高。有研究發現在癌癥老年患者中,譫妄漏診率為 60%;急診老年患者中,譫妄漏診率甚至高達 84.6%[18-19]。為了避免床旁評估量表的局限性,近年來國外有研究制定了基于電子病歷的譫妄評估方法,該方法不受時間及空間的限制,可重復及規范地對患者進行回顧性評估,從而進一步提高譫妄識別率。目前國內尚未見到此類研究的相關報道。本文就目前基于電子病歷識別譫妄相關方法的研究與應用予以綜述,并對此類評估方法的發展前景進行展望,旨在為今后建立計算機自動化篩查譫妄模型和人工智能譫妄識別系統奠定基礎。
1 電子病歷識別譫妄研究現狀
1.1 電子病歷評估譫妄問卷
電子病歷評估問卷于 2005 年由 Inouye 團隊[20]研發。此評估方法適用于經過專業培訓的臨床醫師,通過閱覽整份電子病歷來回答問卷中的 7 個問題。第一個問題為電子病歷中是否記錄患者出現急性意識狀態改變,如有則回答后續六個問題,包括電子病歷中有無急性意識狀態改變的具體描述、持續時間、是否采取干預措施以及有無好轉等。Inouye 等發現該問卷靈敏度達 74%,特異度達 83%。該方法的優勢在于不受時間和空間的限制,可回顧性地、重復地及規范地查看電子病歷來評估譫妄,特別是識別夜間突發的譫妄,從而使譫妄漏診率顯著減少。但和床旁評估工具相比,它存在以下局限性:① 需要接受過培訓的專業評估員,不適用于所有臨床醫師;② 只能進行回顧性評估,無法實時提醒醫務人員;③ 評估結果依賴于評估員的個人經驗和譫妄患者的癥狀是否典型;④ 需人工瀏覽患者的全部電子病歷,工作量較大,整個過程需要 15~30 min,如評估數量較多則需花費較多人力和時間,因此該方法的可推廣性較差。
1.2 病歷提取關鍵詞識別譫妄
Kuhn 等[21]于 2014 年提出從病歷資料中提取關鍵詞識別譫妄,該研究共納入 95 例患者的病歷,其中包含 29 名根據美國精神疾病診斷與統計手冊第四版(Diagnostic and Statistical Manual of Mental Disorders-Ⅳ,DSM-Ⅳ)標準診斷為譫妄的患者。首先由經過專業培訓的評估員讀取病歷資料,同時進行以下關鍵詞的提取:神志不清、意識水平改變、知覺障礙、精神運動紊亂、定向障礙、記憶障礙等。再將評估員提取的內容交給專家小組,根據 DSM-Ⅳ譫妄診斷標準將患者分為無譫妄、可疑譫妄和譫妄三組,最后進行一致性檢驗。研究發現使用“可疑譫妄”作為鑒別譫妄的臨界點時,此方法的敏感度為 84%,特異度為 77%;如使用“譫妄”作為臨界點,敏感度和特異度分別為 63% 和 92%。該方法的優勢在于可回顧性地從病歷資料中提取關鍵詞來評估譫妄。它的局限性在于:① 整個評估過程較為耗時;② 由于病歷記錄不規范或病歷質量較差,將會影響譫妄的評估質量;③ 評估過程較為繁瑣,同時需要專業評估員及專家小組進行評估,不適用于所有臨床醫師,因此不能廣泛應用于實際臨床。
1.3 計算機自動閱覽病歷識別譫妄
計算機自動閱覽病歷識別譫妄由 Mikalsen 等[22]在 2017 年研發并發表,這是國外首次嘗試利用計算機信息技術建立譫妄識別模型。Mikalsen 等通過提取 1 138 位行腹部手術且具有譫妄風險患者的電子病歷,運用一致聚類算法和t-分布領域嵌入算法(t-distributed stochastic neighbor embedding,t-SNE)制定出基于錨定詞的譫妄識別模型,研究發現調試后的模型識別譫妄的精確率-召回率曲線下面積為 0.96。該研究的局限性在于未使用美國精神疾病診斷與統計手冊第五版(Diagnostic and Statistical Manual of Mental Disorders-Ⅴ,DSM-Ⅴ)譫妄診斷標準作為參考標準進行對照,使用的參考標準為覺醒水平觀察量表(Observational Scale of Level of Arousal,OSLA),此方法與 CAM 量表相比敏感度和特異度相對較低,分別為 85% 和 82%[23]。此外,譫妄識別模型能否正確識別譫妄還取決于電子病歷文本質量,電子病歷中通常會出現不完整的句子或拼寫錯誤。綜上所述,該模型診斷譫妄的準確性將受到一定的影響,今后需進一步驗證此模型的敏感度、特異度及信效度。
2 電子病歷識別譫妄的展望
通過電子病歷識別譫妄是對現有床旁譫妄篩查工具的創新和補充,可極大地提高譫妄的早期識別率,無論是在譫妄的診斷還是治療方面,都有著廣泛的應用前景。但以上所述的病歷識別譫妄方法仍處于試驗階段,并未正式應用于臨床。目前我們對電子病歷識別譫妄進行了初步的探索,并首次構建出基于電子病歷的人工智能譫妄識別量表,研究發現該量表具有較好的可行性及信效度,此量表識別譫妄的敏感度和特異度分別為 77.8% 和 81.7%,這是國內外首次嘗試通過計算機自動化提取電子病歷中的關鍵詞來智能識別譫妄,但是該量表還處于試驗階段,量表的條目和框架仍待進一步完善。當前電子病歷識別譫妄的相關研究為今后建立人工智能譫妄預警系統奠定了堅實的基礎。隨著醫院信息化發展,利用信息技術建立疾病風險預警系統引起了學者的廣泛關注[24-30]。因此,人工智能譫妄識別及預警系統的實用化有望實現,在未來可以獨立依靠該系統對譫妄進行可靠的識別,進一步提高譫妄識別的準確性和效率,能有效節省人力成本和時間。此外,基于電子病歷的譫妄識別系統可隨著病歷中數據的更新而更新,可實現較高的時效性,使臨床醫生能實時監控患者的病情變化,及時獲得患者信息,以提高譫妄風險的應對能力。隨著計算機信息技術的普及,無論是三甲醫院還是基層醫療機構,都可以使用該系統來早期識別譫妄患者,這對于縮小我國目前醫療水平的差距和促進醫療資源的合理分配有著重要意義。
盡管基于電子病歷的譫妄識別及預警系統有著廣泛的應用前景,其存在的問題依然無法被忽視。人工智能識別系統對譫妄識別的準確性很大程度上取決于電子病歷質量的好壞,因此提高臨床醫生的病歷書寫規范尤為重要,這能有效促進今后建立更加智能高效的電子病歷系統。隨著病歷質量的提高,人工智能譫妄識別及預警系統將會逐漸應用于臨床,并將作為臨床診療決策支持系統的一部分,通過對電子病歷中的數據進行深度挖掘,智能、主動地提醒臨床醫護人員,最終實現降低譫妄漏診率的目的,提高醫生的工作效率,讓更多的譫妄患者得到及時干預。隨著人工智能理論和技術的不斷發展,未來將主要圍繞譫妄智能化診斷方法體系的建立進行探索。此外,隨著大數據時代的來臨,患者的診療策略更加需要基于數據分析而得出,未來人工智能譫妄識別系統的研發能使臨床數據中心的建立得到進一步完善,為醫療和科研提供更加完整統一的數據。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
譫妄是一種多種原因引起的常見于老年住院患者的急性腦器質性精神障礙,主要表現為急性發作的意識紊亂,通常伴注意力不集中、思維混亂以及感覺、知覺功能的異常[1]。有研究顯示老年住院患者入院時譫妄發生率為 31%,住院期間譫妄發生率為 3%~45%[2-5]。譫妄的發生不僅會造成死亡率增加、住院時間延長、認知功能/軀體功能下降,還會增加醫療費用和加重照顧者負擔[6-12]。因此提高譫妄識別率并及時干預,可以改善譫妄的不良預后[13-16]。
目前國內外有多種用于譫妄的評定量表,主要有意識模糊評估法(Confusion Assessment Method,CAM)、記憶譫妄評定量表(Memorial Delirium Assessment Scale,MDAS)、3 分鐘譫妄診斷評估(3-Minute Diagnostic Interview for CAM-defined Delirium,3D-CAM)、譫妄評定量表(Delirium Rating Scale,DRS)等。其中 CAM 量表是使用最廣泛的譫妄篩查工具,Inouye 等[17]研究發現該量表的敏感度為 94%~100%,特異度為 90%~95%,具有較好的信效度。但是,由于譫妄具有急性起病和病情反復波動的特點,而 CAM 量表為床旁評估工具,難以動態掌握反復波動的病情,因此該量表篩查譫妄的準確性依賴于評估員的培訓程度和評估水平。此外在實際工作中臨床醫生的工作量較大,以至于難以及時發現譫妄,故譫妄漏診率仍較高。有研究發現在癌癥老年患者中,譫妄漏診率為 60%;急診老年患者中,譫妄漏診率甚至高達 84.6%[18-19]。為了避免床旁評估量表的局限性,近年來國外有研究制定了基于電子病歷的譫妄評估方法,該方法不受時間及空間的限制,可重復及規范地對患者進行回顧性評估,從而進一步提高譫妄識別率。目前國內尚未見到此類研究的相關報道。本文就目前基于電子病歷識別譫妄相關方法的研究與應用予以綜述,并對此類評估方法的發展前景進行展望,旨在為今后建立計算機自動化篩查譫妄模型和人工智能譫妄識別系統奠定基礎。
1 電子病歷識別譫妄研究現狀
1.1 電子病歷評估譫妄問卷
電子病歷評估問卷于 2005 年由 Inouye 團隊[20]研發。此評估方法適用于經過專業培訓的臨床醫師,通過閱覽整份電子病歷來回答問卷中的 7 個問題。第一個問題為電子病歷中是否記錄患者出現急性意識狀態改變,如有則回答后續六個問題,包括電子病歷中有無急性意識狀態改變的具體描述、持續時間、是否采取干預措施以及有無好轉等。Inouye 等發現該問卷靈敏度達 74%,特異度達 83%。該方法的優勢在于不受時間和空間的限制,可回顧性地、重復地及規范地查看電子病歷來評估譫妄,特別是識別夜間突發的譫妄,從而使譫妄漏診率顯著減少。但和床旁評估工具相比,它存在以下局限性:① 需要接受過培訓的專業評估員,不適用于所有臨床醫師;② 只能進行回顧性評估,無法實時提醒醫務人員;③ 評估結果依賴于評估員的個人經驗和譫妄患者的癥狀是否典型;④ 需人工瀏覽患者的全部電子病歷,工作量較大,整個過程需要 15~30 min,如評估數量較多則需花費較多人力和時間,因此該方法的可推廣性較差。
1.2 病歷提取關鍵詞識別譫妄
Kuhn 等[21]于 2014 年提出從病歷資料中提取關鍵詞識別譫妄,該研究共納入 95 例患者的病歷,其中包含 29 名根據美國精神疾病診斷與統計手冊第四版(Diagnostic and Statistical Manual of Mental Disorders-Ⅳ,DSM-Ⅳ)標準診斷為譫妄的患者。首先由經過專業培訓的評估員讀取病歷資料,同時進行以下關鍵詞的提取:神志不清、意識水平改變、知覺障礙、精神運動紊亂、定向障礙、記憶障礙等。再將評估員提取的內容交給專家小組,根據 DSM-Ⅳ譫妄診斷標準將患者分為無譫妄、可疑譫妄和譫妄三組,最后進行一致性檢驗。研究發現使用“可疑譫妄”作為鑒別譫妄的臨界點時,此方法的敏感度為 84%,特異度為 77%;如使用“譫妄”作為臨界點,敏感度和特異度分別為 63% 和 92%。該方法的優勢在于可回顧性地從病歷資料中提取關鍵詞來評估譫妄。它的局限性在于:① 整個評估過程較為耗時;② 由于病歷記錄不規范或病歷質量較差,將會影響譫妄的評估質量;③ 評估過程較為繁瑣,同時需要專業評估員及專家小組進行評估,不適用于所有臨床醫師,因此不能廣泛應用于實際臨床。
1.3 計算機自動閱覽病歷識別譫妄
計算機自動閱覽病歷識別譫妄由 Mikalsen 等[22]在 2017 年研發并發表,這是國外首次嘗試利用計算機信息技術建立譫妄識別模型。Mikalsen 等通過提取 1 138 位行腹部手術且具有譫妄風險患者的電子病歷,運用一致聚類算法和t-分布領域嵌入算法(t-distributed stochastic neighbor embedding,t-SNE)制定出基于錨定詞的譫妄識別模型,研究發現調試后的模型識別譫妄的精確率-召回率曲線下面積為 0.96。該研究的局限性在于未使用美國精神疾病診斷與統計手冊第五版(Diagnostic and Statistical Manual of Mental Disorders-Ⅴ,DSM-Ⅴ)譫妄診斷標準作為參考標準進行對照,使用的參考標準為覺醒水平觀察量表(Observational Scale of Level of Arousal,OSLA),此方法與 CAM 量表相比敏感度和特異度相對較低,分別為 85% 和 82%[23]。此外,譫妄識別模型能否正確識別譫妄還取決于電子病歷文本質量,電子病歷中通常會出現不完整的句子或拼寫錯誤。綜上所述,該模型診斷譫妄的準確性將受到一定的影響,今后需進一步驗證此模型的敏感度、特異度及信效度。
2 電子病歷識別譫妄的展望
通過電子病歷識別譫妄是對現有床旁譫妄篩查工具的創新和補充,可極大地提高譫妄的早期識別率,無論是在譫妄的診斷還是治療方面,都有著廣泛的應用前景。但以上所述的病歷識別譫妄方法仍處于試驗階段,并未正式應用于臨床。目前我們對電子病歷識別譫妄進行了初步的探索,并首次構建出基于電子病歷的人工智能譫妄識別量表,研究發現該量表具有較好的可行性及信效度,此量表識別譫妄的敏感度和特異度分別為 77.8% 和 81.7%,這是國內外首次嘗試通過計算機自動化提取電子病歷中的關鍵詞來智能識別譫妄,但是該量表還處于試驗階段,量表的條目和框架仍待進一步完善。當前電子病歷識別譫妄的相關研究為今后建立人工智能譫妄預警系統奠定了堅實的基礎。隨著醫院信息化發展,利用信息技術建立疾病風險預警系統引起了學者的廣泛關注[24-30]。因此,人工智能譫妄識別及預警系統的實用化有望實現,在未來可以獨立依靠該系統對譫妄進行可靠的識別,進一步提高譫妄識別的準確性和效率,能有效節省人力成本和時間。此外,基于電子病歷的譫妄識別系統可隨著病歷中數據的更新而更新,可實現較高的時效性,使臨床醫生能實時監控患者的病情變化,及時獲得患者信息,以提高譫妄風險的應對能力。隨著計算機信息技術的普及,無論是三甲醫院還是基層醫療機構,都可以使用該系統來早期識別譫妄患者,這對于縮小我國目前醫療水平的差距和促進醫療資源的合理分配有著重要意義。
盡管基于電子病歷的譫妄識別及預警系統有著廣泛的應用前景,其存在的問題依然無法被忽視。人工智能識別系統對譫妄識別的準確性很大程度上取決于電子病歷質量的好壞,因此提高臨床醫生的病歷書寫規范尤為重要,這能有效促進今后建立更加智能高效的電子病歷系統。隨著病歷質量的提高,人工智能譫妄識別及預警系統將會逐漸應用于臨床,并將作為臨床診療決策支持系統的一部分,通過對電子病歷中的數據進行深度挖掘,智能、主動地提醒臨床醫護人員,最終實現降低譫妄漏診率的目的,提高醫生的工作效率,讓更多的譫妄患者得到及時干預。隨著人工智能理論和技術的不斷發展,未來將主要圍繞譫妄智能化診斷方法體系的建立進行探索。此外,隨著大數據時代的來臨,患者的診療策略更加需要基于數據分析而得出,未來人工智能譫妄識別系統的研發能使臨床數據中心的建立得到進一步完善,為醫療和科研提供更加完整統一的數據。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。