引用本文: 劉桂英, 王陽陽, 徐克珮, 李楊, 劉華平. 成人患者譫妄管理指南的質量評價. 中國循證醫學雜志, 2020, 20(7): 837-844. doi: 10.7507/1672-2531.201910139 復制
譫妄(delirium)是一種急性發作的以腦功能障礙為特征的綜合征,表現為精神狀態改變或波動、注意力不集中、思維紊亂或意識水平改變等[1]。根據人群和評估工具的不同,其發生率約為 16%~89%[2],在老年和危重患者中尤為高發[3, 4],且在醫院、長期照護、臨終關懷等醫療機構均有發生[5, 6]。目前已證實譫妄發生率、嚴重程度、持續時間與患者不良結局之間存在顯著相關性[1, 7, 8],將增加患者、照顧者和醫療衛生保健系統負擔[9]。如何有效識別、預防和治療譫妄已成為各醫療機構/部門討論的重點之一[5]。臨床實踐指南是通過系統評價相關科學證據及對各種備選干預方式進行利弊分析后提出的最優指導性文件[10],是能在特定臨床情境中幫助醫療人員決策的較權威工具之一[11]。隨著譫妄管理重要性得到重視,世界各國/組織制定了不同人群的譫妄管理臨床實踐指南,以指導醫療人員實施科學、有效、規范的譫妄管理[5]。然而,目前此類指南質量尚不清楚,具體推薦意見可能因目標人群、納入證據及專家意見的不同而不同,不利于醫務人員選擇,一定程度上影響臨床應用。AGREEⅡ(Appraisal of Guideline Research and EvaluationⅡ)工具是目前國際上普遍接受的指南方法學質量評價標準[11, 12]。本文通過系統檢索近十年發布的成人患者譫妄管理指南,采用 AGREEⅡ 評價其質量,并總結相關推薦意見,為指南更新、醫護人員選擇與應用提供建議與參考,以不斷優化譫妄管理。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 采用循證方式或基于循證證據與專家共識構建的臨床實踐指南;② 目標人群是成人患者;③ 發布于 2010 年 1 月 1 日之后;④ 文種為中、英文;⑤ 全文可獲取。
1.1.2 排除標準
① 僅基于專家共識/立場構建的指南;② 目標人群僅為婦產科、酒精/藥物戒斷的成人譫妄患者;③ 同一組織發布的舊版指南。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、WanFang Data 和 CNKI 數據庫,同時檢索國際指南聯盟(Guidelines International Network,GIN)、世界衛生組織(World Health Organization,WHO)、英國國家衛生和臨床優化研究所(National Institute for Health and Clinical Excellence,NICE)、加拿大安大略注冊護士專業協會(Registered Nurses’ Association of Ontario,RNAO)、蘇格蘭校際指南網(Scottish Intercollegiate Guidelines Network,SIGN),日本醫療信息網絡傳播服務中心(Medical Information Network Distribution Service,MINDS)、澳大利亞臨床指南網(Australian Clinical Practice Guidelines,ACPG)、加拿大老年心理健康聯盟(Canadian Coalition for Seniors’ Mental Health,CCSMH)及國內的醫脈通指南網。此外,檢索老年、神經、譫妄等相關國際醫學協會網站,包括美國老年協會(American Geriatric Society,AGS)、美國譫妄協會(American Delirium Society,ADS)、歐洲譫妄協會(European Delirium Association,EDA)、德國醫學科學協會(Association of the Scientific Medical Societies,AWMF)、澳大利亞與新西蘭老年醫學會(Australian & New Zealand Society for Geriatric Medicine,ANZSGM)。搜集關于成人譫妄管理相關的指南,檢索時限均從 2010 年 1 月 1 日至 2019 年 9 月 1 日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。英文檢索詞包括:delirium、sedation、analgesia、agitation、guideline 等。中文檢索詞包括:譫妄、指南等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入指南的基本信息,包括指南名稱、發表時間等;② 質量評價的關鍵要素;③ 對指南中譫妄管理推薦意見進行分類提取,提取過程中結合具體建議適當增減維度,合并相似的推薦內容,最終形成譫妄管理推薦意見匯總表。
1.4 納入指南的質量評價
1.4.1 指南質量評價
由 4 位研究者采用 AGREE Ⅱ 中文版,分別就 6 個領域共 23 個條目對指南質量進行獨立評價。每個條目評分 1~7 分,1 分表示完全不符合該條目,7 分為完全符合,條目得分越高,表明該指南制定的方法學描述越詳細、明確。將 4 人評價結果匯總后,各領域得分采用標準化百分比[11]表示,計算公式為:(實際得分?最低可能得分)/(最高可能得分?最低可能得分)×100%。標準化百分比越高,提示指南制定越符合規范,質量越高。根據各領域百分比分布情況,將指南推薦級別劃分為 3 個等級[12]。其中,A 級為“推薦”:6 個領域得分均≥60%,可不做修改直接推薦;B 級為“修改后推薦”:存在分數≥30% 的領域≥3 個,但有分數<60% 的領域,不同程度修改完善后推薦;C 級為“不推薦”:分數<30% 的領域≥3 個,因指南制定方法或證據質量低暫不推薦。
1.4.2 評價者間一致性檢驗
參與評價者評價前均完成了 AGREE 網絡培訓課程。評價結果通過組內相關系數(intraclass correlation coefficient,ICC)進行一致性檢驗。ICC<0.4 說明一致性較差;0.4≤ICC<0.75 一致性一般;≥0.75 則一致性較高。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻 622 篇,經逐層篩選后,最終納入 13 部指南[3, 4, 5, 6, 13, 14, 15, 16, 17, 18, 19, 20, 21]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表 1。

2.3 一致性評價
ICC 在 0.77~0.96 之間,一致性較高,表明評價結果較為可信(表 2)。

2.4 指南質量評價結果
納入指南質量評價的各領域評分見表 3。

2.4.1 領域一:范圍與目的
主要考察指南對總體目的、涵蓋衛生問題及目標人群的描述是否清晰明了。本文所納入指南在該領域的平均得分為 82.6%(44.4%~96.2%),說明均能較清晰地描述指南制定/更新的目的和重要性。得分 90% 以上的 4 部指南[5, 6, 16, 20, 21]均簡潔地闡明了健康內容(預防、診斷、治療譫妄)、預期結果(提高診斷率、縮短譫妄持續時間等)及目標人群。且在指南或附加材料中進一步明確目標人群的適用范圍,并對每個子項目涵蓋的衛生問題作了詳細說明。僅有 1 部指南[15]在此領域得分低于 60%,原因在于其只簡單提及指南構建的原因為更新認識、規范臨床運用,未闡述對患者的預期作用和結果,且未進一步解釋危重患者的范疇,整體描述較為模糊。
2.4.2 領域二:參與人員
主要是評價指南在開發和應用層面對于參與人員的描述,包括開發者信息、指南使用者范圍、目標人群意愿。此部分得分均較低,平均得分為 57.2%(6.3%~87.0%)。大部分指南均著重于描述開發小組信息,缺少目標人群的觀點收集和對使用者的界定,尤其是“目標人群觀點”在各條目中得分最低。這也是其他非譫妄指南中普遍缺乏的部分。得分大于 80% 的 3 部指南[5, 13, 20],不僅介紹開發小組結構、成員信息,還列舉出角色和分工,陳述指南使用者及使用方法,也說明了人群意愿收集方法,如患者直接參與[13]、人群意愿相關文獻總結[20]等。得分最低的指南[3]缺乏此領域的描述,也未提供補充材料說明。
2.4.3 領域三:嚴謹性
此領域主要評價指南對證據總結、更新和推薦意見形成過程的方法學描述,平均得分為 67.7%(0.7%~90.3%)。各指南對此部分描述的清晰程度不一,得分較低的集中在條目 13(外部評審方法)和條目 14(指南更新步驟),說明大部分指南均不同程度地描述了證據生成和推薦意見形成的方法和過程,但普遍缺乏外部評審方法[3, 13, 14, 19]和指南更新[3, 13, 15, 18, 21]的描述。1 部指南[3]缺乏對整體方法學描述,只簡寫為通過檢索、綜合文獻結果得出推薦意見,因此得分僅為 0.7%。
2.4.4 領域四:清晰性
清晰程度主要從推薦意見陳述、適用條件和識別難易三方面進行評價。此部分平均分為 82.5%(57.4%~90.7%),說明各指南普遍能結合證據對推薦意見及適用情況進行描述,且進行明確標識,部分指南提煉出更加直觀的表格或流程。
2.4.5 領域五:應用性
該領域的評價側重于指南實際應用指導,包括促進與阻礙因素分析、促進實施的方法及審計標準。平均得分為 48.6%(15.3%~81.9%),是得分最低的領域。得分高的 2 部指南[6, 20]提供了實施和審計內容,其他則欠缺對這部分的描述。得分較高為條目 21(審計標準)和 19(促進實施的工具),最低為條目 18(促進與阻礙因素分析),說明指南開發者普遍能關注審計及促進實施的方法。3 部指南[4, 6, 20]單獨提供了審計標準的章節或材料,而大部分指南只在證據論證過程中涉及評估或測量標準[3, 13, 14, 17, 19]。在促進實施策略方面,同樣只有 3 部指南[6, 13, 18]提供單獨的章節或材料,部分指南將推薦意見總結為臨床路徑或流程,以便進一步應用。對于實施所需資源的描述,主要是在團隊[18, 21]和經濟學[6, 13, 15, 17]方面,而普遍缺乏促進與阻礙因素的相關資料收集和分析[13]。
2.4.6 領域六:獨立性
獨立性評價主要是指指南開發成員的利益沖突描述與處理,包括聲明贊助來源、利益沖突和處理方法,平均得分為 67.3%(0%~97.2%)。除了 2 部指南[3, 15]外,其余都基本進行了描述,但只有 4 部指南[4, 6, 16, 18]闡釋了獨立性問題對制定過程的影響和應對方法。
2.5 譫妄管理推薦內容
各指南主要對譫妄管理中篩查、預測、非藥物及藥物預防和治療等方面進行了討論、證據分析及推薦建議,同時還要求進行相應的文件記錄、為患者及家屬提供信息支持,以及對醫務人員實施教育培訓,也探討了特殊類型譫妄的處理(表 4)。此外,5 部指南[3, 4, 5, 6, 16]總結了譫妄管理的臨床路徑。

2.5.1 譫妄監測與預測
在篩查方面,建議根據不同情境及目的采用相應工具。對于非精神科專業人員,篩查危重或無法發聲的患者建議采用 ICU 意識模糊評估法(confusion assessment method for the intensive care unit,CAM-ICU)[13, 15, 16, 19],評估譫妄嚴重程度可使用重癥監護譫妄篩查量表(intensive care delirium screening checklist,ICDSC)[13],住院或社區老年患者可采用 4 項譫妄快速診斷測試(4AT test)[5]、護理譫妄篩查量表(nursing delirium screening scale,NuDESC)[6]等工具。而癌癥患者的篩查工具由于證據不足,暫建議由精神科專業人員,使用譫妄評定方法(confusion assessment method,CAM)和譫妄分級量表-98 修訂版(delirium rating scale revised-98,DRS-R98)工具[3]進行診斷。SIGN 指南對于顱腦 CT、腰椎穿刺等客觀診斷方法進行了討論,不推薦常規使用,而僅建議在可疑顱腦器質性病變時行 CT 檢查[5]。大多數指南建議常規篩查或評估,然而僅部分指南對篩查頻率[18, 22]、持續時長[4]和患者狀態[17, 21]進行了規定:大多建議常規篩查,篩查頻率在 1~3 次/日,老年術后患者至少持續到術后 5 日。對于鎮靜患者,是在 RASS≥?2 分[15]抑或在 RASS 為?3~4 分[19]時進行譫妄評估,目前仍存在爭議。在譫妄預測方面,只有 2 部指南[13, 19]建議可使用 PRE-DELIRIC 模型對危重患者進行預測,其中 SCCM 建議在入科時及入科 24 小時進行[13],但其效果有待進一步驗證。
2.5.2 譫妄非藥物預防與治療
各指南中關于譫妄預防和治療的措施類似,均建議采用多元策略降低譫妄發生率或縮短譫妄持續時間,包括:① 治療原發病;② 識別并處理誘因;③ 跨專業團隊針對危險因素制定并實施多元非藥物措施;④ 評估實施效果。而多元非藥物措施的內容包括兩類:一類是維持內環境穩定,如體溫、氧合、體液、電解質平衡等;另一類是提供外部支持,如疼痛/鎮靜監測、心理支持、定向訓練、視聽覺輔助、早期活動、物理/職業治療、睡眠優化、減少環境改變、避免社會剝奪等。同時注意老年科或精神科專業人員的會診以及醫護人員隨訪等。而 ESA 的指南[4]由于目標人群為手術患者,針對此類患者譫妄發生的危險因素進行術中管理,包括手術路徑選擇、麻醉監測、疼痛管理和避免術前常規使用苯二氮卓類藥物。需注意的是,無論一元或多元措施目前都缺乏相應證據支持,而譫妄發生是多因素作用的結果,因此更強調多項措施綜合的效果探討[5]。
2.5.3 譫妄藥物預防與治療
各指南均因證據不足而不建議常規用藥防治,而更多指出可在特殊情況下,如嚴重躁動、焦慮影響治療進程或出現自傷或傷人表現時,短期使用小劑量右美托咪定和/或氟哌啶醇等抗精神病藥物控制癥狀。特殊類型譫妄如亞譫妄綜合征,其與患者不良結局之間存在聯系,但由于相關研究較少,證據不足,暫不推薦常規用藥防治,僅建議進行常規監測[13]。快速可逆型譫妄,常指鎮靜相關性譫妄,研究顯示其對患者結局無不良影響,因而未對其管理做出建議[15]。對于臨終患者頻死期的難治性譫妄,可由精神科專業人員評估后應用鎮靜藥物,整體以臨終關懷為主[14]。
3 討論
本研究對譫妄管理相關指南的評價結果顯示目前指南質量不一,平均標化百分比在 25%~85% 之間。其中,僅 NICE、RNAO 和 SIGN 發布的 3 部指南[5, 6, 20]的得分較高,各領域評分>60%,平均標化百分比>80%,可直接為醫務人員應用。而 2 部指南[3, 15]因制定方法存在問題,6 個領域得分均較低,且存在某領域得分幾乎為 0 的情況,因而暫不推薦使用。其他 8 部指南在各領域方面的得分不一,標化百分比≥60% 的領域為 2~5 個,建議符合目標人群的機構經修改后再考慮是否使用。納入的 IPS[3]、ESA[4]、SIGN[5]、ESMO[14]、AGS[17]、CCSMH(老年版)[18],NICE[20]和 CCSMH(臨終版)[21]8 部為譫妄管理專門指南,其余為非專門指南。盡管從評價結果看,兩類指南在得分領域分布上無明顯特征,但在推薦意見內容上,專門指南的建議更為詳細,且對各項措施逐一進行論證,而非專門指南常使用“建議采取多元非藥物措施”、“具體需更多研究進行驗證”等相對籠統的語言[15, 17, 18],在信息支持、人員教育方面也缺乏探討。造成以上差異的原因可能與指南評價工具更側重方法學評價而相對忽略證據內容有關,也可能是由于不同指南制定的整體目的和提出的子問題不同。此外,納入的指南中 2 部來自亞洲國家,11 部發布于歐美國家及拉丁美洲區域。由結果可知,亞洲 2 個國家譫妄指南發布質量較低,其中,印度 IPS 指南在 6 個領域得分均低于 65%,且 4 個領域得分≤25%,說明其欠缺對整體方法學的描述。納入的中文指南為得分最低的指南之一,除清晰性領域外,其余領域得分均低于 45%,其中獨立性領域得分為 0%。原因為指南制定主要側重于整合研究證據與專家意見后提出推薦意見,而同樣欠缺對指南制訂方法學的描述,可能與國內譫妄相關指南制定小組對制定流程的規范性意識較為缺乏有關。今后國內相關指南制訂人員需在整合證據的同時對各個影響因素進行考量、處理和描述,遵循循證指南制訂流程,采用指南質量評價工具,培訓指南制定者等以提高指南質量。
值得注意的是,本研究中的評價結果與其他譫妄指南系統評價相關文章[23]的結果相似,均表現為總體指南對各領域的關注度不一,且平均得分的總體趨勢相近,領域一(領域和目的)和領域四(清晰性)的得分最高,描述最為明確,其次為領域三(嚴謹性)和領域六(獨立性),領域二(參與人員)和領域五(應用性)得分最低。未來需進一步強化制訂嚴謹性和人員獨立性,尤其是在根據質量評價工具對證據進行分析、總結,以及證據如何影響推薦意見產生這兩個方面進行更為清晰地闡述。今后除寫明研究資助和利益沖突聲明外,應描述相關沖突對指南開發的影響及處理,以確保獨立性[3, 21]。各指南在參與人員和應用性領域的描述中均存在不同程度的不足,尤其是后者。原因之一可能為缺乏藥物與非藥物措施有效性的高水平證據,更多基于專家意見的最佳實踐聲明,因而未能對具體應用策略做出建議;另一方面,目前知識轉化中證據應用環節的方法學研究較為缺乏,指南實施效果有待進一步驗證,尚無相關應用經驗和策略以供借鑒[23];第三,開發手冊/準則中缺乏對應用性領域的方法學指導。而指南在促進應用方面的建議能夠幫助醫務人員更好地掌握指南、便于將指南整合進實踐中,同時幫助監測有效性,以促進指南實施的速度和持續性[23],這一領域是未來指南開發、更新與應用中應重點關注和加強的部分。具體可借鑒 NICE[20]和 RNAO[6]指南和網站,提供促進實施的材料及較詳細的審計標準。
因本研究主要納入基于循證和/或共識構建的指南,閱讀后發現基本能在綜合證據的基礎上結合對專家、患者意見的考量,因此,對 A、B 級指南可認為其整體推薦意見形成過程較為透明。盡管如此,指南制定的規范性仍存在一定問題。由于目前尚無公認的指南開發準則[22],各指南制定所遵循的方法學工具各不相同,或采用自制的開發小組手冊[5, 6, 14, 20],或遵循權威組織發布的指引[10]。工具的不同,可能對指南間的質量評價和對比產生影響,從而影響證據提取和應用。同時,盡管部分指南提及依據 GRADE(Grading of Recommendations Assessment,Development and Evaluation)工作組的指南開發方法學[24],經閱讀和評價后,發現其僅引用了部分方法學內容[3, 13, 15],如主題產生、證據質量評價、推薦意見產生等方法,并未完整依照 GRADE 推薦指南制定流程。對此,可能影響證據形成過程的透明度、規范性和嚴謹性。本研究中高質量(A 級)指南均嚴格遵循指南開發小組的工作手冊或準則進行制定[5, 6, 20],因而在制定流程、方法及各領域描述等方面較清晰明確,因此建議今后指南制定應遵循較成熟、完善的開發手冊進行。未來可對目前國際上的指南開發工具進行系統回顧、總結和對比,了解工具特征和異同,以便指南制定小組參考使用。此外,部分指南為更新版,而除 NICE 指南[20]外,其他如 IPS[3]、CCSMH(老年版)[18]并未提供更新的相關方法學描述。CCSMH(臨終版)[21]為依照 CCSMH(老年版)進行調適的版本,文中提供了具體操作流程。鑒于目前國際上并無規范的指南調適工具,后續指南工作小組可參考該流程,或制定指南調適的規范化工具等,以利于研究者根據目標人群疾病、種族等不同對已發布的高質量指南進行調適,促進指南的應用。
目前指南中指出需對譫妄進行規律監測,頻率在 1~3 次/日,其持續時間尚無規定,更多要求對譫妄陽性患者進行隨訪。監測工具依人群、情境而異,尤其在癌癥患者中的應用有待進一步驗證。未來可探討危重患者譫妄預測效果,以盡早采取預防措施。而盡管目標人群不盡相同,各指南關于譫妄防治的推薦意見相似。一方面可能由于關于藥物和非藥物管理目前證據均不足,尤其尚無有效藥物預防和治療譫妄,因此更多只能從采取多元非藥物措施、優化醫療護理質量的角度提出最佳實踐建議。另一重要因素可能是關于譫妄發生的病理生理機制尚未明確,防治主要針對可調節危險因素[25],此類因素在不同人群中存在相似性,因而管理措施趨同。值得注意的是,其中 1 部指南建議應構建質量評價指標評價譫妄非藥物管理的效果[19],如鎮靜深度、譫妄發生率和持續時間、跌倒等安全時間、活動能力等,未來醫護人員可據此,結合指南中提供的審計標準,探討并設立譫妄管理質量評價指標。
未來指南開發者應遵循規范的方法學工具,加強對嚴謹性、獨立性、應用性的描述,尤其應側重在應用性領域,而循證工作者可進一步對指南更新和調適流程進行探討,共同促進證據的轉化。在譫妄管理建議方面,各指南均建議對譫妄進行篩查和多元非藥物管理,必要時藥物控制躁動癥狀,但未來仍需高質量的研究驗證譫妄藥物/非藥物措施的有效性。此外,基于國內現有的譫妄相關指南在方法學上的不足,未來可在遵循指南制定方法學的基礎上,綜合國外指南,構建適用于國內患者的譫妄指南、臨床循證實踐方案和質量評價指標體系等。也可根據目前證據的現狀及存在的問題開展原始研究,以不斷改善譫妄管理,優化患者結局。
譫妄(delirium)是一種急性發作的以腦功能障礙為特征的綜合征,表現為精神狀態改變或波動、注意力不集中、思維紊亂或意識水平改變等[1]。根據人群和評估工具的不同,其發生率約為 16%~89%[2],在老年和危重患者中尤為高發[3, 4],且在醫院、長期照護、臨終關懷等醫療機構均有發生[5, 6]。目前已證實譫妄發生率、嚴重程度、持續時間與患者不良結局之間存在顯著相關性[1, 7, 8],將增加患者、照顧者和醫療衛生保健系統負擔[9]。如何有效識別、預防和治療譫妄已成為各醫療機構/部門討論的重點之一[5]。臨床實踐指南是通過系統評價相關科學證據及對各種備選干預方式進行利弊分析后提出的最優指導性文件[10],是能在特定臨床情境中幫助醫療人員決策的較權威工具之一[11]。隨著譫妄管理重要性得到重視,世界各國/組織制定了不同人群的譫妄管理臨床實踐指南,以指導醫療人員實施科學、有效、規范的譫妄管理[5]。然而,目前此類指南質量尚不清楚,具體推薦意見可能因目標人群、納入證據及專家意見的不同而不同,不利于醫務人員選擇,一定程度上影響臨床應用。AGREEⅡ(Appraisal of Guideline Research and EvaluationⅡ)工具是目前國際上普遍接受的指南方法學質量評價標準[11, 12]。本文通過系統檢索近十年發布的成人患者譫妄管理指南,采用 AGREEⅡ 評價其質量,并總結相關推薦意見,為指南更新、醫護人員選擇與應用提供建議與參考,以不斷優化譫妄管理。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 采用循證方式或基于循證證據與專家共識構建的臨床實踐指南;② 目標人群是成人患者;③ 發布于 2010 年 1 月 1 日之后;④ 文種為中、英文;⑤ 全文可獲取。
1.1.2 排除標準
① 僅基于專家共識/立場構建的指南;② 目標人群僅為婦產科、酒精/藥物戒斷的成人譫妄患者;③ 同一組織發布的舊版指南。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、WanFang Data 和 CNKI 數據庫,同時檢索國際指南聯盟(Guidelines International Network,GIN)、世界衛生組織(World Health Organization,WHO)、英國國家衛生和臨床優化研究所(National Institute for Health and Clinical Excellence,NICE)、加拿大安大略注冊護士專業協會(Registered Nurses’ Association of Ontario,RNAO)、蘇格蘭校際指南網(Scottish Intercollegiate Guidelines Network,SIGN),日本醫療信息網絡傳播服務中心(Medical Information Network Distribution Service,MINDS)、澳大利亞臨床指南網(Australian Clinical Practice Guidelines,ACPG)、加拿大老年心理健康聯盟(Canadian Coalition for Seniors’ Mental Health,CCSMH)及國內的醫脈通指南網。此外,檢索老年、神經、譫妄等相關國際醫學協會網站,包括美國老年協會(American Geriatric Society,AGS)、美國譫妄協會(American Delirium Society,ADS)、歐洲譫妄協會(European Delirium Association,EDA)、德國醫學科學協會(Association of the Scientific Medical Societies,AWMF)、澳大利亞與新西蘭老年醫學會(Australian & New Zealand Society for Geriatric Medicine,ANZSGM)。搜集關于成人譫妄管理相關的指南,檢索時限均從 2010 年 1 月 1 日至 2019 年 9 月 1 日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。英文檢索詞包括:delirium、sedation、analgesia、agitation、guideline 等。中文檢索詞包括:譫妄、指南等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入指南的基本信息,包括指南名稱、發表時間等;② 質量評價的關鍵要素;③ 對指南中譫妄管理推薦意見進行分類提取,提取過程中結合具體建議適當增減維度,合并相似的推薦內容,最終形成譫妄管理推薦意見匯總表。
1.4 納入指南的質量評價
1.4.1 指南質量評價
由 4 位研究者采用 AGREE Ⅱ 中文版,分別就 6 個領域共 23 個條目對指南質量進行獨立評價。每個條目評分 1~7 分,1 分表示完全不符合該條目,7 分為完全符合,條目得分越高,表明該指南制定的方法學描述越詳細、明確。將 4 人評價結果匯總后,各領域得分采用標準化百分比[11]表示,計算公式為:(實際得分?最低可能得分)/(最高可能得分?最低可能得分)×100%。標準化百分比越高,提示指南制定越符合規范,質量越高。根據各領域百分比分布情況,將指南推薦級別劃分為 3 個等級[12]。其中,A 級為“推薦”:6 個領域得分均≥60%,可不做修改直接推薦;B 級為“修改后推薦”:存在分數≥30% 的領域≥3 個,但有分數<60% 的領域,不同程度修改完善后推薦;C 級為“不推薦”:分數<30% 的領域≥3 個,因指南制定方法或證據質量低暫不推薦。
1.4.2 評價者間一致性檢驗
參與評價者評價前均完成了 AGREE 網絡培訓課程。評價結果通過組內相關系數(intraclass correlation coefficient,ICC)進行一致性檢驗。ICC<0.4 說明一致性較差;0.4≤ICC<0.75 一致性一般;≥0.75 則一致性較高。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻 622 篇,經逐層篩選后,最終納入 13 部指南[3, 4, 5, 6, 13, 14, 15, 16, 17, 18, 19, 20, 21]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表 1。

2.3 一致性評價
ICC 在 0.77~0.96 之間,一致性較高,表明評價結果較為可信(表 2)。

2.4 指南質量評價結果
納入指南質量評價的各領域評分見表 3。

2.4.1 領域一:范圍與目的
主要考察指南對總體目的、涵蓋衛生問題及目標人群的描述是否清晰明了。本文所納入指南在該領域的平均得分為 82.6%(44.4%~96.2%),說明均能較清晰地描述指南制定/更新的目的和重要性。得分 90% 以上的 4 部指南[5, 6, 16, 20, 21]均簡潔地闡明了健康內容(預防、診斷、治療譫妄)、預期結果(提高診斷率、縮短譫妄持續時間等)及目標人群。且在指南或附加材料中進一步明確目標人群的適用范圍,并對每個子項目涵蓋的衛生問題作了詳細說明。僅有 1 部指南[15]在此領域得分低于 60%,原因在于其只簡單提及指南構建的原因為更新認識、規范臨床運用,未闡述對患者的預期作用和結果,且未進一步解釋危重患者的范疇,整體描述較為模糊。
2.4.2 領域二:參與人員
主要是評價指南在開發和應用層面對于參與人員的描述,包括開發者信息、指南使用者范圍、目標人群意愿。此部分得分均較低,平均得分為 57.2%(6.3%~87.0%)。大部分指南均著重于描述開發小組信息,缺少目標人群的觀點收集和對使用者的界定,尤其是“目標人群觀點”在各條目中得分最低。這也是其他非譫妄指南中普遍缺乏的部分。得分大于 80% 的 3 部指南[5, 13, 20],不僅介紹開發小組結構、成員信息,還列舉出角色和分工,陳述指南使用者及使用方法,也說明了人群意愿收集方法,如患者直接參與[13]、人群意愿相關文獻總結[20]等。得分最低的指南[3]缺乏此領域的描述,也未提供補充材料說明。
2.4.3 領域三:嚴謹性
此領域主要評價指南對證據總結、更新和推薦意見形成過程的方法學描述,平均得分為 67.7%(0.7%~90.3%)。各指南對此部分描述的清晰程度不一,得分較低的集中在條目 13(外部評審方法)和條目 14(指南更新步驟),說明大部分指南均不同程度地描述了證據生成和推薦意見形成的方法和過程,但普遍缺乏外部評審方法[3, 13, 14, 19]和指南更新[3, 13, 15, 18, 21]的描述。1 部指南[3]缺乏對整體方法學描述,只簡寫為通過檢索、綜合文獻結果得出推薦意見,因此得分僅為 0.7%。
2.4.4 領域四:清晰性
清晰程度主要從推薦意見陳述、適用條件和識別難易三方面進行評價。此部分平均分為 82.5%(57.4%~90.7%),說明各指南普遍能結合證據對推薦意見及適用情況進行描述,且進行明確標識,部分指南提煉出更加直觀的表格或流程。
2.4.5 領域五:應用性
該領域的評價側重于指南實際應用指導,包括促進與阻礙因素分析、促進實施的方法及審計標準。平均得分為 48.6%(15.3%~81.9%),是得分最低的領域。得分高的 2 部指南[6, 20]提供了實施和審計內容,其他則欠缺對這部分的描述。得分較高為條目 21(審計標準)和 19(促進實施的工具),最低為條目 18(促進與阻礙因素分析),說明指南開發者普遍能關注審計及促進實施的方法。3 部指南[4, 6, 20]單獨提供了審計標準的章節或材料,而大部分指南只在證據論證過程中涉及評估或測量標準[3, 13, 14, 17, 19]。在促進實施策略方面,同樣只有 3 部指南[6, 13, 18]提供單獨的章節或材料,部分指南將推薦意見總結為臨床路徑或流程,以便進一步應用。對于實施所需資源的描述,主要是在團隊[18, 21]和經濟學[6, 13, 15, 17]方面,而普遍缺乏促進與阻礙因素的相關資料收集和分析[13]。
2.4.6 領域六:獨立性
獨立性評價主要是指指南開發成員的利益沖突描述與處理,包括聲明贊助來源、利益沖突和處理方法,平均得分為 67.3%(0%~97.2%)。除了 2 部指南[3, 15]外,其余都基本進行了描述,但只有 4 部指南[4, 6, 16, 18]闡釋了獨立性問題對制定過程的影響和應對方法。
2.5 譫妄管理推薦內容
各指南主要對譫妄管理中篩查、預測、非藥物及藥物預防和治療等方面進行了討論、證據分析及推薦建議,同時還要求進行相應的文件記錄、為患者及家屬提供信息支持,以及對醫務人員實施教育培訓,也探討了特殊類型譫妄的處理(表 4)。此外,5 部指南[3, 4, 5, 6, 16]總結了譫妄管理的臨床路徑。

2.5.1 譫妄監測與預測
在篩查方面,建議根據不同情境及目的采用相應工具。對于非精神科專業人員,篩查危重或無法發聲的患者建議采用 ICU 意識模糊評估法(confusion assessment method for the intensive care unit,CAM-ICU)[13, 15, 16, 19],評估譫妄嚴重程度可使用重癥監護譫妄篩查量表(intensive care delirium screening checklist,ICDSC)[13],住院或社區老年患者可采用 4 項譫妄快速診斷測試(4AT test)[5]、護理譫妄篩查量表(nursing delirium screening scale,NuDESC)[6]等工具。而癌癥患者的篩查工具由于證據不足,暫建議由精神科專業人員,使用譫妄評定方法(confusion assessment method,CAM)和譫妄分級量表-98 修訂版(delirium rating scale revised-98,DRS-R98)工具[3]進行診斷。SIGN 指南對于顱腦 CT、腰椎穿刺等客觀診斷方法進行了討論,不推薦常規使用,而僅建議在可疑顱腦器質性病變時行 CT 檢查[5]。大多數指南建議常規篩查或評估,然而僅部分指南對篩查頻率[18, 22]、持續時長[4]和患者狀態[17, 21]進行了規定:大多建議常規篩查,篩查頻率在 1~3 次/日,老年術后患者至少持續到術后 5 日。對于鎮靜患者,是在 RASS≥?2 分[15]抑或在 RASS 為?3~4 分[19]時進行譫妄評估,目前仍存在爭議。在譫妄預測方面,只有 2 部指南[13, 19]建議可使用 PRE-DELIRIC 模型對危重患者進行預測,其中 SCCM 建議在入科時及入科 24 小時進行[13],但其效果有待進一步驗證。
2.5.2 譫妄非藥物預防與治療
各指南中關于譫妄預防和治療的措施類似,均建議采用多元策略降低譫妄發生率或縮短譫妄持續時間,包括:① 治療原發病;② 識別并處理誘因;③ 跨專業團隊針對危險因素制定并實施多元非藥物措施;④ 評估實施效果。而多元非藥物措施的內容包括兩類:一類是維持內環境穩定,如體溫、氧合、體液、電解質平衡等;另一類是提供外部支持,如疼痛/鎮靜監測、心理支持、定向訓練、視聽覺輔助、早期活動、物理/職業治療、睡眠優化、減少環境改變、避免社會剝奪等。同時注意老年科或精神科專業人員的會診以及醫護人員隨訪等。而 ESA 的指南[4]由于目標人群為手術患者,針對此類患者譫妄發生的危險因素進行術中管理,包括手術路徑選擇、麻醉監測、疼痛管理和避免術前常規使用苯二氮卓類藥物。需注意的是,無論一元或多元措施目前都缺乏相應證據支持,而譫妄發生是多因素作用的結果,因此更強調多項措施綜合的效果探討[5]。
2.5.3 譫妄藥物預防與治療
各指南均因證據不足而不建議常規用藥防治,而更多指出可在特殊情況下,如嚴重躁動、焦慮影響治療進程或出現自傷或傷人表現時,短期使用小劑量右美托咪定和/或氟哌啶醇等抗精神病藥物控制癥狀。特殊類型譫妄如亞譫妄綜合征,其與患者不良結局之間存在聯系,但由于相關研究較少,證據不足,暫不推薦常規用藥防治,僅建議進行常規監測[13]。快速可逆型譫妄,常指鎮靜相關性譫妄,研究顯示其對患者結局無不良影響,因而未對其管理做出建議[15]。對于臨終患者頻死期的難治性譫妄,可由精神科專業人員評估后應用鎮靜藥物,整體以臨終關懷為主[14]。
3 討論
本研究對譫妄管理相關指南的評價結果顯示目前指南質量不一,平均標化百分比在 25%~85% 之間。其中,僅 NICE、RNAO 和 SIGN 發布的 3 部指南[5, 6, 20]的得分較高,各領域評分>60%,平均標化百分比>80%,可直接為醫務人員應用。而 2 部指南[3, 15]因制定方法存在問題,6 個領域得分均較低,且存在某領域得分幾乎為 0 的情況,因而暫不推薦使用。其他 8 部指南在各領域方面的得分不一,標化百分比≥60% 的領域為 2~5 個,建議符合目標人群的機構經修改后再考慮是否使用。納入的 IPS[3]、ESA[4]、SIGN[5]、ESMO[14]、AGS[17]、CCSMH(老年版)[18],NICE[20]和 CCSMH(臨終版)[21]8 部為譫妄管理專門指南,其余為非專門指南。盡管從評價結果看,兩類指南在得分領域分布上無明顯特征,但在推薦意見內容上,專門指南的建議更為詳細,且對各項措施逐一進行論證,而非專門指南常使用“建議采取多元非藥物措施”、“具體需更多研究進行驗證”等相對籠統的語言[15, 17, 18],在信息支持、人員教育方面也缺乏探討。造成以上差異的原因可能與指南評價工具更側重方法學評價而相對忽略證據內容有關,也可能是由于不同指南制定的整體目的和提出的子問題不同。此外,納入的指南中 2 部來自亞洲國家,11 部發布于歐美國家及拉丁美洲區域。由結果可知,亞洲 2 個國家譫妄指南發布質量較低,其中,印度 IPS 指南在 6 個領域得分均低于 65%,且 4 個領域得分≤25%,說明其欠缺對整體方法學的描述。納入的中文指南為得分最低的指南之一,除清晰性領域外,其余領域得分均低于 45%,其中獨立性領域得分為 0%。原因為指南制定主要側重于整合研究證據與專家意見后提出推薦意見,而同樣欠缺對指南制訂方法學的描述,可能與國內譫妄相關指南制定小組對制定流程的規范性意識較為缺乏有關。今后國內相關指南制訂人員需在整合證據的同時對各個影響因素進行考量、處理和描述,遵循循證指南制訂流程,采用指南質量評價工具,培訓指南制定者等以提高指南質量。
值得注意的是,本研究中的評價結果與其他譫妄指南系統評價相關文章[23]的結果相似,均表現為總體指南對各領域的關注度不一,且平均得分的總體趨勢相近,領域一(領域和目的)和領域四(清晰性)的得分最高,描述最為明確,其次為領域三(嚴謹性)和領域六(獨立性),領域二(參與人員)和領域五(應用性)得分最低。未來需進一步強化制訂嚴謹性和人員獨立性,尤其是在根據質量評價工具對證據進行分析、總結,以及證據如何影響推薦意見產生這兩個方面進行更為清晰地闡述。今后除寫明研究資助和利益沖突聲明外,應描述相關沖突對指南開發的影響及處理,以確保獨立性[3, 21]。各指南在參與人員和應用性領域的描述中均存在不同程度的不足,尤其是后者。原因之一可能為缺乏藥物與非藥物措施有效性的高水平證據,更多基于專家意見的最佳實踐聲明,因而未能對具體應用策略做出建議;另一方面,目前知識轉化中證據應用環節的方法學研究較為缺乏,指南實施效果有待進一步驗證,尚無相關應用經驗和策略以供借鑒[23];第三,開發手冊/準則中缺乏對應用性領域的方法學指導。而指南在促進應用方面的建議能夠幫助醫務人員更好地掌握指南、便于將指南整合進實踐中,同時幫助監測有效性,以促進指南實施的速度和持續性[23],這一領域是未來指南開發、更新與應用中應重點關注和加強的部分。具體可借鑒 NICE[20]和 RNAO[6]指南和網站,提供促進實施的材料及較詳細的審計標準。
因本研究主要納入基于循證和/或共識構建的指南,閱讀后發現基本能在綜合證據的基礎上結合對專家、患者意見的考量,因此,對 A、B 級指南可認為其整體推薦意見形成過程較為透明。盡管如此,指南制定的規范性仍存在一定問題。由于目前尚無公認的指南開發準則[22],各指南制定所遵循的方法學工具各不相同,或采用自制的開發小組手冊[5, 6, 14, 20],或遵循權威組織發布的指引[10]。工具的不同,可能對指南間的質量評價和對比產生影響,從而影響證據提取和應用。同時,盡管部分指南提及依據 GRADE(Grading of Recommendations Assessment,Development and Evaluation)工作組的指南開發方法學[24],經閱讀和評價后,發現其僅引用了部分方法學內容[3, 13, 15],如主題產生、證據質量評價、推薦意見產生等方法,并未完整依照 GRADE 推薦指南制定流程。對此,可能影響證據形成過程的透明度、規范性和嚴謹性。本研究中高質量(A 級)指南均嚴格遵循指南開發小組的工作手冊或準則進行制定[5, 6, 20],因而在制定流程、方法及各領域描述等方面較清晰明確,因此建議今后指南制定應遵循較成熟、完善的開發手冊進行。未來可對目前國際上的指南開發工具進行系統回顧、總結和對比,了解工具特征和異同,以便指南制定小組參考使用。此外,部分指南為更新版,而除 NICE 指南[20]外,其他如 IPS[3]、CCSMH(老年版)[18]并未提供更新的相關方法學描述。CCSMH(臨終版)[21]為依照 CCSMH(老年版)進行調適的版本,文中提供了具體操作流程。鑒于目前國際上并無規范的指南調適工具,后續指南工作小組可參考該流程,或制定指南調適的規范化工具等,以利于研究者根據目標人群疾病、種族等不同對已發布的高質量指南進行調適,促進指南的應用。
目前指南中指出需對譫妄進行規律監測,頻率在 1~3 次/日,其持續時間尚無規定,更多要求對譫妄陽性患者進行隨訪。監測工具依人群、情境而異,尤其在癌癥患者中的應用有待進一步驗證。未來可探討危重患者譫妄預測效果,以盡早采取預防措施。而盡管目標人群不盡相同,各指南關于譫妄防治的推薦意見相似。一方面可能由于關于藥物和非藥物管理目前證據均不足,尤其尚無有效藥物預防和治療譫妄,因此更多只能從采取多元非藥物措施、優化醫療護理質量的角度提出最佳實踐建議。另一重要因素可能是關于譫妄發生的病理生理機制尚未明確,防治主要針對可調節危險因素[25],此類因素在不同人群中存在相似性,因而管理措施趨同。值得注意的是,其中 1 部指南建議應構建質量評價指標評價譫妄非藥物管理的效果[19],如鎮靜深度、譫妄發生率和持續時間、跌倒等安全時間、活動能力等,未來醫護人員可據此,結合指南中提供的審計標準,探討并設立譫妄管理質量評價指標。
未來指南開發者應遵循規范的方法學工具,加強對嚴謹性、獨立性、應用性的描述,尤其應側重在應用性領域,而循證工作者可進一步對指南更新和調適流程進行探討,共同促進證據的轉化。在譫妄管理建議方面,各指南均建議對譫妄進行篩查和多元非藥物管理,必要時藥物控制躁動癥狀,但未來仍需高質量的研究驗證譫妄藥物/非藥物措施的有效性。此外,基于國內現有的譫妄相關指南在方法學上的不足,未來可在遵循指南制定方法學的基礎上,綜合國外指南,構建適用于國內患者的譫妄指南、臨床循證實踐方案和質量評價指標體系等。也可根據目前證據的現狀及存在的問題開展原始研究,以不斷改善譫妄管理,優化患者結局。