隨著循證醫學發展,臨床護理專家關注指南中推薦意見的證據來源逐漸增加,對護理臨床實踐指南需求日益重要。本文從護理專業角度出發,聚焦護理臨床實踐指南制訂的關鍵環節,包括指南范圍(或主題)和護理問題的確定、護理證據的檢索、結局指標的選擇和應用、證據及推薦意見的分級、證據至推薦意見轉化的方法、患者偏好和價值觀,并進行深入解析,以期為制訂護理臨床實踐指南提供建議。
引用本文: 靳英輝, 王云云, 曾鐵英, 曹英娟, 黃笛, 曾憲濤. 護理臨床實踐指南制訂關鍵環節的解析與思考. 中國循證醫學雜志, 2019, 19(4): 490-497. doi: 10.7507/1672-2531.201807041 復制
臨床護理工作是貫穿整個醫療服務的重要內容,護理質量的高低對患者病情的改善有很大影響。隨著循證醫學的發展,越來越多的臨床護理專家逐漸認識到臨床實踐指南(Clinical Practice Guideline,CPG)的重要性,并嘗試應用指南推薦意見指導臨床護理實踐。2011 年美國醫學科學院(Institute of Medicine,IOM)對指南的定義進行了 20 年來的首次更新,指出臨床實踐指南是圍繞患者特定的臨床問題,以系統評價為基礎,通過全面平衡各種備選干預方式的利弊,提出最優的指導意見[1]。護理臨床實踐指南(Nursing-CPG,N-CPG)特指關注解決護理問題的臨床實踐指南,N-CPG 作為臨床護理指導性文件旨在規范護士的臨床護理行為,幫助護理人員減少護理實踐的變異性,促進合理、公平、有效使用醫療資源。
規范地制訂指南是保證指南質量的基本條件,不同機構組織均提出了實踐指南的制訂方法,其基本流程和主要步驟相似[2]。WHO 指南手冊指出指南制訂過程分為決定制訂指南、與指南評審委員會秘書處討論、指南計劃、小組組件、構建關鍵問題、提交出版計劃許可、指南評審委員會批準、證據檢索、系統評價、GRADE 推薦意見分級、推薦意見制定、撰寫、外部評審等步驟[3]。但目前尚無權威機構組織發布的護理指南制訂方法學手冊,護理指南的制訂主要依據臨床實踐指南制訂的方法學和報告規范。故本文從護理專業角度,在指南范圍(或主題)和護理問題的確定、護理證據的檢索、結局指標的選擇和應用、證據及推薦意見的分級、證據至推薦意見的轉化方法、形成共識方法學、患者偏好與價值觀這 7 個重要方面進行深入解析,為 N-CPG 的制訂提供可參考的建議并希望與同行交流,最終促進 N-CPG 的制訂更科學、規范。
1 指南范圍(或主題)和護理問題的確定
指南范圍(或主題)常被作為指南制訂的首要步驟,指南涉及護理問題則是更明確聚焦待回答的具體臨床問題,它是在指南范圍和主題確定后通過分析最終確定的。指南多由一個范圍(或主題)和多個相關臨床問題組成。指南范圍(或主題)確定的一般原則是:具有重要臨床意義,如涉及發病率高、患病率高、死亡率高或經濟負擔大疾病,而指南實施很有可能改善患者重要結局或降低醫療成本;在臨床實踐中存在較大差異性;目前沒有相關主題及有效臨床指南可供使用,或研究證據不充分[4]。現代護理工作基于“整體護理”觀念,其內容廣泛,往往包括基礎護理(如口腔、皮膚、飲食)、癥狀護理(如疼痛、壓瘡)、專科護理(如糖尿病足、乳腺癌術后功能康復鍛煉)、技術護理(如 PICC、輸液港的護理)和健康教育等,另外病人出院后的社區護理及延續護理等內容等也屬于護理工作涵蓋的范圍,這些均可以成為 N-CPG 的范圍(或主題)。但 N-CPG 主題和范圍不可過大,如選用“糖尿病患者的管理指南”,則該指南可能涉及健康教育、心理護理、隨訪管理、藥物治療、糖尿病并發癥管理等多個方面,內容繁多、信息寬泛,制訂此類指南不僅消耗大量的時間和經費,也會導致研究人員難以把控指南制訂的質量,甚至不能明確其是否具有實際臨床指導意義。N-CPG 主題和范圍宜控制在單個護理主題下,如糖尿病患者的健康飲食教育護理指南。
在范圍和主題確定后,則需要確定其涵蓋的具體護理問題,指南提出的護理問題應該是臨床醫務人員在當時的臨床情景中關于某一問題的“困惑”,如重癥病人選擇吸痰方式時使用開放式吸痰還是密閉式吸痰,哪種方式更有助于降低患者肺感染的發生?患者發生譫妄后,是否使用約束帶,約束帶使用的時間如何確定?那么如何深入挖掘及如何具體化、結構化臨床護理問題?目前,研究者們主要通過文獻調研、德爾菲、關鍵知情人訪談、臨床調研、病歷回顧等途徑幫助指南制訂者獲取最有價值的、最直接的、最具體的臨床問題條目[5-8]。獲取臨床問題的途徑的優缺點如表 1 所示。我們認為,首先,在實際應用過程中指南制訂小組可以在廣泛文獻調研的基礎上,大致確定指南范圍(或主題)所涵蓋的臨床問題,將其進行歸類、合并后制作第一輪臨床護理專家(通常優選與主題相關的資深臨床護理一線工作人員)咨詢問卷,第一輪問卷調研建議調研樣本充足、代表性強,且注意設置開放性問題用以獲取未包括的重要臨床問題。其次,對第一輪問卷的回收結果進行分析總結,按一定的標準進行刪選;如有需要,制定第二輪調研問卷。同時,根據研究主題不同可同時納入患者、家屬、社工或相關管理人員進行調研、訪談或進行焦點小組討論,并將形成的結果補充到以上步驟中,從而獲得最終的臨床問題。指南問題的形成也可以采用德爾菲法,步驟與上類同。

在指南制訂過程中通常要結合以上多種方法以獲取不同指南利益相關方真正關注的重要臨床問題,從而保證制定出的指南符合臨床需求并有利于推廣。如在確定艾滋病臨床實踐指南臨床護理問題時,指南制訂小組一方面通過對 HIV 感染者和 AIDS 病人發放《HIV 感染者和 AIDS 病人護理需求問卷》,充分了解 HIV 感染者和 AIDS 病人在艾滋病相關癥狀管理、抗病毒治療管理和其它健康教育需求方面的護理需求現狀;另一方面通過對相關利益人群如 HIV 感染者、AIDS 病人、相關科室護士、醫生、醫院管理者進行訪談來了解他們對艾滋病臨床護理實踐現狀的認識、反思及護理需求[5]。
2 護理證據的檢索
2.1 檢索式的構建
對現有證據的檢索及篩選是指南制訂的重要環節。在開始檢索之前,指南制訂小組需明確針對特定臨床護理問題,按照“PICO”原則(目標人群:Population、干預措施:Intervention、對照或比較組采用的措施:Comparison、結局指標:Outcomes)將相關的臨床護理問題進行轉化[9]。值得注意的是,實際檢索過程中通常不會進行 PICO 四個部分的完整檢索,一般根據情況選擇 PI、PIC 格式。如想要了解針對糖尿病足壞疽截肢術圍術期患者的真實護理情況,則可以按照“PICo”(P 為人群、I 為感興趣的現象、Co 為具體的情景)三個方面構建檢索式。
2.2 檢索順序及系統評價的選用或制作
護理證據的檢索建議遵照 WHO 推薦的流程(圖 1)。首先確定是否存在回答此類問題的高質量系統評價,如果沒有則需進一步檢索相應的原始研究,再根據指南制訂小組的時間、經費、人力等條件決定是否需要自行制定系統評價 [10]。原則上希望指南制訂小組在缺乏高質量系統評價的時候,進行系統的原始文獻檢索和嚴格的質量評價而后對合格文獻進行定量或定性的合成,從而形成指南推薦意見。通常不建議不進行系統的文獻檢索,單獨應用 1 篇原始研究結果進行分級及推薦意見制定。

2.3 檢索策略的制定
所檢索數據庫除基本數據庫如 MEDLINE、EMbase、CBM、CNKI 等,還應注意檢索護理及與護理關系比較密切的數據庫如 CINAHL、PsycINFO,另外也應對收錄或制作高質量系統評價的機構如 The Cochrane Library、JBI 循證衛生保健數據庫、The Campbell Library 等進行檢索。若需制作系統評價,指南制訂人員不僅需檢索上述數據庫,還應檢索臨床試驗注冊平臺,如美國國立衛生研究院臨床試驗注冊平臺(ClinicalTrials.gov)和 WHO 國際臨床試驗注冊平臺(International Clinical Trials Registry Platform,ICTRP)。指南制訂小組在進行數據庫檢索時,需明確各數據庫的主題詞,結合“AND”、“OR”、“NOT”等邏輯運算符,制定敏感性高的檢索策略,并追溯納入研究的參考文獻。此外,研究者可根據初步檢索結果的數量來決定是否將研究設計類型作為檢索詞,如為了解鎮痛泵對乳腺癌患者疼痛的緩解效果,是否將“隨機對照試驗”作為檢索詞;如果想查找終末期患者照護者的心理體驗,原則上應該將“質性研究”作為檢索詞等。研究者應注意加入新的檢索詞會減少檢索結果,可能造成漏檢文獻。
2.4 衛生經濟學證據的使用
臨床干預的成本-效果或衛生經濟學證據在指南制訂中的作用逐漸受到重視,尤其是涉及人群比較廣泛的指南或藥物治療的指南。而護理指南中可能涉及器械、耗材等的選用,這也需要查找相關衛生經濟證據。例如壓瘡或傷口管理指南可能包含對不同傷口敷料的對比和推薦,指南制訂者可查詢該敷料的供應商了解該耗材的產品價格,也可通過數據庫(MEDLINE、EMbase、CINAHL 等)查找有無相應的衛生經濟學報告文件,或查找如 NHS Economic Evaluation Database 等相關數據庫。當此類證據缺乏時可由指南制訂小組進行調研來支持生成推薦意見。
3 結局指標的選擇和應用
結局指標用來衡量某一干預措施實施后干預效果和作用程度,是系統評價和指南中構建臨床問題、制作推薦意見時的關鍵要素[11-14]。結局指標的選擇不當,不僅影響干預措施與療效間的因果推斷,造成過高或者過低評估相應臨床試驗的研究價值,也會導致同一主題的臨床試驗因結局指標間差異過大,影響結果橫向比較或不能進行合并分析,導致研究結果存在分歧或不被廣泛認同[15]。因此,在 N-CPG 制訂過程中應當重視結局指標的選擇,并明確結局指標與證據、患者的偏好和價值觀間的關系。
目前,指南制訂過程中結局指標和臨床問題的確定采用相似方法[16, 17],同時指南制訂者在獲取結局指標后,應該按結局指標重要性進行分類。可參考 GRADE 體系將結局指標按其重要性分為 1~9 分,其中 7~9 為“關鍵結局”,4~6 分為“重要結局”,1~3 為“一般結局”。其中前兩類會對推薦意見的形成產生重要影響,第三類可能會也可能不會產生影響[18]。
N-CPG 制訂者在選擇結局指標時,仍需注意以下兩點問題:
第一,應當選擇患者最為關注的、最直接的、最重要的結局指標,如針對老年髖部骨折患者圍術期譫妄實施疼痛護理指南,因為研究者已確定疼痛是譫妄發生的危險因素,所以希望通過疼痛護理,達到理想結局指標。而針對疼痛護理,譫妄發生率、譫妄嚴重程度是研究者最關心的結局指標;疼痛的緩解程度是患者最為關注、也是干預實施后最為直接的結局;患者的滿意度是針對患者接受這項護理措施后,護理管理者最關注的結局指標;故以上指標均應納入指南的結局指標體系中。再如評價認知干預對老年性癡呆病人的干預效果時,設定認知功能改善,癡呆嚴重程度為關鍵結局指標,生活自理能力、照護者負擔是重要結局指標,焦慮、抑郁則是一般結局指標,故在制定相應推薦意見、考慮證據體質量時主要根據患者認知功能改善及癡呆嚴重程度改善的效應量大小。
第二,護理由于其專業性特點,患者對護理干預的期盼常常是短期目標的改善。如艾滋病病人管理指南[5]中,推薦采用綜合干預方式如 APP 服藥提醒、知識宣教、同伴教育、定期隨訪等來提高病人的服藥依從性,這時病人遵醫囑正確服藥是醫務人員最關心的結局,應該設置為關鍵結局指標;而遠期生存或死亡率,甚至病人的再住院率等對于提高服藥依從性來說其影響存在一定的間接性,所以可以不列為關鍵結局指標。再如針對晚期癌癥患者實施臨終護理,因護理干預很難降低患者死亡率或提高其生存率,其價值更多體現在維護患者臨終尊嚴、提高生活質量方面。故護理指南制訂小組需明確針對特定問題的護理干預措施,是否在遠期會對患者終點結局有影響以及影響的程度如何,最終決定是否納入遠期結局指標。
4 證據及推薦意見的分級
對于指南制訂者來說,如何在有限的時間內高效地判斷研究的質量,篩選出高質量的證據是指南制訂過程中難度最大且工作量最大的環節。
美國的兩位社會學家 Campbell 和 Stanley 首次引入證據分級的概念后[19-21],基于循證醫學和流行病學的發展,已有諸多由專業組織制定的證據及推薦意見的分級標準,如加拿大定期體檢特別工作組(Canadian Task Force on the Periodic Health Examination,CTFPHE)證據分級及推薦強度[22]、蘇格蘭院際指南網(The Scottish Intercollegiate Guidelines Network,SIGN)證據分級和推薦強度及推薦強度[23]、牛津證據分級標準[24]、GRADE 證據等級及推薦強度[25]等。證據及推薦意見的分級經歷了從單純考慮研究設計到綜合考慮多種因素如試驗設計、精確性、一致性、間接性、發表偏倚、患者的偏好和價值觀的發展過程[26]。其中 GRADE 系統由于其更加科學合理、過程透明、適用性強,目前已被 WHO、Cochrane 協作網等在內的 100 多個國際組織、協會和學會采用。但 GRADE 系統僅在干預性、診斷性、預后性和定性研究中有明確的分級方法,尚未對來自描述性研究、基于專業共識的系統評價、基于模型構建的證據合成等證據來源進行分級。
澳大利亞 Joanna Briggs 循證衛生保健中心(JBI)基于證據來源多元化的特點,將 GRADE 系統及 JBI 循證衛生保健模式結合起來制訂了 JBI 證據預分級及證據推薦級別系統,該系統將證據主題分為干預或治療、診斷、預后、經濟學評價、質性研究 5 種類型[27, 28]。針對推薦強度,JBI 認為應該考慮利弊平衡、證據質量、資源分配、患者的價值觀、意愿和體驗這 5 個因素,并據此將其分為強、弱兩個等級(表 2)[29]。JBI 2014 版的證據預分級和推薦級別系統,保留以往按設計分類的證據等級描述,易于使用者掌握,同時強調了證據的多元性特征,適用范圍廣,可操作性強。

N-CPG 制訂者在選擇證據及推薦意見分級的標準時,應當充分了解不同標準的特點,基于護理證據多元化、護理問題的類型及工具的可操作性等方面,恰當選擇證據分級標準。如研究性證據比較充分可以考慮使用 GRADE 進行證據分級與推薦意見制訂;同時涉及定性研究的證據體可同時結合 CERQual 分級[30, 31];研究證據非常多元,存在一定量的案例報告或專家意見則可以使用 JBI 證據分級系統;制訂中醫護理指南涉及古代醫籍中的護理方案時可以通過多輪專家咨詢制定出更實用的的證據分級及推薦意見制定標準。
5 證據至推薦意見的轉化方法
證據是指南制訂的基礎,但證據本身不能指導決策,證據至推薦意見轉化的過程是指南制訂過程中的關鍵環節。證據與推薦意見關系的清晰程度,直接影響臨床專家對推薦意見的認可程度。目前,國際尚無統一的證據至推薦意見轉化方法和標準。部分專業學會或組織為了更加規范化地制定推薦意見,提出了決策模型[32]、FAME 結構(JBI)[27]、DECIDE EtD 框架(GRADE)[33-35]等工具。然而,需要注意的是,各組織制定推薦意見時考慮的因素不完全相同。上述各工具中,JBI-FAME 結構廣泛應用于護理學及衛生保健領域,其是考慮證據的有效性、可行性、適宜性和臨床意義,結合證據的 JBI 推薦強度分級原則,由指南制訂小組確定證據的推薦強度[27]。JBI 詳細解釋了各因素的內涵,如證據的可行性,主要是從實施這樣干預措施的成本、所需資源的可及性進行考慮,不僅幫助指南制訂小組評估其是否包含與本指南主題推薦意見相關的可能需要考慮的因素,而且分類明確,避免相同的因素重復被考慮。而 FAME 結構條目清晰明了,對 N-CPG 的制訂具有很好的實用價值。
此外,GRADE 工作組開發了DECIDE EtD(Evidence to Decision)理論框架,用于協助指南制訂者規范證據至推薦意見的形成過程(表 3),其包括構建臨床問題、評價證據、得出結論 3 個步驟[33-35]。GRADE 工作組對每一步驟的具體內容均進行了說明,并詳細列出了各類型決策的待考慮的標準及各標準判斷的細節,如針對問題的優先性,主要從問題的嚴重性如何、問題的緊迫性如何、問題的優先性是否被普遍認可這三個角度出發進行評估[33-35, 36]。目前 EtD 因其明確而詳細的推薦意見制定流程、清晰且透明的評估方法,已被 WHO、哥倫比亞指南制作組等組織應用[37]。

N-CPG 制訂者在制訂推薦意見時,應充分考慮:① 結合指南適用人群的特點,明確推薦意見的類型;② 確定各推薦意見類型制訂時需要考慮的標準,并描述各標準詳細的評估依據;③ 選擇或者制訂最佳的證據至推薦意見轉化的工具,并在指南中詳細報告其過程。
6 形成共識的方法學
指南制作是一個復雜過程,其在臨床問題確定、結局指標選擇、推薦意見制訂等多環節均可能意見不一致。故臨床實踐指南的制訂離不開共識法,它是一種針對專家意見討論及觀點闡述進行分析的方法。另外,當缺乏證據支持和現有文獻不足時,指南制訂小組可以鑒于自己的專業知識和經驗經過群體共識會議起草出“共識性的推薦建議”[38]。目前醫學研究領域里最常用的“共識法”包括德爾菲法、名義群體法(Nominal Group Technique,NGT)和共識會議法(Consensus Development Conference,CDC)[39]。護理臨床實踐指南制訂者,可根據各方法特點,考慮本指南制訂組的時間、經費及資源,選擇最適合的方式解決不同專家間的意見分歧。同時,需要注意的是,既使推薦意見有高質量的研究證據支持,仍需倚重臨床專家的意見,借鑒他們豐富的臨床經驗,充分評估各因素如可行性、可接受性、資源等現狀,使指南更具臨床推廣性。
7 患者的偏好與價值觀
指南推薦意見的制訂,最終目的是應用于臨床,服務于患者。護理專業強調以人為本、人文護理,護理臨床實踐指南推薦意見的制訂更應充分考慮患者的偏好和價值觀,患者偏好和價值觀是干預措施可行性及應用性的判斷依據,尤其是在面對缺乏高質量證據支持的推薦意見及多個護理方案并存的情況時,患者偏好及價值觀的高度變異性和不確定性,會嚴重影響推薦意見的等級劃分[40]。然而,目前關于患者的偏好和價值觀的概念、評估工具和方法學尚不完善。
首先,不同組織對患者的偏好和價值觀的觀點不一。如 2012 年美國胸科醫師學院循證臨床實踐指南制訂小組認為它是指患者對健康和生命的信仰、期望與目標,包括患者面對不同診斷和治療時對其利弊、成本和負擔的權衡[41];GRADE 工作組則將其定義為患者對相關結局指標或健康狀態的重視程度[18]。前者是對患者偏好和價值觀較為綜合性的概念。后者明確提出針對結局指標考慮患者的偏好和價值觀,以滿足 GRADE 以系統評價的效應量指標作為證據體(Body of evidence)進行質量分級的需要[28]。對于某項干預措施效果的不同結局指標,護理指南制訂小組原則上應當選擇患者認為對其最為重要的結局指標的偏好及價值觀,用以指導證據分級和推薦意見的制訂[42]。
目前,獲取患者偏好和價值觀的方法,可大致分為 3 類:一類是基于已有相關文獻的研究結果;另一類是通過實時的問卷調查和質性訪談加以了解;此外指南制訂小組中納入患者人群也是收集其觀點意愿非常好的方式。雖然近幾年關于患者偏好及價值觀的原始研究和系統評價數量增多,但尚未發現將其結果應用到推薦意見制訂的方法學中[43-47]。通過實時的問卷調查或質性訪談,可以納入符合指南主題的來自不同臨床環境的患者,使獲得的信息具有代表性和適用性,但需注意的是在進行調研或者訪談時,患者對醫學信息的理解程度、呈現相關信息的方式和順序等都會影響患者偏好和價值觀的收集結果[42]。N-CPG 制訂者可針對特定臨床問題的特點及研究目的選擇最適宜的患者偏好及價值觀的獲取途徑。雖然指南小組中納入患者群體也可以在指南制訂過程中廣泛收集患者觀點,但需要注意應盡量避免帶有明顯個人傾向的觀點,而應該收集能夠反映患者人群的集中意見,這時患者代表的選取就顯得尤為重要。
N-CPG 制訂者在考慮患者的偏好和價值觀時,仍需注意幾點:① 明確本指南中患者的偏好和價值觀可操作性的定義;② 當基于文獻如原始研究、系統評價等考慮患者的偏好和價值觀時,應當充分考慮文獻研究人群與指南應用人群特點的符合程度,以及研究開展時間、研究人群來源(國家、醫院、社區等)等是否代表指南即將應用的當地患者的偏好和價值觀,同時考慮支持證據的質量。
總之,本文從護理專業角度出發,探討了護理指南范圍(或主題)和護理問題的確定、護理證據的檢索、結局指標的選擇和應用、證據及推薦意見的分級、證據至推薦意見轉化的方法、患者偏好和價值觀等問題,以期為制訂護理臨床實踐指南提供參考。
臨床護理工作是貫穿整個醫療服務的重要內容,護理質量的高低對患者病情的改善有很大影響。隨著循證醫學的發展,越來越多的臨床護理專家逐漸認識到臨床實踐指南(Clinical Practice Guideline,CPG)的重要性,并嘗試應用指南推薦意見指導臨床護理實踐。2011 年美國醫學科學院(Institute of Medicine,IOM)對指南的定義進行了 20 年來的首次更新,指出臨床實踐指南是圍繞患者特定的臨床問題,以系統評價為基礎,通過全面平衡各種備選干預方式的利弊,提出最優的指導意見[1]。護理臨床實踐指南(Nursing-CPG,N-CPG)特指關注解決護理問題的臨床實踐指南,N-CPG 作為臨床護理指導性文件旨在規范護士的臨床護理行為,幫助護理人員減少護理實踐的變異性,促進合理、公平、有效使用醫療資源。
規范地制訂指南是保證指南質量的基本條件,不同機構組織均提出了實踐指南的制訂方法,其基本流程和主要步驟相似[2]。WHO 指南手冊指出指南制訂過程分為決定制訂指南、與指南評審委員會秘書處討論、指南計劃、小組組件、構建關鍵問題、提交出版計劃許可、指南評審委員會批準、證據檢索、系統評價、GRADE 推薦意見分級、推薦意見制定、撰寫、外部評審等步驟[3]。但目前尚無權威機構組織發布的護理指南制訂方法學手冊,護理指南的制訂主要依據臨床實踐指南制訂的方法學和報告規范。故本文從護理專業角度,在指南范圍(或主題)和護理問題的確定、護理證據的檢索、結局指標的選擇和應用、證據及推薦意見的分級、證據至推薦意見的轉化方法、形成共識方法學、患者偏好與價值觀這 7 個重要方面進行深入解析,為 N-CPG 的制訂提供可參考的建議并希望與同行交流,最終促進 N-CPG 的制訂更科學、規范。
1 指南范圍(或主題)和護理問題的確定
指南范圍(或主題)常被作為指南制訂的首要步驟,指南涉及護理問題則是更明確聚焦待回答的具體臨床問題,它是在指南范圍和主題確定后通過分析最終確定的。指南多由一個范圍(或主題)和多個相關臨床問題組成。指南范圍(或主題)確定的一般原則是:具有重要臨床意義,如涉及發病率高、患病率高、死亡率高或經濟負擔大疾病,而指南實施很有可能改善患者重要結局或降低醫療成本;在臨床實踐中存在較大差異性;目前沒有相關主題及有效臨床指南可供使用,或研究證據不充分[4]。現代護理工作基于“整體護理”觀念,其內容廣泛,往往包括基礎護理(如口腔、皮膚、飲食)、癥狀護理(如疼痛、壓瘡)、專科護理(如糖尿病足、乳腺癌術后功能康復鍛煉)、技術護理(如 PICC、輸液港的護理)和健康教育等,另外病人出院后的社區護理及延續護理等內容等也屬于護理工作涵蓋的范圍,這些均可以成為 N-CPG 的范圍(或主題)。但 N-CPG 主題和范圍不可過大,如選用“糖尿病患者的管理指南”,則該指南可能涉及健康教育、心理護理、隨訪管理、藥物治療、糖尿病并發癥管理等多個方面,內容繁多、信息寬泛,制訂此類指南不僅消耗大量的時間和經費,也會導致研究人員難以把控指南制訂的質量,甚至不能明確其是否具有實際臨床指導意義。N-CPG 主題和范圍宜控制在單個護理主題下,如糖尿病患者的健康飲食教育護理指南。
在范圍和主題確定后,則需要確定其涵蓋的具體護理問題,指南提出的護理問題應該是臨床醫務人員在當時的臨床情景中關于某一問題的“困惑”,如重癥病人選擇吸痰方式時使用開放式吸痰還是密閉式吸痰,哪種方式更有助于降低患者肺感染的發生?患者發生譫妄后,是否使用約束帶,約束帶使用的時間如何確定?那么如何深入挖掘及如何具體化、結構化臨床護理問題?目前,研究者們主要通過文獻調研、德爾菲、關鍵知情人訪談、臨床調研、病歷回顧等途徑幫助指南制訂者獲取最有價值的、最直接的、最具體的臨床問題條目[5-8]。獲取臨床問題的途徑的優缺點如表 1 所示。我們認為,首先,在實際應用過程中指南制訂小組可以在廣泛文獻調研的基礎上,大致確定指南范圍(或主題)所涵蓋的臨床問題,將其進行歸類、合并后制作第一輪臨床護理專家(通常優選與主題相關的資深臨床護理一線工作人員)咨詢問卷,第一輪問卷調研建議調研樣本充足、代表性強,且注意設置開放性問題用以獲取未包括的重要臨床問題。其次,對第一輪問卷的回收結果進行分析總結,按一定的標準進行刪選;如有需要,制定第二輪調研問卷。同時,根據研究主題不同可同時納入患者、家屬、社工或相關管理人員進行調研、訪談或進行焦點小組討論,并將形成的結果補充到以上步驟中,從而獲得最終的臨床問題。指南問題的形成也可以采用德爾菲法,步驟與上類同。

在指南制訂過程中通常要結合以上多種方法以獲取不同指南利益相關方真正關注的重要臨床問題,從而保證制定出的指南符合臨床需求并有利于推廣。如在確定艾滋病臨床實踐指南臨床護理問題時,指南制訂小組一方面通過對 HIV 感染者和 AIDS 病人發放《HIV 感染者和 AIDS 病人護理需求問卷》,充分了解 HIV 感染者和 AIDS 病人在艾滋病相關癥狀管理、抗病毒治療管理和其它健康教育需求方面的護理需求現狀;另一方面通過對相關利益人群如 HIV 感染者、AIDS 病人、相關科室護士、醫生、醫院管理者進行訪談來了解他們對艾滋病臨床護理實踐現狀的認識、反思及護理需求[5]。
2 護理證據的檢索
2.1 檢索式的構建
對現有證據的檢索及篩選是指南制訂的重要環節。在開始檢索之前,指南制訂小組需明確針對特定臨床護理問題,按照“PICO”原則(目標人群:Population、干預措施:Intervention、對照或比較組采用的措施:Comparison、結局指標:Outcomes)將相關的臨床護理問題進行轉化[9]。值得注意的是,實際檢索過程中通常不會進行 PICO 四個部分的完整檢索,一般根據情況選擇 PI、PIC 格式。如想要了解針對糖尿病足壞疽截肢術圍術期患者的真實護理情況,則可以按照“PICo”(P 為人群、I 為感興趣的現象、Co 為具體的情景)三個方面構建檢索式。
2.2 檢索順序及系統評價的選用或制作
護理證據的檢索建議遵照 WHO 推薦的流程(圖 1)。首先確定是否存在回答此類問題的高質量系統評價,如果沒有則需進一步檢索相應的原始研究,再根據指南制訂小組的時間、經費、人力等條件決定是否需要自行制定系統評價 [10]。原則上希望指南制訂小組在缺乏高質量系統評價的時候,進行系統的原始文獻檢索和嚴格的質量評價而后對合格文獻進行定量或定性的合成,從而形成指南推薦意見。通常不建議不進行系統的文獻檢索,單獨應用 1 篇原始研究結果進行分級及推薦意見制定。

2.3 檢索策略的制定
所檢索數據庫除基本數據庫如 MEDLINE、EMbase、CBM、CNKI 等,還應注意檢索護理及與護理關系比較密切的數據庫如 CINAHL、PsycINFO,另外也應對收錄或制作高質量系統評價的機構如 The Cochrane Library、JBI 循證衛生保健數據庫、The Campbell Library 等進行檢索。若需制作系統評價,指南制訂人員不僅需檢索上述數據庫,還應檢索臨床試驗注冊平臺,如美國國立衛生研究院臨床試驗注冊平臺(ClinicalTrials.gov)和 WHO 國際臨床試驗注冊平臺(International Clinical Trials Registry Platform,ICTRP)。指南制訂小組在進行數據庫檢索時,需明確各數據庫的主題詞,結合“AND”、“OR”、“NOT”等邏輯運算符,制定敏感性高的檢索策略,并追溯納入研究的參考文獻。此外,研究者可根據初步檢索結果的數量來決定是否將研究設計類型作為檢索詞,如為了解鎮痛泵對乳腺癌患者疼痛的緩解效果,是否將“隨機對照試驗”作為檢索詞;如果想查找終末期患者照護者的心理體驗,原則上應該將“質性研究”作為檢索詞等。研究者應注意加入新的檢索詞會減少檢索結果,可能造成漏檢文獻。
2.4 衛生經濟學證據的使用
臨床干預的成本-效果或衛生經濟學證據在指南制訂中的作用逐漸受到重視,尤其是涉及人群比較廣泛的指南或藥物治療的指南。而護理指南中可能涉及器械、耗材等的選用,這也需要查找相關衛生經濟證據。例如壓瘡或傷口管理指南可能包含對不同傷口敷料的對比和推薦,指南制訂者可查詢該敷料的供應商了解該耗材的產品價格,也可通過數據庫(MEDLINE、EMbase、CINAHL 等)查找有無相應的衛生經濟學報告文件,或查找如 NHS Economic Evaluation Database 等相關數據庫。當此類證據缺乏時可由指南制訂小組進行調研來支持生成推薦意見。
3 結局指標的選擇和應用
結局指標用來衡量某一干預措施實施后干預效果和作用程度,是系統評價和指南中構建臨床問題、制作推薦意見時的關鍵要素[11-14]。結局指標的選擇不當,不僅影響干預措施與療效間的因果推斷,造成過高或者過低評估相應臨床試驗的研究價值,也會導致同一主題的臨床試驗因結局指標間差異過大,影響結果橫向比較或不能進行合并分析,導致研究結果存在分歧或不被廣泛認同[15]。因此,在 N-CPG 制訂過程中應當重視結局指標的選擇,并明確結局指標與證據、患者的偏好和價值觀間的關系。
目前,指南制訂過程中結局指標和臨床問題的確定采用相似方法[16, 17],同時指南制訂者在獲取結局指標后,應該按結局指標重要性進行分類。可參考 GRADE 體系將結局指標按其重要性分為 1~9 分,其中 7~9 為“關鍵結局”,4~6 分為“重要結局”,1~3 為“一般結局”。其中前兩類會對推薦意見的形成產生重要影響,第三類可能會也可能不會產生影響[18]。
N-CPG 制訂者在選擇結局指標時,仍需注意以下兩點問題:
第一,應當選擇患者最為關注的、最直接的、最重要的結局指標,如針對老年髖部骨折患者圍術期譫妄實施疼痛護理指南,因為研究者已確定疼痛是譫妄發生的危險因素,所以希望通過疼痛護理,達到理想結局指標。而針對疼痛護理,譫妄發生率、譫妄嚴重程度是研究者最關心的結局指標;疼痛的緩解程度是患者最為關注、也是干預實施后最為直接的結局;患者的滿意度是針對患者接受這項護理措施后,護理管理者最關注的結局指標;故以上指標均應納入指南的結局指標體系中。再如評價認知干預對老年性癡呆病人的干預效果時,設定認知功能改善,癡呆嚴重程度為關鍵結局指標,生活自理能力、照護者負擔是重要結局指標,焦慮、抑郁則是一般結局指標,故在制定相應推薦意見、考慮證據體質量時主要根據患者認知功能改善及癡呆嚴重程度改善的效應量大小。
第二,護理由于其專業性特點,患者對護理干預的期盼常常是短期目標的改善。如艾滋病病人管理指南[5]中,推薦采用綜合干預方式如 APP 服藥提醒、知識宣教、同伴教育、定期隨訪等來提高病人的服藥依從性,這時病人遵醫囑正確服藥是醫務人員最關心的結局,應該設置為關鍵結局指標;而遠期生存或死亡率,甚至病人的再住院率等對于提高服藥依從性來說其影響存在一定的間接性,所以可以不列為關鍵結局指標。再如針對晚期癌癥患者實施臨終護理,因護理干預很難降低患者死亡率或提高其生存率,其價值更多體現在維護患者臨終尊嚴、提高生活質量方面。故護理指南制訂小組需明確針對特定問題的護理干預措施,是否在遠期會對患者終點結局有影響以及影響的程度如何,最終決定是否納入遠期結局指標。
4 證據及推薦意見的分級
對于指南制訂者來說,如何在有限的時間內高效地判斷研究的質量,篩選出高質量的證據是指南制訂過程中難度最大且工作量最大的環節。
美國的兩位社會學家 Campbell 和 Stanley 首次引入證據分級的概念后[19-21],基于循證醫學和流行病學的發展,已有諸多由專業組織制定的證據及推薦意見的分級標準,如加拿大定期體檢特別工作組(Canadian Task Force on the Periodic Health Examination,CTFPHE)證據分級及推薦強度[22]、蘇格蘭院際指南網(The Scottish Intercollegiate Guidelines Network,SIGN)證據分級和推薦強度及推薦強度[23]、牛津證據分級標準[24]、GRADE 證據等級及推薦強度[25]等。證據及推薦意見的分級經歷了從單純考慮研究設計到綜合考慮多種因素如試驗設計、精確性、一致性、間接性、發表偏倚、患者的偏好和價值觀的發展過程[26]。其中 GRADE 系統由于其更加科學合理、過程透明、適用性強,目前已被 WHO、Cochrane 協作網等在內的 100 多個國際組織、協會和學會采用。但 GRADE 系統僅在干預性、診斷性、預后性和定性研究中有明確的分級方法,尚未對來自描述性研究、基于專業共識的系統評價、基于模型構建的證據合成等證據來源進行分級。
澳大利亞 Joanna Briggs 循證衛生保健中心(JBI)基于證據來源多元化的特點,將 GRADE 系統及 JBI 循證衛生保健模式結合起來制訂了 JBI 證據預分級及證據推薦級別系統,該系統將證據主題分為干預或治療、診斷、預后、經濟學評價、質性研究 5 種類型[27, 28]。針對推薦強度,JBI 認為應該考慮利弊平衡、證據質量、資源分配、患者的價值觀、意愿和體驗這 5 個因素,并據此將其分為強、弱兩個等級(表 2)[29]。JBI 2014 版的證據預分級和推薦級別系統,保留以往按設計分類的證據等級描述,易于使用者掌握,同時強調了證據的多元性特征,適用范圍廣,可操作性強。

N-CPG 制訂者在選擇證據及推薦意見分級的標準時,應當充分了解不同標準的特點,基于護理證據多元化、護理問題的類型及工具的可操作性等方面,恰當選擇證據分級標準。如研究性證據比較充分可以考慮使用 GRADE 進行證據分級與推薦意見制訂;同時涉及定性研究的證據體可同時結合 CERQual 分級[30, 31];研究證據非常多元,存在一定量的案例報告或專家意見則可以使用 JBI 證據分級系統;制訂中醫護理指南涉及古代醫籍中的護理方案時可以通過多輪專家咨詢制定出更實用的的證據分級及推薦意見制定標準。
5 證據至推薦意見的轉化方法
證據是指南制訂的基礎,但證據本身不能指導決策,證據至推薦意見轉化的過程是指南制訂過程中的關鍵環節。證據與推薦意見關系的清晰程度,直接影響臨床專家對推薦意見的認可程度。目前,國際尚無統一的證據至推薦意見轉化方法和標準。部分專業學會或組織為了更加規范化地制定推薦意見,提出了決策模型[32]、FAME 結構(JBI)[27]、DECIDE EtD 框架(GRADE)[33-35]等工具。然而,需要注意的是,各組織制定推薦意見時考慮的因素不完全相同。上述各工具中,JBI-FAME 結構廣泛應用于護理學及衛生保健領域,其是考慮證據的有效性、可行性、適宜性和臨床意義,結合證據的 JBI 推薦強度分級原則,由指南制訂小組確定證據的推薦強度[27]。JBI 詳細解釋了各因素的內涵,如證據的可行性,主要是從實施這樣干預措施的成本、所需資源的可及性進行考慮,不僅幫助指南制訂小組評估其是否包含與本指南主題推薦意見相關的可能需要考慮的因素,而且分類明確,避免相同的因素重復被考慮。而 FAME 結構條目清晰明了,對 N-CPG 的制訂具有很好的實用價值。
此外,GRADE 工作組開發了DECIDE EtD(Evidence to Decision)理論框架,用于協助指南制訂者規范證據至推薦意見的形成過程(表 3),其包括構建臨床問題、評價證據、得出結論 3 個步驟[33-35]。GRADE 工作組對每一步驟的具體內容均進行了說明,并詳細列出了各類型決策的待考慮的標準及各標準判斷的細節,如針對問題的優先性,主要從問題的嚴重性如何、問題的緊迫性如何、問題的優先性是否被普遍認可這三個角度出發進行評估[33-35, 36]。目前 EtD 因其明確而詳細的推薦意見制定流程、清晰且透明的評估方法,已被 WHO、哥倫比亞指南制作組等組織應用[37]。

N-CPG 制訂者在制訂推薦意見時,應充分考慮:① 結合指南適用人群的特點,明確推薦意見的類型;② 確定各推薦意見類型制訂時需要考慮的標準,并描述各標準詳細的評估依據;③ 選擇或者制訂最佳的證據至推薦意見轉化的工具,并在指南中詳細報告其過程。
6 形成共識的方法學
指南制作是一個復雜過程,其在臨床問題確定、結局指標選擇、推薦意見制訂等多環節均可能意見不一致。故臨床實踐指南的制訂離不開共識法,它是一種針對專家意見討論及觀點闡述進行分析的方法。另外,當缺乏證據支持和現有文獻不足時,指南制訂小組可以鑒于自己的專業知識和經驗經過群體共識會議起草出“共識性的推薦建議”[38]。目前醫學研究領域里最常用的“共識法”包括德爾菲法、名義群體法(Nominal Group Technique,NGT)和共識會議法(Consensus Development Conference,CDC)[39]。護理臨床實踐指南制訂者,可根據各方法特點,考慮本指南制訂組的時間、經費及資源,選擇最適合的方式解決不同專家間的意見分歧。同時,需要注意的是,既使推薦意見有高質量的研究證據支持,仍需倚重臨床專家的意見,借鑒他們豐富的臨床經驗,充分評估各因素如可行性、可接受性、資源等現狀,使指南更具臨床推廣性。
7 患者的偏好與價值觀
指南推薦意見的制訂,最終目的是應用于臨床,服務于患者。護理專業強調以人為本、人文護理,護理臨床實踐指南推薦意見的制訂更應充分考慮患者的偏好和價值觀,患者偏好和價值觀是干預措施可行性及應用性的判斷依據,尤其是在面對缺乏高質量證據支持的推薦意見及多個護理方案并存的情況時,患者偏好及價值觀的高度變異性和不確定性,會嚴重影響推薦意見的等級劃分[40]。然而,目前關于患者的偏好和價值觀的概念、評估工具和方法學尚不完善。
首先,不同組織對患者的偏好和價值觀的觀點不一。如 2012 年美國胸科醫師學院循證臨床實踐指南制訂小組認為它是指患者對健康和生命的信仰、期望與目標,包括患者面對不同診斷和治療時對其利弊、成本和負擔的權衡[41];GRADE 工作組則將其定義為患者對相關結局指標或健康狀態的重視程度[18]。前者是對患者偏好和價值觀較為綜合性的概念。后者明確提出針對結局指標考慮患者的偏好和價值觀,以滿足 GRADE 以系統評價的效應量指標作為證據體(Body of evidence)進行質量分級的需要[28]。對于某項干預措施效果的不同結局指標,護理指南制訂小組原則上應當選擇患者認為對其最為重要的結局指標的偏好及價值觀,用以指導證據分級和推薦意見的制訂[42]。
目前,獲取患者偏好和價值觀的方法,可大致分為 3 類:一類是基于已有相關文獻的研究結果;另一類是通過實時的問卷調查和質性訪談加以了解;此外指南制訂小組中納入患者人群也是收集其觀點意愿非常好的方式。雖然近幾年關于患者偏好及價值觀的原始研究和系統評價數量增多,但尚未發現將其結果應用到推薦意見制訂的方法學中[43-47]。通過實時的問卷調查或質性訪談,可以納入符合指南主題的來自不同臨床環境的患者,使獲得的信息具有代表性和適用性,但需注意的是在進行調研或者訪談時,患者對醫學信息的理解程度、呈現相關信息的方式和順序等都會影響患者偏好和價值觀的收集結果[42]。N-CPG 制訂者可針對特定臨床問題的特點及研究目的選擇最適宜的患者偏好及價值觀的獲取途徑。雖然指南小組中納入患者群體也可以在指南制訂過程中廣泛收集患者觀點,但需要注意應盡量避免帶有明顯個人傾向的觀點,而應該收集能夠反映患者人群的集中意見,這時患者代表的選取就顯得尤為重要。
N-CPG 制訂者在考慮患者的偏好和價值觀時,仍需注意幾點:① 明確本指南中患者的偏好和價值觀可操作性的定義;② 當基于文獻如原始研究、系統評價等考慮患者的偏好和價值觀時,應當充分考慮文獻研究人群與指南應用人群特點的符合程度,以及研究開展時間、研究人群來源(國家、醫院、社區等)等是否代表指南即將應用的當地患者的偏好和價值觀,同時考慮支持證據的質量。
總之,本文從護理專業角度出發,探討了護理指南范圍(或主題)和護理問題的確定、護理證據的檢索、結局指標的選擇和應用、證據及推薦意見的分級、證據至推薦意見轉化的方法、患者偏好和價值觀等問題,以期為制訂護理臨床實踐指南提供參考。