引用本文: 周英鳳, 王強, 胡雁, 邢唯杰, 黃超, 林煒煒. 中國護理臨床實踐指南質量評價標準的構建. 中國循證醫學雜志, 2018, 18(9): 990-994. doi: 10.7507/1672-2531.201804048 復制
臨床實踐指南是根據特定臨床情景系統指定、幫助醫務人員及患者做出恰當處理的指導意見或建議[1]。作為醫學證據與臨床實踐之間聯系的橋梁,臨床實踐指南受到了研究者、實踐者和管理者的極大關注,臨床實踐指南的數量在近年來急劇增加。但我國臨床實踐指南的總體質量參差不齊[2],部分指南制訂方法缺乏科學性和規范性[3],發布渠道不通暢,更新不及時[4],影響了指南的獲取、傳播和利用。為提高臨床實踐指南報告質量,推動指南發表和傳播,國際上推出了指南研究與評價(AGREE Ⅱ)工具,但該工具存在條目較多、缺乏對指南內容專業性和真實性的評價、某些條目不完全適用于中國開發的指南等問題[5],因此,迫切需要構建適宜于中國國情的本土化指南質量評價工具,以加強對我國臨床實踐指南的質量管理。在此背景下,2017 年 9 月受國家衛生健康委醫療管理服務指導中心的委托,由復旦大學循證護理中心牽頭,聯合全國護理行業專家,在復旦大學王吉耀教授團隊制作的“我國醫療領域臨床實踐指南質量評價標準(草案)”基礎上,結合護理學科特點和循證護理實踐發展要求,制訂了我國護理領域臨床實踐指南質量評價標準,以期為我國護理領域內指南的質量管理提供標準和評價依據。
1 研究方法
本研究采用兩輪全員團體焦點訪談法收集指南質量評價標準的條目[6],該方法是團體焦點訪談中納入人數最多的一種研究方法,通過該領域內專家對特定的主題進行團體討論,充分了解專家對該主題的看法或建議。
1.1 訪談對象
采用目的抽樣法,遵循權威性和代表性原則,選取來自全國的臨床護理專家及循證方法學專家組成焦點小組。臨床護理專家納入標準:從事臨床護理或護理管理工作 10 年以上、具有副高及以上職稱、曾參與過護理標準、護理規范或護理指南的制定;循證方法學專家納入標準:具有碩士及以上學歷、接受過循證方法學專業教育、工作 5 年以上、參與或主持過臨床實踐指南的制定。兩輪焦點小組共納入 26 名專家,平均年齡 48.85±6.72 歲;平均工作年限 25.38±7.94 年;24 名專家具有副高及以上職稱;19 名專家來自醫院,6 名專家來自高等院校,1 名專家來自護理學會。26 名專家來自全國 9 個省(包括甘肅、山東、陜西、吉林、四川、湖南、湖北、廣東和浙江)和 3 個直轄市(北京、上海和天津)。
1.2 訪談提綱
本研究以“我國醫療領域臨床實踐指南質量評價標準(草案)”為依據,結合我國護理學科的特點,擬定了“我國護理領域臨床實踐指南質量評價標準(草案)”。再以此草案為依據,制訂訪談提綱,訪談內容涵蓋:指南質量評價標準的整體框架是否合適、一級和二級指標的描述是否準確、二級指標的評分是否合理、對各評價條目的解讀及評分標準是否符合護理領域指南的要求。
1.3 訪談準備
兩輪訪談于 2017 年 9 月至 10 月分別在上海復旦大學護理學院和西安西京醫院進行。首先與專家聯系,確定訪談時間和地點,選擇大小合適、有圓形會議桌的會議室進行,為所有專家準備紙質版“我國護理領域臨床實踐指南質量評價標準(草案)”,選擇兩名研究人員擔任訪談助理,準備訪談所需物品。
1.4 資料收集及整理
由本研究主要負責人擔任訪談主持人,由另一名研究者負責記錄。首先,主持人介紹本研究背景、本次訪談的目的和內容,在全體人員知情同意下全程錄音。然后,按照訪談提綱組織提問和討論,鼓勵所有專家自由發言,不對專家發言進行評判,推動專家圍繞訪談主題深入開展討論。所有討論內容均通過投影儀同步呈現,以便及時確認相關信息,確保資料的準確性和完整性,訪談時間控制在 3 小時內。在訪談結束 48 小時內結合錄音,通過內容分析法完成資料整理。通過郵件發送給所有專家,對結果進行確認、補充和完善,并在 1 周內收回。研究團隊對專家返回的資料進行最終整合,形成我國護理領域內臨床實踐指南質量評價標準。
2 結果
經過兩輪團體焦點訪談,本研究確定了我國護理領域內臨床實踐指南的質量評價標準,其評價領域、評價內容、評分分值、權重、評價條目的解讀及評分標準見表 1。
2.1 評價領域及內容
經過專家討論,一致同意護理領域臨床實踐指南質量評價標準亦沿用醫療領域指南質量評價標準的五個維度、15 個條目對指南的質量進行評價,以免造成不同領域指南質量評價標準的混亂。該框架依據衛生技術評估原理及指南制定的方法學,從指南制定過程的科學性/嚴謹性、推薦意見有效性/安全性、經濟性、可用性/可行性、指南制定過程的利益沖突五大方面對指南質量進行評價。但專家根據護理學科的特點,對其中 9 個條目進行了修改和完善。如第 3 個條目,在原來“正確、全面的文獻檢索策略進行證據檢索,并提供了全部參考文獻列表”的基礎上,修改為“正確、全面的文獻檢索策略進行證據檢索,并提供了全部參考文獻列表,檢索中考慮證據的多元性”,提出充分考慮護理領域內證據的多元性,不但重視定量研究的價值,也重視定性研究的價值。
2.2 評分分值及權重
由于既往指南質量評價標準尚不統一,一般有四種評分標準對各條目進行評分,即 0~3 分制、0~5 分制、0~7 分制和 0~10 分制。為了提高評價者之間的一致性,本研究中,專家建議將所有條目評分標準均改為統一的評分標準,即 0~5 分制,同時增加了“權重”一欄,充分考慮到不同條目對指南質量的影響不同,根據兩輪專家討論的結果,將不同條目的權重設置為 0.5、1、1.5、2。如條目 8“提供了指南的更新計劃”權重為 0.5,而條目 5“說明了從證據到形成推薦意見的方法”權重為 2。
2.3 評分標準
對評分標準主要從 3 個方面進行了修改和完善,首先從評分內容上,根據護理學科的特點進行了修改、補充和完善,如指南制定小組中應納入護理人員及方法學專家的參與,文獻檢索策略中應納入護理領域內的數據庫并考慮護理領域內證據的多元性等。其次,從評分標準上,全部按照 0~5 分評分制,列出清晰的評分方法和依據。第三,從評分方法上,采用逐級評分的方法,將定性描述和定量評價結合,采用無(0%)、少部分(<25%)、部分(26~50%)、大部分(51~75%)、絕大部分(>75%)、全部(100%)進行明確評價,確保不同評價者對同一條目評價的一致性。

3 討論
作為證據和實踐之間的橋梁,護理臨床實踐指南的價值被越來越多的護理人員認可。傳統的臨床實踐指南大多是“基于專家共識的指南”,因其形成過程缺乏嚴謹的方法學,其科學性和透明性受到了很大質疑[7]。因此,采用嚴謹的指南制訂方法,綜合經過系統檢索、嚴格評價的最佳證據,并對不同干預措施的利弊進行充分評估,結合患者的意愿和價值觀,制訂“基于證據的臨床實踐指南”,已經成為指南發展的主流趨勢[8]。2014 年美國國立指南文庫更改了其指南收錄的標準,明確了其收錄指南應該滿足的條件[9],包括采用系統方法制訂的指南、基于系統評價方法收集的證據、由政府或醫療機構組織發起制訂的、包括各種推薦意見利弊和可以備選的建議、5 年內制訂或修訂的新版本。
而目前我國指南數量日益增多,但存在指南總體質量參差不齊、版本繁多、獲取渠道不暢、難以甄別等問題,嚴重影響了指南的質量和使用效率[4]。為了提高我國護理領域內臨床實踐指南的質量,本研究遵循衛生技術評估的原理,依據臨床實踐指南制訂規范[10-12],從指南制訂的嚴謹性/科學性、推薦意見的有效性/安全性及經濟性、指南的可用性/可行性、指南制訂過程的利益沖突五個領域,全面構建指南質量評價標準,并通過兩輪團體焦點訪談,確定了各條目的評分、權重及評分標準。本指南評價標準不但在評價條目、權重設置及評價標準方面充分考慮了護理領域指南的特點,而且評價標準具體、可操作性強,不僅幫助護理人員評價現有指南的質量,且對未來制訂護理臨床實踐指南也起到規范作用。
中國護理領域臨床實踐指南質量評價標準與目前國際上公認的指南研究與評價(AGREE Ⅱ)工具相比,條目從 23 條精簡到 15 條,且采用了更符合中國人評價的 0~5 分制對每個條目進行評價,并對評分給出了細致、可操作性強的解釋和說明,確保了不同評價者對同一條目及評價的一致性。此外,本評價標準還根據不同條目對指南質量的影響不同,制定了相應的權重,改變了 AGREE II 工具中每個條目對指南質量影響相同的評價方法,從影響指南質量的核心要素來看,本指南評價標準更客觀,更科學。
盡管本指南評價標準具有較好的可操作性,但仍建議評價者在使用該評價標準前,嚴格遴選評價者資質,詳細了解指南制訂的方法學,并深入理解該評價標準,把握每個條目的內涵及評分標準,確保不同評價者對相同條目內涵及評分標準理解一致。此外,建議評價者根據本指南質量評價標準對所要評價的指南進行預評價,以熟悉和理解對本指南質量評價標準。若不同評價者對同一條目評價差別很大時,可共同商議決策,必要時咨詢專家,達成一致后進行指南評價。
臨床實踐指南是根據特定臨床情景系統指定、幫助醫務人員及患者做出恰當處理的指導意見或建議[1]。作為醫學證據與臨床實踐之間聯系的橋梁,臨床實踐指南受到了研究者、實踐者和管理者的極大關注,臨床實踐指南的數量在近年來急劇增加。但我國臨床實踐指南的總體質量參差不齊[2],部分指南制訂方法缺乏科學性和規范性[3],發布渠道不通暢,更新不及時[4],影響了指南的獲取、傳播和利用。為提高臨床實踐指南報告質量,推動指南發表和傳播,國際上推出了指南研究與評價(AGREE Ⅱ)工具,但該工具存在條目較多、缺乏對指南內容專業性和真實性的評價、某些條目不完全適用于中國開發的指南等問題[5],因此,迫切需要構建適宜于中國國情的本土化指南質量評價工具,以加強對我國臨床實踐指南的質量管理。在此背景下,2017 年 9 月受國家衛生健康委醫療管理服務指導中心的委托,由復旦大學循證護理中心牽頭,聯合全國護理行業專家,在復旦大學王吉耀教授團隊制作的“我國醫療領域臨床實踐指南質量評價標準(草案)”基礎上,結合護理學科特點和循證護理實踐發展要求,制訂了我國護理領域臨床實踐指南質量評價標準,以期為我國護理領域內指南的質量管理提供標準和評價依據。
1 研究方法
本研究采用兩輪全員團體焦點訪談法收集指南質量評價標準的條目[6],該方法是團體焦點訪談中納入人數最多的一種研究方法,通過該領域內專家對特定的主題進行團體討論,充分了解專家對該主題的看法或建議。
1.1 訪談對象
采用目的抽樣法,遵循權威性和代表性原則,選取來自全國的臨床護理專家及循證方法學專家組成焦點小組。臨床護理專家納入標準:從事臨床護理或護理管理工作 10 年以上、具有副高及以上職稱、曾參與過護理標準、護理規范或護理指南的制定;循證方法學專家納入標準:具有碩士及以上學歷、接受過循證方法學專業教育、工作 5 年以上、參與或主持過臨床實踐指南的制定。兩輪焦點小組共納入 26 名專家,平均年齡 48.85±6.72 歲;平均工作年限 25.38±7.94 年;24 名專家具有副高及以上職稱;19 名專家來自醫院,6 名專家來自高等院校,1 名專家來自護理學會。26 名專家來自全國 9 個省(包括甘肅、山東、陜西、吉林、四川、湖南、湖北、廣東和浙江)和 3 個直轄市(北京、上海和天津)。
1.2 訪談提綱
本研究以“我國醫療領域臨床實踐指南質量評價標準(草案)”為依據,結合我國護理學科的特點,擬定了“我國護理領域臨床實踐指南質量評價標準(草案)”。再以此草案為依據,制訂訪談提綱,訪談內容涵蓋:指南質量評價標準的整體框架是否合適、一級和二級指標的描述是否準確、二級指標的評分是否合理、對各評價條目的解讀及評分標準是否符合護理領域指南的要求。
1.3 訪談準備
兩輪訪談于 2017 年 9 月至 10 月分別在上海復旦大學護理學院和西安西京醫院進行。首先與專家聯系,確定訪談時間和地點,選擇大小合適、有圓形會議桌的會議室進行,為所有專家準備紙質版“我國護理領域臨床實踐指南質量評價標準(草案)”,選擇兩名研究人員擔任訪談助理,準備訪談所需物品。
1.4 資料收集及整理
由本研究主要負責人擔任訪談主持人,由另一名研究者負責記錄。首先,主持人介紹本研究背景、本次訪談的目的和內容,在全體人員知情同意下全程錄音。然后,按照訪談提綱組織提問和討論,鼓勵所有專家自由發言,不對專家發言進行評判,推動專家圍繞訪談主題深入開展討論。所有討論內容均通過投影儀同步呈現,以便及時確認相關信息,確保資料的準確性和完整性,訪談時間控制在 3 小時內。在訪談結束 48 小時內結合錄音,通過內容分析法完成資料整理。通過郵件發送給所有專家,對結果進行確認、補充和完善,并在 1 周內收回。研究團隊對專家返回的資料進行最終整合,形成我國護理領域內臨床實踐指南質量評價標準。
2 結果
經過兩輪團體焦點訪談,本研究確定了我國護理領域內臨床實踐指南的質量評價標準,其評價領域、評價內容、評分分值、權重、評價條目的解讀及評分標準見表 1。
2.1 評價領域及內容
經過專家討論,一致同意護理領域臨床實踐指南質量評價標準亦沿用醫療領域指南質量評價標準的五個維度、15 個條目對指南的質量進行評價,以免造成不同領域指南質量評價標準的混亂。該框架依據衛生技術評估原理及指南制定的方法學,從指南制定過程的科學性/嚴謹性、推薦意見有效性/安全性、經濟性、可用性/可行性、指南制定過程的利益沖突五大方面對指南質量進行評價。但專家根據護理學科的特點,對其中 9 個條目進行了修改和完善。如第 3 個條目,在原來“正確、全面的文獻檢索策略進行證據檢索,并提供了全部參考文獻列表”的基礎上,修改為“正確、全面的文獻檢索策略進行證據檢索,并提供了全部參考文獻列表,檢索中考慮證據的多元性”,提出充分考慮護理領域內證據的多元性,不但重視定量研究的價值,也重視定性研究的價值。
2.2 評分分值及權重
由于既往指南質量評價標準尚不統一,一般有四種評分標準對各條目進行評分,即 0~3 分制、0~5 分制、0~7 分制和 0~10 分制。為了提高評價者之間的一致性,本研究中,專家建議將所有條目評分標準均改為統一的評分標準,即 0~5 分制,同時增加了“權重”一欄,充分考慮到不同條目對指南質量的影響不同,根據兩輪專家討論的結果,將不同條目的權重設置為 0.5、1、1.5、2。如條目 8“提供了指南的更新計劃”權重為 0.5,而條目 5“說明了從證據到形成推薦意見的方法”權重為 2。
2.3 評分標準
對評分標準主要從 3 個方面進行了修改和完善,首先從評分內容上,根據護理學科的特點進行了修改、補充和完善,如指南制定小組中應納入護理人員及方法學專家的參與,文獻檢索策略中應納入護理領域內的數據庫并考慮護理領域內證據的多元性等。其次,從評分標準上,全部按照 0~5 分評分制,列出清晰的評分方法和依據。第三,從評分方法上,采用逐級評分的方法,將定性描述和定量評價結合,采用無(0%)、少部分(<25%)、部分(26~50%)、大部分(51~75%)、絕大部分(>75%)、全部(100%)進行明確評價,確保不同評價者對同一條目評價的一致性。

3 討論
作為證據和實踐之間的橋梁,護理臨床實踐指南的價值被越來越多的護理人員認可。傳統的臨床實踐指南大多是“基于專家共識的指南”,因其形成過程缺乏嚴謹的方法學,其科學性和透明性受到了很大質疑[7]。因此,采用嚴謹的指南制訂方法,綜合經過系統檢索、嚴格評價的最佳證據,并對不同干預措施的利弊進行充分評估,結合患者的意愿和價值觀,制訂“基于證據的臨床實踐指南”,已經成為指南發展的主流趨勢[8]。2014 年美國國立指南文庫更改了其指南收錄的標準,明確了其收錄指南應該滿足的條件[9],包括采用系統方法制訂的指南、基于系統評價方法收集的證據、由政府或醫療機構組織發起制訂的、包括各種推薦意見利弊和可以備選的建議、5 年內制訂或修訂的新版本。
而目前我國指南數量日益增多,但存在指南總體質量參差不齊、版本繁多、獲取渠道不暢、難以甄別等問題,嚴重影響了指南的質量和使用效率[4]。為了提高我國護理領域內臨床實踐指南的質量,本研究遵循衛生技術評估的原理,依據臨床實踐指南制訂規范[10-12],從指南制訂的嚴謹性/科學性、推薦意見的有效性/安全性及經濟性、指南的可用性/可行性、指南制訂過程的利益沖突五個領域,全面構建指南質量評價標準,并通過兩輪團體焦點訪談,確定了各條目的評分、權重及評分標準。本指南評價標準不但在評價條目、權重設置及評價標準方面充分考慮了護理領域指南的特點,而且評價標準具體、可操作性強,不僅幫助護理人員評價現有指南的質量,且對未來制訂護理臨床實踐指南也起到規范作用。
中國護理領域臨床實踐指南質量評價標準與目前國際上公認的指南研究與評價(AGREE Ⅱ)工具相比,條目從 23 條精簡到 15 條,且采用了更符合中國人評價的 0~5 分制對每個條目進行評價,并對評分給出了細致、可操作性強的解釋和說明,確保了不同評價者對同一條目及評價的一致性。此外,本評價標準還根據不同條目對指南質量的影響不同,制定了相應的權重,改變了 AGREE II 工具中每個條目對指南質量影響相同的評價方法,從影響指南質量的核心要素來看,本指南評價標準更客觀,更科學。
盡管本指南評價標準具有較好的可操作性,但仍建議評價者在使用該評價標準前,嚴格遴選評價者資質,詳細了解指南制訂的方法學,并深入理解該評價標準,把握每個條目的內涵及評分標準,確保不同評價者對相同條目內涵及評分標準理解一致。此外,建議評價者根據本指南質量評價標準對所要評價的指南進行預評價,以熟悉和理解對本指南質量評價標準。若不同評價者對同一條目評價差別很大時,可共同商議決策,必要時咨詢專家,達成一致后進行指南評價。