引用本文: 萬鎧瑞, 李瑤, 吳君萬, 鄒幫玉, 江梅. 2017 年中國呼吸疾病臨床實踐指南的質量評價. 中國循證醫學雜志, 2019, 19(6): 715-722. doi: 10.7507/1672-2531.201811100 復制
近年來,隨著大氣污染加重、吸煙和生物燃料的不合理使用,呼吸疾病的發病率和死亡率逐年升高,成為危害人類健康的主要疾病之一,給社會帶來了沉重的疾病負擔[1,2]。疾病的復雜性和醫療資源分布的地區差異,給呼吸疾病的臨床管理帶來嚴峻挑戰。臨床實踐指南是連接當前最佳證據與臨床實踐之間的橋梁,是規范醫療行為、提高醫療服務質量、提升衛生服務的成本效益和保障患者的生命健康的重要措施[3]。只有高質量指南才能有效發揮其臨床指導作用,但目前發布的臨床實踐指南質量良莠不齊,因此有必要及時對指南進行質量評價[4-6]。本研究旨在運用國際指南質量評價工具 Appraisal of Guidelines for Research and Evaluation Ⅱ(AGREE Ⅱ)[7]評價 2017 年國內期刊發布呼吸疾病指南的質量,監測呼吸疾病指南的質量變化,為今后指南的制訂和更新提供參考,以期提高國內指南質量,從而更好地發揮其指導作用。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
所有 2017 年中文發表的中國呼吸疾病相關臨床實踐指南,根據制訂方法主要分為基于循證醫學證據和基于專家共識兩類[8-10]。本研究對循證指南的定義是:指南至少報告了一個數據庫的檢索策略,并對證據質量及推薦強度進行分級。
1.1.2 排除標準
① 非診療指南;② 指南摘要或解讀;③ 國外指南的翻譯版或改編版;④ 發布在非醫學雜志的指南;⑤ 系統綜述、評論、臨床路徑和其他評價指南的文獻。
1.2 文獻檢索策略
計算機檢索 WanFang Data、CNKI、VIP 和 CBM 數據庫,以及百度、中華人民共和國國家衛生健康委員會、中華醫學會、中華中醫藥學會、中國臨床指南文庫、中華醫學網和醫脈通網站,手工檢索相關呼吸類醫學雜志,檢索時限為 2017 年 1 月至 2017 年 12 月。檢索詞包括:呼吸、肺、氣管、氣道、指南、指引、專家共識、規范、意見、推薦和建議等。以 CBM 為例,其檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 納入指南的基本信息:題目、發表時間、制訂機構、發表雜志、目標人群、關注疾病、參考文獻數和經費來源等;② 質量評價的關鍵要素、是否為循證指南等。
1.4 納入指南的質量評價
由 4 名研究者采用 AGREE Ⅱ對納入指南進行質量評價,包括 6 個領域 23 個條目和 2 個總體評估條目,每個條目的最低分為 1 分,最高分為 7 分[11]。根據公式計算各領域最終得分:各領域分值=(實際得分?最小可能得分)/(最大可能得分?最小可能得分)×100%[11]。指南總體評估綜合考慮所有領域,由于“制訂的嚴謹性”和“應用性”兩個領域的重要性,我們給予雙倍加權處理,6 個領域得分的加權平均數即為各指南的最終得分[2,12]。如果一篇指南最終得分超過 60%,則被評為“推薦在臨床上使用”;如果介于 30%~60% 之間,則被評為“修改后方推薦使用”;如果低于 30%,則被評為“不推薦在臨床上使用”[2,12]。
正式評價前,先對所有評價者進行 AGREE Ⅱ評分相關培訓,然后選取 3 篇指南進行預評分,并計算組內相關系數(Intra-class Correlation Coefficients,ICC)來評價一致性,從而確保每位評價者對每個條目的理解基本一致。只有當 ICC 值大于 0.8 時,才進行正式評價[10,13]。本研究進行預評分的 ICC 為 0.984[95%CI(0.977,0.990)],具有較好的一致性。
1.5 統計分析
運用 SPSS 23.0 軟件進行數據整理與分析,采用均數(范圍)和頻數對納入指南的基本信息進行統計描述。4 名研究者的一致性通過計算 ICC 來評價[14]。
2 結果
2.1 文獻檢索流程及結果
初檢共獲得相關文獻 594 篇,經逐層篩選,最終納入 37 篇指南[15-51]。文獻檢索流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CBM(
2.2 納入指南的基本特征
在所有納入指南中,1 篇(2.7%)為循證指南,7 篇(18.9%)為指南更新,更新年限 3~15 年。27 篇(73.0%)目標人群為成人,9 篇(24.3%)為兒童,1 篇(2.7%)為成人和兒童。26 篇(70.3%)由學會或協會牽頭制訂,涉及呼吸道感染、肺癌、咳嗽、COPD 和介入診療等各方面。34 篇(91.9%)為西醫指南。所有指南均提及參與指南制訂的專家和引用的參考文獻,專家組人數 4~133 人,參考文獻數目 0~158 篇。納入指南的基本特征見表 1。

2.3 AGREE Ⅱ評分結果
正式評價時,4 名評價者的 ICC 為 0.983[95%CI(0.982,0.985)],說明評價一致性很好。納入指南 AGREE Ⅱ各領域評價及總體評價結果見表 2。

6 個領域中“范圍和目的”和“表達的明晰性”兩個領域得分較高(59.3% 和 59.1%),“參與人員”、“制訂的嚴謹性”和“應用性”三個領域得分較低(25.1%、10.8% 和 25.8%)。“參與人員”有 33 篇(89.2%)得分低于 30%,僅 1 篇(2.7%)大于 60%,僅 1 篇(2.7%)提及有方法學家的參與并考慮了患者及家屬的意愿。“制訂的嚴謹性”領域有 26 篇(70.3%)得分小于 10%,僅有 3 篇(8.1%)大于 30%,1 篇(2.7%)使用了 GRADE 工具進行證據質量和推薦強度分級,1 篇(2.7%)提及指南更新、更新頻率與方法,1 篇(2.7%)闡述了數據庫的檢索方法,3 篇(8.1%)提及在指南發布前經過了外部專家的評審。“應用性”領域僅有 8 篇(21.6%)得分大于 30%,且所有指南均未提及應用的阻礙因素。“編輯獨立性”得分最低,平均僅為 7.3%,其中 26 篇(70.3%)得分為 0%,僅 1 篇(2.7%)指出受到贊助單位資助且其觀點不影響指南內容,2 篇(5.4%)提及與其他組織或個人不存在利益沖突。納入指南中,僅 1 篇(2.7%)被評為“推薦在臨床上使用”,2 篇(5.4%)被評為“修改后方推薦使用”,其余 34 篇(91.9%)被評為“不推薦在臨床上使用”。
2.4 可能影響指南質量的因素分析
按照不同亞組(包括版本、制訂機構、目標人群、研究領域、專家組成員數、參考文獻數)對可能影響指南質量的因素進行分析,結果顯示:所有指南更新在 6 個領域的得分均高于首版;兒童指南在 5 個領域(“應用性”領域除外)的得分高于成人;專家組成員數>25 人的指南在 6 個領域的得分均高于成員數≤25 人的指南;參考文獻數>40 條的指南在 4 個領域(除“參與人員”和“編輯獨立性”領域外)的得分高于參考文獻數≤40 條的指南;學會或協會制訂的指南在“參與人員”、“應用性”和“編輯獨立性”領域得分高于非學會或協會(表 3)。由于循證指南(n=1)和中醫指南(n=3)數量較少,未能進行亞組分析。


3 討論
3.1 指南數量明顯增加,但質量不高
近年來,在中華醫學會、中國醫師協會等學術團體的指導下,我國發布的呼吸疾病指南數量逐漸增多[2]。隨著循證醫學理念的增強和指南制訂方法學的不斷發展,指南制訂本身的質量也受到廣泛的關注。Jiang 等[2]對 2013 年之前中國發布的 109 篇呼吸疾病指南進行評價,發現整體質量較低,尤其是“參與人員”、“制訂的嚴謹性”、“應用性”和“編輯獨立性”4 個領域得分特別低,這也是國內其他領域醫學指南存在的共性問題[52]。1999 年至 2013 年,國內發布的呼吸疾病指南年均僅為 6.4 篇(2~16 篇/年),其中 2009、2011 年最多(16 篇),雖然 2017 年發布指南的數據顯著增加(37 篇),但質量卻未見明顯提高[2],與國際平均水平[53]差距更大。由此可見,中國呼吸疾病指南存在的問題尚未得到指南制訂者的重視,提示我們需要在實際工作中提出更有效的措施來加強指南制訂的方法學和報告規范性。同時,對指南進行持續追蹤和質量評價,也有利于不斷地提高我國臨床實踐指南的質量,提升中國呼吸研究的影響力。
3.2 我國呼吸疾病指南發展對策
針對目前我國呼吸疾病指南的現況和存在問題,我們提出以下改進的建議。
3.2.1 加強循證醫學思維的傳播與普及
本研究顯示在呼吸疾病指南中,專家共識占大多數,與 Jiang 等[54]發表在Lancet上的研究結果類似。由此可見,盡管目前循證醫學在中國已逐漸被接受,但在臨床實踐中仍非常有限,需進一步加強循證醫學理念的傳播與普及[55]。中國很多臨床工作者(特別是基層醫院或低年資醫生),可能由于缺乏循證醫學意識和相關知識背景,無法正確理解證據質量和推薦強度,導致更傾向于遵循專家共識來進行決策,限制了循證指南在臨床上的推廣和應用[56,57]。臨床醫生既是證據的提供者,又是證據的使用者,這就要求醫生需具有循證醫學理念和相關知識,有能力對證據的來源和可靠性進行有效甄別,并根據具體情況科學合理地選擇和使用最佳證據去指導臨床實踐[5]。因此,我們應加強循證醫學理念的傳播與普及,針對臨床醫生開展相關培訓和調查,培養其使用循證指南的意識和習慣,從而達到提高整體醫療水平的目的。
3.2.2 提高指南的方法學質量和報告規范性
目前國內指南質量普遍不高,而低質量指南對臨床實踐不僅起不到指導作用,甚至可能阻礙臨床實踐[58]。因此建議從國家層面建立一個收錄、傳播、實施和監測指南的管理機構,從對指南制訂人員進行方法學培訓、嚴格遵循指南制訂的方法和流程、增加指南制訂過程的透明度、加強指南報告的規范性和更新機制、重視指南的利益沖突管理和質量監督、加強與國際指南制訂機構的交流與合作等多方面,來提高國內指南的方法學質量和報告規范性[55]。目前,有關學會和團體也意識到這點,開始制訂各種規范指南制訂程序的指南和報告規范的文件,如 2016 年中華醫學會頒布的《制訂/修訂<臨床診療指南>的基本方法及程序》[59]和中國牽頭完成的國際指南報告規范(RIGHT)聲明[60]。
3.2.3 提高指南的實用性和操作性,加強指南的傳播和實施
臨床實踐指南制訂發布后,需要推廣傳播促進指南的應用和實施。指南能否發揮最大作用,很大程度取決于推薦意見是否具有可操作性、科學性和實用性,以及臨床工作者對指南的理解和掌握程度、遵循程度,是否具備指南實施所需的設施設備和環境條件等方面。雖然近年來我國制訂指南的數量呈指數式增長,但大多數專家卻沒有關注指南的執行情況,目前尚缺乏這方面的數據[55]。國內有些循證指南雖然按照指南制訂的方法和流程來制訂,但若僅從方法學角度而忽視從臨床實際應用角度進行評價,可能導致評價結果跟實際應用存在偏倚—指南的方法質量和推薦意見與臨床實踐互相矛盾[61]。例如本研究推薦在臨床上使用的指南[43],雖然其方法學質量較高,報告格式也嚴格遵循了 AGREE Ⅱ工具要求的框架,但其數據的真實性、具體推薦意見的臨床適用性、患者的收益程度等很難被保證,臨床的使用狀況也不容樂觀。這也是 AGREE Ⅱ評價指南質量的不足之處[9]。
建議制訂指南需考慮指南的實用性和可操作性,通過同步開發配套的指南基層版、口袋書、APP 或網站以及相應的應用培訓等,來幫助臨床工作者隨時了解指南的相關信息;通過對指南具體實施情況的監測和評價,發現指南存在的問題和不足并使之及時得到糾正、完善來衡量指南的質量與應用效果,從而更好地促進指南發揮實際效用,達到改善患者結局目的。如 2018 年開展的“中國咳嗽指南推廣萬里行”全國巡講活動,幫助全國范圍內特別是基層醫院的醫生能更加透徹地理解 2016 年新修訂的中國咳嗽的診斷與治療指南[62]的內容,極大程度地促進了該指南的推廣、普及和傳播,提高了全國各級醫院對咳嗽,尤其慢性咳嗽的診療水平。
3.2.4 提高國內臨床研究質量
一部高質量的臨床實踐指南的形成,需要建立在大量的高質量臨床研究基礎上。盡管國內長期呼吁開展臨床研究,但缺少本土化的臨床研究證據是中國的臨床治療經驗難以轉化成可靠指南的原因之一[63,64]。高質量的隨機對照研究(randomized control trial,RCT)為指南提供高質量證據,而真實世界研究(real world study,RWS)評估了在真實臨床環境下治療措施對患者健康的影響,為 RCT 研究結果提供有力的佐證,對改進臨床患者的診治水平同樣具有重要意義[65-67]。與 RCT 相比,RWS 評價結果基于臨床真實環境,外部真實性更好,所產生的證據等級不一定低于 RCT 證據,也能為指南提供高質量證據[65-67]。建議政府主管部門應提供關于指南制訂的相關政策和專項資金,加大對高質量臨床研究的投入與支持,開展更多的高質量 RCT 和 RWS,生產更多的本土化證據,提高臨床科研的質量,從證據來源方面不斷提高指南的質量。
3.3 本研究的優勢和局限性
本研究的優勢:① 進行全面的文獻檢索,4 名評價員的評價結果一致性很好;② 研究團隊包括臨床醫生和指南方法學家;③ 使用國際通用的 AGREE Ⅱ對評價指南質量,AGREE Ⅱ已得到眾多衛生保健組織的支持和認可;④ 對不同維度進行加權。
本研究的局限性:① 沒有全面檢索和閱讀指南的補充材料和背景信息,可能會在某種程度低估有些指南的質量[62];② 只評價了發布在醫學雜志的指南,忽視了以其他形式(例如書、小冊子或者政府文檔等)發布的指南,或許存在發表偏倚;③ AGREE Ⅱ只能評價指南的方法學質量和報告規范性,無法評價推薦內容的有效性,可能導致指南方法質量和臨床有效性互相矛盾[68]。
3.4 結論
2017 年國內發布的呼吸疾病臨床實踐指南的整體質量相對之前有所提升,但與國際平均水平相比還存在較大差距,特別是制訂的嚴謹性和編輯獨立性領域。因此,今后指南開發者需要借鑒國際指南制訂方法,加強指南制訂方法學培訓,規范指南的報告,提高指南內容有效性,從而制訂出我國高質量的循證指南,更好指導臨床實踐。
利益沖突聲明:本研究聲明無利益沖突。
近年來,隨著大氣污染加重、吸煙和生物燃料的不合理使用,呼吸疾病的發病率和死亡率逐年升高,成為危害人類健康的主要疾病之一,給社會帶來了沉重的疾病負擔[1,2]。疾病的復雜性和醫療資源分布的地區差異,給呼吸疾病的臨床管理帶來嚴峻挑戰。臨床實踐指南是連接當前最佳證據與臨床實踐之間的橋梁,是規范醫療行為、提高醫療服務質量、提升衛生服務的成本效益和保障患者的生命健康的重要措施[3]。只有高質量指南才能有效發揮其臨床指導作用,但目前發布的臨床實踐指南質量良莠不齊,因此有必要及時對指南進行質量評價[4-6]。本研究旨在運用國際指南質量評價工具 Appraisal of Guidelines for Research and Evaluation Ⅱ(AGREE Ⅱ)[7]評價 2017 年國內期刊發布呼吸疾病指南的質量,監測呼吸疾病指南的質量變化,為今后指南的制訂和更新提供參考,以期提高國內指南質量,從而更好地發揮其指導作用。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
所有 2017 年中文發表的中國呼吸疾病相關臨床實踐指南,根據制訂方法主要分為基于循證醫學證據和基于專家共識兩類[8-10]。本研究對循證指南的定義是:指南至少報告了一個數據庫的檢索策略,并對證據質量及推薦強度進行分級。
1.1.2 排除標準
① 非診療指南;② 指南摘要或解讀;③ 國外指南的翻譯版或改編版;④ 發布在非醫學雜志的指南;⑤ 系統綜述、評論、臨床路徑和其他評價指南的文獻。
1.2 文獻檢索策略
計算機檢索 WanFang Data、CNKI、VIP 和 CBM 數據庫,以及百度、中華人民共和國國家衛生健康委員會、中華醫學會、中華中醫藥學會、中國臨床指南文庫、中華醫學網和醫脈通網站,手工檢索相關呼吸類醫學雜志,檢索時限為 2017 年 1 月至 2017 年 12 月。檢索詞包括:呼吸、肺、氣管、氣道、指南、指引、專家共識、規范、意見、推薦和建議等。以 CBM 為例,其檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 納入指南的基本信息:題目、發表時間、制訂機構、發表雜志、目標人群、關注疾病、參考文獻數和經費來源等;② 質量評價的關鍵要素、是否為循證指南等。
1.4 納入指南的質量評價
由 4 名研究者采用 AGREE Ⅱ對納入指南進行質量評價,包括 6 個領域 23 個條目和 2 個總體評估條目,每個條目的最低分為 1 分,最高分為 7 分[11]。根據公式計算各領域最終得分:各領域分值=(實際得分?最小可能得分)/(最大可能得分?最小可能得分)×100%[11]。指南總體評估綜合考慮所有領域,由于“制訂的嚴謹性”和“應用性”兩個領域的重要性,我們給予雙倍加權處理,6 個領域得分的加權平均數即為各指南的最終得分[2,12]。如果一篇指南最終得分超過 60%,則被評為“推薦在臨床上使用”;如果介于 30%~60% 之間,則被評為“修改后方推薦使用”;如果低于 30%,則被評為“不推薦在臨床上使用”[2,12]。
正式評價前,先對所有評價者進行 AGREE Ⅱ評分相關培訓,然后選取 3 篇指南進行預評分,并計算組內相關系數(Intra-class Correlation Coefficients,ICC)來評價一致性,從而確保每位評價者對每個條目的理解基本一致。只有當 ICC 值大于 0.8 時,才進行正式評價[10,13]。本研究進行預評分的 ICC 為 0.984[95%CI(0.977,0.990)],具有較好的一致性。
1.5 統計分析
運用 SPSS 23.0 軟件進行數據整理與分析,采用均數(范圍)和頻數對納入指南的基本信息進行統計描述。4 名研究者的一致性通過計算 ICC 來評價[14]。
2 結果
2.1 文獻檢索流程及結果
初檢共獲得相關文獻 594 篇,經逐層篩選,最終納入 37 篇指南[15-51]。文獻檢索流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CBM(
2.2 納入指南的基本特征
在所有納入指南中,1 篇(2.7%)為循證指南,7 篇(18.9%)為指南更新,更新年限 3~15 年。27 篇(73.0%)目標人群為成人,9 篇(24.3%)為兒童,1 篇(2.7%)為成人和兒童。26 篇(70.3%)由學會或協會牽頭制訂,涉及呼吸道感染、肺癌、咳嗽、COPD 和介入診療等各方面。34 篇(91.9%)為西醫指南。所有指南均提及參與指南制訂的專家和引用的參考文獻,專家組人數 4~133 人,參考文獻數目 0~158 篇。納入指南的基本特征見表 1。

2.3 AGREE Ⅱ評分結果
正式評價時,4 名評價者的 ICC 為 0.983[95%CI(0.982,0.985)],說明評價一致性很好。納入指南 AGREE Ⅱ各領域評價及總體評價結果見表 2。

6 個領域中“范圍和目的”和“表達的明晰性”兩個領域得分較高(59.3% 和 59.1%),“參與人員”、“制訂的嚴謹性”和“應用性”三個領域得分較低(25.1%、10.8% 和 25.8%)。“參與人員”有 33 篇(89.2%)得分低于 30%,僅 1 篇(2.7%)大于 60%,僅 1 篇(2.7%)提及有方法學家的參與并考慮了患者及家屬的意愿。“制訂的嚴謹性”領域有 26 篇(70.3%)得分小于 10%,僅有 3 篇(8.1%)大于 30%,1 篇(2.7%)使用了 GRADE 工具進行證據質量和推薦強度分級,1 篇(2.7%)提及指南更新、更新頻率與方法,1 篇(2.7%)闡述了數據庫的檢索方法,3 篇(8.1%)提及在指南發布前經過了外部專家的評審。“應用性”領域僅有 8 篇(21.6%)得分大于 30%,且所有指南均未提及應用的阻礙因素。“編輯獨立性”得分最低,平均僅為 7.3%,其中 26 篇(70.3%)得分為 0%,僅 1 篇(2.7%)指出受到贊助單位資助且其觀點不影響指南內容,2 篇(5.4%)提及與其他組織或個人不存在利益沖突。納入指南中,僅 1 篇(2.7%)被評為“推薦在臨床上使用”,2 篇(5.4%)被評為“修改后方推薦使用”,其余 34 篇(91.9%)被評為“不推薦在臨床上使用”。
2.4 可能影響指南質量的因素分析
按照不同亞組(包括版本、制訂機構、目標人群、研究領域、專家組成員數、參考文獻數)對可能影響指南質量的因素進行分析,結果顯示:所有指南更新在 6 個領域的得分均高于首版;兒童指南在 5 個領域(“應用性”領域除外)的得分高于成人;專家組成員數>25 人的指南在 6 個領域的得分均高于成員數≤25 人的指南;參考文獻數>40 條的指南在 4 個領域(除“參與人員”和“編輯獨立性”領域外)的得分高于參考文獻數≤40 條的指南;學會或協會制訂的指南在“參與人員”、“應用性”和“編輯獨立性”領域得分高于非學會或協會(表 3)。由于循證指南(n=1)和中醫指南(n=3)數量較少,未能進行亞組分析。


3 討論
3.1 指南數量明顯增加,但質量不高
近年來,在中華醫學會、中國醫師協會等學術團體的指導下,我國發布的呼吸疾病指南數量逐漸增多[2]。隨著循證醫學理念的增強和指南制訂方法學的不斷發展,指南制訂本身的質量也受到廣泛的關注。Jiang 等[2]對 2013 年之前中國發布的 109 篇呼吸疾病指南進行評價,發現整體質量較低,尤其是“參與人員”、“制訂的嚴謹性”、“應用性”和“編輯獨立性”4 個領域得分特別低,這也是國內其他領域醫學指南存在的共性問題[52]。1999 年至 2013 年,國內發布的呼吸疾病指南年均僅為 6.4 篇(2~16 篇/年),其中 2009、2011 年最多(16 篇),雖然 2017 年發布指南的數據顯著增加(37 篇),但質量卻未見明顯提高[2],與國際平均水平[53]差距更大。由此可見,中國呼吸疾病指南存在的問題尚未得到指南制訂者的重視,提示我們需要在實際工作中提出更有效的措施來加強指南制訂的方法學和報告規范性。同時,對指南進行持續追蹤和質量評價,也有利于不斷地提高我國臨床實踐指南的質量,提升中國呼吸研究的影響力。
3.2 我國呼吸疾病指南發展對策
針對目前我國呼吸疾病指南的現況和存在問題,我們提出以下改進的建議。
3.2.1 加強循證醫學思維的傳播與普及
本研究顯示在呼吸疾病指南中,專家共識占大多數,與 Jiang 等[54]發表在Lancet上的研究結果類似。由此可見,盡管目前循證醫學在中國已逐漸被接受,但在臨床實踐中仍非常有限,需進一步加強循證醫學理念的傳播與普及[55]。中國很多臨床工作者(特別是基層醫院或低年資醫生),可能由于缺乏循證醫學意識和相關知識背景,無法正確理解證據質量和推薦強度,導致更傾向于遵循專家共識來進行決策,限制了循證指南在臨床上的推廣和應用[56,57]。臨床醫生既是證據的提供者,又是證據的使用者,這就要求醫生需具有循證醫學理念和相關知識,有能力對證據的來源和可靠性進行有效甄別,并根據具體情況科學合理地選擇和使用最佳證據去指導臨床實踐[5]。因此,我們應加強循證醫學理念的傳播與普及,針對臨床醫生開展相關培訓和調查,培養其使用循證指南的意識和習慣,從而達到提高整體醫療水平的目的。
3.2.2 提高指南的方法學質量和報告規范性
目前國內指南質量普遍不高,而低質量指南對臨床實踐不僅起不到指導作用,甚至可能阻礙臨床實踐[58]。因此建議從國家層面建立一個收錄、傳播、實施和監測指南的管理機構,從對指南制訂人員進行方法學培訓、嚴格遵循指南制訂的方法和流程、增加指南制訂過程的透明度、加強指南報告的規范性和更新機制、重視指南的利益沖突管理和質量監督、加強與國際指南制訂機構的交流與合作等多方面,來提高國內指南的方法學質量和報告規范性[55]。目前,有關學會和團體也意識到這點,開始制訂各種規范指南制訂程序的指南和報告規范的文件,如 2016 年中華醫學會頒布的《制訂/修訂<臨床診療指南>的基本方法及程序》[59]和中國牽頭完成的國際指南報告規范(RIGHT)聲明[60]。
3.2.3 提高指南的實用性和操作性,加強指南的傳播和實施
臨床實踐指南制訂發布后,需要推廣傳播促進指南的應用和實施。指南能否發揮最大作用,很大程度取決于推薦意見是否具有可操作性、科學性和實用性,以及臨床工作者對指南的理解和掌握程度、遵循程度,是否具備指南實施所需的設施設備和環境條件等方面。雖然近年來我國制訂指南的數量呈指數式增長,但大多數專家卻沒有關注指南的執行情況,目前尚缺乏這方面的數據[55]。國內有些循證指南雖然按照指南制訂的方法和流程來制訂,但若僅從方法學角度而忽視從臨床實際應用角度進行評價,可能導致評價結果跟實際應用存在偏倚—指南的方法質量和推薦意見與臨床實踐互相矛盾[61]。例如本研究推薦在臨床上使用的指南[43],雖然其方法學質量較高,報告格式也嚴格遵循了 AGREE Ⅱ工具要求的框架,但其數據的真實性、具體推薦意見的臨床適用性、患者的收益程度等很難被保證,臨床的使用狀況也不容樂觀。這也是 AGREE Ⅱ評價指南質量的不足之處[9]。
建議制訂指南需考慮指南的實用性和可操作性,通過同步開發配套的指南基層版、口袋書、APP 或網站以及相應的應用培訓等,來幫助臨床工作者隨時了解指南的相關信息;通過對指南具體實施情況的監測和評價,發現指南存在的問題和不足并使之及時得到糾正、完善來衡量指南的質量與應用效果,從而更好地促進指南發揮實際效用,達到改善患者結局目的。如 2018 年開展的“中國咳嗽指南推廣萬里行”全國巡講活動,幫助全國范圍內特別是基層醫院的醫生能更加透徹地理解 2016 年新修訂的中國咳嗽的診斷與治療指南[62]的內容,極大程度地促進了該指南的推廣、普及和傳播,提高了全國各級醫院對咳嗽,尤其慢性咳嗽的診療水平。
3.2.4 提高國內臨床研究質量
一部高質量的臨床實踐指南的形成,需要建立在大量的高質量臨床研究基礎上。盡管國內長期呼吁開展臨床研究,但缺少本土化的臨床研究證據是中國的臨床治療經驗難以轉化成可靠指南的原因之一[63,64]。高質量的隨機對照研究(randomized control trial,RCT)為指南提供高質量證據,而真實世界研究(real world study,RWS)評估了在真實臨床環境下治療措施對患者健康的影響,為 RCT 研究結果提供有力的佐證,對改進臨床患者的診治水平同樣具有重要意義[65-67]。與 RCT 相比,RWS 評價結果基于臨床真實環境,外部真實性更好,所產生的證據等級不一定低于 RCT 證據,也能為指南提供高質量證據[65-67]。建議政府主管部門應提供關于指南制訂的相關政策和專項資金,加大對高質量臨床研究的投入與支持,開展更多的高質量 RCT 和 RWS,生產更多的本土化證據,提高臨床科研的質量,從證據來源方面不斷提高指南的質量。
3.3 本研究的優勢和局限性
本研究的優勢:① 進行全面的文獻檢索,4 名評價員的評價結果一致性很好;② 研究團隊包括臨床醫生和指南方法學家;③ 使用國際通用的 AGREE Ⅱ對評價指南質量,AGREE Ⅱ已得到眾多衛生保健組織的支持和認可;④ 對不同維度進行加權。
本研究的局限性:① 沒有全面檢索和閱讀指南的補充材料和背景信息,可能會在某種程度低估有些指南的質量[62];② 只評價了發布在醫學雜志的指南,忽視了以其他形式(例如書、小冊子或者政府文檔等)發布的指南,或許存在發表偏倚;③ AGREE Ⅱ只能評價指南的方法學質量和報告規范性,無法評價推薦內容的有效性,可能導致指南方法質量和臨床有效性互相矛盾[68]。
3.4 結論
2017 年國內發布的呼吸疾病臨床實踐指南的整體質量相對之前有所提升,但與國際平均水平相比還存在較大差距,特別是制訂的嚴謹性和編輯獨立性領域。因此,今后指南開發者需要借鑒國際指南制訂方法,加強指南制訂方法學培訓,規范指南的報告,提高指南內容有效性,從而制訂出我國高質量的循證指南,更好指導臨床實踐。
利益沖突聲明:本研究聲明無利益沖突。