引用本文: 江梅, 廖理粵, 羅煒, 謝燕清, 賴克方. 國內咳嗽診療指南的質量評價. 中國循證醫學雜志, 2015, 15(4): 409-413. doi: 10.7507/1672-2531.20150069 復制
咳嗽,是臨床上最常見的病癥之一。我國上呼吸道感染引起的急性咳嗽社區患病率約為9%~64%,慢性咳嗽患病率為7.2%~33% [1]。由于慢性咳嗽缺乏典型的相關癥狀、胸部X線片檢查無異常,特別是對慢性咳嗽的病因認識不足,很多患者長期誤診誤治,嚴重影響其學習、工作和生活 [2]。1998年美國胸科醫師協會制定了世界第一部咳嗽診療方面的指南 [3],并于2006年進行修訂 [4]。日本 [5]、歐洲 [6]相繼于2003、2004年制定了相關指南。而我國也于2005年制定了中國第一部咳嗽診療方面的指南 [7],并于2009年進行修訂 [8]。這些指南的制定和實施,幫助很多臨床醫生(特別是呼吸科醫生)提高了對慢性咳嗽的診治水平,同時也相應提高了醫療服務質量,對臨床實踐具有重要意義。到目前為止,我國已發布了多部咳嗽診療方面的指南,但尚未有研究對其質量進行評價。本研究采用國際公認評價指南質量的工具AGREE Ⅱ(appraisal of guidelines for research and evaluation Ⅱ)[9]對我國發布的咳嗽診療指南進行評價,旨在了解該領域指南存在的問題,為今后我國咳嗽診療循證指南的更新和制定提供參考。
1 資料與方法
1.1 納入與排除標準
納入所有中文發表的有關咳嗽診療的指南;指南若有更新,原指南和更新版都同時納入和評價。按照Field等 [10]給出的指南定義來區分文獻是否屬于指南:臨床實踐指南是系統開發的用來幫助臨床醫生和患者在特定情況作出合適臨床決策的文件。排除標準:指南摘要或解讀、非診療指南、國外指南翻譯版或改編版。
1.2 檢索策略
計算機檢索WanFang Data、CNKI、VIP和CBM數據庫及中國臨床指南網站,檢索時間限定為建庫至2014年12月。檢索詞包括:指南、專家共識、規范和咳嗽。
1.3 資料提取與評價
由4位研究者獨立提取納入指南的基本信息,并采用AGREE Ⅱ對其進行質量評價。AGREE Ⅱ包括6個領域(23個條目)和2個總體評估條目。每個條目的最低分為1分,最高分為7分。各領域最終得分(標化為百分比)=(實際分-最低分)/(最高分-最低分)[9]。正式評價前,對所有評價者進行AGREE Ⅱ評分培訓,包括在線練習評分和預評分,確保每位研究者對每個條目的理解基本一致。
本研究對循證指南的判斷標準為:報告了至少一個數據庫的檢索策略、對證據質量進行評價以及對推薦意見進行分級 [11]。
1.4 統計分析
采用均數(范圍)和頻數對納入指南的基本信息進行統計描述。4位研究者評價的一致性通過計算組內相關系數來評價。
2 結果
2.1 納入指南的基本特征
本研究共納入6個指南,發表時間從2005~2014年。其中4個指南是首版,2個指南是更新版,平均更新時間為5年。參與指南制定的專家人數為11~32人,指南參考文獻數為0~36篇;除1個指南外,其余均由學會牽頭制定;有2個涉及中醫領域,3個目標人群為兒童;有2個關注慢性咳嗽,其余均涉及所有咳嗽類型;只有2個指南為循證指南(表 1)。

2.2 AGREE Ⅱ評分結果
4位研究者之間關于AGREE Ⅱ的評價結果組間相關系數為0.973[95%CI(0.965,0.979)],具有較好的一致性。6個領域的得分情況詳見表 2。

2.2.1 范圍和目的
該領域主要考察指南在闡述總目的、衛生問題和涉及人群是否清晰明了,以便指南使用者可以快速獲取所需指南。在6個領域得分中,該領域得分最高,平均為61.1%(54.2%~68.1%)。
2.2.2 參與人員
該領域考察指南制定小組的構成及闡明指南的使用者,要求需要包含所有相關專業人員,如方法學家等,同時還應包括患者代表參與。該領域得分較低,平均26.6%(19.4%~34.7%)。納入的6個指南均未提及有方法學家和患者代表參與指南制定。
2.2.3 制定的嚴謹性
該領域是評價指南質量高低的重要內容,考察指南制定過程中各個步驟的嚴謹性。該領域得分很低,所有指南得分<30%,平均僅為16.7%(8.9%~27.1%)。只有2個指南為循證指南,描述了具體的證據分級和推薦強度,但無一提及檢索的數據庫、檢索時間和檢索策略;無一使用GRADE工具進行證據分級和推薦;無一提及指南更新及更新頻率與方法。
2.2.4 表達的明晰性
該領域考察指南形成推薦意見時對推薦意見的表達是否明確不含糊,并根據不同情況給出不同推薦意見。該領域得分相對較高,平均為58.4%(41.7%~75.0%)。
2.2.5 應用性
該領域考察指南在應用過程中的適應性和可行性。該領域得分較低,平均僅為11.1%(1.1%~22.9%)。其中2個指南得分僅為1.1%。
2.2.6 編輯獨立性
該領域反映了指南的可信度,指南應闡述贊助單位的觀點不影響指南的內容,和制定小組成員的利益沖突。納入6個指南該領域得分均為0,均未在指南正文中報告是否受到贊助單位的資助和利益沖突情況。
2.2.7 總體評價
納入的所有指南得分均<50%,僅2個指南可以修訂后在臨床推薦使用(得分>30%)。6個領域中,范圍和目的和表達的明晰性兩個領域總體平均分均>50%,而參與人員、制定的嚴謹性、應用性,特別是編輯獨立性有待加強。
3 討論
臨床實踐指南是縮小當前最佳證據與臨床實踐之間差距的臨床決策工具,是規范醫療行為和提高醫療服務質量的重要措施 [16]。然而指南所起作用依賴于本身的質量,只有高質量的指南才能有效發揮指導作用 [17]。目前國內外尚無研究對咳嗽診療指南進行質量評價。因此,我們采用AGREE Ⅱ工具對目前國內咳嗽診療指南的質量進行了評價,針對其存在的問題提出相應的建議,以期提高國內咳嗽診療指南的方法學質量。
本研究結果提示,目前我國咳嗽診療指南質量不高,其中范圍和目的、表達的明晰性兩個領域AGREE Ⅱ得分相對較高,其余4個領域得分均非常低,特別是制定的嚴謹性、應用性和編輯獨立性3個領域。跟國內指南相比,除了編輯獨立性,咳嗽診療指南其他5個領域的AGREE Ⅱ得分均高于陳耀龍等 [18]和韋當等 [19]的研究結果,但與胡晶等 [20]的研究結果類似。與國外指南相比,本研究6個領域得分均低于國際平均水平 [21],特別是在制定的嚴謹性、應用性和編輯獨立性3個領域。在呼吸疾病領域中,Acuna-Izcaray等 [22]、Linda等 [23]和Zeng等 [24]曾對國際上發表的哮喘、肺癌和兒童上呼吸道感染診療指南進行質量評價。與這些研究結果相比,我國咳嗽診療指南也是在制定的嚴謹性、應用性和編輯獨立性3個領域得分較低。
指南制定的嚴謹性這一領域得分的高低反映了指南制定小組對方法學的認識和重視程度。指南制定是一項復雜的工作,需要科學性和規范化 [24]。但目前大多數國內的臨床實踐指南是通過專家共識方法制定的,缺乏透明性,質量無法保證。到目前為止,GIN數據庫和美國國家指南文庫均未收錄來自中國大陸的指南 [25],原因可能與國內指南質量相對比較低有關。2000年WHO倡議指南應由循證方法制定,2011年美國醫學研究所給出臨床指南的新定義 [26],也強調了制定循證指南的重要性。采用循證方法制定指南是當前的趨勢,它需要多學科人員的參與,具有嚴格的開發程序。指南制定小組不僅要包括臨床專家,還要納入方法學專家等,同時要考慮患者的利益和偏好。而我國目前所制定指南大多數僅包括臨床醫生,忽視方法學家的作用,且甚少指南能夠考慮到患者意愿。因此,建議今后國內在制定指南時應重視多學科成員的納入。其次,中國的指南制定者對循證指南制定程序各個步驟不熟悉,包括如何提出相關臨床問題、系統全面收集證據、使用正確的方法對證據進行評價、再根據證據級別和強度提出推薦意見等各個環節,迫切需要進行相關的方法學培訓。GRADE系統代表了當前對研究證據進行分類分級的國際最高水平,它突破了單從研究設計角度考慮證據質量的局限性,在對推薦建議分級時將證據質量和其他因素(例如患者價值觀和意愿、資源利用等)綜合進行考慮 [27]。因此,建議今后中國臨床指南的制定者采用GRADE工具來進行證據分級和形成推薦意見。有研究表明,指南在發布之后的平均3.6年信息就過時,因此建議指南需要定期更新 [28]。指南需有明確更新計劃,包括在何時或何種情況下需要更新,以及如何更新。
另外,咳嗽診療指南AGREE Ⅱ得分低,可能不是因為指南本身質量低,而是指南的報告不規范導致的 [20, 21]。在發表時由于版面限制,編寫者未對指南制定方法學進行闡述;或指南制定者對指南報告規范不熟悉,有些細節并未交代清楚。例如有些咳嗽診療指南進行了定期更新,但在指南中卻未寫清楚。因此,指南制定者在指南報告規范方面有待加強。
應用性這一領域得分低,說明指南在應用過程中適應性和可行性差。很多指南制定者常常把指南制定和具體實施分開考慮 [21],建議在指南正式發表前,需在小范圍內進行預試驗,檢測指南的可實施性及其利弊。利益沖突是指南制定過程中最常見的偏倚來源 [29]。因此為了保證指南制定的透明化,制定小組成員必須明確聲明是否存在潛在的利益沖突 [30]。但納入的6個咳嗽診療指南編輯獨立性得分均為0,表明我國指南制定小組沒有意識到其重要性,未特意聲明利益沖突。因此,建議國內醫學期刊編輯要求指南制定者在投稿時將所有參與編寫成員的利益沖突聲明作為附件一起提供,以提高指南編寫過程的透明度。
本研究的局限性:① AGREE Ⅱ評價指南時注重對指南方法學和指南報告質量的評價,而對指南證據質量和推薦內容真實可靠評價不足 [31],因此可能會出現得分與真實質量不符合的情況 [32]。② 未能找到與納入指南制定過程相關的附加材料,因此可能會低估納入指南的質量。
總之,目前國內咳嗽診療指南質量不高。因此,我們需要借鑒國際指南制定方法,加強指南制定方法學培訓和研究,規范指南的報告,制定出我國高質量的咳嗽循證指南。
咳嗽,是臨床上最常見的病癥之一。我國上呼吸道感染引起的急性咳嗽社區患病率約為9%~64%,慢性咳嗽患病率為7.2%~33% [1]。由于慢性咳嗽缺乏典型的相關癥狀、胸部X線片檢查無異常,特別是對慢性咳嗽的病因認識不足,很多患者長期誤診誤治,嚴重影響其學習、工作和生活 [2]。1998年美國胸科醫師協會制定了世界第一部咳嗽診療方面的指南 [3],并于2006年進行修訂 [4]。日本 [5]、歐洲 [6]相繼于2003、2004年制定了相關指南。而我國也于2005年制定了中國第一部咳嗽診療方面的指南 [7],并于2009年進行修訂 [8]。這些指南的制定和實施,幫助很多臨床醫生(特別是呼吸科醫生)提高了對慢性咳嗽的診治水平,同時也相應提高了醫療服務質量,對臨床實踐具有重要意義。到目前為止,我國已發布了多部咳嗽診療方面的指南,但尚未有研究對其質量進行評價。本研究采用國際公認評價指南質量的工具AGREE Ⅱ(appraisal of guidelines for research and evaluation Ⅱ)[9]對我國發布的咳嗽診療指南進行評價,旨在了解該領域指南存在的問題,為今后我國咳嗽診療循證指南的更新和制定提供參考。
1 資料與方法
1.1 納入與排除標準
納入所有中文發表的有關咳嗽診療的指南;指南若有更新,原指南和更新版都同時納入和評價。按照Field等 [10]給出的指南定義來區分文獻是否屬于指南:臨床實踐指南是系統開發的用來幫助臨床醫生和患者在特定情況作出合適臨床決策的文件。排除標準:指南摘要或解讀、非診療指南、國外指南翻譯版或改編版。
1.2 檢索策略
計算機檢索WanFang Data、CNKI、VIP和CBM數據庫及中國臨床指南網站,檢索時間限定為建庫至2014年12月。檢索詞包括:指南、專家共識、規范和咳嗽。
1.3 資料提取與評價
由4位研究者獨立提取納入指南的基本信息,并采用AGREE Ⅱ對其進行質量評價。AGREE Ⅱ包括6個領域(23個條目)和2個總體評估條目。每個條目的最低分為1分,最高分為7分。各領域最終得分(標化為百分比)=(實際分-最低分)/(最高分-最低分)[9]。正式評價前,對所有評價者進行AGREE Ⅱ評分培訓,包括在線練習評分和預評分,確保每位研究者對每個條目的理解基本一致。
本研究對循證指南的判斷標準為:報告了至少一個數據庫的檢索策略、對證據質量進行評價以及對推薦意見進行分級 [11]。
1.4 統計分析
采用均數(范圍)和頻數對納入指南的基本信息進行統計描述。4位研究者評價的一致性通過計算組內相關系數來評價。
2 結果
2.1 納入指南的基本特征
本研究共納入6個指南,發表時間從2005~2014年。其中4個指南是首版,2個指南是更新版,平均更新時間為5年。參與指南制定的專家人數為11~32人,指南參考文獻數為0~36篇;除1個指南外,其余均由學會牽頭制定;有2個涉及中醫領域,3個目標人群為兒童;有2個關注慢性咳嗽,其余均涉及所有咳嗽類型;只有2個指南為循證指南(表 1)。

2.2 AGREE Ⅱ評分結果
4位研究者之間關于AGREE Ⅱ的評價結果組間相關系數為0.973[95%CI(0.965,0.979)],具有較好的一致性。6個領域的得分情況詳見表 2。

2.2.1 范圍和目的
該領域主要考察指南在闡述總目的、衛生問題和涉及人群是否清晰明了,以便指南使用者可以快速獲取所需指南。在6個領域得分中,該領域得分最高,平均為61.1%(54.2%~68.1%)。
2.2.2 參與人員
該領域考察指南制定小組的構成及闡明指南的使用者,要求需要包含所有相關專業人員,如方法學家等,同時還應包括患者代表參與。該領域得分較低,平均26.6%(19.4%~34.7%)。納入的6個指南均未提及有方法學家和患者代表參與指南制定。
2.2.3 制定的嚴謹性
該領域是評價指南質量高低的重要內容,考察指南制定過程中各個步驟的嚴謹性。該領域得分很低,所有指南得分<30%,平均僅為16.7%(8.9%~27.1%)。只有2個指南為循證指南,描述了具體的證據分級和推薦強度,但無一提及檢索的數據庫、檢索時間和檢索策略;無一使用GRADE工具進行證據分級和推薦;無一提及指南更新及更新頻率與方法。
2.2.4 表達的明晰性
該領域考察指南形成推薦意見時對推薦意見的表達是否明確不含糊,并根據不同情況給出不同推薦意見。該領域得分相對較高,平均為58.4%(41.7%~75.0%)。
2.2.5 應用性
該領域考察指南在應用過程中的適應性和可行性。該領域得分較低,平均僅為11.1%(1.1%~22.9%)。其中2個指南得分僅為1.1%。
2.2.6 編輯獨立性
該領域反映了指南的可信度,指南應闡述贊助單位的觀點不影響指南的內容,和制定小組成員的利益沖突。納入6個指南該領域得分均為0,均未在指南正文中報告是否受到贊助單位的資助和利益沖突情況。
2.2.7 總體評價
納入的所有指南得分均<50%,僅2個指南可以修訂后在臨床推薦使用(得分>30%)。6個領域中,范圍和目的和表達的明晰性兩個領域總體平均分均>50%,而參與人員、制定的嚴謹性、應用性,特別是編輯獨立性有待加強。
3 討論
臨床實踐指南是縮小當前最佳證據與臨床實踐之間差距的臨床決策工具,是規范醫療行為和提高醫療服務質量的重要措施 [16]。然而指南所起作用依賴于本身的質量,只有高質量的指南才能有效發揮指導作用 [17]。目前國內外尚無研究對咳嗽診療指南進行質量評價。因此,我們采用AGREE Ⅱ工具對目前國內咳嗽診療指南的質量進行了評價,針對其存在的問題提出相應的建議,以期提高國內咳嗽診療指南的方法學質量。
本研究結果提示,目前我國咳嗽診療指南質量不高,其中范圍和目的、表達的明晰性兩個領域AGREE Ⅱ得分相對較高,其余4個領域得分均非常低,特別是制定的嚴謹性、應用性和編輯獨立性3個領域。跟國內指南相比,除了編輯獨立性,咳嗽診療指南其他5個領域的AGREE Ⅱ得分均高于陳耀龍等 [18]和韋當等 [19]的研究結果,但與胡晶等 [20]的研究結果類似。與國外指南相比,本研究6個領域得分均低于國際平均水平 [21],特別是在制定的嚴謹性、應用性和編輯獨立性3個領域。在呼吸疾病領域中,Acuna-Izcaray等 [22]、Linda等 [23]和Zeng等 [24]曾對國際上發表的哮喘、肺癌和兒童上呼吸道感染診療指南進行質量評價。與這些研究結果相比,我國咳嗽診療指南也是在制定的嚴謹性、應用性和編輯獨立性3個領域得分較低。
指南制定的嚴謹性這一領域得分的高低反映了指南制定小組對方法學的認識和重視程度。指南制定是一項復雜的工作,需要科學性和規范化 [24]。但目前大多數國內的臨床實踐指南是通過專家共識方法制定的,缺乏透明性,質量無法保證。到目前為止,GIN數據庫和美國國家指南文庫均未收錄來自中國大陸的指南 [25],原因可能與國內指南質量相對比較低有關。2000年WHO倡議指南應由循證方法制定,2011年美國醫學研究所給出臨床指南的新定義 [26],也強調了制定循證指南的重要性。采用循證方法制定指南是當前的趨勢,它需要多學科人員的參與,具有嚴格的開發程序。指南制定小組不僅要包括臨床專家,還要納入方法學專家等,同時要考慮患者的利益和偏好。而我國目前所制定指南大多數僅包括臨床醫生,忽視方法學家的作用,且甚少指南能夠考慮到患者意愿。因此,建議今后國內在制定指南時應重視多學科成員的納入。其次,中國的指南制定者對循證指南制定程序各個步驟不熟悉,包括如何提出相關臨床問題、系統全面收集證據、使用正確的方法對證據進行評價、再根據證據級別和強度提出推薦意見等各個環節,迫切需要進行相關的方法學培訓。GRADE系統代表了當前對研究證據進行分類分級的國際最高水平,它突破了單從研究設計角度考慮證據質量的局限性,在對推薦建議分級時將證據質量和其他因素(例如患者價值觀和意愿、資源利用等)綜合進行考慮 [27]。因此,建議今后中國臨床指南的制定者采用GRADE工具來進行證據分級和形成推薦意見。有研究表明,指南在發布之后的平均3.6年信息就過時,因此建議指南需要定期更新 [28]。指南需有明確更新計劃,包括在何時或何種情況下需要更新,以及如何更新。
另外,咳嗽診療指南AGREE Ⅱ得分低,可能不是因為指南本身質量低,而是指南的報告不規范導致的 [20, 21]。在發表時由于版面限制,編寫者未對指南制定方法學進行闡述;或指南制定者對指南報告規范不熟悉,有些細節并未交代清楚。例如有些咳嗽診療指南進行了定期更新,但在指南中卻未寫清楚。因此,指南制定者在指南報告規范方面有待加強。
應用性這一領域得分低,說明指南在應用過程中適應性和可行性差。很多指南制定者常常把指南制定和具體實施分開考慮 [21],建議在指南正式發表前,需在小范圍內進行預試驗,檢測指南的可實施性及其利弊。利益沖突是指南制定過程中最常見的偏倚來源 [29]。因此為了保證指南制定的透明化,制定小組成員必須明確聲明是否存在潛在的利益沖突 [30]。但納入的6個咳嗽診療指南編輯獨立性得分均為0,表明我國指南制定小組沒有意識到其重要性,未特意聲明利益沖突。因此,建議國內醫學期刊編輯要求指南制定者在投稿時將所有參與編寫成員的利益沖突聲明作為附件一起提供,以提高指南編寫過程的透明度。
本研究的局限性:① AGREE Ⅱ評價指南時注重對指南方法學和指南報告質量的評價,而對指南證據質量和推薦內容真實可靠評價不足 [31],因此可能會出現得分與真實質量不符合的情況 [32]。② 未能找到與納入指南制定過程相關的附加材料,因此可能會低估納入指南的質量。
總之,目前國內咳嗽診療指南質量不高。因此,我們需要借鑒國際指南制定方法,加強指南制定方法學培訓和研究,規范指南的報告,制定出我國高質量的咳嗽循證指南。