引用本文: 李楠, 姚亮, 吳瓊芳, 韋當, 王琪, 王小琴, 楊克虎, 陳耀龍. 2012~2013年中國大陸期刊發表臨床實踐指南質量評價. 中國循證醫學雜志, 2015, 15(3): 259-263. doi: 10.7507/1672-2531.20150045 復制
臨床實踐指南(以下簡稱指南)的制定對于改善醫療服務質量和安全性、減少不恰當的臨床決策行為以及提高新研究成果在臨床上的推廣和應用具有重要意義 [1]。然而如果指南的制定不夠嚴謹、規范,則很有可能對臨床醫生造成誤導,并給患者帶來危害和不必要的經濟負擔,因此有必要對指南進行質量評價。近年來,雖然國內指南的數量不斷增多 [2],但指南質量卻被廣泛爭議。中國GRADE中心指南研究課題組旨在對中國大陸期刊發表臨床實踐指南的質量進行持續監測,已發表的前2篇文章報告了2011年之前的344篇大陸期刊發表指南的質量評價結果 [3, 4]。作為該系列的第三篇,本研究關注的是2012~2013年大陸期刊發表指南質量的變化情況。
1 資料與方法
1.1 納入與排除標準
納入符合指南定義 [5-8]的文獻,即系統評價產生的證據以及對各種備選干預方式進行利弊評價之后提出的最優指導意見的文件。排除以下文獻:① 指南摘要;② 書目指南;③ 國外指南的翻譯版或改編版。
1.2 檢索策略
計算機檢索CBM、CNKI和WanFang Data。本課題組采用統一的檢索策略 [3],具體檢索策略見表 1。由于VIP數據庫系統出現檢索結果顯示不全的問題,同時有研究表明VIP與WanFang Data的重復率高達85.2%,與CNKI的重復率高達98.5% [9],因此本研究對VIP未進行檢索。

1.3 文獻篩選、資料提取與質量評價
文獻篩選分為文題、摘要篩選和全文篩選兩個階段。6名研究人員分為三組,每組2名研究人員采用預先制定的信息提取表獨立提取納入指南信息。提取內容包括指南應用領域、更新情況、制定單位、方法學等方面。然后采用AGREE Ⅱ指南評價工具 [10]進行質量評價,共分為6個領域,包含23條評分項。每條評分項的最低分為1分,最高分為7分。每篇指南各領域最終得分(標化為百分比)的計算公式如下:各領域得分=(實際分-最低分)/(最高分-最低分)。
1.4 質量控制
在正式評分之前,所有研究人員共同學習AGREE Ⅱ評分條目并進行了一次預試驗(計算機隨機選取10篇指南) [11-20],以確保每名研究人員對每個條目的理解基本一致。然后采用SPSS 19.0軟件計算組內相關系數ICC(interclass correlation coefficient)值驗證一致性 [21, 22],只有當ICC值>0.8時,才進行正式試驗。
1.5 統計分析
AGREE Ⅱ各領域最終得分為納入指南在各個領域得分的平均數。所得數據運用Microsoft Excel 2013進行整理。計量資料的結果采用均值及其95%CI表示。
2 結果
2.1 納入指南的一般情況
最終納入指南78篇,其中2012年37篇,2013年41篇。文獻篩選流程及結果見圖 1。整體來看這78篇指南呈現以下特點:① 在應用類別方面以診療指南為主,占57.69%(45篇),其次為技術類指南(14.10%/11篇)和治療類指南(10.26%/8篇)(圖 2);② 參與指南制定的單位主要是學會(42.31%/33篇),此外衛生和計劃生育委員會(前衛生部)、協會以及醫院也都參與了指南的制定,分別占8.97%(7篇)、6.41%(5篇)和5.13%(4篇)(圖 3);③ 制定方法學方面,29%(23篇)的指南提及應用了循證的方法制定指南;④ 基金或項目資助方面,23%(18篇)的指南報告了受資助情況;⑤ 指南更新方面,有10%(8篇)的指南 [23-30]報告了將在未來2~5年進行更新;⑥ 數據庫檢索方面,僅有2篇(3%)指南 [31, 32]清楚描述了檢索數據庫、檢索詞及檢索時限;⑦ 利益聲明方面,僅有1篇(1%)指南 [32]報告了利益沖突聲明。



2.2 納入指南AGREE Ⅱ評分結果
6名研究人員運用AGREE Ⅱ對納入指南獨立進行評價,預試驗結果的ICC值為0.95[95%CI(0.94,0.96)],說明6名研究人員對評分條目的理解達成了一致。6個領域得分的具體分布情況見表 2。每個領域內容所代表的具體含義請參見本系列第二篇文章《2011年中國臨床實踐指南質量評價》 [4]。不同年份國內指南以及國際指南的AGREE Ⅱ得分情況見圖 4 [3, 4, 33]。


2.3 不同分類標準下各亞類指南的AGREE Ⅱ各領域得分情況
不同分類標準(包括指南的制定單位、類型、發表期刊、資助情況和提及循證方法情況)下各亞類指南的AGREE Ⅱ各領域得分情況見表 3。結果顯示:不同制定單位和不同類型的指南各領域得分差異較大,發表在CSCD期刊的指南在5個領域得分均高于非CSCD期刊(除“領域五:應用性”外),接受資助的指南在4個領域得分(除“領域二:參與人員”和“領域五:應用性”外)均高于未接受資助的指南,提及循證方法制定的指南各領域得分明顯高于未提及的指南。2013年發表的指南在5個領域(除 “領域六:編輯獨立性”外)的得分均高于2012年發表的指南。

3 討論
3.1 整體質量情況
從AGREE評分的總體情況來看,2012和2013年的指南評分與2011年和2011年之間的指南評分相比呈上升趨勢。其原因可能有兩方面:一方面,隨著循證醫學在國內的不斷發展,本土的循證醫學證據不斷累積為國內指南的制定提供了良好的證據基礎;另一方面,有關指南方法學的文章也被越來越多的指南制定者知曉,并運用到指南制定中,提高了指南制定的科學性。
雖然2012和2013年的指南相對之前的指南質量有所提升,但與國際平均水平相比還存在較大差距。其中差距最大的領域是制定的嚴謹性(領域三),其次是編輯獨立性(領域六)和參與人員(領域二)。這提示國內指南制定者應注重在指南制定過程中重點參考這三個領域的具體內容。制定的嚴謹性主要考察指南制定者對方法學的研究、認知和重視程度,包括對證據的檢索、證據選擇標準的描述、推薦意見形成的描述、形成推薦意見時是否考慮了對健康的風險及副作用、推薦意見與證據之間的關系、專家的外部評審和指南更新的步驟 [34]。編輯獨立性主要考察指南制定過程中的編輯獨立性,包括贊助單位的觀點不影響指南的內容和指南闡述并強調了制定小組成員的利益沖突 [34]。參與人員主要考察指南制定過程中參與人員的構成及闡明指南的使用者,指南制定小組應包含所有相關專業人員,如文獻檢索專家、統計學家、方法學家、臨床醫生等,同時參與人員中還應包括目標人群的代表,即患者、公眾等 [34]。
3.2 指南質量的影響因素
由表 3可見,指南的質量受多種因素影響。從指南的制定機構來看,協、學會制定的指南質量更高,可能與其可支配與指南制定相關的資源較其他類型機構更多(如能召集更多相關專業和領域的專家)有關;從指南發表的期刊等級來看,CSCD期刊發表的指南質量明顯高于非CSCD期刊,可能與CSCD期刊對論文的科學性和透明性要求更嚴格有關。從指南接受資助的情況來看,有資助的指南質量更高,可能與其有更多資金用于招募相關領域專家組成指南制定小組有關;此外,循證制定的指南比非循證制定的指南質量更高,與循證制定過程能夠保證指南制定過程更加嚴謹有關。
3.3 本研究的局限性
本研究的局限性包括:① 當前針對指南的檢索并無統一的檢索策略,本研究對通過“指南”和“指引”進行主題檢索獲取指南,存在漏檢的可能;② 雖然對研究人員進行了AGREE工具使用的培訓并進行了預試驗,但不排除因個人理解的差異影響打分結果的精確性。
3.4 小結
臨床指南作為指導醫務工作者醫療決策的重要文件和主要依據 [34],其制定方法應盡可能嚴謹和科學。運用循證醫學的理念和方法制定指南是指南制定的發展趨勢。目前國內指南主要由中華醫學會及其分會來制定,主要關注的是疾病的治療方面,對于預防、診斷以及預后的關注較少。另外,國內指南質量逐年改善,但與國際平均水平相比還存在較大差距,主要體現在指南制定的嚴謹性、編輯的獨立性以及參與人員的多學科化方面。國內的指南制定者在指南制定的過程中應重視和參考國際上關于指南制定方面的科學方法,如結構化指南問題,并通過系統全面的檢索、評價和綜合證據,并考慮成本、證據質量以及患者意愿形成推薦意見,在此過程中還應注意增加指南制定過程的透明性和獨立性。
臨床實踐指南(以下簡稱指南)的制定對于改善醫療服務質量和安全性、減少不恰當的臨床決策行為以及提高新研究成果在臨床上的推廣和應用具有重要意義 [1]。然而如果指南的制定不夠嚴謹、規范,則很有可能對臨床醫生造成誤導,并給患者帶來危害和不必要的經濟負擔,因此有必要對指南進行質量評價。近年來,雖然國內指南的數量不斷增多 [2],但指南質量卻被廣泛爭議。中國GRADE中心指南研究課題組旨在對中國大陸期刊發表臨床實踐指南的質量進行持續監測,已發表的前2篇文章報告了2011年之前的344篇大陸期刊發表指南的質量評價結果 [3, 4]。作為該系列的第三篇,本研究關注的是2012~2013年大陸期刊發表指南質量的變化情況。
1 資料與方法
1.1 納入與排除標準
納入符合指南定義 [5-8]的文獻,即系統評價產生的證據以及對各種備選干預方式進行利弊評價之后提出的最優指導意見的文件。排除以下文獻:① 指南摘要;② 書目指南;③ 國外指南的翻譯版或改編版。
1.2 檢索策略
計算機檢索CBM、CNKI和WanFang Data。本課題組采用統一的檢索策略 [3],具體檢索策略見表 1。由于VIP數據庫系統出現檢索結果顯示不全的問題,同時有研究表明VIP與WanFang Data的重復率高達85.2%,與CNKI的重復率高達98.5% [9],因此本研究對VIP未進行檢索。

1.3 文獻篩選、資料提取與質量評價
文獻篩選分為文題、摘要篩選和全文篩選兩個階段。6名研究人員分為三組,每組2名研究人員采用預先制定的信息提取表獨立提取納入指南信息。提取內容包括指南應用領域、更新情況、制定單位、方法學等方面。然后采用AGREE Ⅱ指南評價工具 [10]進行質量評價,共分為6個領域,包含23條評分項。每條評分項的最低分為1分,最高分為7分。每篇指南各領域最終得分(標化為百分比)的計算公式如下:各領域得分=(實際分-最低分)/(最高分-最低分)。
1.4 質量控制
在正式評分之前,所有研究人員共同學習AGREE Ⅱ評分條目并進行了一次預試驗(計算機隨機選取10篇指南) [11-20],以確保每名研究人員對每個條目的理解基本一致。然后采用SPSS 19.0軟件計算組內相關系數ICC(interclass correlation coefficient)值驗證一致性 [21, 22],只有當ICC值>0.8時,才進行正式試驗。
1.5 統計分析
AGREE Ⅱ各領域最終得分為納入指南在各個領域得分的平均數。所得數據運用Microsoft Excel 2013進行整理。計量資料的結果采用均值及其95%CI表示。
2 結果
2.1 納入指南的一般情況
最終納入指南78篇,其中2012年37篇,2013年41篇。文獻篩選流程及結果見圖 1。整體來看這78篇指南呈現以下特點:① 在應用類別方面以診療指南為主,占57.69%(45篇),其次為技術類指南(14.10%/11篇)和治療類指南(10.26%/8篇)(圖 2);② 參與指南制定的單位主要是學會(42.31%/33篇),此外衛生和計劃生育委員會(前衛生部)、協會以及醫院也都參與了指南的制定,分別占8.97%(7篇)、6.41%(5篇)和5.13%(4篇)(圖 3);③ 制定方法學方面,29%(23篇)的指南提及應用了循證的方法制定指南;④ 基金或項目資助方面,23%(18篇)的指南報告了受資助情況;⑤ 指南更新方面,有10%(8篇)的指南 [23-30]報告了將在未來2~5年進行更新;⑥ 數據庫檢索方面,僅有2篇(3%)指南 [31, 32]清楚描述了檢索數據庫、檢索詞及檢索時限;⑦ 利益聲明方面,僅有1篇(1%)指南 [32]報告了利益沖突聲明。



2.2 納入指南AGREE Ⅱ評分結果
6名研究人員運用AGREE Ⅱ對納入指南獨立進行評價,預試驗結果的ICC值為0.95[95%CI(0.94,0.96)],說明6名研究人員對評分條目的理解達成了一致。6個領域得分的具體分布情況見表 2。每個領域內容所代表的具體含義請參見本系列第二篇文章《2011年中國臨床實踐指南質量評價》 [4]。不同年份國內指南以及國際指南的AGREE Ⅱ得分情況見圖 4 [3, 4, 33]。


2.3 不同分類標準下各亞類指南的AGREE Ⅱ各領域得分情況
不同分類標準(包括指南的制定單位、類型、發表期刊、資助情況和提及循證方法情況)下各亞類指南的AGREE Ⅱ各領域得分情況見表 3。結果顯示:不同制定單位和不同類型的指南各領域得分差異較大,發表在CSCD期刊的指南在5個領域得分均高于非CSCD期刊(除“領域五:應用性”外),接受資助的指南在4個領域得分(除“領域二:參與人員”和“領域五:應用性”外)均高于未接受資助的指南,提及循證方法制定的指南各領域得分明顯高于未提及的指南。2013年發表的指南在5個領域(除 “領域六:編輯獨立性”外)的得分均高于2012年發表的指南。

3 討論
3.1 整體質量情況
從AGREE評分的總體情況來看,2012和2013年的指南評分與2011年和2011年之間的指南評分相比呈上升趨勢。其原因可能有兩方面:一方面,隨著循證醫學在國內的不斷發展,本土的循證醫學證據不斷累積為國內指南的制定提供了良好的證據基礎;另一方面,有關指南方法學的文章也被越來越多的指南制定者知曉,并運用到指南制定中,提高了指南制定的科學性。
雖然2012和2013年的指南相對之前的指南質量有所提升,但與國際平均水平相比還存在較大差距。其中差距最大的領域是制定的嚴謹性(領域三),其次是編輯獨立性(領域六)和參與人員(領域二)。這提示國內指南制定者應注重在指南制定過程中重點參考這三個領域的具體內容。制定的嚴謹性主要考察指南制定者對方法學的研究、認知和重視程度,包括對證據的檢索、證據選擇標準的描述、推薦意見形成的描述、形成推薦意見時是否考慮了對健康的風險及副作用、推薦意見與證據之間的關系、專家的外部評審和指南更新的步驟 [34]。編輯獨立性主要考察指南制定過程中的編輯獨立性,包括贊助單位的觀點不影響指南的內容和指南闡述并強調了制定小組成員的利益沖突 [34]。參與人員主要考察指南制定過程中參與人員的構成及闡明指南的使用者,指南制定小組應包含所有相關專業人員,如文獻檢索專家、統計學家、方法學家、臨床醫生等,同時參與人員中還應包括目標人群的代表,即患者、公眾等 [34]。
3.2 指南質量的影響因素
由表 3可見,指南的質量受多種因素影響。從指南的制定機構來看,協、學會制定的指南質量更高,可能與其可支配與指南制定相關的資源較其他類型機構更多(如能召集更多相關專業和領域的專家)有關;從指南發表的期刊等級來看,CSCD期刊發表的指南質量明顯高于非CSCD期刊,可能與CSCD期刊對論文的科學性和透明性要求更嚴格有關。從指南接受資助的情況來看,有資助的指南質量更高,可能與其有更多資金用于招募相關領域專家組成指南制定小組有關;此外,循證制定的指南比非循證制定的指南質量更高,與循證制定過程能夠保證指南制定過程更加嚴謹有關。
3.3 本研究的局限性
本研究的局限性包括:① 當前針對指南的檢索并無統一的檢索策略,本研究對通過“指南”和“指引”進行主題檢索獲取指南,存在漏檢的可能;② 雖然對研究人員進行了AGREE工具使用的培訓并進行了預試驗,但不排除因個人理解的差異影響打分結果的精確性。
3.4 小結
臨床指南作為指導醫務工作者醫療決策的重要文件和主要依據 [34],其制定方法應盡可能嚴謹和科學。運用循證醫學的理念和方法制定指南是指南制定的發展趨勢。目前國內指南主要由中華醫學會及其分會來制定,主要關注的是疾病的治療方面,對于預防、診斷以及預后的關注較少。另外,國內指南質量逐年改善,但與國際平均水平相比還存在較大差距,主要體現在指南制定的嚴謹性、編輯的獨立性以及參與人員的多學科化方面。國內的指南制定者在指南制定的過程中應重視和參考國際上關于指南制定方面的科學方法,如結構化指南問題,并通過系統全面的檢索、評價和綜合證據,并考慮成本、證據質量以及患者意愿形成推薦意見,在此過程中還應注意增加指南制定過程的透明性和獨立性。