引用本文: 裴彩俠, 王夢書, 李樂, 張紅霞, 李瑞, 常曉楠, 王寅中, 杜亮, 楊克虎, 雷軍強, 陳耀龍. 我國臨床實踐指南中影像診斷推薦意見的現況調查. 中國循證醫學雜志, 2016, 16(2): 130-134. doi: 10.7507/1672-2531.20160023 復制
臨床實踐指南的核心是推薦意見,推薦意見可分為預防、診斷、治療等幾大類。診斷推薦意見可包括體格檢查、實驗室檢查和影像學檢查等方面。其中影像診斷檢查是指南中診斷類推薦意見的最主要類型。本文作為循證診斷臨床實踐指南研究課題組系列文章的第二篇,旨在對我國期刊發表的臨床實踐指南中含影像診斷推薦意見的現狀進行調查分析,為國內指南制定者在形成影像診斷推薦意見時提供參考。
1 資料與方法
1.1 納入與排除標準
納入:符合指南定義 [1-4]、包含了影像診斷推薦意見和建議的文獻。排除:① 指南摘要;② 書目指南;③ 國外指南的翻譯版或改編版。
1.2 檢索策略
采用統一的檢索策略 [5],以“指南”、“指引”為檢索詞在CNKI、WanFang Data和VIP三個數據庫中進行自由詞檢索,同時以“指南”為檢索詞在CBM中進行主題詞檢索,檢索時限均為建庫至2014年12月31日。
1.3 文獻篩選與資料提取
文獻篩選分為題目、摘要篩選和全文篩選兩個階段。確定納入指南后,研究人員根據預先制定好的信息提取表對納入指南的數據進行提取,包括指南類型、發表年份、制定單位、推薦意見的標識、影像推薦意見涉及的影像技術、影像推薦意見中證據質量和推薦強度分級等方面。經課題組協商共識,確定影像診斷推薦意見的判定標準如下:出現在指南正文或推薦意見部分,指導臨床醫生如何使用影像設備和工具,對患者進行診斷檢查的建議或陳述。指南的分類按照國內外已經發表的相關文獻 [5-9],主要分為綜合、診療、診斷、防治、治療、醫技和其他7類。文獻篩選與數據提取均由兩名研究人員獨立進行,遇到分歧雙方討論解決或請第三方介入。
1.4 統計分析
采用Excel軟件進行數據整理和統計分析,分析內容主要包括文獻發表的年代、指南的類型、所屬的疾病、證據質量和推薦強度的分級等。
2 結果
2.1 納入指南的基本情況
初檢出相關文獻22 515篇,經過兩輪篩選,最終納入診斷相關指南341篇(篩選流程見圖 1)。納入指南基本情況如下:① 在發表年份方面,2011年發文量最多(圖 2);② 在制定單位方面,協會制定的最多,達59.2%(202/341);③ 在指南類型方面,診療指南最多,占84.5%(288/341),具體分布見表 1;④ 在指南關注的臨床問題方面,腫瘤所占比例最高,排名前十的疾病分布情況見圖 3;⑤ 在基金資助方面,22.9%(78/341)的指南報告了資助信息。



a:腫瘤;b:呼吸系統疾病;c:循環系統疾病,d:消化系統疾病;e:骨骼肌肉系統和結締組織疾病;f:泌尿生殖系統疾病;g:內分泌、營養和代謝疾病;h:血液和造血器官疾病以及某些涉及免疫機能的異常;i:某些傳染病和寄生蟲病;j:皮膚和皮下組織疾病。

2.2 推薦意見的呈現與所涉及的影像技術
在納入的指南中,48.7%(166/341)的指南制定了影像診斷推薦意見,推薦意見總量為534條,其中78.3%的推薦意見來自于診療指南(表 1)。在推薦意見的呈現方面,25.7%(137/534)的推薦意見有推薦強度和/或證據質量的分級,18.9%(101/534)的推薦意見含有“推薦”、“建議”等提示字眼,55.4%(296/534)的推薦意見僅對所使用的影像技術進行了描述,但沒有明確的分級和符號。在涉及的影像技術方面,按照數量排序依次為超聲(35.8%,191/534)、CT(25.1%,134/534)、X線(24.3%,130/534)、核磁(20.0%,107/534)、血管造影6.9%(37/534)、核醫學10.5%(56/534)。
2.3 證據質量及推薦強度的分級
在含影像推薦意見的指南中,13.9%(23/166)的指南對證據質量進行了分級,13.3%(22/166)的指南對推薦強度進行了分級,10.2%(17/166)的指南同時對證據質量和推薦強度進行了分級(表 2)。在分級標準方面,21篇(12.7%)指南報告了使用的分級方法(共6種),其余16篇(9.6%)指南未報告具體采用了何種分級方法,具體見表 3。


在534條影像診斷推薦意見中,15.9%(85/534)的推薦意見同時報告了證據質量及推薦強度(具體見表 4);在報告了推薦強度的119條推薦意見中,38.7%(46/119)的推薦意見為強推薦,16.0%(19/119)的推薦意見為弱推薦。在證據質量和推薦強度的關系方面,23.9%(11/46)的強推薦基于低質量證據,42.1%(8/19)的弱推薦基于高質量證據(表 5);沒有指南對基于低質量證據制定強推薦予以解釋。


3 討論
近10年來診斷相關臨床實踐指南的數量呈上升趨勢,其中半數指南制定了影像推薦意見。診療類型指南、腫瘤指南含影像診斷推薦意見最多。基于以上結果,課題組發現我國含影像診斷推薦意見的指南在制定和報告中存在以下主要問題。
3.1 影像診斷推薦意見報告不明確
指南研究與評價工具(AGREEⅡ工具) [15]要求指南的推薦意見應該清晰易辨,應對所有的推薦意見突出顯示、分類匯總。如,采用表格、流程圖、加粗、下劃線等方式。但本研究納入的超過半數的影像推薦意見既沒有清楚的分級標準,也沒有明顯的類似“推薦”、“建議”等標識性文字。這將影響指南的使用者和研究者快速發現、理解和應用推薦意見。AGREE協作網2013年啟動了一項針對指南推薦意見制定、報告和評價的項目——AGREE-REX項目 [16]。該項目的重要產出之一是對指南的推薦意見如何精準表述提出相關的標準。
3.2 影像診斷推薦意見的分級不規范
本研究納入的指南中,80%以上未對影像診斷推薦意見及其證據質量進行分級。在進行了分級的指南中,證據質量和推薦強度分級所采納的標準又嚴重不一致。GRADE分級是當前國際上證據質量和推薦強度的主流標準,較之其他分級系統具有以下優勢:① 由一個具有廣泛代表性的國際指南制定小組制定;② 明確定義了證據質量和推薦強度;③ 清楚評價了不同治療方案的重要結局;④ 對不同級別證據的升級與降級有明確、綜合的標準;⑤ 從證據到推薦意見的全過程透明;⑥ 明確考慮價值觀和偏好;⑦ 就推薦意見的強弱,分別從臨床醫生、患者、政策制定者角度做了實用的詮釋;⑧ 適用于制定系統評價、衛生技術評估及指南。課題組建議我國在制定影像診斷推薦意見時,可參考GRADE方法對證據質量和推薦強度進行分級。
3.3 對推薦意見和證據質量之間的關系缺乏解釋說明
AGREEⅡ工具 [15]強調在指南中應清晰描述形成推薦意見的方法以及推薦意見和支持證據之間的聯系。本研究納入的包含影像診斷推薦意見的指南中,約1/4的強推薦基于低質量證據,但指南中均未對此進行解釋說明。基于低質量證據進行強推薦,只有在特定的情況下才能實現。Alexander等 [17]對WHO指南推薦意見的證據質量和推薦強度進行分析后,總結了5種可以基于低或者極低質量形成強推薦的情況:① 在危及生命的情況下低質量證據顯示有利(有害的相關證據質量可以是低或者高);② 當低質量證據顯示有利,而高質量證據顯示有害或成本非常高;③ 當低質量證據顯示兩項干預效果相當,但高質量證據顯示其中一項干預措施的害處更大;④ 當高質量證據顯示兩項干預效果相當,但低質量證據顯示其中一項干預措施的害處更大;⑤ 當高質量證據顯示有微弱效果,而低或極低質量證據顯示有重大不良反應的可能。課題組建議我國在制定影像診斷推薦意見時,如果要基于低或極低證據的質量,進行強推薦,制定者應以以上5條標準為重要參考,特別是強推薦CT或核磁檢查時,因為該類檢查手段不僅對患者可能造成傷害,而且花費不菲。
3.4 小結
疾病的正確診斷是開展有效治療的前提。而科學、合理地利用影像診斷技術,可以幫助臨床醫生縮短診斷時間,提高診斷效果。對于診斷、診療和綜合類臨床實踐指南中,診斷推薦意見是其重要組成部分,我們建議,影像診斷推薦意見的產生應該基于當前可得的最佳研究證據,對其進行分級。同時應考慮和平衡診斷技術可能給患者帶來的潛在危害與經濟負擔。在對推薦意見進行表述時,也應遵循相關標準,進行清晰、準確和規范的報告。
臨床實踐指南的核心是推薦意見,推薦意見可分為預防、診斷、治療等幾大類。診斷推薦意見可包括體格檢查、實驗室檢查和影像學檢查等方面。其中影像診斷檢查是指南中診斷類推薦意見的最主要類型。本文作為循證診斷臨床實踐指南研究課題組系列文章的第二篇,旨在對我國期刊發表的臨床實踐指南中含影像診斷推薦意見的現狀進行調查分析,為國內指南制定者在形成影像診斷推薦意見時提供參考。
1 資料與方法
1.1 納入與排除標準
納入:符合指南定義 [1-4]、包含了影像診斷推薦意見和建議的文獻。排除:① 指南摘要;② 書目指南;③ 國外指南的翻譯版或改編版。
1.2 檢索策略
采用統一的檢索策略 [5],以“指南”、“指引”為檢索詞在CNKI、WanFang Data和VIP三個數據庫中進行自由詞檢索,同時以“指南”為檢索詞在CBM中進行主題詞檢索,檢索時限均為建庫至2014年12月31日。
1.3 文獻篩選與資料提取
文獻篩選分為題目、摘要篩選和全文篩選兩個階段。確定納入指南后,研究人員根據預先制定好的信息提取表對納入指南的數據進行提取,包括指南類型、發表年份、制定單位、推薦意見的標識、影像推薦意見涉及的影像技術、影像推薦意見中證據質量和推薦強度分級等方面。經課題組協商共識,確定影像診斷推薦意見的判定標準如下:出現在指南正文或推薦意見部分,指導臨床醫生如何使用影像設備和工具,對患者進行診斷檢查的建議或陳述。指南的分類按照國內外已經發表的相關文獻 [5-9],主要分為綜合、診療、診斷、防治、治療、醫技和其他7類。文獻篩選與數據提取均由兩名研究人員獨立進行,遇到分歧雙方討論解決或請第三方介入。
1.4 統計分析
采用Excel軟件進行數據整理和統計分析,分析內容主要包括文獻發表的年代、指南的類型、所屬的疾病、證據質量和推薦強度的分級等。
2 結果
2.1 納入指南的基本情況
初檢出相關文獻22 515篇,經過兩輪篩選,最終納入診斷相關指南341篇(篩選流程見圖 1)。納入指南基本情況如下:① 在發表年份方面,2011年發文量最多(圖 2);② 在制定單位方面,協會制定的最多,達59.2%(202/341);③ 在指南類型方面,診療指南最多,占84.5%(288/341),具體分布見表 1;④ 在指南關注的臨床問題方面,腫瘤所占比例最高,排名前十的疾病分布情況見圖 3;⑤ 在基金資助方面,22.9%(78/341)的指南報告了資助信息。



a:腫瘤;b:呼吸系統疾病;c:循環系統疾病,d:消化系統疾病;e:骨骼肌肉系統和結締組織疾病;f:泌尿生殖系統疾病;g:內分泌、營養和代謝疾病;h:血液和造血器官疾病以及某些涉及免疫機能的異常;i:某些傳染病和寄生蟲病;j:皮膚和皮下組織疾病。

2.2 推薦意見的呈現與所涉及的影像技術
在納入的指南中,48.7%(166/341)的指南制定了影像診斷推薦意見,推薦意見總量為534條,其中78.3%的推薦意見來自于診療指南(表 1)。在推薦意見的呈現方面,25.7%(137/534)的推薦意見有推薦強度和/或證據質量的分級,18.9%(101/534)的推薦意見含有“推薦”、“建議”等提示字眼,55.4%(296/534)的推薦意見僅對所使用的影像技術進行了描述,但沒有明確的分級和符號。在涉及的影像技術方面,按照數量排序依次為超聲(35.8%,191/534)、CT(25.1%,134/534)、X線(24.3%,130/534)、核磁(20.0%,107/534)、血管造影6.9%(37/534)、核醫學10.5%(56/534)。
2.3 證據質量及推薦強度的分級
在含影像推薦意見的指南中,13.9%(23/166)的指南對證據質量進行了分級,13.3%(22/166)的指南對推薦強度進行了分級,10.2%(17/166)的指南同時對證據質量和推薦強度進行了分級(表 2)。在分級標準方面,21篇(12.7%)指南報告了使用的分級方法(共6種),其余16篇(9.6%)指南未報告具體采用了何種分級方法,具體見表 3。


在534條影像診斷推薦意見中,15.9%(85/534)的推薦意見同時報告了證據質量及推薦強度(具體見表 4);在報告了推薦強度的119條推薦意見中,38.7%(46/119)的推薦意見為強推薦,16.0%(19/119)的推薦意見為弱推薦。在證據質量和推薦強度的關系方面,23.9%(11/46)的強推薦基于低質量證據,42.1%(8/19)的弱推薦基于高質量證據(表 5);沒有指南對基于低質量證據制定強推薦予以解釋。


3 討論
近10年來診斷相關臨床實踐指南的數量呈上升趨勢,其中半數指南制定了影像推薦意見。診療類型指南、腫瘤指南含影像診斷推薦意見最多。基于以上結果,課題組發現我國含影像診斷推薦意見的指南在制定和報告中存在以下主要問題。
3.1 影像診斷推薦意見報告不明確
指南研究與評價工具(AGREEⅡ工具) [15]要求指南的推薦意見應該清晰易辨,應對所有的推薦意見突出顯示、分類匯總。如,采用表格、流程圖、加粗、下劃線等方式。但本研究納入的超過半數的影像推薦意見既沒有清楚的分級標準,也沒有明顯的類似“推薦”、“建議”等標識性文字。這將影響指南的使用者和研究者快速發現、理解和應用推薦意見。AGREE協作網2013年啟動了一項針對指南推薦意見制定、報告和評價的項目——AGREE-REX項目 [16]。該項目的重要產出之一是對指南的推薦意見如何精準表述提出相關的標準。
3.2 影像診斷推薦意見的分級不規范
本研究納入的指南中,80%以上未對影像診斷推薦意見及其證據質量進行分級。在進行了分級的指南中,證據質量和推薦強度分級所采納的標準又嚴重不一致。GRADE分級是當前國際上證據質量和推薦強度的主流標準,較之其他分級系統具有以下優勢:① 由一個具有廣泛代表性的國際指南制定小組制定;② 明確定義了證據質量和推薦強度;③ 清楚評價了不同治療方案的重要結局;④ 對不同級別證據的升級與降級有明確、綜合的標準;⑤ 從證據到推薦意見的全過程透明;⑥ 明確考慮價值觀和偏好;⑦ 就推薦意見的強弱,分別從臨床醫生、患者、政策制定者角度做了實用的詮釋;⑧ 適用于制定系統評價、衛生技術評估及指南。課題組建議我國在制定影像診斷推薦意見時,可參考GRADE方法對證據質量和推薦強度進行分級。
3.3 對推薦意見和證據質量之間的關系缺乏解釋說明
AGREEⅡ工具 [15]強調在指南中應清晰描述形成推薦意見的方法以及推薦意見和支持證據之間的聯系。本研究納入的包含影像診斷推薦意見的指南中,約1/4的強推薦基于低質量證據,但指南中均未對此進行解釋說明。基于低質量證據進行強推薦,只有在特定的情況下才能實現。Alexander等 [17]對WHO指南推薦意見的證據質量和推薦強度進行分析后,總結了5種可以基于低或者極低質量形成強推薦的情況:① 在危及生命的情況下低質量證據顯示有利(有害的相關證據質量可以是低或者高);② 當低質量證據顯示有利,而高質量證據顯示有害或成本非常高;③ 當低質量證據顯示兩項干預效果相當,但高質量證據顯示其中一項干預措施的害處更大;④ 當高質量證據顯示兩項干預效果相當,但低質量證據顯示其中一項干預措施的害處更大;⑤ 當高質量證據顯示有微弱效果,而低或極低質量證據顯示有重大不良反應的可能。課題組建議我國在制定影像診斷推薦意見時,如果要基于低或極低證據的質量,進行強推薦,制定者應以以上5條標準為重要參考,特別是強推薦CT或核磁檢查時,因為該類檢查手段不僅對患者可能造成傷害,而且花費不菲。
3.4 小結
疾病的正確診斷是開展有效治療的前提。而科學、合理地利用影像診斷技術,可以幫助臨床醫生縮短診斷時間,提高診斷效果。對于診斷、診療和綜合類臨床實踐指南中,診斷推薦意見是其重要組成部分,我們建議,影像診斷推薦意見的產生應該基于當前可得的最佳研究證據,對其進行分級。同時應考慮和平衡診斷技術可能給患者帶來的潛在危害與經濟負擔。在對推薦意見進行表述時,也應遵循相關標準,進行清晰、準確和規范的報告。