引用本文: 王夢書, 李樂, 張紅霞, 李瑞, 常曉楠, 杜亮, 楊克虎, 雷軍強, 裴彩俠, 陳耀龍. 影像診斷系統評價被臨床實踐指南引用情況調查. 中國循證醫學雜志, 2016, 16(3): 341-347. doi: 10.7507/1672-2531.20160053 復制
1990年,美國醫學科學院(Institute of Medicine,IOM)對實踐指南進行了定義:實踐指南是針對特定的臨床情況,系統制訂的幫助醫務人員和患者做出恰當處理的指導性建議(推薦意見) [1]。2011年,隨著循證醫學和系統評價的發展及其對指南的影響,IOM組織了國際專家,對指南的定義進行了20年來的首次更新,即:指南是基于系統評價的證據和平衡了不同干預措施的利弊,在此基礎上形成的能夠為患者提供最佳保健服務的推薦意見集合 [2]。2014年6月起,美國國立指南文庫更是將指南是否基于系統評價作為其收錄的基本條件之一 [3]。
診斷試驗系統評價是系統評價的一種重要類型,近年來其數量快速增長,方法學也不斷取得發展 [4-6]。調查顯示,2009年國外學者發表的診斷試驗系統評價就達230篇 [7]。中國大陸學者2001年至2011年底共發表診斷試驗系統評價312篇,其中中文235篇,英文77篇。影像診斷系統評價比例占45% [8]。這為循證影像診斷指南的制定提供了重要的證據來源。但當前發表的影像診斷系統評價有多少被指南引用或用于支持其推薦意見,尚沒有相關研究或論文發表。本文作為循證診斷臨床實踐指南研究課題組系列文章的第三篇,旨在調查影像診斷系統評價被指南引用的情況,以期為國內循證影像診斷指南的制定提供借鑒。
1 資料與方法
1.1 納入與排除標準
納入:① 診斷精確性系統評價;② 關注的診斷技術為影像技術或影像相關診斷策略;③ 發表語種為中英文。
1.2 文獻檢索
以systematic review、meta-analysis、meta analyses、specificity、sensitivity等為檢索詞在PubMed中進行檢索,檢索時間限定為2010年1月1日至2012年12月31日,具體檢索策略見框1。
框 1 在PubMed中的檢索策略
#1 “sensitivity and specificity”[MeSH Terms] #2 “sensitivity”[All Fields] #3 “specificity”[All Fields] #4 #2 AND #3 #5 “sensitivity and specificity”[All Fields] #6 #1 OR #4 OR #5 #7 “Meta-Analysis” [Publication Type] #8 “systematic reviews”[Title/Abstract] #9 “systematic review”[Title/Abstract] #10 “meta-analyses”[Title/Abstract] #11 “meta-analysis”[Title/Abstract] #12 “meta analyses”[Title/Abstract] #13 “meta analysis”[Title/Abstract] #14 #7 OR #8 OR #9 OR #10 OR #11 OR #12 OR #13 #15 “2010/01/01”[Date - Publication]: “2012/12/31” [Date - Publication] #16 #6 AND #14 AND #15
1.3 文獻篩選與資料提取
文獻篩選分為題目、摘要篩選和全文篩選兩個階段;確定納入文獻后,再對納入文獻進行數據提取。提取內容包含:發表年份、發表期刊、來源國家、作者數量、檢索數據庫、偏倚風險評估工具、診斷的影像技術;同時,在Web of Science數據庫中對納入的系統評價進行檢索,提取納入系統評價的被引頻次、引文類型及引文基本信息。文獻篩選與資料提取均由兩名研究人員獨立進行,遇到分歧雙方討論解決或請第三方介入。
1.4 數據分析
通過Excel軟件對提取的數據進行整理,分析影像領域診斷系統評價的發表現狀及其被指南引用情況。
2 結果
2.1 文獻檢索結果
初檢出相關文獻1 744篇,經過題目、摘要和全文兩輪篩選分別排除1 363和89篇文獻,最終納入292篇影像診斷系統評價。文獻篩選流程及結果見圖 1。

2.2 納入系統評價的基本情況
① 在發表數量的時間分布上,2010、2011和2012年分別發表55篇(19%)、96篇(33%)和141篇(48%);② 在第一作者的國家分布方面,納入的系統評價分別來自24個國家,發表數量前五的國家分別為:中國(74,25%)、美國(54,18%)、英國(42,14%)、荷蘭(28,10%)、意大利(18,6%);③ 在發表期刊方面,納入的系統評價分別發表在170種期刊上,發表數量前五位期刊見表 1;④ 在作者數量方面,影像診斷系統評價作者數量的中位數為5人,范圍為1~29人;⑤ 在檢索數據庫方面,檢索頻次排名前三的數據庫分別為:PubMed/MEDLINE(99%)、EMbase(71%)和The Cochrane Library(36%),14%(40/292)的系統評價僅檢索了一個數據庫;⑥ 在偏倚風險評估方面,225篇系統評價報告了對偏倚風險的評估,且偏倚風險評估工具中以QUADAS(Quality Assessment of Diagnostic Accuracy Studies)或QUADAS-2的使用率最高(87%,196/225),其次為Cochrane Methods Working Group on Systematic Review of Screening and Diagnostic Tests(3%,6/225),有4篇系統評價將STARD(Standards for Reporting Diagnostic Accuracy)報告規范 [9, 10]作為偏倚風險評估工具 [11-14]。

2.3 影像診斷系統評價被引情況
94%(275/292)的系統評價被Web of Science數據庫收錄,其總被引頻次為5 413次,被引頻次的中位數為20次,范圍為0~131次(詳見圖 2),其中28%(78/275)的系統評價被指南引用,總被引頻次為132次,被引頻次的中位數為1次,范圍為1~6次,共有118部指南引用了此78篇系統評價,引用同一篇系統評價的指南部數最高為4,其中位數為1,范圍為1~4(詳情見表 2)。系統評價首次被引與其發表時間間隔中位數為2年,范圍為0~5年(詳情見表 3)。7%(19/275)的系統評價被指南納入后明確作為推薦意見的證據來源(詳情見表 4)。




3 討論
3.1 影像診斷系統評價發展迅速,但制作方法尚不規范
2010年至2012年影像診斷系統評價發表數量持續上升,且2012年的數量是2010年的近3倍,其中以中國的發表量最多。然而影像診斷系統評價的制作方法尚需提高,原因如下:① 在納入研究的偏倚風險評估方面,近1/3的系統評價未對納入研究進行偏倚風險評估;② 在偏倚風險評估工具方面,有4篇系統評價錯誤運用診斷試驗報告規范STARD工具作為評估納入研究質量的標準;③ 在檢索數據庫數量方面,14%的系統評價只檢索了1個數據庫,而系統評價質量評價工具(AMSTAR工具)要求系統評價作者至少檢索2種電子數據庫 [48];④ 在系統評價作者方面,有2篇系統評價只有1名作者 [49, 50],而Cochrane系統評價指導手冊中要求在提取納入研究數據時需要兩名研究人員獨立完成再合并最后的結果,同時研究顯示單名研究人員提取數據相比于兩名研究人員獨立提取數據會出現更多錯誤 [51],因此單個作者完成的系統評價可能難以實現數據提取的準確性,其結果的真實性有待商榷。
3.2 影像診斷系統評價被指南引用的比例小、頻次低、時間間隔長
在納入的影像診斷系統評價中,被指南引用的僅占1/3,其中僅有1篇系統評價被4部指南引用,且超過半數的系統評價僅被1部指南引用。影像診斷系統評價被引頻數低的原因可能有:① 系統評價的質量低;指南要利用現有的系統評價,前提是系統評價的質量要高。本研究納入的部分系統評價在方法學上存在一定的缺陷,可能是造成低引用的原因之一。② 部分指南未報告參考文獻;研究顯示中國期刊發表指南引文報告率低于五成 [52],因此可能部分影像診斷系統評價已被指南引用,但因指南未報告參考文獻而無法統計。③ 指南制定者在納入研究時,未進行系統檢索,故有遺漏系統評價和Meta分析的可能性。
此外,近四成的影像診斷系統評價發表 3年或以上才被指南引用。然而隨著原始研究不斷地完成和發表,系統評價也需要不斷地更新,Cochrane協作網要求其系統評價應該在兩年內更新 [7],因此這部分系統評價被指南引用時,可能存在過期風險,應予以警惕。
3.3 作為推薦意見證據來源的影像診斷系統評價比例低
系統評價的重要作用之一是為臨床指南的推薦意見提供證據支持。IOM對指南新的定義中明確要求指南的推薦意見應該基于系統評價產生。但本研究結果顯示,盡管影像診斷系統評價數量逐年快速增長,但被用作推薦意見證據來源的比例不到十分之一。系統評價和指南制作過程需要投入大量人力和經費等資源,建議系統評價的制作者在選題之初就應與指南制定者合作,在發表之后也需積極聯系指南制定者,從而提高被引用的效率。指南制定者也應加強對現有系統評價的檢索和利用,避免對研究資源的浪費。
3.4 小結
影像診斷系統評價發展迅速,但部分系統評價制作過程尚存在一定的缺陷;而被指南引用或者作為推薦意見證據來源的比例低。影像診斷系統評價作者應嚴格按照相關系統評價手冊的要求制作系統評價,保證制作過程嚴謹、規范;同時,指南制定者也應注重基于系統評價證據制定推薦意見。
1990年,美國醫學科學院(Institute of Medicine,IOM)對實踐指南進行了定義:實踐指南是針對特定的臨床情況,系統制訂的幫助醫務人員和患者做出恰當處理的指導性建議(推薦意見) [1]。2011年,隨著循證醫學和系統評價的發展及其對指南的影響,IOM組織了國際專家,對指南的定義進行了20年來的首次更新,即:指南是基于系統評價的證據和平衡了不同干預措施的利弊,在此基礎上形成的能夠為患者提供最佳保健服務的推薦意見集合 [2]。2014年6月起,美國國立指南文庫更是將指南是否基于系統評價作為其收錄的基本條件之一 [3]。
診斷試驗系統評價是系統評價的一種重要類型,近年來其數量快速增長,方法學也不斷取得發展 [4-6]。調查顯示,2009年國外學者發表的診斷試驗系統評價就達230篇 [7]。中國大陸學者2001年至2011年底共發表診斷試驗系統評價312篇,其中中文235篇,英文77篇。影像診斷系統評價比例占45% [8]。這為循證影像診斷指南的制定提供了重要的證據來源。但當前發表的影像診斷系統評價有多少被指南引用或用于支持其推薦意見,尚沒有相關研究或論文發表。本文作為循證診斷臨床實踐指南研究課題組系列文章的第三篇,旨在調查影像診斷系統評價被指南引用的情況,以期為國內循證影像診斷指南的制定提供借鑒。
1 資料與方法
1.1 納入與排除標準
納入:① 診斷精確性系統評價;② 關注的診斷技術為影像技術或影像相關診斷策略;③ 發表語種為中英文。
1.2 文獻檢索
以systematic review、meta-analysis、meta analyses、specificity、sensitivity等為檢索詞在PubMed中進行檢索,檢索時間限定為2010年1月1日至2012年12月31日,具體檢索策略見框1。
框 1 在PubMed中的檢索策略
#1 “sensitivity and specificity”[MeSH Terms] #2 “sensitivity”[All Fields] #3 “specificity”[All Fields] #4 #2 AND #3 #5 “sensitivity and specificity”[All Fields] #6 #1 OR #4 OR #5 #7 “Meta-Analysis” [Publication Type] #8 “systematic reviews”[Title/Abstract] #9 “systematic review”[Title/Abstract] #10 “meta-analyses”[Title/Abstract] #11 “meta-analysis”[Title/Abstract] #12 “meta analyses”[Title/Abstract] #13 “meta analysis”[Title/Abstract] #14 #7 OR #8 OR #9 OR #10 OR #11 OR #12 OR #13 #15 “2010/01/01”[Date - Publication]: “2012/12/31” [Date - Publication] #16 #6 AND #14 AND #15
1.3 文獻篩選與資料提取
文獻篩選分為題目、摘要篩選和全文篩選兩個階段;確定納入文獻后,再對納入文獻進行數據提取。提取內容包含:發表年份、發表期刊、來源國家、作者數量、檢索數據庫、偏倚風險評估工具、診斷的影像技術;同時,在Web of Science數據庫中對納入的系統評價進行檢索,提取納入系統評價的被引頻次、引文類型及引文基本信息。文獻篩選與資料提取均由兩名研究人員獨立進行,遇到分歧雙方討論解決或請第三方介入。
1.4 數據分析
通過Excel軟件對提取的數據進行整理,分析影像領域診斷系統評價的發表現狀及其被指南引用情況。
2 結果
2.1 文獻檢索結果
初檢出相關文獻1 744篇,經過題目、摘要和全文兩輪篩選分別排除1 363和89篇文獻,最終納入292篇影像診斷系統評價。文獻篩選流程及結果見圖 1。

2.2 納入系統評價的基本情況
① 在發表數量的時間分布上,2010、2011和2012年分別發表55篇(19%)、96篇(33%)和141篇(48%);② 在第一作者的國家分布方面,納入的系統評價分別來自24個國家,發表數量前五的國家分別為:中國(74,25%)、美國(54,18%)、英國(42,14%)、荷蘭(28,10%)、意大利(18,6%);③ 在發表期刊方面,納入的系統評價分別發表在170種期刊上,發表數量前五位期刊見表 1;④ 在作者數量方面,影像診斷系統評價作者數量的中位數為5人,范圍為1~29人;⑤ 在檢索數據庫方面,檢索頻次排名前三的數據庫分別為:PubMed/MEDLINE(99%)、EMbase(71%)和The Cochrane Library(36%),14%(40/292)的系統評價僅檢索了一個數據庫;⑥ 在偏倚風險評估方面,225篇系統評價報告了對偏倚風險的評估,且偏倚風險評估工具中以QUADAS(Quality Assessment of Diagnostic Accuracy Studies)或QUADAS-2的使用率最高(87%,196/225),其次為Cochrane Methods Working Group on Systematic Review of Screening and Diagnostic Tests(3%,6/225),有4篇系統評價將STARD(Standards for Reporting Diagnostic Accuracy)報告規范 [9, 10]作為偏倚風險評估工具 [11-14]。

2.3 影像診斷系統評價被引情況
94%(275/292)的系統評價被Web of Science數據庫收錄,其總被引頻次為5 413次,被引頻次的中位數為20次,范圍為0~131次(詳見圖 2),其中28%(78/275)的系統評價被指南引用,總被引頻次為132次,被引頻次的中位數為1次,范圍為1~6次,共有118部指南引用了此78篇系統評價,引用同一篇系統評價的指南部數最高為4,其中位數為1,范圍為1~4(詳情見表 2)。系統評價首次被引與其發表時間間隔中位數為2年,范圍為0~5年(詳情見表 3)。7%(19/275)的系統評價被指南納入后明確作為推薦意見的證據來源(詳情見表 4)。




3 討論
3.1 影像診斷系統評價發展迅速,但制作方法尚不規范
2010年至2012年影像診斷系統評價發表數量持續上升,且2012年的數量是2010年的近3倍,其中以中國的發表量最多。然而影像診斷系統評價的制作方法尚需提高,原因如下:① 在納入研究的偏倚風險評估方面,近1/3的系統評價未對納入研究進行偏倚風險評估;② 在偏倚風險評估工具方面,有4篇系統評價錯誤運用診斷試驗報告規范STARD工具作為評估納入研究質量的標準;③ 在檢索數據庫數量方面,14%的系統評價只檢索了1個數據庫,而系統評價質量評價工具(AMSTAR工具)要求系統評價作者至少檢索2種電子數據庫 [48];④ 在系統評價作者方面,有2篇系統評價只有1名作者 [49, 50],而Cochrane系統評價指導手冊中要求在提取納入研究數據時需要兩名研究人員獨立完成再合并最后的結果,同時研究顯示單名研究人員提取數據相比于兩名研究人員獨立提取數據會出現更多錯誤 [51],因此單個作者完成的系統評價可能難以實現數據提取的準確性,其結果的真實性有待商榷。
3.2 影像診斷系統評價被指南引用的比例小、頻次低、時間間隔長
在納入的影像診斷系統評價中,被指南引用的僅占1/3,其中僅有1篇系統評價被4部指南引用,且超過半數的系統評價僅被1部指南引用。影像診斷系統評價被引頻數低的原因可能有:① 系統評價的質量低;指南要利用現有的系統評價,前提是系統評價的質量要高。本研究納入的部分系統評價在方法學上存在一定的缺陷,可能是造成低引用的原因之一。② 部分指南未報告參考文獻;研究顯示中國期刊發表指南引文報告率低于五成 [52],因此可能部分影像診斷系統評價已被指南引用,但因指南未報告參考文獻而無法統計。③ 指南制定者在納入研究時,未進行系統檢索,故有遺漏系統評價和Meta分析的可能性。
此外,近四成的影像診斷系統評價發表 3年或以上才被指南引用。然而隨著原始研究不斷地完成和發表,系統評價也需要不斷地更新,Cochrane協作網要求其系統評價應該在兩年內更新 [7],因此這部分系統評價被指南引用時,可能存在過期風險,應予以警惕。
3.3 作為推薦意見證據來源的影像診斷系統評價比例低
系統評價的重要作用之一是為臨床指南的推薦意見提供證據支持。IOM對指南新的定義中明確要求指南的推薦意見應該基于系統評價產生。但本研究結果顯示,盡管影像診斷系統評價數量逐年快速增長,但被用作推薦意見證據來源的比例不到十分之一。系統評價和指南制作過程需要投入大量人力和經費等資源,建議系統評價的制作者在選題之初就應與指南制定者合作,在發表之后也需積極聯系指南制定者,從而提高被引用的效率。指南制定者也應加強對現有系統評價的檢索和利用,避免對研究資源的浪費。
3.4 小結
影像診斷系統評價發展迅速,但部分系統評價制作過程尚存在一定的缺陷;而被指南引用或者作為推薦意見證據來源的比例低。影像診斷系統評價作者應嚴格按照相關系統評價手冊的要求制作系統評價,保證制作過程嚴謹、規范;同時,指南制定者也應注重基于系統評價證據制定推薦意見。