引用本文: 李江, 唐威, 李霓, 王昕, 王勇, 呂章艷, 馮小雙, 魏鑼佩, 李鑫, 孫鑫, 陳萬青, 代敏. 乳腺癌篩查指南方法學質量和報告質量的系統評價. 中國循證醫學雜志, 2018, 18(6): 629-636. doi: 10.7507/1672-2531.201803081 復制
目前乳腺癌在我國女性人群中的發病率為 22.1/10 萬,位居女性癌癥首位,每年有近 18.7 萬新發病例,15 年后預計將超過 24.3 萬,已成為發病率和死亡率增長較迅速的惡性腫瘤。而歐美等西方高度城鎮化國家的乳腺癌發病率已從 30 年前的 50/10 萬增加到目前的 70/10 萬余[1]。據聯合國人口署預測,亞洲國家 60 歲以上女性占全部女性人口的比例將從 2015 年的 16% 上升為 2030 年的 25%。這些數據均提示,隨著人口城鎮化和老齡化的加速,全球女性人群的乳腺癌疾病負擔將日益加重[2]。多個國家已陸續開展乳腺癌篩查項目,但何種乳腺癌篩查指南/推薦意見可為篩查提供有效的參考依據尚不得而知。為了高效實現對潛在乳腺癌患者的早期發現、預防和治療,最終達到降低乳腺癌死亡率和社會經濟負擔的目標,制訂并參考高質量的乳腺癌篩查指南進行實踐工作是十分重要和必要的。
目前,許多國家已經制訂或正在制訂臨床實踐指南[3, 4]。如果指南建立在嚴格的循證醫學證據和高質量方法的基礎上,采用系統的檢索和文獻評價方法,基于得到的高質量證據,并予以充分、嚴格和全透明過程的推薦,在可能的情況下盡量減少偏倚產生,那么這樣的指南將能夠科學地將證據轉化到實踐中,其臨床使用更具有可靠性。歐洲指南研究與評估工具(Appraisal of guidelines research and evaluation in Europe,AGREE)是由 13 個國家的研究者制訂的指南研究和評價工具,主要用于評價指南的開發、使用和推廣等,已成為世界公認評價指南質量的重要工具,目前已經更新至第二版(AGREE Ⅱ)[5]。2016 年《內科學年鑒》(Annals of Internal Medicine)發表了由 10 個國家專家團隊研究制訂的實踐指南報告標準(Reporting items for practice guidelines in healthcare,RIGHT),包含 7 大領域,共 22 個條目,是當前全球唯一一個適用于指導衛生政策與體系、公共衛生和臨床醫學指南的報告標準[6]。目前已有團隊使用 AGREE Ⅱ 工具對 2012~2013 年中國大陸期刊發表的臨床實踐指南質量進行了方法學質量評價[7],而本研究團隊計劃采用 AGREE Ⅱ 和 RIGHT 工具對不同癌癥的篩查指南進行評估[8],以期為我國的癌癥篩查高質量的指南制訂工作提供借鑒。
本文分析了全世界乳腺癌篩查指南的現狀,使用 AGREE Ⅱ 和 RIGHT 工具評價相關指南的方法學質量和報告質量,希望促進我國乳腺癌篩查工作在方案決策、實踐、經濟成本考慮等方面的規范化。
1 資料與方法
1.1 納入與排除標準
納入標準:① 公開發布的原創和更新的正常人群乳腺癌篩查指南/推薦意見全文,如有多次更新版本,以最近一版為準;② 題目中有明確“指南(guideline)”和/或“推薦意見(recommendation)”的詞語,其形式為獨立報告;③ 官方或非官方發布指南均納入,且指南報告內容具備詳細的制作流程和/或研究方法描述;④ 語種限中、英文。
排除標準:① 關于臨床指南的介紹、解讀、應用效果評價;② 非乳腺癌、非篩查類和非獨立內容呈現的指南;③ 其它癌種轉移性質的繼發性乳腺癌;④ 翻譯版本及重復發表的指南。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、The Cochrane Library、Web of Science、CNKI、CBM、WanFang Data 數據庫和相關網站,包括美國國家癌癥網絡信息平臺(National Comprehensive Cancer Network,NCCN)、美國臨床腫瘤學會(American Society of Clinical Oncology,ASCO)、美國預防服務工作組(U.S. Preventive Services Task Force,USPSTF)、國際指南協作網(Guideline International Network,GIN)和中國臨床指南文庫(China Guideline Clearinghouse,CGC)等,檢索時限均為建庫至 2018 年 2 月。同時通過手工檢索和追溯參考文獻,搜集相關指南及全文。中文檢索詞包括:乳腺癌、乳腺腫瘤、篩查、早期診斷、指南;英文檢索詞包括:breast cancer、breast neoplasms、screening、early detection of cancer、guideline、recommendation。以 PubMed 為例,其具體檢索策略見框 1。

1.3 研究方法
1.3.1 指南基本情況描述
將所納入的指南根據國別(以第一發布機構所在地區為準)、發布時間、指南名稱、發布機構、是否有詳細研究制訂方法、是否證據分級、指南更新次數與時間進行統計描述。
1.3.2 指南的推薦意見主要內容匯總
該部分主要匯總報告了制訂方法的指南。將包括乳腺癌篩查時的高危險人群評估指標(包括年齡、其他疾病或遺傳史等)、篩查的頻率、篩查地點推薦及篩查試點的建立、篩查手段的潛在利益(包括生存率及行為改變)和潛在危害(包括過度篩查、假陽性以及篩查所引起的并發癥等)、在指南中是否鼓勵受試者參與、是否有提出針對受試者的行為干預、制作指南過程中是否對證據等級進行分級。
1.3.3 指南質量初步評價
參考 AGREE Ⅱ 指南評價工具[5],按“范圍和目的、參與人員、嚴謹性、清晰性、應用性與獨立性”6 個領域 23 個主要條目對報告了制訂方法的指南進行綜合評價。AGREE Ⅱ 的每一個條目均按 7 分劃分等級(1 分代表很不同意,7 分代表很同意,條目報道不能滿足全部標準或條件則根據不同情況給予 2~6 分)。每個領域得分等于該領域中每一個條目分數的總和,并標準化為該領域可能的最高分數(表 1)。
4 名評價人員按照每個條目對每一篇指南進行評估判分,每個領域的總分評判標準為:
最大可能得分=7 分(很同意)×條目數×評價者數
最小可能得分=1 分(很不同意)×條目數×評價者數
領域分值=“實際得分–最小可能得分”/“最大可能得分–最小可能得分”×100

1.3.4 指南推薦級別判定
根據 6 個領域的總分綜合判斷所評指南是否值得推薦應用,分為 3 個推薦等級:A 級:積極推薦(4 個及以上領域的分值≥50 分);B 級:推薦(3 個領域的分值≥50 分);C 級:一定條件下推薦(2 個及以下領域的分值≥50 分)。
1.3.5 指南報告質量評價
RIGHT 工具 7 大領域包括基本信息、背景、證據、推薦意見、評審和質量保證、資金資助與利益沖突聲明和管理、其他方面,其中基本信息涉及標題/副標題、執行總結、術語與縮略語、通訊作者;背景涉及簡要描述指衛生問題、總目標和具體目的、目標人群、指南的使用者和應用環境、制訂工作組;證據涉及衛生保健問題、系統評價及證據體的質量評價方法或標準;推薦意見涉及推薦意見內容、形成推薦意見的原理和解釋說明、指南制訂工作組的決策過程和方法;資金資助與利益沖突聲明和管理涉及資金來源、作用、利益沖突的聲明和管理;其他方面涉及可及性、對未來研究的建議及局限性[8]。共包括 22 個條目的 35 個具體標準,如該條目判定為是,則得 1 分,反之 0 分,總分為 35 分。≥30 分為報告質量高,20~29 分為報告質量中等,≤19 分為報告質量低。分別由兩名研究人員背靠背進行評價,評分結束后,取平均值。
1.4 評價人員對評價結果的一致性判斷
指南篩選采用研究人員獨立判讀、翻譯、校對的方法,如有異議通過小組討論解決。小組中研究人員均需具備較好的英文閱讀能力和循證醫學方法學的基礎,并由通過組內培訓對文獻評價的方法、AGREE Ⅱ 工具、RIGHT 工具評價標準及評價注意事項進行詳細介紹。同時,為保證指南質量和報告質量評價結果的可靠性,隨機抽取 3 篇納入文獻進行獨立評分,共同衡量評價人員間對指南評價結果的一致性。
1.5 統計分析
文獻資料管理采用 EndNote 軟件,采用 Excel 2010 軟件進行評分記錄及分析。采用 SAS 9.4 軟件對評價者評分結果的一致性進行組內相關系數(intra-class correlation coefficient,ICC)檢驗[9]。若 ICC≤0.20,說明評價者間一致性差;0.21≤ICC≤0.60,說明一致性中等;0.6l≤ICC<0.80 說明一致性良好;ICC≥0.80,說明一致性非常好。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 761 篇,經逐層篩選,最終納入乳腺癌篩查領域報告了詳細研究方法的指南共 11 篇[10-20]。文獻篩選流程及結果見圖 1。

2.2 納入指南的基本特征
納入指南的基本特征見表 2。2015 年~2017 年呈現一個乳腺癌篩查領域指南的發布高峰。總體上發布國家主要集中在美國,占總量的 45%[10, 16, 18-20],中國、加拿大、德國和日本各 1 篇[11, 12, 14, 17],國際組織,如世界衛生組織國際癌癥研究署和歐洲腫瘤內科學會發布各 1 篇[13, 15]。指南發布機構涉及各國腫瘤專業協會(委員會)、癌癥研究中心、癌癥工作組等專業機構。

2.3 納入指南的主要內容報告情況
指南關注的問題包括乳腺癌篩查中人群年齡的界定、方案的選擇、篩查頻率的選擇及潛在利益與危害等。11 篇指南[10-20]均提及乳腺癌篩查中女性人群的年齡界定,其中 7 篇[10-12, 15-19]推薦 40 歲以上女性均可接受乳腺癌篩查,2 篇[13, 14]推薦 50 歲以上女性需接受篩查,2 篇[10, 20]推薦 40~49 歲女性人群接受篩查。8 篇[10, 12, 14, 16-20]提供了接受篩查的頻率,但其依據各有不同。8 篇指南[10, 12, 14-16, 18-20]提及篩查涉及的潛在利益,10 篇指南[10-12, 14-20]提及篩查涉及的潛在危害。4 篇指南[12, 15, 16, 18]指出需要鼓勵受試者參與到篩查項目中以體現受試者的意愿和個體化選擇。
指南制訂方法包括:根據需要制作系統評價/Meta 分析、整合已有系統評價、證據分級和專家共識等,4 篇[10, 12, 16, 19]報告使用系統評價方法制訂,3 篇[11, 14, 15]報告使用整合評價和專家共識的方法制訂,3 篇[13, 17, 18]報告單獨使用專家共識方法,1 篇[20]報告單獨使用整合評價的方法制訂。部分指南所依據的證據采用系統評價所獲證據,證據質量逐步提高,方法也逐漸完善,其中 9 篇[11-16, 18-20]報告了制訂指南過程中所依據證據等級的分級方法,2 篇[12, 19]使用了 GRADE(Grading of Recommendations Assessment,Development and Evaluation)系統(表 3)。

2.4 一致性檢驗結果
使用 AGREE Ⅱ 工具評價中,4 名評價人員針對“范圍和目的、參與人員、嚴謹性、清晰性、應用性、獨立性”共 6 個領域進行評價的一致性檢驗結果分別為:0.75、0.59、0.80、0.67、0.71、0.72,評價的總一致性非常好[ICC=0.82,95%CI(0.79,0.90)]。
使用 RIGHT 工具評價中,2 名評價人員針對“基本信息、背景、證據、推薦意見、評審和質量保證、資金資助與利益沖突聲明和管理、其他方面”共 7 個領域進行評價的一致性檢驗結果分別為:0.81、0.49、0.76、0.75、0.72、0.68 和 0.58,評價的總一致性非常好[ICC=0.80,95%CI(0.77,0.86)]。
2.5 納入指南的方法學質量評價結果
采用 AGREE Ⅱ 評價工具對納入指南進行方法學質量評價,在“范圍和目的、參與人員、嚴謹性、清晰性、應用性、獨立性”6 個領域獨立計分,其總體評價結果平均得分分別為:83、48、60、77、53 和 79 分。6 個領域總和平均分達到 50 分以上者有 10 篇[10-13, 15-20](81%)。6 篇指南[11, 12, 15, 16, 18, 19]推薦等級為 A,其余 5 篇指南[10, 13, 14, 17, 20]推薦等級為 B(表 4)。
“范圍與目的”領域中,美國發布的乳腺癌篩查指南平均分為 86 分,加拿大 94 分,中國 81 分,德國 83 分,日本 63 分;“參與人員”領域中,美國指南的平均分為 54 分,加拿大 69 分,中國 33 分,德國 48 分,日本 31 分;“嚴謹性”領域中,美國指南的平均分為 69 分,加拿大 79 分,中國 24 分,德國 70 分,日本 31 分;“清晰性”領域中,美國指南的平均分為 81 分,加拿大 89 分,中國 74 分,德國 70 分,日本 67 分;“應用性”領域中,美國指南的平均分為 58 分,加拿大 74 分,中國 40 分,德國 49 分,日本 35 分;“獨立性”領域中,美國指南的平均分為 86 分,加拿大 81 分,中國 81 分,德國 78 分,日本 58 分。推薦等級為 A 的指南中,美國指南 3 篇[16, 18, 19]、加拿大 1 篇[12]、德國 1 篇[11](表 4)。

2.6 納入指南的報告質量評價結果
采用 RIGHT 評價工具對納入指南進行報告質量評價,在“基本信息、背景、證據、推薦意見、評審和質量保證、資金資助與利益沖突聲明和管理、其他方面”7 個部分計分。“基本信息”有 6 篇[11, 12, 15, 16, 18, 19]達到滿分 6 分,“背景”有 2 篇[12, 16]達到滿分 8 分,“證據”有 3 篇[12, 16, 19]達到滿分 5 分,“推薦意見”有 2 篇[12, 16]達到滿分 7 分,“評審和質量保證”無滿分,“資金資助與利益沖突聲明”有 1 篇[10]達到滿分 4 分,“其他方面”有 6 篇[10-12, 15, 16, 19]達到滿分 3 分。11 篇指南中,高報告質量指南 3 篇[12, 16, 19],包括美國 2 篇[16, 19]、加拿大 1 篇[12]。美國發布的乳腺癌篩查指南報告質量平均 25 分,加拿大 33 分,中國 17 分,德國 24 分,日本 16 分(表 5)。

3 討論
本研究納入指南多數由相關癌癥防控組織制訂發布,詳細描述了指南制訂方法的指南發布/更新時間均在 2014 年之后。指南的內容和質量由于制訂的時間、國家地區和組織不同而差異較大。作為指導性文件,臨床實踐指南是縮小當前最佳證據與臨床實踐之間差距的決策性工具,高質量的指南可直接為醫藥衛生工作者提供決策依據,在改善患者結局、節約醫療費用、提高衛生保健質量中扮演重要作用[21, 22]。目前癌癥篩查在我國乃至全球都占有舉足輕重的地位,正確合理的篩查手段可有效降低癌癥死亡率,同時也可大大降低經濟社會負擔。美國預防服務工作組和國立綜合癌癥網絡自 2010 年起,每年都會更新癌癥篩查相關指南,尤其是其更新均依據證據推薦分級進行。本研究納入的 4 篇[12, 15, 16, 18]具有證據推薦等級的循證實踐指南涉及內容全面,對乳腺癌篩查所考慮的問題,如人群年齡選擇、篩查頻率、篩查地點推薦及建立、篩查潛在利益和潛在危害、是否鼓勵受試者參與均有提及,指南推薦等級均為 A 級,具有較好的實用性、適用性和推廣性。
本研究依據 AGREE Ⅱ 的 6 個領域對乳腺癌篩查指南的質量進行評價,6 篇(54%)指南質量等級為 A 級。6 個領域中平均分數≥60 分的包括“范圍和目的”、“嚴謹性”、“清晰性”和“獨立性”,而得分較低(≤60 分)的領域包括“參與人員”和“應用性”。AGREE Ⅱ 評價方法不僅強調注重指南制訂過程中依據循證醫學方法,同時注重其實用性、應用性和適用性[23]。指南制訂過程中往往需要政府及商業團體資助,利益沖突不可避免,所以進行指南制訂組織的責任利益聲明非常有必要。一方面是為了避免存在因商業團體傾向性而導致的陽性偏倚,同時也使所制訂的指南可信度更強[24]。本研究納入指南均在利益沖突方面進行了聲明且評估分值大于 50 分,故可信度較高。
RIGHT 工具的產生,在基于 AGREE 評價指南質量的同時,還需關注指南的報告質量,能讓指南生產和使用者清楚了解需要怎樣報告才是正確的。本研究納入指南大多在基本信息和背景部分報告質量尚可,但在推薦意見和評審、質量保證部分報告質量較低。綜合得分顯示報告質量較好的指南僅 3 篇,說明指南制訂后的報告過程,要根據 RIGHT 標準撰寫,以提高報告質量。
本研究納入一篇我國抗癌協會制訂的乳腺癌篩查指南[17],其在乳腺癌診治規范等內容中,包含了篩查這一部分。我國乳腺癌診治相關專家充分結合了我國現有國情,使得推薦意見具有地域指導性。我國已進行了多年的乳腺癌篩查項目,但尚無長期隨訪的高質量數據以提供高推薦級別的證據,這限制了我國乳腺癌篩查領域高質量指南的制訂,也意味著一段時間內,我國尚不能給全球提供乳腺癌篩查的中國智慧和中國經驗。這也提示在資源、經費、經驗和時間有限的國家或地區,由于文化和組織等差異,循證指南制訂方法和產出也會有差異,需考慮地域特殊性[25]。因此,我們可借鑒國外高質量指南的制訂標準和規范證據,并與本地疾病負擔、遺傳特點及衛生資源條件相結合,采用循證理念制訂出高質量證據支持的本土化指南,這可能是我國標準版癌癥篩查指南的發展方向。中國癌癥篩查指南與中國本土其他指南一致,都存在以下重要挑戰[26]:① 缺乏像 NCCN 這樣專門的癌癥指南制訂機構;② 缺乏高質量的原始研究證據,即使有相關研究發表,質量也良莠不齊;③ 指南更新周期較長,制作過程較龐雜,無法滿足快速得到結果的期望;④ 缺乏具備臨床背景并可熟練使用循證評價方法的相關人員。存在挑戰的同時,篩查指南的制訂也面臨著重要機遇,基于前期大量的篩查項目得到的高質量數據可提供本土化的醫學證據作為參考,眾多的高校循證醫學中心培養了大量的循證醫學研究人員,能夠為制訂指南、生產證據及分級等提供方法學指導。
關于評價工具,本研究首次使用 AGREE Ⅱ 和 RIGHT 評價乳腺癌篩查指南/推薦意見。使用的版本是中國中醫科學院廣安門醫院的團隊翻譯的 AGREE Ⅱ 中文版及蘭州大學循證醫學中心團隊翻譯的 RIGHT 中文版。雖然前期進行了統一的培訓且評價的一致性較好,但兩種工具尚無法對指南內容應用的有效性進行評價。此外,納入指南均公開發表于期刊雜志上和相關網站,在檢索文獻過程中限定了語種(中文和英文),因不同的國家地區會有針對性的篩查指南,文種的限制可能會造成不完全檢索。我們會在今后的研究中,盡量納入其它文種的肺癌篩查領域指南,通過專業人員進行翻譯從而提供全球化的指南方法學質量評價和報告質量評價。
本研究表明,目前提供研究方案的乳腺癌篩查指南的總體質量尚可,且集中在近三年發布。篩查指南在“應用性”和“參與人員”領域需要加強,指南報告需在“推薦意見”和“評審和質量保證”部分加強。為提高我國癌癥篩查指南的質量,我們提出如下建議:① 嚴格遵守指南制訂的標準,加強人員的制訂方法學培訓;② 提高指南制訂過程的透明度,重視利益沖突聲明;③ 提高報告內容中推薦意見的清晰明辨,加強報告規范;④ 建議由權威機構籌劃、加強指南的傳播和實施。總之,要制訂出重點突出、符合我國國情的癌癥篩查循證實踐指南完整版并定期更新,適應醫療技術的發展及臨床的規范化,從而有力地促進我國癌癥早期診斷和早期治療項目的工作效率與成果。
目前乳腺癌在我國女性人群中的發病率為 22.1/10 萬,位居女性癌癥首位,每年有近 18.7 萬新發病例,15 年后預計將超過 24.3 萬,已成為發病率和死亡率增長較迅速的惡性腫瘤。而歐美等西方高度城鎮化國家的乳腺癌發病率已從 30 年前的 50/10 萬增加到目前的 70/10 萬余[1]。據聯合國人口署預測,亞洲國家 60 歲以上女性占全部女性人口的比例將從 2015 年的 16% 上升為 2030 年的 25%。這些數據均提示,隨著人口城鎮化和老齡化的加速,全球女性人群的乳腺癌疾病負擔將日益加重[2]。多個國家已陸續開展乳腺癌篩查項目,但何種乳腺癌篩查指南/推薦意見可為篩查提供有效的參考依據尚不得而知。為了高效實現對潛在乳腺癌患者的早期發現、預防和治療,最終達到降低乳腺癌死亡率和社會經濟負擔的目標,制訂并參考高質量的乳腺癌篩查指南進行實踐工作是十分重要和必要的。
目前,許多國家已經制訂或正在制訂臨床實踐指南[3, 4]。如果指南建立在嚴格的循證醫學證據和高質量方法的基礎上,采用系統的檢索和文獻評價方法,基于得到的高質量證據,并予以充分、嚴格和全透明過程的推薦,在可能的情況下盡量減少偏倚產生,那么這樣的指南將能夠科學地將證據轉化到實踐中,其臨床使用更具有可靠性。歐洲指南研究與評估工具(Appraisal of guidelines research and evaluation in Europe,AGREE)是由 13 個國家的研究者制訂的指南研究和評價工具,主要用于評價指南的開發、使用和推廣等,已成為世界公認評價指南質量的重要工具,目前已經更新至第二版(AGREE Ⅱ)[5]。2016 年《內科學年鑒》(Annals of Internal Medicine)發表了由 10 個國家專家團隊研究制訂的實踐指南報告標準(Reporting items for practice guidelines in healthcare,RIGHT),包含 7 大領域,共 22 個條目,是當前全球唯一一個適用于指導衛生政策與體系、公共衛生和臨床醫學指南的報告標準[6]。目前已有團隊使用 AGREE Ⅱ 工具對 2012~2013 年中國大陸期刊發表的臨床實踐指南質量進行了方法學質量評價[7],而本研究團隊計劃采用 AGREE Ⅱ 和 RIGHT 工具對不同癌癥的篩查指南進行評估[8],以期為我國的癌癥篩查高質量的指南制訂工作提供借鑒。
本文分析了全世界乳腺癌篩查指南的現狀,使用 AGREE Ⅱ 和 RIGHT 工具評價相關指南的方法學質量和報告質量,希望促進我國乳腺癌篩查工作在方案決策、實踐、經濟成本考慮等方面的規范化。
1 資料與方法
1.1 納入與排除標準
納入標準:① 公開發布的原創和更新的正常人群乳腺癌篩查指南/推薦意見全文,如有多次更新版本,以最近一版為準;② 題目中有明確“指南(guideline)”和/或“推薦意見(recommendation)”的詞語,其形式為獨立報告;③ 官方或非官方發布指南均納入,且指南報告內容具備詳細的制作流程和/或研究方法描述;④ 語種限中、英文。
排除標準:① 關于臨床指南的介紹、解讀、應用效果評價;② 非乳腺癌、非篩查類和非獨立內容呈現的指南;③ 其它癌種轉移性質的繼發性乳腺癌;④ 翻譯版本及重復發表的指南。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、The Cochrane Library、Web of Science、CNKI、CBM、WanFang Data 數據庫和相關網站,包括美國國家癌癥網絡信息平臺(National Comprehensive Cancer Network,NCCN)、美國臨床腫瘤學會(American Society of Clinical Oncology,ASCO)、美國預防服務工作組(U.S. Preventive Services Task Force,USPSTF)、國際指南協作網(Guideline International Network,GIN)和中國臨床指南文庫(China Guideline Clearinghouse,CGC)等,檢索時限均為建庫至 2018 年 2 月。同時通過手工檢索和追溯參考文獻,搜集相關指南及全文。中文檢索詞包括:乳腺癌、乳腺腫瘤、篩查、早期診斷、指南;英文檢索詞包括:breast cancer、breast neoplasms、screening、early detection of cancer、guideline、recommendation。以 PubMed 為例,其具體檢索策略見框 1。

1.3 研究方法
1.3.1 指南基本情況描述
將所納入的指南根據國別(以第一發布機構所在地區為準)、發布時間、指南名稱、發布機構、是否有詳細研究制訂方法、是否證據分級、指南更新次數與時間進行統計描述。
1.3.2 指南的推薦意見主要內容匯總
該部分主要匯總報告了制訂方法的指南。將包括乳腺癌篩查時的高危險人群評估指標(包括年齡、其他疾病或遺傳史等)、篩查的頻率、篩查地點推薦及篩查試點的建立、篩查手段的潛在利益(包括生存率及行為改變)和潛在危害(包括過度篩查、假陽性以及篩查所引起的并發癥等)、在指南中是否鼓勵受試者參與、是否有提出針對受試者的行為干預、制作指南過程中是否對證據等級進行分級。
1.3.3 指南質量初步評價
參考 AGREE Ⅱ 指南評價工具[5],按“范圍和目的、參與人員、嚴謹性、清晰性、應用性與獨立性”6 個領域 23 個主要條目對報告了制訂方法的指南進行綜合評價。AGREE Ⅱ 的每一個條目均按 7 分劃分等級(1 分代表很不同意,7 分代表很同意,條目報道不能滿足全部標準或條件則根據不同情況給予 2~6 分)。每個領域得分等于該領域中每一個條目分數的總和,并標準化為該領域可能的最高分數(表 1)。
4 名評價人員按照每個條目對每一篇指南進行評估判分,每個領域的總分評判標準為:
最大可能得分=7 分(很同意)×條目數×評價者數
最小可能得分=1 分(很不同意)×條目數×評價者數
領域分值=“實際得分–最小可能得分”/“最大可能得分–最小可能得分”×100

1.3.4 指南推薦級別判定
根據 6 個領域的總分綜合判斷所評指南是否值得推薦應用,分為 3 個推薦等級:A 級:積極推薦(4 個及以上領域的分值≥50 分);B 級:推薦(3 個領域的分值≥50 分);C 級:一定條件下推薦(2 個及以下領域的分值≥50 分)。
1.3.5 指南報告質量評價
RIGHT 工具 7 大領域包括基本信息、背景、證據、推薦意見、評審和質量保證、資金資助與利益沖突聲明和管理、其他方面,其中基本信息涉及標題/副標題、執行總結、術語與縮略語、通訊作者;背景涉及簡要描述指衛生問題、總目標和具體目的、目標人群、指南的使用者和應用環境、制訂工作組;證據涉及衛生保健問題、系統評價及證據體的質量評價方法或標準;推薦意見涉及推薦意見內容、形成推薦意見的原理和解釋說明、指南制訂工作組的決策過程和方法;資金資助與利益沖突聲明和管理涉及資金來源、作用、利益沖突的聲明和管理;其他方面涉及可及性、對未來研究的建議及局限性[8]。共包括 22 個條目的 35 個具體標準,如該條目判定為是,則得 1 分,反之 0 分,總分為 35 分。≥30 分為報告質量高,20~29 分為報告質量中等,≤19 分為報告質量低。分別由兩名研究人員背靠背進行評價,評分結束后,取平均值。
1.4 評價人員對評價結果的一致性判斷
指南篩選采用研究人員獨立判讀、翻譯、校對的方法,如有異議通過小組討論解決。小組中研究人員均需具備較好的英文閱讀能力和循證醫學方法學的基礎,并由通過組內培訓對文獻評價的方法、AGREE Ⅱ 工具、RIGHT 工具評價標準及評價注意事項進行詳細介紹。同時,為保證指南質量和報告質量評價結果的可靠性,隨機抽取 3 篇納入文獻進行獨立評分,共同衡量評價人員間對指南評價結果的一致性。
1.5 統計分析
文獻資料管理采用 EndNote 軟件,采用 Excel 2010 軟件進行評分記錄及分析。采用 SAS 9.4 軟件對評價者評分結果的一致性進行組內相關系數(intra-class correlation coefficient,ICC)檢驗[9]。若 ICC≤0.20,說明評價者間一致性差;0.21≤ICC≤0.60,說明一致性中等;0.6l≤ICC<0.80 說明一致性良好;ICC≥0.80,說明一致性非常好。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 761 篇,經逐層篩選,最終納入乳腺癌篩查領域報告了詳細研究方法的指南共 11 篇[10-20]。文獻篩選流程及結果見圖 1。

2.2 納入指南的基本特征
納入指南的基本特征見表 2。2015 年~2017 年呈現一個乳腺癌篩查領域指南的發布高峰。總體上發布國家主要集中在美國,占總量的 45%[10, 16, 18-20],中國、加拿大、德國和日本各 1 篇[11, 12, 14, 17],國際組織,如世界衛生組織國際癌癥研究署和歐洲腫瘤內科學會發布各 1 篇[13, 15]。指南發布機構涉及各國腫瘤專業協會(委員會)、癌癥研究中心、癌癥工作組等專業機構。

2.3 納入指南的主要內容報告情況
指南關注的問題包括乳腺癌篩查中人群年齡的界定、方案的選擇、篩查頻率的選擇及潛在利益與危害等。11 篇指南[10-20]均提及乳腺癌篩查中女性人群的年齡界定,其中 7 篇[10-12, 15-19]推薦 40 歲以上女性均可接受乳腺癌篩查,2 篇[13, 14]推薦 50 歲以上女性需接受篩查,2 篇[10, 20]推薦 40~49 歲女性人群接受篩查。8 篇[10, 12, 14, 16-20]提供了接受篩查的頻率,但其依據各有不同。8 篇指南[10, 12, 14-16, 18-20]提及篩查涉及的潛在利益,10 篇指南[10-12, 14-20]提及篩查涉及的潛在危害。4 篇指南[12, 15, 16, 18]指出需要鼓勵受試者參與到篩查項目中以體現受試者的意愿和個體化選擇。
指南制訂方法包括:根據需要制作系統評價/Meta 分析、整合已有系統評價、證據分級和專家共識等,4 篇[10, 12, 16, 19]報告使用系統評價方法制訂,3 篇[11, 14, 15]報告使用整合評價和專家共識的方法制訂,3 篇[13, 17, 18]報告單獨使用專家共識方法,1 篇[20]報告單獨使用整合評價的方法制訂。部分指南所依據的證據采用系統評價所獲證據,證據質量逐步提高,方法也逐漸完善,其中 9 篇[11-16, 18-20]報告了制訂指南過程中所依據證據等級的分級方法,2 篇[12, 19]使用了 GRADE(Grading of Recommendations Assessment,Development and Evaluation)系統(表 3)。

2.4 一致性檢驗結果
使用 AGREE Ⅱ 工具評價中,4 名評價人員針對“范圍和目的、參與人員、嚴謹性、清晰性、應用性、獨立性”共 6 個領域進行評價的一致性檢驗結果分別為:0.75、0.59、0.80、0.67、0.71、0.72,評價的總一致性非常好[ICC=0.82,95%CI(0.79,0.90)]。
使用 RIGHT 工具評價中,2 名評價人員針對“基本信息、背景、證據、推薦意見、評審和質量保證、資金資助與利益沖突聲明和管理、其他方面”共 7 個領域進行評價的一致性檢驗結果分別為:0.81、0.49、0.76、0.75、0.72、0.68 和 0.58,評價的總一致性非常好[ICC=0.80,95%CI(0.77,0.86)]。
2.5 納入指南的方法學質量評價結果
采用 AGREE Ⅱ 評價工具對納入指南進行方法學質量評價,在“范圍和目的、參與人員、嚴謹性、清晰性、應用性、獨立性”6 個領域獨立計分,其總體評價結果平均得分分別為:83、48、60、77、53 和 79 分。6 個領域總和平均分達到 50 分以上者有 10 篇[10-13, 15-20](81%)。6 篇指南[11, 12, 15, 16, 18, 19]推薦等級為 A,其余 5 篇指南[10, 13, 14, 17, 20]推薦等級為 B(表 4)。
“范圍與目的”領域中,美國發布的乳腺癌篩查指南平均分為 86 分,加拿大 94 分,中國 81 分,德國 83 分,日本 63 分;“參與人員”領域中,美國指南的平均分為 54 分,加拿大 69 分,中國 33 分,德國 48 分,日本 31 分;“嚴謹性”領域中,美國指南的平均分為 69 分,加拿大 79 分,中國 24 分,德國 70 分,日本 31 分;“清晰性”領域中,美國指南的平均分為 81 分,加拿大 89 分,中國 74 分,德國 70 分,日本 67 分;“應用性”領域中,美國指南的平均分為 58 分,加拿大 74 分,中國 40 分,德國 49 分,日本 35 分;“獨立性”領域中,美國指南的平均分為 86 分,加拿大 81 分,中國 81 分,德國 78 分,日本 58 分。推薦等級為 A 的指南中,美國指南 3 篇[16, 18, 19]、加拿大 1 篇[12]、德國 1 篇[11](表 4)。

2.6 納入指南的報告質量評價結果
采用 RIGHT 評價工具對納入指南進行報告質量評價,在“基本信息、背景、證據、推薦意見、評審和質量保證、資金資助與利益沖突聲明和管理、其他方面”7 個部分計分。“基本信息”有 6 篇[11, 12, 15, 16, 18, 19]達到滿分 6 分,“背景”有 2 篇[12, 16]達到滿分 8 分,“證據”有 3 篇[12, 16, 19]達到滿分 5 分,“推薦意見”有 2 篇[12, 16]達到滿分 7 分,“評審和質量保證”無滿分,“資金資助與利益沖突聲明”有 1 篇[10]達到滿分 4 分,“其他方面”有 6 篇[10-12, 15, 16, 19]達到滿分 3 分。11 篇指南中,高報告質量指南 3 篇[12, 16, 19],包括美國 2 篇[16, 19]、加拿大 1 篇[12]。美國發布的乳腺癌篩查指南報告質量平均 25 分,加拿大 33 分,中國 17 分,德國 24 分,日本 16 分(表 5)。

3 討論
本研究納入指南多數由相關癌癥防控組織制訂發布,詳細描述了指南制訂方法的指南發布/更新時間均在 2014 年之后。指南的內容和質量由于制訂的時間、國家地區和組織不同而差異較大。作為指導性文件,臨床實踐指南是縮小當前最佳證據與臨床實踐之間差距的決策性工具,高質量的指南可直接為醫藥衛生工作者提供決策依據,在改善患者結局、節約醫療費用、提高衛生保健質量中扮演重要作用[21, 22]。目前癌癥篩查在我國乃至全球都占有舉足輕重的地位,正確合理的篩查手段可有效降低癌癥死亡率,同時也可大大降低經濟社會負擔。美國預防服務工作組和國立綜合癌癥網絡自 2010 年起,每年都會更新癌癥篩查相關指南,尤其是其更新均依據證據推薦分級進行。本研究納入的 4 篇[12, 15, 16, 18]具有證據推薦等級的循證實踐指南涉及內容全面,對乳腺癌篩查所考慮的問題,如人群年齡選擇、篩查頻率、篩查地點推薦及建立、篩查潛在利益和潛在危害、是否鼓勵受試者參與均有提及,指南推薦等級均為 A 級,具有較好的實用性、適用性和推廣性。
本研究依據 AGREE Ⅱ 的 6 個領域對乳腺癌篩查指南的質量進行評價,6 篇(54%)指南質量等級為 A 級。6 個領域中平均分數≥60 分的包括“范圍和目的”、“嚴謹性”、“清晰性”和“獨立性”,而得分較低(≤60 分)的領域包括“參與人員”和“應用性”。AGREE Ⅱ 評價方法不僅強調注重指南制訂過程中依據循證醫學方法,同時注重其實用性、應用性和適用性[23]。指南制訂過程中往往需要政府及商業團體資助,利益沖突不可避免,所以進行指南制訂組織的責任利益聲明非常有必要。一方面是為了避免存在因商業團體傾向性而導致的陽性偏倚,同時也使所制訂的指南可信度更強[24]。本研究納入指南均在利益沖突方面進行了聲明且評估分值大于 50 分,故可信度較高。
RIGHT 工具的產生,在基于 AGREE 評價指南質量的同時,還需關注指南的報告質量,能讓指南生產和使用者清楚了解需要怎樣報告才是正確的。本研究納入指南大多在基本信息和背景部分報告質量尚可,但在推薦意見和評審、質量保證部分報告質量較低。綜合得分顯示報告質量較好的指南僅 3 篇,說明指南制訂后的報告過程,要根據 RIGHT 標準撰寫,以提高報告質量。
本研究納入一篇我國抗癌協會制訂的乳腺癌篩查指南[17],其在乳腺癌診治規范等內容中,包含了篩查這一部分。我國乳腺癌診治相關專家充分結合了我國現有國情,使得推薦意見具有地域指導性。我國已進行了多年的乳腺癌篩查項目,但尚無長期隨訪的高質量數據以提供高推薦級別的證據,這限制了我國乳腺癌篩查領域高質量指南的制訂,也意味著一段時間內,我國尚不能給全球提供乳腺癌篩查的中國智慧和中國經驗。這也提示在資源、經費、經驗和時間有限的國家或地區,由于文化和組織等差異,循證指南制訂方法和產出也會有差異,需考慮地域特殊性[25]。因此,我們可借鑒國外高質量指南的制訂標準和規范證據,并與本地疾病負擔、遺傳特點及衛生資源條件相結合,采用循證理念制訂出高質量證據支持的本土化指南,這可能是我國標準版癌癥篩查指南的發展方向。中國癌癥篩查指南與中國本土其他指南一致,都存在以下重要挑戰[26]:① 缺乏像 NCCN 這樣專門的癌癥指南制訂機構;② 缺乏高質量的原始研究證據,即使有相關研究發表,質量也良莠不齊;③ 指南更新周期較長,制作過程較龐雜,無法滿足快速得到結果的期望;④ 缺乏具備臨床背景并可熟練使用循證評價方法的相關人員。存在挑戰的同時,篩查指南的制訂也面臨著重要機遇,基于前期大量的篩查項目得到的高質量數據可提供本土化的醫學證據作為參考,眾多的高校循證醫學中心培養了大量的循證醫學研究人員,能夠為制訂指南、生產證據及分級等提供方法學指導。
關于評價工具,本研究首次使用 AGREE Ⅱ 和 RIGHT 評價乳腺癌篩查指南/推薦意見。使用的版本是中國中醫科學院廣安門醫院的團隊翻譯的 AGREE Ⅱ 中文版及蘭州大學循證醫學中心團隊翻譯的 RIGHT 中文版。雖然前期進行了統一的培訓且評價的一致性較好,但兩種工具尚無法對指南內容應用的有效性進行評價。此外,納入指南均公開發表于期刊雜志上和相關網站,在檢索文獻過程中限定了語種(中文和英文),因不同的國家地區會有針對性的篩查指南,文種的限制可能會造成不完全檢索。我們會在今后的研究中,盡量納入其它文種的肺癌篩查領域指南,通過專業人員進行翻譯從而提供全球化的指南方法學質量評價和報告質量評價。
本研究表明,目前提供研究方案的乳腺癌篩查指南的總體質量尚可,且集中在近三年發布。篩查指南在“應用性”和“參與人員”領域需要加強,指南報告需在“推薦意見”和“評審和質量保證”部分加強。為提高我國癌癥篩查指南的質量,我們提出如下建議:① 嚴格遵守指南制訂的標準,加強人員的制訂方法學培訓;② 提高指南制訂過程的透明度,重視利益沖突聲明;③ 提高報告內容中推薦意見的清晰明辨,加強報告規范;④ 建議由權威機構籌劃、加強指南的傳播和實施。總之,要制訂出重點突出、符合我國國情的癌癥篩查循證實踐指南完整版并定期更新,適應醫療技術的發展及臨床的規范化,從而有力地促進我國癌癥早期診斷和早期治療項目的工作效率與成果。