引用本文: 邵麗華, 張秋寧, 田金徽, 楊震, 羅宏濤, 劉銳鋒, 廖亦然, 耿一超, 王小虎, 楊克虎. 食管癌臨床指南和共識的質量評價. 中國循證醫學雜志, 2020, 20(5): 593-603. doi: 10.7507/1672-2531.201909072 復制
根據 2018 年全球癌癥統計數據,食管癌的發病率和死亡率在所有腫瘤中分別排在第七位和第六位[1]。我國是食管癌的發病大國,根據 WHO 實時數據,我國食管癌患病率和死亡率都排在全球第五位,盡管隨著食管癌診療技術的進步,食管癌五年生存率有一定提升,但是縱觀全球,仍然維持在 10%~30% 的較低水平。因此規范的診治食管癌方案受到越來越多的關注,這可使眾多的食管癌患者受益。在食管癌的診治過程中,利用臨床指南共識指導臨床醫師的醫療行為,可改善醫療服務質量和安全性,減少不恰當的臨床決策并對推廣和應用新研究成果具有重要意義[2]。然而如果指南的制訂不夠嚴謹、規范,則很有可能對臨床醫生造成誤導,并給患者帶來危害和不必要的經濟負擔,因此有必要對指南進行質量評價。指南的制訂不僅要遵守嚴格的方法學標準[3],還應以透明的方式進行報告,從而保證其清晰性和完整性[4]。13 個國家的研究者共同制訂了臨床指南評價系統(appraisal of guidelines for research and evaluation,AGREE),并于 2003 年發表[5]。2009 年,臨床指南評價系統國際協作組織對 2003 版 AGREE 修正后并更新為 AGREE Ⅱ[6],這對臨床指南的質量保證和成功實施產生了重要作用,已得到廣泛支持和認同,成為國際公認評價臨床指南質量的重要工具。2016 年,國際 RIGHT(reporting items for practice guidelines in healthcare,RIGHT)工作組發布了 RIGHT 標準,作為指南報告的規范化標準以協助指南制訂人員撰寫和報告指南。本文旨在通過 AGREE Ⅱ和 RIGHT 標準評價國內外發表的食管癌指南和共識的方法學和報告質量。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
期刊、會議、網站公開發表的食管癌臨床實踐指南和共識。
1.1.2 排除標準
① 直接翻譯的國外臨床指南和共識;② 重復收錄的臨床指南和共識;③ 臨床指南的介紹、評析、應用指導、應用效果評價和勘誤表等。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、Web of Science、CBM、WanFang Data 和 CNKI 數據庫。補充檢索 GIN、NICE、NGC 和醫脈通主要指南網站,搜集食管癌相關指南和共識,檢索時限均從建庫至 2018 年 8 月。此外,追溯已納入臨床指南和共識的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:食管癌、食管腫瘤、指南和共識等;英文檢索詞包括:esophagus cancer,esophagus neoplasm,guideline 和 consensus 等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入指南和共識的基本信息,包括題目、發表雜志、發表時間、制訂機構、制訂方法等;② 方法學質量評價的關鍵要素;③ 報告質量評價的關鍵要素。
1.4 納入指南的質量評價
由 2 位評價員采用 AGREE Ⅱ和 RIGHT 評價工具分別評價納入研究的方法學質量和報告質量。AGREE Ⅱ指南評價工具包括 6 個領域 23 個條目[6],每條條目分值為 1~7 分,完全符合條目要求的賦予 7 分,完全不符合的賦予 1 分,介于二者之間的根據不同情況給予 2~6 分,每篇指南各領域最終得分的計算公式如下:各領域得分=(實際分?最低分)/(最高分?最低分)。RIGHT 標準共 7 個領域 22 條目[7],以“報告”、“部分報告”或“未報告”進行條目評價,分別對“報告”、“部分報告”或“未報告”賦值 1、0.5、0 分,最后匯總每一篇指南或共識的總得分。
1.5 統計分析
描述性分析采用 Excel 軟件,數據分析采用 SPSS 22.0 統計軟件,計量資料采用秩和檢驗,所有假設檢驗的檢驗水平為 α=0.05。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻 3 259 篇,經逐層篩選后,最終納入食管癌相關的臨床指南和共識 26 個[8-33]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CBM(
2.2 納入研究的基本特征
納入研究的基本特征見表 1,其中,共識 9 個(34.6%),臨床指南 17 個(65.4%);個人發布 5 個(19.2%),學會/協會發布 21 個(80.8%);參與制訂機構和人數≥10 的分別為 8 個(30.8%)、17 個(61.5%),其≤9 的分別為 17 個(65.4%)、9 個(34.6%);基于專家意見或綜述等制訂 12 篇(46.2%),基于循證醫學方法制訂 14 篇(53.8%);我國 8 篇(30.8%),國外 18 篇(69.2%);在應用類別方面以診療指南為主,占 65.4%(17 篇),治療類指南 34.6%(9 篇)。

2.3 方法學質量評價結果
2.3.1 總體評價結果
① 范圍和目的領域:15 個指南評分大于 50%,絕大部分指南共識都不同程度地描述了指南目的、具體的臨床問題以及指南的目標患者。② 參與人員領域:僅有 2 個指南評分大于 50%,70% 以上的指南共識不同程度地描述了指南制訂者是相關領域專家,50% 以上的指南共識規定了指南的適用者;近 70% 的指南共識未考慮到目標患者的觀點和選擇。③ 制定嚴謹性領域:僅有 2 個指南評分大于 50%,65% 的指南共識未提供系統的證據檢索步驟、篩選過程,55% 的指南共識未明確指出證據的推薦優勢和不足,約超過 50% 的指南共識不同程度地闡述了形成推薦意見的方法及推薦意見和支持證據之間的聯系,超過 70% 的指南共識在形成推薦意見時不同程度考慮了對健康的效益、不良反應以及風險,超過 80% 的指南共識在發表前未經過專家的外部評審,超過 60% 的指南共識未提及指南更新。④ 清晰性領域:14 個指南評分大于 50%,近 90% 的指南共識推薦意見明確、列出了針對某一臨床問題的不同選擇,近 70% 的指南共識的主要推薦意見清晰可辨。⑤ 應用性領域:無指南評分大于 50%,超過 50% 的指南共識未提及指南應用過程中的促進和阻礙因素,接近 90% 的指南共識未提供推薦意見、如何應用于實踐的建議及配套工具,也未考慮應用推薦建議時潛在的資源投入問題,但約 70% 的指南提供了監測指南使用的標準。⑥ 編輯獨立性領域:僅有 2 個指南評分大于 50%,約 75% 的指南共識未聲明贊助單位不影響指南或共識的內容,超過 50% 的指南或共識未記錄和考慮制訂小組成員的利益沖突(表 2)。

2.3.2 亞組分析
不同分類標準下各亞組指南和共識的 AGREE Ⅱ各領域得分及比較情況見表 3。指南在制訂的嚴謹性、清晰性和編輯獨立性領域的得分均高于共識(P<0.05);學會/協會發布在范圍和目的、參與人員、制訂的嚴謹性及清晰性領域的得分均高于個人發布(P<0.05);基于循證醫學方法制訂的指南和共識較基于專家意見或綜述制訂的各領域得分均較高(P<0.05);國外指南和共識在制訂的嚴謹性、清晰性及編輯的獨立性領域的得分均高于國內指南(P<0.05);但 AGREE Ⅱ發布前后及參與指南和共識制訂的人和機構數量在各領域得分差異無統計學意義。

2.4 報告質量評價結果
2.4.1 報告質量總體評價
根據 RIGHT 評價條目中報告率最高的條目為 5(84.62%),其次為 1a(80.77%)、1c(65.38%)、13a(65.38%)、4(61.54%),其余條目報告率均在 50% 以下,報告率最低的條目為 8b、10a、10b、14b、14c、16、17、21、22,均為 0(表 4)。

2.4.2 亞組分析
指南較共識、學會/協會發布較個人發布、基于循證制訂較基于專家意見或綜述制訂、國外指南共識較我國指南共識的 RIGHT 評分高且差異均具有統計學意義(P<0.05),而參與制訂的人數和機構數量不同的 RIGHT 評分比較差異無統計學意義(表 5)。

3 討論
根據 AGREE II 評價結果,納入的指南和共識 6 個領域平均得分分別為 49.63%、25.16%、23.42%、49.25%、16.91%、21.07%,均在 50% 以下,未達到 AGREE Ⅱ 合格標準,總體制訂質量不高。存在的主要問題包括:① 范圍和目的領域:指南制訂過程中獲取患者的觀點或選擇,有利于實施指南推薦意見,體現指南制訂的全面性,能保證指南推廣實施,為指南適用性提供證據,但大多數食管癌指南共識制訂時未考慮到患者的觀點和選擇。② 嚴謹性領域:指南制訂的嚴謹性主要考察指南制訂者對方法學的研究、認知和重視程度,包括對證據的檢索、證據選擇標準的描述、推薦意見形成的描述、形成推薦意見時是否考慮了對健康的風險及副作用、推薦意見與證據之間的關系、專家的外部評審和指南更新的步驟,但納入的大部分食管癌指南共識未提供系統的證據檢索步驟、篩選過程,在發表前也未經過專家的外部評審,并且隨著醫學的不斷發展,臨床新技術、新療法不斷出現,臨床指南必須根據新出現的證據及時更新,大部分食管癌指南共識均未提及指南更新計劃。③ 應用性領域:指南應用性是指指南制訂過程中需考慮指南推行的潛在障礙、推行指南推薦意見所需成本和監測指南使用的標準,納入的絕大部分食管癌指南和共識均未提供推薦意見如何應用于實踐,也未考慮應用推薦建議時潛在的資源投入問題。④ 編輯獨立性領域:指南編輯的獨立性是指指南必須在文中聲明指南制訂和資金贊助者之間及指南制訂人員之間無利益沖突,大部分食管癌指南和共識未進行利益沖突的聲明和管理。
根據 RIGHT 標準報告清單,納入的食管癌指南或共識報告質量均不高,各領域報告率均未超過 50%,報告率最高的為基本信息領域。① 基本信息領域:大部分指南和共識都能夠通過題目判斷為指南或共識,并對報告指南進行了分類,一般都有通訊作者;但對于報告指南的發表年份、執行總結、術語和縮略語絕大部分指南都未報告。② 背景領域:大部分指南和共識都簡要描述了指南衛生問題;50% 以上的國外指南和共識對指南的總目標和具體目的進行了不同程度的描述,而我國指南和共識基本未對此進行描述;絕大多數指南和共識對于目標人群、指南的使用者和應用環境、指南制訂小組均未進行描述。③ 證據領域:所有指南和共識都未對衛生保健問題進行報告;系統評價和評價證據質量條目國外指南和共識有不同程度的報告,而我國指南基本未予報告。④ 推薦意見領域:基本所有國外指南共識均提供了清晰、準確且可實施的推薦意見,而我國指南和共識僅有 1 篇提供。⑤ 評審和質量保證領域:所有指南和共識都未進行報告。⑥ 資助與利益沖突聲明及管理領域:我國食管癌指南共識均未報告,少部分國外指南和共識進行了報告和聲明。⑦ 其他領域:指南的獲取、對未來研究或指南制訂的建議、指南的局限性等其他領域所評價的指南和共識基本都未進行描述。由此可見,納入的 26 個食管癌指南和共識的報告質量低,這可能與 2016 年國際 RIGHT 工作組發布了 RIGHT 標準,而食管癌指南和共識大多于此前發布相關,建議以后的指南制訂者和撰寫者可以參考 RIGHT 標準撰寫指南,提高指南的報告質量,使其明晰、規范。
本研究結果顯示食管癌指南共識的質量良莠不齊,可能受多種因素影響。從 AGREE II 發布前后來看,AGREE II 發布后 6 個領域得分均有提高,并在范圍和目的領域及明晰性領域方面得分達到 50% 以上,說明 AGREE II 被越來越多的指南制訂者知曉,并運用到指南制訂中,在一定程度上提高了指南制訂的科學性。指南的制訂較共識規范,方法學和報告質量均較高。從制訂機構來看,學/協會制訂的指南質量更高,可能與其可支配與指南制訂相關的資源較其他類型機構更多(如能召集更多相關專業和領域的專家)有關,由此可見,臨床指南的制訂應該是相關學會/協議組織該領域專家共同編寫,以提高其方法學質量和報告規范。從參與臨床指南和共識制訂機構數和人數來說,參與機構和人數≥10 時,相對≤9 來說質量雖無顯著差異,但其在各領域(除嚴謹性領域)及 RIGHT 評分得分均較高,說明質量有增高的趨勢,因此參與臨床指南和共識的制訂人數和機構應該具備權威性的同時,還應該考慮具有廣泛的代表性。從制訂方法來說,基于循證制訂的指南或共識質量明顯高于非循證制訂的指南共識,可能與循證制訂過程能夠保證指南制訂過程更加嚴謹有關,由此可見,臨床指南和共識的制訂需要基于循證醫學的方法及證據系統的研究和嚴格論證。另外,我國制訂的指南在制訂的嚴謹性、表達的清晰性、編輯獨立性領域以及 RIGHT 評分方面的得分明顯低于國外制訂的指南共識,差異有統計學意義;且國外制訂指南過程中更重視循證方法的使用,相比之下我國制訂的 8 個食管癌指南和共識中僅有 1 個提及循證醫學方法,無 1 個應用衛生技術評估方法,這說明我國臨床指南制訂方面還有很大的發展空間,我國是食管癌發病大國,需要高質量的循證指南來規范食管癌的診治,國家和相關的學會應向國外高質量指南學習,整合資源,制訂出高質量證據支持的本土化食管癌診治指南。
臨床指南共識作為指導臨床實踐的指導性文件,保證其質量對臨床療效與安全性有重要意義,其制訂方法應盡可能嚴謹和科學,根據亞組分析的結果基于循證制訂的指南其在 AGREE II 的 6 個領域及其 RIGHT 標準的得分明顯高于非循證制訂,并且差異具有統計學意義,表明運用循證醫學的理念和方法制訂指南是指南制訂的發展趨勢。納入食管癌指南 AGREE II 評分中應用性領域得分最低,臨床指南制訂出來后,必須在實施、評價方面給予更多關注,臨床指南應提供相關的配套文件和建議來推廣指南使用,如總結文件、快速參考指南、培訓工具、預試驗結果、患者書面說明和計算機輔助等,并且應該討論指南推行過程中的障礙因素,如應用推薦建議時可能需要額外的資源投入(如更多的專業人員、新的設備和昂貴的治療藥物,這些可能增加衛生保健的預算)、患者主觀感覺治療無效、醫生不愿意改變現行的診斷方法等,并提供解決這些阻礙指南應用的方法,此外應根據新的科學證據及消費者(患者、醫師和護士等)的反饋信息不斷地發展、實施、評價、修訂臨床指南。臨床指南的制訂是一項系統工程,為保證臨床指南質量,需要制訂標準,指南制訂者應根據 WHO 指南制訂手冊[34]、AGREE Ⅱ工具及 RIGHT 等的標準和要求,系統、規范地制訂高質量指南。
本研究存在一定的局限性:① 研究中使用 AGREE Ⅱ和 RIGHT 工具評價食管癌臨床指南和共識,盡管在評價之前進行了培訓,但由于研究者對 AGREE Ⅱ和 RIGHT 評價工具的理解差異,對 AGREE Ⅱ和 RIGHT 工具中一些條目的評分存在差異,可能帶來一定的偏差;② 當前針對指南的檢索并無統一的檢索策略,本研究對通過“指南”和“共識”進行主題檢索獲取指南和共識,存在漏檢的可能;③ 由于無法獲得臨床指南和共識應用的情況,未對納入臨床指南和共識的后效進行評價。
綜上所述,食管癌臨床指南和共識的方法學質量和報告質量均有待進一步提高,我國食管癌指南和共識和國外的存在較大的差距,食管癌臨床指南和共識的發布數量逐漸呈上升趨勢,但在 AGREE Ⅱ 發表后,其方法學和報告質量并沒有較明顯的改善,建議指南制訂者參考 AGREE Ⅱ、RIGHT 等工具和標準,制訂出高質量的指南并推廣應用,以更好地指導食管癌的規范化診療。
根據 2018 年全球癌癥統計數據,食管癌的發病率和死亡率在所有腫瘤中分別排在第七位和第六位[1]。我國是食管癌的發病大國,根據 WHO 實時數據,我國食管癌患病率和死亡率都排在全球第五位,盡管隨著食管癌診療技術的進步,食管癌五年生存率有一定提升,但是縱觀全球,仍然維持在 10%~30% 的較低水平。因此規范的診治食管癌方案受到越來越多的關注,這可使眾多的食管癌患者受益。在食管癌的診治過程中,利用臨床指南共識指導臨床醫師的醫療行為,可改善醫療服務質量和安全性,減少不恰當的臨床決策并對推廣和應用新研究成果具有重要意義[2]。然而如果指南的制訂不夠嚴謹、規范,則很有可能對臨床醫生造成誤導,并給患者帶來危害和不必要的經濟負擔,因此有必要對指南進行質量評價。指南的制訂不僅要遵守嚴格的方法學標準[3],還應以透明的方式進行報告,從而保證其清晰性和完整性[4]。13 個國家的研究者共同制訂了臨床指南評價系統(appraisal of guidelines for research and evaluation,AGREE),并于 2003 年發表[5]。2009 年,臨床指南評價系統國際協作組織對 2003 版 AGREE 修正后并更新為 AGREE Ⅱ[6],這對臨床指南的質量保證和成功實施產生了重要作用,已得到廣泛支持和認同,成為國際公認評價臨床指南質量的重要工具。2016 年,國際 RIGHT(reporting items for practice guidelines in healthcare,RIGHT)工作組發布了 RIGHT 標準,作為指南報告的規范化標準以協助指南制訂人員撰寫和報告指南。本文旨在通過 AGREE Ⅱ和 RIGHT 標準評價國內外發表的食管癌指南和共識的方法學和報告質量。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
期刊、會議、網站公開發表的食管癌臨床實踐指南和共識。
1.1.2 排除標準
① 直接翻譯的國外臨床指南和共識;② 重復收錄的臨床指南和共識;③ 臨床指南的介紹、評析、應用指導、應用效果評價和勘誤表等。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、Web of Science、CBM、WanFang Data 和 CNKI 數據庫。補充檢索 GIN、NICE、NGC 和醫脈通主要指南網站,搜集食管癌相關指南和共識,檢索時限均從建庫至 2018 年 8 月。此外,追溯已納入臨床指南和共識的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:食管癌、食管腫瘤、指南和共識等;英文檢索詞包括:esophagus cancer,esophagus neoplasm,guideline 和 consensus 等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入指南和共識的基本信息,包括題目、發表雜志、發表時間、制訂機構、制訂方法等;② 方法學質量評價的關鍵要素;③ 報告質量評價的關鍵要素。
1.4 納入指南的質量評價
由 2 位評價員采用 AGREE Ⅱ和 RIGHT 評價工具分別評價納入研究的方法學質量和報告質量。AGREE Ⅱ指南評價工具包括 6 個領域 23 個條目[6],每條條目分值為 1~7 分,完全符合條目要求的賦予 7 分,完全不符合的賦予 1 分,介于二者之間的根據不同情況給予 2~6 分,每篇指南各領域最終得分的計算公式如下:各領域得分=(實際分?最低分)/(最高分?最低分)。RIGHT 標準共 7 個領域 22 條目[7],以“報告”、“部分報告”或“未報告”進行條目評價,分別對“報告”、“部分報告”或“未報告”賦值 1、0.5、0 分,最后匯總每一篇指南或共識的總得分。
1.5 統計分析
描述性分析采用 Excel 軟件,數據分析采用 SPSS 22.0 統計軟件,計量資料采用秩和檢驗,所有假設檢驗的檢驗水平為 α=0.05。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻 3 259 篇,經逐層篩選后,最終納入食管癌相關的臨床指南和共識 26 個[8-33]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CBM(
2.2 納入研究的基本特征
納入研究的基本特征見表 1,其中,共識 9 個(34.6%),臨床指南 17 個(65.4%);個人發布 5 個(19.2%),學會/協會發布 21 個(80.8%);參與制訂機構和人數≥10 的分別為 8 個(30.8%)、17 個(61.5%),其≤9 的分別為 17 個(65.4%)、9 個(34.6%);基于專家意見或綜述等制訂 12 篇(46.2%),基于循證醫學方法制訂 14 篇(53.8%);我國 8 篇(30.8%),國外 18 篇(69.2%);在應用類別方面以診療指南為主,占 65.4%(17 篇),治療類指南 34.6%(9 篇)。

2.3 方法學質量評價結果
2.3.1 總體評價結果
① 范圍和目的領域:15 個指南評分大于 50%,絕大部分指南共識都不同程度地描述了指南目的、具體的臨床問題以及指南的目標患者。② 參與人員領域:僅有 2 個指南評分大于 50%,70% 以上的指南共識不同程度地描述了指南制訂者是相關領域專家,50% 以上的指南共識規定了指南的適用者;近 70% 的指南共識未考慮到目標患者的觀點和選擇。③ 制定嚴謹性領域:僅有 2 個指南評分大于 50%,65% 的指南共識未提供系統的證據檢索步驟、篩選過程,55% 的指南共識未明確指出證據的推薦優勢和不足,約超過 50% 的指南共識不同程度地闡述了形成推薦意見的方法及推薦意見和支持證據之間的聯系,超過 70% 的指南共識在形成推薦意見時不同程度考慮了對健康的效益、不良反應以及風險,超過 80% 的指南共識在發表前未經過專家的外部評審,超過 60% 的指南共識未提及指南更新。④ 清晰性領域:14 個指南評分大于 50%,近 90% 的指南共識推薦意見明確、列出了針對某一臨床問題的不同選擇,近 70% 的指南共識的主要推薦意見清晰可辨。⑤ 應用性領域:無指南評分大于 50%,超過 50% 的指南共識未提及指南應用過程中的促進和阻礙因素,接近 90% 的指南共識未提供推薦意見、如何應用于實踐的建議及配套工具,也未考慮應用推薦建議時潛在的資源投入問題,但約 70% 的指南提供了監測指南使用的標準。⑥ 編輯獨立性領域:僅有 2 個指南評分大于 50%,約 75% 的指南共識未聲明贊助單位不影響指南或共識的內容,超過 50% 的指南或共識未記錄和考慮制訂小組成員的利益沖突(表 2)。

2.3.2 亞組分析
不同分類標準下各亞組指南和共識的 AGREE Ⅱ各領域得分及比較情況見表 3。指南在制訂的嚴謹性、清晰性和編輯獨立性領域的得分均高于共識(P<0.05);學會/協會發布在范圍和目的、參與人員、制訂的嚴謹性及清晰性領域的得分均高于個人發布(P<0.05);基于循證醫學方法制訂的指南和共識較基于專家意見或綜述制訂的各領域得分均較高(P<0.05);國外指南和共識在制訂的嚴謹性、清晰性及編輯的獨立性領域的得分均高于國內指南(P<0.05);但 AGREE Ⅱ發布前后及參與指南和共識制訂的人和機構數量在各領域得分差異無統計學意義。

2.4 報告質量評價結果
2.4.1 報告質量總體評價
根據 RIGHT 評價條目中報告率最高的條目為 5(84.62%),其次為 1a(80.77%)、1c(65.38%)、13a(65.38%)、4(61.54%),其余條目報告率均在 50% 以下,報告率最低的條目為 8b、10a、10b、14b、14c、16、17、21、22,均為 0(表 4)。

2.4.2 亞組分析
指南較共識、學會/協會發布較個人發布、基于循證制訂較基于專家意見或綜述制訂、國外指南共識較我國指南共識的 RIGHT 評分高且差異均具有統計學意義(P<0.05),而參與制訂的人數和機構數量不同的 RIGHT 評分比較差異無統計學意義(表 5)。

3 討論
根據 AGREE II 評價結果,納入的指南和共識 6 個領域平均得分分別為 49.63%、25.16%、23.42%、49.25%、16.91%、21.07%,均在 50% 以下,未達到 AGREE Ⅱ 合格標準,總體制訂質量不高。存在的主要問題包括:① 范圍和目的領域:指南制訂過程中獲取患者的觀點或選擇,有利于實施指南推薦意見,體現指南制訂的全面性,能保證指南推廣實施,為指南適用性提供證據,但大多數食管癌指南共識制訂時未考慮到患者的觀點和選擇。② 嚴謹性領域:指南制訂的嚴謹性主要考察指南制訂者對方法學的研究、認知和重視程度,包括對證據的檢索、證據選擇標準的描述、推薦意見形成的描述、形成推薦意見時是否考慮了對健康的風險及副作用、推薦意見與證據之間的關系、專家的外部評審和指南更新的步驟,但納入的大部分食管癌指南共識未提供系統的證據檢索步驟、篩選過程,在發表前也未經過專家的外部評審,并且隨著醫學的不斷發展,臨床新技術、新療法不斷出現,臨床指南必須根據新出現的證據及時更新,大部分食管癌指南共識均未提及指南更新計劃。③ 應用性領域:指南應用性是指指南制訂過程中需考慮指南推行的潛在障礙、推行指南推薦意見所需成本和監測指南使用的標準,納入的絕大部分食管癌指南和共識均未提供推薦意見如何應用于實踐,也未考慮應用推薦建議時潛在的資源投入問題。④ 編輯獨立性領域:指南編輯的獨立性是指指南必須在文中聲明指南制訂和資金贊助者之間及指南制訂人員之間無利益沖突,大部分食管癌指南和共識未進行利益沖突的聲明和管理。
根據 RIGHT 標準報告清單,納入的食管癌指南或共識報告質量均不高,各領域報告率均未超過 50%,報告率最高的為基本信息領域。① 基本信息領域:大部分指南和共識都能夠通過題目判斷為指南或共識,并對報告指南進行了分類,一般都有通訊作者;但對于報告指南的發表年份、執行總結、術語和縮略語絕大部分指南都未報告。② 背景領域:大部分指南和共識都簡要描述了指南衛生問題;50% 以上的國外指南和共識對指南的總目標和具體目的進行了不同程度的描述,而我國指南和共識基本未對此進行描述;絕大多數指南和共識對于目標人群、指南的使用者和應用環境、指南制訂小組均未進行描述。③ 證據領域:所有指南和共識都未對衛生保健問題進行報告;系統評價和評價證據質量條目國外指南和共識有不同程度的報告,而我國指南基本未予報告。④ 推薦意見領域:基本所有國外指南共識均提供了清晰、準確且可實施的推薦意見,而我國指南和共識僅有 1 篇提供。⑤ 評審和質量保證領域:所有指南和共識都未進行報告。⑥ 資助與利益沖突聲明及管理領域:我國食管癌指南共識均未報告,少部分國外指南和共識進行了報告和聲明。⑦ 其他領域:指南的獲取、對未來研究或指南制訂的建議、指南的局限性等其他領域所評價的指南和共識基本都未進行描述。由此可見,納入的 26 個食管癌指南和共識的報告質量低,這可能與 2016 年國際 RIGHT 工作組發布了 RIGHT 標準,而食管癌指南和共識大多于此前發布相關,建議以后的指南制訂者和撰寫者可以參考 RIGHT 標準撰寫指南,提高指南的報告質量,使其明晰、規范。
本研究結果顯示食管癌指南共識的質量良莠不齊,可能受多種因素影響。從 AGREE II 發布前后來看,AGREE II 發布后 6 個領域得分均有提高,并在范圍和目的領域及明晰性領域方面得分達到 50% 以上,說明 AGREE II 被越來越多的指南制訂者知曉,并運用到指南制訂中,在一定程度上提高了指南制訂的科學性。指南的制訂較共識規范,方法學和報告質量均較高。從制訂機構來看,學/協會制訂的指南質量更高,可能與其可支配與指南制訂相關的資源較其他類型機構更多(如能召集更多相關專業和領域的專家)有關,由此可見,臨床指南的制訂應該是相關學會/協議組織該領域專家共同編寫,以提高其方法學質量和報告規范。從參與臨床指南和共識制訂機構數和人數來說,參與機構和人數≥10 時,相對≤9 來說質量雖無顯著差異,但其在各領域(除嚴謹性領域)及 RIGHT 評分得分均較高,說明質量有增高的趨勢,因此參與臨床指南和共識的制訂人數和機構應該具備權威性的同時,還應該考慮具有廣泛的代表性。從制訂方法來說,基于循證制訂的指南或共識質量明顯高于非循證制訂的指南共識,可能與循證制訂過程能夠保證指南制訂過程更加嚴謹有關,由此可見,臨床指南和共識的制訂需要基于循證醫學的方法及證據系統的研究和嚴格論證。另外,我國制訂的指南在制訂的嚴謹性、表達的清晰性、編輯獨立性領域以及 RIGHT 評分方面的得分明顯低于國外制訂的指南共識,差異有統計學意義;且國外制訂指南過程中更重視循證方法的使用,相比之下我國制訂的 8 個食管癌指南和共識中僅有 1 個提及循證醫學方法,無 1 個應用衛生技術評估方法,這說明我國臨床指南制訂方面還有很大的發展空間,我國是食管癌發病大國,需要高質量的循證指南來規范食管癌的診治,國家和相關的學會應向國外高質量指南學習,整合資源,制訂出高質量證據支持的本土化食管癌診治指南。
臨床指南共識作為指導臨床實踐的指導性文件,保證其質量對臨床療效與安全性有重要意義,其制訂方法應盡可能嚴謹和科學,根據亞組分析的結果基于循證制訂的指南其在 AGREE II 的 6 個領域及其 RIGHT 標準的得分明顯高于非循證制訂,并且差異具有統計學意義,表明運用循證醫學的理念和方法制訂指南是指南制訂的發展趨勢。納入食管癌指南 AGREE II 評分中應用性領域得分最低,臨床指南制訂出來后,必須在實施、評價方面給予更多關注,臨床指南應提供相關的配套文件和建議來推廣指南使用,如總結文件、快速參考指南、培訓工具、預試驗結果、患者書面說明和計算機輔助等,并且應該討論指南推行過程中的障礙因素,如應用推薦建議時可能需要額外的資源投入(如更多的專業人員、新的設備和昂貴的治療藥物,這些可能增加衛生保健的預算)、患者主觀感覺治療無效、醫生不愿意改變現行的診斷方法等,并提供解決這些阻礙指南應用的方法,此外應根據新的科學證據及消費者(患者、醫師和護士等)的反饋信息不斷地發展、實施、評價、修訂臨床指南。臨床指南的制訂是一項系統工程,為保證臨床指南質量,需要制訂標準,指南制訂者應根據 WHO 指南制訂手冊[34]、AGREE Ⅱ工具及 RIGHT 等的標準和要求,系統、規范地制訂高質量指南。
本研究存在一定的局限性:① 研究中使用 AGREE Ⅱ和 RIGHT 工具評價食管癌臨床指南和共識,盡管在評價之前進行了培訓,但由于研究者對 AGREE Ⅱ和 RIGHT 評價工具的理解差異,對 AGREE Ⅱ和 RIGHT 工具中一些條目的評分存在差異,可能帶來一定的偏差;② 當前針對指南的檢索并無統一的檢索策略,本研究對通過“指南”和“共識”進行主題檢索獲取指南和共識,存在漏檢的可能;③ 由于無法獲得臨床指南和共識應用的情況,未對納入臨床指南和共識的后效進行評價。
綜上所述,食管癌臨床指南和共識的方法學質量和報告質量均有待進一步提高,我國食管癌指南和共識和國外的存在較大的差距,食管癌臨床指南和共識的發布數量逐漸呈上升趨勢,但在 AGREE Ⅱ 發表后,其方法學和報告質量并沒有較明顯的改善,建議指南制訂者參考 AGREE Ⅱ、RIGHT 等工具和標準,制訂出高質量的指南并推廣應用,以更好地指導食管癌的規范化診療。