引用本文: 肖正華, 盧晨, 項蒙蒙, 張煜, 郭新利, 楊鵬, 黃堯, 胡佳. 中國心房顫動診療指南的質量評價. 中國循證醫學雜志, 2019, 19(2): 199-204. doi: 10.7507/1672-2531.201807083 復制
心房顫動(房顫)是一種以快速、無序心房電活動為特征的室上性快速性心律失常,具有很高的致殘率和致死率[1]。2016 年我國房顫患者超過 700 萬,房顫發病率較十年前增長了 20 倍,房顫相關性腦卒中發生率增長近 13 倍,尤其在 70 歲以上老年人更加突出[2, 3]。房顫在顯著降低患者心排出量的同時[4],還會增加患者左心房附壁血栓形成以及外周動脈栓塞的風險[5],其不良結局給患者和社會帶來了巨大負擔[6]。為綜合考慮房顫治療的受益與風險,規范房顫治療方案,我國于 2001 年制訂了中國第一部房顫診療相關指南[7]。到目前為止,我國已發布多部房顫診療相關指南,提高了我國臨床醫生對房顫的認識和診治水平,但國內尚無研究對房顫指南本身的方法學質量進行評價。
臨床指南研究與評估系統 AGREE Ⅱ(Appraisal of Guidelines for Research Evaluation Ⅱ)[8]旨在評估指南質量、為新指南的制訂提供方法學策略。依據 AGREE Ⅱ制訂指南可以顯著提高指南的方法學質量,并且讀者也可依據 AGREE Ⅱ評分來客觀評價某部指南的方法學質量及指南推薦等級,進而在一定程度上判斷該指南的可信度[9]。Galvez-Olortegui 等[10]在有關 AGREEⅡ評價房顫指南的研究中指出:房顫相關英文指南在整體質量較高的情況下,仍有部分領域如應用性得分較低(36.1%~93.5%),存在一定改進空間。而目前國內房顫指南和共識仍未按國際標準進行方法學質量評價,也未遵循循證指南的國際報告規范進行報告,導致其國際影響力較弱。本研究利用 AGREEⅡ對我國發布的房顫診療指南進行質量評價,了解目前存在的問題,以期為今后我國相關指南的制訂及更新提供參考。
1 資料與方法
1.1 納入與排除標準
納入標準:我國所有以中文發表的有關心房顫動診療的指南和專家共識。指南的定義由 Field 等[11]給出,即系統評價產生的證據以及對各種備選干預方式進行利弊評價之后提出的最優指導意見的文件。
排除標準:① 指南摘要或解讀;② 非診療指南;③ 國外指南的翻譯版或改編版;④ 心房顫動僅為指南的部分內容。
1.2 文獻檢索策略
計算機檢索 CBM、CNKI、WanFang Data 和 VIP 數據庫,搜集我國發布的心房顫動診療指南,檢索時限均從建庫至 2018 年 2 月。檢索詞包括:房顫、心房顫動、指南和專家共識。以 CBM 為例,其檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 納入指南的基本信息:題目、發表時間、制訂機構、發表雜志、專家數、參考文獻數等;② 指南方法學質量評價的關鍵要素。
1.4 納入研究的質量評價
由 4 名研究者采用 2009 年發布的 AGREEⅡ獨立對納入指南進行質量評價。從 6 個領域(共 23 個條目)和 2 個總體評估條目進行評價,每個條目最高 7 分(滿足該條目要求),最低 1 分(缺失該條目),每個領域的標化得分(以百分比形式表示)=(實際得分?可得最低分)/(可得最高分?可得最低分)×100%。在正式評價前,所有研究者都會進行培訓,針對 1 篇納入指南獨立預評分,后由組內討論協商保證 4 名研究者對每個條目的理解基本一致,具有相同的評價標準。
1.5 統計分析
采用均數(范圍)和頻數對所有納入指南的基本信息進行統計描述。計算組內相關系數評估 4 名研究者對每個條目給分的一致性。
2 結果
2.1 文獻檢索流程及結果
初檢共獲得相關文獻 2 668 篇,經逐層篩選,最終納入 10 部指南或共識[7, 12-20]。文獻檢索流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CBM(
2.2 納入指南的基本特征
本研究納入指南的發表時間從 2001 年到 2015 年。其中 7 部[7, 13, 14, 16-18, 20]為首版,3 部[12, 15, 19]為 1 部指南[7]的更新。納入指南中,7 部[7, 12, 13, 15, 16, 18, 19]由中華醫學會各分會牽頭制訂,1 部[17]由藥物臨床應用專家組牽頭制訂,1 部[20]由國家衛生和計劃生育委員會牽頭制訂。其中 9 部指南[7, 12, 13, 15-20]參考文獻數為 29~551 條,參與制訂的專家人數為 14~68 人。其中 5 部[7, 12, 13, 18, 20]指南發表于《中華心律失常學雜志》,2 部[15, 19]發表于《中國心臟起搏與心電生理雜志》,2 部[16, 17]發表于《中華內科雜志》。剩余 1 部指南[14]未提供制訂機構、參考文獻及制訂專家信息,發表于《中國醫刊》。納入指南的基本特征見表 1。

2.3 AGREE Ⅱ 評價結果
不同研究者評價結果的組間相關系數為0.954[95%CI(0.944,0.963)],一致性較好。納入指南在 6 個領域中的最終標化得分見表 2。

2.3.1 范圍和目的
該領域細分 3 條,主要考察指南是否清晰明了地闡述了該指南的總目的、涵蓋的衛生問題和適用人群、臨床醫生或其他指南需求者能否根據遇到的衛生問題迅速獲取到所需指南。在 6 個領域中,該領域的得分較高,標化得分平均為 54.17%(43.54%,64.80%)。
2.3.2 參與人員
該領域細分 3 條,主要考察指南開發小組的構成、收集目標人群要求和規定指南使用者的情況。該領域要求指南開發小組涵蓋所有相關人員,包括臨床醫生、方法學家、贊助者等,并詳細闡述每位成員的學科、機構、位置等信息。該領域的標化得分平均為 18.89%(12.48%,25.30%)。所有納入指南在該領域得分均較低,相關內容未進行報告,有些雖報告但闡述也不明確。
2.3.3 制訂的嚴謹性
該領域細分 8 條,是評價指南質量的重要內容,主要考察指南制訂過程中各過程的嚴謹性,包括證據的產生、評價,推薦建議的形成方法,建議和證據的聯系強度,是否有專家評審等。納入指南在該領域的得分都很低,標化得分平均為 15.89%(14.04%,17.73%)。所有納入指南均未描述指南意見的證據來源、檢索策略及納入排除標準,均未描述證據的評價方法及結果,均未描述推薦意見形成的方法學、過程及結果,均未描述外部專家評審結果。在指南更新方面,納入指南中,7 篇[7, 13, 14, 16-18, 20]為首版,均未描述后續更新步驟;3 篇[12, 15, 19]為同一指南[7]的更新版,但也都未描述更新步驟。
2.3.4 表達的清晰性
該領域細分 3 條,主要考察指南在建議描述上是否明確清晰,是否給出了不同的選擇,以及對重要建議是否著重突出。該領域得分在所有領域中最高,標化得分平均為 66.39%(59.97%,72.81%)。
2.3.5 應用性
該領域細分 4 條,主要考察指南是否可以應用到實際問題中,是否具有可行性。該領域得分較低,標化得分平均為 34.90%(30.83%,38.97%)。
2.3.6 編輯獨立性
該領域細分 2 條,主要考察該指南制訂過程的獨立性,贊助單位是否影響指南內容,指南開發小組成員是否有利益沖突。納入指南均未描述此部分內容,導致得分為 0。
2.3.7 總體評價
納入指南的方法學質量評價得分均不高。在 6 個領域中,僅范圍和目的及表達的清晰性得分較高,其他領域均或多或少地未報告相關條目內容或闡述不明確。
3 討論
指南是針對特定臨床問題為醫生和患者提供建議的臨床決策工具,它將最新和高級別臨床證據歸納為推薦意見,用于制訂醫療標準,提高醫療質量[21]。而使用指南的受益程度取決于指南本身的質量,如果在指南制訂過程中沒有采用合適的方法和嚴謹的策略,制訂的指南可能無法達到最基本的標準[8],甚至對臨床醫生造成誤導,給患者帶去危害和經濟損失。目前國內尚無研究針對房顫診療相關指南進行方法學質量評價,因此,我們采用 AGREEⅡ工具對國內房顫相關指南進行質量評價,以期發現中國房顫診療相關指南存在的方法學問題。此外,為對國內房顫相關指南進行全面分析,我們將納入標準進行了擴大處理,還納入了專家共識。
本研究結果顯示,我國房顫診療相關指南的方法學質量不盡如人意,更多采用專家共識方法而非采用循證方法制訂指南。雖然納入指南在范圍和目的、表達的清晰性兩個領域得分都大于 50%,相對較好;但應用性領域得分僅為 34.90%,需要提升空間巨大;此外,參與人員、嚴謹性和編輯獨立性則存在重要內容的缺失,建議未來制訂相關指南需要根據 AGREE Ⅱ工具條目進行完善和改進。陳耀龍等[22]納入了我國 1993~2010 年發表的 269 篇指南,韋當等[23]納入我國 2011 年發表的 75 篇指南,李楠等[24]納入我國 2012~2013 年發表的 78 篇指南分別進行了方法學質量評價。與以上研究結果相比,本研究顯示中國房顫指南除編輯獨立性這一領域得分較低外,在參與人員、制訂嚴謹性、表達清晰性以及應用性 4 個領域得分均高于上述 3 個研究平均得分。但與國外房顫領域類似指南[9, 10, 25]相比較,我國房顫指南在各領域都還有很大的改進空間,尤其在參與人員、制訂嚴謹性、應用性以及編輯獨立性領域差距最大。
參與人員主要考察指南制訂過程中人員的構成及闡明指南的使用者,一個好的指南制訂小組不僅要包括臨床專家和方法學家,同時還應收集患者在該衛生問題上的意見和偏好。國內大量指南均基于專家共識制訂,大多沒有遵循國際公認的指南制訂方法及系統地使用證據[26]。我國房顫指南也存在類似問題,指南制訂小組成員大都只涵蓋了臨床專家,沒有方法學家參與其中,也未考慮患者的意見和偏好,使得指南整體的嚴謹性不高,指南內容可能與患者意愿沖突,不利于今后推廣使用。并且在缺失方法學家的情況下,沒有按照循證指南制訂的流程,缺乏提出相關臨床問題、系統檢索數據庫收集相關證據、使用合適方法評價證據強度和局限性、形成推薦建議等步驟,也導致了指南的嚴謹性不夠。因此建議今后國內制訂指南時能多吸收方法學家、同行專家、政策開發者、指南目標人群、專業期刊編輯等不同領域的專家和人員,全體制訂小組成員參加相關培訓,在制訂過程中嚴格遵循指南制定規范流程。
制訂的嚴謹性主要考察指南制訂者對方法學的研究、認知和重視程度,包括對證據的檢索、證據選擇標準的描述、推薦意見形成的描述、形成推薦意見時是否考慮了對健康的風險及副作用、推薦意見與證據之間的關系、專家的外部評審和指南更新的步驟。證據推薦分級的評估、制訂與評價系統是 GRADE工作組開發的適用于系統評價、臨床實踐指南和衛生技術評估的分級工具,是當前最權威的證據質量和推薦強度分級的國際標準[27]。它突破了單從研究設計角度考慮證據質量的局限性[28],綜合考慮證據質量、患者及社會的價值觀和偏好等因素,為呈現評價結果和推薦意見提供了一種透明的結構化方法[29],我們建議在今后房顫指南制訂過程中使用 GRADE 系統對證據等級和推薦意見級別進行評價。至于指南更新步驟方面,我國指南平均更新間隔為 5.2 年[30],本研究顯示我國房顫指南更新情況與之相似,建議在指南制訂中就制訂明確的更新計劃,包括更新的時間和方案。
指南中的建議必須要比較不同方案的利弊,不僅需要考慮治療方案的優劣,還需要均衡價格、市場、醫保、醫院資質等現實問題[26],這些問題反映的是指南的應用性。我國房顫指南在應用性這一領域的平均得分僅為 34.90%,指南的推薦意見只局限于討論臨床治療方案的有效性和副作用,沒有考慮到衛生經濟學、醫保政策等問題,導致指南的應用性不強,指南的全國和地區推廣存在障礙。建議未來制訂指南過程中可以在指南正式發布前在小規模醫療環境中預使用指南,以了解指南的應用性。
編輯獨立性主要考察指南制訂過程中的編輯獨立性問題,包括贊助單位的觀點不影響指南的內容和指南闡述并強調了制訂小組成員的利益沖突。利益沖突是指南中最常見的偏倚來源[31],制訂小組必須要在指南中單獨聲明存在的利益沖突。本研究編輯獨立性得分為 0 分,主要原因是本研究所納入的 10 部房顫指南均無關于利益沖突的聲明,這說明未來房顫指南發布應注意補充相關內容,以確保指南的公平性和獨立性。
本研究的局限性:① AGREE Ⅱ工具本身是指南的方法學質量評價工具,故本研究對我國房顫指南進行的評價只局限于指南的方法學質量,不涉及指南內容的真實可靠性和推薦意見的可信度;② 本研究未找到可能與指南制訂過程相關的附件材料,或可能因發表版面要求,指南編寫者未對方法學及其他信息進行闡述,導致本研究評價結果可能低估了國內房顫診療指南的質量。
綜上所述,我國房顫診療指南在制訂的方法學上存在缺陷,距離循證制訂指南有一定差距。在今后指南制訂過程中,制訂小組需要遵循規范的指南制訂流程,尤其注重指南方法學的培訓和研究,規范指南報告格式,制訂出能提高我國房顫診療水平的高質量房顫指南。
心房顫動(房顫)是一種以快速、無序心房電活動為特征的室上性快速性心律失常,具有很高的致殘率和致死率[1]。2016 年我國房顫患者超過 700 萬,房顫發病率較十年前增長了 20 倍,房顫相關性腦卒中發生率增長近 13 倍,尤其在 70 歲以上老年人更加突出[2, 3]。房顫在顯著降低患者心排出量的同時[4],還會增加患者左心房附壁血栓形成以及外周動脈栓塞的風險[5],其不良結局給患者和社會帶來了巨大負擔[6]。為綜合考慮房顫治療的受益與風險,規范房顫治療方案,我國于 2001 年制訂了中國第一部房顫診療相關指南[7]。到目前為止,我國已發布多部房顫診療相關指南,提高了我國臨床醫生對房顫的認識和診治水平,但國內尚無研究對房顫指南本身的方法學質量進行評價。
臨床指南研究與評估系統 AGREE Ⅱ(Appraisal of Guidelines for Research Evaluation Ⅱ)[8]旨在評估指南質量、為新指南的制訂提供方法學策略。依據 AGREE Ⅱ制訂指南可以顯著提高指南的方法學質量,并且讀者也可依據 AGREE Ⅱ評分來客觀評價某部指南的方法學質量及指南推薦等級,進而在一定程度上判斷該指南的可信度[9]。Galvez-Olortegui 等[10]在有關 AGREEⅡ評價房顫指南的研究中指出:房顫相關英文指南在整體質量較高的情況下,仍有部分領域如應用性得分較低(36.1%~93.5%),存在一定改進空間。而目前國內房顫指南和共識仍未按國際標準進行方法學質量評價,也未遵循循證指南的國際報告規范進行報告,導致其國際影響力較弱。本研究利用 AGREEⅡ對我國發布的房顫診療指南進行質量評價,了解目前存在的問題,以期為今后我國相關指南的制訂及更新提供參考。
1 資料與方法
1.1 納入與排除標準
納入標準:我國所有以中文發表的有關心房顫動診療的指南和專家共識。指南的定義由 Field 等[11]給出,即系統評價產生的證據以及對各種備選干預方式進行利弊評價之后提出的最優指導意見的文件。
排除標準:① 指南摘要或解讀;② 非診療指南;③ 國外指南的翻譯版或改編版;④ 心房顫動僅為指南的部分內容。
1.2 文獻檢索策略
計算機檢索 CBM、CNKI、WanFang Data 和 VIP 數據庫,搜集我國發布的心房顫動診療指南,檢索時限均從建庫至 2018 年 2 月。檢索詞包括:房顫、心房顫動、指南和專家共識。以 CBM 為例,其檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 納入指南的基本信息:題目、發表時間、制訂機構、發表雜志、專家數、參考文獻數等;② 指南方法學質量評價的關鍵要素。
1.4 納入研究的質量評價
由 4 名研究者采用 2009 年發布的 AGREEⅡ獨立對納入指南進行質量評價。從 6 個領域(共 23 個條目)和 2 個總體評估條目進行評價,每個條目最高 7 分(滿足該條目要求),最低 1 分(缺失該條目),每個領域的標化得分(以百分比形式表示)=(實際得分?可得最低分)/(可得最高分?可得最低分)×100%。在正式評價前,所有研究者都會進行培訓,針對 1 篇納入指南獨立預評分,后由組內討論協商保證 4 名研究者對每個條目的理解基本一致,具有相同的評價標準。
1.5 統計分析
采用均數(范圍)和頻數對所有納入指南的基本信息進行統計描述。計算組內相關系數評估 4 名研究者對每個條目給分的一致性。
2 結果
2.1 文獻檢索流程及結果
初檢共獲得相關文獻 2 668 篇,經逐層篩選,最終納入 10 部指南或共識[7, 12-20]。文獻檢索流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CBM(
2.2 納入指南的基本特征
本研究納入指南的發表時間從 2001 年到 2015 年。其中 7 部[7, 13, 14, 16-18, 20]為首版,3 部[12, 15, 19]為 1 部指南[7]的更新。納入指南中,7 部[7, 12, 13, 15, 16, 18, 19]由中華醫學會各分會牽頭制訂,1 部[17]由藥物臨床應用專家組牽頭制訂,1 部[20]由國家衛生和計劃生育委員會牽頭制訂。其中 9 部指南[7, 12, 13, 15-20]參考文獻數為 29~551 條,參與制訂的專家人數為 14~68 人。其中 5 部[7, 12, 13, 18, 20]指南發表于《中華心律失常學雜志》,2 部[15, 19]發表于《中國心臟起搏與心電生理雜志》,2 部[16, 17]發表于《中華內科雜志》。剩余 1 部指南[14]未提供制訂機構、參考文獻及制訂專家信息,發表于《中國醫刊》。納入指南的基本特征見表 1。

2.3 AGREE Ⅱ 評價結果
不同研究者評價結果的組間相關系數為0.954[95%CI(0.944,0.963)],一致性較好。納入指南在 6 個領域中的最終標化得分見表 2。

2.3.1 范圍和目的
該領域細分 3 條,主要考察指南是否清晰明了地闡述了該指南的總目的、涵蓋的衛生問題和適用人群、臨床醫生或其他指南需求者能否根據遇到的衛生問題迅速獲取到所需指南。在 6 個領域中,該領域的得分較高,標化得分平均為 54.17%(43.54%,64.80%)。
2.3.2 參與人員
該領域細分 3 條,主要考察指南開發小組的構成、收集目標人群要求和規定指南使用者的情況。該領域要求指南開發小組涵蓋所有相關人員,包括臨床醫生、方法學家、贊助者等,并詳細闡述每位成員的學科、機構、位置等信息。該領域的標化得分平均為 18.89%(12.48%,25.30%)。所有納入指南在該領域得分均較低,相關內容未進行報告,有些雖報告但闡述也不明確。
2.3.3 制訂的嚴謹性
該領域細分 8 條,是評價指南質量的重要內容,主要考察指南制訂過程中各過程的嚴謹性,包括證據的產生、評價,推薦建議的形成方法,建議和證據的聯系強度,是否有專家評審等。納入指南在該領域的得分都很低,標化得分平均為 15.89%(14.04%,17.73%)。所有納入指南均未描述指南意見的證據來源、檢索策略及納入排除標準,均未描述證據的評價方法及結果,均未描述推薦意見形成的方法學、過程及結果,均未描述外部專家評審結果。在指南更新方面,納入指南中,7 篇[7, 13, 14, 16-18, 20]為首版,均未描述后續更新步驟;3 篇[12, 15, 19]為同一指南[7]的更新版,但也都未描述更新步驟。
2.3.4 表達的清晰性
該領域細分 3 條,主要考察指南在建議描述上是否明確清晰,是否給出了不同的選擇,以及對重要建議是否著重突出。該領域得分在所有領域中最高,標化得分平均為 66.39%(59.97%,72.81%)。
2.3.5 應用性
該領域細分 4 條,主要考察指南是否可以應用到實際問題中,是否具有可行性。該領域得分較低,標化得分平均為 34.90%(30.83%,38.97%)。
2.3.6 編輯獨立性
該領域細分 2 條,主要考察該指南制訂過程的獨立性,贊助單位是否影響指南內容,指南開發小組成員是否有利益沖突。納入指南均未描述此部分內容,導致得分為 0。
2.3.7 總體評價
納入指南的方法學質量評價得分均不高。在 6 個領域中,僅范圍和目的及表達的清晰性得分較高,其他領域均或多或少地未報告相關條目內容或闡述不明確。
3 討論
指南是針對特定臨床問題為醫生和患者提供建議的臨床決策工具,它將最新和高級別臨床證據歸納為推薦意見,用于制訂醫療標準,提高醫療質量[21]。而使用指南的受益程度取決于指南本身的質量,如果在指南制訂過程中沒有采用合適的方法和嚴謹的策略,制訂的指南可能無法達到最基本的標準[8],甚至對臨床醫生造成誤導,給患者帶去危害和經濟損失。目前國內尚無研究針對房顫診療相關指南進行方法學質量評價,因此,我們采用 AGREEⅡ工具對國內房顫相關指南進行質量評價,以期發現中國房顫診療相關指南存在的方法學問題。此外,為對國內房顫相關指南進行全面分析,我們將納入標準進行了擴大處理,還納入了專家共識。
本研究結果顯示,我國房顫診療相關指南的方法學質量不盡如人意,更多采用專家共識方法而非采用循證方法制訂指南。雖然納入指南在范圍和目的、表達的清晰性兩個領域得分都大于 50%,相對較好;但應用性領域得分僅為 34.90%,需要提升空間巨大;此外,參與人員、嚴謹性和編輯獨立性則存在重要內容的缺失,建議未來制訂相關指南需要根據 AGREE Ⅱ工具條目進行完善和改進。陳耀龍等[22]納入了我國 1993~2010 年發表的 269 篇指南,韋當等[23]納入我國 2011 年發表的 75 篇指南,李楠等[24]納入我國 2012~2013 年發表的 78 篇指南分別進行了方法學質量評價。與以上研究結果相比,本研究顯示中國房顫指南除編輯獨立性這一領域得分較低外,在參與人員、制訂嚴謹性、表達清晰性以及應用性 4 個領域得分均高于上述 3 個研究平均得分。但與國外房顫領域類似指南[9, 10, 25]相比較,我國房顫指南在各領域都還有很大的改進空間,尤其在參與人員、制訂嚴謹性、應用性以及編輯獨立性領域差距最大。
參與人員主要考察指南制訂過程中人員的構成及闡明指南的使用者,一個好的指南制訂小組不僅要包括臨床專家和方法學家,同時還應收集患者在該衛生問題上的意見和偏好。國內大量指南均基于專家共識制訂,大多沒有遵循國際公認的指南制訂方法及系統地使用證據[26]。我國房顫指南也存在類似問題,指南制訂小組成員大都只涵蓋了臨床專家,沒有方法學家參與其中,也未考慮患者的意見和偏好,使得指南整體的嚴謹性不高,指南內容可能與患者意愿沖突,不利于今后推廣使用。并且在缺失方法學家的情況下,沒有按照循證指南制訂的流程,缺乏提出相關臨床問題、系統檢索數據庫收集相關證據、使用合適方法評價證據強度和局限性、形成推薦建議等步驟,也導致了指南的嚴謹性不夠。因此建議今后國內制訂指南時能多吸收方法學家、同行專家、政策開發者、指南目標人群、專業期刊編輯等不同領域的專家和人員,全體制訂小組成員參加相關培訓,在制訂過程中嚴格遵循指南制定規范流程。
制訂的嚴謹性主要考察指南制訂者對方法學的研究、認知和重視程度,包括對證據的檢索、證據選擇標準的描述、推薦意見形成的描述、形成推薦意見時是否考慮了對健康的風險及副作用、推薦意見與證據之間的關系、專家的外部評審和指南更新的步驟。證據推薦分級的評估、制訂與評價系統是 GRADE工作組開發的適用于系統評價、臨床實踐指南和衛生技術評估的分級工具,是當前最權威的證據質量和推薦強度分級的國際標準[27]。它突破了單從研究設計角度考慮證據質量的局限性[28],綜合考慮證據質量、患者及社會的價值觀和偏好等因素,為呈現評價結果和推薦意見提供了一種透明的結構化方法[29],我們建議在今后房顫指南制訂過程中使用 GRADE 系統對證據等級和推薦意見級別進行評價。至于指南更新步驟方面,我國指南平均更新間隔為 5.2 年[30],本研究顯示我國房顫指南更新情況與之相似,建議在指南制訂中就制訂明確的更新計劃,包括更新的時間和方案。
指南中的建議必須要比較不同方案的利弊,不僅需要考慮治療方案的優劣,還需要均衡價格、市場、醫保、醫院資質等現實問題[26],這些問題反映的是指南的應用性。我國房顫指南在應用性這一領域的平均得分僅為 34.90%,指南的推薦意見只局限于討論臨床治療方案的有效性和副作用,沒有考慮到衛生經濟學、醫保政策等問題,導致指南的應用性不強,指南的全國和地區推廣存在障礙。建議未來制訂指南過程中可以在指南正式發布前在小規模醫療環境中預使用指南,以了解指南的應用性。
編輯獨立性主要考察指南制訂過程中的編輯獨立性問題,包括贊助單位的觀點不影響指南的內容和指南闡述并強調了制訂小組成員的利益沖突。利益沖突是指南中最常見的偏倚來源[31],制訂小組必須要在指南中單獨聲明存在的利益沖突。本研究編輯獨立性得分為 0 分,主要原因是本研究所納入的 10 部房顫指南均無關于利益沖突的聲明,這說明未來房顫指南發布應注意補充相關內容,以確保指南的公平性和獨立性。
本研究的局限性:① AGREE Ⅱ工具本身是指南的方法學質量評價工具,故本研究對我國房顫指南進行的評價只局限于指南的方法學質量,不涉及指南內容的真實可靠性和推薦意見的可信度;② 本研究未找到可能與指南制訂過程相關的附件材料,或可能因發表版面要求,指南編寫者未對方法學及其他信息進行闡述,導致本研究評價結果可能低估了國內房顫診療指南的質量。
綜上所述,我國房顫診療指南在制訂的方法學上存在缺陷,距離循證制訂指南有一定差距。在今后指南制訂過程中,制訂小組需要遵循規范的指南制訂流程,尤其注重指南方法學的培訓和研究,規范指南報告格式,制訂出能提高我國房顫診療水平的高質量房顫指南。