引用本文: 崔立軍, 鮑勇, 陳昕, 縱亞, 王樸, 謝青. 中國康復臨床實踐指南的質量評價. 中國循證醫學雜志, 2019, 19(6): 723-728. doi: 10.7507/1672-2531.201806079 復制
隨著生活水平的日益提高,人們對健康和醫學模式有了更新認識,對醫療服務也有了更高要求,既要求盡快治愈疾病,又要求最大程度地恢復功能及高質量、正常的生活。康復醫學不僅提高了疾病的治愈率,縮短了病程,而且使患者更快、更好地回歸到家庭、工作、學習和社會之中,在臨床實踐中日益受到重視。康復醫學是一門年輕學科,20 世紀 80 年代后才開始蓬勃發展,并逐漸向循證實踐跨越[1]。近年來國內發表的以“康復指南或運動指南”為標題的指南日益增多,但是指南本身的制訂受到諸多因素影響。因此,對發表指南進行質量評價非常重要,本研究對我國發表的康復醫學領域的臨床實踐指南進行評價[2],為規范制訂我國的康復臨床實踐指南提供參考。
1 資料與方法
1.1 納入和排除標準
1.1.1 納入標準
納入在國內發表的康復醫學臨床實踐指南,發布語言為中文。如同一指南發表不同版本或有更新,則納入最新最全版本。
1.1.2 排除標準
① 直接翻譯的國外指南;② 指南解讀、專家共識;③ 僅包含簡介、目錄、摘要等非完整指南。
1.2 文獻檢索策略
計算機檢索 CBM、VIP、CNKI、WanFang Data 和醫脈通數據庫,搜集國內發表的康復醫學指南,檢索時限為 1979 年 1 月至 2018 年 5 月。中文檢索詞包括:康復、運動、指南、規范。追溯納入指南的參考文獻以擴展納入研究范圍。以 CNKI 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 4 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與另一人協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 納入指南的基本信息:題目、發表時間、制訂機構、發表雜志、專家數、參考文獻數等;② 指南質量評價的關鍵要素。
1.4 納入指南的質量評價
由 4 名評價者采用 AGREE Ⅱ工具獨立對納入指南進行質量評價。該評價工具由 AGREE 協作網于 2003 年制訂并發布[3]。該體系包含 6 個領域共 23 個條目,分別為范圍和目的、參與人員、制訂的嚴謹性、表達的明晰性、應用性和編輯獨立性。每個條目得分 1~7 分,1 分表示很不同意,7 分表示很同意。每個領域的標化得分(以百分比形式表示)=(實際得分-可得最低分)/(可得最高分-可得最低分)×100%。最后根據 6 個領域的標準化總分,對指南進行推薦等級分級:A 級(推薦),6 個領域標準化評分均≥60%;B 級(修改完善后推薦),標準化評分≥30% 的領域數≥3 個,但有領域得分<60%;C 級(不推薦),標準化評分<30% 的領域數≥3 個。在正式評價前,對所有研究者進行培訓,對 1 篇指南獨立預評分,然后由組內討論協商保證 4 名評價者對每個條目的理解基本一致,具有相同的評價標準。
1.5 統計分析
采用均數(范圍)和頻數對所有納入指南的基本信息進行描述。
2 結果
2.1 文獻檢索流程及結果
初檢共獲得相關文獻 2 977 篇,經逐層篩選,最終篩選納入指南 11 篇[4-24]。文獻篩選流程及結果見圖 1。

2.2 納入指南的基本特征
納入的 11 篇指南分別涉及診療規范[4]、地震外傷類疾病[5]、兒科疾病[6]、肌肉骨關節系統疾病[7]、內科系統疾病[8]、燒傷[9]和神經系統疾病[10-24]。其中 1 篇[6]由原國家衛生部牽頭制訂,其余 10 篇[4, 5, 7-24]由各級專業學會制訂,且其中有 4 篇[8, 9, 10, 24]由非康復專業學會牽頭制訂。有 8 篇[5, 6, 9-24]發表在正式期刊上,其中 1 篇[13-23]為連載形式發表,3 篇[4, 7, 8]為非期刊發表。最早的指南制訂于 2005 年[4],最近一篇制訂于 2017 年[24]。納入指南的基本特征見表 1。

2.3 納入指南的質量評價結果
納入 11 個指南 6 個領域 23 個條目的平均得分分別為[4-24]:65.3%、28.0%、9.3%、42.1%、6.3% 和 4.0%,總體質量較低。其中,范圍和目的得分最高,平均分≥60%;表達的清晰性得分次之,平均分≥30%;參與人員再次之;制訂的嚴謹性、應用性和編輯獨立性得分均較低。A 級推薦指南 0 篇,B 級推薦指南 2 篇[8, 13-23],C 級不推薦指南 9 篇[4-7, 9-12, 24](表 2)。

2.3.1 范圍和目的
包括 3 個條目,明確闡述指南的總目的、指南所涵蓋的衛生問題和指南所要應用的人群。納入指南該領域平均得分率 65.28%,3 篇[7, 9, 13-23]低于 60%,但高于 30%,其余 8 篇均高于平均分。
2.3.2 參與人員
包括 3 個條目,反映指南在多大程度上能代表它的使用者的觀點,如指南開發小組包括所有相關專業的人員、收集目標人群(患者、公眾等)的觀點和選擇意愿及明確規定指南的使用者。納入指南該領域平均得分率為 28.02%,7 篇高于平均分[4, 8, 10-24],且高于 30%,但均低于 60%。
2.3.3 嚴謹性
包括 8 個條目,反映開發的方法學過程,從證據的檢索過程、納入和排除標準、證據的評價、推薦建議的形成、到指南的外部評審和更新等方面。納入指南該領域平均得分率 9.34%,3 篇高于平均分[8, 10, 13-23],僅 1 篇高于 30%[8],但均低于 60%,其他均低于 30%,4 篇未提及任何與指南證據相關的內容[5-7, 9],得分 0 分。最高分為中華醫學會糖尿病學分會牽頭制訂的中國糖尿病運動治療指南[8],得分 46.4%。
2.3.4 清晰性
包括 3 個條目,主要與指南的語言和格式相關,包括推薦建議明確、不含糊,明確列出不同的選擇或衛生問題,以及容易識別重要的推薦建議。納入指南該領域平均得分率 42.05%,5 篇高于平均分[8, 10, 11, 13-24],其中 2 篇高于 30%[11, 24],但低于 60%。
2.3.5 應用性
包括 4 個條目,涉及應用指南時可能遇到的組織、行為和費用問題,包括描述指南應用時的促進和阻礙因素、提供應用推薦建議的意見和/或工具、考慮了推薦建議應用時潛在的相關資源,以及提供了監督和/或審計標準。納入指南該領域平均得分率 6.35%,僅 2 篇高于平均分[8, 12],但均低于 30%,3 篇為 0 分[5, 6, 13-23]。
2.3.6 編輯獨立性
包括 2 個條目,涉及推薦建議的獨立性和記載指南制訂組中可能存在的利益沖突,包括贊助單位的觀點不影響指南的內容及指南開發小組成員的利益沖突要記載并公布。僅《中國腦性癱瘓康復指南》在指南分集介紹的第一部中指出了利益沖突情況[13],其余指南在所有納入指南均未提及該部分內容,均為 0 分。
3 討論
康復醫學雖然是年輕學科,但其在臨床實踐中的重要性越來越凸顯。絕大多數疾病并不能被治愈,或多或少、或長或短存在功能障礙,而康復醫學能針對這些功能障礙,使患者更快、更好地恢復功能。指南是可幫助臨床醫生和患者做出恰當決策的臨床實踐的指導性文件,可縮小當前最佳證據與臨床實踐之間差距,高質量的臨床實踐指南能夠提高臨床工作者的科學決策能力,保護患者安全。而制訂質量低的臨床指南則給患者帶來傷害,同時浪費有限醫療資源[25]。因此指南在發布時要嚴格按照國際規范指南制訂流程和標準制訂,同時對發表后的指南進行嚴格的評估也非常重要。
本研究檢索發現以“中國康復指南”為標題的文獻中,多數并非真正意義上的臨床實踐指南,只是臨床經驗的總結和分享,也未曾提及任何推薦證據等級和文獻納入標準。從指南評價結果可看出,國內康復指南在編輯獨立性方面得分最低,平均分為 4.0%,絕大多數未對編輯獨立性條目進行描述,有研究顯示高達 88% 的國內指南在正文中并未報告其是否存在利益沖突[26],這可能與藥廠和醫療器械廠家經費資助指南制訂有關[27]。應用性平均分僅 6.3%,在“應用推薦建議的意見和/或工具”這一條目上,小部分指南給出了建議,如圖表、手冊等;在“考慮了推薦建議應用時潛在的相關資源”這一條目上僅 1 篇提及[12]。所有指南都未明確提及條目“指南應用時的促進和阻礙因素”。指南發表后只有應用于臨床,才能真正規范醫療行為,提高醫療質量。而目前指南應用性評分均<30%,提示大多數指南開發的機構或學術組織忽略了指南的實施和應用,最終導致這些指南并不能很好地服務于臨床。
本研究納入指南的嚴謹性較差,平均分僅 9.34%,僅有 1 篇指南評分>30%,但<60%。AGREE Ⅱ用戶指南要求指南開發者要清楚報告證據檢索方法和選擇標準,并盡可能詳細,以便于重復[28]。僅有 2 篇[8, 11]提及采用系統方法檢索數據和清楚描述納入證據的標準。由于臨床證據的不斷更新和補充,有研究提示每 3 年就需對指南進行 1 次修訂。有更新時間說明的指南推薦每 5 年更新一次[29]。而本文納入的 11 篇指南均未提及指南更新步驟,僅 1 篇[13]指南提及了更新時間,2 篇[7, 12]指南為原有指南[30, 31]的更新版。另外所有指南發布前都未曾提及經過外部專家評審,同時也僅有 3 篇[4, 8, 12]考慮了對健康的益處、副作用和危險。在參與人員方面,平均得分率 28.0%,所有指南都未收集目標人群(患者、公眾等)的觀點和選擇意愿;同時有 3 篇[6, 7, 9]指南未明確提及指南的使用者。而部分指南只是臨床經驗的總結和分析,未提及指南開發過程中都有哪些人員參與,導致此項平均分低。在表達的清晰性方面平均得分率為 42.1%,部分指南只是臨床經驗的總結和分析,因此推薦建議沒有突出顯示和總結,導致這些指南該項得分不高。得分最高的為范圍和目的,僅 3 篇[7, 9, 13-23]指南評分低于 60%。絕大多數指南發布時都提及了各自指南的制訂目的和應用人群,以及所涵蓋的衛生問題。但 3 個條目中,得分最低的多為條目 3“明確闡述指南所要應用的人群(患者、公眾等)”。
AGREE 由加拿大等 13 個國家的研究人員發布,2005 年我國學者將其正式引入中國[32]。2009 年,為進一步提高 AGREE 工具的可靠性和有效性,對第一版進行了修訂,AGREE Ⅱ領域和條目數量沒有變化,但其內容更加具體和明確。AGREE Ⅱ評定耗時較長,平均需要 50 分鐘,且其條目評分都是 1~7 分,權重相同,但實際上每個條目的重要性不同;還有學者提出 AGREE Ⅱ可能并不完全適用于評價中國開發的指南[33]。因此,在 AGREE 的基礎上,我國研究者制定了本土化的指南評價工具[34, 35],但它們的評價效能如何還需要在今后的研究中不斷進行修訂和驗證。目前 AGREE Ⅱ仍為國際公認的指南評價金標準[36]。
我國指南較少采用系統評價證據支持推薦意見[27],質量整體偏低,AGREE Ⅱ平均分低于歐美指南[26, 37, 38]。我國指南的平均參考文獻為 36 篇/部,而歐美指南平均參考文獻近 400 篇/部[39]。本文納入的指南最終有 2 篇[8, 13-23]推薦建議為 B 級,也是參考文獻數量最多的 2 篇。
如何制定一部高質量的指南是指南制定者需要重點考慮的問題。我國研究者可以通過以下方法制訂指南:① 直接采用或恰當改編國際上現有的高質量指南。制訂新的指南需要投入大量的時間、經費和人力資源,而我國的指南質量又比較低,可考慮直接采用或恰當改變國際上現有的高質量指南;② 制訂新的指南。由于國情不同,技術手段也有不同,且有些國外的指南質量也不高,這就需要我們制訂新的指南。在新的指南制訂過程中,建議:對 AGREE Ⅱ工具進行系統學習和研究,尤其要研讀指南評價中的嚴謹性、應用性以及獨立性方面;全面、系統地檢索國內外已有的相關指南,并對其進行方法學質量評價;嚴格按照指南制訂的方法和流程,中華醫學會 2016 年就如何制訂和修訂中華醫學會指南發表了相關的指導原則[40];采用循證的方法制訂指南,主要包括提出相關臨床問題、系統檢索文獻和使用正確的方法對證據的級別進行評分,再根據證據的級別和強度提出推薦意見;在指南的制訂和實施領域,均應邀請方法學專家參與,制定和報告指南時可參照 2017 年在 Annals of Internal Medicine 上發表的國際指南報告規范[41],寫出嚴謹規范的臨床實踐指南;注重指南的轉化,特別是推動指南在基層的轉化和針對患者的轉化。通過制訂和實施大量高質量的臨床指南,可提高基層醫院的診療水平。另外,我們的居民和患者常常不知如何獲取可靠的醫學知識,容易受到虛假醫藥信息的欺騙,因此為患者提供基于指南的高質量科普信息至關重要,與此同時也可以促進指南的實施。
本研究的局限性:① 本研究僅檢索了中文文獻,且只納入了公開發表的文獻,未曾檢索相關書籍;② 在評價工具上,AGREE Ⅱ各項得分無權重,指南的推薦等級僅依據達到標準的領域個數,可能存在推薦結果與指南質量不符的情況。
綜上所述,我國康復醫學相關指南在報告格式上常常欠規范,缺少細節的描述,導致指南總體質量較低。本研究共納入 11 篇中國康復醫學相關指南,最高分為《中國糖尿病運動治療指南》,該指南并非康復醫學相關學會牽頭,而是由中華醫學會糖尿病學分會牽頭制訂。其次為《中國腦性癱瘓康復指南(2015)》,是由康復醫學學會牽頭制定。但兩篇指南均為 B 級推薦,即修改完善后推薦。在未來的工作中,建議制訂指南時嚴格按照指南制訂原則及報告規范。期待康復醫學工作者能夠根據指南制定的方法學和規范性報告,制訂高水平的、符合我國國情的臨床實踐指南。
隨著生活水平的日益提高,人們對健康和醫學模式有了更新認識,對醫療服務也有了更高要求,既要求盡快治愈疾病,又要求最大程度地恢復功能及高質量、正常的生活。康復醫學不僅提高了疾病的治愈率,縮短了病程,而且使患者更快、更好地回歸到家庭、工作、學習和社會之中,在臨床實踐中日益受到重視。康復醫學是一門年輕學科,20 世紀 80 年代后才開始蓬勃發展,并逐漸向循證實踐跨越[1]。近年來國內發表的以“康復指南或運動指南”為標題的指南日益增多,但是指南本身的制訂受到諸多因素影響。因此,對發表指南進行質量評價非常重要,本研究對我國發表的康復醫學領域的臨床實踐指南進行評價[2],為規范制訂我國的康復臨床實踐指南提供參考。
1 資料與方法
1.1 納入和排除標準
1.1.1 納入標準
納入在國內發表的康復醫學臨床實踐指南,發布語言為中文。如同一指南發表不同版本或有更新,則納入最新最全版本。
1.1.2 排除標準
① 直接翻譯的國外指南;② 指南解讀、專家共識;③ 僅包含簡介、目錄、摘要等非完整指南。
1.2 文獻檢索策略
計算機檢索 CBM、VIP、CNKI、WanFang Data 和醫脈通數據庫,搜集國內發表的康復醫學指南,檢索時限為 1979 年 1 月至 2018 年 5 月。中文檢索詞包括:康復、運動、指南、規范。追溯納入指南的參考文獻以擴展納入研究范圍。以 CNKI 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 4 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與另一人協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:① 納入指南的基本信息:題目、發表時間、制訂機構、發表雜志、專家數、參考文獻數等;② 指南質量評價的關鍵要素。
1.4 納入指南的質量評價
由 4 名評價者采用 AGREE Ⅱ工具獨立對納入指南進行質量評價。該評價工具由 AGREE 協作網于 2003 年制訂并發布[3]。該體系包含 6 個領域共 23 個條目,分別為范圍和目的、參與人員、制訂的嚴謹性、表達的明晰性、應用性和編輯獨立性。每個條目得分 1~7 分,1 分表示很不同意,7 分表示很同意。每個領域的標化得分(以百分比形式表示)=(實際得分-可得最低分)/(可得最高分-可得最低分)×100%。最后根據 6 個領域的標準化總分,對指南進行推薦等級分級:A 級(推薦),6 個領域標準化評分均≥60%;B 級(修改完善后推薦),標準化評分≥30% 的領域數≥3 個,但有領域得分<60%;C 級(不推薦),標準化評分<30% 的領域數≥3 個。在正式評價前,對所有研究者進行培訓,對 1 篇指南獨立預評分,然后由組內討論協商保證 4 名評價者對每個條目的理解基本一致,具有相同的評價標準。
1.5 統計分析
采用均數(范圍)和頻數對所有納入指南的基本信息進行描述。
2 結果
2.1 文獻檢索流程及結果
初檢共獲得相關文獻 2 977 篇,經逐層篩選,最終篩選納入指南 11 篇[4-24]。文獻篩選流程及結果見圖 1。

2.2 納入指南的基本特征
納入的 11 篇指南分別涉及診療規范[4]、地震外傷類疾病[5]、兒科疾病[6]、肌肉骨關節系統疾病[7]、內科系統疾病[8]、燒傷[9]和神經系統疾病[10-24]。其中 1 篇[6]由原國家衛生部牽頭制訂,其余 10 篇[4, 5, 7-24]由各級專業學會制訂,且其中有 4 篇[8, 9, 10, 24]由非康復專業學會牽頭制訂。有 8 篇[5, 6, 9-24]發表在正式期刊上,其中 1 篇[13-23]為連載形式發表,3 篇[4, 7, 8]為非期刊發表。最早的指南制訂于 2005 年[4],最近一篇制訂于 2017 年[24]。納入指南的基本特征見表 1。

2.3 納入指南的質量評價結果
納入 11 個指南 6 個領域 23 個條目的平均得分分別為[4-24]:65.3%、28.0%、9.3%、42.1%、6.3% 和 4.0%,總體質量較低。其中,范圍和目的得分最高,平均分≥60%;表達的清晰性得分次之,平均分≥30%;參與人員再次之;制訂的嚴謹性、應用性和編輯獨立性得分均較低。A 級推薦指南 0 篇,B 級推薦指南 2 篇[8, 13-23],C 級不推薦指南 9 篇[4-7, 9-12, 24](表 2)。

2.3.1 范圍和目的
包括 3 個條目,明確闡述指南的總目的、指南所涵蓋的衛生問題和指南所要應用的人群。納入指南該領域平均得分率 65.28%,3 篇[7, 9, 13-23]低于 60%,但高于 30%,其余 8 篇均高于平均分。
2.3.2 參與人員
包括 3 個條目,反映指南在多大程度上能代表它的使用者的觀點,如指南開發小組包括所有相關專業的人員、收集目標人群(患者、公眾等)的觀點和選擇意愿及明確規定指南的使用者。納入指南該領域平均得分率為 28.02%,7 篇高于平均分[4, 8, 10-24],且高于 30%,但均低于 60%。
2.3.3 嚴謹性
包括 8 個條目,反映開發的方法學過程,從證據的檢索過程、納入和排除標準、證據的評價、推薦建議的形成、到指南的外部評審和更新等方面。納入指南該領域平均得分率 9.34%,3 篇高于平均分[8, 10, 13-23],僅 1 篇高于 30%[8],但均低于 60%,其他均低于 30%,4 篇未提及任何與指南證據相關的內容[5-7, 9],得分 0 分。最高分為中華醫學會糖尿病學分會牽頭制訂的中國糖尿病運動治療指南[8],得分 46.4%。
2.3.4 清晰性
包括 3 個條目,主要與指南的語言和格式相關,包括推薦建議明確、不含糊,明確列出不同的選擇或衛生問題,以及容易識別重要的推薦建議。納入指南該領域平均得分率 42.05%,5 篇高于平均分[8, 10, 11, 13-24],其中 2 篇高于 30%[11, 24],但低于 60%。
2.3.5 應用性
包括 4 個條目,涉及應用指南時可能遇到的組織、行為和費用問題,包括描述指南應用時的促進和阻礙因素、提供應用推薦建議的意見和/或工具、考慮了推薦建議應用時潛在的相關資源,以及提供了監督和/或審計標準。納入指南該領域平均得分率 6.35%,僅 2 篇高于平均分[8, 12],但均低于 30%,3 篇為 0 分[5, 6, 13-23]。
2.3.6 編輯獨立性
包括 2 個條目,涉及推薦建議的獨立性和記載指南制訂組中可能存在的利益沖突,包括贊助單位的觀點不影響指南的內容及指南開發小組成員的利益沖突要記載并公布。僅《中國腦性癱瘓康復指南》在指南分集介紹的第一部中指出了利益沖突情況[13],其余指南在所有納入指南均未提及該部分內容,均為 0 分。
3 討論
康復醫學雖然是年輕學科,但其在臨床實踐中的重要性越來越凸顯。絕大多數疾病并不能被治愈,或多或少、或長或短存在功能障礙,而康復醫學能針對這些功能障礙,使患者更快、更好地恢復功能。指南是可幫助臨床醫生和患者做出恰當決策的臨床實踐的指導性文件,可縮小當前最佳證據與臨床實踐之間差距,高質量的臨床實踐指南能夠提高臨床工作者的科學決策能力,保護患者安全。而制訂質量低的臨床指南則給患者帶來傷害,同時浪費有限醫療資源[25]。因此指南在發布時要嚴格按照國際規范指南制訂流程和標準制訂,同時對發表后的指南進行嚴格的評估也非常重要。
本研究檢索發現以“中國康復指南”為標題的文獻中,多數并非真正意義上的臨床實踐指南,只是臨床經驗的總結和分享,也未曾提及任何推薦證據等級和文獻納入標準。從指南評價結果可看出,國內康復指南在編輯獨立性方面得分最低,平均分為 4.0%,絕大多數未對編輯獨立性條目進行描述,有研究顯示高達 88% 的國內指南在正文中并未報告其是否存在利益沖突[26],這可能與藥廠和醫療器械廠家經費資助指南制訂有關[27]。應用性平均分僅 6.3%,在“應用推薦建議的意見和/或工具”這一條目上,小部分指南給出了建議,如圖表、手冊等;在“考慮了推薦建議應用時潛在的相關資源”這一條目上僅 1 篇提及[12]。所有指南都未明確提及條目“指南應用時的促進和阻礙因素”。指南發表后只有應用于臨床,才能真正規范醫療行為,提高醫療質量。而目前指南應用性評分均<30%,提示大多數指南開發的機構或學術組織忽略了指南的實施和應用,最終導致這些指南并不能很好地服務于臨床。
本研究納入指南的嚴謹性較差,平均分僅 9.34%,僅有 1 篇指南評分>30%,但<60%。AGREE Ⅱ用戶指南要求指南開發者要清楚報告證據檢索方法和選擇標準,并盡可能詳細,以便于重復[28]。僅有 2 篇[8, 11]提及采用系統方法檢索數據和清楚描述納入證據的標準。由于臨床證據的不斷更新和補充,有研究提示每 3 年就需對指南進行 1 次修訂。有更新時間說明的指南推薦每 5 年更新一次[29]。而本文納入的 11 篇指南均未提及指南更新步驟,僅 1 篇[13]指南提及了更新時間,2 篇[7, 12]指南為原有指南[30, 31]的更新版。另外所有指南發布前都未曾提及經過外部專家評審,同時也僅有 3 篇[4, 8, 12]考慮了對健康的益處、副作用和危險。在參與人員方面,平均得分率 28.0%,所有指南都未收集目標人群(患者、公眾等)的觀點和選擇意愿;同時有 3 篇[6, 7, 9]指南未明確提及指南的使用者。而部分指南只是臨床經驗的總結和分析,未提及指南開發過程中都有哪些人員參與,導致此項平均分低。在表達的清晰性方面平均得分率為 42.1%,部分指南只是臨床經驗的總結和分析,因此推薦建議沒有突出顯示和總結,導致這些指南該項得分不高。得分最高的為范圍和目的,僅 3 篇[7, 9, 13-23]指南評分低于 60%。絕大多數指南發布時都提及了各自指南的制訂目的和應用人群,以及所涵蓋的衛生問題。但 3 個條目中,得分最低的多為條目 3“明確闡述指南所要應用的人群(患者、公眾等)”。
AGREE 由加拿大等 13 個國家的研究人員發布,2005 年我國學者將其正式引入中國[32]。2009 年,為進一步提高 AGREE 工具的可靠性和有效性,對第一版進行了修訂,AGREE Ⅱ領域和條目數量沒有變化,但其內容更加具體和明確。AGREE Ⅱ評定耗時較長,平均需要 50 分鐘,且其條目評分都是 1~7 分,權重相同,但實際上每個條目的重要性不同;還有學者提出 AGREE Ⅱ可能并不完全適用于評價中國開發的指南[33]。因此,在 AGREE 的基礎上,我國研究者制定了本土化的指南評價工具[34, 35],但它們的評價效能如何還需要在今后的研究中不斷進行修訂和驗證。目前 AGREE Ⅱ仍為國際公認的指南評價金標準[36]。
我國指南較少采用系統評價證據支持推薦意見[27],質量整體偏低,AGREE Ⅱ平均分低于歐美指南[26, 37, 38]。我國指南的平均參考文獻為 36 篇/部,而歐美指南平均參考文獻近 400 篇/部[39]。本文納入的指南最終有 2 篇[8, 13-23]推薦建議為 B 級,也是參考文獻數量最多的 2 篇。
如何制定一部高質量的指南是指南制定者需要重點考慮的問題。我國研究者可以通過以下方法制訂指南:① 直接采用或恰當改編國際上現有的高質量指南。制訂新的指南需要投入大量的時間、經費和人力資源,而我國的指南質量又比較低,可考慮直接采用或恰當改變國際上現有的高質量指南;② 制訂新的指南。由于國情不同,技術手段也有不同,且有些國外的指南質量也不高,這就需要我們制訂新的指南。在新的指南制訂過程中,建議:對 AGREE Ⅱ工具進行系統學習和研究,尤其要研讀指南評價中的嚴謹性、應用性以及獨立性方面;全面、系統地檢索國內外已有的相關指南,并對其進行方法學質量評價;嚴格按照指南制訂的方法和流程,中華醫學會 2016 年就如何制訂和修訂中華醫學會指南發表了相關的指導原則[40];采用循證的方法制訂指南,主要包括提出相關臨床問題、系統檢索文獻和使用正確的方法對證據的級別進行評分,再根據證據的級別和強度提出推薦意見;在指南的制訂和實施領域,均應邀請方法學專家參與,制定和報告指南時可參照 2017 年在 Annals of Internal Medicine 上發表的國際指南報告規范[41],寫出嚴謹規范的臨床實踐指南;注重指南的轉化,特別是推動指南在基層的轉化和針對患者的轉化。通過制訂和實施大量高質量的臨床指南,可提高基層醫院的診療水平。另外,我們的居民和患者常常不知如何獲取可靠的醫學知識,容易受到虛假醫藥信息的欺騙,因此為患者提供基于指南的高質量科普信息至關重要,與此同時也可以促進指南的實施。
本研究的局限性:① 本研究僅檢索了中文文獻,且只納入了公開發表的文獻,未曾檢索相關書籍;② 在評價工具上,AGREE Ⅱ各項得分無權重,指南的推薦等級僅依據達到標準的領域個數,可能存在推薦結果與指南質量不符的情況。
綜上所述,我國康復醫學相關指南在報告格式上常常欠規范,缺少細節的描述,導致指南總體質量較低。本研究共納入 11 篇中國康復醫學相關指南,最高分為《中國糖尿病運動治療指南》,該指南并非康復醫學相關學會牽頭,而是由中華醫學會糖尿病學分會牽頭制訂。其次為《中國腦性癱瘓康復指南(2015)》,是由康復醫學學會牽頭制定。但兩篇指南均為 B 級推薦,即修改完善后推薦。在未來的工作中,建議制訂指南時嚴格按照指南制訂原則及報告規范。期待康復醫學工作者能夠根據指南制定的方法學和規范性報告,制訂高水平的、符合我國國情的臨床實踐指南。