引用本文: 陳昊, 李廣林, 徐文韜, 徐斌. 國內循證針灸臨床實踐指南的質量評價. 中國循證醫學雜志, 2014, 14(6): 772-775. doi: 10.7507/1672-2531.20140129 復制
目前針灸療法已成為我國醫療體系中十分重要的一種治療手段,在眾多疾病的治療中發揮著重要作用。為了更好地指導針灸臨床實踐,由國家中醫藥管理局負責立項,中國針灸學會組織制定,于2011年1月出版了我國首批共計5個針灸臨床實踐指南,該批指南共涉及偏頭痛、帶狀皰疹、風后假性球麻痹、抑郁癥和貝爾面癱5種疾病[1]。本研究采用國際指南質量評價工具“Appraisal of Guidelines for Research and Evaluation Ⅱ”(AGREE Ⅱ)對這5個指南進行了質量評價,旨在分析當前針灸領域循證實踐指南的方法學研究現狀,為針灸領域循證指南方法學的研究提供參照。
1 資料與方法
1.1 研究對象
由中國中醫藥出版社2011年出版的《中醫循證臨床實踐指南——針灸篇》 [1]納入的5個針灸臨床實踐指南。
1.2 指南的評價工具
本研究采用AGREE Ⅱ對納入的指南進行質量評價。AGREE是2003年由AGREE協作網組織13個國家的人員制定并發表,目前已得到眾多衛生保健組織的支持與認同[2],2005年北京大學詹思延教授將AGREE翻譯成中文并發表[3],對我國臨床實踐指南方法學的發展起到了巨大促進作用。AGREE Ⅱ是第二版,評價體系包含6個領域和2個總評領域[2]。
1.3 指南資料的提取與評分
根據AGREE Ⅱ各領域的評價內容,我們由4名評價員(陳昊,李廣林,徐文韜,徐斌)獨立對6個領域進行評分。4名評價員之間的信度通過組間相關系數(intra-class correlation coefficients,ICC)來分析結果的一致性[9]。
2 結果
2.1 針灸臨床實踐指南的基本情況
本批次出版的5個針灸臨床實踐指南涉及帶狀皰疹[4]、貝爾面癱[5]、抑郁癥[6]、中風后假性球麻痹[7]和偏頭痛[8]5種疾病。納入的5個指南雖描述了檢索范圍,但無一敘述系統的檢索策略;無一使用GRADE系統(The Grading of Recommendations Assessment, Development and Evaluation)進行證據分級和推薦;無一考慮患者的意愿、價值觀以及資源消耗。此外,5個指南均敘述了具體的證據分級和推薦強度并有方法學家參與各指南小組;5個指南均提及了指南的更新,但未敘述更新的頻率與方法。
2.2 AGREE Ⅱ評分結果
本研究小組中4名評價員之間關于AGREE Ⅱ的評價結果組間相關系數為0.963[95%CI(0.948,0.974)],具有較好的一致性。其6個領域的得分情況詳見表 1。

2.2.1 領域一:范圍和目的
領域一主要是對指南目的、涉及人群和衛生問題的一個總評價。針對領域一的條目,5個指南平均得分55%(最低53%,最高57%)。其中2個指南[7, 8]超過了平均得分。
2.2.2 領域二:參與人員
領域二是對指南制定人員進行的一個綜合性評價,要求需要有方法學家的參與以及患者代表的參與。5個指南平均得分27%(最低25%,最高31%),納入的5個指南均未提及有患者代表參與指南的制定。
2.2.3 領域三:制定的嚴謹性
領域三是對指南制定的方法學進行的綜合性評價,要求指南制定必須要有明確的證據檢索策略,有詳細的證據質量等級評價的過程,有基礎證據形成的推薦意見的方法學過程,同時還明確指南必須要經過外審,以及需定期進行更新。該領域中,納入的5個指南平均得分4%(最低3%,最高7%),所有指南均提及了指南會定期更新,但所有指南均未提及指南更新的方法和具體更新時限。所有指南雖均報道了檢索范圍,但均未指明具體證據的檢索策略。納入的5個指南均未在正文中報道具體的推薦意見形成方法。沒有指南采用GRADE系統對證據進行分級和推薦。所有指南均未提及有外部同行評審過程。
2.2.4 領域四:表達的明晰性
該領域納入指南平均得分55%(最低61%,最高51%)。所有指南均描述了針灸的具體方法和療程,也均給出了明確的推薦意見,但所有指南均未明確推薦干預措施的利弊分析。
2.3.5 領域五:應用性
5個指南平均得分4%(最低2%,最高7%),無指南敘述在應用中的優勢和劣勢,也沒有指南提及涉及干預措施的經濟學分析,所有指南均提出了疾病的療效評價的標準,但均未報道指南在臨床運用時具體的干預措施獲益的臨床評價標準。
2.3.6 領域六:編輯獨立性
5個指南平均得分1%(最低0,最高2%),均未在指南正文中交代利益沖突情況和具體受資助情況。
3 討論
3.1 針灸領域專科實踐指南數量較少,無法對臨床實踐形成有效指導
2011年,美國醫學研究所對循證臨床實踐指南提出了明確的定義:循證實踐指南是對衛生保健做出的決策,這個決策基于患者意愿價值觀、現有的科學證據以及干預措施利弊平衡分析綜合基礎之上形成的系統評價[10]。而制定中醫臨床實踐指南的主要目的在于規范中醫臨床診療技術,用中醫方法維護患者人群的健康利益,但僅有高質量的臨床實踐指南才能有效發揮其臨床指導作用,反之則可能對中醫臨床實踐起誤導作用。目前,中醫藥領域的循證實踐指南已有所發展,但傳統針灸學臨床中仍然堅持以個人經驗為主,依靠高年資醫生和權威醫生的教導及古籍記載為診斷治療依據,其仍未脫離經驗醫學的范疇[11]。正因為存在這個矛盾,當前結合中國實際情況制定、本土化的針灸臨床實踐指南數量很少,我們檢索CNKI、CBM和WanFang Data等主流中文數據庫,未發現有正式發表的針灸臨床實踐指南,僅手工檢索到由國家中醫藥管理局出版的5個針灸實踐指南,其數量少,很難形成對臨床實踐有效的指導。
3.2 針灸臨床實踐指南方法學質量較低,需借鑒國際優秀的方法學工具,加強適合針灸臨床特點的指南方法學研究
我們的研究結果顯示,目前現有的針灸臨床實踐指南方法學質量與2011年國內發表的其他各類醫學指南相比,在領域一、領域二和領域四方面,其方法學質量高于其他國內指南,但在其他3個領域,質量差異不大[12]。這可能是由于納入的5個針灸臨床實踐指南是由國家中醫藥管理局統一牽頭,在指南編寫之前,項目組分別組建了專家指導小組、指南審定委員會、項目辦公室和指南編寫小組。其中專家指導小組由來自全國的權威專家組成,主要負責提供指南編寫體例和推薦證據評價標準、推薦建議形成標準;指南審定委員會主要由既具有中醫藥學背景又具有標準化知識的人員,主要負責指南草稿的審定;項目辦公室主要負責指南編寫的統一協調和管理。指南編寫小組分別由中醫專業、中西醫結合專業、臨床流行病學專業和編輯等多學科人員組成,其主要承擔指南草稿的編寫,在一定程度上保證了方法學質量。但與國際上發表的循證實踐指南比較[13],方法學質量還存在一定差距(表 2、圖 1),尚需加強對方法學的學習和研究。此外,指南的制定需科學性和規范化[14],遵循循證醫學的方法制定,可提高指南質量[15]。目前國際上主流的指南制定方法均采用了GRADE系統。GRADE系統是由GRADE工作組與2004年正式提出的國際統一的證據質量分級和推薦強度標準[16],該標準的特點是:①明確定義了證據質量和推薦強度,即證據質量指在多大程度上能夠確信療效評估的正確性;推薦強度指在多大程度上能夠確信遵守推薦意見利大于弊。②統一使用“級別(grade)”代替“證據水平(levels of evidence)”。③突破了過去主要從研究設計角度考慮證據質量的局限性,綜合考慮研究設計、研究質量、研究結果的一致性和證據的直接性。④從使用者而非研究者角度制定標準,拓寬了應用范圍,并隨時更新。⑤推薦意見將根據當前可得證據的3種結論(肯定、否定、不確定),簡化為強、弱兩級,既充分體現了循證醫學立足于用,后效評價的思想,又為未來的發展和向其他領域拓展留下了空間和接口。⑥在推薦意見形成中,綜合考慮證據質量,患者意愿價值觀,利弊平衡以及資源消耗4個方面的因素,具有明顯的循證實踐的特點。該標準代表了當前對研究證據進行分類分級的國際最高水平,意義和影響重大。包括WHO和Cochrane協作網在內的28個國際組織、協會已采納GRADE標準,成為證據發展史上的里程碑事件。GRADE系統從根本上說,十分符合針灸臨床實踐的特點,是制定針灸臨床實踐指南可以借鑒的方法學之一。關于GRADE系統和針灸臨床實踐指南制定相結合,本課題組將會另行撰文論述。


3.3 總結
總之,我們認為,目前雖然循證醫學已經與傳統針灸學有了初步的融合,但是對于針灸臨床的指導尚不充足[17]。循證醫學理念下,對于臨床的指導主要在于循證臨床實踐指南,循證制定指南也是當前的發展趨勢[18]。運用循證方法學制定中醫藥指南,在一定程度上,為傳統醫學走向世界指明了方向。然而循證制定中針灸指南目前尚存諸多挑戰,故針灸的循證指南需要合理借鑒國際指南制定方法,結合針灸臨床實踐的自身特色,加強針灸實踐指南制定方法學研究,對于指導我國針灸臨床實踐有著重要意義。
目前針灸療法已成為我國醫療體系中十分重要的一種治療手段,在眾多疾病的治療中發揮著重要作用。為了更好地指導針灸臨床實踐,由國家中醫藥管理局負責立項,中國針灸學會組織制定,于2011年1月出版了我國首批共計5個針灸臨床實踐指南,該批指南共涉及偏頭痛、帶狀皰疹、風后假性球麻痹、抑郁癥和貝爾面癱5種疾病[1]。本研究采用國際指南質量評價工具“Appraisal of Guidelines for Research and Evaluation Ⅱ”(AGREE Ⅱ)對這5個指南進行了質量評價,旨在分析當前針灸領域循證實踐指南的方法學研究現狀,為針灸領域循證指南方法學的研究提供參照。
1 資料與方法
1.1 研究對象
由中國中醫藥出版社2011年出版的《中醫循證臨床實踐指南——針灸篇》 [1]納入的5個針灸臨床實踐指南。
1.2 指南的評價工具
本研究采用AGREE Ⅱ對納入的指南進行質量評價。AGREE是2003年由AGREE協作網組織13個國家的人員制定并發表,目前已得到眾多衛生保健組織的支持與認同[2],2005年北京大學詹思延教授將AGREE翻譯成中文并發表[3],對我國臨床實踐指南方法學的發展起到了巨大促進作用。AGREE Ⅱ是第二版,評價體系包含6個領域和2個總評領域[2]。
1.3 指南資料的提取與評分
根據AGREE Ⅱ各領域的評價內容,我們由4名評價員(陳昊,李廣林,徐文韜,徐斌)獨立對6個領域進行評分。4名評價員之間的信度通過組間相關系數(intra-class correlation coefficients,ICC)來分析結果的一致性[9]。
2 結果
2.1 針灸臨床實踐指南的基本情況
本批次出版的5個針灸臨床實踐指南涉及帶狀皰疹[4]、貝爾面癱[5]、抑郁癥[6]、中風后假性球麻痹[7]和偏頭痛[8]5種疾病。納入的5個指南雖描述了檢索范圍,但無一敘述系統的檢索策略;無一使用GRADE系統(The Grading of Recommendations Assessment, Development and Evaluation)進行證據分級和推薦;無一考慮患者的意愿、價值觀以及資源消耗。此外,5個指南均敘述了具體的證據分級和推薦強度并有方法學家參與各指南小組;5個指南均提及了指南的更新,但未敘述更新的頻率與方法。
2.2 AGREE Ⅱ評分結果
本研究小組中4名評價員之間關于AGREE Ⅱ的評價結果組間相關系數為0.963[95%CI(0.948,0.974)],具有較好的一致性。其6個領域的得分情況詳見表 1。

2.2.1 領域一:范圍和目的
領域一主要是對指南目的、涉及人群和衛生問題的一個總評價。針對領域一的條目,5個指南平均得分55%(最低53%,最高57%)。其中2個指南[7, 8]超過了平均得分。
2.2.2 領域二:參與人員
領域二是對指南制定人員進行的一個綜合性評價,要求需要有方法學家的參與以及患者代表的參與。5個指南平均得分27%(最低25%,最高31%),納入的5個指南均未提及有患者代表參與指南的制定。
2.2.3 領域三:制定的嚴謹性
領域三是對指南制定的方法學進行的綜合性評價,要求指南制定必須要有明確的證據檢索策略,有詳細的證據質量等級評價的過程,有基礎證據形成的推薦意見的方法學過程,同時還明確指南必須要經過外審,以及需定期進行更新。該領域中,納入的5個指南平均得分4%(最低3%,最高7%),所有指南均提及了指南會定期更新,但所有指南均未提及指南更新的方法和具體更新時限。所有指南雖均報道了檢索范圍,但均未指明具體證據的檢索策略。納入的5個指南均未在正文中報道具體的推薦意見形成方法。沒有指南采用GRADE系統對證據進行分級和推薦。所有指南均未提及有外部同行評審過程。
2.2.4 領域四:表達的明晰性
該領域納入指南平均得分55%(最低61%,最高51%)。所有指南均描述了針灸的具體方法和療程,也均給出了明確的推薦意見,但所有指南均未明確推薦干預措施的利弊分析。
2.3.5 領域五:應用性
5個指南平均得分4%(最低2%,最高7%),無指南敘述在應用中的優勢和劣勢,也沒有指南提及涉及干預措施的經濟學分析,所有指南均提出了疾病的療效評價的標準,但均未報道指南在臨床運用時具體的干預措施獲益的臨床評價標準。
2.3.6 領域六:編輯獨立性
5個指南平均得分1%(最低0,最高2%),均未在指南正文中交代利益沖突情況和具體受資助情況。
3 討論
3.1 針灸領域專科實踐指南數量較少,無法對臨床實踐形成有效指導
2011年,美國醫學研究所對循證臨床實踐指南提出了明確的定義:循證實踐指南是對衛生保健做出的決策,這個決策基于患者意愿價值觀、現有的科學證據以及干預措施利弊平衡分析綜合基礎之上形成的系統評價[10]。而制定中醫臨床實踐指南的主要目的在于規范中醫臨床診療技術,用中醫方法維護患者人群的健康利益,但僅有高質量的臨床實踐指南才能有效發揮其臨床指導作用,反之則可能對中醫臨床實踐起誤導作用。目前,中醫藥領域的循證實踐指南已有所發展,但傳統針灸學臨床中仍然堅持以個人經驗為主,依靠高年資醫生和權威醫生的教導及古籍記載為診斷治療依據,其仍未脫離經驗醫學的范疇[11]。正因為存在這個矛盾,當前結合中國實際情況制定、本土化的針灸臨床實踐指南數量很少,我們檢索CNKI、CBM和WanFang Data等主流中文數據庫,未發現有正式發表的針灸臨床實踐指南,僅手工檢索到由國家中醫藥管理局出版的5個針灸實踐指南,其數量少,很難形成對臨床實踐有效的指導。
3.2 針灸臨床實踐指南方法學質量較低,需借鑒國際優秀的方法學工具,加強適合針灸臨床特點的指南方法學研究
我們的研究結果顯示,目前現有的針灸臨床實踐指南方法學質量與2011年國內發表的其他各類醫學指南相比,在領域一、領域二和領域四方面,其方法學質量高于其他國內指南,但在其他3個領域,質量差異不大[12]。這可能是由于納入的5個針灸臨床實踐指南是由國家中醫藥管理局統一牽頭,在指南編寫之前,項目組分別組建了專家指導小組、指南審定委員會、項目辦公室和指南編寫小組。其中專家指導小組由來自全國的權威專家組成,主要負責提供指南編寫體例和推薦證據評價標準、推薦建議形成標準;指南審定委員會主要由既具有中醫藥學背景又具有標準化知識的人員,主要負責指南草稿的審定;項目辦公室主要負責指南編寫的統一協調和管理。指南編寫小組分別由中醫專業、中西醫結合專業、臨床流行病學專業和編輯等多學科人員組成,其主要承擔指南草稿的編寫,在一定程度上保證了方法學質量。但與國際上發表的循證實踐指南比較[13],方法學質量還存在一定差距(表 2、圖 1),尚需加強對方法學的學習和研究。此外,指南的制定需科學性和規范化[14],遵循循證醫學的方法制定,可提高指南質量[15]。目前國際上主流的指南制定方法均采用了GRADE系統。GRADE系統是由GRADE工作組與2004年正式提出的國際統一的證據質量分級和推薦強度標準[16],該標準的特點是:①明確定義了證據質量和推薦強度,即證據質量指在多大程度上能夠確信療效評估的正確性;推薦強度指在多大程度上能夠確信遵守推薦意見利大于弊。②統一使用“級別(grade)”代替“證據水平(levels of evidence)”。③突破了過去主要從研究設計角度考慮證據質量的局限性,綜合考慮研究設計、研究質量、研究結果的一致性和證據的直接性。④從使用者而非研究者角度制定標準,拓寬了應用范圍,并隨時更新。⑤推薦意見將根據當前可得證據的3種結論(肯定、否定、不確定),簡化為強、弱兩級,既充分體現了循證醫學立足于用,后效評價的思想,又為未來的發展和向其他領域拓展留下了空間和接口。⑥在推薦意見形成中,綜合考慮證據質量,患者意愿價值觀,利弊平衡以及資源消耗4個方面的因素,具有明顯的循證實踐的特點。該標準代表了當前對研究證據進行分類分級的國際最高水平,意義和影響重大。包括WHO和Cochrane協作網在內的28個國際組織、協會已采納GRADE標準,成為證據發展史上的里程碑事件。GRADE系統從根本上說,十分符合針灸臨床實踐的特點,是制定針灸臨床實踐指南可以借鑒的方法學之一。關于GRADE系統和針灸臨床實踐指南制定相結合,本課題組將會另行撰文論述。


3.3 總結
總之,我們認為,目前雖然循證醫學已經與傳統針灸學有了初步的融合,但是對于針灸臨床的指導尚不充足[17]。循證醫學理念下,對于臨床的指導主要在于循證臨床實踐指南,循證制定指南也是當前的發展趨勢[18]。運用循證方法學制定中醫藥指南,在一定程度上,為傳統醫學走向世界指明了方向。然而循證制定中針灸指南目前尚存諸多挑戰,故針灸的循證指南需要合理借鑒國際指南制定方法,結合針灸臨床實踐的自身特色,加強針灸實踐指南制定方法學研究,對于指導我國針灸臨床實踐有著重要意義。