引用本文: 夏鴻杰, 趙崢嶸, 郭靜, 黃橋, 魏旭煦, 周婕, 任相穎, 張蓉, 靳英輝, 商洪才. 中醫相關證據質量及推薦意見分級體系的系統評價. 中國循證醫學雜志, 2022, 22(2): 187-195. doi: 10.7507/1672-2531.202110021 復制
中醫藥作為我國獨特的衛生資源、潛力巨大的經濟資源、具有原創優勢的科技資源、優秀的文化資源和重要的生態資源,在經濟社會發展中發揮著重要作用[1]。相較于現代醫學,中醫具有“整體觀”和“辨證論治”的理論特點,現代醫學理論體系和方法學并不完全適合中醫學的臨床評價[2]。目前臨床公認證據評價能夠為進一步形成臨床推薦意見奠定基礎,證據評價標準是指南方法學研究的重點[3],在遵循循證醫學原則尋找最佳臨床證據以指導臨床實踐的過程中,構建中醫藥的證據分級體系必要且迫切。迄今為止,國內中醫藥及循證醫學研究者陸續提出中醫藥證據的分級體系,但尚未進行系統的分析、歸納和總結。本文通過對現有中醫藥證據分級體系進行全面檢索和分析,以服務于中醫藥證據的臨床使用及中醫臨床實踐指南的制訂。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
針對中醫藥證據來源、評價與分級等特點制訂的證據質量與推薦意見強度分級標準的研究,即結合中醫藥特點并基于一定的方法學的證據質量和/或推薦意見分級標準,無論是否同時考慮了西醫或現代醫學證據類型。
1.1.2 排除標準
① 重復發表的文獻;② 非中、英文文獻;③ 文獻資料不全且未能聯系上原作者的研究。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、Web of Science、CNKI、WanFang Data和VIP數據庫,搜集有關中醫藥證據質量與推薦意見分級標準的研究,檢索時限均為建庫至2021年6月。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。中文檢索詞為:中醫、中藥、中西醫結合、古籍文獻、針灸、證據分級體系、推薦意見分級等;英文檢索詞為:hierarchical system of evidence、grading of recommendation*、Grading system、Traditional Chinese Medicine、Traditional Chinese and Western Medicine、ancient books of Traditional Chinese Medicine、acupuncture等。以PubMed為例,其詳細檢索策略見框1。

1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:第一作者、發表年份、發表期刊、研究領域(中醫/中西醫/中醫某分支領域)、制訂組織、版本(初版/更新版)、資金來源、制訂證據質量及推薦意見分級的方法學、中醫藥相關證據的證據級別、證據質量等級與推薦意見之間的關系。
1.4 統計分析
采用定性描述的方式對提取的數據進行分析,包括證據質量與推薦意見分級標準內涵,中醫藥證據質量等級及與文獻類型的對應關系,中醫特色證據類型(古籍文獻及中醫專家意見)的分級方法。因證據質量等級劃分方法多樣,如3分法、5分法,為了對各類證據的等級高低進行匯總方便讀者快速理解,統一使用低、中、高三個等級對不同證據等級描述進行歸類。
2 結果
2.1 文獻篩選流程及結果
初檢到相關文獻976篇,經逐層篩選,最終納入20篇文獻[4-23],涉及18個研究。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表1。

2.3 納入研究的中醫證據特征
2.3.1 中醫藥證據質量等級
共有17個研究提出證據質量等級。將其條目合并分析后得出結論:系統評價、Meta分析在中醫證據體系中也被視為最高質量證據,其在證據質量等級劃分中出現9次且都被劃為高質量證據;共有3個研究[6,10-11]認為隨機對照試驗(randomized controlled trial,RCT)為級別最高證據,有2個研究[4,8]將其與其他類型研究結合一起劃為最高等級,有1個研究[5]將其視為等級僅次系統評價、Meta分析的證據;觀察性研究也在中醫證據體系中占比較大,共出現37次,相較于現代醫學證據分級系統,其在中醫證據分級體系中也是中等質量證據。1個研究[22]認為隊列研究可為高質量證據,有3個研究[4,10,19]認為其為中等質量證據;1個研究[7]認為同為中醫觀念“辨證論治”指導下的臨床試驗研究,RCT證據等級最高、其他類型臨床研究、專家經驗總結及個案證據等級依次降低。不同證據來源在證據分級體系中出現頻次的歸類結果見表2。

共有7個研究提出推薦等級。除依據GRADE的證據分級系統,其余中醫/中西醫結合證據質量與推薦意見分級系統均為證據質量與推薦強度的絕對或相對對應關系。梁繁榮等[8]提出的證據質量與推薦意見分級標準中證據質量等級Ⅰ級證據即為推薦等級的Ⅰ級推薦;熊俊等[10]提出1項A級證據或兩項B級支持為Ⅰ級推薦,1項B級證據或兩項C級證據為Ⅱ級推薦;汪受傳等[12]提出至少有2項Ⅰ級研究結果支持為A級推薦。對于證據向推薦意見形成過程,有2個研究認為不能單從文獻證據質量形成推薦意見,還需考慮其他因素。1個研究[13,14]認為還需考慮利弊權衡、患者偏好和價值觀和成本(資源分配);1個研究[21]認為還需考慮臨床效益與風險、衛生經濟學、臨床可行性、臨床可接受性和患者意愿。
2.3.2 中醫特色條目
2.3.2.1 古籍文獻劃分標準
對古籍的劃分主要分為2個維度,即古籍發布時間和古籍出處(古籍作者或古籍發布機構、流派)(表3)。

2.3.2.2 中醫專家意見劃分標準
在現代醫學證據分級體系中,專家經驗常被視為較低等級。而在中醫證據分級研究中,專家經驗亦可成為較高等級證據,納入研究對中醫專家意見的等級劃分標準見表4。

3 討論
循證醫學在幾十年的發展過程中建立了一套比較完善的證據評價體系,其方法建立在現代西醫學體系之上。鑒于中醫學“整體觀”和“辨證論治”的特殊性,西醫證據分級體系并不完全適合中醫的臨床評價,例如國際上的證據分級體系往往將RCT視為較高等級,而中醫特色的專家經驗及古籍文獻常未被納入其相應的證據分級系統[18]。中醫研究者認為中醫與西醫屬兩種不同的學術體系,中醫非常強調傳統文獻在臨床證據中的重要性,認為中醫經典是現代研究證據所無法替代的。其次,“辨證論治”集中體現了中醫藥學對人體生理、病理規律的認識和臨床治療水平,是有別于現代醫學診療體系的一大特色和優勢[24],但辨證論治診療模式因其顯著的個體化特征,一定程度上與主要基于群體化證據的西醫循證決策模式不相適應[25]。除此之外,中醫、中西醫結合證據查找和使用過程中符合循證醫學證據要求、級別較高的文獻如大樣本RCT不多[26]。
無論是西醫還是中醫,循證制訂臨床實踐指南以提高臨床實踐水平,改善患者治療和預后已經成為業界普遍共識。20世紀80年代以來,國家逐漸重視中醫藥事業的發展和標準化體系建設,中醫藥在衛生保健方面的特色和重要性日益凸顯,中醫藥(含中西醫結合)指南的數量也快速增加[27]。中醫研究者普遍認為在中醫指南制訂過程中絕對使用西醫證據質量與推薦意見分級體系是不科學、不合理的。
目前,我國廣大中醫研究者根據中醫證據特點和中醫現代醫學研究發展現狀開發了多個證據質量和/或推薦意見分級標準。這其中對中醫古籍文獻的探討最多。古籍文獻是中醫藥學知識的重要載體,是我國傳統中醫藥學傳承與發展的重要基礎。有研究指出中醫古籍證據內容多而復雜,只將中醫古籍證據籠統地劃分為證據金字塔的某一級顯然是不合理的[20]。一般來說中醫古籍是指1911年(包括1911年)以前編撰出版的、以手工紙為主要文字載體的中醫書籍[21]。很多研究者探討了中醫古籍文獻的證據分級,衷敬柏[15]對古籍文獻的劃分最為詳細,按年代分別劃分為東漢及東漢前、晉到清代、民國-當代,并在其中又進行了是否有較好傳承、著作或醫案的區分。除古籍文獻外,不同等級的中醫專家經驗也在證據質量等級中被多次研究和探討,其中名老中醫和國醫大師在兩個研究中給與了最高級別的證據質量等級。汪受傳[11,12]對古今文獻的中醫專家共識和當代中醫專家共識進行了證據質量等級的區分。呂中茜[17]對省級名中醫和國家級學會會長的專家經驗進行了區分,可見各證據分級系統對古籍文獻和專家意見的劃分標準并不一致。中醫專家經驗是中醫實踐者在臨床診療過程中的知識和體驗的積累,可能以口述的形式呈現,也可能以中醫醫案的形式呈現,而中醫醫案常以個案報道或者病例系列的形式呈現,這和現代醫學研究中的描述性研究是基本一致的,但可能在病案診療過程描述的完整性方面有所欠缺,比如很多醫案僅僅是主觀思考分析后的領悟,而未按照現代醫學方法進行數據描述與統計分析。古籍文獻以及專家經驗本質上來說也是來源于真實世界的觀察,古籍文獻中的觀點不斷被后世論證是否有效,有效的辨證思路及治法得以流傳下來。一方面,我們可直接對這一部分理論指導的真實世界實踐數據進行采集分析,產生真實世界證據;另一方面,我們可進一步設計臨床研究來驗證相關干預的有效性和安全性。
本研究中納入最早的一個證據質量與推薦意見分級標準來自于2007年劉建平[4]提出的傳統醫學證據體的構成及證據分級建議,此建議中最早提出中醫證據評價中的“證據體”概念,并確定最高級別證據由RCT、隊列研究、病例-對照研究、病例系列這4種研究中至少2種不同類型研究構成的證據體組成。循證醫學強調“證據體”概念,其與推薦分級的評價方法(grading of recommendations assessment, development and evaluation,GRADE)中的“證據體”非常類似。2011年美國醫學會的“臨床實踐指南”的定義指出臨床實踐指南是針對患者的特定臨床問題,基于系統評價形成的證據,并對各種備選干預方式進行全面的利弊平衡分析后提出的最優指導意見[28],這里的系統評價形成的證據即是證據體的概念。2019年陳薇等[19]進一步完善了2007年的分級建議,他們認為中醫藥臨床研究的“證據體”應該針對臨床研究的核心結局指標,核心結局指標的證據級別可以分為3個級別,高級證據指由兩個及以上的水平 1/2級證據構成的證據體[19]。
李慧[13-14]在其研究中推薦中醫/中西醫結合指南選用GRADE方法進行證據質量分級與推薦意見的制訂。GRADE方法的創建與發展,是循證醫學與指南/共識制訂發展史上的里程碑事件。循證醫學創始人Gordon Guyatt在《循證醫學走過的四分之一世紀》一文中將GRADE系統視為循證醫學誕生25年來方法學研究中重要的突破之一,也是循證指南/共識制訂過程中最關鍵的要素之一[29]。GRADE方法首次清楚地闡述了證據質量和推薦強度的定義,即證據質量是指對觀察值的真實性有多大把握,推薦強度指指南使用者遵守推薦意見對目標人群產生的利弊程度有多大把握[30]。它在厘清證據質量和區分推薦強度方面發揮著重要作用,突破了單從研究設計角度考慮證據質量的局限性,在對推薦建議分級時將證據質量和其它因素(如患者選擇、資源可利用性等)進行綜合考慮[30]。但GRADE方法在中醫/中西醫結合指南進行使用仍有太多挑戰,特別是現代醫學證據不足時和上述古籍文獻證據較充分時,故針對特定的指南研究者還需要綜合考慮證據來源、文獻量和證據質量等多個因素。2015年中華中醫藥學會組織中醫藥臨床實踐指南的制訂工作,提出應用GRADE方法作為構建中醫臨床證據體系的主要方法學,并在此基礎上完成了一系列相關臨床實踐指南的制訂工作[18]。在GRADE綜合評價理念下有針對性地調整和修改是可行的,但要在指南制訂團隊的充分共識基礎上進行。另外,不能完全照搬現代醫學證據分級體系的另一個重要原因是,中西醫臨床思維差別較大,且直接反應在指南制訂的框架設計上。中醫臨床實踐中“以證統病”思路非常明顯,而西醫的疾病分類或嚴重程度劃分與中醫證候差別很大。如中醫根據癌癥的初、中、晚期有相應的不同療法,但中醫、西醫的癌癥分期差別很大,西醫的晚期對于中醫的病證而言可能屬早期[31],所以中醫理論指導下的各類文獻證據應該在指南制訂過程中給予認真考慮與合理使用。另外,中醫的臨床研究應充分考慮中醫“以證統病”的特點,建立“以證統病”思路下中醫臨床研究設計、中醫辨治復雜疾病診治及中醫特色的臨床管理理念及方法[32]。
眾多的證據分級體系有著不同的產生背景及各自適用的范圍或情境,所以或多或少有各自的局限性,特別是僅針對某一類文獻,或某一種證據特征的證據分級標準,這也是部分分級體系很難被廣泛推薦的原因。從指南制訂角度我們不提倡多個證據質量或推薦等級分級標準的混用,主要原因是分級標準在開發和制訂過程中應具有系統性與整體性,如果割裂一個完整的分級標準和/或結合另一個標準勢必會打破原有標準的內部邏輯,比如GRADE分級是在不同研究類型證據體具有不同的起始證據等級的基礎上再進行升降級,針對不同臨床問題考慮了研究設計的論證強度、可行性、優缺點特別是內部偏倚等以及證據向決策轉化的成本、可行性等因素,這是其他分級標準不完全具備的。
推薦意見共識過程中,患者意愿與價值觀是重要考量因素,也是患者對中醫藥文化、價值接受認同程度的重要體現。該部分內容應由一個建立在良好研究基礎上,充分詳實的研究報告來呈現,進而影響共識小組對推薦意見方向和強度的判斷。此外,中醫藥“簡便廉驗”的特色優勢也應由專門的衛生經濟學研究報告來支撐和呈現,故中醫/中西醫結合指南的制訂過程中也應該充分認識到證據并不完全等于推薦意見,僅依據有效性證據分級來判斷推薦強度是片面的,應該在決策制訂過程中充分考慮有效性、安全性、患者意愿和經濟性等多種因素[13-14]。
有研究者一般認為制訂中醫、中西醫結合指南的最大問題是臨床證據不足,符合循證醫學證據要求、級別較高的證據如大樣本RCT不多。因此,利用好中醫學科理論優勢與古典文獻豐富的優勢,制訂切實可行的中醫臨床診療方案是可行之道。但利用經典的過程中不能忽略現代醫學證據的積累與發展。研究者認為目前中醫藥臨床研究基礎薄弱,如研究目標不明確、方法選擇不恰當、實施與質量控制不到位、結果展示不規范、證據轉化應用不足,以及中醫藥臨床研究適宜方法有待探索[27]。但近年來越來越多的中醫領域的高質量臨床研究發表在頂級期刊上,極大地增加了中醫臨床研究者信心。中醫研究者需更加重視臨床研究,不斷提高研究質量和水平,才能進一步為中醫臨床實踐指南的推薦意見夯實證據基礎[27]。
科學合理的證據質量及推薦意見分級標準能夠為中醫實踐者進行快速決策提供有效參考,采用科學透明且實用性強的證據質量及推薦意見分級標準是中醫領域指南科學發展的必然要求。中醫標準化、現代化不可盲目,中醫證據研究者應與臨床實踐者通力合作、充分討論溝通,根據特定指南的需求針對性地選用或調整證據質量與推薦意見分級標準,透明、嚴謹地制訂臨床實踐指南,以期更好地服務于臨床決策。
中醫藥作為我國獨特的衛生資源、潛力巨大的經濟資源、具有原創優勢的科技資源、優秀的文化資源和重要的生態資源,在經濟社會發展中發揮著重要作用[1]。相較于現代醫學,中醫具有“整體觀”和“辨證論治”的理論特點,現代醫學理論體系和方法學并不完全適合中醫學的臨床評價[2]。目前臨床公認證據評價能夠為進一步形成臨床推薦意見奠定基礎,證據評價標準是指南方法學研究的重點[3],在遵循循證醫學原則尋找最佳臨床證據以指導臨床實踐的過程中,構建中醫藥的證據分級體系必要且迫切。迄今為止,國內中醫藥及循證醫學研究者陸續提出中醫藥證據的分級體系,但尚未進行系統的分析、歸納和總結。本文通過對現有中醫藥證據分級體系進行全面檢索和分析,以服務于中醫藥證據的臨床使用及中醫臨床實踐指南的制訂。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
針對中醫藥證據來源、評價與分級等特點制訂的證據質量與推薦意見強度分級標準的研究,即結合中醫藥特點并基于一定的方法學的證據質量和/或推薦意見分級標準,無論是否同時考慮了西醫或現代醫學證據類型。
1.1.2 排除標準
① 重復發表的文獻;② 非中、英文文獻;③ 文獻資料不全且未能聯系上原作者的研究。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、Web of Science、CNKI、WanFang Data和VIP數據庫,搜集有關中醫藥證據質量與推薦意見分級標準的研究,檢索時限均為建庫至2021年6月。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。中文檢索詞為:中醫、中藥、中西醫結合、古籍文獻、針灸、證據分級體系、推薦意見分級等;英文檢索詞為:hierarchical system of evidence、grading of recommendation*、Grading system、Traditional Chinese Medicine、Traditional Chinese and Western Medicine、ancient books of Traditional Chinese Medicine、acupuncture等。以PubMed為例,其詳細檢索策略見框1。

1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:第一作者、發表年份、發表期刊、研究領域(中醫/中西醫/中醫某分支領域)、制訂組織、版本(初版/更新版)、資金來源、制訂證據質量及推薦意見分級的方法學、中醫藥相關證據的證據級別、證據質量等級與推薦意見之間的關系。
1.4 統計分析
采用定性描述的方式對提取的數據進行分析,包括證據質量與推薦意見分級標準內涵,中醫藥證據質量等級及與文獻類型的對應關系,中醫特色證據類型(古籍文獻及中醫專家意見)的分級方法。因證據質量等級劃分方法多樣,如3分法、5分法,為了對各類證據的等級高低進行匯總方便讀者快速理解,統一使用低、中、高三個等級對不同證據等級描述進行歸類。
2 結果
2.1 文獻篩選流程及結果
初檢到相關文獻976篇,經逐層篩選,最終納入20篇文獻[4-23],涉及18個研究。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表1。

2.3 納入研究的中醫證據特征
2.3.1 中醫藥證據質量等級
共有17個研究提出證據質量等級。將其條目合并分析后得出結論:系統評價、Meta分析在中醫證據體系中也被視為最高質量證據,其在證據質量等級劃分中出現9次且都被劃為高質量證據;共有3個研究[6,10-11]認為隨機對照試驗(randomized controlled trial,RCT)為級別最高證據,有2個研究[4,8]將其與其他類型研究結合一起劃為最高等級,有1個研究[5]將其視為等級僅次系統評價、Meta分析的證據;觀察性研究也在中醫證據體系中占比較大,共出現37次,相較于現代醫學證據分級系統,其在中醫證據分級體系中也是中等質量證據。1個研究[22]認為隊列研究可為高質量證據,有3個研究[4,10,19]認為其為中等質量證據;1個研究[7]認為同為中醫觀念“辨證論治”指導下的臨床試驗研究,RCT證據等級最高、其他類型臨床研究、專家經驗總結及個案證據等級依次降低。不同證據來源在證據分級體系中出現頻次的歸類結果見表2。

共有7個研究提出推薦等級。除依據GRADE的證據分級系統,其余中醫/中西醫結合證據質量與推薦意見分級系統均為證據質量與推薦強度的絕對或相對對應關系。梁繁榮等[8]提出的證據質量與推薦意見分級標準中證據質量等級Ⅰ級證據即為推薦等級的Ⅰ級推薦;熊俊等[10]提出1項A級證據或兩項B級支持為Ⅰ級推薦,1項B級證據或兩項C級證據為Ⅱ級推薦;汪受傳等[12]提出至少有2項Ⅰ級研究結果支持為A級推薦。對于證據向推薦意見形成過程,有2個研究認為不能單從文獻證據質量形成推薦意見,還需考慮其他因素。1個研究[13,14]認為還需考慮利弊權衡、患者偏好和價值觀和成本(資源分配);1個研究[21]認為還需考慮臨床效益與風險、衛生經濟學、臨床可行性、臨床可接受性和患者意愿。
2.3.2 中醫特色條目
2.3.2.1 古籍文獻劃分標準
對古籍的劃分主要分為2個維度,即古籍發布時間和古籍出處(古籍作者或古籍發布機構、流派)(表3)。

2.3.2.2 中醫專家意見劃分標準
在現代醫學證據分級體系中,專家經驗常被視為較低等級。而在中醫證據分級研究中,專家經驗亦可成為較高等級證據,納入研究對中醫專家意見的等級劃分標準見表4。

3 討論
循證醫學在幾十年的發展過程中建立了一套比較完善的證據評價體系,其方法建立在現代西醫學體系之上。鑒于中醫學“整體觀”和“辨證論治”的特殊性,西醫證據分級體系并不完全適合中醫的臨床評價,例如國際上的證據分級體系往往將RCT視為較高等級,而中醫特色的專家經驗及古籍文獻常未被納入其相應的證據分級系統[18]。中醫研究者認為中醫與西醫屬兩種不同的學術體系,中醫非常強調傳統文獻在臨床證據中的重要性,認為中醫經典是現代研究證據所無法替代的。其次,“辨證論治”集中體現了中醫藥學對人體生理、病理規律的認識和臨床治療水平,是有別于現代醫學診療體系的一大特色和優勢[24],但辨證論治診療模式因其顯著的個體化特征,一定程度上與主要基于群體化證據的西醫循證決策模式不相適應[25]。除此之外,中醫、中西醫結合證據查找和使用過程中符合循證醫學證據要求、級別較高的文獻如大樣本RCT不多[26]。
無論是西醫還是中醫,循證制訂臨床實踐指南以提高臨床實踐水平,改善患者治療和預后已經成為業界普遍共識。20世紀80年代以來,國家逐漸重視中醫藥事業的發展和標準化體系建設,中醫藥在衛生保健方面的特色和重要性日益凸顯,中醫藥(含中西醫結合)指南的數量也快速增加[27]。中醫研究者普遍認為在中醫指南制訂過程中絕對使用西醫證據質量與推薦意見分級體系是不科學、不合理的。
目前,我國廣大中醫研究者根據中醫證據特點和中醫現代醫學研究發展現狀開發了多個證據質量和/或推薦意見分級標準。這其中對中醫古籍文獻的探討最多。古籍文獻是中醫藥學知識的重要載體,是我國傳統中醫藥學傳承與發展的重要基礎。有研究指出中醫古籍證據內容多而復雜,只將中醫古籍證據籠統地劃分為證據金字塔的某一級顯然是不合理的[20]。一般來說中醫古籍是指1911年(包括1911年)以前編撰出版的、以手工紙為主要文字載體的中醫書籍[21]。很多研究者探討了中醫古籍文獻的證據分級,衷敬柏[15]對古籍文獻的劃分最為詳細,按年代分別劃分為東漢及東漢前、晉到清代、民國-當代,并在其中又進行了是否有較好傳承、著作或醫案的區分。除古籍文獻外,不同等級的中醫專家經驗也在證據質量等級中被多次研究和探討,其中名老中醫和國醫大師在兩個研究中給與了最高級別的證據質量等級。汪受傳[11,12]對古今文獻的中醫專家共識和當代中醫專家共識進行了證據質量等級的區分。呂中茜[17]對省級名中醫和國家級學會會長的專家經驗進行了區分,可見各證據分級系統對古籍文獻和專家意見的劃分標準并不一致。中醫專家經驗是中醫實踐者在臨床診療過程中的知識和體驗的積累,可能以口述的形式呈現,也可能以中醫醫案的形式呈現,而中醫醫案常以個案報道或者病例系列的形式呈現,這和現代醫學研究中的描述性研究是基本一致的,但可能在病案診療過程描述的完整性方面有所欠缺,比如很多醫案僅僅是主觀思考分析后的領悟,而未按照現代醫學方法進行數據描述與統計分析。古籍文獻以及專家經驗本質上來說也是來源于真實世界的觀察,古籍文獻中的觀點不斷被后世論證是否有效,有效的辨證思路及治法得以流傳下來。一方面,我們可直接對這一部分理論指導的真實世界實踐數據進行采集分析,產生真實世界證據;另一方面,我們可進一步設計臨床研究來驗證相關干預的有效性和安全性。
本研究中納入最早的一個證據質量與推薦意見分級標準來自于2007年劉建平[4]提出的傳統醫學證據體的構成及證據分級建議,此建議中最早提出中醫證據評價中的“證據體”概念,并確定最高級別證據由RCT、隊列研究、病例-對照研究、病例系列這4種研究中至少2種不同類型研究構成的證據體組成。循證醫學強調“證據體”概念,其與推薦分級的評價方法(grading of recommendations assessment, development and evaluation,GRADE)中的“證據體”非常類似。2011年美國醫學會的“臨床實踐指南”的定義指出臨床實踐指南是針對患者的特定臨床問題,基于系統評價形成的證據,并對各種備選干預方式進行全面的利弊平衡分析后提出的最優指導意見[28],這里的系統評價形成的證據即是證據體的概念。2019年陳薇等[19]進一步完善了2007年的分級建議,他們認為中醫藥臨床研究的“證據體”應該針對臨床研究的核心結局指標,核心結局指標的證據級別可以分為3個級別,高級證據指由兩個及以上的水平 1/2級證據構成的證據體[19]。
李慧[13-14]在其研究中推薦中醫/中西醫結合指南選用GRADE方法進行證據質量分級與推薦意見的制訂。GRADE方法的創建與發展,是循證醫學與指南/共識制訂發展史上的里程碑事件。循證醫學創始人Gordon Guyatt在《循證醫學走過的四分之一世紀》一文中將GRADE系統視為循證醫學誕生25年來方法學研究中重要的突破之一,也是循證指南/共識制訂過程中最關鍵的要素之一[29]。GRADE方法首次清楚地闡述了證據質量和推薦強度的定義,即證據質量是指對觀察值的真實性有多大把握,推薦強度指指南使用者遵守推薦意見對目標人群產生的利弊程度有多大把握[30]。它在厘清證據質量和區分推薦強度方面發揮著重要作用,突破了單從研究設計角度考慮證據質量的局限性,在對推薦建議分級時將證據質量和其它因素(如患者選擇、資源可利用性等)進行綜合考慮[30]。但GRADE方法在中醫/中西醫結合指南進行使用仍有太多挑戰,特別是現代醫學證據不足時和上述古籍文獻證據較充分時,故針對特定的指南研究者還需要綜合考慮證據來源、文獻量和證據質量等多個因素。2015年中華中醫藥學會組織中醫藥臨床實踐指南的制訂工作,提出應用GRADE方法作為構建中醫臨床證據體系的主要方法學,并在此基礎上完成了一系列相關臨床實踐指南的制訂工作[18]。在GRADE綜合評價理念下有針對性地調整和修改是可行的,但要在指南制訂團隊的充分共識基礎上進行。另外,不能完全照搬現代醫學證據分級體系的另一個重要原因是,中西醫臨床思維差別較大,且直接反應在指南制訂的框架設計上。中醫臨床實踐中“以證統病”思路非常明顯,而西醫的疾病分類或嚴重程度劃分與中醫證候差別很大。如中醫根據癌癥的初、中、晚期有相應的不同療法,但中醫、西醫的癌癥分期差別很大,西醫的晚期對于中醫的病證而言可能屬早期[31],所以中醫理論指導下的各類文獻證據應該在指南制訂過程中給予認真考慮與合理使用。另外,中醫的臨床研究應充分考慮中醫“以證統病”的特點,建立“以證統病”思路下中醫臨床研究設計、中醫辨治復雜疾病診治及中醫特色的臨床管理理念及方法[32]。
眾多的證據分級體系有著不同的產生背景及各自適用的范圍或情境,所以或多或少有各自的局限性,特別是僅針對某一類文獻,或某一種證據特征的證據分級標準,這也是部分分級體系很難被廣泛推薦的原因。從指南制訂角度我們不提倡多個證據質量或推薦等級分級標準的混用,主要原因是分級標準在開發和制訂過程中應具有系統性與整體性,如果割裂一個完整的分級標準和/或結合另一個標準勢必會打破原有標準的內部邏輯,比如GRADE分級是在不同研究類型證據體具有不同的起始證據等級的基礎上再進行升降級,針對不同臨床問題考慮了研究設計的論證強度、可行性、優缺點特別是內部偏倚等以及證據向決策轉化的成本、可行性等因素,這是其他分級標準不完全具備的。
推薦意見共識過程中,患者意愿與價值觀是重要考量因素,也是患者對中醫藥文化、價值接受認同程度的重要體現。該部分內容應由一個建立在良好研究基礎上,充分詳實的研究報告來呈現,進而影響共識小組對推薦意見方向和強度的判斷。此外,中醫藥“簡便廉驗”的特色優勢也應由專門的衛生經濟學研究報告來支撐和呈現,故中醫/中西醫結合指南的制訂過程中也應該充分認識到證據并不完全等于推薦意見,僅依據有效性證據分級來判斷推薦強度是片面的,應該在決策制訂過程中充分考慮有效性、安全性、患者意愿和經濟性等多種因素[13-14]。
有研究者一般認為制訂中醫、中西醫結合指南的最大問題是臨床證據不足,符合循證醫學證據要求、級別較高的證據如大樣本RCT不多。因此,利用好中醫學科理論優勢與古典文獻豐富的優勢,制訂切實可行的中醫臨床診療方案是可行之道。但利用經典的過程中不能忽略現代醫學證據的積累與發展。研究者認為目前中醫藥臨床研究基礎薄弱,如研究目標不明確、方法選擇不恰當、實施與質量控制不到位、結果展示不規范、證據轉化應用不足,以及中醫藥臨床研究適宜方法有待探索[27]。但近年來越來越多的中醫領域的高質量臨床研究發表在頂級期刊上,極大地增加了中醫臨床研究者信心。中醫研究者需更加重視臨床研究,不斷提高研究質量和水平,才能進一步為中醫臨床實踐指南的推薦意見夯實證據基礎[27]。
科學合理的證據質量及推薦意見分級標準能夠為中醫實踐者進行快速決策提供有效參考,采用科學透明且實用性強的證據質量及推薦意見分級標準是中醫領域指南科學發展的必然要求。中醫標準化、現代化不可盲目,中醫證據研究者應與臨床實踐者通力合作、充分討論溝通,根據特定指南的需求針對性地選用或調整證據質量與推薦意見分級標準,透明、嚴謹地制訂臨床實踐指南,以期更好地服務于臨床決策。