本文對比呈現了 CONSORT 工作組有關隨機對照試驗與單病例隨機對照試驗報告規范的條目,將 GRADE 證據質量評估理念與單病例隨機對照試驗原理結合探索,進一步發展單病例隨機對照試驗方法學,以期將來在疾病的臨床研究中廣泛應用單病例隨機對照試驗方法。
引用本文: 李江, 翟靜波, 商洪才, 楊克虎, 田金徽, 陳靜, 代敏. 單病例隨機對照試驗的證據級別和報告規范. 中國循證醫學雜志, 2017, 17(5): 612-615. doi: 10.7507/1672-2531.201701074 復制
循證醫學研究的最終目的是為臨床實踐提供高質量的證據,所以對臨床研究證據進行質量分級,篩選出高質量的證據是循證醫學研究的一項重要內容[1]。作為一種個體化的臨床研究設計,單病例隨機對照試驗(N-of-1 trial)的證據級別將影響其在循證醫學研究中的作用和應用范圍。本文目的是介紹單病例隨機對照試驗在證據金字塔中的級別以及報告規范,為研究者開展高質量的單病例隨機對照試驗提供參考依據。
1 單病例隨機對照試驗的證據級別及引入 GRADE 評價方法的思考
單病例隨機對照試驗是針對單個患者或者一系列的單個患者所設計,設置多輪試驗期與對照期交替的前瞻性臨床隨機交叉對照試驗。加拿大 McMaster 大學 Gordon 教授指出,在最新的證據金字塔中,單病例隨機對照試驗處于臨床研究證據級別的最高等級,隨機對照試驗的系統評價處于第二位(圖 1)[2]。由此可見,單病例隨機對照試驗證據對于臨床實踐具有重要指導作用。但是,這種證據級別并非固定不變。當某些單病例隨機對照試驗存在研究缺陷或不足時,研究者需要考慮降低這些單病例隨機對照試驗的證據級別。所以,開發適用于單病例隨機對照試驗證據質量評估工具有利于篩選最佳的單病例隨機對照試驗證據。

1979 年,加拿大定期體檢特別工作組(Canadian Task Force on the Periodic Health Examination,CTFPHE)首次對研究證據進行系統分級、給出推薦意見[3]。此后,多個機構和組織也提出了各自的證據質量和推薦強度的標準,但是方法各異,標準不一,甚至彼此矛盾。直到 2004 年,由“推薦等級的評估、制定與評價”(The Grading of Recommendations Assessment,Development and Evaluation,GRADE)工作組推出國際統一的證據分級和推薦意見標準,包括 WHO 和 Cochrane 協作網在內的 28 個國際組織、協會已采納 GRADE 標準,成為證據發展史上的里程碑事件,為其他領域證據分級和推薦強度提供了示范標準,目前所列出的則是平行隨機對照試驗中每種結局指標所產生的證據質量(表 1)[4]。

GRADE 突破了過去主要從研究設計角度考慮證據質量的局限性,不僅綜合考慮研究設計,也對研究質量層層把關,以確保研究結果的一致性和證據的直接性[5],故單病例隨機對照試驗使用 GRADE 方法進行研究質量的把關,能夠使所得結果證據更加具備說服力。但是,目前為止,尚未發現用于單病例隨機對照試驗證據質量評估的 GRADE 工具面世。GRADE 強調對于結局指標的評價,按照重要性的不同分為不同的等級。單病例隨機對照試驗因針對單個受試者,且又是治療性的一種試驗,能夠與 GRADE 強調結局指標的思想高度契合。另外,單病例隨機對照試驗樣本量較小,對于單個患者要求在試驗結束后確定一種能夠長期使用的治療方案而言,GRADE 又提倡在充分權衡不同治療方案利弊基礎上的平衡利弊,更能凸現兩者結合后的特色和優勢。
2 單病例隨機對照試驗的報告規范
除單病例隨機對照試驗證據本身的質量以外,另外一個影響將單病例隨機對照試驗證據用于臨床實踐的因素是單病例隨機對照試驗的報告規范。CONSORT 2010 聲明是用于規范隨機對照臨床試驗報告的工具。目前,CONSORT 2010 聲明已廣泛用于規范隨機對照臨床試驗文章的發表,被美國患者療效研究所(Patient-Centered Outcomes Research Institute,PCORI)評為 20 世紀醫學頂尖研究發展中的里程碑之一[6]。但是,CONSORT 2010 聲明并不完全適用于單病例隨機對照試驗的報告。
面對這一困境,加拿大阿爾伯特大學 Sunita 教授和渥太華大學 David 教授在 2011 年提出制作單病例隨機對照試驗報告規范的構想,并集結全球多個國家的眾多學科專家開展相關研究。2015 年 6 月,用于單病例隨機對照試驗報告規范的 CENT 聲明在British Medical Journal、Journal of Clinical Epidemiology等雜志公開發布[7]。美國質量衛生保健局(AHRQ)、國立衛生研究院(NIH)和 CONSORT 協作組等都認為,CENT 規范將會加快單病例隨機對照試驗的應用和推廣。CENT 聲明有利于規范單病例隨機對照試驗的設計和實施,推進個體化臨床研究的發展。目前,已有多個國家的研究人員,對 CENT 聲明及其延伸課題做著進一步的研究。
CNET 聲明來源仍然是基于 CONSORT 聲明。為使讀者能夠清楚地了解 CENT 規范的結構及內容,我們列出了 CONSORT 聲明和 CENT 聲明條目的對比分析結果(表 2)。


CENT 在 CONSORT 基礎上增加了特色的三條,如表中 CENT 欄 12c,14b 和 17,均是針對單病例隨機對照系列試驗而言。隨機對照試驗中的附加統計分析方法(12b)和結果估計時對于二分類變量的結局提供相對效應值和絕對效應值是不適用于單病例隨機對照試驗的。
3 小結
單病例隨機對照試驗的證據級別處于證據金字塔的頂端,但是,與 RCT 相似,在使用單病例隨機對照試驗證據之前,仍需對其質量進行評估。盡管 CENT 聲明可以用于規范單病例隨機對照試驗的報告,但尚不能用于單病例隨機對照試驗的質量評估和分級。Jadad 量表是評估 RCT 研究質量的常用工具。從 Jadad 量表的條目判斷,Jadad 量表可以用于單病例隨機對照試驗的質量評價。但尚未見到相關報道,同時,Jadad 量表也存在不足,尚待完善[8]。GRADE 在評估試驗質量時,考慮到了試驗過程中的多個重要環節。但是,由于設計的差異,如何采用 GRADE 方法評價單病例隨機對照試驗的質量仍需進一步深入研究。基于 GRADE 的單病例隨機對照試驗證據質量評估和分級工具開發是今后單病例隨機對照試驗質量評估研究的一個重要方向。
循證醫學研究的最終目的是為臨床實踐提供高質量的證據,所以對臨床研究證據進行質量分級,篩選出高質量的證據是循證醫學研究的一項重要內容[1]。作為一種個體化的臨床研究設計,單病例隨機對照試驗(N-of-1 trial)的證據級別將影響其在循證醫學研究中的作用和應用范圍。本文目的是介紹單病例隨機對照試驗在證據金字塔中的級別以及報告規范,為研究者開展高質量的單病例隨機對照試驗提供參考依據。
1 單病例隨機對照試驗的證據級別及引入 GRADE 評價方法的思考
單病例隨機對照試驗是針對單個患者或者一系列的單個患者所設計,設置多輪試驗期與對照期交替的前瞻性臨床隨機交叉對照試驗。加拿大 McMaster 大學 Gordon 教授指出,在最新的證據金字塔中,單病例隨機對照試驗處于臨床研究證據級別的最高等級,隨機對照試驗的系統評價處于第二位(圖 1)[2]。由此可見,單病例隨機對照試驗證據對于臨床實踐具有重要指導作用。但是,這種證據級別并非固定不變。當某些單病例隨機對照試驗存在研究缺陷或不足時,研究者需要考慮降低這些單病例隨機對照試驗的證據級別。所以,開發適用于單病例隨機對照試驗證據質量評估工具有利于篩選最佳的單病例隨機對照試驗證據。

1979 年,加拿大定期體檢特別工作組(Canadian Task Force on the Periodic Health Examination,CTFPHE)首次對研究證據進行系統分級、給出推薦意見[3]。此后,多個機構和組織也提出了各自的證據質量和推薦強度的標準,但是方法各異,標準不一,甚至彼此矛盾。直到 2004 年,由“推薦等級的評估、制定與評價”(The Grading of Recommendations Assessment,Development and Evaluation,GRADE)工作組推出國際統一的證據分級和推薦意見標準,包括 WHO 和 Cochrane 協作網在內的 28 個國際組織、協會已采納 GRADE 標準,成為證據發展史上的里程碑事件,為其他領域證據分級和推薦強度提供了示范標準,目前所列出的則是平行隨機對照試驗中每種結局指標所產生的證據質量(表 1)[4]。

GRADE 突破了過去主要從研究設計角度考慮證據質量的局限性,不僅綜合考慮研究設計,也對研究質量層層把關,以確保研究結果的一致性和證據的直接性[5],故單病例隨機對照試驗使用 GRADE 方法進行研究質量的把關,能夠使所得結果證據更加具備說服力。但是,目前為止,尚未發現用于單病例隨機對照試驗證據質量評估的 GRADE 工具面世。GRADE 強調對于結局指標的評價,按照重要性的不同分為不同的等級。單病例隨機對照試驗因針對單個受試者,且又是治療性的一種試驗,能夠與 GRADE 強調結局指標的思想高度契合。另外,單病例隨機對照試驗樣本量較小,對于單個患者要求在試驗結束后確定一種能夠長期使用的治療方案而言,GRADE 又提倡在充分權衡不同治療方案利弊基礎上的平衡利弊,更能凸現兩者結合后的特色和優勢。
2 單病例隨機對照試驗的報告規范
除單病例隨機對照試驗證據本身的質量以外,另外一個影響將單病例隨機對照試驗證據用于臨床實踐的因素是單病例隨機對照試驗的報告規范。CONSORT 2010 聲明是用于規范隨機對照臨床試驗報告的工具。目前,CONSORT 2010 聲明已廣泛用于規范隨機對照臨床試驗文章的發表,被美國患者療效研究所(Patient-Centered Outcomes Research Institute,PCORI)評為 20 世紀醫學頂尖研究發展中的里程碑之一[6]。但是,CONSORT 2010 聲明并不完全適用于單病例隨機對照試驗的報告。
面對這一困境,加拿大阿爾伯特大學 Sunita 教授和渥太華大學 David 教授在 2011 年提出制作單病例隨機對照試驗報告規范的構想,并集結全球多個國家的眾多學科專家開展相關研究。2015 年 6 月,用于單病例隨機對照試驗報告規范的 CENT 聲明在British Medical Journal、Journal of Clinical Epidemiology等雜志公開發布[7]。美國質量衛生保健局(AHRQ)、國立衛生研究院(NIH)和 CONSORT 協作組等都認為,CENT 規范將會加快單病例隨機對照試驗的應用和推廣。CENT 聲明有利于規范單病例隨機對照試驗的設計和實施,推進個體化臨床研究的發展。目前,已有多個國家的研究人員,對 CENT 聲明及其延伸課題做著進一步的研究。
CNET 聲明來源仍然是基于 CONSORT 聲明。為使讀者能夠清楚地了解 CENT 規范的結構及內容,我們列出了 CONSORT 聲明和 CENT 聲明條目的對比分析結果(表 2)。


CENT 在 CONSORT 基礎上增加了特色的三條,如表中 CENT 欄 12c,14b 和 17,均是針對單病例隨機對照系列試驗而言。隨機對照試驗中的附加統計分析方法(12b)和結果估計時對于二分類變量的結局提供相對效應值和絕對效應值是不適用于單病例隨機對照試驗的。
3 小結
單病例隨機對照試驗的證據級別處于證據金字塔的頂端,但是,與 RCT 相似,在使用單病例隨機對照試驗證據之前,仍需對其質量進行評估。盡管 CENT 聲明可以用于規范單病例隨機對照試驗的報告,但尚不能用于單病例隨機對照試驗的質量評估和分級。Jadad 量表是評估 RCT 研究質量的常用工具。從 Jadad 量表的條目判斷,Jadad 量表可以用于單病例隨機對照試驗的質量評價。但尚未見到相關報道,同時,Jadad 量表也存在不足,尚待完善[8]。GRADE 在評估試驗質量時,考慮到了試驗過程中的多個重要環節。但是,由于設計的差異,如何采用 GRADE 方法評價單病例隨機對照試驗的質量仍需進一步深入研究。基于 GRADE 的單病例隨機對照試驗證據質量評估和分級工具開發是今后單病例隨機對照試驗質量評估研究的一個重要方向。