個體內臨床試驗(within person trial)是一種高效的隨機對照試驗研究設計,廣泛應用于口腔醫學、皮膚病學和眼科學領域。然而,由于存在一系列特有方法學難點,個體內臨床試驗的設計、實施與報告往往需要研究人員具備更多方法學知識、進行更全面的考量。為規范和提高這類臨床試驗的報告質量,BMJ 近期發表了臨床試驗報告統一標準:個體內臨床試驗擴展聲明(CONSORT for Within Person Trials)。本文旨在對 CONSORT for WPT 進行解讀,以促進其在國內研究人員中的理解與應用。
引用本文: 花放, 賀紅. 個體內臨床試驗報告規范(CONSORT for WPT)解讀. 中國循證醫學雜志, 2018, 18(9): 1001-1006. doi: 10.7507/1672-2531.201804086 復制
高質量隨機對照試驗(randomized controlled trial,RCT)是證據等級最高的臨床研究設計[1]。雖然研究中大部分 RCT 采用平行分組設計(parallel-group design),即以個體為單位將研究對象隨機分配到各干預組[2],但在一些 RCT 中隨機化的單位不是個體而是器官(或人體的其他組成部分)。常見者包括口腔醫學領域的分口試驗(split-mouth trial)[3, 4]、皮膚病學領域的分臉或分體試驗(split face/split body trial)[5, 6]及眼科學領域的對側研究(contralateral study)[7, 8]等。長期以來這類 RCT 在醫學界沒有統一的名稱,Pandis 等[9]參考 Cochrane 眼科與視力組的表述方法[10],將其命名為個體內臨床試驗(within person trial,WPT)。
相對于平行分組設計 RCT,WPT 雖然效率更高但其設計與實施有一系列方法學難點。因此,高質量的 WPT 研究報告對相關研究證據的應用與轉化來說至關重要。但有研究顯示,近年已發表的 WPT 文獻存在嚴重的報告不完整和不清晰問題[10, 11]。鑒于此,臨床試驗報告統一標準(CONSORT)團隊于 2017 年發表了 CONSORT 2010 個體內臨床試驗擴展聲明(CONSORT for WPT),以規范和提高 WPT 文章的報告質量[9]。本文對 WPT 的方法學特點,以及 CONSORT for WPT 報告規范的主要內容進行介紹與解讀,以期為國內研究人員撰寫高質量的 WPT 文章提供參考。
1 CONSORT for WPT 的制訂背景
1.1 WPT 的方法學特點
與平行分組設計 RCT 相比,WPT 最主要的優勢在于其高效性。其自身對照、配對分析的特點減小了個體差異對效應量估計值的影響,使得其理論上只需平行分組設計二分之一的樣本量即可獲得與平行分組相當的統計學效能[12]。但與此同時,WPT 也存在一些特有的方法學難點或局限,需要研究人員和臨床醫師注意[9, 12, 13](表 1)。

首先,當 WPT 中存在跨界效應(carry-across effects),即施加于身體(或某部位)一側的臨床干預可影響到身體(或某部位)的另一側時,療效評價結果將出現嚴重偏倚(傾向于低估不同干預間的差異)。在研究的前期準備階段,預計跨界效應無法避免時,研究人員不應選用 WPT 設計進行研究。
其次,對在不同時間點施加各項臨床干預的 WPT,若先施加干預對后施加干預的效果有影響,或所研究疾病的病情隨時間推移會產生較大變化時,則造成時期效應(period effects),導致研究結果的可靠性降低。這一點對于采用患者報告的結局指標(patient-reported outcomes)的 WPT 尤為明顯。
第三,雖然 WPT 理論上需要的樣本量較小,但由于其設計要求疾病在受試者身體不同部位(或兩側)之間的分布和嚴重程度均勻、可比,導致受試者招募的實際難度較大。這同時也是制約 WPT 研究結果外推性的一個因素。
第四,由于 WPT 涉及來自同一患者多個部位、甚至同一部位多個位點(或多次測量)的數據,因此往往需要根據具體的研究設計與特點,選用廣義估計方程(generalized estimation equation)、多水平模型(multilevel models)等相對復雜的統計方法進行分析,從而對數據的群組效應(clustering effects)給予適當處理。
1.2 WPT 的報告質量
近年來專門針對 WPT 報告質量的研究不多,但均顯示已發表的 WPT 論文存在嚴重的報告不完整、不清晰問題。Lesaffre 等[11]對 34 篇分口試驗的報告質量進行了評價,發現其中只有 14 篇(41%)報告了隨機分配序列的產生方法,只有 9 篇(26%)報告了分配隱藏的機制。Scherer 等[10]分析了 60 篇眼科領域的 WPT,發現其中不到一半說明了采用個體內設計的理由(42%),或與同一個體左右眼可比性有關的合格標準(48%)。這些研究結果提示 WPT 的報告亟待規范和標準化。
1.3 CONSORT for WPT 的制訂過程
CONSORT for WPT 報告規范擴展的制訂工作組于 2013 年成立,由 5 名來自口腔醫學、整形外科學、眼科學和醫學研究方法學領域的專家組成。制訂的過程主要是通過多次集體遠程會議和部分成員面對面會議進行[9]。
2 CONSORT for WPT 的核心內容
以平行分組設計 RCT 為主要對象的 CONSORT 2010 聲明共包含 37 個條目[14, 15]。CONSORT for WPT 擴展聲明對其中涉及標題、摘要、方法和結果部分的 16 個條目進行了補充修訂(表 2)。本文主要對這 16 個條目的核心內容進行介紹。

2.1 標題
文章的標題應明確表明該研究為隨機 WPT(或本專業公認的其他術語,如:分口試驗),從而幫助讀者尤其是系統評價研究者快速、準確地識別其研究設計。當條件允許時,WPT 論文的標題還應包括相應的 PICO 信息,即研究的受試者、臨床干預措施、對照措施和結局指標。可采用如下表述:“A(研究組干預)與 B(對照組干預)治療……(目標疾病)的比較:一項隨機個體內臨床試驗”。
2.2 摘要
在 CONSORT for Abstracts 摘要報告指南[16, 17]的基礎上,CONSORT for WPT 為 WPT 摘要的報告制訂了專門的報告清單(表 3)。清單共包括 17 個條目,主要強調除個體層面(person level)外,還需報告身體部位層面(body site level)的各項關鍵信息,例如身體部位的合格標準、干預分配方式、以及接受隨機和納入數據分析的個數等。

2.3 方法
在研究方法方面,WPT 論文應著重報告以下幾個方面:
2.3.1 研究設計
應闡明為什么采用 WPT 設計進行這項研究是合適、可靠的,各個身體部位在納入之前是如何識別、篩選的(條目 3a)。在受試者個體和身體部位兩個水平上分別報告具體的納入與排除標準,其中應包括與同一個體內不同部位之間可比性有關的合格標準(條目 4a)。
2.3.2 干預措施
參考 TIDieR(Template for Intervention Description and Replication)報告清單對各項干預的細節進行描述[18]。著重介紹不同的干預是同時給予還是先后給予的,以及是否采取了任何措施來避免跨界效應(如果有,應給出采取這種措施的原因)(條目 5)。
2.3.3 結局指標
報告各個結局指標具體的測量時間點和測量方法,以及是在個體層面還是部位層面測量的(條目 6a)。對于在同一時間點給予不同干預的 WPT,應說明不同身體部位的測量是如何做到相互獨立的;對于先后給予不同干預的 WPT,則應重點講明結局指標的測量是在施加每項干預后分別進行的,還是在全部干預施加完畢后統一開展的。當存在多個結局指標或多個追蹤時長時,應明確說明哪些數據用于主要統計分析。
2.3.4 樣本量計算
提供重復該計算所需的各項具體信息,包括是否將不同部位間的相關性納入考量(條目 7a)。可以采用如下表述:“在樣本量計算過程中,我們針對數據的配對屬性/相關性進行了相應校正。假設兩組的標準差均為 X,且同一個體內不同部位間……(主要結局指標)的相關系數為 Y,α=0.05,統計學功效 80%,則樣本量為每組 Z 名受試者。”
2.3.5 隨機化
報告確定隨機分配序列的方法(條目 8b),以及隨機化各步驟由誰來完成(條目 10)。這些信息有助于讀者判斷跨界效應、時期效應等對 WPT 結果的潛在影響,以及納入研究的不同部位在基線特征、治療時點、隨訪周期等方面是否具有可比性。
2.3 結果
在論文結果部分,作者應采用流程圖報告各組各階段納入、脫落、被剔除受試者人數和身體部位個數(條目 13a),采用表格報告各組受試者和身體部位的基線數據(條目 15)。
對于針對各個結局指標的數據分析,作者應分別報告其相應的受試者和身體部位數目,以及所采用的分組分析方法,例如意向性分析(intention-to-treat)或符合方案分析(per protocol)(條目 16)。
在報告結局和估計值時,除報告各主次要結局指標在各組的結果、效應估計值和精確度外,對于主要結局指標采用連續性變量的,作者應提供不同身體部位間的相關系數(correlation coefficient);對于主要結局指標采用二分類變量的,還應給出配對結果表格(條目 17a)。這些數據有利于將 WPT 結果納入后期 Meta 分析中,也有助于后期相關臨床試驗的樣本量計算。
此外,在報告研究過程中出現了危害和不良反應時[19],應當明確說明其是在個體層面還是身體部位層面出現的(條目 19)。
3 討論
CONSORT 報告規范目前已得到大部分國際權威醫學期刊的認可[20, 21],其對 RCT 報告質量的提升作用也已在大量研究中得到驗證[22, 23]。Pandis 等[24]和 Hopewell 等[25]的研究發現,當醫學期刊編輯通過積極措施確保 CONSORT 報告規范的使用時,RCT 類稿件的報告質量可以得到顯著提升。
CONSORT for WPT 和 CONSORT for Cluster Randomized Trials[26]、CONSORT for Non-pharmacologic Treatments[27]等其他 CONSORT 報告規范擴展一樣,是對 CONSORT 2010 報告規范的有益補充。其制訂與發布有利于提升 WPT 類研究報告的報告質量,促進高質量 WPT 成果向臨床實踐轉化,減少與醫學研究報告有關的可避免的研究浪費[28]。
不過,CONSORT for WPT 規范仍存在其局限性:① 其制訂過程與 COS-STAR[29]、GRIPP 2[30]等近年新制訂的報告規范不同,僅基于工作組內部專家意見,未采用德爾菲法(Delphi)對更多相關領域專家的共識進行系統性采集與總結;② 其報告清單中的條目 12a(“用于比較各組主要和次要結局指標的統計學方法,且該方法適用于個體內設計”)可能存在混淆報告質量與方法學質量的錯誤[31]。
近年來研究顯示,當前中文期刊 RCT 的報告質量仍有待提高[32, 33]。因此,我們建議國內口腔醫學、皮膚病學和眼科學期刊在了解 CONSORT for WPT 報告規范優勢和局限性的基礎上,將 CONSORT for WPT 報告規范納入其稿約或作者須知,并采取積極措施促進 CONSORT for WPT 在本領域的傳播與應用。
高質量隨機對照試驗(randomized controlled trial,RCT)是證據等級最高的臨床研究設計[1]。雖然研究中大部分 RCT 采用平行分組設計(parallel-group design),即以個體為單位將研究對象隨機分配到各干預組[2],但在一些 RCT 中隨機化的單位不是個體而是器官(或人體的其他組成部分)。常見者包括口腔醫學領域的分口試驗(split-mouth trial)[3, 4]、皮膚病學領域的分臉或分體試驗(split face/split body trial)[5, 6]及眼科學領域的對側研究(contralateral study)[7, 8]等。長期以來這類 RCT 在醫學界沒有統一的名稱,Pandis 等[9]參考 Cochrane 眼科與視力組的表述方法[10],將其命名為個體內臨床試驗(within person trial,WPT)。
相對于平行分組設計 RCT,WPT 雖然效率更高但其設計與實施有一系列方法學難點。因此,高質量的 WPT 研究報告對相關研究證據的應用與轉化來說至關重要。但有研究顯示,近年已發表的 WPT 文獻存在嚴重的報告不完整和不清晰問題[10, 11]。鑒于此,臨床試驗報告統一標準(CONSORT)團隊于 2017 年發表了 CONSORT 2010 個體內臨床試驗擴展聲明(CONSORT for WPT),以規范和提高 WPT 文章的報告質量[9]。本文對 WPT 的方法學特點,以及 CONSORT for WPT 報告規范的主要內容進行介紹與解讀,以期為國內研究人員撰寫高質量的 WPT 文章提供參考。
1 CONSORT for WPT 的制訂背景
1.1 WPT 的方法學特點
與平行分組設計 RCT 相比,WPT 最主要的優勢在于其高效性。其自身對照、配對分析的特點減小了個體差異對效應量估計值的影響,使得其理論上只需平行分組設計二分之一的樣本量即可獲得與平行分組相當的統計學效能[12]。但與此同時,WPT 也存在一些特有的方法學難點或局限,需要研究人員和臨床醫師注意[9, 12, 13](表 1)。

首先,當 WPT 中存在跨界效應(carry-across effects),即施加于身體(或某部位)一側的臨床干預可影響到身體(或某部位)的另一側時,療效評價結果將出現嚴重偏倚(傾向于低估不同干預間的差異)。在研究的前期準備階段,預計跨界效應無法避免時,研究人員不應選用 WPT 設計進行研究。
其次,對在不同時間點施加各項臨床干預的 WPT,若先施加干預對后施加干預的效果有影響,或所研究疾病的病情隨時間推移會產生較大變化時,則造成時期效應(period effects),導致研究結果的可靠性降低。這一點對于采用患者報告的結局指標(patient-reported outcomes)的 WPT 尤為明顯。
第三,雖然 WPT 理論上需要的樣本量較小,但由于其設計要求疾病在受試者身體不同部位(或兩側)之間的分布和嚴重程度均勻、可比,導致受試者招募的實際難度較大。這同時也是制約 WPT 研究結果外推性的一個因素。
第四,由于 WPT 涉及來自同一患者多個部位、甚至同一部位多個位點(或多次測量)的數據,因此往往需要根據具體的研究設計與特點,選用廣義估計方程(generalized estimation equation)、多水平模型(multilevel models)等相對復雜的統計方法進行分析,從而對數據的群組效應(clustering effects)給予適當處理。
1.2 WPT 的報告質量
近年來專門針對 WPT 報告質量的研究不多,但均顯示已發表的 WPT 論文存在嚴重的報告不完整、不清晰問題。Lesaffre 等[11]對 34 篇分口試驗的報告質量進行了評價,發現其中只有 14 篇(41%)報告了隨機分配序列的產生方法,只有 9 篇(26%)報告了分配隱藏的機制。Scherer 等[10]分析了 60 篇眼科領域的 WPT,發現其中不到一半說明了采用個體內設計的理由(42%),或與同一個體左右眼可比性有關的合格標準(48%)。這些研究結果提示 WPT 的報告亟待規范和標準化。
1.3 CONSORT for WPT 的制訂過程
CONSORT for WPT 報告規范擴展的制訂工作組于 2013 年成立,由 5 名來自口腔醫學、整形外科學、眼科學和醫學研究方法學領域的專家組成。制訂的過程主要是通過多次集體遠程會議和部分成員面對面會議進行[9]。
2 CONSORT for WPT 的核心內容
以平行分組設計 RCT 為主要對象的 CONSORT 2010 聲明共包含 37 個條目[14, 15]。CONSORT for WPT 擴展聲明對其中涉及標題、摘要、方法和結果部分的 16 個條目進行了補充修訂(表 2)。本文主要對這 16 個條目的核心內容進行介紹。

2.1 標題
文章的標題應明確表明該研究為隨機 WPT(或本專業公認的其他術語,如:分口試驗),從而幫助讀者尤其是系統評價研究者快速、準確地識別其研究設計。當條件允許時,WPT 論文的標題還應包括相應的 PICO 信息,即研究的受試者、臨床干預措施、對照措施和結局指標。可采用如下表述:“A(研究組干預)與 B(對照組干預)治療……(目標疾病)的比較:一項隨機個體內臨床試驗”。
2.2 摘要
在 CONSORT for Abstracts 摘要報告指南[16, 17]的基礎上,CONSORT for WPT 為 WPT 摘要的報告制訂了專門的報告清單(表 3)。清單共包括 17 個條目,主要強調除個體層面(person level)外,還需報告身體部位層面(body site level)的各項關鍵信息,例如身體部位的合格標準、干預分配方式、以及接受隨機和納入數據分析的個數等。

2.3 方法
在研究方法方面,WPT 論文應著重報告以下幾個方面:
2.3.1 研究設計
應闡明為什么采用 WPT 設計進行這項研究是合適、可靠的,各個身體部位在納入之前是如何識別、篩選的(條目 3a)。在受試者個體和身體部位兩個水平上分別報告具體的納入與排除標準,其中應包括與同一個體內不同部位之間可比性有關的合格標準(條目 4a)。
2.3.2 干預措施
參考 TIDieR(Template for Intervention Description and Replication)報告清單對各項干預的細節進行描述[18]。著重介紹不同的干預是同時給予還是先后給予的,以及是否采取了任何措施來避免跨界效應(如果有,應給出采取這種措施的原因)(條目 5)。
2.3.3 結局指標
報告各個結局指標具體的測量時間點和測量方法,以及是在個體層面還是部位層面測量的(條目 6a)。對于在同一時間點給予不同干預的 WPT,應說明不同身體部位的測量是如何做到相互獨立的;對于先后給予不同干預的 WPT,則應重點講明結局指標的測量是在施加每項干預后分別進行的,還是在全部干預施加完畢后統一開展的。當存在多個結局指標或多個追蹤時長時,應明確說明哪些數據用于主要統計分析。
2.3.4 樣本量計算
提供重復該計算所需的各項具體信息,包括是否將不同部位間的相關性納入考量(條目 7a)。可以采用如下表述:“在樣本量計算過程中,我們針對數據的配對屬性/相關性進行了相應校正。假設兩組的標準差均為 X,且同一個體內不同部位間……(主要結局指標)的相關系數為 Y,α=0.05,統計學功效 80%,則樣本量為每組 Z 名受試者。”
2.3.5 隨機化
報告確定隨機分配序列的方法(條目 8b),以及隨機化各步驟由誰來完成(條目 10)。這些信息有助于讀者判斷跨界效應、時期效應等對 WPT 結果的潛在影響,以及納入研究的不同部位在基線特征、治療時點、隨訪周期等方面是否具有可比性。
2.3 結果
在論文結果部分,作者應采用流程圖報告各組各階段納入、脫落、被剔除受試者人數和身體部位個數(條目 13a),采用表格報告各組受試者和身體部位的基線數據(條目 15)。
對于針對各個結局指標的數據分析,作者應分別報告其相應的受試者和身體部位數目,以及所采用的分組分析方法,例如意向性分析(intention-to-treat)或符合方案分析(per protocol)(條目 16)。
在報告結局和估計值時,除報告各主次要結局指標在各組的結果、效應估計值和精確度外,對于主要結局指標采用連續性變量的,作者應提供不同身體部位間的相關系數(correlation coefficient);對于主要結局指標采用二分類變量的,還應給出配對結果表格(條目 17a)。這些數據有利于將 WPT 結果納入后期 Meta 分析中,也有助于后期相關臨床試驗的樣本量計算。
此外,在報告研究過程中出現了危害和不良反應時[19],應當明確說明其是在個體層面還是身體部位層面出現的(條目 19)。
3 討論
CONSORT 報告規范目前已得到大部分國際權威醫學期刊的認可[20, 21],其對 RCT 報告質量的提升作用也已在大量研究中得到驗證[22, 23]。Pandis 等[24]和 Hopewell 等[25]的研究發現,當醫學期刊編輯通過積極措施確保 CONSORT 報告規范的使用時,RCT 類稿件的報告質量可以得到顯著提升。
CONSORT for WPT 和 CONSORT for Cluster Randomized Trials[26]、CONSORT for Non-pharmacologic Treatments[27]等其他 CONSORT 報告規范擴展一樣,是對 CONSORT 2010 報告規范的有益補充。其制訂與發布有利于提升 WPT 類研究報告的報告質量,促進高質量 WPT 成果向臨床實踐轉化,減少與醫學研究報告有關的可避免的研究浪費[28]。
不過,CONSORT for WPT 規范仍存在其局限性:① 其制訂過程與 COS-STAR[29]、GRIPP 2[30]等近年新制訂的報告規范不同,僅基于工作組內部專家意見,未采用德爾菲法(Delphi)對更多相關領域專家的共識進行系統性采集與總結;② 其報告清單中的條目 12a(“用于比較各組主要和次要結局指標的統計學方法,且該方法適用于個體內設計”)可能存在混淆報告質量與方法學質量的錯誤[31]。
近年來研究顯示,當前中文期刊 RCT 的報告質量仍有待提高[32, 33]。因此,我們建議國內口腔醫學、皮膚病學和眼科學期刊在了解 CONSORT for WPT 報告規范優勢和局限性的基礎上,將 CONSORT for WPT 報告規范納入其稿約或作者須知,并采取積極措施促進 CONSORT for WPT 在本領域的傳播與應用。