為提高對實效性隨機對照試驗(pRCT)的認識,促進此類試驗的高質量實施,為研究者科學開展此類試驗提供技術指導,中國真實世界數據與研究聯盟(ChinaREAL)工作組特制訂本技術規范。本技術規范從 pRCT 的概念與適用范圍、策劃與研究設計、研究實施、數據管理與質量控制、統計分析和倫理學考慮多個方面做出技術上的說明,強調在策劃和設計上應從研究目的出發來考慮其研究場所與環境、患者人群、干預措施、對照、結局指標、隨訪等方面要素。同時,該規范推薦以個體實效性隨機對照試驗為基礎進行不同類型試驗設計的樣本量估算,也提出了研究實施中數據管理和質量控制的建議、統計分析的原則、各類型試驗設計的分析要求及倫理學上的考慮。
引用本文: 溫澤淮, 李玲, 劉艷梅, 郭曉慧, 李洪超, 郭新峰, 陳進, 陳曉凡, 費宇彤, 孫鑫, 代表中國真實世界數據與研究聯盟(ChinaREAL). 實效性隨機對照試驗的技術規范. 中國循證醫學雜志, 2019, 19(7): 794-802. doi: 10.7507/1672-2531.201904163 復制
真實世界研究已日益成為醫療衛生領域關注的焦點[1, 2]。基于真實世界數據的觀察性研究(如隊列研究和病例-對照研究)是真實世界研究的常用設計類型。但觀察性研究固有的問題諸如混雜因素、偏倚的影響,給干預與結局的因果關系推斷帶來了困擾。融合了隨機化和真實世界數據優勢的實效性隨機對照試驗(pragmatic randomized controlled trial,pRCT)因較好地控制了混雜和偏倚而為因果關系推斷提供了有效方法,其研究結果可為干預措施效果或比較效果評價提供最佳真實世界證據[3]。但目前對 pRCT 的認識、理解和應用還存在一些偏見和誤區,對如何開展高質量的 pRCT 也存在一定的疑惑。為此,中國真實世界數據與研究聯盟(ChinaREAL)工作組特制訂本技術規范,旨在促進更好地認識和開展 pRCT。本規范是真實世界數據與研究系列技術規范 5。
1 概念和適用范圍
若按研究目的劃分,干預性試驗可分為在不同治療方法中做出選擇的試驗(如實效性試驗)和驗證某種干預措施效力或生物學機制的試驗(如解釋性試驗)[4]。pRCT 是指在真實或接近真實醫療環境下,采用隨機、對照的設計比較臨床實踐中不同干預措施的治療結果(包括實際效果、比較效果、安全性或/和成本效益等)的研究[5]。pRCT 的目的是衡量某種干預措施在常規臨床實踐中的效果(effectiveness),而解釋性隨機對照試驗(exploratory randomized controlled trial,eRCT)則通常是評價某種干預措施在理想的、嚴格控制的環境下的效力(efficacy)。eRCT 適用于回答干預措施在理想條件下是否真正有效(效力)的問題,是藥物上市前或上市后效力評價的最佳設計[6, 7];pRCT 適用于回答干預措施在實際條件下效果大小的問題,是上市后藥品、醫療器械等進行效果評價的最佳證據。pRCT 和 eRCT 的主要區別見表 1。

實效性試驗是相對于解釋性試驗而言,除為新藥注冊提供效力證據的嚴格的解釋性試驗外,沒有絕對的實效性和解釋性之分。一般而言,每個研究都需根據其研究目的制定或選擇更傾向于解釋性或實效性的研究場所與環境、患者人群、干預措施、對照、結局指標、隨訪方式等。如何從不同維度區分解釋性和實效性試驗可采用 PRECIS-2 工具[8]進行評價。PRECIS-2 包含入選標準、招募、研究場所、組織、干預過程靈活性、治療依從靈活性、隨訪、主要結局和主要分析 9 個領域,每一領域以 1~5 分依次代表從很強解釋性至很強實效性之間的程度判斷(圖 1)。

2 研究策劃與研究設計
在 pRCT 中,能夠進行一種治療措施與另一措施在現實條件下的比較,或新治療措施與常規治療(可能多種)在特定條件下的比較。pRCT 常常涉及復雜干預,也常涉及到提供干預者的技巧和經驗[9],從而導致其在設計、實施和分析方面存在更多挑戰。因此,pRCT 的策劃和設計應從研究目的出發來考慮其研究場所與環境、患者人群、干預措施、對照、結局指標、隨訪等方面的設計選擇。在策劃 pRCT 時,可使用 PRECIS-2 工具[8]輔助進行不同研究要素的設計,從總體把握試驗的實效性程度。
2.1 研究目的
一般而言,實效性試驗的目的是評價某種干預措施在常規臨床實踐中的效果,為臨床或衛生政策決策提供證據,以期將干預措施納入現實世界臨床實踐之中[9]。在策劃和設計時應對目的了然于胸,并根據不同目的選擇合適的設計類型。
2.2 研究設計類型
2.2.1 常見設計類型
實效性隨機對照試驗的設計包括但不限于以下的類型:① 個體實效性隨機對照試驗(individual pRCT,ipRCT):即以個體為隨機分組單位的隨機對照試驗,此時以個體為觀測、實驗的單元,一般未做特殊聲明的 pRCT 均指此類;② 群組隨機對照試驗(cluster RCT,cRCT):以群組為隨機分組單位的隨機對照試驗,此時以群組為干預的單元[10]。群組可以是家庭、診所、醫院、學校或居民小區等。此類型設計的試驗,在數據分析時除考慮群組效應外,也將以個體為單位進行效果的評價和分析;③ 階梯楔形隨機對照試驗(stepped wedge RCT,swRCT):一種特殊的群組隨機對照試驗,常用于評價醫療衛生服務、衛生政策性的干預。在階梯楔形試驗中,群組在不同的開始時間(階梯式的)被隨機分配接受干預,采取各個群組“實驗式分階段引入(experimentally staged introduction)”[11]的方法,最終所有群組均會接受干預。這類試驗通常以一個基線數據采集的階段開始,一個或多個群組被隨機分配到從對照轉到試驗干預的安排,此時其余群組仍保留在對照,再逐階段隨機安排各個群組從對照轉到試驗干預的處理,試驗繼續進行直至最后階段所有群組均接受試驗干預。該設計通常用于無法同時安排所有群組分為接受干預或對照的試驗,所有群組均接受試驗干預且干預利大于弊,特別適合于需要觀察時間協變量的情況[12]。
2.2.2 設計類型的選擇
通常為了獲得真實世界環境下評價干預措施的最佳證據而采用 pRCT 設計,而 pRCT 中選擇哪一種設計類型則主要基于研究目的、研究問題和研究條件來考慮。從研究效率角度而言,研究設計以簡單高效為宜,所以一般先考慮采用 ipRCT。如果干預或對照措施實施個體間可能出現干擾或沾染(contamination),則應考慮采用 cRCT,即以群組方式進行干預或對照。當研究只能分階段先后實施時,可考慮采用 swRCT 設計。swRCT 是一種自身對照設計,但也應考慮干預措施是否利大于弊、干預療程與常規治療長短是否影響患者病情和有無延遲效應等因素。
此外,pRCT 設計中也可根據實際情況的需求考慮加入適應性設計(adaptive design)。比如,采用期中分析或成組序貫設計的 ipRCT。適應性設計除了統計學上、倫理上的優勢之外,因其設計上的靈活性而對增加藥物評價結果的外推性有一定優勢[13]。比如,適應性富集設計(adaptive enrichment design)的試驗有可能既評價預定人群的效果也觀察到相應亞組人群的效果。若 pCRT 中采用適應性設計,應事先計劃和充分權衡其優點和局限性。
2.3 研究場所與環境
pRCT 選取研究場所時,通常應考慮研究場所與干預措施應用的衛生機構的相似程度,即通常應考慮從研究結果可能被應用的類似衛生機構中選取研究場所。因此,pRCT 實施的場所和環境一般是使用常規療法的普通醫療機構、基層醫院、診所,而不僅僅是三甲醫院、專科特殊診所或專科醫療機構,且選取的研究場所應熟悉且能很好地應用這類干預措施。試驗的干預措施與其適用的環境之間密切匹配,這樣的環境能提供該干預措施直接適用的信息,從而有助于決策者選擇是否實施該干預措施[9]。但應注意:部分疑難雜癥、罕見病等則只能在特定大型綜合性醫院或專科醫院開展,這時應根據實際情況選取合適的研究場所和環境。
2.4 研究要素的設定
實效性試驗的研究要素可從 PICO(patient、intervention、comparison 和 outcome)模式、干預單元(或隨機化單位)及隨訪等方面考慮。
2.4.1 患者(P)
從實效性角度考慮,試驗結果應更具外推性(generalizability),因而研究對象應更廣泛并切合臨床實際情況,可能包含研究疾病的不同階段、分期、病理類型等,或包含復雜的合并疾病,也可能涵蓋不同的年齡層、各種生理、病理狀態或各類中醫證候或不同依從程度等。患者的招募條件也應盡量與干預措施的實際應用環境相吻合。
pRCT 通常在一項醫療干預措施上市后開展,故納入研究的患者通常是說明書中列出的適應癥患者。但在實際臨床治療過程中,超適應癥用藥(off-label use)的情況也普遍存在。超適應癥用藥的患者是否需要納入研究,應當根據研究目的及研究結果應用的政策環境來確定。
2.4.2 干預措施(I)
pRCT 所研究的干預措施包括藥物、醫療器械、復雜干預甚至衛生政策等較廣范圍,但限于本文篇幅,論述中僅能涉及藥物或醫療器械。理論上,pRCT 所研究的干預措施應已獲得效力(efficacy)證據,在此基礎上再開展干預措施在現實環境中應用的效果(effectiveness)研究。相比解釋性試驗,pRCT 中的干預措施可能更靈活,其標準化程度不及解釋性試驗的高,甚至可能更為復雜。比如根據患者不同的情況而使用不同劑量或成份作為試驗組措施。不少情況下,pRCT 中的研究措施疊加于常規治療之上。另外,常規療法可能由多種成分組成,試驗的干預方案可以是一次或逐步移除其中的一種或幾種成分,再與原來的常規療法對照,以便比較移除某些成分是否可提高成本-效益。
pRCT 中干預措施的執行通常靈活性和可變性更大,但研究者仍應對試驗中允許臨床醫生或患者合并用藥、改變劑量、換藥或停藥等條件或時間等做出必要的限定,也應描述試驗中比較的各干預措施,包括所用藥物的名稱、劑型、規格、用法、用量、治療頻率、療程、合并用藥和輔助治療等。當干預措施中包含的藥物有多個商品名(brand name)時,研究方案中應當明確試驗中使用藥物的通用名(generic name)、商品名和生產企業信息。在采用疊加設計(add-on design)時,研究方案中應同時明確常規治療或標準治療方法及合并用藥或輔助用藥的具體藥用特征。在傳統中醫療法或手術操作相關的干預措施中,衛生技術人員因素通常也會對干預結果帶來重要影響,必要時 pRCT 中也應對衛生技術操作者給出適當限定條件。
2.4.3 對照措施(C)
一般不采用安慰劑、假針刺及其他安慰措施做對照。倫理原則允許的話可以采用無治療作為對照,但也必須在現實環境下進行。實效性試驗中對照的選擇要考慮現實臨床實際情況,通常以常規治療、標準治療或公認有效的治療措施為對照,應切合實際應用環境,且這些常規醫療保健措施應是醫生已熟練掌握和應用的。在研究設計階段,建議研究者可通過調查疾病治療模式(treatment pattern)來了解所在研究環境中最常用的干預措施,并根據具體研究目的和所要回答的實際問題來選擇對照措施。
2.4.4 結局指標(O)
實效性試驗中的結局指標需根據研究的具體目的選擇,可包括有安全性、有效性、衛生經濟、治療依從性、患者滿意度、生存質量等。實效性試驗一般強調以病人為導向(patient-oriented)的臨床結局,常常包含與患者日常生活相關的整體健康獲益的結局,通常測量干預的遠期療效、功能變化、生存質量、衛生經濟學指標及遠期終點事件等[5]。從設計角度看,試驗評價的是干預措施的整體效果,而不是解釋干預各成分的效果;從實施角度看,結局指標在真實世界環境中應容易獲取和評測,否則就不太適合實效性試驗。pRCT 中結局指標的測量通常不應過于復雜,一般以只需要對研究者進行基本培訓和解釋即可操作為宜。如試驗中使用病人報告結局(patient-reported outcomes,PROs),則不需要專業人員評測。
2.4.5 干預單元
也稱實驗單元(experimental unit),是試驗中的隨機化單位(unit of randomization),指試驗中干預措施的作用對象(也是隨機分組的對象),因實際情況不同而有個體和群組之分。通常干預對象以個體為單位進行觀察,但當干預措施和對照措施在不同組別的個體間容易出現干擾時,就應采取以群組為干預單位的方式。例如,同一家庭成員分到不同的飲食干預組、同一班級同學采用不同干預措施而難以實施,或以太極拳為干預措施與普通日常活動對照時,對照組的個體容易受干擾而練習太極拳,從而無法很好保證對照組的依從性等。此時可以家庭、班級、學校或居民群組為單位(群組)進行干預和隨機分組,整個小區均接受相同的干預或對照措施,避免干預與對照措施的相互干擾。
2.4.6 隨訪
因評測注重遠期結局,實效性試驗一般隨訪時間相對較長,需進行多時點的結局測量。在研究方案中應明確指出試驗中隨訪次數和周期安排,通常 pRCT 的隨訪頻率低于解釋性臨床試驗,但可能高于現實診療過程中臨床醫生對患者的隨訪頻率。有些研究中,患者的隨訪可由相關臨床事件觸發(如高血壓患者因心梗或腦梗住院或死亡)。實效性試驗需要有嚴謹、積極的患者管理機制及鼓勵患者參加、提高其依從性的激勵措施。但試驗中對患者過多管理也會帶來患者治療依從性高于實際診療環境的問題,將損失研究結果的外部效度。因此,研究者需要在鼓勵患者積極參與以提高數據收集的完整性與盡量減少研究本身對患者治療依從性的影響之間進行綜合權衡。
2.5 樣本量估算
ipRCT 的樣本量估算原則與解釋性試驗無異,結合試驗的設計類型(如平行對照、交叉對照、析因設計)、比較類型(如優效性、等效性、非劣效性比較)、對照的選擇(如安慰劑、無治療、陽性對照等)、主要結局指標的數據屬性(如二分類、連續性數據),對效應量的統計檢驗提出假設,設定檢驗參數(單雙側檢驗、Ⅰ型和Ⅱ型錯誤)進行計算,并根據脫落率、依從性等具體情況進行適當調整[13]。因 pRCT 采用了更寬泛的篩選條件和實際臨床診療方案,可能會產生隨機后的混雜諸如根據個體反應差異調整的治療方案多樣性等,在研究設計時應考慮適當擴大樣本量[14]。cRCT 和 swRCT 的樣本量估算則建議以 ipRCT 為基礎,先計算 ipRCT 樣本量,再以各類型研究的設計效應(design effect)進行調整。基本上分為兩種情形—固定群組大小(cluster size)和固定群組數目(number of cluster)進行估算[12, 15]。樣本量估算考慮的因素除了干預措施、對照的效應大小及統計學檢驗參數外,還包括組內相關系數、群組大小、群組數目、結局測量次數和每階段群組數目(僅 swRCT)[11]。估算得出總體樣本量后,研究者需考慮在病人招募、實施難度和費用等方面的情況而適當調整群組數目和/或群組大小,而群組大小不宜過大或過小,一般以 50 例左右為常見。若 pCRT 中采用了適應性設計,樣本量估算同時應符合相應設計的原則和要求。
3 研究的實施
實效性試驗是一種提供了良好外部真實性又保持一定的內部真實性的試驗設計,相比于傳統的 eRCT,最大的挑戰是如何高質量實施。該類試驗的實施涉及到的數據管理和質量控制與傳統的隨機對照試驗在基本原則上是一致的,此處將不贅述。但實效性試驗的實施在以下方面有不同之處,需要多加注意。
3.1 研究者的招募
實效性試驗特別是 cRCT 和 swRCT,因是以群組為干預單位,通常需招募研究者(醫生)以整個診所為單位參加試驗。故研究者招募應該制訂適當的遴選條件,可能包括但不限于研究資質、常規技術水平、診所規模、設備等,以便保證群組的相對同質性(群組大小、群組特征、群內個體特征、技術水平相近),且在試驗過程中應采取適當激勵措施保持研究者對試驗的興趣。參加試驗的研究者應熟悉常規治療措施的使用、操作或實施,以配合試驗的順利開展。
3.2 研究對象的招募、篩選和入組
在 ipRCT 中,研究對象的招募、篩選和入組與傳統的 eRCT 沒有明顯區別。但在 cRCT、swRCT 中研究對象以群組方式招募入組,應適當注意滿足事先制訂的群組和個體的遴選條件。ipRCT 的研究對象篩選條件一般較為寬泛,以期增加其結果的外推性。cRCT、swRCT 的個體篩選則應同時滿足其所在群組和群組內個體的篩選條件,一般隨其所在的診所、醫院或居民小區而被納入招募和進行篩選,合格并經知情同意后才入組,簽署知情同意之前已經隨機分組和入組了,若不愿意參加試驗則退出研究。在研究實施中,研究者還需指明患者招募的方式和流程,應盡可能避免因招募方式和流程設計原因導致的選擇性偏倚。
3.3 研究對象的隨機分配
研究對象采用隨機分組是 pRCT 的必備設計要素,但因干預方式不同而會有所區別。在 ipRCT 中,研究對象以個體為單位進行隨機分組和接受干預處理;而在 cRCT 和 swRCT 中,研究對象以群組方式進行隨機分組和接受干預處理。當干預和對照措施在不同組別的個體間容易出現相互干擾時,應采取以群組單位為干預方式,并以群組為單位進行隨機分組。配對、分層隨機和簡單隨機的方法可用于 cRCT 的群組分配。不管是個體或群組方式,隨機分組中隨機序列產生、分配隱藏等規范化操作至為重要,建議采用中央隨機化方法或網絡交互式隨機分配系統(interactive web-based randomization system)。在有些 swRCT 中,研究對象可以群組分階段進入方式進行隨機分配[11, 12, 16, 17],進入試驗的先后取決于研究場所實際條件和實施的安排。若 pCRT 中采用適應性設計,研究對象的隨機分配應符合其設計要求。
3.4 研究隨訪
實效性試驗因一般強調測量干預后的功能狀態(殘障等)、衛生經濟學指標及遠期終點事件等,或同時因干預措施的處理時間較長,其研究隨訪在時限、結局評測內容等方面與解釋性試驗有所不同。pRCT 一般需進行結局的多時點測量,隨訪時間較長,在實施時應使隨訪的數據盡量簡單、明了和易于獲取,通常可利用電話、郵件、疾病登記系統、電子醫療記錄等手段進行隨訪數據采集。建議試驗中應制訂患者管理的詳細計劃,包括監查、記錄患者依從性、干預方案以及違背情況、合并治療及隨訪情況等。為保證患者持續接受干預和隨訪的依從性,應采取招募后患者持續參與研究的策略和有效鼓勵措施。
4 數據管理與質量控制
4.1 數據采集
在 pRCT 設計時,通常可考慮如何將現有資源(如醫院電子病歷、電子健康記錄、來自人口普查的人群特征信息)用于患者招募、干預實施和結局評價等,應充分利用現有電子信息系統進行患者篩選和數據采集,考慮哪些數據可通過現有電子記錄系統來獲取(包含實時或/和歷史數據)。例如,一項試驗中可考慮一部分數據通過醫院電子病歷系統收集,電子病歷記錄中沒有的信息再通過必要的訪視來收集;也可利用患者登記數據庫為患者入組、招募、隨訪等提供支持,這樣可降低研究成本、提高研究效率。因此,在 pRCT 的設計階段,應明確需要收集哪些數據、如何收集數據、哪些數據可從電子病歷系統收集、哪些應通過訪視收集。若部分數據從電子病歷系統中收集時,應事先驗證電子病歷數據的準確性和完整性。應充分了解各種電子信息系統來源的數據特征,若預估某項數據準確性低或缺失比例較高,可能對結果造成較大影響時,應通過前瞻性訪視收集該項數據。
當從不同電子信息系統收集數據時,各個系統的互聯互通或兼容性是應該考慮的因素之一。條件允許的話,應該考慮將各系統來源數據采用 HL7(health level seven international)[18]或臨床數據交換標準協會(clinical data interchange standard consortium,CDISC)[19]的數據標準進行采集、轉換和集成,應用通用的醫學編碼字典或系統(如 MedDRA、SNOMED CT),將可提高數據采集、共享和分析的效率。
因 pRCT 的研究目的在于評價干預措施在真實世界環境下的效果,其特點是研究對象、干預措施和結局測量多樣化,覆蓋面更廣。因此,所有與此目的相關的數據都應該盡量收集,且盡可能分類和細化。如研究者和研究對象的特征,除常規人口學特征外,收集研究者和研究對象或所在研究地點或機構的一些相關組織管理模式、社會心理學、醫療保險特征和個體偏好等與依從性相關的信息,將有助于理解和說明干預措施的可應用性。
4.2 數據管理和質量控制
數據管理和質量控制是任何試驗的重要環節,pRCT 中這一環節難度更大。在設計階段,這方面的準備至為關鍵。提倡在承擔試驗的機構、組織的現有質量保證和質量控制體系(quality assurance and quality control system,QA&QC)下,建立試驗內部數據管理小組,制訂數據管理計劃、試驗過程相關的各項標準操作規程(standard operational procedure,SOP)及涉及特定項目的質量管理文書(如質量手冊、程序文件、作業指導書、質量記錄),并在試驗過程中嚴格執行。必要時可委托合同研究組織(contract research organization,CRO)承擔數據管理、數據質量控制的任務。采用電子數據采集系統、臨床試驗管理系統進行數據收集和管理時,應確保系統可靠、數據可溯源和數據安全。質量控制活動還包括研究培訓、實施的組織、數據采集表(data collection form,DCF)或病例報告表(case report form,CRF)等試驗文件的編制、測試、調整、確認以及組織機構和配備資源等。數據管理活動包括但不限于試驗的稽查、監查、不良事件報告監測與報告、數據問題糾正和偏倚預防措施制定等。研究設計階段應明確指派數據管理小組或相關組織、研究者、監查員、數據管理員并確定其相應的職責,確保數據質量管理體系有效實施和正常運行。此外,由于 pRCT 評價的是干預措施在真實世界環境下的效果,其干預措施通常與患者的常規治療相似,通常無需設置數據與安全監查委員會(DSMC),但若在 pCRT 中采用適應性設計,則 DSMC 有時是必需的;對于存在特殊安全性的試驗,如有較高安全風險的干預措施、納入受試者為潛在弱勢人群(如兒童、孕婦等),也應考慮設置 DSMC。
5 統計分析
5.1 基本原則
pRCT 的統計分析與 eRCT 的基本原則一致,即采用意向性治療(intention-to-treat,ITT)分析原則,使用全分析集(full analysis set,FAS)作為主要分析數據集。同時,也進行符合方案集(per-protocol set,PPS)分析、亞組分析和敏感性分析等。統計分析應預先制訂計劃,包括協變量調整、缺失數據處理、中心效應、群組效應、統計模型擬合分析等均應有事先規定。對發現的不一致結果,應給予解釋,計劃外的補充分析也應該給出合理解釋。若在 pCRT 中采用適應性設計,統計分析計劃應符合其設計要求,采用合適的分析方法,以避免增加錯誤結論和在估計中引入偏倚[13]。
5.2 數據分析
在制訂研究方案直至完成數據盲態審核之前,應制訂并確定統計分析計劃(statistical analysis plan,SAP),統計分析則將遵照 SAP 執行。該計劃可包括研究方案概要、數據集定義、分析原則與策略、缺失數據處理、分析指標與分析方法、亞組或分層分析、敏感性分析、補充分析和結果報告等。對 cRCT,除考慮以患者個體為單位的效果分析外,還要考慮群組的效應,這時 SAP 的復雜性增加不可避免。在目標估計時,越來越多的共識和指南推薦重視敏感性分析,以評估統計推斷的穩健性,且優先于亞組分析和補充分析;敏感性分析通常一次只改變一個條件,如分析集的敏感性、分析方法的敏感性、缺失數據處理的敏感性等[17]。此外,在 pRCT 中還可能會產生隨機后的新混雜因素,如根據個體差異調整的治療方案多樣性,需進行協變量的校正。當主要結局變量和協變量都是連續性指標時,可采用協方差分析(analysis of covariance,ANCOVA)方法;當主要結局變量和協變量是分類指標時,可采用分層分析(stratified analysis)方法;當有多個不同數據屬性的協變量需要考慮時,常采用相應的統計學模型進行校正,如 logistic 回歸、Cox 回歸、Poisson 回歸等[13]。
ipRCT 的統計分析原則、內容及方法與 eRCT 類似,但應考慮寬泛的納入人群的異質性問題,必要時可根據人群特征采用分層分析、亞組分析方法。cRCT 和 swRCT,因干預、隨機分配單位為群組和干預的階段性引入,分析內容和方法有別于 ipRCT:① cRCT:效果比較時可采用固定效應模型估計組內相關系數、群組效應和時間效應等。分析也應考慮群組層面和/或個體層面的協變量調整。試驗中個體層面數據的分析可采用混合效應模型、多水平/層次建模技術,以便可同時考慮群組、個體水平和組間特征的影響。貝葉斯層次建模(Bayesian hierarchical modelling)方法也可被采用,該方法可獲得干預效應的合理區間估計,并提供對于群組效應和模型參數的穩健估計。如采用貝葉斯方法,應事先說明為主要分析而提出的先驗分布的來源和結構[18, 19];② swRCT:可從橫向和豎向兩個角度進行分析。橫向分析是比較干預條件下從對照轉到干預的前后時期的結果,而豎向分析是在連續交叉點之間的時間內比較群組分配至干預組或對照組的組間差異結果。應著重考慮主要分析在于干預與對照群組的比較,若可行,可增補群組轉換對照和干預的前后時期比較分析[11, 20]。實際上,多數試驗采用群組隨機效應模型進行分析,且不管是否有統計學意義均調整時間效應的影響,并將橫向和豎向比較的信息納入到干預效果分析中[20]。
6 倫理學考慮
pRCT 的倫理學考慮主要是設計時基于個體或群組為觀察、干預單位的不同而在倫理審查、知情同意的方式和內容上有所區別。
6.1 個體的知情同意
6.1.1 知情同意的原則
與其他類型人體生物醫學研究一樣,研究者必須獲得研究對象自愿做出的知情同意。若在個體不能給予/不能充分給予知情同意的情況下,必須根據現行法律獲得其法定代理人的許可,只有在確定可能的受試對象充分了解了參加研究的有關實情和后果并有充分的機會考慮是否參加后,才能征求同意。
6.1.2 知情同意的方式和內容
pRCT 在研究對象以個體為觀察、干預單位時,其知情同意的過程、內容和方式與解釋性試驗并無不同。pRCT 的研究方案也需獲得醫療衛生機構倫理委員會批準,研究對象也需規范地進行知情同意和簽署書面知情書并注明簽署日期。
6.2 群組的知情同意
盡管以群組為觀察、干預單位時,pRCT 的倫理審查、知情同意的原則與人體生物醫學研究所要遵守的赫爾辛基宣言的倫理規范一致,但其倫理學考慮有別于以個體為單位的試驗。
6.2.1 知情同意的方式
基于群組的團體權益考慮,試驗應該制訂群組咨詢計劃,向研究人群利益相關方充分告知研究的風險與預期受益,征求團體意見[21]。由于群組規模大小不同,群組的咨詢計劃及知情同意方式可能不盡相同。例如,社區為群組的試驗,研究者應該制訂社區咨詢計劃、團體知情同意告知書,在研究開始前公開披露研究計劃,以保證更廣泛的研究對象利益相關方獲知研究計劃及其風險與預期受益,必要時建立獨立的數據與安全監查委員會進行監督。經過充分的團體咨詢、告知后,群組內個體需個人單獨簽署書面知情同意書(有未成年人為研究對象的,也應需其監護人簽署)。cRCT 中的個人知情同意書簽署通常在群組咨詢計劃、團體告知和隨機分配之后再進行。
6.2.2 豁免個體知情同意
群組內的個人能否免除知情同意,應該視其實際情況而定。如果研究內容與患者的日常診療活動無異或干預措施不改變治療常規,且已經完成團體咨詢、告知,此時在取得群組管理方同意后,可提交倫理委員會申請豁免患者個人知情同意書的簽署[5]。
6.3 個人隱私信息保護
pRCT 涉及通過各類信息系統收集個體的個人身份、聯系方式、疾病診斷、治療、結局評價等個人隱私相關信息時,需在研究方案說明,也需獲得倫理委員會審批,并應采取通過設定讀取權限、脫敏化方法、數據安全防護等嚴格確切措施保護個體隱私,避免泄露。
7 小結
pRCT 作為一種重要的真實世界研究設計類型,其優勢在于可融合隨機化和真實世界數據的優點,能較好地控制研究中的混雜和偏倚,有效利用現有資源進行研究設計、患者招募、數據收集等,從而科學評價干預措施在真實或接近真實醫療環境下的治療效果(包括實際效果、比較效果、安全性或/和成本效益等)。因此,pRCT 可獲得評價干預措施效果或比較效果的最佳真實世界證據。作為真實世界數據與研究系列技術規范之一,本技術規范從 pRCT 的設計、實施、數據收集與管理、數據分析及倫理考慮方面做出建議或推薦(pRCT 研究環節的關鍵因素見表 2),以期為研究者正確認識和科學開展 pRCT 提供指導。

真實世界研究已日益成為醫療衛生領域關注的焦點[1, 2]。基于真實世界數據的觀察性研究(如隊列研究和病例-對照研究)是真實世界研究的常用設計類型。但觀察性研究固有的問題諸如混雜因素、偏倚的影響,給干預與結局的因果關系推斷帶來了困擾。融合了隨機化和真實世界數據優勢的實效性隨機對照試驗(pragmatic randomized controlled trial,pRCT)因較好地控制了混雜和偏倚而為因果關系推斷提供了有效方法,其研究結果可為干預措施效果或比較效果評價提供最佳真實世界證據[3]。但目前對 pRCT 的認識、理解和應用還存在一些偏見和誤區,對如何開展高質量的 pRCT 也存在一定的疑惑。為此,中國真實世界數據與研究聯盟(ChinaREAL)工作組特制訂本技術規范,旨在促進更好地認識和開展 pRCT。本規范是真實世界數據與研究系列技術規范 5。
1 概念和適用范圍
若按研究目的劃分,干預性試驗可分為在不同治療方法中做出選擇的試驗(如實效性試驗)和驗證某種干預措施效力或生物學機制的試驗(如解釋性試驗)[4]。pRCT 是指在真實或接近真實醫療環境下,采用隨機、對照的設計比較臨床實踐中不同干預措施的治療結果(包括實際效果、比較效果、安全性或/和成本效益等)的研究[5]。pRCT 的目的是衡量某種干預措施在常規臨床實踐中的效果(effectiveness),而解釋性隨機對照試驗(exploratory randomized controlled trial,eRCT)則通常是評價某種干預措施在理想的、嚴格控制的環境下的效力(efficacy)。eRCT 適用于回答干預措施在理想條件下是否真正有效(效力)的問題,是藥物上市前或上市后效力評價的最佳設計[6, 7];pRCT 適用于回答干預措施在實際條件下效果大小的問題,是上市后藥品、醫療器械等進行效果評價的最佳證據。pRCT 和 eRCT 的主要區別見表 1。

實效性試驗是相對于解釋性試驗而言,除為新藥注冊提供效力證據的嚴格的解釋性試驗外,沒有絕對的實效性和解釋性之分。一般而言,每個研究都需根據其研究目的制定或選擇更傾向于解釋性或實效性的研究場所與環境、患者人群、干預措施、對照、結局指標、隨訪方式等。如何從不同維度區分解釋性和實效性試驗可采用 PRECIS-2 工具[8]進行評價。PRECIS-2 包含入選標準、招募、研究場所、組織、干預過程靈活性、治療依從靈活性、隨訪、主要結局和主要分析 9 個領域,每一領域以 1~5 分依次代表從很強解釋性至很強實效性之間的程度判斷(圖 1)。

2 研究策劃與研究設計
在 pRCT 中,能夠進行一種治療措施與另一措施在現實條件下的比較,或新治療措施與常規治療(可能多種)在特定條件下的比較。pRCT 常常涉及復雜干預,也常涉及到提供干預者的技巧和經驗[9],從而導致其在設計、實施和分析方面存在更多挑戰。因此,pRCT 的策劃和設計應從研究目的出發來考慮其研究場所與環境、患者人群、干預措施、對照、結局指標、隨訪等方面的設計選擇。在策劃 pRCT 時,可使用 PRECIS-2 工具[8]輔助進行不同研究要素的設計,從總體把握試驗的實效性程度。
2.1 研究目的
一般而言,實效性試驗的目的是評價某種干預措施在常規臨床實踐中的效果,為臨床或衛生政策決策提供證據,以期將干預措施納入現實世界臨床實踐之中[9]。在策劃和設計時應對目的了然于胸,并根據不同目的選擇合適的設計類型。
2.2 研究設計類型
2.2.1 常見設計類型
實效性隨機對照試驗的設計包括但不限于以下的類型:① 個體實效性隨機對照試驗(individual pRCT,ipRCT):即以個體為隨機分組單位的隨機對照試驗,此時以個體為觀測、實驗的單元,一般未做特殊聲明的 pRCT 均指此類;② 群組隨機對照試驗(cluster RCT,cRCT):以群組為隨機分組單位的隨機對照試驗,此時以群組為干預的單元[10]。群組可以是家庭、診所、醫院、學校或居民小區等。此類型設計的試驗,在數據分析時除考慮群組效應外,也將以個體為單位進行效果的評價和分析;③ 階梯楔形隨機對照試驗(stepped wedge RCT,swRCT):一種特殊的群組隨機對照試驗,常用于評價醫療衛生服務、衛生政策性的干預。在階梯楔形試驗中,群組在不同的開始時間(階梯式的)被隨機分配接受干預,采取各個群組“實驗式分階段引入(experimentally staged introduction)”[11]的方法,最終所有群組均會接受干預。這類試驗通常以一個基線數據采集的階段開始,一個或多個群組被隨機分配到從對照轉到試驗干預的安排,此時其余群組仍保留在對照,再逐階段隨機安排各個群組從對照轉到試驗干預的處理,試驗繼續進行直至最后階段所有群組均接受試驗干預。該設計通常用于無法同時安排所有群組分為接受干預或對照的試驗,所有群組均接受試驗干預且干預利大于弊,特別適合于需要觀察時間協變量的情況[12]。
2.2.2 設計類型的選擇
通常為了獲得真實世界環境下評價干預措施的最佳證據而采用 pRCT 設計,而 pRCT 中選擇哪一種設計類型則主要基于研究目的、研究問題和研究條件來考慮。從研究效率角度而言,研究設計以簡單高效為宜,所以一般先考慮采用 ipRCT。如果干預或對照措施實施個體間可能出現干擾或沾染(contamination),則應考慮采用 cRCT,即以群組方式進行干預或對照。當研究只能分階段先后實施時,可考慮采用 swRCT 設計。swRCT 是一種自身對照設計,但也應考慮干預措施是否利大于弊、干預療程與常規治療長短是否影響患者病情和有無延遲效應等因素。
此外,pRCT 設計中也可根據實際情況的需求考慮加入適應性設計(adaptive design)。比如,采用期中分析或成組序貫設計的 ipRCT。適應性設計除了統計學上、倫理上的優勢之外,因其設計上的靈活性而對增加藥物評價結果的外推性有一定優勢[13]。比如,適應性富集設計(adaptive enrichment design)的試驗有可能既評價預定人群的效果也觀察到相應亞組人群的效果。若 pCRT 中采用適應性設計,應事先計劃和充分權衡其優點和局限性。
2.3 研究場所與環境
pRCT 選取研究場所時,通常應考慮研究場所與干預措施應用的衛生機構的相似程度,即通常應考慮從研究結果可能被應用的類似衛生機構中選取研究場所。因此,pRCT 實施的場所和環境一般是使用常規療法的普通醫療機構、基層醫院、診所,而不僅僅是三甲醫院、專科特殊診所或專科醫療機構,且選取的研究場所應熟悉且能很好地應用這類干預措施。試驗的干預措施與其適用的環境之間密切匹配,這樣的環境能提供該干預措施直接適用的信息,從而有助于決策者選擇是否實施該干預措施[9]。但應注意:部分疑難雜癥、罕見病等則只能在特定大型綜合性醫院或專科醫院開展,這時應根據實際情況選取合適的研究場所和環境。
2.4 研究要素的設定
實效性試驗的研究要素可從 PICO(patient、intervention、comparison 和 outcome)模式、干預單元(或隨機化單位)及隨訪等方面考慮。
2.4.1 患者(P)
從實效性角度考慮,試驗結果應更具外推性(generalizability),因而研究對象應更廣泛并切合臨床實際情況,可能包含研究疾病的不同階段、分期、病理類型等,或包含復雜的合并疾病,也可能涵蓋不同的年齡層、各種生理、病理狀態或各類中醫證候或不同依從程度等。患者的招募條件也應盡量與干預措施的實際應用環境相吻合。
pRCT 通常在一項醫療干預措施上市后開展,故納入研究的患者通常是說明書中列出的適應癥患者。但在實際臨床治療過程中,超適應癥用藥(off-label use)的情況也普遍存在。超適應癥用藥的患者是否需要納入研究,應當根據研究目的及研究結果應用的政策環境來確定。
2.4.2 干預措施(I)
pRCT 所研究的干預措施包括藥物、醫療器械、復雜干預甚至衛生政策等較廣范圍,但限于本文篇幅,論述中僅能涉及藥物或醫療器械。理論上,pRCT 所研究的干預措施應已獲得效力(efficacy)證據,在此基礎上再開展干預措施在現實環境中應用的效果(effectiveness)研究。相比解釋性試驗,pRCT 中的干預措施可能更靈活,其標準化程度不及解釋性試驗的高,甚至可能更為復雜。比如根據患者不同的情況而使用不同劑量或成份作為試驗組措施。不少情況下,pRCT 中的研究措施疊加于常規治療之上。另外,常規療法可能由多種成分組成,試驗的干預方案可以是一次或逐步移除其中的一種或幾種成分,再與原來的常規療法對照,以便比較移除某些成分是否可提高成本-效益。
pRCT 中干預措施的執行通常靈活性和可變性更大,但研究者仍應對試驗中允許臨床醫生或患者合并用藥、改變劑量、換藥或停藥等條件或時間等做出必要的限定,也應描述試驗中比較的各干預措施,包括所用藥物的名稱、劑型、規格、用法、用量、治療頻率、療程、合并用藥和輔助治療等。當干預措施中包含的藥物有多個商品名(brand name)時,研究方案中應當明確試驗中使用藥物的通用名(generic name)、商品名和生產企業信息。在采用疊加設計(add-on design)時,研究方案中應同時明確常規治療或標準治療方法及合并用藥或輔助用藥的具體藥用特征。在傳統中醫療法或手術操作相關的干預措施中,衛生技術人員因素通常也會對干預結果帶來重要影響,必要時 pRCT 中也應對衛生技術操作者給出適當限定條件。
2.4.3 對照措施(C)
一般不采用安慰劑、假針刺及其他安慰措施做對照。倫理原則允許的話可以采用無治療作為對照,但也必須在現實環境下進行。實效性試驗中對照的選擇要考慮現實臨床實際情況,通常以常規治療、標準治療或公認有效的治療措施為對照,應切合實際應用環境,且這些常規醫療保健措施應是醫生已熟練掌握和應用的。在研究設計階段,建議研究者可通過調查疾病治療模式(treatment pattern)來了解所在研究環境中最常用的干預措施,并根據具體研究目的和所要回答的實際問題來選擇對照措施。
2.4.4 結局指標(O)
實效性試驗中的結局指標需根據研究的具體目的選擇,可包括有安全性、有效性、衛生經濟、治療依從性、患者滿意度、生存質量等。實效性試驗一般強調以病人為導向(patient-oriented)的臨床結局,常常包含與患者日常生活相關的整體健康獲益的結局,通常測量干預的遠期療效、功能變化、生存質量、衛生經濟學指標及遠期終點事件等[5]。從設計角度看,試驗評價的是干預措施的整體效果,而不是解釋干預各成分的效果;從實施角度看,結局指標在真實世界環境中應容易獲取和評測,否則就不太適合實效性試驗。pRCT 中結局指標的測量通常不應過于復雜,一般以只需要對研究者進行基本培訓和解釋即可操作為宜。如試驗中使用病人報告結局(patient-reported outcomes,PROs),則不需要專業人員評測。
2.4.5 干預單元
也稱實驗單元(experimental unit),是試驗中的隨機化單位(unit of randomization),指試驗中干預措施的作用對象(也是隨機分組的對象),因實際情況不同而有個體和群組之分。通常干預對象以個體為單位進行觀察,但當干預措施和對照措施在不同組別的個體間容易出現干擾時,就應采取以群組為干預單位的方式。例如,同一家庭成員分到不同的飲食干預組、同一班級同學采用不同干預措施而難以實施,或以太極拳為干預措施與普通日常活動對照時,對照組的個體容易受干擾而練習太極拳,從而無法很好保證對照組的依從性等。此時可以家庭、班級、學校或居民群組為單位(群組)進行干預和隨機分組,整個小區均接受相同的干預或對照措施,避免干預與對照措施的相互干擾。
2.4.6 隨訪
因評測注重遠期結局,實效性試驗一般隨訪時間相對較長,需進行多時點的結局測量。在研究方案中應明確指出試驗中隨訪次數和周期安排,通常 pRCT 的隨訪頻率低于解釋性臨床試驗,但可能高于現實診療過程中臨床醫生對患者的隨訪頻率。有些研究中,患者的隨訪可由相關臨床事件觸發(如高血壓患者因心梗或腦梗住院或死亡)。實效性試驗需要有嚴謹、積極的患者管理機制及鼓勵患者參加、提高其依從性的激勵措施。但試驗中對患者過多管理也會帶來患者治療依從性高于實際診療環境的問題,將損失研究結果的外部效度。因此,研究者需要在鼓勵患者積極參與以提高數據收集的完整性與盡量減少研究本身對患者治療依從性的影響之間進行綜合權衡。
2.5 樣本量估算
ipRCT 的樣本量估算原則與解釋性試驗無異,結合試驗的設計類型(如平行對照、交叉對照、析因設計)、比較類型(如優效性、等效性、非劣效性比較)、對照的選擇(如安慰劑、無治療、陽性對照等)、主要結局指標的數據屬性(如二分類、連續性數據),對效應量的統計檢驗提出假設,設定檢驗參數(單雙側檢驗、Ⅰ型和Ⅱ型錯誤)進行計算,并根據脫落率、依從性等具體情況進行適當調整[13]。因 pRCT 采用了更寬泛的篩選條件和實際臨床診療方案,可能會產生隨機后的混雜諸如根據個體反應差異調整的治療方案多樣性等,在研究設計時應考慮適當擴大樣本量[14]。cRCT 和 swRCT 的樣本量估算則建議以 ipRCT 為基礎,先計算 ipRCT 樣本量,再以各類型研究的設計效應(design effect)進行調整。基本上分為兩種情形—固定群組大小(cluster size)和固定群組數目(number of cluster)進行估算[12, 15]。樣本量估算考慮的因素除了干預措施、對照的效應大小及統計學檢驗參數外,還包括組內相關系數、群組大小、群組數目、結局測量次數和每階段群組數目(僅 swRCT)[11]。估算得出總體樣本量后,研究者需考慮在病人招募、實施難度和費用等方面的情況而適當調整群組數目和/或群組大小,而群組大小不宜過大或過小,一般以 50 例左右為常見。若 pCRT 中采用了適應性設計,樣本量估算同時應符合相應設計的原則和要求。
3 研究的實施
實效性試驗是一種提供了良好外部真實性又保持一定的內部真實性的試驗設計,相比于傳統的 eRCT,最大的挑戰是如何高質量實施。該類試驗的實施涉及到的數據管理和質量控制與傳統的隨機對照試驗在基本原則上是一致的,此處將不贅述。但實效性試驗的實施在以下方面有不同之處,需要多加注意。
3.1 研究者的招募
實效性試驗特別是 cRCT 和 swRCT,因是以群組為干預單位,通常需招募研究者(醫生)以整個診所為單位參加試驗。故研究者招募應該制訂適當的遴選條件,可能包括但不限于研究資質、常規技術水平、診所規模、設備等,以便保證群組的相對同質性(群組大小、群組特征、群內個體特征、技術水平相近),且在試驗過程中應采取適當激勵措施保持研究者對試驗的興趣。參加試驗的研究者應熟悉常規治療措施的使用、操作或實施,以配合試驗的順利開展。
3.2 研究對象的招募、篩選和入組
在 ipRCT 中,研究對象的招募、篩選和入組與傳統的 eRCT 沒有明顯區別。但在 cRCT、swRCT 中研究對象以群組方式招募入組,應適當注意滿足事先制訂的群組和個體的遴選條件。ipRCT 的研究對象篩選條件一般較為寬泛,以期增加其結果的外推性。cRCT、swRCT 的個體篩選則應同時滿足其所在群組和群組內個體的篩選條件,一般隨其所在的診所、醫院或居民小區而被納入招募和進行篩選,合格并經知情同意后才入組,簽署知情同意之前已經隨機分組和入組了,若不愿意參加試驗則退出研究。在研究實施中,研究者還需指明患者招募的方式和流程,應盡可能避免因招募方式和流程設計原因導致的選擇性偏倚。
3.3 研究對象的隨機分配
研究對象采用隨機分組是 pRCT 的必備設計要素,但因干預方式不同而會有所區別。在 ipRCT 中,研究對象以個體為單位進行隨機分組和接受干預處理;而在 cRCT 和 swRCT 中,研究對象以群組方式進行隨機分組和接受干預處理。當干預和對照措施在不同組別的個體間容易出現相互干擾時,應采取以群組單位為干預方式,并以群組為單位進行隨機分組。配對、分層隨機和簡單隨機的方法可用于 cRCT 的群組分配。不管是個體或群組方式,隨機分組中隨機序列產生、分配隱藏等規范化操作至為重要,建議采用中央隨機化方法或網絡交互式隨機分配系統(interactive web-based randomization system)。在有些 swRCT 中,研究對象可以群組分階段進入方式進行隨機分配[11, 12, 16, 17],進入試驗的先后取決于研究場所實際條件和實施的安排。若 pCRT 中采用適應性設計,研究對象的隨機分配應符合其設計要求。
3.4 研究隨訪
實效性試驗因一般強調測量干預后的功能狀態(殘障等)、衛生經濟學指標及遠期終點事件等,或同時因干預措施的處理時間較長,其研究隨訪在時限、結局評測內容等方面與解釋性試驗有所不同。pRCT 一般需進行結局的多時點測量,隨訪時間較長,在實施時應使隨訪的數據盡量簡單、明了和易于獲取,通常可利用電話、郵件、疾病登記系統、電子醫療記錄等手段進行隨訪數據采集。建議試驗中應制訂患者管理的詳細計劃,包括監查、記錄患者依從性、干預方案以及違背情況、合并治療及隨訪情況等。為保證患者持續接受干預和隨訪的依從性,應采取招募后患者持續參與研究的策略和有效鼓勵措施。
4 數據管理與質量控制
4.1 數據采集
在 pRCT 設計時,通常可考慮如何將現有資源(如醫院電子病歷、電子健康記錄、來自人口普查的人群特征信息)用于患者招募、干預實施和結局評價等,應充分利用現有電子信息系統進行患者篩選和數據采集,考慮哪些數據可通過現有電子記錄系統來獲取(包含實時或/和歷史數據)。例如,一項試驗中可考慮一部分數據通過醫院電子病歷系統收集,電子病歷記錄中沒有的信息再通過必要的訪視來收集;也可利用患者登記數據庫為患者入組、招募、隨訪等提供支持,這樣可降低研究成本、提高研究效率。因此,在 pRCT 的設計階段,應明確需要收集哪些數據、如何收集數據、哪些數據可從電子病歷系統收集、哪些應通過訪視收集。若部分數據從電子病歷系統中收集時,應事先驗證電子病歷數據的準確性和完整性。應充分了解各種電子信息系統來源的數據特征,若預估某項數據準確性低或缺失比例較高,可能對結果造成較大影響時,應通過前瞻性訪視收集該項數據。
當從不同電子信息系統收集數據時,各個系統的互聯互通或兼容性是應該考慮的因素之一。條件允許的話,應該考慮將各系統來源數據采用 HL7(health level seven international)[18]或臨床數據交換標準協會(clinical data interchange standard consortium,CDISC)[19]的數據標準進行采集、轉換和集成,應用通用的醫學編碼字典或系統(如 MedDRA、SNOMED CT),將可提高數據采集、共享和分析的效率。
因 pRCT 的研究目的在于評價干預措施在真實世界環境下的效果,其特點是研究對象、干預措施和結局測量多樣化,覆蓋面更廣。因此,所有與此目的相關的數據都應該盡量收集,且盡可能分類和細化。如研究者和研究對象的特征,除常規人口學特征外,收集研究者和研究對象或所在研究地點或機構的一些相關組織管理模式、社會心理學、醫療保險特征和個體偏好等與依從性相關的信息,將有助于理解和說明干預措施的可應用性。
4.2 數據管理和質量控制
數據管理和質量控制是任何試驗的重要環節,pRCT 中這一環節難度更大。在設計階段,這方面的準備至為關鍵。提倡在承擔試驗的機構、組織的現有質量保證和質量控制體系(quality assurance and quality control system,QA&QC)下,建立試驗內部數據管理小組,制訂數據管理計劃、試驗過程相關的各項標準操作規程(standard operational procedure,SOP)及涉及特定項目的質量管理文書(如質量手冊、程序文件、作業指導書、質量記錄),并在試驗過程中嚴格執行。必要時可委托合同研究組織(contract research organization,CRO)承擔數據管理、數據質量控制的任務。采用電子數據采集系統、臨床試驗管理系統進行數據收集和管理時,應確保系統可靠、數據可溯源和數據安全。質量控制活動還包括研究培訓、實施的組織、數據采集表(data collection form,DCF)或病例報告表(case report form,CRF)等試驗文件的編制、測試、調整、確認以及組織機構和配備資源等。數據管理活動包括但不限于試驗的稽查、監查、不良事件報告監測與報告、數據問題糾正和偏倚預防措施制定等。研究設計階段應明確指派數據管理小組或相關組織、研究者、監查員、數據管理員并確定其相應的職責,確保數據質量管理體系有效實施和正常運行。此外,由于 pRCT 評價的是干預措施在真實世界環境下的效果,其干預措施通常與患者的常規治療相似,通常無需設置數據與安全監查委員會(DSMC),但若在 pCRT 中采用適應性設計,則 DSMC 有時是必需的;對于存在特殊安全性的試驗,如有較高安全風險的干預措施、納入受試者為潛在弱勢人群(如兒童、孕婦等),也應考慮設置 DSMC。
5 統計分析
5.1 基本原則
pRCT 的統計分析與 eRCT 的基本原則一致,即采用意向性治療(intention-to-treat,ITT)分析原則,使用全分析集(full analysis set,FAS)作為主要分析數據集。同時,也進行符合方案集(per-protocol set,PPS)分析、亞組分析和敏感性分析等。統計分析應預先制訂計劃,包括協變量調整、缺失數據處理、中心效應、群組效應、統計模型擬合分析等均應有事先規定。對發現的不一致結果,應給予解釋,計劃外的補充分析也應該給出合理解釋。若在 pCRT 中采用適應性設計,統計分析計劃應符合其設計要求,采用合適的分析方法,以避免增加錯誤結論和在估計中引入偏倚[13]。
5.2 數據分析
在制訂研究方案直至完成數據盲態審核之前,應制訂并確定統計分析計劃(statistical analysis plan,SAP),統計分析則將遵照 SAP 執行。該計劃可包括研究方案概要、數據集定義、分析原則與策略、缺失數據處理、分析指標與分析方法、亞組或分層分析、敏感性分析、補充分析和結果報告等。對 cRCT,除考慮以患者個體為單位的效果分析外,還要考慮群組的效應,這時 SAP 的復雜性增加不可避免。在目標估計時,越來越多的共識和指南推薦重視敏感性分析,以評估統計推斷的穩健性,且優先于亞組分析和補充分析;敏感性分析通常一次只改變一個條件,如分析集的敏感性、分析方法的敏感性、缺失數據處理的敏感性等[17]。此外,在 pRCT 中還可能會產生隨機后的新混雜因素,如根據個體差異調整的治療方案多樣性,需進行協變量的校正。當主要結局變量和協變量都是連續性指標時,可采用協方差分析(analysis of covariance,ANCOVA)方法;當主要結局變量和協變量是分類指標時,可采用分層分析(stratified analysis)方法;當有多個不同數據屬性的協變量需要考慮時,常采用相應的統計學模型進行校正,如 logistic 回歸、Cox 回歸、Poisson 回歸等[13]。
ipRCT 的統計分析原則、內容及方法與 eRCT 類似,但應考慮寬泛的納入人群的異質性問題,必要時可根據人群特征采用分層分析、亞組分析方法。cRCT 和 swRCT,因干預、隨機分配單位為群組和干預的階段性引入,分析內容和方法有別于 ipRCT:① cRCT:效果比較時可采用固定效應模型估計組內相關系數、群組效應和時間效應等。分析也應考慮群組層面和/或個體層面的協變量調整。試驗中個體層面數據的分析可采用混合效應模型、多水平/層次建模技術,以便可同時考慮群組、個體水平和組間特征的影響。貝葉斯層次建模(Bayesian hierarchical modelling)方法也可被采用,該方法可獲得干預效應的合理區間估計,并提供對于群組效應和模型參數的穩健估計。如采用貝葉斯方法,應事先說明為主要分析而提出的先驗分布的來源和結構[18, 19];② swRCT:可從橫向和豎向兩個角度進行分析。橫向分析是比較干預條件下從對照轉到干預的前后時期的結果,而豎向分析是在連續交叉點之間的時間內比較群組分配至干預組或對照組的組間差異結果。應著重考慮主要分析在于干預與對照群組的比較,若可行,可增補群組轉換對照和干預的前后時期比較分析[11, 20]。實際上,多數試驗采用群組隨機效應模型進行分析,且不管是否有統計學意義均調整時間效應的影響,并將橫向和豎向比較的信息納入到干預效果分析中[20]。
6 倫理學考慮
pRCT 的倫理學考慮主要是設計時基于個體或群組為觀察、干預單位的不同而在倫理審查、知情同意的方式和內容上有所區別。
6.1 個體的知情同意
6.1.1 知情同意的原則
與其他類型人體生物醫學研究一樣,研究者必須獲得研究對象自愿做出的知情同意。若在個體不能給予/不能充分給予知情同意的情況下,必須根據現行法律獲得其法定代理人的許可,只有在確定可能的受試對象充分了解了參加研究的有關實情和后果并有充分的機會考慮是否參加后,才能征求同意。
6.1.2 知情同意的方式和內容
pRCT 在研究對象以個體為觀察、干預單位時,其知情同意的過程、內容和方式與解釋性試驗并無不同。pRCT 的研究方案也需獲得醫療衛生機構倫理委員會批準,研究對象也需規范地進行知情同意和簽署書面知情書并注明簽署日期。
6.2 群組的知情同意
盡管以群組為觀察、干預單位時,pRCT 的倫理審查、知情同意的原則與人體生物醫學研究所要遵守的赫爾辛基宣言的倫理規范一致,但其倫理學考慮有別于以個體為單位的試驗。
6.2.1 知情同意的方式
基于群組的團體權益考慮,試驗應該制訂群組咨詢計劃,向研究人群利益相關方充分告知研究的風險與預期受益,征求團體意見[21]。由于群組規模大小不同,群組的咨詢計劃及知情同意方式可能不盡相同。例如,社區為群組的試驗,研究者應該制訂社區咨詢計劃、團體知情同意告知書,在研究開始前公開披露研究計劃,以保證更廣泛的研究對象利益相關方獲知研究計劃及其風險與預期受益,必要時建立獨立的數據與安全監查委員會進行監督。經過充分的團體咨詢、告知后,群組內個體需個人單獨簽署書面知情同意書(有未成年人為研究對象的,也應需其監護人簽署)。cRCT 中的個人知情同意書簽署通常在群組咨詢計劃、團體告知和隨機分配之后再進行。
6.2.2 豁免個體知情同意
群組內的個人能否免除知情同意,應該視其實際情況而定。如果研究內容與患者的日常診療活動無異或干預措施不改變治療常規,且已經完成團體咨詢、告知,此時在取得群組管理方同意后,可提交倫理委員會申請豁免患者個人知情同意書的簽署[5]。
6.3 個人隱私信息保護
pRCT 涉及通過各類信息系統收集個體的個人身份、聯系方式、疾病診斷、治療、結局評價等個人隱私相關信息時,需在研究方案說明,也需獲得倫理委員會審批,并應采取通過設定讀取權限、脫敏化方法、數據安全防護等嚴格確切措施保護個體隱私,避免泄露。
7 小結
pRCT 作為一種重要的真實世界研究設計類型,其優勢在于可融合隨機化和真實世界數據的優點,能較好地控制研究中的混雜和偏倚,有效利用現有資源進行研究設計、患者招募、數據收集等,從而科學評價干預措施在真實或接近真實醫療環境下的治療效果(包括實際效果、比較效果、安全性或/和成本效益等)。因此,pRCT 可獲得評價干預措施效果或比較效果的最佳真實世界證據。作為真實世界數據與研究系列技術規范之一,本技術規范從 pRCT 的設計、實施、數據收集與管理、數據分析及倫理考慮方面做出建議或推薦(pRCT 研究環節的關鍵因素見表 2),以期為研究者正確認識和科學開展 pRCT 提供指導。
