隨機對照試驗報告規范聲明(consolidated standards of reporting trials,CONSORT)是一個旨在提高隨機對照試驗(randomized controlled trial,RCT)報告透明度和質量的指南。本擴展版針對將來確定性 RCT 之前所進行的隨機先導性和可行性試驗制定統一報告規范。該清單適用于任何隨機研究,其中包括確定性 RCT 及此前的、在小規模研究樣本下進行的任何先導性試驗,而其設計(如聚類、析因、交叉)或作者用來描述該研究的術語(如先導性(試驗)、可行性(試驗)、試驗、研究)并不會對此造成影響。不過,需要注意的是,本報告規范擴展范圍不直接適用于主要試驗設計中內置的先導性試驗、非隨機的先導性和可行性試驗,或者Ⅱ期臨床試驗。不過這些研究都與隨機先導性和可行性試驗有一定相似性,因此許多原則也同樣適用。本擴展版的研發是因為越來越多的研究被描述為可行性試驗或先導性試驗,但這些研究的報告和實施存在缺陷。我們遵循了所推薦的良好實踐來研發 CONSORT 先導性和可行性試驗擴展版,其中包括進行德爾菲調查、召開共識會議和研究團隊會議及試行此條目清單等。由于先導性試驗和可行性隨機試驗的目的和目標不同于其他隨機試驗,因此,盡管在這些試驗報告中的許多內容,與評估效果和效力的 RCT 中的報告內容相似,但在報告內容類型、報告條目解釋方面,其與標準 CONSORT 存在一些關鍵差異。本文保留了部分標準 CONSORT 聲明的條目,但仔細閱讀就會發現,其中大多數條目已經被修改或刪除,并且添加了一些新的條目。其中,新增條目包括:如何識別受試者并獲得同意;如果適用,用于判斷是否或如何進行將來確定性 RCT 的預先制定的標準;如果相關,其他重要的非預期結果;先導性試驗的結果對將來確定性 RCT 的影響,還包括任何擬定的修正及倫理批準或研究審查委員會的批準,并要求附有獲準批號。本擴展版包括 26 個條目清單、摘要的單獨清單、研究的流程圖模板及對所做條目更改的解釋和相關范例。我們相信,使用 CONSORT 先導性和可行性試驗擴展版,將提高先導性試驗的報告質量。
引用本文: 蔣寅, 劉巖, 商洪才, 張弛, 段玉婷, 卞兆祥, 譯. CONSORT 2010 聲明:針對隨機先導性和可行性試驗的擴展. 中國循證醫學雜志, 2021, 21(3): 313-337. doi: 10.7507/1672-2531.202008174 復制
隨機對照試驗報告規范(consolidated standards of reporting trials,CONSORT),是一個旨在提高隨機對照試驗(randomized controlled trial,RCT)報告透明度和質量的指南。它于 1996 年首次發表,2001 年修訂,最后一次更新于 2010 年[1, 2],并同時發表在 10 種行業領先的醫學雜志上,包括 Lancet,JAMA,BMJ,Annals of Internal Medicine 和 PLOS Medicine。CONSORT 聲明包括 RCT 應報告的最少基本條目清單和記錄試驗受試者試驗過程的流程圖。
到目前為止,CONSORT 指南的制定在國際上獲得了相當大的認可,已被引用 8 000 多次,并得到了世界醫學編輯協會、科學編輯委員會、國際醫學期刊編輯委員會和世界各地 600 多種期刊的支持。前期進行的幾個相關研究對該聲明能否提高隨機試驗報告質量進行了檢驗,結果顯示,采用 CONSORT 聲明會使得報告質量顯著提高[3]。
繼 CONSORT 聲明后,CONSORT 清單的擴展版也被陸續發表,用于具有非劣效性、等效性及組群或實效設計的試驗[4-6]及用于報告危害[7]、不同類型的干預措施(非藥物治療[8]和草藥干預[9])、患者報告結局[10]的研究。CONSORT 的主要聲明和所有當前擴展都聚焦于試驗上,試驗性研究問題集中在干預措施的效果或效力上。但是,一些隨機試驗(我們稱為先導性試驗和可行性試驗)并不以效果或效力作為主要重點,而是旨在支持將來確定性 RCT 的開展。本文中“確定性”試驗是指側重于效果或效力的研究。對試驗實施和報告制定高標準的要求,與確定性試驗一樣,同樣適用于先導性試驗和可行性試驗。
1 本文范圍
本文為在確定性 RCT 前的隨機先導性和可行性試驗提出基于 CONSORT 聲明的擴展內容。為與 CONSORT 的廣泛涵括范圍保持一致,將來確定性 RCT 可能會評估干預措施的效果或效力。然而,隨機先導性或可行性試驗的主要目的是評估將來確定性 RCT 的可行性。
需要注意的是:本文所涉及的擴展內容并沒有對先導性試驗和可行性隨機試驗進行區分。雖然在實踐中本文作者認識到不同的研究者可能對不同的術語具有不同的偏好,但缺乏區分的原因是由于作者所研發的用于研究定義的框架[11]。在這些框架內,為將來確定性 RCT 實施的可行性試驗需要回答:確定性 RCT 是否能完成,是否應該完成及如果可完成應如何完成。先導性試驗是可行性試驗的一個子集,他們提出了相似問題(確定性 RCT 是否能完成,是否應該完成及如果可完成應如何完成),但有一個特定的設計特征:在先導性試驗中(可能是隨機的,也可能不是隨機的),將來確定性 RCT 或其中的一部分,是在小樣本的基礎上進行的。
簡短起見,我們使用“先導性試驗”一詞來指代任何以較小規模進行將來確定性 RCT 或其中一部分的隨機研究。然而,這些研究可合理地使用以下任何術語:先導性 RCT、隨機先導性試驗、先導性試驗、先導性研究、隨機先導性研究、可行性 RCT、隨機可行性試驗、可行性試驗、可行性研究或隨機可行性研究。事實上,本文沒有限制用于描述先導性試驗的術語;相反,本文只規定該類試驗是隨機的,在將來確定性 RCT 之前實施,且主要目的是評估研究方法的可行性。
這一擴展版的提出是由于人們正在進行越來越多的被描述為可行性試驗[12]或先導性試驗的研究及在報告和實施這些研究中被識別出薄弱環節的研究[12-15]。我們期望通過提高報告質量來產生更多高質量的先導性試驗案例,進而改善先導性試驗的實施,并使讀者能夠使用先導性試驗報告結果,為將來在類似的環境下和相似的受試者進行試驗做準備。由于先導性試驗(評估可行性)的目的與將來確定性 RCT(評估效果或效力)的目的不同,因此報告的重點應該不同,這種差異反映在本擴展版中。
本擴展內容不適用融入于主要試驗設計的內部先導性試驗,同時也不適用于非隨機先導性和可行性試驗。然而,這里呈現的大部分內容可能適用于或在調整后能夠適用于如先導性或可行性研究或類似類型的試驗研究,例如在藥物研發中進行的“概念證明”或Ⅱ期臨床試驗[16, 17]。概念證明或Ⅱ期臨床試驗是小樣本 RCT,其主要目的是告知資助方是否繼續開展大規模的臨床試驗來研發藥物。與先導性試驗類似,概念證明或Ⅱ期臨床試驗的重點是評估進一步開發的可行性,而不是評估效果或效力。然而,為做到這一點,概念證明或Ⅱ期臨床試驗往往側重于安全性和潛在的效果或效力等方面。他們可使用為 II 期試驗設計的公認方法來評估將來 III 期試驗中所涉及的一些結果(如果需要,可進行 Meta 分析來實現)[18]或使用替代結果—即中間指標[19],通常是生物化學類指標,其對患者的直接影響要小于治愈或死亡等,但應與這些“硬”終點結局指標相關。在先導性試驗中,安全性和潛在效果或效力量通常不那么重要,與其他試驗有所不同,它重點關注干預措施及其評估方法的研發和與可行性有關的問題。然而,先導性試驗有時確實使用替代結果來評估潛在的有效性。例如,血氧飽和度作為改善肺功能和生存率的替代指標[20]或每天步行的步數代替心臟病臨床測量[21]。
本文提出了一個針對報告先導性 RCT 而制定的標準 CONSORT 規范的擴展版。不過,需要注意的是,許多研究者常常會使用定性研究和其他方法來評估可行性。因此,不可否認的是,在先導性和可行性試驗階段進行的定性工作的數量,其與任何先導性試驗的關系及研究者希望報告這項工作的方式各不相同。諸如 Hoddinott 等和 Schoultz等[22, 23]所進行的獨立于先導性試驗單獨報告的定性研究應遵循適當的報告規范[24-26],并應提供與為準備相同的最終試驗而進行的其他試驗工作的鏈接參考。當在先導性試驗的主要報告中報告定性工作時[27],并不總是能夠在報告的方法部分中加入足夠的細節,以符合定性研究的報告規范。如果出現這種情況,我們推薦通過在線補充或附錄來詳細報告這些方法。O’Cathain 等、Hoddinott 等和 Schoultz 等已經為實施與先導性試驗一并開展的定性可行性試驗提供了指南和示例[22, 23, 26, 28, 29]。
2 制定 CONSORT 在先導性試驗中的擴展
本文簡述了 CONSORT 的先導性試驗擴展制定過程[30]。在制定這一擴展內容的清單之前,研究小組就先導性和可行性試驗的定義達成了一致。首先,先導性試驗和可行性試驗視為不同類型的研究,因此需要單獨的檢查清單。然而,初步工作得出的結論是,先導性試驗和可行性試驗的定義不能相互排斥,且與目前的理解和研究界對這些術語的使用相沖突。因此,本文采用了可行性試驗的總體定義,將先導性試驗作為可行性試驗的一個子集,并為使用隨機方法的先導性試驗制定了一份清單。可行性試驗和先導性試驗的定義達成一致的過程及作為基礎的概念框架另文發表[11]。這個工作是在編制清單(表 1)的同時完成的。本文使用框 1 中的原則來指導工作。


第一階段,研究小組討論并研究了現有 CONSORT 清單中的每個條目,對每個條目進行確認,以判斷是否與先導性試驗相關,然后決定保留還是刪除,同時還確認所涉及條目是否需要在可行性試驗或先導性試驗的背景下重新措辭以達成一致。這一過程中產生兩個清單。然后將修訂后的清單應用于先前工作和個人收集的 30 篇文章樣本中[13, 15]。第二階段,研究小組使用修改后的德爾菲調查表就每個清單條目的適宜性尋求共識。參與者(n=93)對每個條目進行評分(1~9 分;1=完全不合適,9=完全合適)。除此之外,參與者還有機會就每個條目、先導性試驗和可行性試驗的定義及清單的有用性發表評論[11]。第三階段,德爾菲調查的參與者審查回復在第一輪調查中超過 70% 參與者評為 8 分或 9 分的條目,并對這些條目提出補充意見。與此同時,要求參與者審查剩余的條目,并使用 4 個選項(不保留、保留、不確定或沒有意見)對每個條目進行分類。此外,參與者被要求添加他們認為遺漏的任何條目。第一輪共收到 93/120 份答復(77.5%),第二輪收到 79/93 份(84.9%)答復。第四階段,研究小組面對面地討論了來自德爾菲調查的反饋意見,并修改了清單。第五階段,在為期 2 天的共識會議上,進一步詳細審查修訂后的清單。第六階段,改寫了部分清單條目,以確保含義和目的明確性;研究小組又舉行了三次面對面會議就該清單的最終措辭達成一致,并確定了良好報告的示例,并形成了解釋與說明文件。隨后向共識會議的成員發送了文件的完整草案,以確保草案充分反映會議的討論情況。
表 2 列出了最終的清單,該表中的相關內容與其他 CONSORT 擴展內容相一致。研究者在制定相關研究報告時應遵守標準清單中列的條目,除非條目發生了更改。框 1 列出了指導該過程的方法學考慮和原則事項。

3 CONSORT 2010 在先導性試驗中的擴展
3.1 標題和摘要
3.1.1 條目 1a
CONSORT 標準條目:文題能識別是隨機臨床試驗。先導性試驗的擴展:文題能識別是先導性或可行性隨機試驗。
示例 1(使用詞語“先導性”、“隨機”和“試驗”):“利用 Bespoke 戒煙治療嚴重精神疾病患者(SCIMITAR):一個先導性隨機對照試驗”[31]。
示例 2(使用詞語“可行性”、“隨機”和“試驗”):“一個評估療養院成年住客營養不良治療中營養干預的組群隨機可行性試驗”[32]
解釋:該報告規范的主要服務對象是先導性試驗或可行性隨機試驗。為確保這些類型的研究可很容易地從特定的檢索標準中識別出來,包含“先導性”或“可行性”及“隨機化”的標題為檢索提供了一個必要的、公認的術語[13]。這也將使這些研究能夠很容易地在電子數據庫中被索引,例如 PubMed 數據庫[33]。雖然這些詞語可能出現在許多研究的標題中,但它們可能不一定會同時出現,如:“關于在初級保健機構使用抗菌藥物治療急性呼吸道感染中共享決策的繼續醫學教育項目的可行性隨機試驗:決策+先導性試驗”[34]。除此之外,在某些情況下,作者可能使用短語“隨機試驗研究”或“隨機可行性研究”,如“不僅僅是另一個步行方案:日常活動支持(簡單)計劃—一個平行隨機對照試驗的隨機先導試驗[21]。”這些文件可在適當的檢索中被識別出來。然而,本文一般建議在同一個短語中一起給出相關術語,并使用“試驗”而不是“研究”,如“隨機試驗”或“隨機可行性試驗”。
3.1.2 條目 1b
CONSORT 標準條目:結構性摘要,包括試驗設計、方法、結果、結論幾個部分(具體的指導建議參考“CONSORT for abstracts”)[35, 36]。先導性試驗的擴展:先導性試驗結構性摘要,包括試驗設計、方法、結果、結論幾個部分(具體的指導建議參考“CONSORT for abstracts”)(表 3)。



解釋:根據期刊的風格,摘要遵循不同的結構,通常約 300 字左右。我們需在任一風格的摘要中概述應該報告的內容。此部分內容也適用于會議摘要。摘要的結構在格式上與標準 CONSORT 2010 指南的條目 1b 之間沒有差異。然而,它的內容側重于先導性試驗的目的和目標,而不是將來確定性 RCT。
重要的是,摘要包含與試驗可行性的目標和結果相關的研究背景、研究方法、結果和結論等內容,并聲明該研究是一個“隨機”的先導性試驗。這將有助于研究者理解該研究的性質,并通過包含的特定關鍵詞以便電子檢索。建議在摘要中說明這個試驗是為將來確定性 RCT 做準備。在背景中,應包括對需要解決的不確定性問題的描述及可行性目標和目的的說明,這些目標在試驗方法中是如何解決的及在結果部分中每個目標的結果。如果先導性試驗的目標不多,則應具體列出所有目標,并報告每個目標的結果。如果目標較多,那么應該先就哪些是最重要的目標達成一致,這些目標決定是否進行確定性 RCT,并且只需要報告這些目標。關于確定性 RCT 是否可能在先導性試驗結果的基礎上進行的明確聲明也應成為討論和結論的一部分。
3.2 引言
3.2.1 條目 2a
CONSORT 標準條目:科學背景和對試驗理由的解釋。先導性試驗的擴展:將來確定性試驗的科學背景和理由及開展隨機先導性試驗的原因。
示例:“胎動減少(reduced fetal movements,RFM)是產科護理中經常出現的問題,據報道 6%~15% 的婦女在妊娠晚期至少會經歷一次 RFM。RFM 的定義是母親認為胎兒活動明顯減少或消失,而這一問題與胎盤功能障礙導致的死產和胎兒生長受限(fetal growth restriction,FGR)的風險增加之間存在顯著相關性。盡管存在這種關聯,但目前依舊缺乏證據來指導出現 RFM 的婦女的臨床管理。最近皇家婦產科學院指南和一個 Meta 分析結果強調了這一點。因此高質量證據的缺乏導致了高收入地區 RFM 管理策略的廣泛差異。盡管有通過正式計數胎動的 RCT(如計數至 10),但目前依舊沒有針對胎動管理問題的 RCT 發表。一個承擔胎動管理的 RCT 提出了重要的實際問題,包括:母親對胎兒健康的焦慮,由于 RFM 的急性性質和參與試驗需要遵守試驗流程,因此需要在短時間內決定是否參與試驗。故而,研究中改變了胎動患者在病房層面的處理,采用了一種質量改進或階梯群組 RCT 的方案(CONFIRM,NCT01777022)。本研究旨在解決:單個患者 RFM 管理的 RCT 是否為一個適當的試驗設計,并且解決:① 產婦招募和保留(篩選部分);② 患者可接受性;③ 遵守試驗方案等方面是否可行。除此之外,本研究希望確認圍產期研究人群中不良結局的發生率[37]。”
解釋:為將來確定性 RCT 及先導性試驗給出理由和研究思路是非常重要的,因為根據赫爾辛基宣言的原則,在非必要的前提下,將人群暴露于研究相關風險之中是一種不道德的行為[38]。這個示例很好地表述了相關的背景和理由。不僅如此,該部分還應說明其他相關的文獻或前期工作,如系統評價、定性研究或其他的可行性工作,或者因之前沒有人關注過這些領域而導致此類工作的缺失。除此之外,應該清楚地闡述隨機先導性試驗的理由,包括在將來確定性 RCT 實施之前需要解決的不確定問題及為什么在進行將來確定性 RCT 之前需要進行這樣的試驗。這些理由通常在引言或背景部分的最后一段中報告,以說明為何要進行先導性試驗。
3.2.2 條目 2b
CONSORT 標準條目:具體目的或假設。先導性試驗的擴展:先導性試驗的具體目的或研究問題。
示例 1(將目標分為主要目標和次要目標):“在這個可行性試驗中,研究目的是探索試驗設計,工作人員和居民對干預措施和結局指標測量的可接受性,并提供數據來估計設計確定性 RCT 所需的參數……試驗的主要目的如下:① 評估有多少養老院接受邀請參與研究;② 通過估計可行的合格率和招募率,確定對養老院住客的入選標準是否過于寬松或過于局限;③ 通過評估 3 個月和 6 個月的隨訪率,評估養老院和住客的試驗參與的持續情況;④ 調查養老院住客對營養支持干預的依從性及療養院工作人員對干預計劃的遵從情況;⑤ 評估結局指標測量方式的可接受性和可行性(及影響因素),并將其作為在確定性試驗中測量干預措施有效性的方法。試驗的次要目的如下所示:① 研究養老院工作人員完成篩查工具和問卷的情況;② 確定有多少營養不良的住客能夠參加患者報告結局測驗(patient-reported outcome measures,PROM)并完成問卷;③ 試行衛生保健資源使用情況(healthcare resource usage,HCRU)問卷;④ 測量養老院營養不良的研究對象的關鍵結局指標域(對照組和干預組之間的完成率、缺失數據、估計值、方差和 95% 可信區間),包括物理結局指標測量和 PROM;⑤ 收集和合成數據,從中可估計確定組群 RCT(cluster randomised controlled trials,CRCT)的組群內相關系數(intraclass correlation coefficient,ICC)和樣本量[32]。”
示例 2(目標導向型混合方法研究):“這個研究的主要目的是評估實施確定性試驗的可行性,包括招募、干預措施的使用及可接受性、隨訪(3 個月和 6 個月時)及數據收集方法。除此之外,該研究旨在建立適當的程序,以提供干預,并進行評估和規范,以確保足夠數量的受試者被成功招募和保留在研究項目之中。最后,該研究旨在發現使用結構化、個性化的方法進行生活方式評估和轉介,是否會明顯提高研究對象對生活方式和行為改變干預的接受和參與度。同時,這個研究還將定性地檢查評估工具對急性心臟病患者的可接受性及患者改變生活方式的可接受性,以便制定有效的招募參與者和保留參與者策略。這個研究將有一系列的量化目標:① 確定有多少患者接受轉介并參與正式的生活方式計劃;② 確定有多少患者參與生活方式改變干預措施或啟動自我管理改變項目;③ 調查生活方式干預與后續行為改變的關系及對健康相關生存質量、情緒和社交滿意度的影響;④ 估計可行的納入標準、招募和拒絕率及 3 個月和 6 個月的隨訪率;⑤ 測量患者的關鍵結局指標內容(即對照組和干預組之間的完成率、缺失數據、估計值、方差和 95% 可信區間),包括:臨床指標和患者報告的社交滿意度測量,健康相關的生存質量指標和情緒相關指標;⑥ 對數據進行整合,為確定性試驗的樣本量估算提供依據;⑦ 確定財務獎勵作為一種鼓勵行為改變方法的可接受性及其影響因素、定價及其影響因素[39]。”
解釋:盡管可行性的許多方面可能相互關聯,但明確的具體目標能夠使讀者理解先導性試驗中要解決的主要不確定性內容,并提供一個工作框架來介紹與這些目標相關的方法和結果。除此之外,一份完整的目標清單使其他研究者能夠在自己的研究中學習和采用類似的方法。
將目標分成主要目標(通常是那些與將來確定性 RCT 決策相關的目標)和次要目標可能是有益的,如示例 1 所示,其中可行性目標是主要的,而與以患者為中心結局指標相關的問題被視為次要的。因為收集以患者為中心的結局數據并不總是必要的,所以給出收集這些數據的理由很重要。例如,目標可能是確保可收集某些特定的數據,包括來自特定患者組(如示例 1 中的老年人),或確保難以測量的概念(如生活方式行為改變)可在將來確定性 RCT 中進行適當評估(示例 2)。這可能明確說明哪些目標測量將使用定量方法,哪些使用定性方法也可能是有益的,如示例 2 所示。
在示例 2 中,定量目標列表非常有用,但它們來自已發表的試驗方案。在已發表的先導性試驗中,目標包含更多詳細信息:“健康醫院試驗是一個在利茲信托教學醫院的 2 個心臟病病房實施的單中心、隨機對照、雙臂、平行組、非盲可行性試驗。其主要目的是探討個體化生活方式轉介評估的可行性,估計招募率,并探討收集數據和受試者隨訪以確定最終試驗樣本量的可行性。第二個目的是檢驗這樣一個概念,即與通常評估相比,個性化的評估提高了對生活方式改變的接受程度。試驗方案已在別處發表[40]。”我們推薦將詳細的每個先導性試驗目標寫進報告中,以便讀者可更容易地判斷研究在多大程度上實現了這些目標。
不推薦在先導性試驗中納入檢驗效力(或效果)假設的目標(框 1)。然而,其他類型的假設可能會被測試,例如當使用臨時或替代結果來解決潛在效果[41]。然而,試驗應始終為任何假設檢驗提供足夠的檢驗效能,在先導性試驗中亦應清楚陳述評估潛在效果是目標之一。如果檢驗是在沒有足夠檢驗效能的情況下開展的(就像它們在現實中一樣),其結果當然應該肯定被視為次要的,并且應該在討論中予以提醒[21]。
3.3 方法
3.3.1 條目 3a
CONSORT 標準條目:描述試驗設計(諸如平行設計、析因設計),包括受試者分配入各組的比例。先導性試驗的擴展:先導性試驗的設計說明(如平行設計、析因設計),包括受試者分配入各組的比例。
示例:“本研究開展了一個平行分組隨機對照先導性試驗,選擇 2∶1 對 1∶1 的不均等隨機分組,為更多的患者提供水合作用干預措施的經驗[42]。”
解釋:無論是確定性試驗還是先導性試驗,都應描述研究的設計。絕大多數的先導性試驗所采用的都是 1∶1 的隨機化比例。例如,在將來確定性 RCT 中,1∶1 隨機化比例為測試有效性提供了最大的效能。然而,先導性試驗通常涉及新的、尚未建立的干預措施,其目的之一可能是獲得實施干預措施的經驗,在這種情況下最好讓盡可能多的參與者接受可行的干預措施。
3.3.2 條目 3b
CONSORT 標準條目:試驗開始后方法的重要改變(如合格受試者的挑選標準),并說明原因。先導性試驗的擴展:先導性試驗開始后試驗方法所做的重要改變(如合格受試者的挑選標準),并說明原因。
示例:“在隨機分配了 11 例患者(其中 5 例分配到標準護理組)后,我們發現被分配到標準護理組的患者正在接受早期手術,因為在完成快速的醫療檢查后,他們被列入了手術名單。因此,本研究修改了方案,在確定診斷時立即隨機分配患者;只有那些被分配早期手術的患者才會得到快速的醫學評估[43]。”
解釋:因為先導性試驗具備探索性質,所以如果其中存在很明顯的潛在問題,那么在實施過程中應該改正。在 Buse 等的研究中,原始方案規定患者在被隨機分配之前,必須完成為快速手術而做的醫療檢查,但因為已經確定了對照組的一些患者是合適的候選者,所以這些患者也被列入了快速手術的名單(快速手術是干預措施),這就干擾了對照組的入組。在修訂后的方案中,受試者首先被隨機分配,然后再行評估以判斷他們是否適合快速手術。因此,先導性試驗潛在地改進了確定性試驗的設計。重要的是記錄所有的更改并給出理由。本例描述了隨機分配時間的變化,但試驗的其他方面也可能發生調整,例如治療方案、入選標準或結局變量。
3.3.3 條目 4a
CONSORT 標準條目:受試者合格標準。
示例:“2011 年 3 月至 2011 年 11 月,從英國加的夫和牛津的亨廷頓病(Huntington’s disease,HD)專科門診連續招募了 31 例符合納入標準的 HD 患者。納入標準為:① 經基因測試和神經學檢查診斷為 HD 的患者;② 能夠獨立行走,且作為主要的行走方式;③ 愿意前往運動中心接受治療試驗;④ 具備能夠知情同意的能力;⑤ 統一 HD 評定量表總運動評分(UHDRS-TMS)和總運動能力(total functional capacity,TFC)評分至少分別在 5/124 和 5/13;⑥ 在研究開始前 4 周維持穩定的醫療方案,并且招募的臨床醫生認為能夠在研究過程中維持穩定的方案。如果受試者:① 有中風等其他主要神經系統疾病的病史;② 有限制行動能力的骨科疾病;③ 表現出不受控制的精神癥狀;④ 懷孕;⑤ 表現出任何運動禁忌癥;⑥ 參與任何介入試驗或在完成介入試驗后 3 個月內則不符合入選標準[44]。”
解釋:讀者可能想知道如何將試驗結果盡可能地應用于將來確定性 RCT 和將來類似受試者及試驗環境的其他試驗中。各種各樣的研究參與者(如患者、醫生、評估人員、護理人員和管理人員)可提供相關數據來實現先導性試驗的研究目標。例如,在療養院實施的一個研究中,采訪院友對干預措施的可接受程度,而護士參加焦點小組以征求關于隨機或遵守治療方案的意見。除此之外,先導性試驗中應具體設置每個受試者的納入合格標準。入選標準的細節必須足夠具體,只有這樣才能確定臨床人群和任何其他人群,招募中心的設置,并確定能夠符合法律要求,例如有能力給予知情同意。細節應足以讓其他研究者理解、學習和使用所提供的內容。
3.3.4 條目 4b
CONSORT 標準條目:資料收集的場所和地點。
示例:“高危青少年的招募來自 3 個地方:① 在匹茲堡大學參加 NIMH 資助(BIOS,PI:BirMaher)的雙向情感障礙(bipolar disorder,BP)子代研究的 205 例 12 至 18 歲 BP 父母的后代;② 在西方精神病學研究所和診所(western psychiatric institute and clinic,WPIC)接受 BP 治療的成年人的子女;③ 在 WPIC 的兒童和青少年 BP 服務診所(child and adolescent bipolar services clinic,CABS)接受 BP 治療的青少年的兄弟姐妹[45]。”
解釋:研究必須指定用于招募患者和收集數據的環境,以便讀者能判斷研究結果對其他試驗及確定性 RCT 的適用性(可推廣性)。除此之外,作者還應明確是否有任何先導性試驗場所具有特定的特征,例如,組織特征,使該場所易于早期采用新方案的特征或作者之間可能會影響招募、知情同意和隨訪的特定關系。因為這些特性可能無法在其他環境中重復,所以在確定性試驗中也同樣無法重復。與條目 4a 一樣,報告的細節必須足以讓其他研究者理解、學習和使用這些內容。
3.3.5 條目 4c
先導性試驗的擴展:如何確定受試者及如何獲得受試者知情同意。
示例:“2013 年 5 月至 10 月,胃腸病門診臨床工作人員篩選并識別了符合研究納入標準的潛在受試者。然后,研究邀請要么發送給與研究者密切接觸患者,要么給在診所連續觀察并接觸研究信息患者。所有研究信息都與來自患者參與組的患者共同設計。感興趣的患者通過電話或電子郵件向研究者表達他們參與研究的興趣。隨后研究者對潛在受試者進行了篩選,并且獲得了書面的知情同意[46]。”
解釋:這是聲明中的一個新增條目。在先導性試驗中,報告選擇受試者和知情同意的細節尤其重要,以便評估招募方法的可行性。研究者應詳細描述識別和接觸受試者的方式(如通過廣告或從醫療記錄或其他數據集中選擇),以使讀者能夠理解結果的可推廣性(適用性)。這對于擴大將來確定性 RCT 的試驗規模具有特別重要的意義,同時對將開展的其他試驗也具有借鑒作用。此外,知曉在將來確定性 RCT 中可能不容易實施的任何具體方面是至關重要的。同時,有一種觀點認為,先導性試驗的過程不需要像其他試驗那樣嚴格,因此,在這些試驗中展示嚴格、符合倫理的受試者遴選和招募過程可能尤為重要。如果識別受試者和獲得知情同意的方式細節已經在臨床方案中發表,那么應該清楚地引用。
3.3.6 條目 5
CONSORT 標準條目:詳細描述各組干預措施的細節以使其他研究者能重復試驗,包括各干預措施實際上是在何時及如何實施的。
示例:“干預(鍛煉或拉伸):參加運動活動所需的時間對于鍛煉組和拉伸組是相同的。唯一的區別是在活動過程中消耗的能量。在第一次會議上,運動教練解釋了各種治療的程序(鍛煉或拉伸),向他們展示了可用于鍛煉或拉伸課程的設備,并且協調員讓受試者熟悉了練習設備。前兩周至少需要在庫珀研究院(Cooper Institute,CI)進行 3 次培訓,讓教練教他們如何使用設備并完成練習或拉伸動作。兩周后,受試者開始在家里或其他地方(健身房、公園等)進行鍛煉,并且只需每周在 CI 參加一次鍛煉課程。每個鍛煉或拉伸階段平均約 30~40 分鐘。① 鍛煉干預:CI 受試者在指導下開始使用跑步機或健身腳踏車上運動課程。除此之外,CI 培訓師還培訓患者如何完成在家中的鍛煉課程(例如,根據他們喜歡的運動選擇 Wii 運動和 Fit、爵士健美操、慢跑、舉重訓練),這些鍛煉都是在患者家里或社區進行的無指導鍛煉。每次運動課程的持續時間通常是達到每周總熱量消耗的 1/3 或 1/4。最初幾周安排進階運動量,使他們達到最低 12 千卡/千克/周(kilocalories/kilogram/week,KKW)的能量消耗(例如,第一周 8 KKW,第二周 10 KKW 和第三周 12 KKW。受試者每周鍛煉 3 次[43]。② 拉伸干預:與鍛煉組相比,拉伸組花費的時間大致相同,但每節運動的能量消耗不足 4 KKW。在 CI 兩周 3 次課程后,改為每周 1 次在 CI 和 2 次在家課程。其中,5~10 分鐘的拉伸熱身期包括鍛煉身體主要肌肉群的拉伸。該系列包括傳統的熱身拉伸,如:拉伸臀部、大腿內側、小腿和腳踝、跟腱、腿筋拉伸、前后翻肩、聳肩、頸部肌肉鍛煉、膝蓋緊貼胸部、前額移向右膝,然后向左膝,之后雙膝及做骨盆傾斜運動。另外 10~15 分鐘的運動包括右小腿和左小腿拉伸,四肢拉伸,然后是手臂、手掌、手指、手腕、肱二頭肌/肱三頭肌、肩膀和背部的系列拉伸。所有的練習都設計為緩慢進行,強調適當的調整和休息時間,以在獲得一般柔韌性的同時最大限度地減少總體體力消耗,最重要的是控制與培訓者的接觸時間和參與此類活動的任何社交效應。本組受試者在 12 周中的每一周都有一套不同的低水平/低強度常規運動,以盡量減少受試者對重復運動的厭倦[47]。”
解釋:如果先導性試驗是要提示將來研究,那么作者應該報告給予所有研究組治療的確切細節,即使一個組僅是像往常一樣接受治療,也應該完整地描述。研究細節應包括由誰實施治療過程、治療內容、頻次和場所。研究者應遵循干預措施描述和重復的報告規范模板(the template for intervention description and replication,TIDieR),并完成報告清單[48]。如果任何組別的治療細節發生變化,則必須報告這些變化(條目 3b)。
3.3.7 條目 6a
CONSORT 標準條目:完整而確切地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的。先導性試驗的擴展:完整而確切地說明預先設定的在 2b 中每個先導性試驗評估和測量的具體目標,包括它們是在何時、如何測評的。
示例:“可接受性和需求基于試驗中受試者使用和重復使用干預措施來評估,并通過登錄用戶統計來反應。干預措施的實用性被認為是一種在交付中登錄和限制出現的能力,并根據青少年和專業人員的用戶百分比、其退回百分比(登錄錯誤百分比)和其他登錄問題進行評估。記錄退回百分比,并要求受試者報告登錄錯誤。整合情況的評估,是基于我們的網絡干預推廣程度,這一方法與公認的糖尿病護理標準一致,其中公認的標準包括由國際糖尿病聯合會(International Diabetes Federation,IDF)與國際兒科和青少年糖尿病學會(International Society for Pediatric and Adolescent Diabetes,ISpad)[51]和美國糖尿病協會(American Diabetes Association,ADA)合作發布的標準(參見原文附錄 1)[49]。”
解釋:在確定性的試驗中,研究者主要對能夠使他們實現主要目標(評估干預或治療效果)的反應變量或結局指標感興趣,并且他們需要對預先制定的結局指標進行明確的表述,以防止在評估這一效果時產生偏倚。然而,在先導性試驗中,目標應與可行性有關(框 1 和條目 2b),任何測量或評估都應使這些目標得以實現。為確保先導性試驗符合其目標,應定義測量或評估方法以解決每個單獨的目標或研究問題。在該示例中,目標是評估干預措施的可接受性、需求、實用性及整合情況。作者列出了每種方法所使用的措施。
為評估應答、完成情況或有效性,一些被認為可能是將來確定性 RCT 的主要和次要結局指標的變量可能會在先導性試驗中進行測量。然后,適當的測量或評估方法可是應答率、完成率或是效度的測量方法。有時研究者也想測量替代結局指標(比如條目 7b 中的示例),可能成為確定性 RCT 中的主要結局指標的因果途徑的變量,或早期時間點的結果,以便評估干預措施在影響確定性的 RCT 中的結局指標時的潛在作用(條目 2b)。
3.3.8 條目 6b
CONSORT 標準條目:試驗開始后對結局指標是否有任何更改,并說明原因。先導性試驗的擴展:先導性試驗開始后任何對試驗評估或測量的更改,并說明原因。
示例 1(改變評估期):“本研究結局指標測量了接受和停止干預措施的情況,因為本研究希望通過推薦更多的人來參加以影響干預措施接受率及通過支持對治療的堅持來影響那些被推薦的人的治療成功率。因此,干預有兩個不同的階段,盡管在方案中沒有計劃,本研究在這兩個階段檢查了試驗組的服務接受率和 4 周停止率[50]。”
示例 2(改變測量儀器):“本研究將改變的開始定義為:參與正式計劃或自我指導的計劃,引起任何時候的飲食、體力活動、吸煙或飲酒的改變。在本研究公布的方案中,本研究提出了 4 個類別的改變,本研究發現在定性的隨訪調查中很難區分“堅持”和“保留”;因此,本研究在類別 1 中合并改變了持久性和維持性[40]。”
解釋:在先導性試驗期間,評估或測量可能會發生變化,因為或出于可接受性或實用性的原因(示例 2),這些改變(示例 1)可使研究者能夠收集關于干預措施實施的更多內容。在示例 2 中,當發現研究者無法區分其中兩個類別時,使用具有四個類別的測量工具變得不切實際。為完整報告,且由于這些內容對同一專業領域的其他人有用,所有這些變化都應該在研究報告中詳細地報道出來。
3.3.9 條目 6c
先導性試驗的擴展:如果適用,使用預先設定的標準判斷是否或如何處理將來確定性試驗。
示例:“DECISION+計劃的可行性(交付)和可接受性(接受)是本次先導性試驗的主要結果測量措施。研究者已為具體的可行性和可接受性標準建立了先驗閾值,包括:① 聯系的家族醫學小組(family medicine groups,FMG)參與先導性試驗研究的比例將為 50% 或更高;② 招募的參與所有 3 個研討會的家庭醫生比例為 70% 或更高;③ 家庭醫生對研討會的平均滿意度為 65% 或更高;④ 每份填妥的問卷中缺失數據的比例將少于 10%[34]。”
解釋:這是該聲明中的一個新增條目。先導性試驗的目的是評估在研究過程中進入下一階段的可行性。為做到這一點,研究者需要一些標準來決定是否繼續研究。正常情況下,研究過程的下一階段將是將來確定性 RCT,盡管并非總是如此。
英國國家衛生研究所要求先導性或可行性試驗要有明確的標準來決定是否進展到下一階段:“我們期望當申請人提出先導性或可行性試驗申請時,或者在試運行簡報中,能夠在實質性研究中描述進展標準的清晰路徑。列出清晰的進展標準在前期研究申請或者前期合并實質性研究的簡報或申請書中都適用。前期試驗和主要試驗是合并資助還是分開資助將根據實際情況而決定[51]。”
然而,在許多先導性試驗中,這些進度標準最好被視為指標,而不是決定下一階段的門檻。在這個示例中,作者發現只有 24% 的 FMG 同意參加。他們表示,“未達到預先確定的標準并不一定表明試驗不可行,而是強調要對試驗方案做出改變”[34]。顯然,對試驗方案更改是否可行的討論至關重要,并且這種討論常常得益于試驗團隊以外的人員參與。例如,來自試驗指導委員會的參與。這可能是在先導性試驗中設立指導委員會的原因。Bugge 等[52]對先導性試驗后如何決策提供了進一步指導。
除對試驗方案進行修改的可能性外,研究者還應該意識到先導性試驗中所估計的比率可能會受到相當大不確定性的影響,因此最好謹慎地設置可能僅僅由于機會變量而錯過的明確閾值。事實上,研究者以類似交通指揮的紅綠燈系統作為判斷可行性的標準正變得越來越普遍,因此當低于較低閾值的測量結果(如招募率)表明試驗是不可行的,而高于較高閾值則表明試驗是可行的,如閾值在兩者之間,如果能夠做出適當的改變,那么試驗可能也是可行的。
3.3.10 條目 7a
CONSORT 標準條目:如何確定樣本量。先導性試驗的擴展:先導性試驗樣本量設置的理由。
示例 1(基于實用性評估和估計率的基本理由):“因為這是一個先導性研究,所以沒有進行樣本量計算。研究者的目標是納入 120 例受試者,他們認為這是一個足夠大的樣本,可讓他們了解實施針對慢性阻塞性肺病患者幾個自我管理課程的實用性及其招募、納入和退出的情況[53]。”
示例 2(基于將來確定性 RCT 所需樣本量百分比的基本理由):“因為這是一個可行性研究,所以不需要正式的樣本量估算,但本研究估計的樣本量是第三階段試驗所需的樣本量的 10%。第三階段試驗的樣本量計算表明,本研究需要招募 1 665 例受試者。鑒于參與人數眾多,預計將出現大幅度參與者中途退出的情況。因此,本研究的目標是招募 200 例受試者參加可行性試驗,為第三期 RCT 的設計和樣本量選擇提供詳細資料[54]。”
解釋:有關試驗目標和樣本量之間的一致性標準,適用于先導性試驗及任何試驗研究。許多先導性試驗有明確的與估計接受率、招募率、保留率或采用率有關的關鍵目標(如條目 2b)。對于這些類型的目標,在理想情況下,應設置具體的數值,以確保圍繞估計率的所需精確度,盡管在實踐中可能難以實現。除此之外,對于主要目標集中于干預措施的可接受性或可行性的先導性試驗,考慮需要多少個試驗中心可能是有益的,因為干預措施的可接受性或可行性有時也取決于試驗中心的多少。在示例 1 中,作者陳述了他們選擇所需樣本量的原因,涉及估算率和探索實施干預措施的實用性。然而,他們本可為他們選擇的樣本規模提供更有力的理由,例如可能的招募或流失率及圍繞這些比率所需的精確度,這樣讀者(和資助者)就有更多的理由相信試驗可實現其目標而不是憑感覺判斷。
大多數側重于關于先導性試驗樣本量要求的方法學論文,都假設此類試驗的主要目的是估計定量指標,如效應量的方差(或標準差),以便為將來確定性 RCT 的樣本量計算提供資料。這些方法的重點是獲得這樣的估計精確度。這里有幾篇相關的文件[55-57]。其中,Whitehead 等[58]建議先導性試驗的樣本量應與將來確定性 RCT 的樣本量相關。對于設計為 90% 檢驗效能和雙側 5% 檢驗水準的此類試驗,他們建議每個治療組的先導試驗樣本量為 75、25、15 和 10,標準化效應量則分別為特小(0.1)、小(0.2)、中等(0.5)或大(0.8)。
示例 2 說明了另一種方法,該方法使用的樣本量是將來確定性 RCT 的預期樣本量的某個百分比。作者參考了 Cocks 和 Torgerson 的論文,這是基于使用這一樣本量時,如果無效假設為真,那么效應大小的單側 80% 可信區間將排除最小臨床重要差異[59]。這與用于估計效果或效力所需樣本量的計算類似,但允許在結局指標效應量估計中存在額外的不確定性,從而有效地評估潛在有效性。如果目標是使用替代或臨時結局指標來評估潛在的有效性,研究者將需要使用標準樣本量計算來確保有足夠的檢驗效能。然而,這種類型的目標在先導性試驗中很少見。
3.3.11 條目 7b
CONSORT 標準條目:必要時,解釋中期分析和試驗中止原則。
示例:在招募 60 例患者后,委員會成員需進行中期分析,如果基于關鍵顯著性水平(P≤0.02)檢測到壓倒性效應,他們可建議中止試驗,這是針對具有波科克邊界的蘭德米茨阿爾法支出函數進行調整的[20]。
解釋:由于先導性試驗規模較小,因此不常定義早期中止的標準,但如果研究者這樣做了,則應報告這些標準。示例是測試替代結局指標的先導性試驗。這一結局指標的可變性存在相當大的不確定性,因此作者計算了一個保守的樣本量,但在招募 60 例患者后進行了中期分析,以防先驗估計太大,并且確保在這一階段他們有足夠信息為后續試驗提供資料。
3.3.12 條目 8a
CONSORT 標準條目:產生隨機分配序列的方法。
示例:“受試者被隨機分配到干預‘MBCT 組’或‘等待名單對照組’……。其中隨機分配序列號是由計算機生成的[46]。”
解釋:隨機化導致每個隨機化單位分配的不可預測性,這是確保 RCT 公正評估效果或效力的一個重要因素,因為從長遠來看,它確保了干預措施組之間相關特征的均衡。在先導性試驗中,隨機方法的完整性可能不會直接影響先導性試驗結果的穩健性,因為先導性試驗結果不側重于對效果或效力的評估,但對隨機過程的明確描述對于透明報告仍然很重要。
除此之外,在一些先導性試驗中,目標之一可能是評估隨機化的可行性;因此,報告細節也很重要。如果評估可行性涉及生成隨機分配序列的方法不止一種,則應充分描述每種方法。
3.3.13 條目 8b
CONSORT 標準條目:隨機方法的類型,任何限定的細節(如怎樣分區組和各區組樣本多少)。先導性試驗的擴展:隨機方法的類型,任何限定的細節(如怎樣分區組和各區組樣本多少)。
示例 1(分區組示例):“按計算機生成的隨機分配序列,區組數為 3,按性別分層,受試者被隨機分組到水合組或對照組(2∶1)。[42]”
示例 2(兩種不同類型的隨機化):“除了隨機分配到三個治療組之一,本研究使用 2×2 析因設計按兩個試驗設計因素分配普通科和受試者:群組對個人招募及系統性或機會性招募(圖 1)。本研究隨機分配了 24 個普通科(在布里斯托爾、德文和考文垂 3 地,各有 8 個普通科),按 3∶1 比例分配群組(普通科)或個人,機會性或系統性招募比例為 1∶1。不同隨機化方法的不同分配比率是因需要確保普通科和參與者在 3 個試驗組中的數量均衡[60]。”
解釋:研究者應報告隨機化的類型,包括是簡單隨機化或限制性隨機化。
出于實際原因,有時在先導性試驗中使用簡單的隨機化,即使預期在將來確定性 RCT 中使用限制性隨機化,像這樣的情況也需要描述。限制性隨機化在評估干預效果的小樣本試驗中特別有用,因為其能夠確保干預措施組和對照組之間某些特征的均衡(詳見原 CONSORT 聲明)[2, 61]。在先導性試驗中,限制性隨機化可用于模擬將來確定性 RCT 中預期的隨機類型,或如有必要,即使限制性隨機化不會在確定性 RCT 中使用,也應對先導性試驗各組特征進行均衡處理。示例 1 中使用了分層區組隨機化分組方法。
先導性試驗的目標之一可能為評估隨機化的可行性;因此,可嘗試不同類型的隨機化,如在示例 2 中考慮群組與個體隨機化[60]。
3.3.14 條目 9
CONSORT 標準條目:用于執行隨機分配序列的機制(如按序編碼的封藏法),描述干預措施分配之前為隱藏序列號所采取的步驟。
示例:“分配是使用布里斯托爾隨機試驗協會提供的自動電話隨機化服務來實現的,以確保從事受試者招募的臨床工作人員不會對其造成任何干擾[62]。”
解釋:確保分配隱藏是良好隨機試驗設計的基石,這一機制可通過防止登記受試的研究者預知受試者的分組方案,從而為最大限度防止偏倚發揮了關鍵作用。在將來確定性 RCT 中,將使用單一機制來實施分配隱藏。然而,在先導性試驗中使用分配隱藏機制的主要目的是確保該機制的可行性。如果要使用的機制存在相當大的不確定性,那么可在先導性試驗中嘗試多種機制。這種罕見情況發生時,應充分描述嘗試的各種機制細節。
3.3.15 條目 10
CONSORT 標準條目:誰產生隨機分配序列,誰招募受試者,誰給受試者分配干預措施。
示例 1(誰生成隨機分配序列):“一位獨立的統計顧問建立了基于網絡的隨機化過程,通過遠程分配,使用大小為 2 和 4 的區組,將符合條件的受試者分配到干預措施組或對照組。沒有直接參與該項目的人不能接觸分配代碼[21]。”
示例 2(誰登記受試者,誰分配干預措施給予受試者):“負責評估的臨床醫生,篩選了符合條件的兒童及其家庭。如果孩子和他或她的家人愿意了解更多關于這個研究的內容,研究者就會聯系他們的家人并安排在方便的場所(通常是在家里)探望他們……。那些愿意參加的受試者被隨機分配接受專科醫療護理或專科醫療護理+菲爾帕克閃電治療(lightning process,LP)。其中具體分配過程由布里斯托爾隨機試驗協會實施[62]。”
解釋:重要的是,先導性試驗確認了分配隱藏方式可在確定性 RCT 中重復實施,包括誰產生隨機化序列,誰招募和分配受試者。
3.3.16 條目 11a
CONSORT 標準條目:如果實施了盲法,分配干預措施之后對誰設盲(如受試者、醫護提供者、結局評估者)及盲法是如何實施的。
示例 1(多人不知情):“患者、家屬、ICU(重癥監護病房)工作人員、超聲技術人員和研究者對藥物分配情況均不知曉。每個中心的研究藥劑師是唯一清楚相關情況的一方[63]。”
示例 2(安慰劑對照):“與僅含纖維的安慰劑配方相比,試驗組每天提供包含 4 種益生菌菌株加上 4 種不可消化、可發酵的膳食纖維(每個 2.5 克)的共生配方(Synbiotic 2000?)[64]。”
解釋:研究者希望在確定性 RCT 中盡可能減少結果偏倚。“盲法”被認為是做到這一點的最有效的方法之一,至少在盲法可行的試驗中(詳見主要的 CONSORT 聲明)。由于先導性試驗的主要目的是評估方法的可行性,包括那些減少偏倚的方法。因此在一些先導性試驗中,詳細報告盲法可能是有用的,如示例 2 所示,這種方法可幫助希望在將來 RCT 中重復該方法的讀者。
在先導性試驗中,通過詢問受試者是否相信自己被施盲來嘗試和評估盲法的成功與否是很有吸引力的。例如,Arnold 等[65]就是這樣做的。但不建議這樣做,因為有證據表明這樣做的結果在很大程度上反映了干預措施的有效性,而不是其他[66]。
3.3.17 條目 11b
CONSORT 標準條目:如有必要,描述干預措施的相似之處。
示例:“每個研究的藥物輸注都采用標準的基于容量的速率升級方案,靜脈注射氫化可的松 100 mg,口服或靜脈注射苯海拉明 50 mg,口服對乙酰氨基酚 650 mg,以盡量減少與輸注有關的反應,避免揭盲[65]。”
解釋:如果盲法是通過安慰劑對照來完成的,那在評估干預效果的試驗中,重要的是詳細說明安慰劑的哪些特征與干預措施(通常是藥物)相似—例如外觀、味道、嗅覺、給藥方法等。但是,先導性試驗中描述的許多干預措施都不是藥物。盡管如此,描述如何確保干預措施組和對照組在可能的情況下獲得一致的治療(除外科手術外)仍然是很重要的。同樣重要的是要注意到這一點,即使用此類型方法在復雜干預措施中通過盲法分配某些人將是不可能或不可行的。
3.3.18 條目 12a
CONSORT 標準條目:用于比較各組主要和次要結局的統計方法。先導性試驗的擴展:用于解決每個先導性試驗定性或定量目標的方法。
示例 1(描述性和敘述性報告):“可行性結局指標需描述性和敘述性的報告。對于臨床終點指標,僅進行了描述型統計,連續型指標報告了平均值(標準差),二分類指標報告了原始計數(%)[67]。”
示例 2(可信區間):“對于主要結局指標,可行性標準是招募率和持續時間、保留率、安全性、不良事件、依從性、干預措施的可接受性和疲勞程度等。招募率(包括合格率和知情同意率)用 95% 可信區間(confidence interval,CI)報告,有序分類數據(如疲勞)利用中位數(范圍)報告,連續型數據(如步行速度和步行距離)利用平均值(95%CI)報告,而二分類變量用原始計數(數字,%)報告。由于這個可行性研究的性質,本研究決定不對步行和疲勞數據進行關于任何有效性問題的統計驗證[68]。”
解釋:可使用一系列方法來處理先導性試驗中的目標。這里并不需要統計學方法。提供有關所用方法的內容可確保在所用分析描述的基礎上對相關結果進行驗證。其主要重點是處理試驗可行性目標的方法。這些方法通常基于描述性統計,如均值和百分比,但也可能是敘述性描述(示例 1)。在先導性臨床試驗中,任何使用受試者結果對效應值的估計,這個效應值有可能在將來確定性 RCT 中被測量到,通常被報告為一個估計值及其 95%CI,但沒有 P 值—因為先導性試驗不足以驗證關于效果的假設。
3.3.19 條目 12b
CONSORT 標準條目:附加分析的方法,諸如亞組分析和校正分析。先導性試驗的擴展:不適用。
解釋:在確定性試驗中,分析亞組治療效果的差異或對基線不均衡對結局的調整性分析可能會提供有用的內容。然而,先導性試驗中的這種分析是不適用的,因為主要重點不是確定治療效果或亞組之間的效果差異。相反,可行性試驗的重點是評估可行性或試驗程序,以便為確定性 RCT 的設計提供依據。
3.4 結果
3.4.1 條目 13a
CONSORT 標準條目:隨機分配到各組的受試者例數,接受已分配治療的例數及納入主要結局分析的例數。先導性試驗的擴展:對于每一組,接觸和/或評估合格的,隨機分配的,接受意向性治療的,并對每個目標進行評估的受試者例數。


解釋:類似于對其他試驗一樣,本研究推薦一種先導性試驗中反映受試者過程的流程圖。流程圖是 CONSORT 聲明中已被廣泛采用的關鍵元素[70]。一篇針對發表在 5 種主要的全科和內科雜志上的隨機對照試驗的研究發現,按 CONSORT 推薦的方式,以流程圖報告受試者流程,試驗信息更加完整[70]。除此之外,完整的 CONSORT 流程圖也減少了讀者找到必要信息以評估試驗可靠性的時間。同時它還可能提高某些有可能不會被報告信息的可獲得性。
完成 CONSORT 流程圖所需的信息包括:參與評估的潛在參與者的數目,被隨機分配到每個干預組的受試者數目,依分配方案接受治療的受試者數目,依分配方案完成治療的受試者數目及就主要結局指標進行分析的受試者數目,而且,每個步驟中都應列出排除者的數量和原因[2, 61]。
對于先導性試驗,了解在評估被招募者的入選資格之前接觸了(或篩選了)多少受試者可能也很重要。這確保了讀者可評估外部效度及試驗受試者能夠與所有合格參與者進行比較的代表性[71]。除此之外,對于先導性試驗,重要的是要知道在評估合格參與者之前接觸了多少潛在受試者及招募他們的難度,以便評估確定性 RCT 和其他將來試驗的招募潛力。在某些情況下,如果這些要素是先導性試驗的主要焦點,則流程圖可能需要更多的信息(圖 4)。
對于先導性試驗,報告每個先導性試驗目標評估的受試者人數是適當的,而不是為主要結果分析的人數(如將來確定性 RCT 報告的是主要結果分析的人數)。如果先導性試驗的目標有限,則應列出所有目標,并在流程圖中報告每個目標的結果。如果有多個目標,那么應該事先就哪些是最重要的目標達成一致,以決定是否繼續進行將來確定性 RCT,同時也只有這些重要的目標應該在流程圖中報告。圖 5 提供了先導性試驗的 CONSORT 流程圖的模板,該模板包括不同目標的結果展示。然而,確切的形式和內容可能會因試驗的具體特征而有所不同。因此作者應確保他們的流程圖盡可能與關鍵目標相匹配。
3.4.2 條目 13b
CONSORT 標準條目:隨機分組后各組脫落和被剔除的例數,并說明原因。
示例:“所有 16 例患者,隨機分配到癥狀診所,都完成了首診,其中 11 例完成了 3 次或 4 次隨訪。在其余的人中,有兩人在同意提前出院時,情況明顯改善;兩人在第二次隨訪后發現難以進一步參與該研究,一人在第一次隨訪后拒絕了任何進一步聯系。盡管兩組的隨訪應答率相當,但有幾個隨機分組后接受常規治療的患者表示了一定程度的失望[72]。”
解釋:對于一些 RCT 而言,描述受試者在試驗每個階段的流程相對直接,特別是在沒有隨訪缺失或受試者剔除時。然而在一些較為復雜的試驗中,讀者可能很難確定一些受試者是否、及為什么沒有按分組方案接受治療,為什么隨訪中斷,或者為什么被排除在結果統計之外[73]。在確定性試驗中,這些信息對于解釋試驗結果的可推廣性至關重要,因為分配后被剔除的受試者不太可能代表研究中的所有受試者[74]。在先導性試驗中,這些內容可用于判斷將來確定性 RCT 的潛在可推廣性,但亦可用于評估受試者對干預措施的可接受性,并幫助規劃確定性 RCT 和類似情況下的其他試驗。
3.4.3 條目 14a
CONSORT 標準條目:招募期和隨訪時間的長短,并說明具體日期。
示例:“患者招募開始于 2003 年 8 月,并于 2005 年 10 月完成[75]。”
解釋:為提高透明度,報告所有研究中重要活動的起始日期是很重要的。就先導性試驗而言的另一個理由是,這些日期可能影響確定性 RCT 的疾病定義、治療選項和報銷計劃等因素,因為在進行先導性試驗和確定性 RCT 開始之間,這些情況都可能發生了變化。試驗之外的不同治療方法的可獲得性也會發生變化,并可能對人們參加隨機試驗的意愿產生影響。因此,先導性試驗的招募可能比將來確定性 RCT 招募更容易,也可能更難。除此之外,了解研究過程的時間長度對于規劃將來確定性 RCT 和其他試驗可能也重要。
3.4.4 條目 14b
CONSORT 標準條目:為什么試驗結束或中止。先導性試驗的擴展:先導性試驗結束或中止的原因。
示例 1(未達到預期招募人數而停止,但提供了足夠的數據):“產腸毒素大腸桿菌(enterotoxigenic escherichia coli,ETEC)是導致旅行者腹瀉的主要原因。本研究設計了這個Ⅱ期雙盲隨機安慰劑對照研究,以調查計劃登記的 300 例安慰劑接受者中 ETEC 自然感染的流行病學,安慰劑與不耐熱腸毒素(heat-labile enterotoxin,LT)的比例為 2∶1。當登記人數達到 201 例時,該研究停止,因為已經超過了計劃的試驗停止要求,研究者認為,大于 100 例的安慰劑組,雖然不如原來計劃的 200 例,但足以評估安慰劑組的 ETEC 罹患率。在 111 例安慰劑組中,有 24 例(22%)患有腹瀉,其中 11 例(10%)由 ETEC 引起[76]。”
示例 2(在招募結束時停止,但沒有提供足夠的數據):“如果招募率低于預期,就將研究擴展到較多領域,并通過廣告招募潛在受試者。然而,由于英國血壓治療質量和結局指標框架指南出于對高血壓的更好管控考慮而做出的變化,幾乎沒有篩選到合格的受試者(有 13 例受試者同意參與,但 12 例篩查失敗,導致只招募了 1 例受試者),因此試驗在招募期間結束時就停止了[77]。”
解釋:當先導性試驗結束或中止時說明原因很重要,因為這可能會影響確定性 RCT 的可行性。在示例 1 中,研究者的計劃時間已用完,并且認為他們可有足夠的受試者來估計腹瀉的罹患率,以便為將來的研究提供信息。由于臨床環境發生變化,導致疾病未能控制的患者數量減少,這種情況并不少見,這可能導致重要的后續試驗,而不僅是先導性試驗,招募不到參與者。這說明了一個先導性試驗研究在評估確定性 RCT 的可能收益方面的好處。在示例 2 中,停止的原因僅僅是受試者招募失敗,并且清楚地說明了原因。停止的其他潛在原因還包括:干預措施不可能實施,有新的研究表明該試驗與研究目標已經不相關及資金困難。知道是誰做出了提前停止的決定也是有幫助的。在確定性 RCT 中,數據監測委員會經常提出停止試驗的建議。也許沒有必要為所有的先導性試驗設立數據監測委員會,但研究者應考慮如何做出停止的決定。
3.4.5 條目 15
CONSORT 標準條目:用一張表格列出每一組的基線數據,包括人口學資料和臨床特征。
示例:參見表 4。

解釋:在評估干預措施效果的 RCT 中,干預組基線特征表對說明可能影響試驗結果表面效度的任何差異是很重要的。在先導性試驗中,受試者的數量可能比將來確定性 RCT 少,因此基線失衡的可能性更大。與確定性試驗類似,不均衡并不意味著偏倚,且在某些情況下任何病例偏倚都不是一個問題,因為在先導性試驗中對干預措施效果的評估不是主要關注的問題。盡管如此,基線數據對于幫助解釋結果很重要,包括可推廣性方面的考慮,而表格是展示這些內容的最佳方式。
3.4.6 條目 16
標準 CONSORT 條目:各組納入每一種分析的受試者數目(分母)及是否按最初的分組分析。先導性試驗的擴展:對于每個研究目的,納入每一種分析中包括的受試者數目(分母)。如果相關,這些樣本應該按隨機分組的結果進行分析。
示例 1(聯系的站點數量):“一名研究助理在 4 周期間打了 41 個介紹電話,與 21 個合格的家庭醫學小組(family medicine group,FMG)的醫療主任聯絡。其中 1 個醫療主任無法聯絡。有關研究的宣傳資料已傳真至 20 個已聯絡的家庭醫學小組。”
示例 2(在試驗點內參與試驗的參與者數量):“在 5 個參與試驗的 FMG 中工作的 52 名合格家庭醫生,有 39 名(75%)同意參與這個研究[34]。”
解釋:在評估干預措施效果的 RCT 中,結局指標通常是測量受試者的,因此分母是受試者的數量。然而,由于先導性試驗中試驗目標有潛在多樣性,根據這些目標評估可行性措施的分母可能是組織、衛生從業人員、患者或在某些情況下可能是情節或事件。為簡單起見,我們沒有更改本條目中的“受試者”一詞,但應根據特定目標和相關措施或評估來解釋該條目。這兩個示例取自同一試驗。一個目標是評估招募的可行性。該目標的主要受試者是 FGMs(示例 1)和家庭醫生(示例 2)。21(FMGs)和 52(家庭醫生)的分母表示研究者所接觸到的受試者數目以表達招募過程中的努力。在這個示例中,不能按隨機分組例數進行分析。
3.4.7 條目 17a
CONSORT 標準條目:各組每一個主要和次要結局指標的結果,效應估計值及其精確性(如 95% 可信區間)。先導性試驗的擴展:對于每個研究目的,任何估計的結果都包括對不確定性的表達(如 95% 可信區間)。如果相關,這些結果應該按隨機分組進行分析。
示例 1(可行性結果):“ABSORB(用于單個冠狀動脈病變患者的生物可吸收依維莫司洗脫冠脈支架系統)研究旨在評估 BVS(生物可吸收依維莫司洗脫支架)支架在單個冠狀動脈病變患者中的可行性和安全性。治療成功率為 100%(30/30 例患者),設備成功率為 94%(31 次嘗試植入支架成功 29 次)[78]。”
示例 2(建議在將來確定性試驗檢測的結局指標):“盡管生活方式改變的起始率也有利于個體化的評估組,但不太明顯。在 3 個月時,75% 的個體化評估組和 68% 的常規評估組已經開始改變他們的生活方式[未調整的優勢比為 1.38,95%CI(0.55,3.52)]。在 6 個月時,該百分比分別為 85% 和 75%,表明隨著時間的推移,兩組的變化開始增加,差距略有擴大[未調整的優勢比為 1.86,95%CI(0.64,5.77)]。而該可信區間所體現的較大范圍再次提示這一結論的不確定性程度[40]。”
解釋:反映先導性試驗研究目標的結果報告很重要。例如,結果可能包括招募、保留或應答率,或其他類型的比率,如示例 1。由于先導性試驗中的樣本量可能較小,因此對這些比率的估計并不精確,并且應通過計算估計值的可信區間來識別這種不精確。通常,在先導性試驗中,作者不會給出這樣的可信區間,但如果給定分子和分母,則可計算出該可信區間。在示例 1 中,100%(30/30)的 Wilson 95%CI 為 88.65% 至 100%,而 94%(29/31)的 Wilson 95%CI 為 79.78% 至 98.21%(OpenEpi Seattle)[78]。如果作者確實報告了試驗組之間的差異(如果與試驗的目標不一致,這是沒有必要的),則可信區間為讀者提供精確度評估(示例 2),這通常表示相當大的不確定性。如果先導性試驗和將來確定性 RCT 中的樣本來自略微不同的總體,則根據先導性試驗計算的可信區間將不會直接指明確定性 RCT 中相關結局指標的可能上下限,但仍然可有效地突出其不精確。
3.4.8 條目 17b
CONSORT 標準條目:對于二分類結局,建議同時提供絕對效應值和相對效應值。先導性試驗的擴展:不適用。
解釋:這一條目被包括在 2010 年 CONSORT 聲明中,因為在考慮臨床意義時,二分類結局指標的效應大小的相對或絕對測量都不能給出干預效果的全貌。例如,與絕對風險相比,研究中人群的基線差異對相對風險的影響較小,盡管有時人群的影響可能會被曲解。除此之外,不同的受眾(臨床、政策、患者)更喜歡使用一些其他的措施。然而,在先導性試驗中,情況就不同了。由于來自這些試驗的估計不精確,并且這些試驗中的樣本可能不具有代表性(條目 17a),因此我們建議不要依賴先導性試驗的效應量估計來判斷臨床意義(另見引言,本文的范圍和框 1)。結局指標的數據可合理地用于其他的目的,比如估計確定性 RCT 的樣本量(條目 7a)。但就條目 17b 來說,報告理由是以臨床意義為基礎的,其對于先導性試驗而言是不適用的。
3.4.9 條目 18
CONSORT 標準條目:所做的其他分析的結果,包括亞組分析和校正分析及不同于預先設定的分析。先導性試驗的擴展:任何進行的可能用于將來確定性試驗的其他分析的結果。
示例:“敏感性分析:在 6 周和 12 周時,研究結果對那些在住院期間接受導尿的患者不敏感(也排除了那些在拔除導尿管后從未出現尿失禁的患者)。然而,同樣在這兩個時間點,當排除中風前尿失禁患者時,優勢比會發生較為明顯的降低[79]。”
解釋:最初非計劃性分析,其結果可能對將來確定性 RCT 產生重要影響。應該報告這些分析的結果,并討論它們如何影響將來確定性 RCT。在示例中,雖然受試者樣本量很小,但作者從非計劃性敏感性分析推斷,與中風前尿可控制的患者相比,尿失禁患者至少有可能或更可能從干預措施中受益,并得出該組患者應該包括在完整試驗中的結論。
3.4.10 條目 19
CONSORT 標準條目:各組出現的所有嚴重危害或意外效應(具體的指導建議參考“CONSORT for harms”)[7]。
示例 1(潛在危害):“盡管干預措施組和常規治療組在年齡、性別和婚姻狀況方面相似,但干預措施組更有可能是:失業(69% vs. 59%)、使用除服毒以外的方法自殺(23% vs. 9%)、有自殘史(67% vs. 53%)和接受過精神治療(64% vs. 53%)。在線 DS1 表顯示了兩組中的反復自殘和資源使用情況。從表中可看出,干預措施組與普通治療組受試者的 12 個月復發率為 34.4% vs. 12.5%……調整臨床因素基線后(中心,傷害方法(服毒 vs. 其他)及自殘史,既往精神病治療)后,與常規治療組相比,干預措施組重復發作的優勢比和重復發作次數仍然升高了[80]。”
示例 2(意外影響或潛在危害):“盡管我們認識到在研究開始時各組之間的體重存在一些差異,而這可能對結果造成影響,但這個研究中一個意想不到的發現是干預措施組平均體重減輕了 4 公斤,有利于本研究的預期結果。因此,在任何旨在對體重產生積極影響的研究中,飲食因素有明確的作用。盡管我們在當地營養師陪同下的雜貨店之旅中,提供了一次有關營養的教育課程,并通過提供的午餐模擬了健康食品的選擇,但飲食行為和體重并不是本研究的重點[21]。”
解釋:報告每組受試者的所有重要的或潛在的危害或意外影響是至關重要的,這些結果可改良確定性 RCT 的研究設計,以避免這些影響或建立有效的程序監測潛在的危害。在示例 1 中,尚不清楚干預措施組反復自殘的非預期增加風險是真實的,還是基線協變量不均衡的結果,還是特定環境所特有的。這一結果導致了提議在將來確定性 RCT 中使用分層隨機化的設計。在示例 2 中,老年受試者體重減輕的非預期效應導致在干預措施中加入飲食因素的決定,以避免在將來確定性 RCT 中產生潛在的傷害。這些內容也可能對計劃進行類似研究的其他研究者有用。
3.4.11 條目 19a
先導性試驗的擴展:如果相關,其他重要的非預期結果。
示例(非預期結果):“從 1998 年 4 月中起計 12 個月內,13 個積極疼痛管理方案組中的 12 個及 13 個傳統疼痛管理方案組中的 11 個,一共招募了 231 例受試者。其中,積極管理方案共招募了 165 例受試者(平均方案招募率為每 1 000 例注冊患者有 1.71 例,即預期的 141%),而傳統管理方案僅招募了 66 例(每 1 000 例 0.57 例,即預期的 54%)(圖 1)。平均而言,積極疼痛管理組招募了 12.7 例受試者(范圍 0~39),而傳統疼痛管理組僅招募了 5.1 例受試者(范圍 0~18)(表 2)。雖然兩種類型的治療方案都招募了與所確定的做法相似的百分比(積極的占 13%;傳統的占 16%),但積極疼痛管理組的人數為 1 257,遠遠超過傳統疼痛管理的 416。招募率的極端差異導致了一個針對兩組受試者基線特征的調查(表 3)。研究發現,通過積極疼痛管理組招募的受試者更有可能是全職工作,并且在離開學校后接受了進一步的教育。除此之外,他們的背部疼痛也較輕,身體上的不適較少,抑郁情緒也較少[81]。”
解釋:這是該聲明中的一個新增條目,反映了報告非預期結果的重要性,盡管這些非預期結果不會直接影響個別參與者,但如果不在先導性試驗中處理,可能會對確定性 RCT 的有效性產生影響。所謂非預期結果,是指在先導性試驗中發生的原本非研究者所期望的,并且對研究產生一定的影響。在這個示例中,先導性試驗的設計包括方案水平的隨機化,在隨機化之后進行參與者招募。這導致兩組在招募參與者時產生了非預期結果。在隨后的主要研究中,研究者在方案層面放棄了隨機化。
3.5 討論
3.5.1 條目 20
CONSORT 標準條目:試驗的局限性,報告潛在偏倚和不精確的原因及出現多種分析結果的原因(如果有這種情況的話)。先導性試驗的擴展:先導性試驗的局限性,處理潛在偏倚的來源和其他有關可行性的不確定性。
示例 1(先導性試驗局限性):“在某些情況下,根據本研究以前對血小板量和腦室出血(intraventricular hemorrhage,IVH)之間關系的研究,可使用長達 72 小時的平均血小板量(mean platelet volume,MPV)來計算血小板量。我們不能排除急性血小板減少癥期間 MPV 的變化或許更為劇烈的可能性。由于血小板計數沒有通過人工計數得到證實,因此本研究不能排除一些嬰兒可能患有假性血小板減少癥的可能性[82]。”
示例 2(潛在偏倚):“第四,對于本研究而言,分別隸屬于兩個學術中心的住院醫師可能會成為干擾因素。除此之外,偶爾會有其他住院醫師在干預措施組學術中心提供夜間服務。這些額外的住院醫師沒有接受關于這個研究的正式培訓,因此他們有效地發揮作用,就好像他們處于對照組中一樣。相反,在對照組學術中心提供額外夜間服務的住院醫師可能先前在干預措施組學術中心工作時已經接受過關于本研究的培訓。因此,這些住院醫師有效地發揮了作用,就好像他們是在干預措施組中一樣[83]。”
示例 3(其他不確定性):“應考慮在確定性試驗中加入內部先導性試驗,以便繼續監測試驗的可行性,特別是評估使用不同的納入標準和對數據收集方法的更改建議(尤其是在招募的第一年內)。在數據收集方面,使用定性方法來評估受試者的意見,也是有益的[84]。”
解釋:列出并討論研究的局限性,有助于更好地理解研究結果的重要性。在先導性試驗中,區分可在將來確定性 RCT 中克服的局限和不能克服的局限可能會有所幫助。在示例 1 中,作者解釋了測量方法的局限性,盡管他們沒有說他們是否認為在將來確定性 RCT 中克服這一問題。
在將來確定性 RCT 中,研究者希望盡可能避免可能影響治療效果評估的偏倚來源。在先導性試驗中,研究者對治療效果并不太感興趣,因此這些偏倚不會引起太多關注,但在將來確定性 RCT 中,確定可能影響治療效果的潛在偏倚仍然是有用的,以便研究者更好的避免這些偏倚。示例 2 識別了將來確定性 RCT 中的潛在偏倚來源。
如果在先導性試驗結束時仍然存在大量關于可行性方面的不確定性,從而阻止研究者繼續進行將來確定性 RCT 或需要在內部先導性試驗中再次探討可行性,那么為明晰起見,亦應需報告,正如示例 3 所示。
最后,盡管我們不建議這樣做,但如果實施及報告了檢驗效能不足的試驗,那么研究者仍應指出這些局限,以免讀者對結果產生誤解(條目 2b)。
3.5.2 條目 21
CONSORT 標準條目:試驗結果被推廣的可能性(外部可靠性、適用性)。先導性試驗的擴展:先導性試驗方法和結果對將來確定性試驗和其他研究的可推廣性(適用性)。
示例 1(調查結果的可推廣性):“本研究考慮了標準治療的選擇和持續時間的變化,以增強結果的可推廣性,并有很高的隨訪率[65]。”
示例 2(推廣至其他先導性試驗):“我們的數據只反映了一個先導性試驗的結果;然而我們希望這些方法可作為分析其他情型下具有不同設計的先導性試驗的模板[63]。”
示例 3(推廣性問題):“盡管安全問題在醫療實踐和臨床研究中必須高度關注,但普遍來講過于嚴格的排除標準可能會增加人們對試驗安全性的擔憂,也限制了試驗結果的可推廣性,并延緩了對重要臨床問題的解答。重新評估 PROTECT 先導性試驗排除標準……將大大提高 PROTECT 研究的適用性……PROTECT 先導性試驗表明需要進行另一個先導性試驗研究(DIRECT),以確定 Dalteparin 5000 IU SC OD 在嚴重腎功能不全(肌酐清除率,b30 mL/min)患者中的安全性[63]。”
解釋:可推廣性(適用性)是研究的內容可適用于其他情況的程度。可推廣性不是絕對的,而是需要做出判斷的問題。在確定性試驗中,讀者通常對研究結果在研究范圍以外情況的可推廣性感興趣—如常規臨床實踐。然而,在先導性試驗中情況并非如此,因為這些研究的規模不允許這樣做。在先導性試驗階段考慮可推廣性可能是重要的,因為這對于確定性 RCT 的可推廣性可能很重要(示例 1),結果和方法可應用于確定性 RCT 以外的研究環境(示例 2),或者,可能存在對以與先導性試驗相同的方式進行的確定性 RCT 結果的推廣性的擔憂,這可能導致將來確定性 RCT 設計的改變或進行進一步的先導性試驗(示例 3)。
3.5.3 條目 22
CONSORT 標準條目:與結果相對應的解釋,權衡試驗結果的利弊,并且考慮其他相關證據。先導性試驗的擴展:與先導性試驗目的和結果相一致的解釋,權衡潛在的利弊,并考慮其他相關證據。
示例 1(與目的和結果的一致性):“這個初步研究的目標之一是探討使用基于血小板計數的血小板輸注指南的可行性。通過對 5 例被確診為血小板減少癥的嬰兒進行研究后發現,平均血小板量(mean platelet volume,MPV)在確診血小板減少癥前 72 小時內并不能提供具有確定性的診斷數據。因此缺乏即時可用的 MPV 可能會限制這種輸血策略在某些機構的臨床適用性和推廣性。在我們的研究中,克里斯蒂娜醫院所在地大約一半的家庭不同意這個研究。而這些信息對于規劃將來血小板輸注的研究而言非常重要,因為當他們的嬰兒患有血小板減少癥并面臨輸血治療時,許多家庭無法決定是否申請輸血。血小板輸注研究的另一種研究設計可能涉及在入院時登記更多的嬰兒,而不考慮血小板計數,輸血指南僅適用于他們實際上已被確診為患有血小板減少癥的情況。這種方法可能會減少被告知需要輸血和輸血相關研究的家庭的壓力[82]。”
示例 2(考慮其他相關證據):“據我們所知,我們的受試者能夠進行運動想象。我們的結果似乎與之前的研究結果不同,這些研究表明多發性硬化癥(multiple sclerosis,MS)患者的運動想象能力較低。然而,這些作者將這一人群中受損的運動想象與認知功能障礙和抑郁癥聯系起來,因此,在我們的研究中,有認知障礙和抑郁的人被排除在研究之外。一些研究使用了患者評定的問卷,比如動覺和視覺想象問卷來評估受試者的運動想象能力。我們的研究本可使用這個患者評定的問卷,但我們每周都要電話詢問受試者任何與動覺運動想象有關的問題,同時他們也得到了相應的支持。除此之外,先前所有對 MS 患者的運動想象能力研究都是實驗性研究,沒有長期訓練效果,我們的研究不同,包括為期 4 周的學習,有 24 個訓練課程,這可能會增強大腦的心理表征能力[68]。”
示例 3(與決策標準相關調查結果的一致性):“除此之外,這個試驗的結果(可行性和可接受性方面)支持實施一個大型群組隨機試驗,該試驗涉及家庭醫生和他們的患者在共享決策(shared decision-making,SDM)中關于最佳使用急性呼吸道感染(acute respiratory infections,ARI)的抗生素。即使不是所有預先確定的標準總是完全符合本研究的標準,也能得出這一結論。事實上可肯定的是,沒有達到預先確定的標準并不一定表明試驗不可行,而是強調要對試驗方案進行修改。24% 的符合條件的家庭醫療小組(family medicine groups,FMG)同意參加這個研究,低于預期的 50%。當本研究的目標是從所有已確定的 FMG 中獲得 50% 的積極應答率時,我們可能過于樂觀了[34]。”
解釋:對研究結果的解釋有助于增加讀者對結果重要性的理解。在示例 1 中,除研究結果的解釋與研究的目標之一相匹配外,作者還引出了重新設計的問題,即以減輕招募家庭的難度增加招募,并希望最終為相關兒童受試者帶來積極的好處。這一觀察結果可能對其他計劃進行類似試驗的人有所幫助。至于確定性試驗,讀者希望了解先導性試驗報告中與其他來源證據相關的證據是如何呈現的(如示例 2 所示)。這里指的其他來源可能是作者進行的其他可行性試驗,或不同作者在相同或相似的環境中或對相似的患者進行的試驗。如果使用了先驗判定標準(條目 6c),就可參照這些標準對先導性試驗中呈現的證據進行解釋(示例 3)。
3.5.4 條目 22a
先導性試驗的擴展:從先導性試驗到將來確定性試驗進展的影響,包括任何提出的修正案。
示例 1(提議修正以改善招募):“按時招募的目標已經達到,但這并沒有轉化為預期的合格患者招募人數。篩查人群的合格程度遠低于預期,表明納入標準可能過于嚴格。體重指數≤22 kg/m2的排除標準是基于公布的證據,即體重指數在正常范圍的下限會增加血液透析人群的死亡率。然而,身體成分被認為在體重指數的保護作用下起著更大的作用。使用體重指數作為篩查工具是一種快速而簡單的測量方法,但在進行確定性試驗之前,應重新評估體重指數≤22 kg/m2的水平。如果體重指數提高到 24 kg/m2,那么潛在的招募人數就會增加 10%[84]。”
示例 2(提議修正以改善合作):“六個家庭甚至在開始干預之前就拒絕積極參與本試驗。為確保整個團隊的合作,并避免受試者過早退出,研究團隊向專業咨詢委員會小組作簡短介紹的方式,可能會促進受試者的招募/保留。獲得醫務主任和護理主任的初步同意也可能為受試者的招募和保留帶來一定的好處。除此之外,為克服安排方面的挑戰,特別是對北部較遠地區的家庭來說,提供一個在網站上查看方案或遠程參與的機會可能會提高潛在受試者的研究參與率[85]。”
示例 3(對將來確定性 RCT 進展的影響):“被分配接受本研究的多元化干預措施(包括教育、標準化的紙質醫囑及小組審核和反饋)的醫院,在入院 24 小時內適當管理血栓預防的住院患者的比率并不比沒有分配這一策略的醫院更高(63% vs. 67%)。這一發現,再加上確保在所有預印的醫囑放在醫療圖表中的問題,使我們得出結論,如果沒有重大修改和測試的,不應提供這種干預措施。換句話說,這種干預措施是不可行的[83]。”
解釋:這是該聲明中的一個新增條目。為從先導性試驗過渡到將來確定性 RCT,了解先導性試驗結果如何影響將來確定性 RCT 非常重要。為清晰起見,將來確定性 RCT 的計劃是否基于先導性試驗而沒有任何變化的情況下進行,或者通過對先導性試驗的更改而進行(示例 1 和示例 2),還是由于可行性方面的重大問題而未實施(示例 3),這樣的簡單陳述就足夠了。如果提議通過先導性試驗的特定更改來計劃將來確定性 RCT,則應說明這些內容。
3.6 其他信息
3.6.1 條目 23
CONSORT 標準條目:臨床試驗注冊號和注冊機構名稱。先導性試驗的擴展:先導性試驗的臨床注冊號和注冊機構名稱。
示例(試驗注冊號):臨床試驗,方案注冊系統:NCT01695070[86]。
解釋:使用唯一標識符注冊先導性試驗與最終試驗一樣重要。注冊確保了透明度和可靠性,在獲得英國倫理委員會批準之前,英國所有臨床試驗都需要注冊[87, 88]。它確保了所有正在進行的工作處于公開狀態及隨后的出版物更可信(故而獲得結果具有更大的效應)。世界衛生組織聲明:“所有干預性試驗的注冊是一種科學、倫理和道德責任[89]”。國際醫學期刊編輯委員會要求將所有試驗注冊作為發表的標準,并列出注冊機構[90]。
3.6.2 條目 24
CONSORT 標準條目:如果有的話,在哪里可獲取完整的試驗方案。先導性試驗的擴展:如果有的話,哪里可獲取完整的先導性試驗方案。
示例 1(參考發表試驗方案):“健康醫院試驗是一個在利茲信托教學醫院的 2 個心臟病病房實施的單中心、隨機對照、雙臂、平行、非盲法可行性試驗。其主要目的是探討個體化生活方式轉換評估的可行性,估計招募比率,并探討收集數據和對受試者隨訪的可行性,并以此估計確定性試驗的樣本量……該試驗方案已經在其他地方發表[40]。”
示例 2(作為支持信息的試驗方案):“此試驗的方案和支持提高行為和公共衛生干預措施的非隨機評價的報告質量(improving the reporting quality of nonrandomized evaluations of behavioral and public health interventions,TREND)清單可作為支持信息提供;請參閱清單 S1 和試驗方案 S1[91]。”
示例 3(作者可應要求提供試驗方案):對照組(而不是其他兩組)的受試者收到了一本 16 頁的小冊子,內容涉及教育、醫療、住房、就業和社區資源(作者可應要求提供試驗方案)[92]。
解釋:獲得先導性試驗的完整方案很重要,因為它將預先指定試驗的所有主要組成部分。SPIRIT(標準試驗方案清單條目:干預性試驗的推薦意見)聲明定義了一組基于納入條目的證據[93]。試驗方案的可獲取性使得檢查后續產出的完整性成為可能,并減少了選擇性報告提示“更好”結果的機會。這些示例說明了可提供試驗方案的不同方式,如先前的出版物(示例 1),作為先導性試驗報告的附錄(示例 2),或應作者的請求提供的文件(示例 3)。試驗方案已經可公開獲取(如先前發表的試驗方案)是首先推薦的獲取方式。可實現這一點的其他方法還包括在研究網站上發表。除此之外,試驗注冊機構(條目 23)還提供一些核心的試驗方案條目。
3.6.3 條目 25
CONSORT 標準條目:資助和其他支持(如提供藥品)的來源,提供資助者所起的作用。
示例(資助):“這個試驗由安大略省學術健康科學中心替代籌資計劃創新基金和加拿大 Octapharma 基金資助。試驗資助者在研究的設計,數據的收集、分析或解釋,報告的撰寫或提交文章發表的決策中沒有起到任何作用[94]。”
解釋:報告先導性試驗的所有資金來源(即主要研究獎項和任何其他支持,如設備供應)允許讀者判斷資助機構對試驗的設計、實施、分析和報告的潛在影響。如果沒有具體的資金支持先導性試驗,也應該說明這一點。正如原 CONSORT 聲明所報告的那樣,一個系統評價表明,與獨立資助機構資助的研究報告相比,由制藥業資助的研究更有可能報告對其有利的研究結果[2, 61]。如果資助者沒有參與試驗實施或報告的任何環節,則應明確說明這一點。
3.6.4 條目 26
先導性試驗的擴展:倫理批準或研究審查委員會批準,附帶參考編號。
示例:“卡羅林斯卡研究所的區域倫理審查委員會批準了這個研究,編號為 2007/1401-31/3。”
解釋:這是加入 CONSORT 清單中的一個新增條目,因為需要強調所有的研究(包括先導性試驗)只應在倫理框架內進行,并且在開始之前獲得所有倫理和其他批準。與先導性試驗特別相關的是需要了解倫理審查委員會施加的任何限制,因為這些限制將對將來確定性 RCT 的設計和實施產生影響。
4 討論
RCT 研究報告需要包括關于方法和結果的關鍵信息,以便讀者能夠準確地理解報告的內容。這對于先導性試驗而言同樣也非常重要,因為其是確定性 RCT 能否順利實施的關鍵。CONSORT 2010 聲明提供了 CONSORT 研究團隊關于 RCT 報告中應包括基本條目的最新建議[2, 61]。然而,先導性試驗與其他隨機試驗的目的和目標之間均存在較為明顯的差異,這是因為前者側重于評估可行性,而不是效果或效力。因此,盡管在這些試驗中報告的許多內容與任何其他隨機試驗中需要報告的內容相似,但在內容類型和標準 CONSORT 報告條目的適當解釋方面存在一些關鍵差異。
本文介紹和解釋了針對先導性試驗的 CONSORT 清單擴展中的這些關鍵差異。在題為“本擴展的范圍”一節中,討論了其他幾種類型的可行性研究和“概念驗證”試驗。其他研究者已經開始研究這些不同類型的研究之間的報告規范轉化的想法(例如,Wilson 等[96])。本研究期望,本擴展中提出的一些報告原則也可適用于其他類型的可行性或概念驗證試驗。
對于兩組平行試驗而言,使用 CONSORT 聲明可顯著提高研究的報告質量[97]。我們相信,常規使用這一 CONSORT 聲明的擴展也同樣會改善先導性試驗的報告質量。在報告先導性試驗時,作者應使用本 CONSORT 擴展清單中的 26 個條目,并且適時參考原 CONSORT 聲明。堅持 CONSORT 聲明及其擴展版也可幫助研究者在將來設計相關試驗,指導同行評議和編輯評價稿件。許多期刊在給作者的說明中建議遵循 CONSORT 的推薦意見。我們鼓勵他們指導作者遵循此意見,同時包括針對具體研究設計的其他的 CONSORT 擴展聲明。目前正在研發一種工具來支持期刊實施這個步驟[98]。所有 CONSORT 規范的最新版本可在 www.consort-statement.org 獲得。
參考文獻
見原文。
隨機對照試驗報告規范(consolidated standards of reporting trials,CONSORT),是一個旨在提高隨機對照試驗(randomized controlled trial,RCT)報告透明度和質量的指南。它于 1996 年首次發表,2001 年修訂,最后一次更新于 2010 年[1, 2],并同時發表在 10 種行業領先的醫學雜志上,包括 Lancet,JAMA,BMJ,Annals of Internal Medicine 和 PLOS Medicine。CONSORT 聲明包括 RCT 應報告的最少基本條目清單和記錄試驗受試者試驗過程的流程圖。
到目前為止,CONSORT 指南的制定在國際上獲得了相當大的認可,已被引用 8 000 多次,并得到了世界醫學編輯協會、科學編輯委員會、國際醫學期刊編輯委員會和世界各地 600 多種期刊的支持。前期進行的幾個相關研究對該聲明能否提高隨機試驗報告質量進行了檢驗,結果顯示,采用 CONSORT 聲明會使得報告質量顯著提高[3]。
繼 CONSORT 聲明后,CONSORT 清單的擴展版也被陸續發表,用于具有非劣效性、等效性及組群或實效設計的試驗[4-6]及用于報告危害[7]、不同類型的干預措施(非藥物治療[8]和草藥干預[9])、患者報告結局[10]的研究。CONSORT 的主要聲明和所有當前擴展都聚焦于試驗上,試驗性研究問題集中在干預措施的效果或效力上。但是,一些隨機試驗(我們稱為先導性試驗和可行性試驗)并不以效果或效力作為主要重點,而是旨在支持將來確定性 RCT 的開展。本文中“確定性”試驗是指側重于效果或效力的研究。對試驗實施和報告制定高標準的要求,與確定性試驗一樣,同樣適用于先導性試驗和可行性試驗。
1 本文范圍
本文為在確定性 RCT 前的隨機先導性和可行性試驗提出基于 CONSORT 聲明的擴展內容。為與 CONSORT 的廣泛涵括范圍保持一致,將來確定性 RCT 可能會評估干預措施的效果或效力。然而,隨機先導性或可行性試驗的主要目的是評估將來確定性 RCT 的可行性。
需要注意的是:本文所涉及的擴展內容并沒有對先導性試驗和可行性隨機試驗進行區分。雖然在實踐中本文作者認識到不同的研究者可能對不同的術語具有不同的偏好,但缺乏區分的原因是由于作者所研發的用于研究定義的框架[11]。在這些框架內,為將來確定性 RCT 實施的可行性試驗需要回答:確定性 RCT 是否能完成,是否應該完成及如果可完成應如何完成。先導性試驗是可行性試驗的一個子集,他們提出了相似問題(確定性 RCT 是否能完成,是否應該完成及如果可完成應如何完成),但有一個特定的設計特征:在先導性試驗中(可能是隨機的,也可能不是隨機的),將來確定性 RCT 或其中的一部分,是在小樣本的基礎上進行的。
簡短起見,我們使用“先導性試驗”一詞來指代任何以較小規模進行將來確定性 RCT 或其中一部分的隨機研究。然而,這些研究可合理地使用以下任何術語:先導性 RCT、隨機先導性試驗、先導性試驗、先導性研究、隨機先導性研究、可行性 RCT、隨機可行性試驗、可行性試驗、可行性研究或隨機可行性研究。事實上,本文沒有限制用于描述先導性試驗的術語;相反,本文只規定該類試驗是隨機的,在將來確定性 RCT 之前實施,且主要目的是評估研究方法的可行性。
這一擴展版的提出是由于人們正在進行越來越多的被描述為可行性試驗[12]或先導性試驗的研究及在報告和實施這些研究中被識別出薄弱環節的研究[12-15]。我們期望通過提高報告質量來產生更多高質量的先導性試驗案例,進而改善先導性試驗的實施,并使讀者能夠使用先導性試驗報告結果,為將來在類似的環境下和相似的受試者進行試驗做準備。由于先導性試驗(評估可行性)的目的與將來確定性 RCT(評估效果或效力)的目的不同,因此報告的重點應該不同,這種差異反映在本擴展版中。
本擴展內容不適用融入于主要試驗設計的內部先導性試驗,同時也不適用于非隨機先導性和可行性試驗。然而,這里呈現的大部分內容可能適用于或在調整后能夠適用于如先導性或可行性研究或類似類型的試驗研究,例如在藥物研發中進行的“概念證明”或Ⅱ期臨床試驗[16, 17]。概念證明或Ⅱ期臨床試驗是小樣本 RCT,其主要目的是告知資助方是否繼續開展大規模的臨床試驗來研發藥物。與先導性試驗類似,概念證明或Ⅱ期臨床試驗的重點是評估進一步開發的可行性,而不是評估效果或效力。然而,為做到這一點,概念證明或Ⅱ期臨床試驗往往側重于安全性和潛在的效果或效力等方面。他們可使用為 II 期試驗設計的公認方法來評估將來 III 期試驗中所涉及的一些結果(如果需要,可進行 Meta 分析來實現)[18]或使用替代結果—即中間指標[19],通常是生物化學類指標,其對患者的直接影響要小于治愈或死亡等,但應與這些“硬”終點結局指標相關。在先導性試驗中,安全性和潛在效果或效力量通常不那么重要,與其他試驗有所不同,它重點關注干預措施及其評估方法的研發和與可行性有關的問題。然而,先導性試驗有時確實使用替代結果來評估潛在的有效性。例如,血氧飽和度作為改善肺功能和生存率的替代指標[20]或每天步行的步數代替心臟病臨床測量[21]。
本文提出了一個針對報告先導性 RCT 而制定的標準 CONSORT 規范的擴展版。不過,需要注意的是,許多研究者常常會使用定性研究和其他方法來評估可行性。因此,不可否認的是,在先導性和可行性試驗階段進行的定性工作的數量,其與任何先導性試驗的關系及研究者希望報告這項工作的方式各不相同。諸如 Hoddinott 等和 Schoultz等[22, 23]所進行的獨立于先導性試驗單獨報告的定性研究應遵循適當的報告規范[24-26],并應提供與為準備相同的最終試驗而進行的其他試驗工作的鏈接參考。當在先導性試驗的主要報告中報告定性工作時[27],并不總是能夠在報告的方法部分中加入足夠的細節,以符合定性研究的報告規范。如果出現這種情況,我們推薦通過在線補充或附錄來詳細報告這些方法。O’Cathain 等、Hoddinott 等和 Schoultz 等已經為實施與先導性試驗一并開展的定性可行性試驗提供了指南和示例[22, 23, 26, 28, 29]。
2 制定 CONSORT 在先導性試驗中的擴展
本文簡述了 CONSORT 的先導性試驗擴展制定過程[30]。在制定這一擴展內容的清單之前,研究小組就先導性和可行性試驗的定義達成了一致。首先,先導性試驗和可行性試驗視為不同類型的研究,因此需要單獨的檢查清單。然而,初步工作得出的結論是,先導性試驗和可行性試驗的定義不能相互排斥,且與目前的理解和研究界對這些術語的使用相沖突。因此,本文采用了可行性試驗的總體定義,將先導性試驗作為可行性試驗的一個子集,并為使用隨機方法的先導性試驗制定了一份清單。可行性試驗和先導性試驗的定義達成一致的過程及作為基礎的概念框架另文發表[11]。這個工作是在編制清單(表 1)的同時完成的。本文使用框 1 中的原則來指導工作。


第一階段,研究小組討論并研究了現有 CONSORT 清單中的每個條目,對每個條目進行確認,以判斷是否與先導性試驗相關,然后決定保留還是刪除,同時還確認所涉及條目是否需要在可行性試驗或先導性試驗的背景下重新措辭以達成一致。這一過程中產生兩個清單。然后將修訂后的清單應用于先前工作和個人收集的 30 篇文章樣本中[13, 15]。第二階段,研究小組使用修改后的德爾菲調查表就每個清單條目的適宜性尋求共識。參與者(n=93)對每個條目進行評分(1~9 分;1=完全不合適,9=完全合適)。除此之外,參與者還有機會就每個條目、先導性試驗和可行性試驗的定義及清單的有用性發表評論[11]。第三階段,德爾菲調查的參與者審查回復在第一輪調查中超過 70% 參與者評為 8 分或 9 分的條目,并對這些條目提出補充意見。與此同時,要求參與者審查剩余的條目,并使用 4 個選項(不保留、保留、不確定或沒有意見)對每個條目進行分類。此外,參與者被要求添加他們認為遺漏的任何條目。第一輪共收到 93/120 份答復(77.5%),第二輪收到 79/93 份(84.9%)答復。第四階段,研究小組面對面地討論了來自德爾菲調查的反饋意見,并修改了清單。第五階段,在為期 2 天的共識會議上,進一步詳細審查修訂后的清單。第六階段,改寫了部分清單條目,以確保含義和目的明確性;研究小組又舉行了三次面對面會議就該清單的最終措辭達成一致,并確定了良好報告的示例,并形成了解釋與說明文件。隨后向共識會議的成員發送了文件的完整草案,以確保草案充分反映會議的討論情況。
表 2 列出了最終的清單,該表中的相關內容與其他 CONSORT 擴展內容相一致。研究者在制定相關研究報告時應遵守標準清單中列的條目,除非條目發生了更改。框 1 列出了指導該過程的方法學考慮和原則事項。

3 CONSORT 2010 在先導性試驗中的擴展
3.1 標題和摘要
3.1.1 條目 1a
CONSORT 標準條目:文題能識別是隨機臨床試驗。先導性試驗的擴展:文題能識別是先導性或可行性隨機試驗。
示例 1(使用詞語“先導性”、“隨機”和“試驗”):“利用 Bespoke 戒煙治療嚴重精神疾病患者(SCIMITAR):一個先導性隨機對照試驗”[31]。
示例 2(使用詞語“可行性”、“隨機”和“試驗”):“一個評估療養院成年住客營養不良治療中營養干預的組群隨機可行性試驗”[32]
解釋:該報告規范的主要服務對象是先導性試驗或可行性隨機試驗。為確保這些類型的研究可很容易地從特定的檢索標準中識別出來,包含“先導性”或“可行性”及“隨機化”的標題為檢索提供了一個必要的、公認的術語[13]。這也將使這些研究能夠很容易地在電子數據庫中被索引,例如 PubMed 數據庫[33]。雖然這些詞語可能出現在許多研究的標題中,但它們可能不一定會同時出現,如:“關于在初級保健機構使用抗菌藥物治療急性呼吸道感染中共享決策的繼續醫學教育項目的可行性隨機試驗:決策+先導性試驗”[34]。除此之外,在某些情況下,作者可能使用短語“隨機試驗研究”或“隨機可行性研究”,如“不僅僅是另一個步行方案:日常活動支持(簡單)計劃—一個平行隨機對照試驗的隨機先導試驗[21]。”這些文件可在適當的檢索中被識別出來。然而,本文一般建議在同一個短語中一起給出相關術語,并使用“試驗”而不是“研究”,如“隨機試驗”或“隨機可行性試驗”。
3.1.2 條目 1b
CONSORT 標準條目:結構性摘要,包括試驗設計、方法、結果、結論幾個部分(具體的指導建議參考“CONSORT for abstracts”)[35, 36]。先導性試驗的擴展:先導性試驗結構性摘要,包括試驗設計、方法、結果、結論幾個部分(具體的指導建議參考“CONSORT for abstracts”)(表 3)。



解釋:根據期刊的風格,摘要遵循不同的結構,通常約 300 字左右。我們需在任一風格的摘要中概述應該報告的內容。此部分內容也適用于會議摘要。摘要的結構在格式上與標準 CONSORT 2010 指南的條目 1b 之間沒有差異。然而,它的內容側重于先導性試驗的目的和目標,而不是將來確定性 RCT。
重要的是,摘要包含與試驗可行性的目標和結果相關的研究背景、研究方法、結果和結論等內容,并聲明該研究是一個“隨機”的先導性試驗。這將有助于研究者理解該研究的性質,并通過包含的特定關鍵詞以便電子檢索。建議在摘要中說明這個試驗是為將來確定性 RCT 做準備。在背景中,應包括對需要解決的不確定性問題的描述及可行性目標和目的的說明,這些目標在試驗方法中是如何解決的及在結果部分中每個目標的結果。如果先導性試驗的目標不多,則應具體列出所有目標,并報告每個目標的結果。如果目標較多,那么應該先就哪些是最重要的目標達成一致,這些目標決定是否進行確定性 RCT,并且只需要報告這些目標。關于確定性 RCT 是否可能在先導性試驗結果的基礎上進行的明確聲明也應成為討論和結論的一部分。
3.2 引言
3.2.1 條目 2a
CONSORT 標準條目:科學背景和對試驗理由的解釋。先導性試驗的擴展:將來確定性試驗的科學背景和理由及開展隨機先導性試驗的原因。
示例:“胎動減少(reduced fetal movements,RFM)是產科護理中經常出現的問題,據報道 6%~15% 的婦女在妊娠晚期至少會經歷一次 RFM。RFM 的定義是母親認為胎兒活動明顯減少或消失,而這一問題與胎盤功能障礙導致的死產和胎兒生長受限(fetal growth restriction,FGR)的風險增加之間存在顯著相關性。盡管存在這種關聯,但目前依舊缺乏證據來指導出現 RFM 的婦女的臨床管理。最近皇家婦產科學院指南和一個 Meta 分析結果強調了這一點。因此高質量證據的缺乏導致了高收入地區 RFM 管理策略的廣泛差異。盡管有通過正式計數胎動的 RCT(如計數至 10),但目前依舊沒有針對胎動管理問題的 RCT 發表。一個承擔胎動管理的 RCT 提出了重要的實際問題,包括:母親對胎兒健康的焦慮,由于 RFM 的急性性質和參與試驗需要遵守試驗流程,因此需要在短時間內決定是否參與試驗。故而,研究中改變了胎動患者在病房層面的處理,采用了一種質量改進或階梯群組 RCT 的方案(CONFIRM,NCT01777022)。本研究旨在解決:單個患者 RFM 管理的 RCT 是否為一個適當的試驗設計,并且解決:① 產婦招募和保留(篩選部分);② 患者可接受性;③ 遵守試驗方案等方面是否可行。除此之外,本研究希望確認圍產期研究人群中不良結局的發生率[37]。”
解釋:為將來確定性 RCT 及先導性試驗給出理由和研究思路是非常重要的,因為根據赫爾辛基宣言的原則,在非必要的前提下,將人群暴露于研究相關風險之中是一種不道德的行為[38]。這個示例很好地表述了相關的背景和理由。不僅如此,該部分還應說明其他相關的文獻或前期工作,如系統評價、定性研究或其他的可行性工作,或者因之前沒有人關注過這些領域而導致此類工作的缺失。除此之外,應該清楚地闡述隨機先導性試驗的理由,包括在將來確定性 RCT 實施之前需要解決的不確定問題及為什么在進行將來確定性 RCT 之前需要進行這樣的試驗。這些理由通常在引言或背景部分的最后一段中報告,以說明為何要進行先導性試驗。
3.2.2 條目 2b
CONSORT 標準條目:具體目的或假設。先導性試驗的擴展:先導性試驗的具體目的或研究問題。
示例 1(將目標分為主要目標和次要目標):“在這個可行性試驗中,研究目的是探索試驗設計,工作人員和居民對干預措施和結局指標測量的可接受性,并提供數據來估計設計確定性 RCT 所需的參數……試驗的主要目的如下:① 評估有多少養老院接受邀請參與研究;② 通過估計可行的合格率和招募率,確定對養老院住客的入選標準是否過于寬松或過于局限;③ 通過評估 3 個月和 6 個月的隨訪率,評估養老院和住客的試驗參與的持續情況;④ 調查養老院住客對營養支持干預的依從性及療養院工作人員對干預計劃的遵從情況;⑤ 評估結局指標測量方式的可接受性和可行性(及影響因素),并將其作為在確定性試驗中測量干預措施有效性的方法。試驗的次要目的如下所示:① 研究養老院工作人員完成篩查工具和問卷的情況;② 確定有多少營養不良的住客能夠參加患者報告結局測驗(patient-reported outcome measures,PROM)并完成問卷;③ 試行衛生保健資源使用情況(healthcare resource usage,HCRU)問卷;④ 測量養老院營養不良的研究對象的關鍵結局指標域(對照組和干預組之間的完成率、缺失數據、估計值、方差和 95% 可信區間),包括物理結局指標測量和 PROM;⑤ 收集和合成數據,從中可估計確定組群 RCT(cluster randomised controlled trials,CRCT)的組群內相關系數(intraclass correlation coefficient,ICC)和樣本量[32]。”
示例 2(目標導向型混合方法研究):“這個研究的主要目的是評估實施確定性試驗的可行性,包括招募、干預措施的使用及可接受性、隨訪(3 個月和 6 個月時)及數據收集方法。除此之外,該研究旨在建立適當的程序,以提供干預,并進行評估和規范,以確保足夠數量的受試者被成功招募和保留在研究項目之中。最后,該研究旨在發現使用結構化、個性化的方法進行生活方式評估和轉介,是否會明顯提高研究對象對生活方式和行為改變干預的接受和參與度。同時,這個研究還將定性地檢查評估工具對急性心臟病患者的可接受性及患者改變生活方式的可接受性,以便制定有效的招募參與者和保留參與者策略。這個研究將有一系列的量化目標:① 確定有多少患者接受轉介并參與正式的生活方式計劃;② 確定有多少患者參與生活方式改變干預措施或啟動自我管理改變項目;③ 調查生活方式干預與后續行為改變的關系及對健康相關生存質量、情緒和社交滿意度的影響;④ 估計可行的納入標準、招募和拒絕率及 3 個月和 6 個月的隨訪率;⑤ 測量患者的關鍵結局指標內容(即對照組和干預組之間的完成率、缺失數據、估計值、方差和 95% 可信區間),包括:臨床指標和患者報告的社交滿意度測量,健康相關的生存質量指標和情緒相關指標;⑥ 對數據進行整合,為確定性試驗的樣本量估算提供依據;⑦ 確定財務獎勵作為一種鼓勵行為改變方法的可接受性及其影響因素、定價及其影響因素[39]。”
解釋:盡管可行性的許多方面可能相互關聯,但明確的具體目標能夠使讀者理解先導性試驗中要解決的主要不確定性內容,并提供一個工作框架來介紹與這些目標相關的方法和結果。除此之外,一份完整的目標清單使其他研究者能夠在自己的研究中學習和采用類似的方法。
將目標分成主要目標(通常是那些與將來確定性 RCT 決策相關的目標)和次要目標可能是有益的,如示例 1 所示,其中可行性目標是主要的,而與以患者為中心結局指標相關的問題被視為次要的。因為收集以患者為中心的結局數據并不總是必要的,所以給出收集這些數據的理由很重要。例如,目標可能是確保可收集某些特定的數據,包括來自特定患者組(如示例 1 中的老年人),或確保難以測量的概念(如生活方式行為改變)可在將來確定性 RCT 中進行適當評估(示例 2)。這可能明確說明哪些目標測量將使用定量方法,哪些使用定性方法也可能是有益的,如示例 2 所示。
在示例 2 中,定量目標列表非常有用,但它們來自已發表的試驗方案。在已發表的先導性試驗中,目標包含更多詳細信息:“健康醫院試驗是一個在利茲信托教學醫院的 2 個心臟病病房實施的單中心、隨機對照、雙臂、平行組、非盲可行性試驗。其主要目的是探討個體化生活方式轉介評估的可行性,估計招募率,并探討收集數據和受試者隨訪以確定最終試驗樣本量的可行性。第二個目的是檢驗這樣一個概念,即與通常評估相比,個性化的評估提高了對生活方式改變的接受程度。試驗方案已在別處發表[40]。”我們推薦將詳細的每個先導性試驗目標寫進報告中,以便讀者可更容易地判斷研究在多大程度上實現了這些目標。
不推薦在先導性試驗中納入檢驗效力(或效果)假設的目標(框 1)。然而,其他類型的假設可能會被測試,例如當使用臨時或替代結果來解決潛在效果[41]。然而,試驗應始終為任何假設檢驗提供足夠的檢驗效能,在先導性試驗中亦應清楚陳述評估潛在效果是目標之一。如果檢驗是在沒有足夠檢驗效能的情況下開展的(就像它們在現實中一樣),其結果當然應該肯定被視為次要的,并且應該在討論中予以提醒[21]。
3.3 方法
3.3.1 條目 3a
CONSORT 標準條目:描述試驗設計(諸如平行設計、析因設計),包括受試者分配入各組的比例。先導性試驗的擴展:先導性試驗的設計說明(如平行設計、析因設計),包括受試者分配入各組的比例。
示例:“本研究開展了一個平行分組隨機對照先導性試驗,選擇 2∶1 對 1∶1 的不均等隨機分組,為更多的患者提供水合作用干預措施的經驗[42]。”
解釋:無論是確定性試驗還是先導性試驗,都應描述研究的設計。絕大多數的先導性試驗所采用的都是 1∶1 的隨機化比例。例如,在將來確定性 RCT 中,1∶1 隨機化比例為測試有效性提供了最大的效能。然而,先導性試驗通常涉及新的、尚未建立的干預措施,其目的之一可能是獲得實施干預措施的經驗,在這種情況下最好讓盡可能多的參與者接受可行的干預措施。
3.3.2 條目 3b
CONSORT 標準條目:試驗開始后方法的重要改變(如合格受試者的挑選標準),并說明原因。先導性試驗的擴展:先導性試驗開始后試驗方法所做的重要改變(如合格受試者的挑選標準),并說明原因。
示例:“在隨機分配了 11 例患者(其中 5 例分配到標準護理組)后,我們發現被分配到標準護理組的患者正在接受早期手術,因為在完成快速的醫療檢查后,他們被列入了手術名單。因此,本研究修改了方案,在確定診斷時立即隨機分配患者;只有那些被分配早期手術的患者才會得到快速的醫學評估[43]。”
解釋:因為先導性試驗具備探索性質,所以如果其中存在很明顯的潛在問題,那么在實施過程中應該改正。在 Buse 等的研究中,原始方案規定患者在被隨機分配之前,必須完成為快速手術而做的醫療檢查,但因為已經確定了對照組的一些患者是合適的候選者,所以這些患者也被列入了快速手術的名單(快速手術是干預措施),這就干擾了對照組的入組。在修訂后的方案中,受試者首先被隨機分配,然后再行評估以判斷他們是否適合快速手術。因此,先導性試驗潛在地改進了確定性試驗的設計。重要的是記錄所有的更改并給出理由。本例描述了隨機分配時間的變化,但試驗的其他方面也可能發生調整,例如治療方案、入選標準或結局變量。
3.3.3 條目 4a
CONSORT 標準條目:受試者合格標準。
示例:“2011 年 3 月至 2011 年 11 月,從英國加的夫和牛津的亨廷頓病(Huntington’s disease,HD)專科門診連續招募了 31 例符合納入標準的 HD 患者。納入標準為:① 經基因測試和神經學檢查診斷為 HD 的患者;② 能夠獨立行走,且作為主要的行走方式;③ 愿意前往運動中心接受治療試驗;④ 具備能夠知情同意的能力;⑤ 統一 HD 評定量表總運動評分(UHDRS-TMS)和總運動能力(total functional capacity,TFC)評分至少分別在 5/124 和 5/13;⑥ 在研究開始前 4 周維持穩定的醫療方案,并且招募的臨床醫生認為能夠在研究過程中維持穩定的方案。如果受試者:① 有中風等其他主要神經系統疾病的病史;② 有限制行動能力的骨科疾病;③ 表現出不受控制的精神癥狀;④ 懷孕;⑤ 表現出任何運動禁忌癥;⑥ 參與任何介入試驗或在完成介入試驗后 3 個月內則不符合入選標準[44]。”
解釋:讀者可能想知道如何將試驗結果盡可能地應用于將來確定性 RCT 和將來類似受試者及試驗環境的其他試驗中。各種各樣的研究參與者(如患者、醫生、評估人員、護理人員和管理人員)可提供相關數據來實現先導性試驗的研究目標。例如,在療養院實施的一個研究中,采訪院友對干預措施的可接受程度,而護士參加焦點小組以征求關于隨機或遵守治療方案的意見。除此之外,先導性試驗中應具體設置每個受試者的納入合格標準。入選標準的細節必須足夠具體,只有這樣才能確定臨床人群和任何其他人群,招募中心的設置,并確定能夠符合法律要求,例如有能力給予知情同意。細節應足以讓其他研究者理解、學習和使用所提供的內容。
3.3.4 條目 4b
CONSORT 標準條目:資料收集的場所和地點。
示例:“高危青少年的招募來自 3 個地方:① 在匹茲堡大學參加 NIMH 資助(BIOS,PI:BirMaher)的雙向情感障礙(bipolar disorder,BP)子代研究的 205 例 12 至 18 歲 BP 父母的后代;② 在西方精神病學研究所和診所(western psychiatric institute and clinic,WPIC)接受 BP 治療的成年人的子女;③ 在 WPIC 的兒童和青少年 BP 服務診所(child and adolescent bipolar services clinic,CABS)接受 BP 治療的青少年的兄弟姐妹[45]。”
解釋:研究必須指定用于招募患者和收集數據的環境,以便讀者能判斷研究結果對其他試驗及確定性 RCT 的適用性(可推廣性)。除此之外,作者還應明確是否有任何先導性試驗場所具有特定的特征,例如,組織特征,使該場所易于早期采用新方案的特征或作者之間可能會影響招募、知情同意和隨訪的特定關系。因為這些特性可能無法在其他環境中重復,所以在確定性試驗中也同樣無法重復。與條目 4a 一樣,報告的細節必須足以讓其他研究者理解、學習和使用這些內容。
3.3.5 條目 4c
先導性試驗的擴展:如何確定受試者及如何獲得受試者知情同意。
示例:“2013 年 5 月至 10 月,胃腸病門診臨床工作人員篩選并識別了符合研究納入標準的潛在受試者。然后,研究邀請要么發送給與研究者密切接觸患者,要么給在診所連續觀察并接觸研究信息患者。所有研究信息都與來自患者參與組的患者共同設計。感興趣的患者通過電話或電子郵件向研究者表達他們參與研究的興趣。隨后研究者對潛在受試者進行了篩選,并且獲得了書面的知情同意[46]。”
解釋:這是聲明中的一個新增條目。在先導性試驗中,報告選擇受試者和知情同意的細節尤其重要,以便評估招募方法的可行性。研究者應詳細描述識別和接觸受試者的方式(如通過廣告或從醫療記錄或其他數據集中選擇),以使讀者能夠理解結果的可推廣性(適用性)。這對于擴大將來確定性 RCT 的試驗規模具有特別重要的意義,同時對將開展的其他試驗也具有借鑒作用。此外,知曉在將來確定性 RCT 中可能不容易實施的任何具體方面是至關重要的。同時,有一種觀點認為,先導性試驗的過程不需要像其他試驗那樣嚴格,因此,在這些試驗中展示嚴格、符合倫理的受試者遴選和招募過程可能尤為重要。如果識別受試者和獲得知情同意的方式細節已經在臨床方案中發表,那么應該清楚地引用。
3.3.6 條目 5
CONSORT 標準條目:詳細描述各組干預措施的細節以使其他研究者能重復試驗,包括各干預措施實際上是在何時及如何實施的。
示例:“干預(鍛煉或拉伸):參加運動活動所需的時間對于鍛煉組和拉伸組是相同的。唯一的區別是在活動過程中消耗的能量。在第一次會議上,運動教練解釋了各種治療的程序(鍛煉或拉伸),向他們展示了可用于鍛煉或拉伸課程的設備,并且協調員讓受試者熟悉了練習設備。前兩周至少需要在庫珀研究院(Cooper Institute,CI)進行 3 次培訓,讓教練教他們如何使用設備并完成練習或拉伸動作。兩周后,受試者開始在家里或其他地方(健身房、公園等)進行鍛煉,并且只需每周在 CI 參加一次鍛煉課程。每個鍛煉或拉伸階段平均約 30~40 分鐘。① 鍛煉干預:CI 受試者在指導下開始使用跑步機或健身腳踏車上運動課程。除此之外,CI 培訓師還培訓患者如何完成在家中的鍛煉課程(例如,根據他們喜歡的運動選擇 Wii 運動和 Fit、爵士健美操、慢跑、舉重訓練),這些鍛煉都是在患者家里或社區進行的無指導鍛煉。每次運動課程的持續時間通常是達到每周總熱量消耗的 1/3 或 1/4。最初幾周安排進階運動量,使他們達到最低 12 千卡/千克/周(kilocalories/kilogram/week,KKW)的能量消耗(例如,第一周 8 KKW,第二周 10 KKW 和第三周 12 KKW。受試者每周鍛煉 3 次[43]。② 拉伸干預:與鍛煉組相比,拉伸組花費的時間大致相同,但每節運動的能量消耗不足 4 KKW。在 CI 兩周 3 次課程后,改為每周 1 次在 CI 和 2 次在家課程。其中,5~10 分鐘的拉伸熱身期包括鍛煉身體主要肌肉群的拉伸。該系列包括傳統的熱身拉伸,如:拉伸臀部、大腿內側、小腿和腳踝、跟腱、腿筋拉伸、前后翻肩、聳肩、頸部肌肉鍛煉、膝蓋緊貼胸部、前額移向右膝,然后向左膝,之后雙膝及做骨盆傾斜運動。另外 10~15 分鐘的運動包括右小腿和左小腿拉伸,四肢拉伸,然后是手臂、手掌、手指、手腕、肱二頭肌/肱三頭肌、肩膀和背部的系列拉伸。所有的練習都設計為緩慢進行,強調適當的調整和休息時間,以在獲得一般柔韌性的同時最大限度地減少總體體力消耗,最重要的是控制與培訓者的接觸時間和參與此類活動的任何社交效應。本組受試者在 12 周中的每一周都有一套不同的低水平/低強度常規運動,以盡量減少受試者對重復運動的厭倦[47]。”
解釋:如果先導性試驗是要提示將來研究,那么作者應該報告給予所有研究組治療的確切細節,即使一個組僅是像往常一樣接受治療,也應該完整地描述。研究細節應包括由誰實施治療過程、治療內容、頻次和場所。研究者應遵循干預措施描述和重復的報告規范模板(the template for intervention description and replication,TIDieR),并完成報告清單[48]。如果任何組別的治療細節發生變化,則必須報告這些變化(條目 3b)。
3.3.7 條目 6a
CONSORT 標準條目:完整而確切地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的。先導性試驗的擴展:完整而確切地說明預先設定的在 2b 中每個先導性試驗評估和測量的具體目標,包括它們是在何時、如何測評的。
示例:“可接受性和需求基于試驗中受試者使用和重復使用干預措施來評估,并通過登錄用戶統計來反應。干預措施的實用性被認為是一種在交付中登錄和限制出現的能力,并根據青少年和專業人員的用戶百分比、其退回百分比(登錄錯誤百分比)和其他登錄問題進行評估。記錄退回百分比,并要求受試者報告登錄錯誤。整合情況的評估,是基于我們的網絡干預推廣程度,這一方法與公認的糖尿病護理標準一致,其中公認的標準包括由國際糖尿病聯合會(International Diabetes Federation,IDF)與國際兒科和青少年糖尿病學會(International Society for Pediatric and Adolescent Diabetes,ISpad)[51]和美國糖尿病協會(American Diabetes Association,ADA)合作發布的標準(參見原文附錄 1)[49]。”
解釋:在確定性的試驗中,研究者主要對能夠使他們實現主要目標(評估干預或治療效果)的反應變量或結局指標感興趣,并且他們需要對預先制定的結局指標進行明確的表述,以防止在評估這一效果時產生偏倚。然而,在先導性試驗中,目標應與可行性有關(框 1 和條目 2b),任何測量或評估都應使這些目標得以實現。為確保先導性試驗符合其目標,應定義測量或評估方法以解決每個單獨的目標或研究問題。在該示例中,目標是評估干預措施的可接受性、需求、實用性及整合情況。作者列出了每種方法所使用的措施。
為評估應答、完成情況或有效性,一些被認為可能是將來確定性 RCT 的主要和次要結局指標的變量可能會在先導性試驗中進行測量。然后,適當的測量或評估方法可是應答率、完成率或是效度的測量方法。有時研究者也想測量替代結局指標(比如條目 7b 中的示例),可能成為確定性 RCT 中的主要結局指標的因果途徑的變量,或早期時間點的結果,以便評估干預措施在影響確定性的 RCT 中的結局指標時的潛在作用(條目 2b)。
3.3.8 條目 6b
CONSORT 標準條目:試驗開始后對結局指標是否有任何更改,并說明原因。先導性試驗的擴展:先導性試驗開始后任何對試驗評估或測量的更改,并說明原因。
示例 1(改變評估期):“本研究結局指標測量了接受和停止干預措施的情況,因為本研究希望通過推薦更多的人來參加以影響干預措施接受率及通過支持對治療的堅持來影響那些被推薦的人的治療成功率。因此,干預有兩個不同的階段,盡管在方案中沒有計劃,本研究在這兩個階段檢查了試驗組的服務接受率和 4 周停止率[50]。”
示例 2(改變測量儀器):“本研究將改變的開始定義為:參與正式計劃或自我指導的計劃,引起任何時候的飲食、體力活動、吸煙或飲酒的改變。在本研究公布的方案中,本研究提出了 4 個類別的改變,本研究發現在定性的隨訪調查中很難區分“堅持”和“保留”;因此,本研究在類別 1 中合并改變了持久性和維持性[40]。”
解釋:在先導性試驗期間,評估或測量可能會發生變化,因為或出于可接受性或實用性的原因(示例 2),這些改變(示例 1)可使研究者能夠收集關于干預措施實施的更多內容。在示例 2 中,當發現研究者無法區分其中兩個類別時,使用具有四個類別的測量工具變得不切實際。為完整報告,且由于這些內容對同一專業領域的其他人有用,所有這些變化都應該在研究報告中詳細地報道出來。
3.3.9 條目 6c
先導性試驗的擴展:如果適用,使用預先設定的標準判斷是否或如何處理將來確定性試驗。
示例:“DECISION+計劃的可行性(交付)和可接受性(接受)是本次先導性試驗的主要結果測量措施。研究者已為具體的可行性和可接受性標準建立了先驗閾值,包括:① 聯系的家族醫學小組(family medicine groups,FMG)參與先導性試驗研究的比例將為 50% 或更高;② 招募的參與所有 3 個研討會的家庭醫生比例為 70% 或更高;③ 家庭醫生對研討會的平均滿意度為 65% 或更高;④ 每份填妥的問卷中缺失數據的比例將少于 10%[34]。”
解釋:這是該聲明中的一個新增條目。先導性試驗的目的是評估在研究過程中進入下一階段的可行性。為做到這一點,研究者需要一些標準來決定是否繼續研究。正常情況下,研究過程的下一階段將是將來確定性 RCT,盡管并非總是如此。
英國國家衛生研究所要求先導性或可行性試驗要有明確的標準來決定是否進展到下一階段:“我們期望當申請人提出先導性或可行性試驗申請時,或者在試運行簡報中,能夠在實質性研究中描述進展標準的清晰路徑。列出清晰的進展標準在前期研究申請或者前期合并實質性研究的簡報或申請書中都適用。前期試驗和主要試驗是合并資助還是分開資助將根據實際情況而決定[51]。”
然而,在許多先導性試驗中,這些進度標準最好被視為指標,而不是決定下一階段的門檻。在這個示例中,作者發現只有 24% 的 FMG 同意參加。他們表示,“未達到預先確定的標準并不一定表明試驗不可行,而是強調要對試驗方案做出改變”[34]。顯然,對試驗方案更改是否可行的討論至關重要,并且這種討論常常得益于試驗團隊以外的人員參與。例如,來自試驗指導委員會的參與。這可能是在先導性試驗中設立指導委員會的原因。Bugge 等[52]對先導性試驗后如何決策提供了進一步指導。
除對試驗方案進行修改的可能性外,研究者還應該意識到先導性試驗中所估計的比率可能會受到相當大不確定性的影響,因此最好謹慎地設置可能僅僅由于機會變量而錯過的明確閾值。事實上,研究者以類似交通指揮的紅綠燈系統作為判斷可行性的標準正變得越來越普遍,因此當低于較低閾值的測量結果(如招募率)表明試驗是不可行的,而高于較高閾值則表明試驗是可行的,如閾值在兩者之間,如果能夠做出適當的改變,那么試驗可能也是可行的。
3.3.10 條目 7a
CONSORT 標準條目:如何確定樣本量。先導性試驗的擴展:先導性試驗樣本量設置的理由。
示例 1(基于實用性評估和估計率的基本理由):“因為這是一個先導性研究,所以沒有進行樣本量計算。研究者的目標是納入 120 例受試者,他們認為這是一個足夠大的樣本,可讓他們了解實施針對慢性阻塞性肺病患者幾個自我管理課程的實用性及其招募、納入和退出的情況[53]。”
示例 2(基于將來確定性 RCT 所需樣本量百分比的基本理由):“因為這是一個可行性研究,所以不需要正式的樣本量估算,但本研究估計的樣本量是第三階段試驗所需的樣本量的 10%。第三階段試驗的樣本量計算表明,本研究需要招募 1 665 例受試者。鑒于參與人數眾多,預計將出現大幅度參與者中途退出的情況。因此,本研究的目標是招募 200 例受試者參加可行性試驗,為第三期 RCT 的設計和樣本量選擇提供詳細資料[54]。”
解釋:有關試驗目標和樣本量之間的一致性標準,適用于先導性試驗及任何試驗研究。許多先導性試驗有明確的與估計接受率、招募率、保留率或采用率有關的關鍵目標(如條目 2b)。對于這些類型的目標,在理想情況下,應設置具體的數值,以確保圍繞估計率的所需精確度,盡管在實踐中可能難以實現。除此之外,對于主要目標集中于干預措施的可接受性或可行性的先導性試驗,考慮需要多少個試驗中心可能是有益的,因為干預措施的可接受性或可行性有時也取決于試驗中心的多少。在示例 1 中,作者陳述了他們選擇所需樣本量的原因,涉及估算率和探索實施干預措施的實用性。然而,他們本可為他們選擇的樣本規模提供更有力的理由,例如可能的招募或流失率及圍繞這些比率所需的精確度,這樣讀者(和資助者)就有更多的理由相信試驗可實現其目標而不是憑感覺判斷。
大多數側重于關于先導性試驗樣本量要求的方法學論文,都假設此類試驗的主要目的是估計定量指標,如效應量的方差(或標準差),以便為將來確定性 RCT 的樣本量計算提供資料。這些方法的重點是獲得這樣的估計精確度。這里有幾篇相關的文件[55-57]。其中,Whitehead 等[58]建議先導性試驗的樣本量應與將來確定性 RCT 的樣本量相關。對于設計為 90% 檢驗效能和雙側 5% 檢驗水準的此類試驗,他們建議每個治療組的先導試驗樣本量為 75、25、15 和 10,標準化效應量則分別為特小(0.1)、小(0.2)、中等(0.5)或大(0.8)。
示例 2 說明了另一種方法,該方法使用的樣本量是將來確定性 RCT 的預期樣本量的某個百分比。作者參考了 Cocks 和 Torgerson 的論文,這是基于使用這一樣本量時,如果無效假設為真,那么效應大小的單側 80% 可信區間將排除最小臨床重要差異[59]。這與用于估計效果或效力所需樣本量的計算類似,但允許在結局指標效應量估計中存在額外的不確定性,從而有效地評估潛在有效性。如果目標是使用替代或臨時結局指標來評估潛在的有效性,研究者將需要使用標準樣本量計算來確保有足夠的檢驗效能。然而,這種類型的目標在先導性試驗中很少見。
3.3.11 條目 7b
CONSORT 標準條目:必要時,解釋中期分析和試驗中止原則。
示例:在招募 60 例患者后,委員會成員需進行中期分析,如果基于關鍵顯著性水平(P≤0.02)檢測到壓倒性效應,他們可建議中止試驗,這是針對具有波科克邊界的蘭德米茨阿爾法支出函數進行調整的[20]。
解釋:由于先導性試驗規模較小,因此不常定義早期中止的標準,但如果研究者這樣做了,則應報告這些標準。示例是測試替代結局指標的先導性試驗。這一結局指標的可變性存在相當大的不確定性,因此作者計算了一個保守的樣本量,但在招募 60 例患者后進行了中期分析,以防先驗估計太大,并且確保在這一階段他們有足夠信息為后續試驗提供資料。
3.3.12 條目 8a
CONSORT 標準條目:產生隨機分配序列的方法。
示例:“受試者被隨機分配到干預‘MBCT 組’或‘等待名單對照組’……。其中隨機分配序列號是由計算機生成的[46]。”
解釋:隨機化導致每個隨機化單位分配的不可預測性,這是確保 RCT 公正評估效果或效力的一個重要因素,因為從長遠來看,它確保了干預措施組之間相關特征的均衡。在先導性試驗中,隨機方法的完整性可能不會直接影響先導性試驗結果的穩健性,因為先導性試驗結果不側重于對效果或效力的評估,但對隨機過程的明確描述對于透明報告仍然很重要。
除此之外,在一些先導性試驗中,目標之一可能是評估隨機化的可行性;因此,報告細節也很重要。如果評估可行性涉及生成隨機分配序列的方法不止一種,則應充分描述每種方法。
3.3.13 條目 8b
CONSORT 標準條目:隨機方法的類型,任何限定的細節(如怎樣分區組和各區組樣本多少)。先導性試驗的擴展:隨機方法的類型,任何限定的細節(如怎樣分區組和各區組樣本多少)。
示例 1(分區組示例):“按計算機生成的隨機分配序列,區組數為 3,按性別分層,受試者被隨機分組到水合組或對照組(2∶1)。[42]”
示例 2(兩種不同類型的隨機化):“除了隨機分配到三個治療組之一,本研究使用 2×2 析因設計按兩個試驗設計因素分配普通科和受試者:群組對個人招募及系統性或機會性招募(圖 1)。本研究隨機分配了 24 個普通科(在布里斯托爾、德文和考文垂 3 地,各有 8 個普通科),按 3∶1 比例分配群組(普通科)或個人,機會性或系統性招募比例為 1∶1。不同隨機化方法的不同分配比率是因需要確保普通科和參與者在 3 個試驗組中的數量均衡[60]。”
解釋:研究者應報告隨機化的類型,包括是簡單隨機化或限制性隨機化。
出于實際原因,有時在先導性試驗中使用簡單的隨機化,即使預期在將來確定性 RCT 中使用限制性隨機化,像這樣的情況也需要描述。限制性隨機化在評估干預效果的小樣本試驗中特別有用,因為其能夠確保干預措施組和對照組之間某些特征的均衡(詳見原 CONSORT 聲明)[2, 61]。在先導性試驗中,限制性隨機化可用于模擬將來確定性 RCT 中預期的隨機類型,或如有必要,即使限制性隨機化不會在確定性 RCT 中使用,也應對先導性試驗各組特征進行均衡處理。示例 1 中使用了分層區組隨機化分組方法。
先導性試驗的目標之一可能為評估隨機化的可行性;因此,可嘗試不同類型的隨機化,如在示例 2 中考慮群組與個體隨機化[60]。
3.3.14 條目 9
CONSORT 標準條目:用于執行隨機分配序列的機制(如按序編碼的封藏法),描述干預措施分配之前為隱藏序列號所采取的步驟。
示例:“分配是使用布里斯托爾隨機試驗協會提供的自動電話隨機化服務來實現的,以確保從事受試者招募的臨床工作人員不會對其造成任何干擾[62]。”
解釋:確保分配隱藏是良好隨機試驗設計的基石,這一機制可通過防止登記受試的研究者預知受試者的分組方案,從而為最大限度防止偏倚發揮了關鍵作用。在將來確定性 RCT 中,將使用單一機制來實施分配隱藏。然而,在先導性試驗中使用分配隱藏機制的主要目的是確保該機制的可行性。如果要使用的機制存在相當大的不確定性,那么可在先導性試驗中嘗試多種機制。這種罕見情況發生時,應充分描述嘗試的各種機制細節。
3.3.15 條目 10
CONSORT 標準條目:誰產生隨機分配序列,誰招募受試者,誰給受試者分配干預措施。
示例 1(誰生成隨機分配序列):“一位獨立的統計顧問建立了基于網絡的隨機化過程,通過遠程分配,使用大小為 2 和 4 的區組,將符合條件的受試者分配到干預措施組或對照組。沒有直接參與該項目的人不能接觸分配代碼[21]。”
示例 2(誰登記受試者,誰分配干預措施給予受試者):“負責評估的臨床醫生,篩選了符合條件的兒童及其家庭。如果孩子和他或她的家人愿意了解更多關于這個研究的內容,研究者就會聯系他們的家人并安排在方便的場所(通常是在家里)探望他們……。那些愿意參加的受試者被隨機分配接受專科醫療護理或專科醫療護理+菲爾帕克閃電治療(lightning process,LP)。其中具體分配過程由布里斯托爾隨機試驗協會實施[62]。”
解釋:重要的是,先導性試驗確認了分配隱藏方式可在確定性 RCT 中重復實施,包括誰產生隨機化序列,誰招募和分配受試者。
3.3.16 條目 11a
CONSORT 標準條目:如果實施了盲法,分配干預措施之后對誰設盲(如受試者、醫護提供者、結局評估者)及盲法是如何實施的。
示例 1(多人不知情):“患者、家屬、ICU(重癥監護病房)工作人員、超聲技術人員和研究者對藥物分配情況均不知曉。每個中心的研究藥劑師是唯一清楚相關情況的一方[63]。”
示例 2(安慰劑對照):“與僅含纖維的安慰劑配方相比,試驗組每天提供包含 4 種益生菌菌株加上 4 種不可消化、可發酵的膳食纖維(每個 2.5 克)的共生配方(Synbiotic 2000?)[64]。”
解釋:研究者希望在確定性 RCT 中盡可能減少結果偏倚。“盲法”被認為是做到這一點的最有效的方法之一,至少在盲法可行的試驗中(詳見主要的 CONSORT 聲明)。由于先導性試驗的主要目的是評估方法的可行性,包括那些減少偏倚的方法。因此在一些先導性試驗中,詳細報告盲法可能是有用的,如示例 2 所示,這種方法可幫助希望在將來 RCT 中重復該方法的讀者。
在先導性試驗中,通過詢問受試者是否相信自己被施盲來嘗試和評估盲法的成功與否是很有吸引力的。例如,Arnold 等[65]就是這樣做的。但不建議這樣做,因為有證據表明這樣做的結果在很大程度上反映了干預措施的有效性,而不是其他[66]。
3.3.17 條目 11b
CONSORT 標準條目:如有必要,描述干預措施的相似之處。
示例:“每個研究的藥物輸注都采用標準的基于容量的速率升級方案,靜脈注射氫化可的松 100 mg,口服或靜脈注射苯海拉明 50 mg,口服對乙酰氨基酚 650 mg,以盡量減少與輸注有關的反應,避免揭盲[65]。”
解釋:如果盲法是通過安慰劑對照來完成的,那在評估干預效果的試驗中,重要的是詳細說明安慰劑的哪些特征與干預措施(通常是藥物)相似—例如外觀、味道、嗅覺、給藥方法等。但是,先導性試驗中描述的許多干預措施都不是藥物。盡管如此,描述如何確保干預措施組和對照組在可能的情況下獲得一致的治療(除外科手術外)仍然是很重要的。同樣重要的是要注意到這一點,即使用此類型方法在復雜干預措施中通過盲法分配某些人將是不可能或不可行的。
3.3.18 條目 12a
CONSORT 標準條目:用于比較各組主要和次要結局的統計方法。先導性試驗的擴展:用于解決每個先導性試驗定性或定量目標的方法。
示例 1(描述性和敘述性報告):“可行性結局指標需描述性和敘述性的報告。對于臨床終點指標,僅進行了描述型統計,連續型指標報告了平均值(標準差),二分類指標報告了原始計數(%)[67]。”
示例 2(可信區間):“對于主要結局指標,可行性標準是招募率和持續時間、保留率、安全性、不良事件、依從性、干預措施的可接受性和疲勞程度等。招募率(包括合格率和知情同意率)用 95% 可信區間(confidence interval,CI)報告,有序分類數據(如疲勞)利用中位數(范圍)報告,連續型數據(如步行速度和步行距離)利用平均值(95%CI)報告,而二分類變量用原始計數(數字,%)報告。由于這個可行性研究的性質,本研究決定不對步行和疲勞數據進行關于任何有效性問題的統計驗證[68]。”
解釋:可使用一系列方法來處理先導性試驗中的目標。這里并不需要統計學方法。提供有關所用方法的內容可確保在所用分析描述的基礎上對相關結果進行驗證。其主要重點是處理試驗可行性目標的方法。這些方法通常基于描述性統計,如均值和百分比,但也可能是敘述性描述(示例 1)。在先導性臨床試驗中,任何使用受試者結果對效應值的估計,這個效應值有可能在將來確定性 RCT 中被測量到,通常被報告為一個估計值及其 95%CI,但沒有 P 值—因為先導性試驗不足以驗證關于效果的假設。
3.3.19 條目 12b
CONSORT 標準條目:附加分析的方法,諸如亞組分析和校正分析。先導性試驗的擴展:不適用。
解釋:在確定性試驗中,分析亞組治療效果的差異或對基線不均衡對結局的調整性分析可能會提供有用的內容。然而,先導性試驗中的這種分析是不適用的,因為主要重點不是確定治療效果或亞組之間的效果差異。相反,可行性試驗的重點是評估可行性或試驗程序,以便為確定性 RCT 的設計提供依據。
3.4 結果
3.4.1 條目 13a
CONSORT 標準條目:隨機分配到各組的受試者例數,接受已分配治療的例數及納入主要結局分析的例數。先導性試驗的擴展:對于每一組,接觸和/或評估合格的,隨機分配的,接受意向性治療的,并對每個目標進行評估的受試者例數。


解釋:類似于對其他試驗一樣,本研究推薦一種先導性試驗中反映受試者過程的流程圖。流程圖是 CONSORT 聲明中已被廣泛采用的關鍵元素[70]。一篇針對發表在 5 種主要的全科和內科雜志上的隨機對照試驗的研究發現,按 CONSORT 推薦的方式,以流程圖報告受試者流程,試驗信息更加完整[70]。除此之外,完整的 CONSORT 流程圖也減少了讀者找到必要信息以評估試驗可靠性的時間。同時它還可能提高某些有可能不會被報告信息的可獲得性。
完成 CONSORT 流程圖所需的信息包括:參與評估的潛在參與者的數目,被隨機分配到每個干預組的受試者數目,依分配方案接受治療的受試者數目,依分配方案完成治療的受試者數目及就主要結局指標進行分析的受試者數目,而且,每個步驟中都應列出排除者的數量和原因[2, 61]。
對于先導性試驗,了解在評估被招募者的入選資格之前接觸了(或篩選了)多少受試者可能也很重要。這確保了讀者可評估外部效度及試驗受試者能夠與所有合格參與者進行比較的代表性[71]。除此之外,對于先導性試驗,重要的是要知道在評估合格參與者之前接觸了多少潛在受試者及招募他們的難度,以便評估確定性 RCT 和其他將來試驗的招募潛力。在某些情況下,如果這些要素是先導性試驗的主要焦點,則流程圖可能需要更多的信息(圖 4)。
對于先導性試驗,報告每個先導性試驗目標評估的受試者人數是適當的,而不是為主要結果分析的人數(如將來確定性 RCT 報告的是主要結果分析的人數)。如果先導性試驗的目標有限,則應列出所有目標,并在流程圖中報告每個目標的結果。如果有多個目標,那么應該事先就哪些是最重要的目標達成一致,以決定是否繼續進行將來確定性 RCT,同時也只有這些重要的目標應該在流程圖中報告。圖 5 提供了先導性試驗的 CONSORT 流程圖的模板,該模板包括不同目標的結果展示。然而,確切的形式和內容可能會因試驗的具體特征而有所不同。因此作者應確保他們的流程圖盡可能與關鍵目標相匹配。
3.4.2 條目 13b
CONSORT 標準條目:隨機分組后各組脫落和被剔除的例數,并說明原因。
示例:“所有 16 例患者,隨機分配到癥狀診所,都完成了首診,其中 11 例完成了 3 次或 4 次隨訪。在其余的人中,有兩人在同意提前出院時,情況明顯改善;兩人在第二次隨訪后發現難以進一步參與該研究,一人在第一次隨訪后拒絕了任何進一步聯系。盡管兩組的隨訪應答率相當,但有幾個隨機分組后接受常規治療的患者表示了一定程度的失望[72]。”
解釋:對于一些 RCT 而言,描述受試者在試驗每個階段的流程相對直接,特別是在沒有隨訪缺失或受試者剔除時。然而在一些較為復雜的試驗中,讀者可能很難確定一些受試者是否、及為什么沒有按分組方案接受治療,為什么隨訪中斷,或者為什么被排除在結果統計之外[73]。在確定性試驗中,這些信息對于解釋試驗結果的可推廣性至關重要,因為分配后被剔除的受試者不太可能代表研究中的所有受試者[74]。在先導性試驗中,這些內容可用于判斷將來確定性 RCT 的潛在可推廣性,但亦可用于評估受試者對干預措施的可接受性,并幫助規劃確定性 RCT 和類似情況下的其他試驗。
3.4.3 條目 14a
CONSORT 標準條目:招募期和隨訪時間的長短,并說明具體日期。
示例:“患者招募開始于 2003 年 8 月,并于 2005 年 10 月完成[75]。”
解釋:為提高透明度,報告所有研究中重要活動的起始日期是很重要的。就先導性試驗而言的另一個理由是,這些日期可能影響確定性 RCT 的疾病定義、治療選項和報銷計劃等因素,因為在進行先導性試驗和確定性 RCT 開始之間,這些情況都可能發生了變化。試驗之外的不同治療方法的可獲得性也會發生變化,并可能對人們參加隨機試驗的意愿產生影響。因此,先導性試驗的招募可能比將來確定性 RCT 招募更容易,也可能更難。除此之外,了解研究過程的時間長度對于規劃將來確定性 RCT 和其他試驗可能也重要。
3.4.4 條目 14b
CONSORT 標準條目:為什么試驗結束或中止。先導性試驗的擴展:先導性試驗結束或中止的原因。
示例 1(未達到預期招募人數而停止,但提供了足夠的數據):“產腸毒素大腸桿菌(enterotoxigenic escherichia coli,ETEC)是導致旅行者腹瀉的主要原因。本研究設計了這個Ⅱ期雙盲隨機安慰劑對照研究,以調查計劃登記的 300 例安慰劑接受者中 ETEC 自然感染的流行病學,安慰劑與不耐熱腸毒素(heat-labile enterotoxin,LT)的比例為 2∶1。當登記人數達到 201 例時,該研究停止,因為已經超過了計劃的試驗停止要求,研究者認為,大于 100 例的安慰劑組,雖然不如原來計劃的 200 例,但足以評估安慰劑組的 ETEC 罹患率。在 111 例安慰劑組中,有 24 例(22%)患有腹瀉,其中 11 例(10%)由 ETEC 引起[76]。”
示例 2(在招募結束時停止,但沒有提供足夠的數據):“如果招募率低于預期,就將研究擴展到較多領域,并通過廣告招募潛在受試者。然而,由于英國血壓治療質量和結局指標框架指南出于對高血壓的更好管控考慮而做出的變化,幾乎沒有篩選到合格的受試者(有 13 例受試者同意參與,但 12 例篩查失敗,導致只招募了 1 例受試者),因此試驗在招募期間結束時就停止了[77]。”
解釋:當先導性試驗結束或中止時說明原因很重要,因為這可能會影響確定性 RCT 的可行性。在示例 1 中,研究者的計劃時間已用完,并且認為他們可有足夠的受試者來估計腹瀉的罹患率,以便為將來的研究提供信息。由于臨床環境發生變化,導致疾病未能控制的患者數量減少,這種情況并不少見,這可能導致重要的后續試驗,而不僅是先導性試驗,招募不到參與者。這說明了一個先導性試驗研究在評估確定性 RCT 的可能收益方面的好處。在示例 2 中,停止的原因僅僅是受試者招募失敗,并且清楚地說明了原因。停止的其他潛在原因還包括:干預措施不可能實施,有新的研究表明該試驗與研究目標已經不相關及資金困難。知道是誰做出了提前停止的決定也是有幫助的。在確定性 RCT 中,數據監測委員會經常提出停止試驗的建議。也許沒有必要為所有的先導性試驗設立數據監測委員會,但研究者應考慮如何做出停止的決定。
3.4.5 條目 15
CONSORT 標準條目:用一張表格列出每一組的基線數據,包括人口學資料和臨床特征。
示例:參見表 4。

解釋:在評估干預措施效果的 RCT 中,干預組基線特征表對說明可能影響試驗結果表面效度的任何差異是很重要的。在先導性試驗中,受試者的數量可能比將來確定性 RCT 少,因此基線失衡的可能性更大。與確定性試驗類似,不均衡并不意味著偏倚,且在某些情況下任何病例偏倚都不是一個問題,因為在先導性試驗中對干預措施效果的評估不是主要關注的問題。盡管如此,基線數據對于幫助解釋結果很重要,包括可推廣性方面的考慮,而表格是展示這些內容的最佳方式。
3.4.6 條目 16
標準 CONSORT 條目:各組納入每一種分析的受試者數目(分母)及是否按最初的分組分析。先導性試驗的擴展:對于每個研究目的,納入每一種分析中包括的受試者數目(分母)。如果相關,這些樣本應該按隨機分組的結果進行分析。
示例 1(聯系的站點數量):“一名研究助理在 4 周期間打了 41 個介紹電話,與 21 個合格的家庭醫學小組(family medicine group,FMG)的醫療主任聯絡。其中 1 個醫療主任無法聯絡。有關研究的宣傳資料已傳真至 20 個已聯絡的家庭醫學小組。”
示例 2(在試驗點內參與試驗的參與者數量):“在 5 個參與試驗的 FMG 中工作的 52 名合格家庭醫生,有 39 名(75%)同意參與這個研究[34]。”
解釋:在評估干預措施效果的 RCT 中,結局指標通常是測量受試者的,因此分母是受試者的數量。然而,由于先導性試驗中試驗目標有潛在多樣性,根據這些目標評估可行性措施的分母可能是組織、衛生從業人員、患者或在某些情況下可能是情節或事件。為簡單起見,我們沒有更改本條目中的“受試者”一詞,但應根據特定目標和相關措施或評估來解釋該條目。這兩個示例取自同一試驗。一個目標是評估招募的可行性。該目標的主要受試者是 FGMs(示例 1)和家庭醫生(示例 2)。21(FMGs)和 52(家庭醫生)的分母表示研究者所接觸到的受試者數目以表達招募過程中的努力。在這個示例中,不能按隨機分組例數進行分析。
3.4.7 條目 17a
CONSORT 標準條目:各組每一個主要和次要結局指標的結果,效應估計值及其精確性(如 95% 可信區間)。先導性試驗的擴展:對于每個研究目的,任何估計的結果都包括對不確定性的表達(如 95% 可信區間)。如果相關,這些結果應該按隨機分組進行分析。
示例 1(可行性結果):“ABSORB(用于單個冠狀動脈病變患者的生物可吸收依維莫司洗脫冠脈支架系統)研究旨在評估 BVS(生物可吸收依維莫司洗脫支架)支架在單個冠狀動脈病變患者中的可行性和安全性。治療成功率為 100%(30/30 例患者),設備成功率為 94%(31 次嘗試植入支架成功 29 次)[78]。”
示例 2(建議在將來確定性試驗檢測的結局指標):“盡管生活方式改變的起始率也有利于個體化的評估組,但不太明顯。在 3 個月時,75% 的個體化評估組和 68% 的常規評估組已經開始改變他們的生活方式[未調整的優勢比為 1.38,95%CI(0.55,3.52)]。在 6 個月時,該百分比分別為 85% 和 75%,表明隨著時間的推移,兩組的變化開始增加,差距略有擴大[未調整的優勢比為 1.86,95%CI(0.64,5.77)]。而該可信區間所體現的較大范圍再次提示這一結論的不確定性程度[40]。”
解釋:反映先導性試驗研究目標的結果報告很重要。例如,結果可能包括招募、保留或應答率,或其他類型的比率,如示例 1。由于先導性試驗中的樣本量可能較小,因此對這些比率的估計并不精確,并且應通過計算估計值的可信區間來識別這種不精確。通常,在先導性試驗中,作者不會給出這樣的可信區間,但如果給定分子和分母,則可計算出該可信區間。在示例 1 中,100%(30/30)的 Wilson 95%CI 為 88.65% 至 100%,而 94%(29/31)的 Wilson 95%CI 為 79.78% 至 98.21%(OpenEpi Seattle)[78]。如果作者確實報告了試驗組之間的差異(如果與試驗的目標不一致,這是沒有必要的),則可信區間為讀者提供精確度評估(示例 2),這通常表示相當大的不確定性。如果先導性試驗和將來確定性 RCT 中的樣本來自略微不同的總體,則根據先導性試驗計算的可信區間將不會直接指明確定性 RCT 中相關結局指標的可能上下限,但仍然可有效地突出其不精確。
3.4.8 條目 17b
CONSORT 標準條目:對于二分類結局,建議同時提供絕對效應值和相對效應值。先導性試驗的擴展:不適用。
解釋:這一條目被包括在 2010 年 CONSORT 聲明中,因為在考慮臨床意義時,二分類結局指標的效應大小的相對或絕對測量都不能給出干預效果的全貌。例如,與絕對風險相比,研究中人群的基線差異對相對風險的影響較小,盡管有時人群的影響可能會被曲解。除此之外,不同的受眾(臨床、政策、患者)更喜歡使用一些其他的措施。然而,在先導性試驗中,情況就不同了。由于來自這些試驗的估計不精確,并且這些試驗中的樣本可能不具有代表性(條目 17a),因此我們建議不要依賴先導性試驗的效應量估計來判斷臨床意義(另見引言,本文的范圍和框 1)。結局指標的數據可合理地用于其他的目的,比如估計確定性 RCT 的樣本量(條目 7a)。但就條目 17b 來說,報告理由是以臨床意義為基礎的,其對于先導性試驗而言是不適用的。
3.4.9 條目 18
CONSORT 標準條目:所做的其他分析的結果,包括亞組分析和校正分析及不同于預先設定的分析。先導性試驗的擴展:任何進行的可能用于將來確定性試驗的其他分析的結果。
示例:“敏感性分析:在 6 周和 12 周時,研究結果對那些在住院期間接受導尿的患者不敏感(也排除了那些在拔除導尿管后從未出現尿失禁的患者)。然而,同樣在這兩個時間點,當排除中風前尿失禁患者時,優勢比會發生較為明顯的降低[79]。”
解釋:最初非計劃性分析,其結果可能對將來確定性 RCT 產生重要影響。應該報告這些分析的結果,并討論它們如何影響將來確定性 RCT。在示例中,雖然受試者樣本量很小,但作者從非計劃性敏感性分析推斷,與中風前尿可控制的患者相比,尿失禁患者至少有可能或更可能從干預措施中受益,并得出該組患者應該包括在完整試驗中的結論。
3.4.10 條目 19
CONSORT 標準條目:各組出現的所有嚴重危害或意外效應(具體的指導建議參考“CONSORT for harms”)[7]。
示例 1(潛在危害):“盡管干預措施組和常規治療組在年齡、性別和婚姻狀況方面相似,但干預措施組更有可能是:失業(69% vs. 59%)、使用除服毒以外的方法自殺(23% vs. 9%)、有自殘史(67% vs. 53%)和接受過精神治療(64% vs. 53%)。在線 DS1 表顯示了兩組中的反復自殘和資源使用情況。從表中可看出,干預措施組與普通治療組受試者的 12 個月復發率為 34.4% vs. 12.5%……調整臨床因素基線后(中心,傷害方法(服毒 vs. 其他)及自殘史,既往精神病治療)后,與常規治療組相比,干預措施組重復發作的優勢比和重復發作次數仍然升高了[80]。”
示例 2(意外影響或潛在危害):“盡管我們認識到在研究開始時各組之間的體重存在一些差異,而這可能對結果造成影響,但這個研究中一個意想不到的發現是干預措施組平均體重減輕了 4 公斤,有利于本研究的預期結果。因此,在任何旨在對體重產生積極影響的研究中,飲食因素有明確的作用。盡管我們在當地營養師陪同下的雜貨店之旅中,提供了一次有關營養的教育課程,并通過提供的午餐模擬了健康食品的選擇,但飲食行為和體重并不是本研究的重點[21]。”
解釋:報告每組受試者的所有重要的或潛在的危害或意外影響是至關重要的,這些結果可改良確定性 RCT 的研究設計,以避免這些影響或建立有效的程序監測潛在的危害。在示例 1 中,尚不清楚干預措施組反復自殘的非預期增加風險是真實的,還是基線協變量不均衡的結果,還是特定環境所特有的。這一結果導致了提議在將來確定性 RCT 中使用分層隨機化的設計。在示例 2 中,老年受試者體重減輕的非預期效應導致在干預措施中加入飲食因素的決定,以避免在將來確定性 RCT 中產生潛在的傷害。這些內容也可能對計劃進行類似研究的其他研究者有用。
3.4.11 條目 19a
先導性試驗的擴展:如果相關,其他重要的非預期結果。
示例(非預期結果):“從 1998 年 4 月中起計 12 個月內,13 個積極疼痛管理方案組中的 12 個及 13 個傳統疼痛管理方案組中的 11 個,一共招募了 231 例受試者。其中,積極管理方案共招募了 165 例受試者(平均方案招募率為每 1 000 例注冊患者有 1.71 例,即預期的 141%),而傳統管理方案僅招募了 66 例(每 1 000 例 0.57 例,即預期的 54%)(圖 1)。平均而言,積極疼痛管理組招募了 12.7 例受試者(范圍 0~39),而傳統疼痛管理組僅招募了 5.1 例受試者(范圍 0~18)(表 2)。雖然兩種類型的治療方案都招募了與所確定的做法相似的百分比(積極的占 13%;傳統的占 16%),但積極疼痛管理組的人數為 1 257,遠遠超過傳統疼痛管理的 416。招募率的極端差異導致了一個針對兩組受試者基線特征的調查(表 3)。研究發現,通過積極疼痛管理組招募的受試者更有可能是全職工作,并且在離開學校后接受了進一步的教育。除此之外,他們的背部疼痛也較輕,身體上的不適較少,抑郁情緒也較少[81]。”
解釋:這是該聲明中的一個新增條目,反映了報告非預期結果的重要性,盡管這些非預期結果不會直接影響個別參與者,但如果不在先導性試驗中處理,可能會對確定性 RCT 的有效性產生影響。所謂非預期結果,是指在先導性試驗中發生的原本非研究者所期望的,并且對研究產生一定的影響。在這個示例中,先導性試驗的設計包括方案水平的隨機化,在隨機化之后進行參與者招募。這導致兩組在招募參與者時產生了非預期結果。在隨后的主要研究中,研究者在方案層面放棄了隨機化。
3.5 討論
3.5.1 條目 20
CONSORT 標準條目:試驗的局限性,報告潛在偏倚和不精確的原因及出現多種分析結果的原因(如果有這種情況的話)。先導性試驗的擴展:先導性試驗的局限性,處理潛在偏倚的來源和其他有關可行性的不確定性。
示例 1(先導性試驗局限性):“在某些情況下,根據本研究以前對血小板量和腦室出血(intraventricular hemorrhage,IVH)之間關系的研究,可使用長達 72 小時的平均血小板量(mean platelet volume,MPV)來計算血小板量。我們不能排除急性血小板減少癥期間 MPV 的變化或許更為劇烈的可能性。由于血小板計數沒有通過人工計數得到證實,因此本研究不能排除一些嬰兒可能患有假性血小板減少癥的可能性[82]。”
示例 2(潛在偏倚):“第四,對于本研究而言,分別隸屬于兩個學術中心的住院醫師可能會成為干擾因素。除此之外,偶爾會有其他住院醫師在干預措施組學術中心提供夜間服務。這些額外的住院醫師沒有接受關于這個研究的正式培訓,因此他們有效地發揮作用,就好像他們處于對照組中一樣。相反,在對照組學術中心提供額外夜間服務的住院醫師可能先前在干預措施組學術中心工作時已經接受過關于本研究的培訓。因此,這些住院醫師有效地發揮了作用,就好像他們是在干預措施組中一樣[83]。”
示例 3(其他不確定性):“應考慮在確定性試驗中加入內部先導性試驗,以便繼續監測試驗的可行性,特別是評估使用不同的納入標準和對數據收集方法的更改建議(尤其是在招募的第一年內)。在數據收集方面,使用定性方法來評估受試者的意見,也是有益的[84]。”
解釋:列出并討論研究的局限性,有助于更好地理解研究結果的重要性。在先導性試驗中,區分可在將來確定性 RCT 中克服的局限和不能克服的局限可能會有所幫助。在示例 1 中,作者解釋了測量方法的局限性,盡管他們沒有說他們是否認為在將來確定性 RCT 中克服這一問題。
在將來確定性 RCT 中,研究者希望盡可能避免可能影響治療效果評估的偏倚來源。在先導性試驗中,研究者對治療效果并不太感興趣,因此這些偏倚不會引起太多關注,但在將來確定性 RCT 中,確定可能影響治療效果的潛在偏倚仍然是有用的,以便研究者更好的避免這些偏倚。示例 2 識別了將來確定性 RCT 中的潛在偏倚來源。
如果在先導性試驗結束時仍然存在大量關于可行性方面的不確定性,從而阻止研究者繼續進行將來確定性 RCT 或需要在內部先導性試驗中再次探討可行性,那么為明晰起見,亦應需報告,正如示例 3 所示。
最后,盡管我們不建議這樣做,但如果實施及報告了檢驗效能不足的試驗,那么研究者仍應指出這些局限,以免讀者對結果產生誤解(條目 2b)。
3.5.2 條目 21
CONSORT 標準條目:試驗結果被推廣的可能性(外部可靠性、適用性)。先導性試驗的擴展:先導性試驗方法和結果對將來確定性試驗和其他研究的可推廣性(適用性)。
示例 1(調查結果的可推廣性):“本研究考慮了標準治療的選擇和持續時間的變化,以增強結果的可推廣性,并有很高的隨訪率[65]。”
示例 2(推廣至其他先導性試驗):“我們的數據只反映了一個先導性試驗的結果;然而我們希望這些方法可作為分析其他情型下具有不同設計的先導性試驗的模板[63]。”
示例 3(推廣性問題):“盡管安全問題在醫療實踐和臨床研究中必須高度關注,但普遍來講過于嚴格的排除標準可能會增加人們對試驗安全性的擔憂,也限制了試驗結果的可推廣性,并延緩了對重要臨床問題的解答。重新評估 PROTECT 先導性試驗排除標準……將大大提高 PROTECT 研究的適用性……PROTECT 先導性試驗表明需要進行另一個先導性試驗研究(DIRECT),以確定 Dalteparin 5000 IU SC OD 在嚴重腎功能不全(肌酐清除率,b30 mL/min)患者中的安全性[63]。”
解釋:可推廣性(適用性)是研究的內容可適用于其他情況的程度。可推廣性不是絕對的,而是需要做出判斷的問題。在確定性試驗中,讀者通常對研究結果在研究范圍以外情況的可推廣性感興趣—如常規臨床實踐。然而,在先導性試驗中情況并非如此,因為這些研究的規模不允許這樣做。在先導性試驗階段考慮可推廣性可能是重要的,因為這對于確定性 RCT 的可推廣性可能很重要(示例 1),結果和方法可應用于確定性 RCT 以外的研究環境(示例 2),或者,可能存在對以與先導性試驗相同的方式進行的確定性 RCT 結果的推廣性的擔憂,這可能導致將來確定性 RCT 設計的改變或進行進一步的先導性試驗(示例 3)。
3.5.3 條目 22
CONSORT 標準條目:與結果相對應的解釋,權衡試驗結果的利弊,并且考慮其他相關證據。先導性試驗的擴展:與先導性試驗目的和結果相一致的解釋,權衡潛在的利弊,并考慮其他相關證據。
示例 1(與目的和結果的一致性):“這個初步研究的目標之一是探討使用基于血小板計數的血小板輸注指南的可行性。通過對 5 例被確診為血小板減少癥的嬰兒進行研究后發現,平均血小板量(mean platelet volume,MPV)在確診血小板減少癥前 72 小時內并不能提供具有確定性的診斷數據。因此缺乏即時可用的 MPV 可能會限制這種輸血策略在某些機構的臨床適用性和推廣性。在我們的研究中,克里斯蒂娜醫院所在地大約一半的家庭不同意這個研究。而這些信息對于規劃將來血小板輸注的研究而言非常重要,因為當他們的嬰兒患有血小板減少癥并面臨輸血治療時,許多家庭無法決定是否申請輸血。血小板輸注研究的另一種研究設計可能涉及在入院時登記更多的嬰兒,而不考慮血小板計數,輸血指南僅適用于他們實際上已被確診為患有血小板減少癥的情況。這種方法可能會減少被告知需要輸血和輸血相關研究的家庭的壓力[82]。”
示例 2(考慮其他相關證據):“據我們所知,我們的受試者能夠進行運動想象。我們的結果似乎與之前的研究結果不同,這些研究表明多發性硬化癥(multiple sclerosis,MS)患者的運動想象能力較低。然而,這些作者將這一人群中受損的運動想象與認知功能障礙和抑郁癥聯系起來,因此,在我們的研究中,有認知障礙和抑郁的人被排除在研究之外。一些研究使用了患者評定的問卷,比如動覺和視覺想象問卷來評估受試者的運動想象能力。我們的研究本可使用這個患者評定的問卷,但我們每周都要電話詢問受試者任何與動覺運動想象有關的問題,同時他們也得到了相應的支持。除此之外,先前所有對 MS 患者的運動想象能力研究都是實驗性研究,沒有長期訓練效果,我們的研究不同,包括為期 4 周的學習,有 24 個訓練課程,這可能會增強大腦的心理表征能力[68]。”
示例 3(與決策標準相關調查結果的一致性):“除此之外,這個試驗的結果(可行性和可接受性方面)支持實施一個大型群組隨機試驗,該試驗涉及家庭醫生和他們的患者在共享決策(shared decision-making,SDM)中關于最佳使用急性呼吸道感染(acute respiratory infections,ARI)的抗生素。即使不是所有預先確定的標準總是完全符合本研究的標準,也能得出這一結論。事實上可肯定的是,沒有達到預先確定的標準并不一定表明試驗不可行,而是強調要對試驗方案進行修改。24% 的符合條件的家庭醫療小組(family medicine groups,FMG)同意參加這個研究,低于預期的 50%。當本研究的目標是從所有已確定的 FMG 中獲得 50% 的積極應答率時,我們可能過于樂觀了[34]。”
解釋:對研究結果的解釋有助于增加讀者對結果重要性的理解。在示例 1 中,除研究結果的解釋與研究的目標之一相匹配外,作者還引出了重新設計的問題,即以減輕招募家庭的難度增加招募,并希望最終為相關兒童受試者帶來積極的好處。這一觀察結果可能對其他計劃進行類似試驗的人有所幫助。至于確定性試驗,讀者希望了解先導性試驗報告中與其他來源證據相關的證據是如何呈現的(如示例 2 所示)。這里指的其他來源可能是作者進行的其他可行性試驗,或不同作者在相同或相似的環境中或對相似的患者進行的試驗。如果使用了先驗判定標準(條目 6c),就可參照這些標準對先導性試驗中呈現的證據進行解釋(示例 3)。
3.5.4 條目 22a
先導性試驗的擴展:從先導性試驗到將來確定性試驗進展的影響,包括任何提出的修正案。
示例 1(提議修正以改善招募):“按時招募的目標已經達到,但這并沒有轉化為預期的合格患者招募人數。篩查人群的合格程度遠低于預期,表明納入標準可能過于嚴格。體重指數≤22 kg/m2的排除標準是基于公布的證據,即體重指數在正常范圍的下限會增加血液透析人群的死亡率。然而,身體成分被認為在體重指數的保護作用下起著更大的作用。使用體重指數作為篩查工具是一種快速而簡單的測量方法,但在進行確定性試驗之前,應重新評估體重指數≤22 kg/m2的水平。如果體重指數提高到 24 kg/m2,那么潛在的招募人數就會增加 10%[84]。”
示例 2(提議修正以改善合作):“六個家庭甚至在開始干預之前就拒絕積極參與本試驗。為確保整個團隊的合作,并避免受試者過早退出,研究團隊向專業咨詢委員會小組作簡短介紹的方式,可能會促進受試者的招募/保留。獲得醫務主任和護理主任的初步同意也可能為受試者的招募和保留帶來一定的好處。除此之外,為克服安排方面的挑戰,特別是對北部較遠地區的家庭來說,提供一個在網站上查看方案或遠程參與的機會可能會提高潛在受試者的研究參與率[85]。”
示例 3(對將來確定性 RCT 進展的影響):“被分配接受本研究的多元化干預措施(包括教育、標準化的紙質醫囑及小組審核和反饋)的醫院,在入院 24 小時內適當管理血栓預防的住院患者的比率并不比沒有分配這一策略的醫院更高(63% vs. 67%)。這一發現,再加上確保在所有預印的醫囑放在醫療圖表中的問題,使我們得出結論,如果沒有重大修改和測試的,不應提供這種干預措施。換句話說,這種干預措施是不可行的[83]。”
解釋:這是該聲明中的一個新增條目。為從先導性試驗過渡到將來確定性 RCT,了解先導性試驗結果如何影響將來確定性 RCT 非常重要。為清晰起見,將來確定性 RCT 的計劃是否基于先導性試驗而沒有任何變化的情況下進行,或者通過對先導性試驗的更改而進行(示例 1 和示例 2),還是由于可行性方面的重大問題而未實施(示例 3),這樣的簡單陳述就足夠了。如果提議通過先導性試驗的特定更改來計劃將來確定性 RCT,則應說明這些內容。
3.6 其他信息
3.6.1 條目 23
CONSORT 標準條目:臨床試驗注冊號和注冊機構名稱。先導性試驗的擴展:先導性試驗的臨床注冊號和注冊機構名稱。
示例(試驗注冊號):臨床試驗,方案注冊系統:NCT01695070[86]。
解釋:使用唯一標識符注冊先導性試驗與最終試驗一樣重要。注冊確保了透明度和可靠性,在獲得英國倫理委員會批準之前,英國所有臨床試驗都需要注冊[87, 88]。它確保了所有正在進行的工作處于公開狀態及隨后的出版物更可信(故而獲得結果具有更大的效應)。世界衛生組織聲明:“所有干預性試驗的注冊是一種科學、倫理和道德責任[89]”。國際醫學期刊編輯委員會要求將所有試驗注冊作為發表的標準,并列出注冊機構[90]。
3.6.2 條目 24
CONSORT 標準條目:如果有的話,在哪里可獲取完整的試驗方案。先導性試驗的擴展:如果有的話,哪里可獲取完整的先導性試驗方案。
示例 1(參考發表試驗方案):“健康醫院試驗是一個在利茲信托教學醫院的 2 個心臟病病房實施的單中心、隨機對照、雙臂、平行、非盲法可行性試驗。其主要目的是探討個體化生活方式轉換評估的可行性,估計招募比率,并探討收集數據和對受試者隨訪的可行性,并以此估計確定性試驗的樣本量……該試驗方案已經在其他地方發表[40]。”
示例 2(作為支持信息的試驗方案):“此試驗的方案和支持提高行為和公共衛生干預措施的非隨機評價的報告質量(improving the reporting quality of nonrandomized evaluations of behavioral and public health interventions,TREND)清單可作為支持信息提供;請參閱清單 S1 和試驗方案 S1[91]。”
示例 3(作者可應要求提供試驗方案):對照組(而不是其他兩組)的受試者收到了一本 16 頁的小冊子,內容涉及教育、醫療、住房、就業和社區資源(作者可應要求提供試驗方案)[92]。
解釋:獲得先導性試驗的完整方案很重要,因為它將預先指定試驗的所有主要組成部分。SPIRIT(標準試驗方案清單條目:干預性試驗的推薦意見)聲明定義了一組基于納入條目的證據[93]。試驗方案的可獲取性使得檢查后續產出的完整性成為可能,并減少了選擇性報告提示“更好”結果的機會。這些示例說明了可提供試驗方案的不同方式,如先前的出版物(示例 1),作為先導性試驗報告的附錄(示例 2),或應作者的請求提供的文件(示例 3)。試驗方案已經可公開獲取(如先前發表的試驗方案)是首先推薦的獲取方式。可實現這一點的其他方法還包括在研究網站上發表。除此之外,試驗注冊機構(條目 23)還提供一些核心的試驗方案條目。
3.6.3 條目 25
CONSORT 標準條目:資助和其他支持(如提供藥品)的來源,提供資助者所起的作用。
示例(資助):“這個試驗由安大略省學術健康科學中心替代籌資計劃創新基金和加拿大 Octapharma 基金資助。試驗資助者在研究的設計,數據的收集、分析或解釋,報告的撰寫或提交文章發表的決策中沒有起到任何作用[94]。”
解釋:報告先導性試驗的所有資金來源(即主要研究獎項和任何其他支持,如設備供應)允許讀者判斷資助機構對試驗的設計、實施、分析和報告的潛在影響。如果沒有具體的資金支持先導性試驗,也應該說明這一點。正如原 CONSORT 聲明所報告的那樣,一個系統評價表明,與獨立資助機構資助的研究報告相比,由制藥業資助的研究更有可能報告對其有利的研究結果[2, 61]。如果資助者沒有參與試驗實施或報告的任何環節,則應明確說明這一點。
3.6.4 條目 26
先導性試驗的擴展:倫理批準或研究審查委員會批準,附帶參考編號。
示例:“卡羅林斯卡研究所的區域倫理審查委員會批準了這個研究,編號為 2007/1401-31/3。”
解釋:這是加入 CONSORT 清單中的一個新增條目,因為需要強調所有的研究(包括先導性試驗)只應在倫理框架內進行,并且在開始之前獲得所有倫理和其他批準。與先導性試驗特別相關的是需要了解倫理審查委員會施加的任何限制,因為這些限制將對將來確定性 RCT 的設計和實施產生影響。
4 討論
RCT 研究報告需要包括關于方法和結果的關鍵信息,以便讀者能夠準確地理解報告的內容。這對于先導性試驗而言同樣也非常重要,因為其是確定性 RCT 能否順利實施的關鍵。CONSORT 2010 聲明提供了 CONSORT 研究團隊關于 RCT 報告中應包括基本條目的最新建議[2, 61]。然而,先導性試驗與其他隨機試驗的目的和目標之間均存在較為明顯的差異,這是因為前者側重于評估可行性,而不是效果或效力。因此,盡管在這些試驗中報告的許多內容與任何其他隨機試驗中需要報告的內容相似,但在內容類型和標準 CONSORT 報告條目的適當解釋方面存在一些關鍵差異。
本文介紹和解釋了針對先導性試驗的 CONSORT 清單擴展中的這些關鍵差異。在題為“本擴展的范圍”一節中,討論了其他幾種類型的可行性研究和“概念驗證”試驗。其他研究者已經開始研究這些不同類型的研究之間的報告規范轉化的想法(例如,Wilson 等[96])。本研究期望,本擴展中提出的一些報告原則也可適用于其他類型的可行性或概念驗證試驗。
對于兩組平行試驗而言,使用 CONSORT 聲明可顯著提高研究的報告質量[97]。我們相信,常規使用這一 CONSORT 聲明的擴展也同樣會改善先導性試驗的報告質量。在報告先導性試驗時,作者應使用本 CONSORT 擴展清單中的 26 個條目,并且適時參考原 CONSORT 聲明。堅持 CONSORT 聲明及其擴展版也可幫助研究者在將來設計相關試驗,指導同行評議和編輯評價稿件。許多期刊在給作者的說明中建議遵循 CONSORT 的推薦意見。我們鼓勵他們指導作者遵循此意見,同時包括針對具體研究設計的其他的 CONSORT 擴展聲明。目前正在研發一種工具來支持期刊實施這個步驟[98]。所有 CONSORT 規范的最新版本可在 www.consort-statement.org 獲得。
參考文獻
見原文。