高質量的隨機對照試驗(randomized controlled trials,RCTs)是循證醫學的組成部分。隨機對照試驗是高質量系統評價的基礎,是衛生保健政策和臨床實踐的重要決定因素。為最有效地使用已發表的研究,研究者和作者應遵循準確和透明的 RCTs 報告規范。CONSORT 聲明及其擴展版是生物醫學研究中使用最廣泛的報告規范之一。CONTORT 聲明于 2004 年被 American Journal of Orthodontics and Dentofacial Orthopedics 采用。自 2011 年以來,該期刊一直積極遵守 CONSORT 報告規范。本文旨在解釋 CONSORT 各條目與這一領域研究報告的相關性及其應用,以幫助作者向本雜志和其他矯正類雜志提交 RCTs 報告時,達到 CONSORT 聲明的要求。
引用本文: 趙晨, 付姝菲, 段玉婷, 張弛, 商洪才, 卞兆祥, 譯. CONSORT 聲明:在牙科矯正臨床試驗中的擴展與應用. 中國循證醫學雜志, 2021, 21(2): 219-230. doi: 10.7507/1672-2531.202008177 復制
隨機對照試驗(randomized controlled trials,RCTs)是循證醫學的重要研究方法。隨機對照試驗報告的讀者必須能夠準確理解試驗是如何進行的,以評估研究結果的相關性和方法學的嚴謹性。研究報告有兩個關鍵原則:一是依據報告提供的信息可以重復試驗,二是方法和結果應得到足夠詳細地描述,以便納入系統評價[1]。
CONSORT 聲明是為了幫助改善隨機對照試驗的報告質量,為準備報告臨床試驗的研究人員提供指導。CONSORT 清單由 25 個條目組成,涵蓋臨床試驗的所有關鍵要素,為如何報告此類研究的設計、實施、分析和解釋設定了標準[2]。CONSORT 指南的一些擴展版涵蓋了更復雜的試驗設計,如整群隨機試驗和非劣效試驗;其最新信息可在 CONSORT 網站上獲得(http://www.consort-statement.org/extensions)。超過 600 家生物醫學期刊,包括 2004 年的《美國矯形和口腔矯正雜志》(American Journal of Orthodontics and Dentofacial Orthopedics,AJO-DO)已采用了 CONSORT 聲明,同時許多期刊也采納了關于報告摘要的 CONSORT 規范。盡管這些建議被廣泛接受,但臨床試驗的報告質量仍有相當大的改善空間[4-8]。
AJO-DO 認識到,采納 CONSORT 聲明并不意味著能確保遵守。在 2011 年實施了一項計劃,旨在改善對 CONSORT 的依從性,從而提高 AJO-DO 雜志對隨機對照試驗的報告質量。該計劃包括視頻、CONSORT 網站鏈接,以及為提交有關遵從 CONSORT 規范 RCTs 報告的作者的積極指導。最近,AJO-DO 對 RCTs 的報告重新規定了格式,引入了副標題,以促進完整的報告,進而能夠更有效地在系統評價過程中提取相關臨床數據。
自從 AJO-DO 引入這些改變以來,其發表的 RCTs 在報告質量方面已有了很大改善;這些改善反映了編輯、審稿人和作者之間的成功互動[9]。在 2011 年至 2013 年期間提交的所有已發表試驗中,報告了 37 個 CONSORT 條目及其子條目中的 33 個。但 CONSORT 清單中涉及方法變更(3b)、試驗開始后的結局指標變更(6b)、中期分析(7b)和試驗終止(14b)的條目仍沒有充分地報告。故仍有必要加強作者首次提交的試驗報告質量,從而大大節省為提高對 CONSORT 報告規范依從性的編輯工作。本文旨在解釋 AJO-DO 對 RCTs 試驗報告提交的要求,并描述和說明 CONSORT 清單中每個條目的重要性,以及它與牙科矯正臨床試驗的相關性。本文的基礎是報告兩組平行隨機對照試驗的 CONSORT 2010 解釋與說明文件[2]。一個遵從 CONSORT 報告規范的已發表 RCT 已上傳到 AJO-DO 網站(注釋隨機對照試驗樣本文章),并將作為解釋示例。
1 清單條目及其重要性的說明
以下解釋以 CONSORT 聲明解釋與說明文件為基礎,并進行了適當調整,以更好地針對 AJO-DO 的讀者(表 1)[2]。

1.1 標題和摘要
CONSORT 條目 1a:文題能識別是隨機臨床試驗。
示例:“化學聚合(I)或光聚合(C)法對矯正患者(P)固定器的 2 年內維持度(O)對比研究;單中心隨機對照臨床試驗”。
解釋:為了幫助確保研究被適當索引和容易識別,作者應該在標題中使用“隨機”一詞,以表明參與者被隨機分配到治療組與對照組[10]。鼓勵作者(此處不屬于 CONSORT 的要求)以“ PICO+”格式組織標題,提供關于參與者、干預措施、對照和結局的信息。“+”表示可能包含與盲法、中心數、時間等相關的附加信息。
CONSORT 條目 1b:結構式摘要,包括試驗設計、方法、結果、結論幾個部分(具體的指導建議參見“CONSORT for abstracts”)。
解釋:RCT 摘要的報告有具體的指導(表 2)。文筆流暢、詳細且清楚地描述試驗的摘要有助于對一篇文章的初步評估,便于從數據庫中檢索試驗以納入系統評價中。摘要是許多臨床醫生閱讀文章的唯一要素,因此其準確性和質量至關重要。鑒于幾乎所有與摘要有關的信息都將在主要 CONSORT 規范條目項下詳細討論,本文將在結尾部分介紹摘要條目的報告。

1.2 引言
引言部分包括背景和目的。
1.2.1 背景和目的
CONSORT 條目 2a:科學背景和對試驗理由的解釋。
示例:“粘合失敗仍然是一個嚴重的問題,失敗率估計為 6%~25%,這取決于放置技術和觀察周期。盡管光固化材料提供了更長的有效時間并改善了對濕度的控制,但尚未有研究這些理論性優勢重要性的隨機對照試驗發表”。
解釋:在試驗設計階段的良好習慣首先是檢索文獻以識別有關感興趣主題的可獲得證據。所檢索到的資料可能有限,也可能很多;如果可能,最好能夠找到高質量的系統評價。近期的高質量系統評價總結了現有的臨床證據,可作為已知和未知的有關感興趣干預措施有效性和安全性證據的參考。赫爾辛基宣言認為:在沒有充分了解現有文獻的情況下進行人體研究是不道德的,設計一項試驗來回答已經被回答過的問題也是不道德的,只有現有證據不確定當前干預措施有效性時,這項試驗研究才是恰當的[11]。
在本文的 RCT 范例中,雖然未引用系統評價結果,但作者明確指出,尚未有任何已發表的 RCT 探討光固化法對照化學固化法的優劣。
CONSORT 條目 2b:具體目的和假設。
示例:“在這項研究中,我們旨在比較在矯正治療后使用化學聚合或光聚合作用固定的下頜舌側固定器的維持率”。
解釋:試驗的目標旨在設計試驗解決問題,它們通常與特定治療或預防性干預措施的效應有關。研究假設是預先確定的,通過試驗檢驗以達到試驗目標。研究假設比研究目標更為具體,并且可以進行明確的統計評估。實際上,研究目標和研究假說常常不易分辨。
1.3 方法
1.3.1 試驗設計
CONSORT 條目 3a:描述試驗設計(諸如平行設計、析因設計),包括受試者分配入各組的比例。
示例:“這是分配比例為 1∶1 的平行、隨機、陽性對照試驗”。
解釋:最常見的試驗設計類型是平行設計;但是,還應注意交叉試驗設計、整群隨機化設計、非劣效性檢驗、析因設計及混合設計等類型的臨床設計。牙科中常用的研究設計有左右側對照設計[12],有的研究還包括整群設計要素。當從每個患者的多個部位和組織中收集到多個觀察結果(如牙齒、牙周部位或組織的數量)時,這種設計就會被應用[13]。不同試驗設計的試驗實施和分析的特征不同。因此,應詳細說明這些試驗設計的細節。提供特定細節(設計和分配比例)是十分重要的,如本條目示例所示。
CONSORT 條目 3b:試驗開始后對試驗方法所作的重要改變(如合格受試者的挑選標準),并說明原因。
示例:“開始試驗后,沒有對方法進行更改”。
解釋:研究方案和實際執行方式之間的差異是很常見的,應恰當記錄在案。設計發生變化(例如,納入與排除標準或隨訪時間)的可能原因很多,包括新的外部證據\無法招募足夠多的患者以及財務拮據等。對于某些“適應性”試驗,如果在研究開始前未確定試驗的樣本量和研究的周期,研究方案允許遵循預定的規則進行有限的更改。研究方案應列出在不同情況下預設的方案調整,并且應在發表的文章中對這些變更予以記錄、解釋和說明[14]。對試驗設計的任何變更均應完整報告,以幫助讀者理解其結果,無論這種變更是方案中預知的還是因不斷變化的情況導致的。
在試驗開始后,示例的這項 RCT 報告未發生。但是沒有發表的試驗方案可以驗證這一說法,在摘要的末尾也被提及到。
1.3.2 受試者
CONSORT 條目 4a:受試者合格標準。
示例:“采用了以下選擇標準:下頜前牙沒有活動性齲齒、修復體或骨折;沒有牙周疾病;足夠的口腔衛生”。
解釋:應明確概述受試者和環境的合格標準以及相關信息,因為它們會影響試驗結果與其它環境的相關性(適用性)。由于合格標準在隨機分配之前應用,因此它們不會影響試驗的內部效度(方法學質量)[15]。將納入標準和排除標準進行區分不是必需的;可以用相同的標準對納入或排除的受試者進行表述[16]。
CONSORT 條目 4b:資料收集的場所和地點。
示例:“自 2009 年 4 月至 2010 年 11 月,第一作者(N.P.)在私人診所連續招募了使用固定矯治器完成矯正治療的患者”。
解釋:清楚地描述收集數據的環境和場所對于讀者判斷研究結果是否與自己的環境有關很重要。還應明確說明地理位置、參與中心數量、可用設施、相關護理提供者及其專業水平的信息。例如,在擁有最先進設施、訓練有素的人員的中心和由設備簡陋的診所中新手進行的研究之間,試驗結果可能會有很大的不同[15]。
1.3.3 干預措施
CONSORT 條目 5:詳細描述各組干預措施的細節以使他人能夠重復,包括它們實際上是在何時、如何實施的。
示例:“所有患者均接受在口內制備的 0.022 英寸軟質舌側固定器(Tru-Chrome 多股弓絲;Rocky Mountain 矯正,丹佛市,科羅拉多州)”。“在化學聚合治療組中,將 Maximum Cure 二件式液體粘合劑(Reliance 矯正產品,伊塔斯卡市,伊利諾伊州)混合并應用于弓絲和牙齒上,Excel 二件式糊劑(Reliance 矯正產品)混合,用注射器施用。在光聚合治療組中,將光固化液體(Assure;Reliance 矯正產品)和兩層糊劑(Flow-Tain;Reliance 矯正產品)放在弓絲和相鄰的牙釉質上,每顆牙使用等離子燈(Ortholite;3M Unitek,蒙羅維亞,加利福尼亞)進行 9 秒光固化”。
解釋:應提供每種干預措施足夠詳細的清晰描述,以使有經驗的研究人員能夠重復該試驗[17]。例如,在一項多中心試驗中,至少應概述給藥的確切方法、持續時間和治療時機[18]。藥物干預需要解釋給藥方式、劑量和頻率,以及無論對照或安慰劑在形狀、顏色、氣味和味道方面與“有效藥物”都沒有區別。對于其他類型的干預措施,CONSORT 用于非藥物試驗的擴展描述了報告要求[19]。干預措施的標準化、干預措施各個組成部分的描述以及如何評估研究者依從性都十分重要。清晰描述將進一步促進將有效比較和決策納入系統評價[17]。
1.3.4 結局指標
CONSORT 條目 6a:完整而確切地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的。
示例:“主要結局指標是舌側固定器首次失效。次要結局是根據殘留膠粘劑判斷失效種類。患者被建議在放置固定器后的 1、3、6 個月開始去看牙科矯正醫生,然后在 12、18、24 個月安排隨訪。當預定的預約不可行時,特別是在試驗快結束時,可通過電話對固定器的完整性進行評估”。
解釋:試驗通常有幾種結局指標,一般分為主要結局指標和次要結局指標。應該明確定義和預先規定所有結局指標,并明確說明如何以及何時進行評估。每個結局指標的定義應足夠清晰,以允許其他研究者在試驗中使用相同的結局指標,或者明確知悉相關結局指標與系統評價中的相關結局指標的異同性。明確預先指定的結局指標,尤其是主要結局指標非常重要,因為與試驗注冊和方案預發表一樣,它減輕了選擇性報告“感興趣的”結局指標的問題,這種可能性在有研究中包含多個結局指標或多個時間點的數據收集時更大[20]。此外,多個結局指標記錄及隨之而來的多重測試,會引發與多重性和誤導性解釋相關的系列問題[21]。
在評估支持或不支持某項干預措施有效性的證據時,有效性和安全性之間的平衡是一個重要的考慮因素。應清晰描述所記錄的傷害[22]。在非藥學試驗中,明確結局指標評估的具體方法和開展結局指標評估的人數尤為重要。
CONSORT 條目 6b:試驗開始后對結局指標是否有任何更改,并說明原因。
示例:“試驗開始后結局指標沒有變化”。
解釋:已發表文獻的回顧研究表明,計劃與報告的結局指標之間存在差異[23]。最初計劃為原始試驗方案的主要結局指標可能被描述為次要結局指標,而在發表的文章中,可能會介紹新的主要結局指標。已有文獻報道選擇性報告研究結果和將“有意義”的結果報告出來的問題[20]。因此,對任何結局指標變更以及變更原因的清晰描述,將會提高臨床試驗的透明度。示例所述的 RCT 中,報告結局指標沒有變化;然而,也未在預先發表的臨床試驗方案中證實這一點。
1.3.5 樣本量
CONSORT 條目 7a:如何確定樣本量。
示例:“樣本量的計算是基于檢測兩個試驗組之間首次失效(主要結局指標)風險的臨床相關差異達到 20% 的能力(15% vs. 35%,α=0.05,檢驗效能為 85%)。Foek 等發現,光固化法舌側固定器的失效率是 35%。我們將此值用作樣本量計算的參考。計算結果表明,每個小組至少需要 93 例受試者,每組將樣本量增加到 110 例,以補充隨訪中可能的患者失訪”。
解釋:RCTs 應該具有足夠的檢驗效能來檢測試驗各組間在臨床結局上的重要差異(如果存在差異)或確認治療措施之間無差異。研究人員有義務根據臨床重要性和合理假設進行適當的樣本量計算。
作者應提供足夠的樣本量估算信息,使讀者可以重現樣本量的計算過程[24, 25]。應明確指出,樣本量的計算通常基于主要結局指標。對于連續型變量指標,作者應報告對照組的預期結局,干預組與對照組的預期差異、標準差以及檢驗水準和檢驗效能。對于二分類指標,除了標準差外,也需要相同的信息。在預期會產生群組效應的設計中,應提供群組內相關系數的值[26]。對于矯正臨床試驗中常見的左右側對照設計,應指明部位之間的假定相關性[12, 27]。最后,還應描述任何有關預期隨訪脫落的規定。理想情況下,作者應解釋樣本計算中使用的參數值的來源。
臨床研究一般不宜通過事后分析來證明之前的樣本量是否合理。但可以通過檢查效應量和可信區間以及其表現出的不確定性來判斷檢驗效能[28]。
CONSORT 條目 7b:必要時,解釋中期分析和試驗中止原則。
示例:“不適用”。
解釋:在延長期內招募和治療受試者。如果在試驗早期就出現了不同干預措施效果的明顯差異,則出于倫理原因,可能會提前終止臨床研究。可以通過中期檢查結果來解決這個問題,最好由獨立的數據監查委員會來解決。但是,在沒有進行適當更正的情況下執行多次統計檢查,可能會導致錯誤的結果和解釋[21]。作者應報告他們或數據監查委員會是否對數據進行了數次“檢查”;如果是,那么進行了幾次,是什么原因誘發他們這么做,使用了什么統計方法(包括任何試驗正式的停止規則),以及是否在試驗開始前,或在數據監查委員會通過分配看到任何臨時數據之前,又或在之后的某個時間進行的數據核查。
在示例研究報告中,未報告任何中期分析或終止的辦法。
1.3.6 隨機化
與其他前瞻性研究相比,隨機化是 RCTs 的主要優勢。臨床試驗方法學中的隨機化具有特殊含義,應該加以實施,以使研究者和受試者都無法預測下一個治療方案的分配。術語“交替分配”、“隨機指派”和基于某種確定性度量的分配—如出生日期或星期幾—并不被認為是完全隨機或足夠明確,盡管在牙科文獻中經常遇到[5,29]。這種不適當的分配方案不是真正的隨機化,而與偏倚的結果有關。隨機化過程要求治療分配是完全隨機的,并需要一種機制在實施治療之前隱藏其分配情況。
1.3.6.1 隨機序列產生
CONSORT 條目 8a:產生隨機分配序列的方法。
示例:“通過使用 Stata 軟件(StataCorp,CollegeStation,Tex)中的“-ralloc-”命令[20]完成隨機化”。
解釋:隨機數通常是由隨機表或能產生隨機序列的軟件生成的。作者必須清楚描述隨機數字表是如何生成的,以便讀者判斷該隨機方法是否合適。
CONSORT 條目 8b:隨機方法的類型,任何限定的細節(如怎樣分區組和各區組樣本多少)。
示例:“按長度為 20 例患者的區組,確保兩組均勻分布”。
解釋:牙科臨床研究中常使用簡單和區組隨機、分層隨機和最小化法等幾種方法[29]。簡單隨機就像擲硬幣一樣,盡管它是最安全的方法(因為它確實是隨機的),但是在小型試驗中,兩個治療組樣本量不一致的可能性很高。根據區組的長度,使用區組隨機可確保治療組接近平衡,而分層隨機化或最小化法可使治療組在重要結局指標方面保持平衡。
作者應清楚地描述隨機方法及應用的任何限制。使用區組時,也應指出區組長度以及其長度是固定的還是可變,因為這會影響后續分配的可預測性。
1.3.6.2 分配隱藏
CONSORT 條目 9:用于執行隨機分配序列的機制(例如按序編碼的封藏法),描述干預措施分配之前為隱藏序列號所采取的步驟。
示例:“使用順序編號、不透明、密封的信封(包含試驗前準備的治療分配卡)實現分配隱藏”。
解釋:分配隱藏確保患者和研究者對治療分配的不可預測性,并且是持續有效的,這與盲法不同,盲法通常很難在牙科試驗中實施[30]。分配隱藏的方法可以包括使用順序編號的密封不透明信封或外面資源中心協助分配設置。分配隱藏的最佳方法是使用獨立的中央隨機分配方案。中央隨機的好處在于:研究使用的隨機化分配表被安全地保存在距離研究實施地點較遠的位置,減少了隨機化分配方案泄密的可能。
1.3.6.3 實施
CONSORT 條目 10:誰產生隨機分配序列,誰招募受試者,誰給受試者分配干預措施。
示例:“在打開信封之前,基線信息已記錄在外面。執行人員負責按順序打開下一個信封并執行隨機化過程”。
解釋:隨機化的實施過程中包括人員、時間、地點以及隨機程序(生成隨機化列表,分配隱藏和治療分配)。在小型臨床研究中,可能由同一位研究人員執行所有任務。但是,最好讓不同的研究者來執行單獨的隨機程序,因為這樣會減少該過程產生偏倚的機會。
缺乏適當的隨機化和分配隱藏可能會引入偏倚,從而使研究結果受到質疑[30]。在各種研究設計中,RCT 被認為是提供最高質量臨床證據的試驗方法。然而,在包括牙科在內的生物醫學文獻中,有充分的證據表明,已發表研究的隨機化和 RCT 質量總體上不達標,且通常錯誤地給臨床試驗貼上 RCTs 的標簽[5,31]。因此,需要對隨機化所有要素進行清晰描述,以使具備專業知識的讀者能夠評估試驗方法的嚴謹性。
1.3.7 盲法
CONSORT 條目 11a:如果實施了盲法,分配干預措施之后對誰設盲(例如受試者、醫護提供者、結局評估者),以及盲法是如何實施的。
示例:“無法對患者或施術者實行盲法”。
解釋:作者應描述對誰設盲(患者,研究人員,結局指標評估者或數據分析員)。差異性隨訪(實施偏倚),結果記錄(測量偏倚),隨訪脫落(失訪偏倚)以及與缺乏盲法相關的數據分析可能會使試驗結果產生偏倚[32]。有關盲法的描述千差萬別,令人困惑;因此,鼓勵提供清晰的盲法解釋,而不是使用“單盲”或“雙盲”之類的術語[33]。提供具體信息可使讀者更好地評估潛在偏倚風險。如果有多個結局,則每個結局都必須有清晰地盲法描述。
CONSORT 條目 11b:如有必要,描述干預措施的相似之處。
示例:“不可能對患者或施術者實現盲法;但是,對結局評估者實行了盲法,因為無法區分光固化法和化學固化法”。
解釋:作者應清楚地報告(如果適用)實行盲法的干預措施之間的任何相似之處以利于盲法的實施。在牙科方面,干預措施通常差異很大。但是,甚至在干預措施完全不同的情況下,如該結局評估者沒參與試驗過程,對結局評估者施盲是可行的。不建議對盲法的有效性進行測試,因為測試結果可能反映了對干預效果的準確估算[34]。需要報告已知的盲法折中實施情況,例如試驗中任何受試者在任何時點的破盲。
1.3.8 統計方法
CONSORT 條目 12a:用于比較各組主要和次要結局指標的統計學方法。
示例:“使用統計方法對兩種技術粘合的舌側固定器的維持時間進行了比較,以進行維持率分析。使用了秩和檢驗,并繪制了 Kaplan-Meier 圖。使用 Cox 回歸模型計算危險比(hazard ratios,HRs)和相關的 95%可信區間(confidence intervals,CIs)。Nelson-Aalen 圖用于評估比例風險假設”。
解釋:提供已實施統計分析的詳細描述。
原則是提供“足夠的詳細信息,以使具備專業知識的讀者可以訪問原始數據以驗證報告的結果”(www.icmje.org)[1,35]。同樣重要的是描述每個統計分析中包括的人員詳細信息,而不是依賴模糊的標簽,如意向性治療(intent-to-treat,ITT)分析等[36]。此外,應提供對任何缺失數據處理的清晰描述,并闡明分析是否遵循符合方案集分析(per-protocol principle,PP)或 ITT 分析原則[36,37]。ITT 分析是指對所有受試者均根據最初預設分配給他們的干預措施進行分析,而不管他們是否接受了該干預措施。ITT 在有效性評估中(尤其是在實用性臨床試驗中)受到青睞,因為它們反映了在實踐中進行干預時很可能會發生的依從性問題和治療變更,以及由于將受試者排除在分析范圍之外而導致的隨訪偏倚風險。ITT 分析要求即使受試者沒有完全遵守該方案,也要將其包括在內。ITT 的一個重要問題是受試者的缺失數據。
有關 ITT 分析的術語易令人困惑,并且通常由不同作者以不同方式解釋。因此,清楚地描述數據分析的機制比簡單提及“ITT”或“符合方案分析”或其他替代提法(如已接受治療的、可獲得的、連續的患者)更可取。如果缺少數據,則應對任何合理情形下的歸因分析、敏感性分析進行報告和結果對比[36,37]。
示例中的 RCT 報告,除在統計方法支持下評估了研究假設,還清楚地概述了用于數據分析的具體方法。此外,對缺失數據的處理和敏感性分析也進行了討論,對粘合劑的粘著殘余指數進行了二次分析,但沒有進行亞組分析。
標準分析方法假定數據是“獨立的”。對于 RCTs 而言,這通常意味著每個受試者只有 1 個觀察值。將來自單個受試者的多個觀察結果視為獨立數據是一個嚴重的錯誤;比如在牙科的臨床試驗中,當可以在身體的不同部位測量結局指標時,就會產生此類數據。數據分析應該基于對每個受試者進行的單次計數,或者應該用適用于非獨立數據的更復雜的統計程序完成分析[13]。經驗表明:對統計方法描述不明確,非獨立的觀察結果(如患者嵌套的托槽脫落)常常被不當地視為獨立的觀察結果[38,39]。
CONSORT 條目 12b:附加分析的方法,諸如亞組分析和校正分析。
示例:“缺失數據通過使用干預措施的類型,性別和年齡等變量來彌補的。填補是在假設隨機缺失的情況下進行的:也就是說,假設在給定的干預措施類型、性別和年齡下,不管我們是否能夠觀察到,結果指標的分布是相同的。使用適用于 Cox 回歸的“-mi-”系列命令來實現填補。使用 Fisher 精確檢驗比較了復合材料之間的粘合劑殘留指數得分”。
解釋:隨著統計檢驗次數的增加,出現假陽性結果的可能性也會增加,意識到這一點十分重要[21]。盡管不鼓勵進行多個亞組分析,但它們在牙科試驗中很常見[40],并可能導致選擇性報告陽性結果和對結果的錯誤解釋[20]。作者應限制亞組分析的數量,并應明確指出這些分析是預先指定的還是事后的或探索性的。
1.4 結果
1.4.1 受試者流程
CONSORT 條目 13a:隨機分配到各組的受試者例數,接受已分配治療的例數,以及納入主要結局分析的例數。
示例:“圖 1 是 CONSORT 流程圖示例,顯示了患者通過試驗的流程”。

解釋:流程圖是一種快速的視覺輔助工具,可顯示受試者在試驗不同階段的流程。隨訪期間的任何脫落,均衡的或不均衡的,以及合格受試者數量,隨機分組和患者統計分析都很容易觀察到。
CONSORT 條目 13b:隨機分組后,各組脫落和被剔除的例數,并說明原因。
示例:“220 例患者(中位年齡 16 歲;四分位間距 2 歲;范圍 12~47 歲)以 1∶1 的比例隨機分配到化學粘合劑治療組或光固化治療組;16 例患者在隨訪中脫落(圖 1 和圖 2)。研究于 2009 年 4 月開始招募患者,并于 2010 年 11 月結束”。

解釋:作者應明確報告隨機化后的脫落和排除,并說明原因。這樣就可以評估排除的合理性[41]。此外,還可以計算出樣本量減少導致的檢驗效能損失。
示例中的 RCT 包括一個流程圖,其中包含與受試流程和隨訪脫落有關的特定信息。
CONSORT 條目 14a:招募期和隨訪時間的長短,并說明具體日期。
示例:“招募患者從 2009 年 4 月開始,到 2010 年 11 月結束”。
解釋:報告受試者招募的時間和持續時間提供了歷史背景,可能對未來的研究者有價值。在某些試驗中,特別是在評估結局發生時間的研究中,并非所有受試者的隨訪時間都是固定的;相反,隨訪可以在預先指定的時間點結束,也可能在觀察到固定數量的結局事件時結束。
CONSORT 條目 14b:為什么試驗中斷或停止。
解釋:按計劃完成的試驗結果比過早結束的試驗結果更值得信任,特別是在根據數據做出決定的情況下。作者應明確指出試驗是否提前結束,包括有關提前終止時間和原因的信息。
示例中的這項研究并未提前終止,并且包含了招募和隨訪的細節。
1.4.2 基線數據
CONSORT 條目 15:用一張表格列出每一組受試者的基線數據,包括人口學資料和臨床特征。
示例:“表中報告了各治療組患者的基線特征”(圖 2 是基線特征表報告示例)。
解釋:如果隨機化已正確進行,則各治療組的基線特征應相似。收集的所有受試者的基線數據可能包括人口統計學變量(即年齡、性別和種族)和臨床特征,包括錯位咬合的類型、牙列擁擠的基線測量值和口腔衛生狀況。基線數據應在隨機分配之前收集,以使數據收集不受對治療分配的了解的影響。例如,支持較新治療方法的研究者可能會不自覺地以有偏倚的方式記錄基線數據(如增加或減少擁擠的數量),并以某種方式證明對新治療方法有先入之見。
表格中顯示的基線數據可以快速評估各組受試者之間的相似性。組間基線特征的微小差異是隨機的,特別是在小型試驗中。各組受試者之間基線的重大差異可能與隨機分配不當有關。
對于連續變量,例如磨牙間寬度或牙根長度,應包括均值(標準差)或中位數(四分位間距)。不應使用標準誤和可信區間來報告變異性,因為它們是推斷性的,而不是描述性的。不應將具有少量有序分類的變量視為連續變量;相反,應報告每個類別的數量和比例[1]。不建議進行旨在評估各組之間基線特征平衡的統計測試,這可能會產生誤導[42]。明智的做法是,基線比較時應考慮所測變量的預測強度,以及任何隨機誤差的大小[42]。
1.4.3 納入分析的例數
CONSORT 條目 16:各組納入每一種分析的受試者數目(分母),以及是否按最初的分組分析。
示例:“最后 1 例患者入院兩年后,用化學固化膠粘劑的 110 個光固化固定器中有 47 個(42.7%)和 110 個固定器中有 55 個(50.0%)失敗了。初步分析是在意向性分析的基礎上進行的,涉及所有在估算缺失數據后被隨機分組的患者”(圖 3 是一個示例表,報告了失效例數和隨訪時間)。

解釋:應明確所有分析中的每組受試者人數。對于二分類變量統計量(即風險比和風險差),也應該報告計算之前的分母或事件發生率。將結果表示為分數有助于讀者評估一些隨機分配的受試者是否被排除在分析之外。因此,結果不應僅僅作為諸如相對風險之類的簡要度量來呈現。
1.4.4 結局和估算
CONSORT 條目 17a:各組每一項主要和次要結局指標的結果,效應估計值及其精確性(如 95% 可信區間)。
示例:“根據估算數據得出的危險比[HR=1.15,95%CI(0.88,1.70),P=0.47]。沒有證據表明年齡可能是舌側固定器失效的重要預測指標[HR=0.96,95%CI(0.93,1.00),P=0.08]。填補數據分析得出兩者的 HR 相似;未填補數據假設刪除了所有缺失值。在 102 例(64.7%)的失效受試者中,只有 66 例(64.7%)測量了粘著殘余指數評分,且復合材料之間沒有差異(Fisher精確檢驗,P=0.16);大多數已確認的失效都發生在釉質黏附層”(圖 4 是一個示例表,報告了來自 Cox 回歸的危險比)。

解釋:對于主要結局指標,作者應為每組結局指標做總結式報告(如發生或未發生事件的受試者數量,或測量的平均值和標準差),再加上組間的對比,也就是效應大小。對于二分類變量,效應大小可以是相對風險、相對風險降低率、比值比或風險差異。對于生存時間數據,可以用危險比或中位生存時間差來度量。對于連續數據,效果度量通常是平均值的差異。作者應該提供組間對比的可信區間,并作為估計效果的精度(不確定性)的度量。從結果中獲得的臨床相關性更強、更重要的信息是實際差異或效應大小及其不確定性。P值雖然在統計學上有顯著意義,但對提供臨床相關性的認識作用有限。報告可信區間將結果的解釋從重要或不重要的二分法轉移到效應的大小或相關性,以及研究數據給出的合理值范圍[1]。對于配對對照設計(如左右側對照),應提供患者間的相關系數,以指導今后的樣本量計算[12]。同樣,對于具有整群效應的設計,應提供群組內相關系數或變異系數(k)[13, 43]。
CONSORT 條目 17b:對于二分類結局,建議同時提供相對效應值和絕對效應值。
示例:“最后 1 例患者入院兩年后,用化學固化膠粘劑的 110 個光固化固定器中有 47 個(42.7%)和 110 個固定器中有 55 個(50.0%)失敗了(風險差異:7.3%,95%CI:5.9%,20.5%)”。
解釋:對于二分類數據,最好同時提供絕對風險和相對風險,因為孤立地解釋二者會產生誤導[44]。例如,絕對風險是兩風險之差(4%?2%=2%),相對風險是兩風險之比(4%/2%=2)。然而,風險之間較大的絕對差異(40%?20%=20%)可能在比率量表中呈現相同的差別(風險比,40%/20%=2);但是,基于絕對差異(2%vs. 20%)的解釋可能會完全不同。相對比例的效應估計(如風險比和比值比)在整個人群中比風險差異(比例差異)更具普遍性,因為后者取決于對照組的基線風險,而基線風險隨人群而變化。
示例中的研究在填補缺失數據后,根據 ITT 原則對患者進行了分析。提供了主要比較的估計危險比和絕對風險差異以及相關的 95%可信區間。對于次要結局(粘著殘余指數),僅提供了納入分析的例數和P值,因為只有 66%的失效例數進行了該結局指標的測量。
1.4.5 輔助分析
CONSORT 條目 18:所做的其他分析的結果,包括亞組分析和校正分析,指出哪些是預先設定的分析,哪些是新嘗試的分析。
示例:“在 102 例(64.7%)的失效病例中,只有 66 例(64.7%)有可能出現粘著殘余指數評分,且復合材料之間沒有差異(Fisher 精確檢驗,P=0.16);大多數已確認的失效都發生在釉質粘附層”。
解釋:臨床試驗的受試者在人口統計學或臨床基線特征方面存在差異,可能影響對干預措施的治療反映。可以進行亞組分析,以確定治療效果是否因于各組患者的基線特征而異,如相同性別、年齡、社會經濟地位、口腔衛生以及與矯正治療的依從性等。隨著統計分析數量的增加,觀察到某些假陽性結果(多重性問題)的可能性也會增加[21]。亞組比較結果的報告可能會被人為操控,過分強調陽性結果會產生對治療效果的錯誤印象。理想情況下,應該預先指定亞組分析的方法[20]。同樣,對基線變量的任何調整最好是預先計劃指定的;應當說明這些措施的實施是否是因為觀察到了基線的不平衡才增加的。
1.4.6 危害
CONSORT 條目 19:各組出現的所有嚴重危害或意外效果(具體的指導建議參見“CONSORT for harms”)。
示例:“除了與牙菌斑積聚相關的牙齦炎外,未觀察到嚴重危害”。
解釋:在評估支持或不支持某項干預措施有效性的證據時,利益和危害之間的平衡是一個重要的考慮因素。因此,應提供評估的治療組危害及其發生頻率的清晰描述。可參見關于 RCTs 中報告危害的 CONSORT 聲明擴展[22];在本案例的試驗中,除與牙菌斑積聚有關的牙齦炎外,沒有其他危害。
1.5 討論
1.5.1 局限性
CONSORT 條目 20:試驗的局限性,報告潛在偏倚和不精確的原因,以及出現多種分析結果的原因(如果有這種情況的話)。
示例:“我們的研究局限性在于不可能對所有患者進行失效性檢查,尤其是在研究即將結束時”。
解釋:在討論部分中,應提及試驗的局限性,尤其是潛在的偏倚來源,包括測量偏倚和失訪偏倚。應當參照報告的可信區間討論觀察到的效應計算的不精確度;應將重點放在臨床意義上,而不是在P值和統計學意義上[37,44,45]。
同樣,應更多地注意對主要的、預先規定的結局指標的分析;應謹慎解釋亞組分析和多次測量后的結果[45,46]。
1.5.2 可推廣性
CONSORT 條目 21:試驗結果被推廣的可能性(外部可靠性,實用性)。
示例:“這些結果的普遍性可能受到限制,因為這項研究是由一位在化學固化粘合法和光固化粘合法方面都有經驗的臨床醫生(N.P.)在一個中心進行的”。
解釋:只要試驗的納入和排除標準相似,且在一致的生物學反應假設下將試驗結果適用于其他環境和人群通常是可行的[15,47]。例如,美國的一項 RCT 評估了僅在成人受試者使用的自酸蝕處理劑或傳統酸蝕法粘結的托槽失效,其結果適用于英國成人嗎?也許是的。同樣的結果適用于青少年嗎?成人和青少年之間的依從性差異可能會影響結果;因此,在評估外部效度時應考慮與年齡有關的差異。
外部效度依存于內部效度。因此,如果由于偏倚的方法導致試驗結果無效,那么外部效度問題就無從談起了。外部效度取決于受試者的背景和特征、干預措施和試驗結果,因為它們由納入和排除標準決定。
1.5.3 解釋
CONSORT 條目 22:與結果相對應的解釋,權衡試驗結果的利弊,并且考慮其他相關證據。
示例:“盡管注意到固定器失效率沒有顯著差異,但記錄的失效數量相當可觀,在脫膠后的兩年內從 43%到 50%不等。這種多數失效的情況與最近的一項前瞻性研究相符”。
“我們相對較高的失效率可能與前瞻性設計和相對冗長的隨訪有關。同樣,任何損壞都被記錄下來;因此,即使是造成輕微后果的小裂縫(甚至在其它回顧性研究中可能被忽略)也已作為失效記錄在該研究中”。
解釋:討論應該把證據作為一個整體來考慮,最好是在系統評價的背景下,而不是僅僅關注當前的試驗或特定的研究,也許是那些研究正好證實了本試驗結果的研究。
本例示范試驗在現有證據的背景下討論了結果,強調了研究的局限性以及延長隨訪時間的復雜性,并對結果的可推廣性發表了評論,因為這種治療僅限于 1 名經驗豐富的操作者。
1.6 其他信息
1.6.1 注冊
CONSORT 條目 23:臨床試驗注冊號和注冊機構名稱。
示例:“該試驗未注冊”。
解釋:為了最大程度地減少數據的不發表和保留、選擇性報道以及重復出版的可能性,國際醫學雜志編輯委員會要求試驗必須進行注冊才能出版。
這一立場導致注冊的試驗數量急劇增加。在報告試驗摘要時,作者應提供試驗注冊號碼和試驗注冊名稱的詳細信息[48]。這使讀者能夠獲得有關試驗及其結果的更多信息。注冊信息還有助于將報告與后續的完整出版物(或同一試驗的多個報告)鏈接起來,從而降低了系統評價中無意識重復計算的風險。
未注冊的試驗仍可在 AJO-DO 中發表;這使得未注冊的正在進行的試驗有機會被發表。目前,臨床試驗未注冊,其試驗結果也可被刊登。關鍵在于臨床試驗注冊是否透明。但是,這種情況將來可能會改變。因此,強烈建議研究人員從一開始就注冊臨床試驗(例如,通過北美平臺 ClinicalTrials.gov 進行注冊)[49]。
1.6.2 方案
CONSORT 條目 24:如果有的話,在哪里可以獲取完整的試驗方案。
示例:“該臨床試驗方案未在試驗開始前發表”。
解釋:預發表臨床試驗方案很重要,因為它提供了試驗的所有計劃細節。將方案置于公共視野,允許對預期和實際完成進行比較,因此不鼓勵只對陽性的結果進行選擇性報告[20]。方案的發表還向科學界通報了計劃中的和正在進行的試驗,并為研究人員和系統評價作者提供了更好的交流和更高的效率。SPIRIT 指南詳細描述了起草 RCT 研究方案的要求[50]。
理想情況下,應該明確臨床試驗方案是否可以獲得以及在何處可以獲得。透明度至關重要;CONSORT 聲明專注于準確地報告在研究期間所做的事情,而不是對此進行判斷。
1.6.3 資助
CONSORT 條目 25:資助和其他支持(如提供藥品)的來源,提供資助者所起的作用。
示例:“聲明沒有資助或利益沖突”。
資助和其他形式的支持應明確聲明。研究表明,與其他來源資助的研究相比,由制藥業贊助的試驗具有使結果偏向贊助者的比率更高[51]。通常,資助來源在摘要的末尾或文章“致謝”部分進行報告。
2 摘要
在本說明性文章的最后一節中,我們將按照 CONSORT 的摘要指南,介紹如何報告隨機對照試驗的摘要[3]。這些條目已在上文進行了描述;然而,由于牙科矯正摘要通常報道不完整,因此有必要簡短描述[6]。
表 2 中列出了摘要中需包含內容的清單。要點如下。
① 清楚闡釋試驗設計的一個重要原因是要確保在電子數據庫中建立適當的索引,以使試驗更被容易識別。例如:“雙臂平行試驗”。
② 清晰描述受試者及試驗環境,以便讀者評估試驗的外部效度(推廣性)并確定其對自身環境的適用性。示例:“納入標準包括下頜前牙沒有活動性齲齒,修復或斷裂,以及足夠的口腔衛生”。
③ 應描述每個試驗組和對照組干預措施的基本特征。示例:“在私人矯正診所接受過矯正治療的患者被隨機分配應用化學固化復合材料或光固化復合材料固定器”。
④ 摘要應清楚描述試驗中涉及的特定目標或研究假設。示例:“該試驗的目的是比較在矯正治療后用化學固化或光固化粘合劑粘結的舌側固定器的維持率”。
⑤ 作者應明確說明試驗的主要結果以及何時進行評估(如評估結果的時間范圍)。例如:主要結局指標是任何類型的第一次舌側固定器損壞;失效的情況種類(粘著殘余指數評分)是次要結局指標。患者分別在 1、3、6 個月和放置固定器后每 6 個月復查一次,直到研究結束。
⑥ 重要的是詳細介紹隨機序列生成方法,隨機化方法和實施的限制,以及從受試者分配到干預組中隱藏分配序列的細節。分配隱藏可以防止研究人員影響受試者分配到干預措施組的選擇(即選擇偏倚)。示例:“隨機分組是對 20 位患者進行隨機區組排列完成的,其分配隱藏在順序編號、不透明的、密封的信封中”。
⑦ 作者應說明受試者,干預措施的實施者(通常是衛生保健提供者)和評估結果的人員(數據收集者和分析人員)是否對分組方案知情。示例:“盲法僅適用于結果評估”。
⑧ 應明確隨機分配到每個干預措施組的受試者人數,因為這是試驗結果的重要組成部分。該數字規定了樣本量,讀者可以使用它來評估最終分析中是否包括所有被隨機分配的參與者。示例:“220 例患者(中位年齡 16 歲,四分位間距 2 歲,范圍 12~47 歲)以 1∶1 的比例隨機分配到化學粘合劑組或光固化粘合劑組”。
⑨ 對于主要結局指標,作者應將每組結局指標做總結式報告(如發生或未發生事件的受試者數量,或測量的均數和標準差),再加上組間的對比,也就是效應大小。對于二分類結局,效應大小可以是相對風險、相對風險降低率、比值比或風險差。對于生存時間數據,可以用危險比或中位生存時間差來度量。對于連續數據,效果度量通常是平均值的差異。作者應該提供組間對比的可信區間,并作為估計效果的精度(不確定性)的度量。示例:“在至少兩年的隨訪中,用化學固化膠粘劑的 110 個固定器中的 47 個(42.7%)和 110 個光固化固定器中有 55 個(50.0%)發生了某種類型的失效(對數秩檢驗,P=0.35)。在意向治療分析的基礎上分析數據,危險比(HR)為 1.15[95%CI(0.88,1.70),P=0.47]。沒有證據表明年齡可能是舌側固定器失效的重要預測指標[HR=0.96,95%CI(0.93,1.00),P=0.08]。在 102 例(64.7%)的失效中,只有 66 例(64.7%)進行了粘著殘余指數評分,且復合材料之間沒有差異(Fisher 精確檢驗,P=0.16)”。
⑩ 要做出權衡的決定,讀者需要有關干預措施利益與危害相關的信息。摘要中應提及干預措施的重要危害(或意想不到的影響)。如果沒有發生重大不良事件,作者應明確說明。示例:“除了與牙菌斑積聚相關的牙齦炎外,未觀察到嚴重危害”。
? 試驗結論應與摘要中報告的結果一致,并應明確說明其臨床應用(避免泛化)。在適用的情況下,作者還應注意,將結果用于臨床前是否需要進行其他研究。示例:“這項研究的結果表明,沒有證據表明應用化學和光固化膠粘劑的下頜舌側固定器的維持率存在差異。總體失效率為 46.4%;然而,這包括任何類型的失效,可能夸大整體失效率”。
? 盡管不是 CONSORT 聲明條目,但應記錄試驗注冊和臨床試驗方案的詳細信息,以及說明資助來源。例如:“該試驗未注冊”,“在試驗開始前未發表該方案”或“聲明無資助或利益沖突”。
3 結論
在做出臨床決策時,循證牙科方法將現有最佳證據、臨床專業知識以及患者的偏好和價值觀融合在一起。高質量的隨機對照試驗是系統評價的基礎,應置于循證決策的最前沿。完整透明的試驗報告有助于準確評估研究質量和正確解釋結果。此外,通過明確的報告,可以更快速地確定適合納入系統評價的研究、評估初步研究結果以及提取數據。經驗表明,醫學和牙科領域的 RCTs 報告質量仍然不是最理想的,并且受到未發表、不完整、選擇性和誤導性報告的不良影響。CONSORT 指南為這些問題提供了有影響力的重要解決方案,在報告矯正臨床試驗時應遵循該指南,而且,這一指南還可以指導試驗的設計和實施。
參考文獻
見原文。
隨機對照試驗(randomized controlled trials,RCTs)是循證醫學的重要研究方法。隨機對照試驗報告的讀者必須能夠準確理解試驗是如何進行的,以評估研究結果的相關性和方法學的嚴謹性。研究報告有兩個關鍵原則:一是依據報告提供的信息可以重復試驗,二是方法和結果應得到足夠詳細地描述,以便納入系統評價[1]。
CONSORT 聲明是為了幫助改善隨機對照試驗的報告質量,為準備報告臨床試驗的研究人員提供指導。CONSORT 清單由 25 個條目組成,涵蓋臨床試驗的所有關鍵要素,為如何報告此類研究的設計、實施、分析和解釋設定了標準[2]。CONSORT 指南的一些擴展版涵蓋了更復雜的試驗設計,如整群隨機試驗和非劣效試驗;其最新信息可在 CONSORT 網站上獲得(http://www.consort-statement.org/extensions)。超過 600 家生物醫學期刊,包括 2004 年的《美國矯形和口腔矯正雜志》(American Journal of Orthodontics and Dentofacial Orthopedics,AJO-DO)已采用了 CONSORT 聲明,同時許多期刊也采納了關于報告摘要的 CONSORT 規范。盡管這些建議被廣泛接受,但臨床試驗的報告質量仍有相當大的改善空間[4-8]。
AJO-DO 認識到,采納 CONSORT 聲明并不意味著能確保遵守。在 2011 年實施了一項計劃,旨在改善對 CONSORT 的依從性,從而提高 AJO-DO 雜志對隨機對照試驗的報告質量。該計劃包括視頻、CONSORT 網站鏈接,以及為提交有關遵從 CONSORT 規范 RCTs 報告的作者的積極指導。最近,AJO-DO 對 RCTs 的報告重新規定了格式,引入了副標題,以促進完整的報告,進而能夠更有效地在系統評價過程中提取相關臨床數據。
自從 AJO-DO 引入這些改變以來,其發表的 RCTs 在報告質量方面已有了很大改善;這些改善反映了編輯、審稿人和作者之間的成功互動[9]。在 2011 年至 2013 年期間提交的所有已發表試驗中,報告了 37 個 CONSORT 條目及其子條目中的 33 個。但 CONSORT 清單中涉及方法變更(3b)、試驗開始后的結局指標變更(6b)、中期分析(7b)和試驗終止(14b)的條目仍沒有充分地報告。故仍有必要加強作者首次提交的試驗報告質量,從而大大節省為提高對 CONSORT 報告規范依從性的編輯工作。本文旨在解釋 AJO-DO 對 RCTs 試驗報告提交的要求,并描述和說明 CONSORT 清單中每個條目的重要性,以及它與牙科矯正臨床試驗的相關性。本文的基礎是報告兩組平行隨機對照試驗的 CONSORT 2010 解釋與說明文件[2]。一個遵從 CONSORT 報告規范的已發表 RCT 已上傳到 AJO-DO 網站(注釋隨機對照試驗樣本文章),并將作為解釋示例。
1 清單條目及其重要性的說明
以下解釋以 CONSORT 聲明解釋與說明文件為基礎,并進行了適當調整,以更好地針對 AJO-DO 的讀者(表 1)[2]。

1.1 標題和摘要
CONSORT 條目 1a:文題能識別是隨機臨床試驗。
示例:“化學聚合(I)或光聚合(C)法對矯正患者(P)固定器的 2 年內維持度(O)對比研究;單中心隨機對照臨床試驗”。
解釋:為了幫助確保研究被適當索引和容易識別,作者應該在標題中使用“隨機”一詞,以表明參與者被隨機分配到治療組與對照組[10]。鼓勵作者(此處不屬于 CONSORT 的要求)以“ PICO+”格式組織標題,提供關于參與者、干預措施、對照和結局的信息。“+”表示可能包含與盲法、中心數、時間等相關的附加信息。
CONSORT 條目 1b:結構式摘要,包括試驗設計、方法、結果、結論幾個部分(具體的指導建議參見“CONSORT for abstracts”)。
解釋:RCT 摘要的報告有具體的指導(表 2)。文筆流暢、詳細且清楚地描述試驗的摘要有助于對一篇文章的初步評估,便于從數據庫中檢索試驗以納入系統評價中。摘要是許多臨床醫生閱讀文章的唯一要素,因此其準確性和質量至關重要。鑒于幾乎所有與摘要有關的信息都將在主要 CONSORT 規范條目項下詳細討論,本文將在結尾部分介紹摘要條目的報告。

1.2 引言
引言部分包括背景和目的。
1.2.1 背景和目的
CONSORT 條目 2a:科學背景和對試驗理由的解釋。
示例:“粘合失敗仍然是一個嚴重的問題,失敗率估計為 6%~25%,這取決于放置技術和觀察周期。盡管光固化材料提供了更長的有效時間并改善了對濕度的控制,但尚未有研究這些理論性優勢重要性的隨機對照試驗發表”。
解釋:在試驗設計階段的良好習慣首先是檢索文獻以識別有關感興趣主題的可獲得證據。所檢索到的資料可能有限,也可能很多;如果可能,最好能夠找到高質量的系統評價。近期的高質量系統評價總結了現有的臨床證據,可作為已知和未知的有關感興趣干預措施有效性和安全性證據的參考。赫爾辛基宣言認為:在沒有充分了解現有文獻的情況下進行人體研究是不道德的,設計一項試驗來回答已經被回答過的問題也是不道德的,只有現有證據不確定當前干預措施有效性時,這項試驗研究才是恰當的[11]。
在本文的 RCT 范例中,雖然未引用系統評價結果,但作者明確指出,尚未有任何已發表的 RCT 探討光固化法對照化學固化法的優劣。
CONSORT 條目 2b:具體目的和假設。
示例:“在這項研究中,我們旨在比較在矯正治療后使用化學聚合或光聚合作用固定的下頜舌側固定器的維持率”。
解釋:試驗的目標旨在設計試驗解決問題,它們通常與特定治療或預防性干預措施的效應有關。研究假設是預先確定的,通過試驗檢驗以達到試驗目標。研究假設比研究目標更為具體,并且可以進行明確的統計評估。實際上,研究目標和研究假說常常不易分辨。
1.3 方法
1.3.1 試驗設計
CONSORT 條目 3a:描述試驗設計(諸如平行設計、析因設計),包括受試者分配入各組的比例。
示例:“這是分配比例為 1∶1 的平行、隨機、陽性對照試驗”。
解釋:最常見的試驗設計類型是平行設計;但是,還應注意交叉試驗設計、整群隨機化設計、非劣效性檢驗、析因設計及混合設計等類型的臨床設計。牙科中常用的研究設計有左右側對照設計[12],有的研究還包括整群設計要素。當從每個患者的多個部位和組織中收集到多個觀察結果(如牙齒、牙周部位或組織的數量)時,這種設計就會被應用[13]。不同試驗設計的試驗實施和分析的特征不同。因此,應詳細說明這些試驗設計的細節。提供特定細節(設計和分配比例)是十分重要的,如本條目示例所示。
CONSORT 條目 3b:試驗開始后對試驗方法所作的重要改變(如合格受試者的挑選標準),并說明原因。
示例:“開始試驗后,沒有對方法進行更改”。
解釋:研究方案和實際執行方式之間的差異是很常見的,應恰當記錄在案。設計發生變化(例如,納入與排除標準或隨訪時間)的可能原因很多,包括新的外部證據\無法招募足夠多的患者以及財務拮據等。對于某些“適應性”試驗,如果在研究開始前未確定試驗的樣本量和研究的周期,研究方案允許遵循預定的規則進行有限的更改。研究方案應列出在不同情況下預設的方案調整,并且應在發表的文章中對這些變更予以記錄、解釋和說明[14]。對試驗設計的任何變更均應完整報告,以幫助讀者理解其結果,無論這種變更是方案中預知的還是因不斷變化的情況導致的。
在試驗開始后,示例的這項 RCT 報告未發生。但是沒有發表的試驗方案可以驗證這一說法,在摘要的末尾也被提及到。
1.3.2 受試者
CONSORT 條目 4a:受試者合格標準。
示例:“采用了以下選擇標準:下頜前牙沒有活動性齲齒、修復體或骨折;沒有牙周疾病;足夠的口腔衛生”。
解釋:應明確概述受試者和環境的合格標準以及相關信息,因為它們會影響試驗結果與其它環境的相關性(適用性)。由于合格標準在隨機分配之前應用,因此它們不會影響試驗的內部效度(方法學質量)[15]。將納入標準和排除標準進行區分不是必需的;可以用相同的標準對納入或排除的受試者進行表述[16]。
CONSORT 條目 4b:資料收集的場所和地點。
示例:“自 2009 年 4 月至 2010 年 11 月,第一作者(N.P.)在私人診所連續招募了使用固定矯治器完成矯正治療的患者”。
解釋:清楚地描述收集數據的環境和場所對于讀者判斷研究結果是否與自己的環境有關很重要。還應明確說明地理位置、參與中心數量、可用設施、相關護理提供者及其專業水平的信息。例如,在擁有最先進設施、訓練有素的人員的中心和由設備簡陋的診所中新手進行的研究之間,試驗結果可能會有很大的不同[15]。
1.3.3 干預措施
CONSORT 條目 5:詳細描述各組干預措施的細節以使他人能夠重復,包括它們實際上是在何時、如何實施的。
示例:“所有患者均接受在口內制備的 0.022 英寸軟質舌側固定器(Tru-Chrome 多股弓絲;Rocky Mountain 矯正,丹佛市,科羅拉多州)”。“在化學聚合治療組中,將 Maximum Cure 二件式液體粘合劑(Reliance 矯正產品,伊塔斯卡市,伊利諾伊州)混合并應用于弓絲和牙齒上,Excel 二件式糊劑(Reliance 矯正產品)混合,用注射器施用。在光聚合治療組中,將光固化液體(Assure;Reliance 矯正產品)和兩層糊劑(Flow-Tain;Reliance 矯正產品)放在弓絲和相鄰的牙釉質上,每顆牙使用等離子燈(Ortholite;3M Unitek,蒙羅維亞,加利福尼亞)進行 9 秒光固化”。
解釋:應提供每種干預措施足夠詳細的清晰描述,以使有經驗的研究人員能夠重復該試驗[17]。例如,在一項多中心試驗中,至少應概述給藥的確切方法、持續時間和治療時機[18]。藥物干預需要解釋給藥方式、劑量和頻率,以及無論對照或安慰劑在形狀、顏色、氣味和味道方面與“有效藥物”都沒有區別。對于其他類型的干預措施,CONSORT 用于非藥物試驗的擴展描述了報告要求[19]。干預措施的標準化、干預措施各個組成部分的描述以及如何評估研究者依從性都十分重要。清晰描述將進一步促進將有效比較和決策納入系統評價[17]。
1.3.4 結局指標
CONSORT 條目 6a:完整而確切地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的。
示例:“主要結局指標是舌側固定器首次失效。次要結局是根據殘留膠粘劑判斷失效種類。患者被建議在放置固定器后的 1、3、6 個月開始去看牙科矯正醫生,然后在 12、18、24 個月安排隨訪。當預定的預約不可行時,特別是在試驗快結束時,可通過電話對固定器的完整性進行評估”。
解釋:試驗通常有幾種結局指標,一般分為主要結局指標和次要結局指標。應該明確定義和預先規定所有結局指標,并明確說明如何以及何時進行評估。每個結局指標的定義應足夠清晰,以允許其他研究者在試驗中使用相同的結局指標,或者明確知悉相關結局指標與系統評價中的相關結局指標的異同性。明確預先指定的結局指標,尤其是主要結局指標非常重要,因為與試驗注冊和方案預發表一樣,它減輕了選擇性報告“感興趣的”結局指標的問題,這種可能性在有研究中包含多個結局指標或多個時間點的數據收集時更大[20]。此外,多個結局指標記錄及隨之而來的多重測試,會引發與多重性和誤導性解釋相關的系列問題[21]。
在評估支持或不支持某項干預措施有效性的證據時,有效性和安全性之間的平衡是一個重要的考慮因素。應清晰描述所記錄的傷害[22]。在非藥學試驗中,明確結局指標評估的具體方法和開展結局指標評估的人數尤為重要。
CONSORT 條目 6b:試驗開始后對結局指標是否有任何更改,并說明原因。
示例:“試驗開始后結局指標沒有變化”。
解釋:已發表文獻的回顧研究表明,計劃與報告的結局指標之間存在差異[23]。最初計劃為原始試驗方案的主要結局指標可能被描述為次要結局指標,而在發表的文章中,可能會介紹新的主要結局指標。已有文獻報道選擇性報告研究結果和將“有意義”的結果報告出來的問題[20]。因此,對任何結局指標變更以及變更原因的清晰描述,將會提高臨床試驗的透明度。示例所述的 RCT 中,報告結局指標沒有變化;然而,也未在預先發表的臨床試驗方案中證實這一點。
1.3.5 樣本量
CONSORT 條目 7a:如何確定樣本量。
示例:“樣本量的計算是基于檢測兩個試驗組之間首次失效(主要結局指標)風險的臨床相關差異達到 20% 的能力(15% vs. 35%,α=0.05,檢驗效能為 85%)。Foek 等發現,光固化法舌側固定器的失效率是 35%。我們將此值用作樣本量計算的參考。計算結果表明,每個小組至少需要 93 例受試者,每組將樣本量增加到 110 例,以補充隨訪中可能的患者失訪”。
解釋:RCTs 應該具有足夠的檢驗效能來檢測試驗各組間在臨床結局上的重要差異(如果存在差異)或確認治療措施之間無差異。研究人員有義務根據臨床重要性和合理假設進行適當的樣本量計算。
作者應提供足夠的樣本量估算信息,使讀者可以重現樣本量的計算過程[24, 25]。應明確指出,樣本量的計算通常基于主要結局指標。對于連續型變量指標,作者應報告對照組的預期結局,干預組與對照組的預期差異、標準差以及檢驗水準和檢驗效能。對于二分類指標,除了標準差外,也需要相同的信息。在預期會產生群組效應的設計中,應提供群組內相關系數的值[26]。對于矯正臨床試驗中常見的左右側對照設計,應指明部位之間的假定相關性[12, 27]。最后,還應描述任何有關預期隨訪脫落的規定。理想情況下,作者應解釋樣本計算中使用的參數值的來源。
臨床研究一般不宜通過事后分析來證明之前的樣本量是否合理。但可以通過檢查效應量和可信區間以及其表現出的不確定性來判斷檢驗效能[28]。
CONSORT 條目 7b:必要時,解釋中期分析和試驗中止原則。
示例:“不適用”。
解釋:在延長期內招募和治療受試者。如果在試驗早期就出現了不同干預措施效果的明顯差異,則出于倫理原因,可能會提前終止臨床研究。可以通過中期檢查結果來解決這個問題,最好由獨立的數據監查委員會來解決。但是,在沒有進行適當更正的情況下執行多次統計檢查,可能會導致錯誤的結果和解釋[21]。作者應報告他們或數據監查委員會是否對數據進行了數次“檢查”;如果是,那么進行了幾次,是什么原因誘發他們這么做,使用了什么統計方法(包括任何試驗正式的停止規則),以及是否在試驗開始前,或在數據監查委員會通過分配看到任何臨時數據之前,又或在之后的某個時間進行的數據核查。
在示例研究報告中,未報告任何中期分析或終止的辦法。
1.3.6 隨機化
與其他前瞻性研究相比,隨機化是 RCTs 的主要優勢。臨床試驗方法學中的隨機化具有特殊含義,應該加以實施,以使研究者和受試者都無法預測下一個治療方案的分配。術語“交替分配”、“隨機指派”和基于某種確定性度量的分配—如出生日期或星期幾—并不被認為是完全隨機或足夠明確,盡管在牙科文獻中經常遇到[5,29]。這種不適當的分配方案不是真正的隨機化,而與偏倚的結果有關。隨機化過程要求治療分配是完全隨機的,并需要一種機制在實施治療之前隱藏其分配情況。
1.3.6.1 隨機序列產生
CONSORT 條目 8a:產生隨機分配序列的方法。
示例:“通過使用 Stata 軟件(StataCorp,CollegeStation,Tex)中的“-ralloc-”命令[20]完成隨機化”。
解釋:隨機數通常是由隨機表或能產生隨機序列的軟件生成的。作者必須清楚描述隨機數字表是如何生成的,以便讀者判斷該隨機方法是否合適。
CONSORT 條目 8b:隨機方法的類型,任何限定的細節(如怎樣分區組和各區組樣本多少)。
示例:“按長度為 20 例患者的區組,確保兩組均勻分布”。
解釋:牙科臨床研究中常使用簡單和區組隨機、分層隨機和最小化法等幾種方法[29]。簡單隨機就像擲硬幣一樣,盡管它是最安全的方法(因為它確實是隨機的),但是在小型試驗中,兩個治療組樣本量不一致的可能性很高。根據區組的長度,使用區組隨機可確保治療組接近平衡,而分層隨機化或最小化法可使治療組在重要結局指標方面保持平衡。
作者應清楚地描述隨機方法及應用的任何限制。使用區組時,也應指出區組長度以及其長度是固定的還是可變,因為這會影響后續分配的可預測性。
1.3.6.2 分配隱藏
CONSORT 條目 9:用于執行隨機分配序列的機制(例如按序編碼的封藏法),描述干預措施分配之前為隱藏序列號所采取的步驟。
示例:“使用順序編號、不透明、密封的信封(包含試驗前準備的治療分配卡)實現分配隱藏”。
解釋:分配隱藏確保患者和研究者對治療分配的不可預測性,并且是持續有效的,這與盲法不同,盲法通常很難在牙科試驗中實施[30]。分配隱藏的方法可以包括使用順序編號的密封不透明信封或外面資源中心協助分配設置。分配隱藏的最佳方法是使用獨立的中央隨機分配方案。中央隨機的好處在于:研究使用的隨機化分配表被安全地保存在距離研究實施地點較遠的位置,減少了隨機化分配方案泄密的可能。
1.3.6.3 實施
CONSORT 條目 10:誰產生隨機分配序列,誰招募受試者,誰給受試者分配干預措施。
示例:“在打開信封之前,基線信息已記錄在外面。執行人員負責按順序打開下一個信封并執行隨機化過程”。
解釋:隨機化的實施過程中包括人員、時間、地點以及隨機程序(生成隨機化列表,分配隱藏和治療分配)。在小型臨床研究中,可能由同一位研究人員執行所有任務。但是,最好讓不同的研究者來執行單獨的隨機程序,因為這樣會減少該過程產生偏倚的機會。
缺乏適當的隨機化和分配隱藏可能會引入偏倚,從而使研究結果受到質疑[30]。在各種研究設計中,RCT 被認為是提供最高質量臨床證據的試驗方法。然而,在包括牙科在內的生物醫學文獻中,有充分的證據表明,已發表研究的隨機化和 RCT 質量總體上不達標,且通常錯誤地給臨床試驗貼上 RCTs 的標簽[5,31]。因此,需要對隨機化所有要素進行清晰描述,以使具備專業知識的讀者能夠評估試驗方法的嚴謹性。
1.3.7 盲法
CONSORT 條目 11a:如果實施了盲法,分配干預措施之后對誰設盲(例如受試者、醫護提供者、結局評估者),以及盲法是如何實施的。
示例:“無法對患者或施術者實行盲法”。
解釋:作者應描述對誰設盲(患者,研究人員,結局指標評估者或數據分析員)。差異性隨訪(實施偏倚),結果記錄(測量偏倚),隨訪脫落(失訪偏倚)以及與缺乏盲法相關的數據分析可能會使試驗結果產生偏倚[32]。有關盲法的描述千差萬別,令人困惑;因此,鼓勵提供清晰的盲法解釋,而不是使用“單盲”或“雙盲”之類的術語[33]。提供具體信息可使讀者更好地評估潛在偏倚風險。如果有多個結局,則每個結局都必須有清晰地盲法描述。
CONSORT 條目 11b:如有必要,描述干預措施的相似之處。
示例:“不可能對患者或施術者實現盲法;但是,對結局評估者實行了盲法,因為無法區分光固化法和化學固化法”。
解釋:作者應清楚地報告(如果適用)實行盲法的干預措施之間的任何相似之處以利于盲法的實施。在牙科方面,干預措施通常差異很大。但是,甚至在干預措施完全不同的情況下,如該結局評估者沒參與試驗過程,對結局評估者施盲是可行的。不建議對盲法的有效性進行測試,因為測試結果可能反映了對干預效果的準確估算[34]。需要報告已知的盲法折中實施情況,例如試驗中任何受試者在任何時點的破盲。
1.3.8 統計方法
CONSORT 條目 12a:用于比較各組主要和次要結局指標的統計學方法。
示例:“使用統計方法對兩種技術粘合的舌側固定器的維持時間進行了比較,以進行維持率分析。使用了秩和檢驗,并繪制了 Kaplan-Meier 圖。使用 Cox 回歸模型計算危險比(hazard ratios,HRs)和相關的 95%可信區間(confidence intervals,CIs)。Nelson-Aalen 圖用于評估比例風險假設”。
解釋:提供已實施統計分析的詳細描述。
原則是提供“足夠的詳細信息,以使具備專業知識的讀者可以訪問原始數據以驗證報告的結果”(www.icmje.org)[1,35]。同樣重要的是描述每個統計分析中包括的人員詳細信息,而不是依賴模糊的標簽,如意向性治療(intent-to-treat,ITT)分析等[36]。此外,應提供對任何缺失數據處理的清晰描述,并闡明分析是否遵循符合方案集分析(per-protocol principle,PP)或 ITT 分析原則[36,37]。ITT 分析是指對所有受試者均根據最初預設分配給他們的干預措施進行分析,而不管他們是否接受了該干預措施。ITT 在有效性評估中(尤其是在實用性臨床試驗中)受到青睞,因為它們反映了在實踐中進行干預時很可能會發生的依從性問題和治療變更,以及由于將受試者排除在分析范圍之外而導致的隨訪偏倚風險。ITT 分析要求即使受試者沒有完全遵守該方案,也要將其包括在內。ITT 的一個重要問題是受試者的缺失數據。
有關 ITT 分析的術語易令人困惑,并且通常由不同作者以不同方式解釋。因此,清楚地描述數據分析的機制比簡單提及“ITT”或“符合方案分析”或其他替代提法(如已接受治療的、可獲得的、連續的患者)更可取。如果缺少數據,則應對任何合理情形下的歸因分析、敏感性分析進行報告和結果對比[36,37]。
示例中的 RCT 報告,除在統計方法支持下評估了研究假設,還清楚地概述了用于數據分析的具體方法。此外,對缺失數據的處理和敏感性分析也進行了討論,對粘合劑的粘著殘余指數進行了二次分析,但沒有進行亞組分析。
標準分析方法假定數據是“獨立的”。對于 RCTs 而言,這通常意味著每個受試者只有 1 個觀察值。將來自單個受試者的多個觀察結果視為獨立數據是一個嚴重的錯誤;比如在牙科的臨床試驗中,當可以在身體的不同部位測量結局指標時,就會產生此類數據。數據分析應該基于對每個受試者進行的單次計數,或者應該用適用于非獨立數據的更復雜的統計程序完成分析[13]。經驗表明:對統計方法描述不明確,非獨立的觀察結果(如患者嵌套的托槽脫落)常常被不當地視為獨立的觀察結果[38,39]。
CONSORT 條目 12b:附加分析的方法,諸如亞組分析和校正分析。
示例:“缺失數據通過使用干預措施的類型,性別和年齡等變量來彌補的。填補是在假設隨機缺失的情況下進行的:也就是說,假設在給定的干預措施類型、性別和年齡下,不管我們是否能夠觀察到,結果指標的分布是相同的。使用適用于 Cox 回歸的“-mi-”系列命令來實現填補。使用 Fisher 精確檢驗比較了復合材料之間的粘合劑殘留指數得分”。
解釋:隨著統計檢驗次數的增加,出現假陽性結果的可能性也會增加,意識到這一點十分重要[21]。盡管不鼓勵進行多個亞組分析,但它們在牙科試驗中很常見[40],并可能導致選擇性報告陽性結果和對結果的錯誤解釋[20]。作者應限制亞組分析的數量,并應明確指出這些分析是預先指定的還是事后的或探索性的。
1.4 結果
1.4.1 受試者流程
CONSORT 條目 13a:隨機分配到各組的受試者例數,接受已分配治療的例數,以及納入主要結局分析的例數。
示例:“圖 1 是 CONSORT 流程圖示例,顯示了患者通過試驗的流程”。

解釋:流程圖是一種快速的視覺輔助工具,可顯示受試者在試驗不同階段的流程。隨訪期間的任何脫落,均衡的或不均衡的,以及合格受試者數量,隨機分組和患者統計分析都很容易觀察到。
CONSORT 條目 13b:隨機分組后,各組脫落和被剔除的例數,并說明原因。
示例:“220 例患者(中位年齡 16 歲;四分位間距 2 歲;范圍 12~47 歲)以 1∶1 的比例隨機分配到化學粘合劑治療組或光固化治療組;16 例患者在隨訪中脫落(圖 1 和圖 2)。研究于 2009 年 4 月開始招募患者,并于 2010 年 11 月結束”。

解釋:作者應明確報告隨機化后的脫落和排除,并說明原因。這樣就可以評估排除的合理性[41]。此外,還可以計算出樣本量減少導致的檢驗效能損失。
示例中的 RCT 包括一個流程圖,其中包含與受試流程和隨訪脫落有關的特定信息。
CONSORT 條目 14a:招募期和隨訪時間的長短,并說明具體日期。
示例:“招募患者從 2009 年 4 月開始,到 2010 年 11 月結束”。
解釋:報告受試者招募的時間和持續時間提供了歷史背景,可能對未來的研究者有價值。在某些試驗中,特別是在評估結局發生時間的研究中,并非所有受試者的隨訪時間都是固定的;相反,隨訪可以在預先指定的時間點結束,也可能在觀察到固定數量的結局事件時結束。
CONSORT 條目 14b:為什么試驗中斷或停止。
解釋:按計劃完成的試驗結果比過早結束的試驗結果更值得信任,特別是在根據數據做出決定的情況下。作者應明確指出試驗是否提前結束,包括有關提前終止時間和原因的信息。
示例中的這項研究并未提前終止,并且包含了招募和隨訪的細節。
1.4.2 基線數據
CONSORT 條目 15:用一張表格列出每一組受試者的基線數據,包括人口學資料和臨床特征。
示例:“表中報告了各治療組患者的基線特征”(圖 2 是基線特征表報告示例)。
解釋:如果隨機化已正確進行,則各治療組的基線特征應相似。收集的所有受試者的基線數據可能包括人口統計學變量(即年齡、性別和種族)和臨床特征,包括錯位咬合的類型、牙列擁擠的基線測量值和口腔衛生狀況。基線數據應在隨機分配之前收集,以使數據收集不受對治療分配的了解的影響。例如,支持較新治療方法的研究者可能會不自覺地以有偏倚的方式記錄基線數據(如增加或減少擁擠的數量),并以某種方式證明對新治療方法有先入之見。
表格中顯示的基線數據可以快速評估各組受試者之間的相似性。組間基線特征的微小差異是隨機的,特別是在小型試驗中。各組受試者之間基線的重大差異可能與隨機分配不當有關。
對于連續變量,例如磨牙間寬度或牙根長度,應包括均值(標準差)或中位數(四分位間距)。不應使用標準誤和可信區間來報告變異性,因為它們是推斷性的,而不是描述性的。不應將具有少量有序分類的變量視為連續變量;相反,應報告每個類別的數量和比例[1]。不建議進行旨在評估各組之間基線特征平衡的統計測試,這可能會產生誤導[42]。明智的做法是,基線比較時應考慮所測變量的預測強度,以及任何隨機誤差的大小[42]。
1.4.3 納入分析的例數
CONSORT 條目 16:各組納入每一種分析的受試者數目(分母),以及是否按最初的分組分析。
示例:“最后 1 例患者入院兩年后,用化學固化膠粘劑的 110 個光固化固定器中有 47 個(42.7%)和 110 個固定器中有 55 個(50.0%)失敗了。初步分析是在意向性分析的基礎上進行的,涉及所有在估算缺失數據后被隨機分組的患者”(圖 3 是一個示例表,報告了失效例數和隨訪時間)。

解釋:應明確所有分析中的每組受試者人數。對于二分類變量統計量(即風險比和風險差),也應該報告計算之前的分母或事件發生率。將結果表示為分數有助于讀者評估一些隨機分配的受試者是否被排除在分析之外。因此,結果不應僅僅作為諸如相對風險之類的簡要度量來呈現。
1.4.4 結局和估算
CONSORT 條目 17a:各組每一項主要和次要結局指標的結果,效應估計值及其精確性(如 95% 可信區間)。
示例:“根據估算數據得出的危險比[HR=1.15,95%CI(0.88,1.70),P=0.47]。沒有證據表明年齡可能是舌側固定器失效的重要預測指標[HR=0.96,95%CI(0.93,1.00),P=0.08]。填補數據分析得出兩者的 HR 相似;未填補數據假設刪除了所有缺失值。在 102 例(64.7%)的失效受試者中,只有 66 例(64.7%)測量了粘著殘余指數評分,且復合材料之間沒有差異(Fisher精確檢驗,P=0.16);大多數已確認的失效都發生在釉質黏附層”(圖 4 是一個示例表,報告了來自 Cox 回歸的危險比)。

解釋:對于主要結局指標,作者應為每組結局指標做總結式報告(如發生或未發生事件的受試者數量,或測量的平均值和標準差),再加上組間的對比,也就是效應大小。對于二分類變量,效應大小可以是相對風險、相對風險降低率、比值比或風險差異。對于生存時間數據,可以用危險比或中位生存時間差來度量。對于連續數據,效果度量通常是平均值的差異。作者應該提供組間對比的可信區間,并作為估計效果的精度(不確定性)的度量。從結果中獲得的臨床相關性更強、更重要的信息是實際差異或效應大小及其不確定性。P值雖然在統計學上有顯著意義,但對提供臨床相關性的認識作用有限。報告可信區間將結果的解釋從重要或不重要的二分法轉移到效應的大小或相關性,以及研究數據給出的合理值范圍[1]。對于配對對照設計(如左右側對照),應提供患者間的相關系數,以指導今后的樣本量計算[12]。同樣,對于具有整群效應的設計,應提供群組內相關系數或變異系數(k)[13, 43]。
CONSORT 條目 17b:對于二分類結局,建議同時提供相對效應值和絕對效應值。
示例:“最后 1 例患者入院兩年后,用化學固化膠粘劑的 110 個光固化固定器中有 47 個(42.7%)和 110 個固定器中有 55 個(50.0%)失敗了(風險差異:7.3%,95%CI:5.9%,20.5%)”。
解釋:對于二分類數據,最好同時提供絕對風險和相對風險,因為孤立地解釋二者會產生誤導[44]。例如,絕對風險是兩風險之差(4%?2%=2%),相對風險是兩風險之比(4%/2%=2)。然而,風險之間較大的絕對差異(40%?20%=20%)可能在比率量表中呈現相同的差別(風險比,40%/20%=2);但是,基于絕對差異(2%vs. 20%)的解釋可能會完全不同。相對比例的效應估計(如風險比和比值比)在整個人群中比風險差異(比例差異)更具普遍性,因為后者取決于對照組的基線風險,而基線風險隨人群而變化。
示例中的研究在填補缺失數據后,根據 ITT 原則對患者進行了分析。提供了主要比較的估計危險比和絕對風險差異以及相關的 95%可信區間。對于次要結局(粘著殘余指數),僅提供了納入分析的例數和P值,因為只有 66%的失效例數進行了該結局指標的測量。
1.4.5 輔助分析
CONSORT 條目 18:所做的其他分析的結果,包括亞組分析和校正分析,指出哪些是預先設定的分析,哪些是新嘗試的分析。
示例:“在 102 例(64.7%)的失效病例中,只有 66 例(64.7%)有可能出現粘著殘余指數評分,且復合材料之間沒有差異(Fisher 精確檢驗,P=0.16);大多數已確認的失效都發生在釉質粘附層”。
解釋:臨床試驗的受試者在人口統計學或臨床基線特征方面存在差異,可能影響對干預措施的治療反映。可以進行亞組分析,以確定治療效果是否因于各組患者的基線特征而異,如相同性別、年齡、社會經濟地位、口腔衛生以及與矯正治療的依從性等。隨著統計分析數量的增加,觀察到某些假陽性結果(多重性問題)的可能性也會增加[21]。亞組比較結果的報告可能會被人為操控,過分強調陽性結果會產生對治療效果的錯誤印象。理想情況下,應該預先指定亞組分析的方法[20]。同樣,對基線變量的任何調整最好是預先計劃指定的;應當說明這些措施的實施是否是因為觀察到了基線的不平衡才增加的。
1.4.6 危害
CONSORT 條目 19:各組出現的所有嚴重危害或意外效果(具體的指導建議參見“CONSORT for harms”)。
示例:“除了與牙菌斑積聚相關的牙齦炎外,未觀察到嚴重危害”。
解釋:在評估支持或不支持某項干預措施有效性的證據時,利益和危害之間的平衡是一個重要的考慮因素。因此,應提供評估的治療組危害及其發生頻率的清晰描述。可參見關于 RCTs 中報告危害的 CONSORT 聲明擴展[22];在本案例的試驗中,除與牙菌斑積聚有關的牙齦炎外,沒有其他危害。
1.5 討論
1.5.1 局限性
CONSORT 條目 20:試驗的局限性,報告潛在偏倚和不精確的原因,以及出現多種分析結果的原因(如果有這種情況的話)。
示例:“我們的研究局限性在于不可能對所有患者進行失效性檢查,尤其是在研究即將結束時”。
解釋:在討論部分中,應提及試驗的局限性,尤其是潛在的偏倚來源,包括測量偏倚和失訪偏倚。應當參照報告的可信區間討論觀察到的效應計算的不精確度;應將重點放在臨床意義上,而不是在P值和統計學意義上[37,44,45]。
同樣,應更多地注意對主要的、預先規定的結局指標的分析;應謹慎解釋亞組分析和多次測量后的結果[45,46]。
1.5.2 可推廣性
CONSORT 條目 21:試驗結果被推廣的可能性(外部可靠性,實用性)。
示例:“這些結果的普遍性可能受到限制,因為這項研究是由一位在化學固化粘合法和光固化粘合法方面都有經驗的臨床醫生(N.P.)在一個中心進行的”。
解釋:只要試驗的納入和排除標準相似,且在一致的生物學反應假設下將試驗結果適用于其他環境和人群通常是可行的[15,47]。例如,美國的一項 RCT 評估了僅在成人受試者使用的自酸蝕處理劑或傳統酸蝕法粘結的托槽失效,其結果適用于英國成人嗎?也許是的。同樣的結果適用于青少年嗎?成人和青少年之間的依從性差異可能會影響結果;因此,在評估外部效度時應考慮與年齡有關的差異。
外部效度依存于內部效度。因此,如果由于偏倚的方法導致試驗結果無效,那么外部效度問題就無從談起了。外部效度取決于受試者的背景和特征、干預措施和試驗結果,因為它們由納入和排除標準決定。
1.5.3 解釋
CONSORT 條目 22:與結果相對應的解釋,權衡試驗結果的利弊,并且考慮其他相關證據。
示例:“盡管注意到固定器失效率沒有顯著差異,但記錄的失效數量相當可觀,在脫膠后的兩年內從 43%到 50%不等。這種多數失效的情況與最近的一項前瞻性研究相符”。
“我們相對較高的失效率可能與前瞻性設計和相對冗長的隨訪有關。同樣,任何損壞都被記錄下來;因此,即使是造成輕微后果的小裂縫(甚至在其它回顧性研究中可能被忽略)也已作為失效記錄在該研究中”。
解釋:討論應該把證據作為一個整體來考慮,最好是在系統評價的背景下,而不是僅僅關注當前的試驗或特定的研究,也許是那些研究正好證實了本試驗結果的研究。
本例示范試驗在現有證據的背景下討論了結果,強調了研究的局限性以及延長隨訪時間的復雜性,并對結果的可推廣性發表了評論,因為這種治療僅限于 1 名經驗豐富的操作者。
1.6 其他信息
1.6.1 注冊
CONSORT 條目 23:臨床試驗注冊號和注冊機構名稱。
示例:“該試驗未注冊”。
解釋:為了最大程度地減少數據的不發表和保留、選擇性報道以及重復出版的可能性,國際醫學雜志編輯委員會要求試驗必須進行注冊才能出版。
這一立場導致注冊的試驗數量急劇增加。在報告試驗摘要時,作者應提供試驗注冊號碼和試驗注冊名稱的詳細信息[48]。這使讀者能夠獲得有關試驗及其結果的更多信息。注冊信息還有助于將報告與后續的完整出版物(或同一試驗的多個報告)鏈接起來,從而降低了系統評價中無意識重復計算的風險。
未注冊的試驗仍可在 AJO-DO 中發表;這使得未注冊的正在進行的試驗有機會被發表。目前,臨床試驗未注冊,其試驗結果也可被刊登。關鍵在于臨床試驗注冊是否透明。但是,這種情況將來可能會改變。因此,強烈建議研究人員從一開始就注冊臨床試驗(例如,通過北美平臺 ClinicalTrials.gov 進行注冊)[49]。
1.6.2 方案
CONSORT 條目 24:如果有的話,在哪里可以獲取完整的試驗方案。
示例:“該臨床試驗方案未在試驗開始前發表”。
解釋:預發表臨床試驗方案很重要,因為它提供了試驗的所有計劃細節。將方案置于公共視野,允許對預期和實際完成進行比較,因此不鼓勵只對陽性的結果進行選擇性報告[20]。方案的發表還向科學界通報了計劃中的和正在進行的試驗,并為研究人員和系統評價作者提供了更好的交流和更高的效率。SPIRIT 指南詳細描述了起草 RCT 研究方案的要求[50]。
理想情況下,應該明確臨床試驗方案是否可以獲得以及在何處可以獲得。透明度至關重要;CONSORT 聲明專注于準確地報告在研究期間所做的事情,而不是對此進行判斷。
1.6.3 資助
CONSORT 條目 25:資助和其他支持(如提供藥品)的來源,提供資助者所起的作用。
示例:“聲明沒有資助或利益沖突”。
資助和其他形式的支持應明確聲明。研究表明,與其他來源資助的研究相比,由制藥業贊助的試驗具有使結果偏向贊助者的比率更高[51]。通常,資助來源在摘要的末尾或文章“致謝”部分進行報告。
2 摘要
在本說明性文章的最后一節中,我們將按照 CONSORT 的摘要指南,介紹如何報告隨機對照試驗的摘要[3]。這些條目已在上文進行了描述;然而,由于牙科矯正摘要通常報道不完整,因此有必要簡短描述[6]。
表 2 中列出了摘要中需包含內容的清單。要點如下。
① 清楚闡釋試驗設計的一個重要原因是要確保在電子數據庫中建立適當的索引,以使試驗更被容易識別。例如:“雙臂平行試驗”。
② 清晰描述受試者及試驗環境,以便讀者評估試驗的外部效度(推廣性)并確定其對自身環境的適用性。示例:“納入標準包括下頜前牙沒有活動性齲齒,修復或斷裂,以及足夠的口腔衛生”。
③ 應描述每個試驗組和對照組干預措施的基本特征。示例:“在私人矯正診所接受過矯正治療的患者被隨機分配應用化學固化復合材料或光固化復合材料固定器”。
④ 摘要應清楚描述試驗中涉及的特定目標或研究假設。示例:“該試驗的目的是比較在矯正治療后用化學固化或光固化粘合劑粘結的舌側固定器的維持率”。
⑤ 作者應明確說明試驗的主要結果以及何時進行評估(如評估結果的時間范圍)。例如:主要結局指標是任何類型的第一次舌側固定器損壞;失效的情況種類(粘著殘余指數評分)是次要結局指標。患者分別在 1、3、6 個月和放置固定器后每 6 個月復查一次,直到研究結束。
⑥ 重要的是詳細介紹隨機序列生成方法,隨機化方法和實施的限制,以及從受試者分配到干預組中隱藏分配序列的細節。分配隱藏可以防止研究人員影響受試者分配到干預措施組的選擇(即選擇偏倚)。示例:“隨機分組是對 20 位患者進行隨機區組排列完成的,其分配隱藏在順序編號、不透明的、密封的信封中”。
⑦ 作者應說明受試者,干預措施的實施者(通常是衛生保健提供者)和評估結果的人員(數據收集者和分析人員)是否對分組方案知情。示例:“盲法僅適用于結果評估”。
⑧ 應明確隨機分配到每個干預措施組的受試者人數,因為這是試驗結果的重要組成部分。該數字規定了樣本量,讀者可以使用它來評估最終分析中是否包括所有被隨機分配的參與者。示例:“220 例患者(中位年齡 16 歲,四分位間距 2 歲,范圍 12~47 歲)以 1∶1 的比例隨機分配到化學粘合劑組或光固化粘合劑組”。
⑨ 對于主要結局指標,作者應將每組結局指標做總結式報告(如發生或未發生事件的受試者數量,或測量的均數和標準差),再加上組間的對比,也就是效應大小。對于二分類結局,效應大小可以是相對風險、相對風險降低率、比值比或風險差。對于生存時間數據,可以用危險比或中位生存時間差來度量。對于連續數據,效果度量通常是平均值的差異。作者應該提供組間對比的可信區間,并作為估計效果的精度(不確定性)的度量。示例:“在至少兩年的隨訪中,用化學固化膠粘劑的 110 個固定器中的 47 個(42.7%)和 110 個光固化固定器中有 55 個(50.0%)發生了某種類型的失效(對數秩檢驗,P=0.35)。在意向治療分析的基礎上分析數據,危險比(HR)為 1.15[95%CI(0.88,1.70),P=0.47]。沒有證據表明年齡可能是舌側固定器失效的重要預測指標[HR=0.96,95%CI(0.93,1.00),P=0.08]。在 102 例(64.7%)的失效中,只有 66 例(64.7%)進行了粘著殘余指數評分,且復合材料之間沒有差異(Fisher 精確檢驗,P=0.16)”。
⑩ 要做出權衡的決定,讀者需要有關干預措施利益與危害相關的信息。摘要中應提及干預措施的重要危害(或意想不到的影響)。如果沒有發生重大不良事件,作者應明確說明。示例:“除了與牙菌斑積聚相關的牙齦炎外,未觀察到嚴重危害”。
? 試驗結論應與摘要中報告的結果一致,并應明確說明其臨床應用(避免泛化)。在適用的情況下,作者還應注意,將結果用于臨床前是否需要進行其他研究。示例:“這項研究的結果表明,沒有證據表明應用化學和光固化膠粘劑的下頜舌側固定器的維持率存在差異。總體失效率為 46.4%;然而,這包括任何類型的失效,可能夸大整體失效率”。
? 盡管不是 CONSORT 聲明條目,但應記錄試驗注冊和臨床試驗方案的詳細信息,以及說明資助來源。例如:“該試驗未注冊”,“在試驗開始前未發表該方案”或“聲明無資助或利益沖突”。
3 結論
在做出臨床決策時,循證牙科方法將現有最佳證據、臨床專業知識以及患者的偏好和價值觀融合在一起。高質量的隨機對照試驗是系統評價的基礎,應置于循證決策的最前沿。完整透明的試驗報告有助于準確評估研究質量和正確解釋結果。此外,通過明確的報告,可以更快速地確定適合納入系統評價的研究、評估初步研究結果以及提取數據。經驗表明,醫學和牙科領域的 RCTs 報告質量仍然不是最理想的,并且受到未發表、不完整、選擇性和誤導性報告的不良影響。CONSORT 指南為這些問題提供了有影響力的重要解決方案,在報告矯正臨床試驗時應遵循該指南,而且,這一指南還可以指導試驗的設計和實施。
參考文獻
見原文。