引用本文: 劉雅琦, 劉曼, 劉玉秀, 陳文松, 袁陽丹. 《新英格蘭醫學雜志》臨床試驗隨機化方法應用狀況評價. 中國循證醫學雜志, 2021, 21(3): 303-307. doi: 10.7507/1672-2531.202010080 復制
隨機對照試驗(randomized controlled trials,RCT)通常被認為是循證醫學干預性研究證據的金標準之一[1]。而納入 RCT 的系統評價和 Meta 分析通過收集匯總具有相同研究目的和手段且相互獨立的多個臨床試驗,可以從中獲得更可靠的結論[2, 3],往往作為循證醫學中的高等級證據[4]。單個 RCT 全程規范化實施對保證臨床試驗質量至關重要,有關隨機化方法在臨床試驗中的應用情況近年受到關注[5, 6],已有若干學者選擇不同期刊發表的臨床試驗文獻進行了回顧性調查[7-13]。然而,這些調查并未區分試驗的盲態情況,難以反映非盲態臨床試驗的隨機化狀況,而非盲態試驗的隨機化方法選擇和實施恰恰是直接影響臨床試驗質量的最重要環節。為此,本研究分析權威醫學期刊《新英格蘭醫學雜志》(The New England Journal of Medicine,NEJM)2018 年發表的所有 RCT,了解新近臨床試驗特別是非盲態臨床試驗隨機化方法的應用現狀,以期為臨床試驗隨機化方法選擇和實施及質量改進提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
RCT。
1.1.2 文獻來源
NEJM 網站(https://www.nejm.org/)。
1.1.3 發表時間
2018 年全年。
1.1.4 排除標準
未提供有關試驗設計信息和研究結果的論文。
1.2 文獻檢索策略
在“All the words”檢索項錄入“random”,在“Search within”檢索項選擇“Full text”,在“Article category”檢索項選擇“Research”,在“Date”檢索項選擇“Jan 2018”至“Dec 2018”。
1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻和提取資料。文獻篩選時首先閱讀摘要,對可能納入的文獻下載全文電子版進行精讀,如有分歧,則通過討論或與第三方協商解決。采用 EpiData 3.2 軟件建立數據庫,由 2 名研究者獨立錄入數據,并進行一致性比對,提取資料主要包括文獻的基本信息、試驗設計的要素信息、隨機化的相關內容等。為了不致引起信息提取和統計分析時的概念混淆,我們對一些可能出現交叉的項目進行了界定。在試驗設計涉及到的項目中,盲態試驗定義為在整個試驗過程中完整保持盲態的試驗,將單盲試驗、對結局指標采用盲法評估的開放性試驗等均歸為非盲態試驗。陽性對照試驗僅指兩組試驗中一組為陽性對照的情形;安慰劑對照試驗指兩組或多組中有一組設為安慰劑的試驗;劑量對照試驗專指按劑量大小分組的試驗(如劑量對照試驗中包含了劑量為 0 的對照組,該試驗不歸為安慰劑對照試驗);空白對照試驗指非盲態、其中一組設為空白不予施加額外處理的試驗。在進行隨機化方法分類時,將單純采用簡單隨機化、區組隨機化、偏幣隨機化、甕法隨機化均歸為傳統隨機化方法;而采取中心分層或者相關基線變量進行適應性隨機化的均歸入協變量適應性隨機化方法;其他的隨機化方法另行說明。
1.4 統計分析
采用 SAS 9.4 軟件進行統計分析。針對定性分類指標,采用例數、百分比進行描述,組間比較采用 Fisher 精確概率檢驗方法,當 P<0.05 時認為差異有統計學意義。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 171 篇,經逐層篩選后,納入 151 個 RCT 進行分析。
2.2 納入研究的基本特征
納入研究的基本特征見表 1。非盲態試驗以多中心(90.79%)、兩組干預(82.89%)、等比例(84.21%)樣本分配為主要類型。非盲態試驗與盲態試驗在試驗總樣本量、中心數、試驗組數方面的差異無統計學意義(P>0.05),而在樣本量分配比例、干預措施及對照組類型方面的差異有統計學意義(P<0.05)。

2.3 試驗隨機化方法應用情況
納入 RCT 中,未報告具體隨機化方法的 34 篇(22.52%)、報告隨機化方法的 117 篇(77.48%)。在報告具體隨機化方法的 RCT 中,以分層區組隨機化(72.65%)最多,其次為區組隨機化(11.11%)、最小化(9.40%)、簡單隨機化(4.27%)等。盲態試驗和非盲態試驗之間報告隨機化方法的比例及其采用不同隨機化方法的比例均無明顯差別(P>0.05)(表 2)。

2.4 非盲態試驗隨機分配隱藏報告
在 76 篇非盲態 RCT 中,明確報告隨機分配隱藏方法的僅 38 篇(50.00%),其中 37 篇采用中央隨機法(97.37%),1 篇采用信封法(2.63%)。
3 討論
已有研究者[7-13]對已經發表臨床試驗隨機化應用情況進行了回顧性調查。2013 年,Clark 等[7]對 42 本核心臨床期刊 2011 年 1 月發表的 85 篇 RCT 進行了分析,結果顯示報告了隨機序列生成方法的占 68%,報告分配隱藏方法的占 32%,報告受試者招募流程和隨機序列生成者的占 31%。2015 年,Higham 等[8]回顧 4 本國際醫學期刊 2012 年 6~9 月發表的 82 篇 RCT,發現 88% 的隨機化方法為限制性隨機化方法,且其中 90% 采用了區組隨機化。2015 年,Lin 等[9]調查了 2014 年 1~12 月發表在 3 本國際醫學期刊上的 RCT,結果顯示 6% 采用簡單隨機化,12% 采用常規區組隨機化,70% 采用分層區組隨機化,11% 采用最小化方法,1% 采用動態層級隨機化。2019 年,陳君超等[10]檢索了 2016 年發表在 4 本醫學期刊上的 237 篇 RCT,結果顯示分層區組隨機化占比達到 61%,區組隨機化為 18%,簡單隨機化為 14%,動態隨機化為 7%。
本研究結果也發現,NEJM 發表的 RCT 采用分層區組隨機化最多,其次為區組隨機化、最小化隨機和簡單隨機化。由于非盲態試驗與盲態試驗相比,非盲態試驗如果隨機化方法選擇不當,會導致更大的選擇性偏倚風險,因此本文還根據盲法實施的不同進行了對比分析,結果發現發表的盲態試驗和非盲態試驗數量相近,且在 76 篇非盲態 RCT 中,有 21 篇(27.63%)未報告具體隨機化方法。
從本研究和上述一些權威期刊發表的臨床試驗所使用的隨機化方法看,依然以區組隨機化方法為主流,但早在 2006 年,對于區組隨機化方法的應用就遭到置疑[14, 15],特別是在非盲態試驗中,該類方法的確定性分配概率和猜對分配概率較高,不能很好避免選擇偏倚,應被更好的方法替代[16]。例如,大棒設計(big stick design,BSD)法在兩組隨機化方法比較中,顯示出較好的性能,是兩處理組、等比例分配臨床試驗隨機化方法的推薦選擇[17],區組甕法(block urn design,BUD)也顯示出優于傳統隨機化方法的優異性能[18]。
然而十余年來,對這一倡導和建議的反應并不積極,一些性能較好的新型隨機化方法并未得到推廣應用。究其可能的原因,一是研究者對區組隨機化方法的認識根深蒂固,一些教科書、技術指導仍將其推薦為主要方法;二是學術界對隨機化方法的研究尚未形成共識,對一些性能更優的新型隨機化方法介紹不夠;三是在實踐應用中還缺少足夠的行之有效的隨機化實現工具等。這一現狀如果不能得到扭轉,臨床試驗質量的提高將不能得到保障。
本文的局限性:① 本文只調查了一本英文期刊一年內發表的 RCT,在結果的代表性方面可能存在局限;② 有關隨機化報告透明性的指標結果,例如隨機序列生成方法和隨機分配隱藏方法的報告比例僅基于發表的正文內容進行信息提取和統計,并沒有進一步追溯附件等資料的報告細節,可能有一定程度低估。
綜上所述,目前在 NEJM 發表的 RCT 仍存在隨機化方法選擇有待優化和隨機化報告透明性不夠的問題。我們呼吁盡快扭轉隨機方法應用仍以區組隨機化為主導的局面,采取隨機化質量促進行動,加強隨機化方法的理論研究,規范隨機化方法的正確應用和透明報告,不斷提升隨機化的質量和水平,確保臨床試驗的質量。
隨機對照試驗(randomized controlled trials,RCT)通常被認為是循證醫學干預性研究證據的金標準之一[1]。而納入 RCT 的系統評價和 Meta 分析通過收集匯總具有相同研究目的和手段且相互獨立的多個臨床試驗,可以從中獲得更可靠的結論[2, 3],往往作為循證醫學中的高等級證據[4]。單個 RCT 全程規范化實施對保證臨床試驗質量至關重要,有關隨機化方法在臨床試驗中的應用情況近年受到關注[5, 6],已有若干學者選擇不同期刊發表的臨床試驗文獻進行了回顧性調查[7-13]。然而,這些調查并未區分試驗的盲態情況,難以反映非盲態臨床試驗的隨機化狀況,而非盲態試驗的隨機化方法選擇和實施恰恰是直接影響臨床試驗質量的最重要環節。為此,本研究分析權威醫學期刊《新英格蘭醫學雜志》(The New England Journal of Medicine,NEJM)2018 年發表的所有 RCT,了解新近臨床試驗特別是非盲態臨床試驗隨機化方法的應用現狀,以期為臨床試驗隨機化方法選擇和實施及質量改進提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
RCT。
1.1.2 文獻來源
NEJM 網站(https://www.nejm.org/)。
1.1.3 發表時間
2018 年全年。
1.1.4 排除標準
未提供有關試驗設計信息和研究結果的論文。
1.2 文獻檢索策略
在“All the words”檢索項錄入“random”,在“Search within”檢索項選擇“Full text”,在“Article category”檢索項選擇“Research”,在“Date”檢索項選擇“Jan 2018”至“Dec 2018”。
1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻和提取資料。文獻篩選時首先閱讀摘要,對可能納入的文獻下載全文電子版進行精讀,如有分歧,則通過討論或與第三方協商解決。采用 EpiData 3.2 軟件建立數據庫,由 2 名研究者獨立錄入數據,并進行一致性比對,提取資料主要包括文獻的基本信息、試驗設計的要素信息、隨機化的相關內容等。為了不致引起信息提取和統計分析時的概念混淆,我們對一些可能出現交叉的項目進行了界定。在試驗設計涉及到的項目中,盲態試驗定義為在整個試驗過程中完整保持盲態的試驗,將單盲試驗、對結局指標采用盲法評估的開放性試驗等均歸為非盲態試驗。陽性對照試驗僅指兩組試驗中一組為陽性對照的情形;安慰劑對照試驗指兩組或多組中有一組設為安慰劑的試驗;劑量對照試驗專指按劑量大小分組的試驗(如劑量對照試驗中包含了劑量為 0 的對照組,該試驗不歸為安慰劑對照試驗);空白對照試驗指非盲態、其中一組設為空白不予施加額外處理的試驗。在進行隨機化方法分類時,將單純采用簡單隨機化、區組隨機化、偏幣隨機化、甕法隨機化均歸為傳統隨機化方法;而采取中心分層或者相關基線變量進行適應性隨機化的均歸入協變量適應性隨機化方法;其他的隨機化方法另行說明。
1.4 統計分析
采用 SAS 9.4 軟件進行統計分析。針對定性分類指標,采用例數、百分比進行描述,組間比較采用 Fisher 精確概率檢驗方法,當 P<0.05 時認為差異有統計學意義。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 171 篇,經逐層篩選后,納入 151 個 RCT 進行分析。
2.2 納入研究的基本特征
納入研究的基本特征見表 1。非盲態試驗以多中心(90.79%)、兩組干預(82.89%)、等比例(84.21%)樣本分配為主要類型。非盲態試驗與盲態試驗在試驗總樣本量、中心數、試驗組數方面的差異無統計學意義(P>0.05),而在樣本量分配比例、干預措施及對照組類型方面的差異有統計學意義(P<0.05)。

2.3 試驗隨機化方法應用情況
納入 RCT 中,未報告具體隨機化方法的 34 篇(22.52%)、報告隨機化方法的 117 篇(77.48%)。在報告具體隨機化方法的 RCT 中,以分層區組隨機化(72.65%)最多,其次為區組隨機化(11.11%)、最小化(9.40%)、簡單隨機化(4.27%)等。盲態試驗和非盲態試驗之間報告隨機化方法的比例及其采用不同隨機化方法的比例均無明顯差別(P>0.05)(表 2)。

2.4 非盲態試驗隨機分配隱藏報告
在 76 篇非盲態 RCT 中,明確報告隨機分配隱藏方法的僅 38 篇(50.00%),其中 37 篇采用中央隨機法(97.37%),1 篇采用信封法(2.63%)。
3 討論
已有研究者[7-13]對已經發表臨床試驗隨機化應用情況進行了回顧性調查。2013 年,Clark 等[7]對 42 本核心臨床期刊 2011 年 1 月發表的 85 篇 RCT 進行了分析,結果顯示報告了隨機序列生成方法的占 68%,報告分配隱藏方法的占 32%,報告受試者招募流程和隨機序列生成者的占 31%。2015 年,Higham 等[8]回顧 4 本國際醫學期刊 2012 年 6~9 月發表的 82 篇 RCT,發現 88% 的隨機化方法為限制性隨機化方法,且其中 90% 采用了區組隨機化。2015 年,Lin 等[9]調查了 2014 年 1~12 月發表在 3 本國際醫學期刊上的 RCT,結果顯示 6% 采用簡單隨機化,12% 采用常規區組隨機化,70% 采用分層區組隨機化,11% 采用最小化方法,1% 采用動態層級隨機化。2019 年,陳君超等[10]檢索了 2016 年發表在 4 本醫學期刊上的 237 篇 RCT,結果顯示分層區組隨機化占比達到 61%,區組隨機化為 18%,簡單隨機化為 14%,動態隨機化為 7%。
本研究結果也發現,NEJM 發表的 RCT 采用分層區組隨機化最多,其次為區組隨機化、最小化隨機和簡單隨機化。由于非盲態試驗與盲態試驗相比,非盲態試驗如果隨機化方法選擇不當,會導致更大的選擇性偏倚風險,因此本文還根據盲法實施的不同進行了對比分析,結果發現發表的盲態試驗和非盲態試驗數量相近,且在 76 篇非盲態 RCT 中,有 21 篇(27.63%)未報告具體隨機化方法。
從本研究和上述一些權威期刊發表的臨床試驗所使用的隨機化方法看,依然以區組隨機化方法為主流,但早在 2006 年,對于區組隨機化方法的應用就遭到置疑[14, 15],特別是在非盲態試驗中,該類方法的確定性分配概率和猜對分配概率較高,不能很好避免選擇偏倚,應被更好的方法替代[16]。例如,大棒設計(big stick design,BSD)法在兩組隨機化方法比較中,顯示出較好的性能,是兩處理組、等比例分配臨床試驗隨機化方法的推薦選擇[17],區組甕法(block urn design,BUD)也顯示出優于傳統隨機化方法的優異性能[18]。
然而十余年來,對這一倡導和建議的反應并不積極,一些性能較好的新型隨機化方法并未得到推廣應用。究其可能的原因,一是研究者對區組隨機化方法的認識根深蒂固,一些教科書、技術指導仍將其推薦為主要方法;二是學術界對隨機化方法的研究尚未形成共識,對一些性能更優的新型隨機化方法介紹不夠;三是在實踐應用中還缺少足夠的行之有效的隨機化實現工具等。這一現狀如果不能得到扭轉,臨床試驗質量的提高將不能得到保障。
本文的局限性:① 本文只調查了一本英文期刊一年內發表的 RCT,在結果的代表性方面可能存在局限;② 有關隨機化報告透明性的指標結果,例如隨機序列生成方法和隨機分配隱藏方法的報告比例僅基于發表的正文內容進行信息提取和統計,并沒有進一步追溯附件等資料的報告細節,可能有一定程度低估。
綜上所述,目前在 NEJM 發表的 RCT 仍存在隨機化方法選擇有待優化和隨機化報告透明性不夠的問題。我們呼吁盡快扭轉隨機方法應用仍以區組隨機化為主導的局面,采取隨機化質量促進行動,加強隨機化方法的理論研究,規范隨機化方法的正確應用和透明報告,不斷提升隨機化的質量和水平,確保臨床試驗的質量。