本文介紹了一種動態分層區組隨機算法,用于解決臨床隨機對照試驗在試驗設計時因無法確定各分層因素和水平下受試者的數量,無法使用分層區組隨機算法的問題。其方法是在臨床試驗開始之前以區組隨機算法生成一個隨機序列,在試驗進行過程中按需從隨機序列中以區組為單位向某分層因素水平下分配隨機號碼,受試者再在本區組內完成隨機分配。本研究采用中醫藥治療胃癌貧血及血液高凝狀態的實例說明如何設計和實施動態分層區組隨機分配。結果顯示,動態分層區組隨機算法與傳統的靜態分層區組隨機算法相比具有更高的靈活性和適應性,但其在臨床試驗的實現更為復雜且要求也更高。
引用本文: 文天才, 何麗云, 閆世艷, 張艷寧. 動態分層區組隨機分配方法在臨床隨機對照試驗中的應用. 中國循證醫學雜志, 2018, 18(7): 758-762. doi: 10.7507/1672-2531.201711017 復制
分層區組隨機(stratified blocked randomization)是一種結合分層隨機與區組隨機的隨機化方法[1, 2],它既關注受試者的某些重要臨床特征或預后因素對療效的影響,又能保證受試者在區組內達到組間均衡。但是,如果在試驗設計時無法確定各分層因素和水平下受試者的數量時,靜態分層區組隨機算法將無法使用[3, 4]。這時,我們可以將分層區組的隨機算法加以改進,采用以區組為單位的動態分層區組隨機算法來滿足這類臨床研究的需求。
1 靜態分層區組隨機算法
1.1 算法原理
分層區組隨機化(stratified blocked randomization)結合了區組隨機與分層隨機。其中區組隨機化(blocked randomization)的原理是先將所有受試者根據進入試驗的時間順序分配到各個區組,在各區組內再進行完全隨機分配,如圖 1(a) 所示,每個區組內的人數(區組長度)一般是試驗分組數的偶數倍。而分層隨機化(stratified randomization)的原理是指先按照某些因素將所有的受試者分為多層(層數一般不多于 3),然后將每層的受試者進行完全隨機分配,如圖 1(b) 所示。把分層隨機和區組隨機結合在一起,當受試者進入試驗時,受試者先按某些因素分層后再分組,最后在組內實現完全隨機分配圖 1(c)。

a:區組隨機;b:分層隨機;c:分層區組隨機
1.2 挑戰與對策
靜態分層區組隨機兼具了區組隨機和分層隨機的優點,也是目前臨床試驗中最多用的隨機化方法。但是,在一些臨床試驗中,無法在試驗開始前預先確定某些分層因素(如性別、研究中心)下的受試者數量。例如一些關于癌癥的臨床研究,因病源稀少導致無法預先精確計算出各研究中心的樣本數,甚至無法保證需要多少個臨床研究機構才能按照試驗方案完成受試者招募。而傳統的靜態分層區組隨機算法無法應對這類問題。
為了解決上述問題,可以將靜態分層區組隨機算法加以改進,采用以區組為最小單元進行競爭分配的隨機算法代替靜態的分層隨機算法。這種按區組競爭的動態分層區組隨機算法的特點在于在產生隨機序列時不指定其所屬分層水平,而是在受試者真正進入試驗時,依據需求動態地以區組為最小單位向各層分配隨機號,在各層內再實施受試者分配。
2 按區組競爭的動態分層區組隨機算法
2.1 算法原理
按區組競爭的動態分層區組隨機算法的基本原理是在試驗前利用統計軟件按區組隨機算法生成規定樣本量的隨機序列號,并規定好分層因素和水平,但不對隨機號進行分層,在臨床試驗進行過程中按需動態地將該區組內所有隨機號置于某分層水平下(以一個區組長度為單位)。該算法最大的特點是“勤拿少取”,即以一個區組長度來規定隨機號的最小取用單元,各分層水平通過先到先得的方式每次獲取到一個最小取用單元中隨機號的使用權,使用完一個區組的隨機號后再取下一個區組,如此往復直到所有隨機號被取完。
該算法的實現方式是在試驗開始前用區組隨機算法生成規定樣本量的隨機數字序列,并將其放入一個隨機序列池中備用。在試驗開始后,當每個受試者進入試驗時需先判斷其所屬的分層因素和水平:如果該水平下已有未完全分配的區組,則直接在該區組中進行隨機;如果該水平下沒有可供使用的隨機號,則先從隨機序列池中向該水平新分配一個區組后,再在該區組內進行完全隨機分配(圖 2)。

2.2 實例分析
在某中醫藥治療胃癌貧血及血液高凝狀態的臨床研究課題中,其方案設計采用為隨機、對照、前瞻性多中心臨床試驗。該課題隨機方法擬采用分層區組隨機,分層因素分別為胃癌合并癥和研究中心,需在 11 個研究中心招募 372 例受試者。其中,胃癌合并貧血有三種干預措施,胃癌合并血液高凝狀態有兩種干預措施。在胃癌合并癥這個分層因素(X)下,各水平樣本量已經預估,但在研究中心(Y)這個分層因素下,因各研究中心病源不穩定導致研究者無法預先確定各中心的樣本量。
基于以上試驗設計方案,我們采用動態分層區組隨機設計并配合中央隨機系統來實現隨機分配[5],但只在研究中心這個分層因素上進行競爭分配,而在胃癌合并癥分層因素上實施靜態分層分配,其隨機流程見圖 3。

在試驗結束時,372 個隨機號全部分配到參與研究的分中心,其中 371 個隨機號已分配給受試者,僅第五中心胃癌合并貧血組有一個隨機號未分配。在試驗設計時有 11 家醫院參與招募病例,直到試驗結束有 8 家醫院納入了胃癌合并貧血病例,有 8 家醫院納入了胃癌合并高凝狀態,而第四和第六中心在整個試驗期間未納入病例,見表 1。我們對胃癌合并貧血和高凝狀態患者進行分層分析,發現受試者的性別和年齡在各處理組間差異無統計學意義。

3 討論
3.1 算法的適用性
從示例的實際隨機分配結果來看,動態分層區組解決了試驗前各中心研究者對無法確定各中心樣本量的問題。該試驗最終依據病源的實際招募情況在各中心間進行動態的隨機號分配,最終完成所有病例招募和觀察。由此可見,按區組競爭的動態分層區組隨機算法可以解決在試驗設計時無法確定某些分層因素下樣本數量的問題。
3.2 與傳統靜態分層區組隨機算法的比較
動態分層區組隨機算法與傳統的靜態分層區組隨機算法相比,適用范圍一致,且具有更高的靈活性和適應性,這也使得它在臨床試驗中實現時更為復雜且要求也更高(表 2)。

傳統的分層區組隨機算法可以非常便利地使用密閉信封等技術來實現分配過程的隱藏[6-8]。但是,改進后的算法因在納入受試者前無法預知各分層因素下的樣本數量,因而也無法預先將相應的隨機序列分配給各中心,需要一臺中心計算機來支持隨機分配過程并預先編寫程序來實現本算法[9]。
動態的隨機號碼分配也為試驗藥品的管理工作帶來挑戰,按區組競爭的分層區組隨機設計要求各研究中心按需配備藥品,尤其是對于保質期較短的藥品來說,需在試驗中進行多次編盲[10]。因此,在實施動態隨機方案時需在試驗前詳細規劃試驗藥品管理方案,可以考慮在試驗準備階段為各研究中心預備一定數量的試驗用藥[11],并在試驗過程中監控試驗藥品的消耗情況,以便及時進行藥品生產、編盲和補給[12]。
另外,靜態分層區組隨機在臨床試驗設計時已確定各分層因素下的樣本量,但采用區組競爭分層區組隨機算法時,研究者無法實時判斷某個分層因素下樣本量是否已經足夠,尤其是對多中心臨床研究來說,各中心研究者不知道其他中心的受試者入組情況。因此在使用動態隨機算法時,需建立一套信息通報機制隨時告訴各中心研究者整個試驗的入組情況,以及在各分層因素下的入組情況。
3.3 算法應用的注意事項
在臨床試驗執行過程中,分層區組隨機中的區組長度對于研究來講是不可知的[13],因為需要避免研究者通過區組長度來預測受試者的組別。但是,按區組競爭的分層隨機算法需要保證各分層水平下受試者數量達到區組的倍數,否則可能會導致在試驗結束時存在部分區組未完全使用的情況。對于樣本量很大的臨床試驗,一個區組中部分隨機號碼未使用并不會對整體試驗造成嚴重影響。但對樣本量較小的試驗而言,存在多個不完全分配的區組可能會影響臨床試驗各組間的均衡。同時,對于某些分層水平下只有少量受試者的情況,這可能會影響重要的非處理因素的組間均衡[14],因此按中心分層的多中心臨床試驗中,如某些中心僅有少量受試者時則需在分析時謹慎處理。臨床試驗組織管理者需要隨時監控各分層因素下入組受試者的數量,以避免出現各分層水平下樣本量差異過大和區組不完全分配的問題。
分層區組隨機(stratified blocked randomization)是一種結合分層隨機與區組隨機的隨機化方法[1, 2],它既關注受試者的某些重要臨床特征或預后因素對療效的影響,又能保證受試者在區組內達到組間均衡。但是,如果在試驗設計時無法確定各分層因素和水平下受試者的數量時,靜態分層區組隨機算法將無法使用[3, 4]。這時,我們可以將分層區組的隨機算法加以改進,采用以區組為單位的動態分層區組隨機算法來滿足這類臨床研究的需求。
1 靜態分層區組隨機算法
1.1 算法原理
分層區組隨機化(stratified blocked randomization)結合了區組隨機與分層隨機。其中區組隨機化(blocked randomization)的原理是先將所有受試者根據進入試驗的時間順序分配到各個區組,在各區組內再進行完全隨機分配,如圖 1(a) 所示,每個區組內的人數(區組長度)一般是試驗分組數的偶數倍。而分層隨機化(stratified randomization)的原理是指先按照某些因素將所有的受試者分為多層(層數一般不多于 3),然后將每層的受試者進行完全隨機分配,如圖 1(b) 所示。把分層隨機和區組隨機結合在一起,當受試者進入試驗時,受試者先按某些因素分層后再分組,最后在組內實現完全隨機分配圖 1(c)。

a:區組隨機;b:分層隨機;c:分層區組隨機
1.2 挑戰與對策
靜態分層區組隨機兼具了區組隨機和分層隨機的優點,也是目前臨床試驗中最多用的隨機化方法。但是,在一些臨床試驗中,無法在試驗開始前預先確定某些分層因素(如性別、研究中心)下的受試者數量。例如一些關于癌癥的臨床研究,因病源稀少導致無法預先精確計算出各研究中心的樣本數,甚至無法保證需要多少個臨床研究機構才能按照試驗方案完成受試者招募。而傳統的靜態分層區組隨機算法無法應對這類問題。
為了解決上述問題,可以將靜態分層區組隨機算法加以改進,采用以區組為最小單元進行競爭分配的隨機算法代替靜態的分層隨機算法。這種按區組競爭的動態分層區組隨機算法的特點在于在產生隨機序列時不指定其所屬分層水平,而是在受試者真正進入試驗時,依據需求動態地以區組為最小單位向各層分配隨機號,在各層內再實施受試者分配。
2 按區組競爭的動態分層區組隨機算法
2.1 算法原理
按區組競爭的動態分層區組隨機算法的基本原理是在試驗前利用統計軟件按區組隨機算法生成規定樣本量的隨機序列號,并規定好分層因素和水平,但不對隨機號進行分層,在臨床試驗進行過程中按需動態地將該區組內所有隨機號置于某分層水平下(以一個區組長度為單位)。該算法最大的特點是“勤拿少取”,即以一個區組長度來規定隨機號的最小取用單元,各分層水平通過先到先得的方式每次獲取到一個最小取用單元中隨機號的使用權,使用完一個區組的隨機號后再取下一個區組,如此往復直到所有隨機號被取完。
該算法的實現方式是在試驗開始前用區組隨機算法生成規定樣本量的隨機數字序列,并將其放入一個隨機序列池中備用。在試驗開始后,當每個受試者進入試驗時需先判斷其所屬的分層因素和水平:如果該水平下已有未完全分配的區組,則直接在該區組中進行隨機;如果該水平下沒有可供使用的隨機號,則先從隨機序列池中向該水平新分配一個區組后,再在該區組內進行完全隨機分配(圖 2)。

2.2 實例分析
在某中醫藥治療胃癌貧血及血液高凝狀態的臨床研究課題中,其方案設計采用為隨機、對照、前瞻性多中心臨床試驗。該課題隨機方法擬采用分層區組隨機,分層因素分別為胃癌合并癥和研究中心,需在 11 個研究中心招募 372 例受試者。其中,胃癌合并貧血有三種干預措施,胃癌合并血液高凝狀態有兩種干預措施。在胃癌合并癥這個分層因素(X)下,各水平樣本量已經預估,但在研究中心(Y)這個分層因素下,因各研究中心病源不穩定導致研究者無法預先確定各中心的樣本量。
基于以上試驗設計方案,我們采用動態分層區組隨機設計并配合中央隨機系統來實現隨機分配[5],但只在研究中心這個分層因素上進行競爭分配,而在胃癌合并癥分層因素上實施靜態分層分配,其隨機流程見圖 3。

在試驗結束時,372 個隨機號全部分配到參與研究的分中心,其中 371 個隨機號已分配給受試者,僅第五中心胃癌合并貧血組有一個隨機號未分配。在試驗設計時有 11 家醫院參與招募病例,直到試驗結束有 8 家醫院納入了胃癌合并貧血病例,有 8 家醫院納入了胃癌合并高凝狀態,而第四和第六中心在整個試驗期間未納入病例,見表 1。我們對胃癌合并貧血和高凝狀態患者進行分層分析,發現受試者的性別和年齡在各處理組間差異無統計學意義。

3 討論
3.1 算法的適用性
從示例的實際隨機分配結果來看,動態分層區組解決了試驗前各中心研究者對無法確定各中心樣本量的問題。該試驗最終依據病源的實際招募情況在各中心間進行動態的隨機號分配,最終完成所有病例招募和觀察。由此可見,按區組競爭的動態分層區組隨機算法可以解決在試驗設計時無法確定某些分層因素下樣本數量的問題。
3.2 與傳統靜態分層區組隨機算法的比較
動態分層區組隨機算法與傳統的靜態分層區組隨機算法相比,適用范圍一致,且具有更高的靈活性和適應性,這也使得它在臨床試驗中實現時更為復雜且要求也更高(表 2)。

傳統的分層區組隨機算法可以非常便利地使用密閉信封等技術來實現分配過程的隱藏[6-8]。但是,改進后的算法因在納入受試者前無法預知各分層因素下的樣本數量,因而也無法預先將相應的隨機序列分配給各中心,需要一臺中心計算機來支持隨機分配過程并預先編寫程序來實現本算法[9]。
動態的隨機號碼分配也為試驗藥品的管理工作帶來挑戰,按區組競爭的分層區組隨機設計要求各研究中心按需配備藥品,尤其是對于保質期較短的藥品來說,需在試驗中進行多次編盲[10]。因此,在實施動態隨機方案時需在試驗前詳細規劃試驗藥品管理方案,可以考慮在試驗準備階段為各研究中心預備一定數量的試驗用藥[11],并在試驗過程中監控試驗藥品的消耗情況,以便及時進行藥品生產、編盲和補給[12]。
另外,靜態分層區組隨機在臨床試驗設計時已確定各分層因素下的樣本量,但采用區組競爭分層區組隨機算法時,研究者無法實時判斷某個分層因素下樣本量是否已經足夠,尤其是對多中心臨床研究來說,各中心研究者不知道其他中心的受試者入組情況。因此在使用動態隨機算法時,需建立一套信息通報機制隨時告訴各中心研究者整個試驗的入組情況,以及在各分層因素下的入組情況。
3.3 算法應用的注意事項
在臨床試驗執行過程中,分層區組隨機中的區組長度對于研究來講是不可知的[13],因為需要避免研究者通過區組長度來預測受試者的組別。但是,按區組競爭的分層隨機算法需要保證各分層水平下受試者數量達到區組的倍數,否則可能會導致在試驗結束時存在部分區組未完全使用的情況。對于樣本量很大的臨床試驗,一個區組中部分隨機號碼未使用并不會對整體試驗造成嚴重影響。但對樣本量較小的試驗而言,存在多個不完全分配的區組可能會影響臨床試驗各組間的均衡。同時,對于某些分層水平下只有少量受試者的情況,這可能會影響重要的非處理因素的組間均衡[14],因此按中心分層的多中心臨床試驗中,如某些中心僅有少量受試者時則需在分析時謹慎處理。臨床試驗組織管理者需要隨時監控各分層因素下入組受試者的數量,以避免出現各分層水平下樣本量差異過大和區組不完全分配的問題。