貝葉斯單病例隨機對照試驗是近年來流行的研究設計。本文對貝葉斯單病例隨機對照試驗的分析原理、統計要求、應用現狀及優缺點等進行介紹。雖然貝葉斯單病例隨機對照試驗尚處于小規模應用的階段且有許多問題尚待完善,但是其可提供較為豐富的后驗信息,有望成為今后單病例隨機對照試驗的主要類型。
引用本文: 翟靜波, 李江, 商洪才, 王輝, 代敏, 陳靜. 貝葉斯單病例隨機對照試驗簡介. 中國循證醫學雜志, 2017, 17(7): 848-851. doi: 10.7507/1672-2531.201701079 復制
貝葉斯單病例隨機對照試驗是近年來在單病例隨機對照試驗研究領域流行的研究設計。這種設計遵從單病例隨機對照試驗設計的基本要求,但采用分層貝葉斯模型進行統計分析。由于貝葉斯模型可提供較為豐富的后驗信息,其有望成為今后單病例隨機對照試驗的主要類型。本文對貝葉斯單病例隨機對照試驗的分析原理、統計要求等進行介紹。
1 單病例隨機對照試驗的一般流程
單病例隨機對照試驗(N-of-1 trials)是指對單個受試者開展的臨床試驗[1]。通常,單病例隨機對照試驗采用交叉、隨機、雙盲的設計方式。具體來講,受試者需要接受多個輪次的治療。輪次的數量可固定也可不固定。在每輪研究中,患者將經歷兩個治療期,一個治療期內,給予試驗藥物或新療法,另一個治療期內,給予安慰劑或者常規療法。受試者接受試驗還是對照藥物或療法的順序是通過隨機序列產生的,以防止人為因素對分組的不利影響。一般情況下,每個輪次之間會設置一個洗脫期,目的是去除前一個周期治療產生的延遲效應(carryover effect)。
一般情況下,研究者會同時開展多個單病例隨機對照試驗,這些試驗采用相同的試驗方案,稱為系列單病例隨機對照試驗(series of N-of-1 trials)[2]。貝葉斯單病例隨機對照試驗指的就是采用貝葉斯模型進行統計分析的系列單病例隨機對照試驗。
2 系列單病例隨機對照試驗的數據特點
由于設計的特殊性,系列單病例隨機對照試驗的數據具有如下特點:① 自相關性。由于不同的處理措施施加于相同的患者,所以試驗組和對照組的數據之間不可避免地存在自相關性。自相關性的方向和程度可能影響統計分析方法的選擇。② 數據量相對較小。系列單病例隨機對照試驗的樣本量通常較小。當獲得多個相似單病例隨機對照試驗的數據時,研究者可通過合并多個患者的多個輪次數據,提高療效估計的準確性和可靠性。③ 多輪次的重復測量。單病例隨機對照試驗設計使得研究者可獲得多輪次的數據。輪次越多,樣本數據對總體的代表性越高,模型擬合效果可能越好。④ 缺失值問題。在系列單病例隨機對照試驗中,由于患者的治療效果不佳、依從性等原因,不同患者的治療輪次數可能是不同的,從而導致缺失值的發生。貝葉斯統計分析模型對缺失值具有一定的容忍度,在一定程度上避免了剔除缺失病例的問題。
3 分層貝葉斯模型用于單病例隨機對照試驗的分析原理
分層貝葉斯模型可以用于具有分層結構數據的統計分析[3]。先驗信息、樣本信息和后驗信息是貝葉斯模型的三個重要信息。先驗信息來源于既往研究。樣本信息來源于現有數據,貝葉斯模型利用樣本信息更新先驗信息,從而獲得更加可靠的后驗信息。
在分層貝葉斯模型中,分層的數量可是兩層或者多層。圖 1 為某項多中心臨床試驗的數據采集流程。第一層級為患者水平層(case level),第二層級為中心水平層(center level)。具體的分層貝葉斯模型構建過程在既往文獻中已有報道[3],本文不再贅述。

系列單病例隨機對照試驗的數據具有分層結構的特點[4]。這是分層貝葉斯模型可用于單病例隨機對照試驗數據分析的主要原因。貝葉斯單病例隨機對照試驗中的貝葉斯分析指的是采用分層貝葉斯模型對系列單病例隨機對照試驗的數據進行合并分析。
假設有 n 個單病例隨機對照試驗采用完全相同的研究方案,并且在相同醫院、由同一位醫生實施。這樣的做法可盡量控制混雜因素對合并結果產生的影響。圖 2 為系列單病例隨機對照試驗的數據采集流程。數據分為兩層,第一層為單個單病例隨機對照試驗內部多個治療輪次數據;第二層為多個單病例隨機對照試驗之間數據。

圖 1 中,分層貝葉斯模型通過“多個醫院”的“多個患者的單輪次干預”累積數據。圖 2 中,“系列單病例隨機對照試驗”通過“每個單病例隨機對照試驗的多輪獨立重復干預”累積數據。所以,我們可將系列單病例隨機對照試驗的貝葉斯分析看作分層貝葉斯模型的特殊案例。如系列單病例隨機對照試驗的數據滿足構建分層貝葉斯模型的基本條件(例如:數據可交換性等)時,通過分層貝葉斯模型合并系列單病例隨機對照試驗可以同步獲得個體和群體的療效估計[5]。
4 分層貝葉斯模型用于系列單病例隨機對照試驗統計要求
4.1 信息采集方面
不同單病例隨機對照試驗的實際完成的治療輪次可能不同。采集的信息可能存在缺失值。盡管分層貝葉斯模型允許存在缺失值,但過多的缺失值會影響數據的擬合效果及結果解釋。所以,研究者需事先設定用于統計分析的數據集,例如:至少完成一個輪次干預的患者用于最終的貝葉斯統計分析[6]。
4.2 評價指標方面
由于單病例隨機對照試驗設計的特殊性及數據的自相關性,研究者無法以某個指標的原始值作為評價指標。研究者可將每輪治療期試驗組和對照組測量結果的差值作為評價指標,也可自行規定一個試驗成功的標準。一項阿米替林治療青少年先天性關節炎的單病例隨機對照試驗采用疼痛評分的下降值作為主要療效指標[7]。一項纈草治療慢性失眠的單病例隨機對照試驗規定,如果治療組得分高于對照組,則在這個配對治療期內治療是成功的[8]。
4.3 相關參數的設定
Winbugs 軟件是構建合并單病例隨機對照試驗的貝葉斯模型常用軟件[9]。建模時,需要設定必要的相關參數,例如:先驗分布、Winbugs 軟件的運行參數等。Winbugs 軟件中參數的設置需要保證數據擬合充分收斂,并且在報告中說明具體參數和評價模型收斂的方法。例如:一項中樞神經興奮劑治療兒童腦損傷的單病例隨機對照試驗中采用迭代史和 Gelman-rubin 指標核查模型的收斂程度[10]。
5 分層貝葉斯模型用于合并單病例隨機對照試驗的優點
5.1 先驗信息的使用
通常情況下,既往數據主要用于計算樣本量、確定療效指標等,并不會用于新試驗的統計分析。在分層貝葉斯模型中,既往數據和新的試驗數據屬于一條連續的數據鏈。當有新的試驗數據產生時,數據鏈得到更新,產生更精確的后驗信息。這種數據整合的過程與 Meta 分析的研究思路類似。
5.2 豐富的后驗信息
分層貝葉斯模型可同步估計個體和群體療效、可信區間以及療效均值大于或小于某一數值的概率。豐富的后驗估計信息為臨床決策提供重要依據。此外,還可以用于評估治療的異質性[11, 12]。
5.3 節省樣本量
由于患者是自身對照,單病例隨機對照試驗存在節省樣本量的可能性。很多研究也論證了這一觀點[2]。理論上講,如果單病例隨機對照試驗借鑒序貫設計或適應性設計中終止試驗的方法,極可能節省樣本量,從而預防患者處于不利的風險。
5.4 協變量調整
在分層貝葉斯模型中,混雜因素可作為協變量或分層因素納入模型,從而使結果估計更加精確[13]。因此,合理確定重要的混雜因素是結果估計精確的前提。
6 貝葉斯模型用于合并單病例隨機對照試驗的現狀
早在 20 年前,貝葉斯模型就已被用于單病例隨機對照試驗的合并分析。但這種方法并未被廣泛應用。本課題組前期研究發現[14],至 2016 年僅有 11 篇文獻采用貝葉斯模型合并單病例隨機對照試驗,而這些研究應用于腫瘤、外傷等多個領域。
7 貝葉斯模型用于單病例隨機對照試驗數據分析的難點
7.1 有效的先驗信息不易獲取
獲取有效的先驗信息是構建貝葉斯模型的一個難點。先驗信息與后驗信息密切相關。先驗信息估計的不準確可能造成后驗信息的偏差或錯誤。信息過于廣泛或者缺乏均不利于有效先驗信息的獲取。召開討論會可能是確定先驗信息的重要途徑。
7.2 頻率學派與貝葉斯學派結論的不一致性
由于基本理論的不同,分析同一組數據,貝葉斯統計與頻率統計所得的結論可能不一致。當這種不一致發生時,研究者需要仔細分析原因。當先驗信息較為準確時,由于利用先驗信息,貝葉斯統計獲得的結果可能更接近真值。
7.3 計算的復雜性
貝葉斯模型的構建難度來自于多個方面。研究者對貝葉斯統計的了解程度、使用 Winbugs 軟件的熟練程度、參數選擇等均可能影響模型的構建。
8 小結
貝葉斯單病例隨機對照試驗屬于一種新穎的設計類型,尚處于小規模應用的階段,仍有許多問題尚待完善。盡管如此,由于貝葉斯模型可以提供較為豐富的后驗信息,貝葉斯單病例隨機對照試驗有望成為今后單病例隨機對照試驗的主要類型。
貝葉斯單病例隨機對照試驗是近年來在單病例隨機對照試驗研究領域流行的研究設計。這種設計遵從單病例隨機對照試驗設計的基本要求,但采用分層貝葉斯模型進行統計分析。由于貝葉斯模型可提供較為豐富的后驗信息,其有望成為今后單病例隨機對照試驗的主要類型。本文對貝葉斯單病例隨機對照試驗的分析原理、統計要求等進行介紹。
1 單病例隨機對照試驗的一般流程
單病例隨機對照試驗(N-of-1 trials)是指對單個受試者開展的臨床試驗[1]。通常,單病例隨機對照試驗采用交叉、隨機、雙盲的設計方式。具體來講,受試者需要接受多個輪次的治療。輪次的數量可固定也可不固定。在每輪研究中,患者將經歷兩個治療期,一個治療期內,給予試驗藥物或新療法,另一個治療期內,給予安慰劑或者常規療法。受試者接受試驗還是對照藥物或療法的順序是通過隨機序列產生的,以防止人為因素對分組的不利影響。一般情況下,每個輪次之間會設置一個洗脫期,目的是去除前一個周期治療產生的延遲效應(carryover effect)。
一般情況下,研究者會同時開展多個單病例隨機對照試驗,這些試驗采用相同的試驗方案,稱為系列單病例隨機對照試驗(series of N-of-1 trials)[2]。貝葉斯單病例隨機對照試驗指的就是采用貝葉斯模型進行統計分析的系列單病例隨機對照試驗。
2 系列單病例隨機對照試驗的數據特點
由于設計的特殊性,系列單病例隨機對照試驗的數據具有如下特點:① 自相關性。由于不同的處理措施施加于相同的患者,所以試驗組和對照組的數據之間不可避免地存在自相關性。自相關性的方向和程度可能影響統計分析方法的選擇。② 數據量相對較小。系列單病例隨機對照試驗的樣本量通常較小。當獲得多個相似單病例隨機對照試驗的數據時,研究者可通過合并多個患者的多個輪次數據,提高療效估計的準確性和可靠性。③ 多輪次的重復測量。單病例隨機對照試驗設計使得研究者可獲得多輪次的數據。輪次越多,樣本數據對總體的代表性越高,模型擬合效果可能越好。④ 缺失值問題。在系列單病例隨機對照試驗中,由于患者的治療效果不佳、依從性等原因,不同患者的治療輪次數可能是不同的,從而導致缺失值的發生。貝葉斯統計分析模型對缺失值具有一定的容忍度,在一定程度上避免了剔除缺失病例的問題。
3 分層貝葉斯模型用于單病例隨機對照試驗的分析原理
分層貝葉斯模型可以用于具有分層結構數據的統計分析[3]。先驗信息、樣本信息和后驗信息是貝葉斯模型的三個重要信息。先驗信息來源于既往研究。樣本信息來源于現有數據,貝葉斯模型利用樣本信息更新先驗信息,從而獲得更加可靠的后驗信息。
在分層貝葉斯模型中,分層的數量可是兩層或者多層。圖 1 為某項多中心臨床試驗的數據采集流程。第一層級為患者水平層(case level),第二層級為中心水平層(center level)。具體的分層貝葉斯模型構建過程在既往文獻中已有報道[3],本文不再贅述。

系列單病例隨機對照試驗的數據具有分層結構的特點[4]。這是分層貝葉斯模型可用于單病例隨機對照試驗數據分析的主要原因。貝葉斯單病例隨機對照試驗中的貝葉斯分析指的是采用分層貝葉斯模型對系列單病例隨機對照試驗的數據進行合并分析。
假設有 n 個單病例隨機對照試驗采用完全相同的研究方案,并且在相同醫院、由同一位醫生實施。這樣的做法可盡量控制混雜因素對合并結果產生的影響。圖 2 為系列單病例隨機對照試驗的數據采集流程。數據分為兩層,第一層為單個單病例隨機對照試驗內部多個治療輪次數據;第二層為多個單病例隨機對照試驗之間數據。

圖 1 中,分層貝葉斯模型通過“多個醫院”的“多個患者的單輪次干預”累積數據。圖 2 中,“系列單病例隨機對照試驗”通過“每個單病例隨機對照試驗的多輪獨立重復干預”累積數據。所以,我們可將系列單病例隨機對照試驗的貝葉斯分析看作分層貝葉斯模型的特殊案例。如系列單病例隨機對照試驗的數據滿足構建分層貝葉斯模型的基本條件(例如:數據可交換性等)時,通過分層貝葉斯模型合并系列單病例隨機對照試驗可以同步獲得個體和群體的療效估計[5]。
4 分層貝葉斯模型用于系列單病例隨機對照試驗統計要求
4.1 信息采集方面
不同單病例隨機對照試驗的實際完成的治療輪次可能不同。采集的信息可能存在缺失值。盡管分層貝葉斯模型允許存在缺失值,但過多的缺失值會影響數據的擬合效果及結果解釋。所以,研究者需事先設定用于統計分析的數據集,例如:至少完成一個輪次干預的患者用于最終的貝葉斯統計分析[6]。
4.2 評價指標方面
由于單病例隨機對照試驗設計的特殊性及數據的自相關性,研究者無法以某個指標的原始值作為評價指標。研究者可將每輪治療期試驗組和對照組測量結果的差值作為評價指標,也可自行規定一個試驗成功的標準。一項阿米替林治療青少年先天性關節炎的單病例隨機對照試驗采用疼痛評分的下降值作為主要療效指標[7]。一項纈草治療慢性失眠的單病例隨機對照試驗規定,如果治療組得分高于對照組,則在這個配對治療期內治療是成功的[8]。
4.3 相關參數的設定
Winbugs 軟件是構建合并單病例隨機對照試驗的貝葉斯模型常用軟件[9]。建模時,需要設定必要的相關參數,例如:先驗分布、Winbugs 軟件的運行參數等。Winbugs 軟件中參數的設置需要保證數據擬合充分收斂,并且在報告中說明具體參數和評價模型收斂的方法。例如:一項中樞神經興奮劑治療兒童腦損傷的單病例隨機對照試驗中采用迭代史和 Gelman-rubin 指標核查模型的收斂程度[10]。
5 分層貝葉斯模型用于合并單病例隨機對照試驗的優點
5.1 先驗信息的使用
通常情況下,既往數據主要用于計算樣本量、確定療效指標等,并不會用于新試驗的統計分析。在分層貝葉斯模型中,既往數據和新的試驗數據屬于一條連續的數據鏈。當有新的試驗數據產生時,數據鏈得到更新,產生更精確的后驗信息。這種數據整合的過程與 Meta 分析的研究思路類似。
5.2 豐富的后驗信息
分層貝葉斯模型可同步估計個體和群體療效、可信區間以及療效均值大于或小于某一數值的概率。豐富的后驗估計信息為臨床決策提供重要依據。此外,還可以用于評估治療的異質性[11, 12]。
5.3 節省樣本量
由于患者是自身對照,單病例隨機對照試驗存在節省樣本量的可能性。很多研究也論證了這一觀點[2]。理論上講,如果單病例隨機對照試驗借鑒序貫設計或適應性設計中終止試驗的方法,極可能節省樣本量,從而預防患者處于不利的風險。
5.4 協變量調整
在分層貝葉斯模型中,混雜因素可作為協變量或分層因素納入模型,從而使結果估計更加精確[13]。因此,合理確定重要的混雜因素是結果估計精確的前提。
6 貝葉斯模型用于合并單病例隨機對照試驗的現狀
早在 20 年前,貝葉斯模型就已被用于單病例隨機對照試驗的合并分析。但這種方法并未被廣泛應用。本課題組前期研究發現[14],至 2016 年僅有 11 篇文獻采用貝葉斯模型合并單病例隨機對照試驗,而這些研究應用于腫瘤、外傷等多個領域。
7 貝葉斯模型用于單病例隨機對照試驗數據分析的難點
7.1 有效的先驗信息不易獲取
獲取有效的先驗信息是構建貝葉斯模型的一個難點。先驗信息與后驗信息密切相關。先驗信息估計的不準確可能造成后驗信息的偏差或錯誤。信息過于廣泛或者缺乏均不利于有效先驗信息的獲取。召開討論會可能是確定先驗信息的重要途徑。
7.2 頻率學派與貝葉斯學派結論的不一致性
由于基本理論的不同,分析同一組數據,貝葉斯統計與頻率統計所得的結論可能不一致。當這種不一致發生時,研究者需要仔細分析原因。當先驗信息較為準確時,由于利用先驗信息,貝葉斯統計獲得的結果可能更接近真值。
7.3 計算的復雜性
貝葉斯模型的構建難度來自于多個方面。研究者對貝葉斯統計的了解程度、使用 Winbugs 軟件的熟練程度、參數選擇等均可能影響模型的構建。
8 小結
貝葉斯單病例隨機對照試驗屬于一種新穎的設計類型,尚處于小規模應用的階段,仍有許多問題尚待完善。盡管如此,由于貝葉斯模型可以提供較為豐富的后驗信息,貝葉斯單病例隨機對照試驗有望成為今后單病例隨機對照試驗的主要類型。