單病例隨機對照試驗是針對單個患者開展的試驗。在開展單病例隨機對照試驗的過程中,統計分析是一個不可或缺的重要部分。雖然有文獻報道了已發表單病例隨機對照試驗所采用統計分析方法的種類,但是,尚缺乏對這些分析方法進行對比分析的報道。本文主要討論了單病例隨機對照試驗中常用統計分析方法的特點以及使用過程中需要注意的問題,旨在為研究者開展高質量的單病例隨機對照試驗提供統計分析方法參考。
引用本文: 翟靜波, 商洪才, 李江, 王輝, 代敏, 陳靜. 單病例隨機對照試驗的統計分析方法. 中國循證醫學雜志, 2017, 17(4): 494-496. doi: 10.7507/1672-2531.201701077 復制
單病例隨機對照試驗是針對單個患者開展的試驗。通常,每個單病例隨機對照試驗內部包括多個治療輪次。每個輪次內部包括兩個治療期和一個洗脫期。兩個治療期內,患者隨機接受不同的治療措施,而洗脫期位于兩個治療期之間,用于消除上一個治療期的延遲效應[1]。
在開展單病例隨機對照試驗的過程中,統計分析是一個不可或缺的重要部分。目前,多篇綜述文獻報道了已發表的單病例隨機對照試驗所采用統計分析方法的種類[2,3]。但是,尚缺乏對這些分析方法的對比分析。本文的主要目的是通過介紹單病例隨機對照試驗中常用統計分析方法特點以及使用過程中需要注意的問題,為研究者開展高質量的單病例隨機對照試驗提供統計分析方法參考。
1 圖形分析方法
圖形分析方法是指以圖形的方式顯示數據變化趨勢的分析方法[1]。例如,以時間因素為橫坐標,以測量變量為縱坐標,將數據繪制于圖中,可較為直觀地觀察數據隨時間的變化趨勢,是單病例隨機對照試驗常用的統計分析方法之一。單個或系列單病例隨機對照試驗均可使用圖形分析方法進行統計分析。優點是比較直觀、操作簡便。缺點是屬于統計描述,無法給出統計檢驗結果。
單病例隨機對照試驗最早應用于心理學領域,例如治療兒童多動癥、抑郁、焦慮等。研究對象通常是單個患者,研究目的是了解患者治療后的改善情況,不一定需要統計學檢驗的統計量和P 值,所以,非常適合采用圖形分析方法對數據進行分析。評價藥物療效的單病例隨機對照試驗也同樣可采用圖形分析方法。例如:一項葛根湯治療原發性痛經的單病例隨機對照試驗采用圖形分析方法展示了每個患者痛經癥狀評分在不同時點的變化情況[3]。
2 配對t 檢驗
配對t 檢驗屬于t 檢驗的一種。顧名思義,需要配對數據才能分析。配對t 檢驗是單病例隨機對照試驗常用的統計分析方法之一。由于試驗組和對照組數據來源于同一個患者,可將單病例隨機對照試驗中試驗組和對照組的數據配成對子,采用配對t 檢驗進行統計分析。需要注意的是,如果患者沒有完成一個輪次的兩個治療期,則該輪治療無法為配對t 檢驗提供所需的數據。
一般情況下,我們將單病例隨機對照試驗多個輪次治療看作是獨立重復試驗。假設不同輪次之間的數據相互獨立。當數據服從正態分布時,即可采用配對t 檢驗對同一患者不同治療措施的療效進行比較。當比較多個單病例隨機對照試驗的總體療效時,研究者可將每個患者所有使用試驗藥物的治療期療后測量均值與所有使用對照藥物治療期療后測量均值進行配對。通過上述處理,每個患者只有一組配對數據,即可采用配對t 檢驗進行分析。
3 配對秩和檢驗
配對秩和檢驗屬于非參數檢驗的一種。這種檢驗不考慮資料的分布類型。當數據不服從正態分布時,可采用配對秩和檢驗分析單個或多個單病例隨機對照試驗的數據。配對秩和檢驗所需數據整理方式與配對t 檢驗類似。但是,配對秩和檢驗獲得的結果較為保守。也就是說,當配對秩和檢驗結果顯示差異沒有統計學意義時,采用配對t 檢驗也可能會獲得差異有統計學意義的結論。但是,當配對t 檢驗結果有統計學差異時,配對秩和檢驗不一定能夠得出相同的結論。配對秩和檢驗也是單病例隨機對照試驗常用的統計分析方法之一,例如:張大錚等[4]開展的一項評估益氣養陰中藥治療糖尿病視網膜病變的單病例隨機對照試驗使用了配對秩和檢驗對數據進行分析。
4 協方差分析
當不考慮混雜因素對結果的影響時,研究者可采用配對t 檢驗或配對秩和檢驗進行單個或多個單病例隨機對照試驗的統計分析。當考慮混雜因素影響時,研究者可采用協方差分析。數據分析格式仍以配對形式呈現。需要注意的是,在協方差模型中,需要增加一個區組因素,用于識別不同患者,控制患者因素對結果的影響。例如:一項針刺治療脊髓損傷后下肢痙攣的單病例隨機對照試驗中使用了協方差分析[5]。
5 重復測量方差分析
重復測量方差分析可用于分析具有重復測量特點的數據。單病例隨機對照試驗中存在重復測量變量,例如:考慮到測量值的波動性,研究方案中規定每個時點的觀測值需連續測量 2 或 3 次。研究者可不用計算每個時點重復測量的平均值而是直接將原始測量數據和每個時點的重復測量因素納入模型。此外,研究者還可將單病例隨機對照試驗中的治療輪次變量或者觀察時點變量做為重復測量變量。重復測量方差分析在單病例隨機對照試驗中使用較多,例如:一項六味地黃湯治療腎陰虛證的單病例隨機對照試驗采用重復測量方差分析方法進行統計分析[6]。需要注意的是,除重復測量因素外,研究者還可以將其它混雜因素做為協變量納入重復測量方差分析模型。由于試驗組和對照組數據存在相關性,有些研究以試驗組和對照組測量值之差做為療效指標,而不將分組變量納入模型。
6 Meta 分析方法
Meta 分析是一種合并多個研究數據的統計學分析方法。當多個單病例隨機對照試驗采用相同的研究過程且研究質量較高時,采用 Meta 分析方法獲得總體療效的組間比較結果是一種可行的選擇。Meta 分析也是單病例隨機對照試驗常用的統計分析方法,例如:黃宇虹等[6]采用 Meta 分析方法比較了六味地黃湯治療腎陰虛患者的 Likert 得分和 SF36 量表得分的組間差異;王輝等[7]采用 Meta 分析方法評估了牛黃降壓膠囊治療高血壓單病例隨機對照試驗的療效。
Salima 等[8]在一項安非他明和哌醋甲酯治療兒童多動癥的系統評價中采用 Meta 分析方法將 RCT 與單病例隨機對照試驗證據進行了合并。結果顯示,與單獨合并 RCT 結果相比,加入單病例隨機對照試驗數據后,4 個指標中,有 3 個指標合并結果的可信區間變窄。1 個指標的分析結果由無統計學差異變為有統計學差異。所以,他們認為,當 Meta 分析的目的是整合某一特定領域所有可獲得的證據時,將單病例隨機對照試驗與 RCT 結果合并可能具有潛在的重要價值。
7 分層貝葉斯模型
分層貝葉斯模型屬于分層模型的一種。這種模型的優勢在于通過合并多個單病例隨機對照試驗數據同步獲得群體和個體療效估計及可信區間,同時,還可以獲得效應值大于或小于某一設定值的概率。對于臨床醫生和患者而言,這種概率更容易理解,更有利于做出臨床決策。
一項系統綜述研究表明,目前僅有 11 篇文獻使用分層貝葉斯模型合并單病例隨機對照試驗數據[9]。最早的一篇文章是 1997 年 Zucker 等[10]發表在Journal of Clinical Epidemiology 上的采用分層貝葉斯模型合并 23 個阿米替林治療纖維肌痛的單病例隨機對照試驗。近些年,采用分層貝葉斯模型進行統計分析的單病例隨機對照試驗方案也開始出現在 BMC 系列等雜志上[11,12]。說明這種分析方法正在逐漸被認可和使用。但是,由于合并單病例隨機對照試驗的分層貝葉斯模型需要使用 WinBugs 軟件編程實現,可能在一定程度上限制了這種方法的推廣。
8 卡方檢驗
當單病例隨機對照試驗測量結果為定性資料時,研究者可以采用卡方檢驗或配對卡方檢驗(McNemar 檢驗)比較不同處理組的療效。McNemar 檢驗可以使用單個單病例隨機對照試驗數據也可以使用多個單病例隨機對照試驗數據。卡方檢驗一般用于多個單病例隨機對照試驗的組間比較。
9 小結
單病例隨機對照試驗被認為是“治療試驗”[13]。這種試驗設計的特殊性使得其統計分析具有一定挑戰性。本文深入分析了單病例隨機對照試驗中常用統計分析方法的特點以及使用過程中需要注意的問題。圖形分析方法是最直觀的分析方法,t 檢驗、秩和檢驗、方差分析、卡方檢驗是比較常用的分析方法。重復測量方差分析、Meta 分析屬于較為高級的分析方法。分層貝葉斯模型則是目前逐漸被認可的一種分析方法。
這些分析方法均可以通過軟件實現。t 檢驗、秩和檢驗、方差分析、重復測量方差分析、卡方檢驗可以通過 spss 軟件實現。Meta 分析可以通過 RevMan 軟件實現。分層貝葉斯模型可以通過 Winbugs 軟件編程實現。
需要注意的是,合理的統計分析方法只是獲得真實、可靠結果的一個方面。科學劃分數據集、選擇具有臨床意義的評價指標、樣本量等均會對結果產生影響。所以,研究者在考慮統計分析方法的同時,也應當關注其它影響試驗質量的因素。
單病例隨機對照試驗是針對單個患者開展的試驗。通常,每個單病例隨機對照試驗內部包括多個治療輪次。每個輪次內部包括兩個治療期和一個洗脫期。兩個治療期內,患者隨機接受不同的治療措施,而洗脫期位于兩個治療期之間,用于消除上一個治療期的延遲效應[1]。
在開展單病例隨機對照試驗的過程中,統計分析是一個不可或缺的重要部分。目前,多篇綜述文獻報道了已發表的單病例隨機對照試驗所采用統計分析方法的種類[2,3]。但是,尚缺乏對這些分析方法的對比分析。本文的主要目的是通過介紹單病例隨機對照試驗中常用統計分析方法特點以及使用過程中需要注意的問題,為研究者開展高質量的單病例隨機對照試驗提供統計分析方法參考。
1 圖形分析方法
圖形分析方法是指以圖形的方式顯示數據變化趨勢的分析方法[1]。例如,以時間因素為橫坐標,以測量變量為縱坐標,將數據繪制于圖中,可較為直觀地觀察數據隨時間的變化趨勢,是單病例隨機對照試驗常用的統計分析方法之一。單個或系列單病例隨機對照試驗均可使用圖形分析方法進行統計分析。優點是比較直觀、操作簡便。缺點是屬于統計描述,無法給出統計檢驗結果。
單病例隨機對照試驗最早應用于心理學領域,例如治療兒童多動癥、抑郁、焦慮等。研究對象通常是單個患者,研究目的是了解患者治療后的改善情況,不一定需要統計學檢驗的統計量和P 值,所以,非常適合采用圖形分析方法對數據進行分析。評價藥物療效的單病例隨機對照試驗也同樣可采用圖形分析方法。例如:一項葛根湯治療原發性痛經的單病例隨機對照試驗采用圖形分析方法展示了每個患者痛經癥狀評分在不同時點的變化情況[3]。
2 配對t 檢驗
配對t 檢驗屬于t 檢驗的一種。顧名思義,需要配對數據才能分析。配對t 檢驗是單病例隨機對照試驗常用的統計分析方法之一。由于試驗組和對照組數據來源于同一個患者,可將單病例隨機對照試驗中試驗組和對照組的數據配成對子,采用配對t 檢驗進行統計分析。需要注意的是,如果患者沒有完成一個輪次的兩個治療期,則該輪治療無法為配對t 檢驗提供所需的數據。
一般情況下,我們將單病例隨機對照試驗多個輪次治療看作是獨立重復試驗。假設不同輪次之間的數據相互獨立。當數據服從正態分布時,即可采用配對t 檢驗對同一患者不同治療措施的療效進行比較。當比較多個單病例隨機對照試驗的總體療效時,研究者可將每個患者所有使用試驗藥物的治療期療后測量均值與所有使用對照藥物治療期療后測量均值進行配對。通過上述處理,每個患者只有一組配對數據,即可采用配對t 檢驗進行分析。
3 配對秩和檢驗
配對秩和檢驗屬于非參數檢驗的一種。這種檢驗不考慮資料的分布類型。當數據不服從正態分布時,可采用配對秩和檢驗分析單個或多個單病例隨機對照試驗的數據。配對秩和檢驗所需數據整理方式與配對t 檢驗類似。但是,配對秩和檢驗獲得的結果較為保守。也就是說,當配對秩和檢驗結果顯示差異沒有統計學意義時,采用配對t 檢驗也可能會獲得差異有統計學意義的結論。但是,當配對t 檢驗結果有統計學差異時,配對秩和檢驗不一定能夠得出相同的結論。配對秩和檢驗也是單病例隨機對照試驗常用的統計分析方法之一,例如:張大錚等[4]開展的一項評估益氣養陰中藥治療糖尿病視網膜病變的單病例隨機對照試驗使用了配對秩和檢驗對數據進行分析。
4 協方差分析
當不考慮混雜因素對結果的影響時,研究者可采用配對t 檢驗或配對秩和檢驗進行單個或多個單病例隨機對照試驗的統計分析。當考慮混雜因素影響時,研究者可采用協方差分析。數據分析格式仍以配對形式呈現。需要注意的是,在協方差模型中,需要增加一個區組因素,用于識別不同患者,控制患者因素對結果的影響。例如:一項針刺治療脊髓損傷后下肢痙攣的單病例隨機對照試驗中使用了協方差分析[5]。
5 重復測量方差分析
重復測量方差分析可用于分析具有重復測量特點的數據。單病例隨機對照試驗中存在重復測量變量,例如:考慮到測量值的波動性,研究方案中規定每個時點的觀測值需連續測量 2 或 3 次。研究者可不用計算每個時點重復測量的平均值而是直接將原始測量數據和每個時點的重復測量因素納入模型。此外,研究者還可將單病例隨機對照試驗中的治療輪次變量或者觀察時點變量做為重復測量變量。重復測量方差分析在單病例隨機對照試驗中使用較多,例如:一項六味地黃湯治療腎陰虛證的單病例隨機對照試驗采用重復測量方差分析方法進行統計分析[6]。需要注意的是,除重復測量因素外,研究者還可以將其它混雜因素做為協變量納入重復測量方差分析模型。由于試驗組和對照組數據存在相關性,有些研究以試驗組和對照組測量值之差做為療效指標,而不將分組變量納入模型。
6 Meta 分析方法
Meta 分析是一種合并多個研究數據的統計學分析方法。當多個單病例隨機對照試驗采用相同的研究過程且研究質量較高時,采用 Meta 分析方法獲得總體療效的組間比較結果是一種可行的選擇。Meta 分析也是單病例隨機對照試驗常用的統計分析方法,例如:黃宇虹等[6]采用 Meta 分析方法比較了六味地黃湯治療腎陰虛患者的 Likert 得分和 SF36 量表得分的組間差異;王輝等[7]采用 Meta 分析方法評估了牛黃降壓膠囊治療高血壓單病例隨機對照試驗的療效。
Salima 等[8]在一項安非他明和哌醋甲酯治療兒童多動癥的系統評價中采用 Meta 分析方法將 RCT 與單病例隨機對照試驗證據進行了合并。結果顯示,與單獨合并 RCT 結果相比,加入單病例隨機對照試驗數據后,4 個指標中,有 3 個指標合并結果的可信區間變窄。1 個指標的分析結果由無統計學差異變為有統計學差異。所以,他們認為,當 Meta 分析的目的是整合某一特定領域所有可獲得的證據時,將單病例隨機對照試驗與 RCT 結果合并可能具有潛在的重要價值。
7 分層貝葉斯模型
分層貝葉斯模型屬于分層模型的一種。這種模型的優勢在于通過合并多個單病例隨機對照試驗數據同步獲得群體和個體療效估計及可信區間,同時,還可以獲得效應值大于或小于某一設定值的概率。對于臨床醫生和患者而言,這種概率更容易理解,更有利于做出臨床決策。
一項系統綜述研究表明,目前僅有 11 篇文獻使用分層貝葉斯模型合并單病例隨機對照試驗數據[9]。最早的一篇文章是 1997 年 Zucker 等[10]發表在Journal of Clinical Epidemiology 上的采用分層貝葉斯模型合并 23 個阿米替林治療纖維肌痛的單病例隨機對照試驗。近些年,采用分層貝葉斯模型進行統計分析的單病例隨機對照試驗方案也開始出現在 BMC 系列等雜志上[11,12]。說明這種分析方法正在逐漸被認可和使用。但是,由于合并單病例隨機對照試驗的分層貝葉斯模型需要使用 WinBugs 軟件編程實現,可能在一定程度上限制了這種方法的推廣。
8 卡方檢驗
當單病例隨機對照試驗測量結果為定性資料時,研究者可以采用卡方檢驗或配對卡方檢驗(McNemar 檢驗)比較不同處理組的療效。McNemar 檢驗可以使用單個單病例隨機對照試驗數據也可以使用多個單病例隨機對照試驗數據。卡方檢驗一般用于多個單病例隨機對照試驗的組間比較。
9 小結
單病例隨機對照試驗被認為是“治療試驗”[13]。這種試驗設計的特殊性使得其統計分析具有一定挑戰性。本文深入分析了單病例隨機對照試驗中常用統計分析方法的特點以及使用過程中需要注意的問題。圖形分析方法是最直觀的分析方法,t 檢驗、秩和檢驗、方差分析、卡方檢驗是比較常用的分析方法。重復測量方差分析、Meta 分析屬于較為高級的分析方法。分層貝葉斯模型則是目前逐漸被認可的一種分析方法。
這些分析方法均可以通過軟件實現。t 檢驗、秩和檢驗、方差分析、重復測量方差分析、卡方檢驗可以通過 spss 軟件實現。Meta 分析可以通過 RevMan 軟件實現。分層貝葉斯模型可以通過 Winbugs 軟件編程實現。
需要注意的是,合理的統計分析方法只是獲得真實、可靠結果的一個方面。科學劃分數據集、選擇具有臨床意義的評價指標、樣本量等均會對結果產生影響。所以,研究者在考慮統計分析方法的同時,也應當關注其它影響試驗質量的因素。