多水平模型是既適用于計量資料、又適用于二分類或多分類資料的統計方法。本文通過對各類型的實例數據,分別應用多水平模型、協方差分析和CMH卡方檢驗方法進行分析,探討多水平模型在多中心臨床試驗中心效應分析中的應用。結果表明,在計量資料的中心效應分析中,協方差分析較多水平模型更容易發現中心效應;對分類資料的中心效應,多水平模型更為敏感。可見不同分析方法對中心效應的分析結果不相同,在實際運用中應結合數據自身的結構特點和研究目的,并根據各種方法的適用條件選擇分析方法。
引用本文: 傅瑾, 何佳, 杜亮, 劉關鍵. 多水平模型在臨床試驗中心效應分析中的研究. 生物醫學工程學雜志, 2014, 31(3): 632-636. doi: 10.7507/1001-5515.20140118 復制
引言
多中心臨床試驗(multicenter clinical trial)是指由一個單位的主要研究者總負責,多個單位的研究者合作,按同一個試驗方案同時進行的臨床試驗。多中心臨床試驗可以在較短的時間內入選所需的病例數,且入選的病例范圍廣,試驗的結果更具代表性,但其影響因素亦隨之更趨復雜[1]。
多中心臨床試驗必須在統一的組織領導下,遵循一個共同制定的試驗方案完成整個試驗,并規定統一的納入、排除標準和試驗效應指標,各中心試驗組和對照組病例數的比例應與總樣本的比例相同,以保證各中心齊同可比。
試驗過程中,盡管所有中心都針對同一問題或相同的研究假設進行研究,但各中心通常在研究設計或實施的諸多方面不完全與另一中心相同,難以避免的差異導致了個體結局指標取值在某中心內的相似性[2-3],換言之,同一中心的數據具有聚集性,而不同中心之間的“效應尺度”存在異質性(heterogeneity)。在多中心臨床試驗中這樣的差異性就稱之為“中心效應(center effect)” [4]。
多中心臨床試驗的前提是各中心間結果一致,主效應指標一旦出現中心效應,則試驗結果可能受到影響,結論也可能存在偏倚。因此,多中心臨床試驗的中心效應分析是評價干預措施結果的真實性和可靠性的重要環節。在新藥臨床試驗中若出現中心效應,多數情況下要求重新做該試驗[5]。
多水平模型(multilevel models)的研究和應用始于20世紀80年代初期英國初級中學學校效益分析及美國的補償教育研究,是將Ⅱ型方差分析理論與多元統計分析相結合的新技術,是分析和處理具有層次結構特征的有力工具。其理論、方法及計算技術發展迅速,目前在心理學、社會學、經濟學[6]、地理學、實驗研究、兒童生長發育、流行病學及其他醫學領域應用廣泛,并展現出日益廣闊的應用前景。
多水平數據(multilevel data)或具有多水平層次結構(hierarchical structure)的數據是多水平統計模型(multilevel statistical models)發展和應用的基礎。此類數據的主要特征是反應變量的分布在個體間不具備獨立性,但存在地理距離內、某行政劃區內或特定空間范圍內的聚集性(clustering)。多中心臨床試驗中的數據具有上述典型特征[7]。
在多中心臨床試驗的統計分析中,除了常規統計分析外,還需要對多個中心的各效應指標是否具有一致性進行評價[8]。當前分析中心效應常用的方法有:① 用于計量資料的協方差分析[9];② 適用于定性資料的CMH卡方檢驗;③ logistic回歸(二分類或多分類)。
運用這些常用的統計方法檢驗中心效應時有兩個問題:其一,傳統統計模型的估計方法是建立在個體測量值相互獨立的假設上。當這個假設不成立時,模型中的各參數估計值的有效性和統計特性均會受到影響,從而可能使最終的統計推斷結論存在偏倚。其二,中心變量對同一中心的每一個體的取值是一樣的,即該變量的自由度在同一中心內已經人為擴大了,其結果無疑會影響該變量參數估計值的統計推斷,因為該估計值的標準誤會有偏差[10-11]。
多水平模型按中心進行分層擬合多水平的模型,通過判斷數據在水平2內是否存在相似性或聚集性來判斷中心效應,同時可以將變異從中心(水平2)中分離出來,從而得到個體水平(水平1)的凈效應。
1 研究目的
本研究采用多水平模型對多中心臨床試驗的中心效應(異質性)進行分析,并分別與協方差、CMH卡方檢驗的分析結果進行比較,探討這些統計分析方法在中心效應分析時的適用條件、作用及優缺點,為多水平模型在多中心臨床試驗中心效應分析中的應用提供參考。
2 實例分析
2.1 資料來源
本研究來源于“某新藥預防化療后中性粒細胞減少的療效和安全性的Ⅲ期臨床試驗方案研究”,采用多中心臨床隨機對照研究方法,由19個單位(中心)共同完成。各中心均按臨床試驗前的隨機化方案進行臨床病例的隨機分組,試驗過程中的質量控制由各中心自行質控,主持單位定期或不定期地到各中心進行CRF表的質控。該研究將所有研究對象隨機分為兩組:試驗組和對照組,共納入研究對象326人,其中試驗組160人,對照組166人。該研究以兩組中性粒細胞絕對計數值(ANC)和中性粒細胞減少發生率為分析指標來評價藥物療效。
2.2 數據管理及統計分析方法
數據錄入人員經統一培訓,采用Epitada軟件建立數據庫,數據錄入校對等完成后生成SPSS/SAS/MLwiN等數據庫文件。在SAS9.01、SPSS17.0及MLwiN2.02統計軟件上完成全部數據的統計分析。統計分析采用協方差分析、CMH卡方檢驗、多水平統計模型等方法。若無特殊說明,本研究中檢驗水準均為α=0.05。
3 結果
3.1 分類資料
3.1.1 CMH卡方檢驗
首先分別采用Breslow-Day檢驗與Tarone’s statistics檢驗對各中心中性粒細胞減少發生率同質性進行檢驗,結果如表 1所示。

同質性檢驗結果顯示無統計學意義(P=0.162),提示中心結果具有一致性,可將各中心數據進行合并分析。
采用卡方檢驗,比較兩組中性粒細胞減少發生率,結果如表 2所示。
由卡方檢驗結果可見,兩組中性粒細胞減少發生率的差異無統計學意義(χ2=0.611,P=0.434),尚不能認為兩組中性粒細胞減少發生率不同。

以中心為分層因素,采用CMH卡方檢驗對兩組中性粒細胞減少發生率進行比較,結果如表 3所示。

由CMH卡方檢驗結果可見,兩組中性粒細胞減少發生率的差異無統計學意義(CMH χ2=0.616,P=0.433),尚不能認為兩組中性粒細胞減少發生率不同。
綜上所述,卡方檢驗的結果與將中心作為分層因素而采用CMH卡方檢驗的結果一致,提示無中心效應。
3.1.2 多水平模型
當反應變量為率,一般采用二項分布(binomial distribution)。假定服從標準二項分布的率:
yij~Bin(nij,πij),
其中 i指水平1單位,j指水平2單位,以中性粒細胞減少發生率為反應變量,中心為水平2單位,個體為水平1單位,擬合兩水平logistic回歸模型:
logit(Pij)=(β0+u0j)+β1xij
u0j=β0j-β0 ,u0j~N(0,σu02)
β1為處理因素的效應參數,又稱固定效應(fixed effects)參數。u0j為水平2單位的logit均值β0j與總均值β0之差,又稱為隨機效應(random effects)或高水平的殘差,其方差σu02越大說明數據在高水平單位內的聚集性越強。
運行MLwiN2.02,分析結果如表 4所示。
由多水平模型的分析結果可見,水平2(中心)有統計學意義(P<0.05),可以認為各中心的試驗效應不具有一致性,提示存在中心效應;組別間的差異無統計學意義(P>0.05),尚不能認為兩組治療后中性粒細胞減少的發生情況不同。

3.2 計量資料
3.2.1 協方差分析
對治療前后中性粒細胞絕對計數值ANC進行統計描述,同時,考慮治療前ANC值可能會對療效產生影響,故以療前值為協變量,考慮中心效應以及中心與組別的交互作用,建立ANC比較的協方差分析模型,其結果如表 5所示。

由兩組治療后ANC比較的協方差分析結果可見,療前值對結果的影響有統計學意義(F=28.499,P=0.000);各中心間的差異有統計學意義(F=2.372,P=0.002),尚不能認為各中心的試驗效應具有一致性,提示存在中心效應;中心與組別的交互作用無統計學意義(F=0.741,P=0.768);兩組ANC的差別無統計學意義(F=3.668,P=0.056),尚不能認為兩組治療后ANC不同。
上述統計分析結果表明該研究中心與組別的交互作用無統計學意義,故重新擬合不考慮交互作用的協方差模型,其結果如表 6所示。

由兩組治療后ANC比較的協方差分析結果可見,療前值對結果的影響有統計學意義(F=33.057,P=0.000);各中心間的差異有統計學意義(F=2.499,P=0.001),尚不能認為各中心的試驗效應具有一致性,提示存在中心效應;兩組ANC的差別有統計學意義(F=9.981,P=0.002),尚不能認為兩組治療后ANC相同。
3.2.2 多水平模型
比較組間治療前后ANC實測值,以中心為水平2單位,個體為水平1單位,擬合兩水平方差成分模型:
yij=β0j+β1Xij +e0ij ,β0j=β0+ u0j
u0j~N(0,σu02),e0ij ~N(0,σe02),
其中 i表示水平1單位(個體),j表示水平2單位(中心),X表示組別,β0j為截距,e0ij為個體水平的隨機誤差項,σu02和σe02描述模型的隨機效應。σu02為中心水平的方差成分,σe02為個體水平的方差成分。
運行MLwiN2.02,分析結果如表 7所示。

由多水平模型的分析結果可見,水平2(中心)無統計學意義(P>0.05),可以認為各中心的試驗效應具有一致性,不存在中心效應;組別間的差異有統計學意義(P<0.05),尚不能認為兩組治療后ANC相同。
3.3 各分析方法的結果匯總(見表 8

對于分類資料,分別采用CMH卡方檢驗和多水平模型對中心效應進行分析。CMH檢驗結果為:同質性檢驗結果無統計學意義,χ2檢驗與采用CMH卡方檢驗的結果一致,即提示各中心具有一致性,不存在中心效應;多水平模型結果為:水平2(中心)有統計學意義,不能認為各中心的試驗效應具有一致性,提示存在中心效應。兩種方法對中心效應的檢驗結果不一致,提示各種方法對分類資料異質性的敏感性程度不同,多水平模型較為敏感。
對于計量資料,分別采用協方差分析與多水平模型對中心效應進行分析。協方差分析結果為:各中心間的差異有統計學意義,不能認為各中心的試驗效應具有一致性,提示存在中心效應,但中心與組別的交互作用無統計學意義;多水平模型結果為:水平2(中心)無統計學意義,可以認為各中心的試驗效應具有一致性,不存在中心效應。兩種方法對中心效應的檢驗結果不一致,這提示各種方法對計量數據異質性的敏感性程度不同,協方差分析較為敏感。
4 討論
本研究結果顯示,在多中心臨床試驗中可使用多水平模型實現中心效應的分析,該方法不僅適用于二分類、有序分類和無序分類資料[12],也可用于計量資料,較傳統的統計分析方法有更加廣闊的應用空間。
對分類資料,多水平模型通過將隨機誤差項隨機分解到與數據層次結構相應的水平上,除了使得個體水平的隨機誤差更純,還可了解高水平的情況,即可以直接得到中心效應的情況和考慮了中心效應的組間比較結果,并且提供了進一步擬合研究水平上復雜誤差結構的可能。采用傳統的CMH卡方檢驗時,只能通過比較分層前后的分析結果間接了解是否有中心效應,研究結果也顯示,對分類資料的中心效應分析,多水平模型較CMH卡方檢驗更為敏感。進一步進行多因素的分析時,雖然CMH卡方檢驗也可對多因素進行分層處理,但是當分層因素較多時,單元格被劃分得越來越細,列聯表的格子中頻數可能很小甚至為0,一方面對樣本含量的要求較大,另一方面也將導致檢驗結果的不可靠。
對計量資料,臨床試驗中常涉及重復測量數據[13],多水平統計模型通過將數據的不同層次設置為不同水平,將低水平的隨機誤差分解到數據系統結構的相應水平上,從而獲得處理具有層次結構的數據的明顯優勢,以充分考慮數據的層次性和各層內數據之間的相關性,對數據資料提供的信息的利用也較其他統計分析方法更為充分,從而可以對重復測量資料的多次觀測數據進行更加全面和系統的分析。目前對于多中心臨床試驗重復測量的計量資料,其中心效應分析往往使用協方差分析,而同一個體的重復測量數據間往往存在相關性,這就違反了方差分析模型要求的數據獨立性,這時若仍采用協方差分析,就只能在各時間點分別進行分析,孤立地看待各時間點的觀測值,沒有充分考慮各觀測點之間的相關性,不能充分利用該類資料所提供的信息,所得結論會有一定的偏倚。此時雖然可考慮采用單變量重復測量的方差分析來分析重復測量資料各測量點間的相關性,但此法對協方差結構有更嚴格的要求,須通過球性檢驗,否則就需用校正因子對F分布的自由度加以校正,這種校正分析對于各種各樣的方差和協方差結構顯然是不夠的,且多次單變量分析也會增大犯Ⅰ型錯誤的概率。
多水平模型還可在其固定或隨機部分輕松引入任何水平上測量到的解釋變量,使得研究者能夠探討各水平單位的特征對反應變量的影響,以及對反應變量在高水平單位甚至是低水平位之間變異的影響,分析結果的影響因素及可能的變化趨勢。對分類資料采用logistic回歸模型,以及對計量資料采用協方差分析或多元線性回歸,也可以同時分析多個解釋變量的影響,以及各變量間的交互作用,但是,這些分析方法都是建立在單水平上的,當遇到多中心臨床試驗這樣具有層次結構的數據,如前所述,忽略了數據在高水平的聚集性,其統計分析結論可能會有一定的偏倚。
當然,多水平模型也有其局限性,如:對非正態分布數據擬合模型較困難;當水平增多、解釋變量增多時,會增加對分析結果解釋的困難;當中心數較多時,不宜將中心設為啞變量對中心效應進行處理,這樣不但增加了擬合模型的復雜程度,同時減少了擬合優度的自由度,此時常用隨機效應來表示中心效應,即將中心作為一個更高的層次來擬合模型,但是多中心臨床試驗常需要檢驗中心與組別間的交互作用,多水平模型無法擬合高層次單位與低層次單位變量間的交互作用,因此將中心作為高層次單位以后,將不能分析中心(高層次)和組別(低層次)的交互作用。
多水平模型對多中心臨床試驗數據的處理有獨特的優勢,但是研究也顯示各種分析方法對中心效應的估計不盡一致,因此在實際運用中應結合待分析數據自身的結構特點和研究目的,并根據各種方法的適用條件來選擇適當的分析方法,可以采用多種分析方法同時進行綜合分析,以減少偏倚,提高研究結論的可靠性和準確性。
引言
多中心臨床試驗(multicenter clinical trial)是指由一個單位的主要研究者總負責,多個單位的研究者合作,按同一個試驗方案同時進行的臨床試驗。多中心臨床試驗可以在較短的時間內入選所需的病例數,且入選的病例范圍廣,試驗的結果更具代表性,但其影響因素亦隨之更趨復雜[1]。
多中心臨床試驗必須在統一的組織領導下,遵循一個共同制定的試驗方案完成整個試驗,并規定統一的納入、排除標準和試驗效應指標,各中心試驗組和對照組病例數的比例應與總樣本的比例相同,以保證各中心齊同可比。
試驗過程中,盡管所有中心都針對同一問題或相同的研究假設進行研究,但各中心通常在研究設計或實施的諸多方面不完全與另一中心相同,難以避免的差異導致了個體結局指標取值在某中心內的相似性[2-3],換言之,同一中心的數據具有聚集性,而不同中心之間的“效應尺度”存在異質性(heterogeneity)。在多中心臨床試驗中這樣的差異性就稱之為“中心效應(center effect)” [4]。
多中心臨床試驗的前提是各中心間結果一致,主效應指標一旦出現中心效應,則試驗結果可能受到影響,結論也可能存在偏倚。因此,多中心臨床試驗的中心效應分析是評價干預措施結果的真實性和可靠性的重要環節。在新藥臨床試驗中若出現中心效應,多數情況下要求重新做該試驗[5]。
多水平模型(multilevel models)的研究和應用始于20世紀80年代初期英國初級中學學校效益分析及美國的補償教育研究,是將Ⅱ型方差分析理論與多元統計分析相結合的新技術,是分析和處理具有層次結構特征的有力工具。其理論、方法及計算技術發展迅速,目前在心理學、社會學、經濟學[6]、地理學、實驗研究、兒童生長發育、流行病學及其他醫學領域應用廣泛,并展現出日益廣闊的應用前景。
多水平數據(multilevel data)或具有多水平層次結構(hierarchical structure)的數據是多水平統計模型(multilevel statistical models)發展和應用的基礎。此類數據的主要特征是反應變量的分布在個體間不具備獨立性,但存在地理距離內、某行政劃區內或特定空間范圍內的聚集性(clustering)。多中心臨床試驗中的數據具有上述典型特征[7]。
在多中心臨床試驗的統計分析中,除了常規統計分析外,還需要對多個中心的各效應指標是否具有一致性進行評價[8]。當前分析中心效應常用的方法有:① 用于計量資料的協方差分析[9];② 適用于定性資料的CMH卡方檢驗;③ logistic回歸(二分類或多分類)。
運用這些常用的統計方法檢驗中心效應時有兩個問題:其一,傳統統計模型的估計方法是建立在個體測量值相互獨立的假設上。當這個假設不成立時,模型中的各參數估計值的有效性和統計特性均會受到影響,從而可能使最終的統計推斷結論存在偏倚。其二,中心變量對同一中心的每一個體的取值是一樣的,即該變量的自由度在同一中心內已經人為擴大了,其結果無疑會影響該變量參數估計值的統計推斷,因為該估計值的標準誤會有偏差[10-11]。
多水平模型按中心進行分層擬合多水平的模型,通過判斷數據在水平2內是否存在相似性或聚集性來判斷中心效應,同時可以將變異從中心(水平2)中分離出來,從而得到個體水平(水平1)的凈效應。
1 研究目的
本研究采用多水平模型對多中心臨床試驗的中心效應(異質性)進行分析,并分別與協方差、CMH卡方檢驗的分析結果進行比較,探討這些統計分析方法在中心效應分析時的適用條件、作用及優缺點,為多水平模型在多中心臨床試驗中心效應分析中的應用提供參考。
2 實例分析
2.1 資料來源
本研究來源于“某新藥預防化療后中性粒細胞減少的療效和安全性的Ⅲ期臨床試驗方案研究”,采用多中心臨床隨機對照研究方法,由19個單位(中心)共同完成。各中心均按臨床試驗前的隨機化方案進行臨床病例的隨機分組,試驗過程中的質量控制由各中心自行質控,主持單位定期或不定期地到各中心進行CRF表的質控。該研究將所有研究對象隨機分為兩組:試驗組和對照組,共納入研究對象326人,其中試驗組160人,對照組166人。該研究以兩組中性粒細胞絕對計數值(ANC)和中性粒細胞減少發生率為分析指標來評價藥物療效。
2.2 數據管理及統計分析方法
數據錄入人員經統一培訓,采用Epitada軟件建立數據庫,數據錄入校對等完成后生成SPSS/SAS/MLwiN等數據庫文件。在SAS9.01、SPSS17.0及MLwiN2.02統計軟件上完成全部數據的統計分析。統計分析采用協方差分析、CMH卡方檢驗、多水平統計模型等方法。若無特殊說明,本研究中檢驗水準均為α=0.05。
3 結果
3.1 分類資料
3.1.1 CMH卡方檢驗
首先分別采用Breslow-Day檢驗與Tarone’s statistics檢驗對各中心中性粒細胞減少發生率同質性進行檢驗,結果如表 1所示。

同質性檢驗結果顯示無統計學意義(P=0.162),提示中心結果具有一致性,可將各中心數據進行合并分析。
采用卡方檢驗,比較兩組中性粒細胞減少發生率,結果如表 2所示。
由卡方檢驗結果可見,兩組中性粒細胞減少發生率的差異無統計學意義(χ2=0.611,P=0.434),尚不能認為兩組中性粒細胞減少發生率不同。

以中心為分層因素,采用CMH卡方檢驗對兩組中性粒細胞減少發生率進行比較,結果如表 3所示。

由CMH卡方檢驗結果可見,兩組中性粒細胞減少發生率的差異無統計學意義(CMH χ2=0.616,P=0.433),尚不能認為兩組中性粒細胞減少發生率不同。
綜上所述,卡方檢驗的結果與將中心作為分層因素而采用CMH卡方檢驗的結果一致,提示無中心效應。
3.1.2 多水平模型
當反應變量為率,一般采用二項分布(binomial distribution)。假定服從標準二項分布的率:
yij~Bin(nij,πij),
其中 i指水平1單位,j指水平2單位,以中性粒細胞減少發生率為反應變量,中心為水平2單位,個體為水平1單位,擬合兩水平logistic回歸模型:
logit(Pij)=(β0+u0j)+β1xij
u0j=β0j-β0 ,u0j~N(0,σu02)
β1為處理因素的效應參數,又稱固定效應(fixed effects)參數。u0j為水平2單位的logit均值β0j與總均值β0之差,又稱為隨機效應(random effects)或高水平的殘差,其方差σu02越大說明數據在高水平單位內的聚集性越強。
運行MLwiN2.02,分析結果如表 4所示。
由多水平模型的分析結果可見,水平2(中心)有統計學意義(P<0.05),可以認為各中心的試驗效應不具有一致性,提示存在中心效應;組別間的差異無統計學意義(P>0.05),尚不能認為兩組治療后中性粒細胞減少的發生情況不同。

3.2 計量資料
3.2.1 協方差分析
對治療前后中性粒細胞絕對計數值ANC進行統計描述,同時,考慮治療前ANC值可能會對療效產生影響,故以療前值為協變量,考慮中心效應以及中心與組別的交互作用,建立ANC比較的協方差分析模型,其結果如表 5所示。

由兩組治療后ANC比較的協方差分析結果可見,療前值對結果的影響有統計學意義(F=28.499,P=0.000);各中心間的差異有統計學意義(F=2.372,P=0.002),尚不能認為各中心的試驗效應具有一致性,提示存在中心效應;中心與組別的交互作用無統計學意義(F=0.741,P=0.768);兩組ANC的差別無統計學意義(F=3.668,P=0.056),尚不能認為兩組治療后ANC不同。
上述統計分析結果表明該研究中心與組別的交互作用無統計學意義,故重新擬合不考慮交互作用的協方差模型,其結果如表 6所示。

由兩組治療后ANC比較的協方差分析結果可見,療前值對結果的影響有統計學意義(F=33.057,P=0.000);各中心間的差異有統計學意義(F=2.499,P=0.001),尚不能認為各中心的試驗效應具有一致性,提示存在中心效應;兩組ANC的差別有統計學意義(F=9.981,P=0.002),尚不能認為兩組治療后ANC相同。
3.2.2 多水平模型
比較組間治療前后ANC實測值,以中心為水平2單位,個體為水平1單位,擬合兩水平方差成分模型:
yij=β0j+β1Xij +e0ij ,β0j=β0+ u0j
u0j~N(0,σu02),e0ij ~N(0,σe02),
其中 i表示水平1單位(個體),j表示水平2單位(中心),X表示組別,β0j為截距,e0ij為個體水平的隨機誤差項,σu02和σe02描述模型的隨機效應。σu02為中心水平的方差成分,σe02為個體水平的方差成分。
運行MLwiN2.02,分析結果如表 7所示。

由多水平模型的分析結果可見,水平2(中心)無統計學意義(P>0.05),可以認為各中心的試驗效應具有一致性,不存在中心效應;組別間的差異有統計學意義(P<0.05),尚不能認為兩組治療后ANC相同。
3.3 各分析方法的結果匯總(見表 8

對于分類資料,分別采用CMH卡方檢驗和多水平模型對中心效應進行分析。CMH檢驗結果為:同質性檢驗結果無統計學意義,χ2檢驗與采用CMH卡方檢驗的結果一致,即提示各中心具有一致性,不存在中心效應;多水平模型結果為:水平2(中心)有統計學意義,不能認為各中心的試驗效應具有一致性,提示存在中心效應。兩種方法對中心效應的檢驗結果不一致,提示各種方法對分類資料異質性的敏感性程度不同,多水平模型較為敏感。
對于計量資料,分別采用協方差分析與多水平模型對中心效應進行分析。協方差分析結果為:各中心間的差異有統計學意義,不能認為各中心的試驗效應具有一致性,提示存在中心效應,但中心與組別的交互作用無統計學意義;多水平模型結果為:水平2(中心)無統計學意義,可以認為各中心的試驗效應具有一致性,不存在中心效應。兩種方法對中心效應的檢驗結果不一致,這提示各種方法對計量數據異質性的敏感性程度不同,協方差分析較為敏感。
4 討論
本研究結果顯示,在多中心臨床試驗中可使用多水平模型實現中心效應的分析,該方法不僅適用于二分類、有序分類和無序分類資料[12],也可用于計量資料,較傳統的統計分析方法有更加廣闊的應用空間。
對分類資料,多水平模型通過將隨機誤差項隨機分解到與數據層次結構相應的水平上,除了使得個體水平的隨機誤差更純,還可了解高水平的情況,即可以直接得到中心效應的情況和考慮了中心效應的組間比較結果,并且提供了進一步擬合研究水平上復雜誤差結構的可能。采用傳統的CMH卡方檢驗時,只能通過比較分層前后的分析結果間接了解是否有中心效應,研究結果也顯示,對分類資料的中心效應分析,多水平模型較CMH卡方檢驗更為敏感。進一步進行多因素的分析時,雖然CMH卡方檢驗也可對多因素進行分層處理,但是當分層因素較多時,單元格被劃分得越來越細,列聯表的格子中頻數可能很小甚至為0,一方面對樣本含量的要求較大,另一方面也將導致檢驗結果的不可靠。
對計量資料,臨床試驗中常涉及重復測量數據[13],多水平統計模型通過將數據的不同層次設置為不同水平,將低水平的隨機誤差分解到數據系統結構的相應水平上,從而獲得處理具有層次結構的數據的明顯優勢,以充分考慮數據的層次性和各層內數據之間的相關性,對數據資料提供的信息的利用也較其他統計分析方法更為充分,從而可以對重復測量資料的多次觀測數據進行更加全面和系統的分析。目前對于多中心臨床試驗重復測量的計量資料,其中心效應分析往往使用協方差分析,而同一個體的重復測量數據間往往存在相關性,這就違反了方差分析模型要求的數據獨立性,這時若仍采用協方差分析,就只能在各時間點分別進行分析,孤立地看待各時間點的觀測值,沒有充分考慮各觀測點之間的相關性,不能充分利用該類資料所提供的信息,所得結論會有一定的偏倚。此時雖然可考慮采用單變量重復測量的方差分析來分析重復測量資料各測量點間的相關性,但此法對協方差結構有更嚴格的要求,須通過球性檢驗,否則就需用校正因子對F分布的自由度加以校正,這種校正分析對于各種各樣的方差和協方差結構顯然是不夠的,且多次單變量分析也會增大犯Ⅰ型錯誤的概率。
多水平模型還可在其固定或隨機部分輕松引入任何水平上測量到的解釋變量,使得研究者能夠探討各水平單位的特征對反應變量的影響,以及對反應變量在高水平單位甚至是低水平位之間變異的影響,分析結果的影響因素及可能的變化趨勢。對分類資料采用logistic回歸模型,以及對計量資料采用協方差分析或多元線性回歸,也可以同時分析多個解釋變量的影響,以及各變量間的交互作用,但是,這些分析方法都是建立在單水平上的,當遇到多中心臨床試驗這樣具有層次結構的數據,如前所述,忽略了數據在高水平的聚集性,其統計分析結論可能會有一定的偏倚。
當然,多水平模型也有其局限性,如:對非正態分布數據擬合模型較困難;當水平增多、解釋變量增多時,會增加對分析結果解釋的困難;當中心數較多時,不宜將中心設為啞變量對中心效應進行處理,這樣不但增加了擬合模型的復雜程度,同時減少了擬合優度的自由度,此時常用隨機效應來表示中心效應,即將中心作為一個更高的層次來擬合模型,但是多中心臨床試驗常需要檢驗中心與組別間的交互作用,多水平模型無法擬合高層次單位與低層次單位變量間的交互作用,因此將中心作為高層次單位以后,將不能分析中心(高層次)和組別(低層次)的交互作用。
多水平模型對多中心臨床試驗數據的處理有獨特的優勢,但是研究也顯示各種分析方法對中心效應的估計不盡一致,因此在實際運用中應結合待分析數據自身的結構特點和研究目的,并根據各種方法的適用條件來選擇適當的分析方法,可以采用多種分析方法同時進行綜合分析,以減少偏倚,提高研究結論的可靠性和準確性。