隨著區域醫療大數據平臺的建立和不斷完善,區域醫療大數據在醫藥政策研究評價中越來越凸顯出重要的作用。區域醫療大數據通常具有層次結構,傳統的統計分析模型因不能處理層次結構的數據而受到限制,多水平模型是處理層次結構數據的有力統計分析工具,近年來受到國外政策評價研究者的廣泛關注,而國內缺乏其在醫藥政策評價中的應用。本文介紹了多水平模型構建的總體思路及其在醫藥政策評價領域中的幾種常見應用場景,以期為未來利用區域醫療大數據或層次結構數據評價醫療政策實施效果提供方法學參考。
引用本文: 任燕, 黃云香, 仉元瑾, 姚明宏, 賈玉龍, 楊珉, 孫鑫. 多水平模型及其在醫藥政策評價研究領域的應用. 中國循證醫學雜志, 2021, 21(12): 1474-1479. doi: 10.7507/1672-2531.202108101 復制
多水平模型(multilevel models)是基于多水平數據(層次結構數據)發展和應用起來的統計分析方法[1]。因學科領域的不同,多水平模型在不同領域的叫法存在差異,例如在社會學研究領域中,多水平模型被稱為層次線性模型(hierarchical linear models);在生物統計領域被稱為混合效應模型(mixed-effect models)或隨機效應模型(random-effect models),在計量經濟學領域被稱為隨機系數模型(random coefficient models)[2]。多水平模型最先應用于教育學領域,因多水平模型對不同層次數據處理具有統計學優勢,近年來在心理學、社會學、經濟學、組織行為與管理科學、醫學和公共衛生等領域均得到了廣泛的應用。
傳統的醫藥政策評價研究中,多采用調查的方式,收集的數據量有限且很少存在層次結構,數據為單水平結構,此時傳統的統計方法即可用于政策實施效果評價。在醫藥政策評價研究中,若數據具有層次或聚類結構,如采用全國基層醫療機構數據評價基本藥物制度實施效果的研究,其數據的多層次結構表現為縣嵌套于市,市嵌套于省,省嵌套于國家或地區[3],此時傳統統計模型因不能處理具有層次結構的數據,不再適用于此類研究。近幾年,隨著區域醫療大數據的發展與可及(如天津、濟南、廈門區域醫療大數據等),區域醫療大數據在政策評價研究中的運用越來越凸顯。而區域醫療大數據通常具有醫療機構嵌套于區,區嵌套于市的層次結構,這種具有層次機構的數據在同一層次內具有較高的相似性、不同層次具有較強的異質性,亟需創新研究方法從不同角度評價醫藥政策實施的效果[4]。
在醫藥政策效果評價中,針對多層次結構數據,采用多水平統計方法對政策實施效果進行統計分析,已成為方法學研究的熱點。近年來,國內外相關學者開始探索多水平模型用于醫藥政策的評價,如美國、加拿大、瑞典、我國已有學者采用多水平間斷時間序列模型(interrupted time-series,ITS)、多水平雙重差分模型(difference-in-difference,DID)和多水平重復測量模型評價政策的實施效果[5-9]。國內尚缺乏有關多水平模型在醫藥政策評價領域的方法學介紹和情景分析,鑒于此,本文介紹多水平模型建模的總體思路及其在醫藥政策評價研究中的幾種常見應用場景,以期為未來利用區域醫療大數據評價政策實施效果提供方法學參考。
1 多水平模型的數據結構類型
多水平數據指觀測數據在單位上具有嵌套的關系,如患者嵌套于醫院,醫院嵌套于地區,形成了三水平的數據結構,三水平數據結構示意圖見圖1,箭頭方向表示低水平單元嵌套于高水平單元內。若只存在患者嵌套于醫院時,三水平數據結構就變成了兩水平的數據結構。

2 傳統線性模型與兩水平線性模型的差異性分析
現以簡單的傳統線性模型與兩水平線性模型為例,介紹多水平統計分析模型的原理。
傳統線性模型的模型設定:
![]() |
兩水平線性模型的模型設定:
![]() |
表達式中:i指水平1單位,如患者;j為水平1所屬的水平2單位,如醫院,為
在水平2的隨機效應,
為水平1的殘差,即隨機誤差。圖2中的
表示傳統線性模型所獲得的總均值,
、
、
表示兩水平線性模型中水平2單位的均值。從傳統線性模型與兩水平線性模型表達式及其殘差示意圖2可以清晰的發現,兩水平線性模型可將殘差進行分解為一水平的殘差和二水平的殘差,如果二水平的殘差
為0,則可直接采用傳統線性模型,如果二水平的殘差
不為0,則應該采用兩水平線性模型。

3 多水平模型建模總體思路
根據研究者的目的和數據資料的情況不同,多水平模型存在不同類型,如:多水平線性回歸、多水平logistic回歸、多水平poisson回歸、多水平Cox回歸、多元多水平模型、多水平交叉分類模型、多水平樣條函數模型、多水平結構方程模型等。多水平模型雖然存在不同類型,但其建模的總體思路是類似的,如圖3。以構建兩水平線性模型為例,首先建立僅包含隨機截距項的兩水平的空模型,對空模型中的兩水平的方差進行檢驗,若該檢驗結果有統計學意義,說明存在兩水平的層次結構,進一步構建隨機截距模型,即在空模型中加入固定效應的自變量,若想進一步估計隨機截距模型中自變量的隨機效應,則需構建隨機系數模型,若進一步考慮加入兩水平的自變量,則形成了全模型。

3.1 構建空模型
空模型中只包含截距項,不包含任何自變量。多水平模型的空模型與傳統回歸模型的區別在于截距項,傳統回歸模型中的截距項為固定變量,即總均值只有一個,是固定的,不會在水平2上存在變化,而多水平模型的空模型中的截距項為隨機效應,即總體均值在不同的水平存在變異,如水平2有5家醫院,可得到5家醫院不同的均值。兩水平線性空模型的模型設定為:
![]() |
![]() |
![]() |
表達式中:i指水平1單位,如患者;j為水平1所屬的水平2單位,如醫院;為
的總平均,
為
在水平2的殘差,即
在水平2的隨機效應,代表組間變異;
為水平1的殘差,即隨機誤差,代表組內變異;
為組間方差,
為組內方差,對其進行假設檢驗,若假設檢驗發現其存在差異,則應采用兩水平模型。
3.2 構建隨機截距模型
隨機截距模型是在上述空模型的基礎上加入水平1的變量,且自變量是固定效應。假設只納入水平1單位1個自變量,隨機截距模型表達為:
![]() |
表達式中:為加入的水平1自變量,
為
對y的固定效應。
3.3 構建隨機系數模型
隨機系數模型是在隨機截距模型的基礎上考慮自變量的隨機效應。隨機系數模型表達為:
![]() |
![]() |
![]() |
表達式中:為
對y的平均效應,
為
的隨機效應,通過對隨機效應
的方差系數
進行假設檢驗,可以發現兩水平各單元的效應分布,如兩水平各個醫院的效應分布,通過對隨機效應
進行排序,可判斷兩水平的哪個單元效應最高或最低。
3.4 全模型
全模型即在隨機系數模型中進一步加入水平2的自變量。假設只納入水平2的1個自變量,全模型表達為:
![]() |
表達式中:為加入的水平2自變量,
為
對y的固定效應,由于
是水平2的自變量,所以不能構建其隨機效應。
以上為兩水平模型的構建總體思路,該思路可以擴展到三水平及以上水平的模型,同時結局變量類型是二分類或者事件發生數等也適用。
4 多水平模型在醫藥政策實施效果評價領域的幾種常見應用場景
多水平模型在醫藥政策實施效果評價領域可以應用但不限于以下幾種常見的場景,以評價基本藥物制度的實施效果為例進行介紹各種場景,其因變量為基層醫療衛生機構的服務量。研究數據均是全省的基層醫療衛生機構,則同一個縣中的基層醫療衛生機構的服務量可能更為接近,這就造成了數據間不獨立,從而需在傳統的模型基礎上考慮多水平的數據結構,采用對應的多水平模型。
4.1 多水平ITS模型評價基本藥物制度實施對基層醫療衛生機構服務量的影響
4.1.1 研究問題
評價基本藥物制度實施前后基層醫療衛生機構服務量的變化趨勢,評估政策干預對基層醫療衛生機構服務量的影響。
4.1.2 研究設計
研究設計為某個省實施前和實施后基層醫療衛生機構多次重復測量的數據,如2008年未實施基本藥物制度,2009年實施了基本藥物制度,2008年和2009年每個月均測量了基層醫療衛生機構的服務量。該研究只有一個省份數據,沒有其他省份作為對照。
4.2.3 多水平ITS
針對4.1.1研究問題和4.1.2研究設計,需采用多水平ITS,其模型基本表達式如下:
![]() |
![]() |
![]() |
該模型不同于傳統的ITS,考慮了數據的層次結構,即考慮了不同測量時間點在同一醫療機構水平的聚集性,模型中變量是指基層醫療衛生機構i在時間點t處的服務量;
是一個連續變量,指從時間序列起始處計算的時間點t;
是一個虛擬變量,政策實施前則取0,政策實施后則取1。參數
是服務量的基線水平平均估計值,即t=0時基層醫療機構服務量的平均值,隨機部分
分別代表基層醫療機構服務量平均估計值的方差,隨機變量
表示i基層醫療機構服務量與總體均數
之差;
是干預實施前基層醫療機構服務量隨單位時間變量t變化的趨勢估計值,即基線斜率估計值;
是指政策實施前時間分段末端處與實施后時間分段的起始處的指標水平值的差值,即政策引起的基層醫療機構服務量水平變化的估計值;
是政策實施后時間分段趨勢值(斜率)與實施前時間分段趨勢值的差值,即政策實施引起的基層醫療機構服務量的趨勢變化估計值;即
與
的和為政策實施后時間分段趨勢的斜率,該模型也可以直接加入協變量。
4.2 多水平DID模型評價基本藥物制度實施對基層醫療衛生機構服務量的影響
4.2.1 研究問題
評價基本藥物制度實施前后基層醫療衛生機構服務量的變化趨勢,評估政策干預對基層醫療衛生機構服務量的影響。
4.2.2 研究設計
兩個省的基層醫療衛生機構在2008年均未實施基本藥物制度,在2009年其中一個省實施了基本藥物制度,而另外一個省仍未實施基本藥物制度。兩個省份的基層醫療衛生機構可比可以通過傾向性評分匹配實現。該研究涉及兩個不同的省份相互對照和自身前后對照。
4.2.3 多水平DID模型
針對4.2.1研究問題和4.2.2研究設計,需采用多水平DID模型的統計方法。兩水平的DID模型如下:
![]() |
![]() |
![]() |
模型中機構為水平一,縣為水平二,i、j代表水平1、2,該模型中和
均是分類變量。該模型考慮了截距項的隨機效應,即基層醫療衛生機構服務量在不同水平結構的層次效應,隨機部分
代表縣水平上的基層醫療衛生機構服務量平均估計值的方差,并且假設服從正態分布,隨機變量
表示j縣的服務量均數與總體均數之差。該模型中
為固定效應系數,表示兩個時間點上的政策干預效應,也可進一步考慮其隨機效應,估計不同縣基層醫療衛生機構服務量的影響效應,比較哪些縣政策實施效果更好,同時該模型也可直接加入其余協變量。
4.3 多水平重復測量模型評價基本藥物制度實施效果的劑量反應效應
4.3.1 研究問題
評價全國2008~2012年基本藥物制度實施效果是否存在劑量-反應關系,即是否基本藥物制度實施時間越長,基層醫療衛生機構服務量增加的越多。
4.3.2 研究設計
全國基本藥物制度是從2009至2012年逐步實施的,從而2008年所有基層醫療機構均未實施基本藥物制度,2012年所有基層醫療機構均實施了基本藥物制度,基本藥物制度在各地基層醫療機構逐步實施的過程是一個非隨機化的過程,因此是非標準的“階梯試驗設計”,估稱為“類階梯試驗設計”(圖4)。

白色框:未接受干預;藍色框:接受了干預,時間點1所有醫療機構未接受干預,至時間點
4.3.3 多水平重復測量模型
評價基本藥物制度實施效果是否存在劑量-反應關系,我們可構建多水平重復測量模型。重復測量時間點為一水平,機構為二水平,縣為三水平,省為四水平,令i,j,k,l分別代表水平一、二、三、四,多水平重復測量基本模型如下:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
該模型中連續性變量,2008~2012年分別表示0、1、2、3、4,該模型可以直接加入各水平的自變量。該模型不僅考慮了截距項的隨機效應,還考慮了實施效果評價的隨機效應,
指的是總均數在省份/縣/基層衛生機構層次的隨機效應,
為各層次上的劑量反應效應的隨機效應。通過對隨機效應
的方差系數
,
和
進行假設檢驗,我們可以找到各水平上各單元的劑量反應效應的分布,通過對隨機效應
進行排序,可以判斷哪個做的最好或者最差。
5 案例分析
以應用場景:多水平重復測量模型評價基本藥物制度實施效果是否存在劑量-反應關系為例,介紹多水平重復測量模型可呈現的關鍵結果。通過多水平重復測量模型,可以獲得截距項和政策的劑量反應效應在不同水平的變異情況,即對截距項在不同水平的方差系數、
、
、
和政策劑量反應效應在不同水平的方差系數
、
、
進行假設檢驗,獲得截距項和政策劑量反應效應在不同水平上的分布情況是否存在變異,如表1的結果。

根據多水平重復測量模型,我們可以計算每個省、縣、基層醫療衛生機構的劑量反應效應的變異值、
、
,將總體平均劑量反應效應
加上各省份上效應的變異值
,得到各個省份的劑量反應效應值(表2),北京、江蘇、遼寧、甘肅、浙江等16個省/市的劑量反應效應值為正值,說明這些省/市的政策干預實施效果較好,其中浙江省實施干預政策所帶來的服務量增加最快(每年增加0.12)。黑龍江、內蒙古、陜西、吉林等15個省份的劑量反應效應值為負值,說明這些省/市的服務量未隨著政策實施時間的增加而增加,政策干預實施效果相對較差。

6 展望
隨著區域醫療大數據的出現,基于區域醫療大數據的醫藥政策評價研究成為可能,而通常這種區域醫療大數據具有多個層次結構,對其的數據分析有必要考慮不同層次之間的異質性,利用多水平模型一方面能夠高效地處理數據分析,并提高統計推斷的精確度;另一方面能夠分解不同層次之間的異質性,精確評價哪些地區的政策實施效果更好或更差,為政策實施監管提供科學依據。多水平模型將隨著區域醫療大數據的發展應用于醫藥政策研究實施效果越來越多,如基于廈門或天津區域醫療大數據采用多水平模型評價“4+7”帶量采購政策的實施效果等。同時,本文章僅介紹了多水平模型在醫藥政策實施效果評價領域的幾種常見應用場景,未來根據研究目的不同還可能存在更多的應用場景[10]。
多水平模型(multilevel models)是基于多水平數據(層次結構數據)發展和應用起來的統計分析方法[1]。因學科領域的不同,多水平模型在不同領域的叫法存在差異,例如在社會學研究領域中,多水平模型被稱為層次線性模型(hierarchical linear models);在生物統計領域被稱為混合效應模型(mixed-effect models)或隨機效應模型(random-effect models),在計量經濟學領域被稱為隨機系數模型(random coefficient models)[2]。多水平模型最先應用于教育學領域,因多水平模型對不同層次數據處理具有統計學優勢,近年來在心理學、社會學、經濟學、組織行為與管理科學、醫學和公共衛生等領域均得到了廣泛的應用。
傳統的醫藥政策評價研究中,多采用調查的方式,收集的數據量有限且很少存在層次結構,數據為單水平結構,此時傳統的統計方法即可用于政策實施效果評價。在醫藥政策評價研究中,若數據具有層次或聚類結構,如采用全國基層醫療機構數據評價基本藥物制度實施效果的研究,其數據的多層次結構表現為縣嵌套于市,市嵌套于省,省嵌套于國家或地區[3],此時傳統統計模型因不能處理具有層次結構的數據,不再適用于此類研究。近幾年,隨著區域醫療大數據的發展與可及(如天津、濟南、廈門區域醫療大數據等),區域醫療大數據在政策評價研究中的運用越來越凸顯。而區域醫療大數據通常具有醫療機構嵌套于區,區嵌套于市的層次結構,這種具有層次機構的數據在同一層次內具有較高的相似性、不同層次具有較強的異質性,亟需創新研究方法從不同角度評價醫藥政策實施的效果[4]。
在醫藥政策效果評價中,針對多層次結構數據,采用多水平統計方法對政策實施效果進行統計分析,已成為方法學研究的熱點。近年來,國內外相關學者開始探索多水平模型用于醫藥政策的評價,如美國、加拿大、瑞典、我國已有學者采用多水平間斷時間序列模型(interrupted time-series,ITS)、多水平雙重差分模型(difference-in-difference,DID)和多水平重復測量模型評價政策的實施效果[5-9]。國內尚缺乏有關多水平模型在醫藥政策評價領域的方法學介紹和情景分析,鑒于此,本文介紹多水平模型建模的總體思路及其在醫藥政策評價研究中的幾種常見應用場景,以期為未來利用區域醫療大數據評價政策實施效果提供方法學參考。
1 多水平模型的數據結構類型
多水平數據指觀測數據在單位上具有嵌套的關系,如患者嵌套于醫院,醫院嵌套于地區,形成了三水平的數據結構,三水平數據結構示意圖見圖1,箭頭方向表示低水平單元嵌套于高水平單元內。若只存在患者嵌套于醫院時,三水平數據結構就變成了兩水平的數據結構。

2 傳統線性模型與兩水平線性模型的差異性分析
現以簡單的傳統線性模型與兩水平線性模型為例,介紹多水平統計分析模型的原理。
傳統線性模型的模型設定:
![]() |
兩水平線性模型的模型設定:
![]() |
表達式中:i指水平1單位,如患者;j為水平1所屬的水平2單位,如醫院,為
在水平2的隨機效應,
為水平1的殘差,即隨機誤差。圖2中的
表示傳統線性模型所獲得的總均值,
、
、
表示兩水平線性模型中水平2單位的均值。從傳統線性模型與兩水平線性模型表達式及其殘差示意圖2可以清晰的發現,兩水平線性模型可將殘差進行分解為一水平的殘差和二水平的殘差,如果二水平的殘差
為0,則可直接采用傳統線性模型,如果二水平的殘差
不為0,則應該采用兩水平線性模型。

3 多水平模型建模總體思路
根據研究者的目的和數據資料的情況不同,多水平模型存在不同類型,如:多水平線性回歸、多水平logistic回歸、多水平poisson回歸、多水平Cox回歸、多元多水平模型、多水平交叉分類模型、多水平樣條函數模型、多水平結構方程模型等。多水平模型雖然存在不同類型,但其建模的總體思路是類似的,如圖3。以構建兩水平線性模型為例,首先建立僅包含隨機截距項的兩水平的空模型,對空模型中的兩水平的方差進行檢驗,若該檢驗結果有統計學意義,說明存在兩水平的層次結構,進一步構建隨機截距模型,即在空模型中加入固定效應的自變量,若想進一步估計隨機截距模型中自變量的隨機效應,則需構建隨機系數模型,若進一步考慮加入兩水平的自變量,則形成了全模型。

3.1 構建空模型
空模型中只包含截距項,不包含任何自變量。多水平模型的空模型與傳統回歸模型的區別在于截距項,傳統回歸模型中的截距項為固定變量,即總均值只有一個,是固定的,不會在水平2上存在變化,而多水平模型的空模型中的截距項為隨機效應,即總體均值在不同的水平存在變異,如水平2有5家醫院,可得到5家醫院不同的均值。兩水平線性空模型的模型設定為:
![]() |
![]() |
![]() |
表達式中:i指水平1單位,如患者;j為水平1所屬的水平2單位,如醫院;為
的總平均,
為
在水平2的殘差,即
在水平2的隨機效應,代表組間變異;
為水平1的殘差,即隨機誤差,代表組內變異;
為組間方差,
為組內方差,對其進行假設檢驗,若假設檢驗發現其存在差異,則應采用兩水平模型。
3.2 構建隨機截距模型
隨機截距模型是在上述空模型的基礎上加入水平1的變量,且自變量是固定效應。假設只納入水平1單位1個自變量,隨機截距模型表達為:
![]() |
表達式中:為加入的水平1自變量,
為
對y的固定效應。
3.3 構建隨機系數模型
隨機系數模型是在隨機截距模型的基礎上考慮自變量的隨機效應。隨機系數模型表達為:
![]() |
![]() |
![]() |
表達式中:為
對y的平均效應,
為
的隨機效應,通過對隨機效應
的方差系數
進行假設檢驗,可以發現兩水平各單元的效應分布,如兩水平各個醫院的效應分布,通過對隨機效應
進行排序,可判斷兩水平的哪個單元效應最高或最低。
3.4 全模型
全模型即在隨機系數模型中進一步加入水平2的自變量。假設只納入水平2的1個自變量,全模型表達為:
![]() |
表達式中:為加入的水平2自變量,
為
對y的固定效應,由于
是水平2的自變量,所以不能構建其隨機效應。
以上為兩水平模型的構建總體思路,該思路可以擴展到三水平及以上水平的模型,同時結局變量類型是二分類或者事件發生數等也適用。
4 多水平模型在醫藥政策實施效果評價領域的幾種常見應用場景
多水平模型在醫藥政策實施效果評價領域可以應用但不限于以下幾種常見的場景,以評價基本藥物制度的實施效果為例進行介紹各種場景,其因變量為基層醫療衛生機構的服務量。研究數據均是全省的基層醫療衛生機構,則同一個縣中的基層醫療衛生機構的服務量可能更為接近,這就造成了數據間不獨立,從而需在傳統的模型基礎上考慮多水平的數據結構,采用對應的多水平模型。
4.1 多水平ITS模型評價基本藥物制度實施對基層醫療衛生機構服務量的影響
4.1.1 研究問題
評價基本藥物制度實施前后基層醫療衛生機構服務量的變化趨勢,評估政策干預對基層醫療衛生機構服務量的影響。
4.1.2 研究設計
研究設計為某個省實施前和實施后基層醫療衛生機構多次重復測量的數據,如2008年未實施基本藥物制度,2009年實施了基本藥物制度,2008年和2009年每個月均測量了基層醫療衛生機構的服務量。該研究只有一個省份數據,沒有其他省份作為對照。
4.2.3 多水平ITS
針對4.1.1研究問題和4.1.2研究設計,需采用多水平ITS,其模型基本表達式如下:
![]() |
![]() |
![]() |
該模型不同于傳統的ITS,考慮了數據的層次結構,即考慮了不同測量時間點在同一醫療機構水平的聚集性,模型中變量是指基層醫療衛生機構i在時間點t處的服務量;
是一個連續變量,指從時間序列起始處計算的時間點t;
是一個虛擬變量,政策實施前則取0,政策實施后則取1。參數
是服務量的基線水平平均估計值,即t=0時基層醫療機構服務量的平均值,隨機部分
分別代表基層醫療機構服務量平均估計值的方差,隨機變量
表示i基層醫療機構服務量與總體均數
之差;
是干預實施前基層醫療機構服務量隨單位時間變量t變化的趨勢估計值,即基線斜率估計值;
是指政策實施前時間分段末端處與實施后時間分段的起始處的指標水平值的差值,即政策引起的基層醫療機構服務量水平變化的估計值;
是政策實施后時間分段趨勢值(斜率)與實施前時間分段趨勢值的差值,即政策實施引起的基層醫療機構服務量的趨勢變化估計值;即
與
的和為政策實施后時間分段趨勢的斜率,該模型也可以直接加入協變量。
4.2 多水平DID模型評價基本藥物制度實施對基層醫療衛生機構服務量的影響
4.2.1 研究問題
評價基本藥物制度實施前后基層醫療衛生機構服務量的變化趨勢,評估政策干預對基層醫療衛生機構服務量的影響。
4.2.2 研究設計
兩個省的基層醫療衛生機構在2008年均未實施基本藥物制度,在2009年其中一個省實施了基本藥物制度,而另外一個省仍未實施基本藥物制度。兩個省份的基層醫療衛生機構可比可以通過傾向性評分匹配實現。該研究涉及兩個不同的省份相互對照和自身前后對照。
4.2.3 多水平DID模型
針對4.2.1研究問題和4.2.2研究設計,需采用多水平DID模型的統計方法。兩水平的DID模型如下:
![]() |
![]() |
![]() |
模型中機構為水平一,縣為水平二,i、j代表水平1、2,該模型中和
均是分類變量。該模型考慮了截距項的隨機效應,即基層醫療衛生機構服務量在不同水平結構的層次效應,隨機部分
代表縣水平上的基層醫療衛生機構服務量平均估計值的方差,并且假設服從正態分布,隨機變量
表示j縣的服務量均數與總體均數之差。該模型中
為固定效應系數,表示兩個時間點上的政策干預效應,也可進一步考慮其隨機效應,估計不同縣基層醫療衛生機構服務量的影響效應,比較哪些縣政策實施效果更好,同時該模型也可直接加入其余協變量。
4.3 多水平重復測量模型評價基本藥物制度實施效果的劑量反應效應
4.3.1 研究問題
評價全國2008~2012年基本藥物制度實施效果是否存在劑量-反應關系,即是否基本藥物制度實施時間越長,基層醫療衛生機構服務量增加的越多。
4.3.2 研究設計
全國基本藥物制度是從2009至2012年逐步實施的,從而2008年所有基層醫療機構均未實施基本藥物制度,2012年所有基層醫療機構均實施了基本藥物制度,基本藥物制度在各地基層醫療機構逐步實施的過程是一個非隨機化的過程,因此是非標準的“階梯試驗設計”,估稱為“類階梯試驗設計”(圖4)。

白色框:未接受干預;藍色框:接受了干預,時間點1所有醫療機構未接受干預,至時間點
4.3.3 多水平重復測量模型
評價基本藥物制度實施效果是否存在劑量-反應關系,我們可構建多水平重復測量模型。重復測量時間點為一水平,機構為二水平,縣為三水平,省為四水平,令i,j,k,l分別代表水平一、二、三、四,多水平重復測量基本模型如下:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
該模型中連續性變量,2008~2012年分別表示0、1、2、3、4,該模型可以直接加入各水平的自變量。該模型不僅考慮了截距項的隨機效應,還考慮了實施效果評價的隨機效應,
指的是總均數在省份/縣/基層衛生機構層次的隨機效應,
為各層次上的劑量反應效應的隨機效應。通過對隨機效應
的方差系數
,
和
進行假設檢驗,我們可以找到各水平上各單元的劑量反應效應的分布,通過對隨機效應
進行排序,可以判斷哪個做的最好或者最差。
5 案例分析
以應用場景:多水平重復測量模型評價基本藥物制度實施效果是否存在劑量-反應關系為例,介紹多水平重復測量模型可呈現的關鍵結果。通過多水平重復測量模型,可以獲得截距項和政策的劑量反應效應在不同水平的變異情況,即對截距項在不同水平的方差系數、
、
、
和政策劑量反應效應在不同水平的方差系數
、
、
進行假設檢驗,獲得截距項和政策劑量反應效應在不同水平上的分布情況是否存在變異,如表1的結果。

根據多水平重復測量模型,我們可以計算每個省、縣、基層醫療衛生機構的劑量反應效應的變異值、
、
,將總體平均劑量反應效應
加上各省份上效應的變異值
,得到各個省份的劑量反應效應值(表2),北京、江蘇、遼寧、甘肅、浙江等16個省/市的劑量反應效應值為正值,說明這些省/市的政策干預實施效果較好,其中浙江省實施干預政策所帶來的服務量增加最快(每年增加0.12)。黑龍江、內蒙古、陜西、吉林等15個省份的劑量反應效應值為負值,說明這些省/市的服務量未隨著政策實施時間的增加而增加,政策干預實施效果相對較差。

6 展望
隨著區域醫療大數據的出現,基于區域醫療大數據的醫藥政策評價研究成為可能,而通常這種區域醫療大數據具有多個層次結構,對其的數據分析有必要考慮不同層次之間的異質性,利用多水平模型一方面能夠高效地處理數據分析,并提高統計推斷的精確度;另一方面能夠分解不同層次之間的異質性,精確評價哪些地區的政策實施效果更好或更差,為政策實施監管提供科學依據。多水平模型將隨著區域醫療大數據的發展應用于醫藥政策研究實施效果越來越多,如基于廈門或天津區域醫療大數據采用多水平模型評價“4+7”帶量采購政策的實施效果等。同時,本文章僅介紹了多水平模型在醫藥政策實施效果評價領域的幾種常見應用場景,未來根據研究目的不同還可能存在更多的應用場景[10]。