實施科學作為一個相對較新且逐漸受到重視的研究領域,其開展有助于將理論中的可能性轉化為現實中的實踐,從而應對如何在真實世界中實施經過驗證的干預措施的挑戰。實施研究用途廣泛且研究問題具有復雜性,需要借助合適的研究方法、設計和結局指標來實現不同的研究目的。由此,本文結合實施研究的目的與實施問題,系統介紹醫療衛生領域中實施研究的研究設計、實施結局指標及相關的報告規范,以期為更好地開展實施研究提供參考。
引用本文: 謝潤生, 徐東, 李慧, 陳耀龍, 杜亮, 周英鳳, 靳英輝. 醫療衛生領域中實施科學的研究方法. 中國循證醫學雜志, 2020, 20(9): 1104-1110. doi: 10.7507/1672-2531.202003234 復制
實施科學作為新興研究領域逐漸受到重視,其相關研究已廣泛在醫療衛生領域開展[1, 2]。世界衛生組織主張開展實施研究以應對如何在真實世界中實施經過驗證的干預措施的挑戰,同時呼吁將實施研究更多地嵌合到衛生決策中,從而幫助將理論中的可能性轉化為現實中的實踐[3, 4]。
實施研究是對實施問題的科學探究[5]。根據這一定義,實施研究可解決或探討關于實施的任何方面,包括影響實施的因素、實施過程本身及實施的結局或最終產品。換而言之,實施研究側重于以下主題:① 識別常見的實施問題;② 了解促進或阻礙獲得衛生干預措施的因素;③ 在特定背景和環境中,開發和測試用于解決實施障礙的方案;④ 確定將創新引入衛生系統或促進其大規模使用和可持續發展的最佳方式。
實施研究用途廣泛且研究問題具有一定的復雜性,往往需要借助合適的研究方法和設計來實現不同研究目的,并且通過實施結局指標對實施開展情況對實施效果進行描述和評價。因此,本文將介紹醫療衛生領域中實施研究的研究設計、實施結局指標及相關的報告規范,旨在為更好地開展實施研究提供參考。
1 實施研究的目的與實施問題
實施研究的基本目的不僅是要了解哪些干預措施是有效的或無效的,還要了解影響實施成敗的原因和方式及檢驗改進實施的方法[5]。其往往關注的是一項計劃或項目推出或推廣時出現的若干實施問題。圍繞這些實施問題,可進一步把研究目的劃分為探索、描述、充分性分析、合理性分析、概率評估、解釋、預測等(表 1)。基于以問題為導向的原則,研究者應先明確實施過程中遇到的障礙并提出實施問題,然后選用與具體實施問題對應的研究方法。

2 醫療衛生研究的研究設計
醫療衛生領域中,實施科學采用了廣泛存在于各學科中的定性、定量和混合方法來開展實施研究,這些方法有助于研究者了解實施背景與環境、評估實施策略、識別個人和/或組織實踐過程中的變化。與其他研究不同的是,實施研究側重于提供或實施循證實踐的策略,關注其實施效果,旨在系統彌合認知-行為差異,使干預措施的作用最大限度地在真實世界中得以發揮。
定性研究方法側重于描述和理解實施過程中人類行為和經驗看法,并不依賴于對數據的運算處理。定性研究通常包括個別訪談、焦點小組訪談、民族志、田野調查、參與式觀察、文獻分析、個案調查等方法[6, 7]。其中以訪談法最為常見,實施研究中往往將不同層次的關鍵利益相關者作為訪談對象,通過實施理論框架形成訪談提綱并進行半結構化訪談。如基于實施研究整合框架(consolidated framework for implementation research,CFIR),結合其干預特征、外部環境、內部環境、個體特征、實施過程領域形成訪談指南,指導數據收集[8]。
定量研究方法側重于通過結構化的研究設計對實施數據進行量化處理、檢驗和分析,關注干預措施的外部有效性。定量研究可按照是否采用隨機化設計、是否采用干預等進行分類。研究類型包括:觀察性設計,如橫斷面、隊列研究;隨機對照設計,如經典隨機對照試驗(randomized controlled trial,RCT)、整群 RCT、階梯設計(stepped-wedge design,SWD)、效果-實施混合設計(effectiveness-implementation hybrid design,EIHD);準試驗設計(quasi-experimental designs,QED),如中斷時間序列(interrupted time series,ITS)設計、回歸不連續設計、回歸點位移設計;干預優化設計,如多階段優化策略(multiphase optimization strategy,MOST)、多重方案隨機序貫試驗(sequential multiple assignment randomized trial,SMART)和混合設計[4, 5, 9, 10]。本文將于下一部分著重介紹定量研究中常用的研究設計。
混合方法研究是指在同一研究中收集和分析數據時,根據不同組合結構同時采用或按順序采用定性和定量方法[11]。混合方法研究的用途超過 60 種,可歸納為 4 個方面[12, 13]:① 關注研究對象:旨在更充分、更全面地獲取研究對象的樣本信息;② 關注研究工具:旨在測試研究工具的有效性,確保所使用的工具合適且有效;③ 關注實施方案:旨在測量實施方案的保真度,評估干預措施或治療方案是否按設計進行;④ 關注研究結果:旨在最大限度地解釋研究結果,增強研究的意義。
3 常用的實施研究設計
廣義而言,定量研究方法中 5 種研究設計 EIHD、MOST、SWD、QED、SMART 均可稱為實施研究設計,但他們從本質和內涵上稍有不同。其中,EIHD 主要是從研究目的出發,兼顧臨床效果和實施效果的檢驗。MOST 主要是從研究的流程出發,通過三個階段的方法開展一項規范的實施研究。而 SWD、QED、SMART 是真正意義上的實施研究設計。
3.1 SWD
SWD 是一種特殊的群組 RCT 設計,各群組在不同的時間點實施干預,最終所有組都將接受干預,不需設置專門的對照組,既做到平行隨機對照,又避免了倫理學問題[14]。因此,SWD 適用于評價“利大于弊”的干預措施,尤其適用于當資源受限時需要分階段實施干預措施的情況。
SWD 的基本原理是根據研究目的將研究對象分為若干個小組,并對其進行隨機編號,然后按照時間先后順序將干預過程劃分為不同的階段。研究開始后,按照事先確定的隨機編號順序給予對應小組實施干預,已納入的小組將在研究過程中持續接受干預,而未納入的小組則保持空白等待狀態,直到按順序接受干預,如此反復直至所有小組均接受干預(圖 1)。SWD 的結果分析有同期比較和前后比較兩種比較方式,可使用 COX 回歸模型、Logistic 回歸模型及 Poisson 回歸模型等進行分析。

另外,根據研究對象類型不同,SWD 可進一步分為固定隊列 SWD、開放隊列 SWD 和連續入組短期暴露 SWD[15]。
3.2 EIHD
EIHD 是一種既注重評估臨床效果又注重實施的試驗設計,可同時評估干預措施的效果和實施策略。其特點是從臨床試驗開始,首先確定在可控制條件下實施的干預是否有效,然后再繼續進行如整群 RCT 等設計,從而確定在真實世界環境中引入干預的最佳方式。基于研究目標中的效果或實施部分的優先地位,EIHD 設計可劃分為 3 種基本類型[4, 16]:① Ⅰ 型混合試驗設計:主要測試干預措施對健康結局的影響,同時觀察和收集關于實施情況的信息。在此類研究中,測量了研究對象接受干預措施后的功能或癥狀變化,同時通過定性、過程導向或混合方法評價實施方法的可行性和接受度。② Ⅱ 型混合試驗設計:涉及對干預措施和實施策略的雙重測試。③ Ⅲ 型混合試驗設計:主要測試實施策略,同時觀察和收集關于干預措施對健康結局的影響信息,該設計主要使用干預措施的采用率和保真度來測試實施策略。
EIHD 設計不僅加快了原本可能非常耗時的臨床試驗過程,使得研究人員能夠識別重要的干預-實施交互作用,并可利用這些信息為最佳實施方法決策提供參考。研究者在試驗設計過程中可基于 PRECIS-2(pragmatic–explanatory continuum indicator summary)工具綜合考慮試驗的解釋性和實用性程度,避免試驗設計與預期目的不符[17, 18]。PRECIS-2 的輪狀模型包含 9 個維度:分別為納入標準、招募、場景、組織、靈活性、依從性、隨訪、主要結局、主要分析[18, 19]。研究者需要在 PRECIS-2 輪狀模型圖上對各維度進行評分,評分范圍為 1 分(解釋性非常強)到 5 分(實用性非常強)。研究團隊可根據評分結果更仔細地考慮試驗的預期目標,展開內部討論并促進達成共識,從而確保有關試驗設計的決策與試驗的既定目的相一致。研究者可登陸 PRECIS-2 官網(www.precis-2.org)進一步查閱相關的培訓資源、工具指南和試驗數據庫等資料。
3.3 QED
因研究條件限制而不能采用隨機分組或設立平行對照的研究被稱為“準試驗”設計[10]。研究人員在評估真實環境中的干預措施實施時面臨研究設計上的挑戰,需要在保持內部有效性的同時兼顧外部有效性因素(如各亞組的攝入量、可接受性、可持續性和成本)。因而越來越多研究選擇采用 QED,該類設計包括 ITS 設計、回歸不連續設計、回歸點位移設計等[20-23]。這 3 種 QED 在研究目的、設計和分析上較為相似,現以 ITS 為代表進行介紹。
ITS 是一種用于探索干預措施的效應是否顯著大于潛在時間趨勢,評價干預措施效果的準實驗設計[24]。如圖 2 所示,該設計在干預前后均等間隔的時間點(多個時間點)收集常規監測數據,將干預前的數據則作為對照組,估計干預前時間序列的潛在趨勢后,根據潛在趨勢線和干預后的時間序列趨勢評估干預措施效果[25]。其特點是能充分利用縱向數據的信息,考慮干預前指標的發展趨勢,并且一般不受恒定混雜因素的影響。

ITS 步驟如下[25]:① 判斷是否合適采用 ITS。干預是否可清楚分為前、后階段;結局指標最好是能在干預后迅速反應或有明確滯后反應的短期結局指標;干預實施前后的觀察時點較多。② 構建影響模型。基于以往證據進行假設,評估干預可能對結局產生的水平上或斜率上的影響,構建相應的模型。③ 進行描述性分析。可采用散點圖和傳統方法識別潛在趨勢、季節性和離群值。④ 進行回歸分析。常采用時間序列模型進行分析,如 ARIMA 模型、分段回歸時間序列模型。⑤ 不同統計方法細節的考慮。考慮自相關、隨時間變化的混雜因素、采用對照、基于亞組的分層分析、構建非線性模型等。⑥ 模型檢查及敏感性分析。
3.4 MOST
MOST[26-28] 是一種通過使用三個階段的方法來構建、優化和評估多因素干預措施的策略,它可識別干預措施的有效要素,及識別獲得最優結果時每個要素的水平(劑量)。MOST 由篩選階段、優化階段、驗證階段 3 部分組成。
篩選階段:篩選階段的目的在于根據某一干預要素的作用決定其是否被納入綜合干預方案,高效地選擇可能會有效的干預要素,形成干預方案草案。這需以理論為基礎,識別由程序要素和傳遞要素組成的一系列干預要素。可通過析因設計來解釋各個要素的作用,根據結果解決以下問題:① 哪些程序要素有效且可促成正向結果,需要被納入;② 哪些程序要素無效或起反作用,需要被排除;③ 哪些傳遞要素有效、對干預結果有影響或對于維持干預精確度起作用。
優化階段:優化階段的目的是將篩選階段中形成的干預方案草案進行調整,將每一個干預要素優化到最佳水平并形成最終干預方案。研究方法可采用析因設計或 SMART。優化階段關注以下問題:① 哪些干預要素具有最優水平;② 干預要素的最優水平是否受個體或群體的特征影響。
驗證階段:最終優化干預方案草案是驗證階段的起點,這一階段將進行標準的 RCT 來驗證由最佳干預要素組成的干預方案的作用和效果。驗證階段需解決以下問題:① 干預方案是否有效;② 干預方案能否推廣應用到更大樣本人群。
3.5 SMART
SMART[27, 29] 是一種專為建立隨時間變化的適應性干預措施而開發的多階段隨機試驗設計。在每一個階段,所有參與者都被隨機分配到一個干預方案中。通過多次隨機分配參與者,研究者可將多種干預措施嵌入到研究中并評估其在不同階段的效果,從而制定最佳的決策規則與方案。
以一項孕期藥物濫用患者的研究為例[30],該研究關注如何通過調整基于強化理論的治療(reinforcement based treatment,RBT)強度及適用范圍來提高孕期藥物濫用者的療效。該研究設計了 4 種不同干預強度的 RBT,包括簡化 RBT、減量 RBT、常規 RBT、增強 RBT。如圖 3 所示,在研究的第一階段,所有患者隨機接受兩種中等強度干預措施的一種,即減量 RBT 或常規 RBT。兩周后,將第一階段治療無效的患者再次隨機分為兩組,繼續原方案組或加大干預強度組;對第一階段治療有效的患者則隨機分為原方案組或降低干預強度組。最終,將兩階段共 8 種干預方案嵌入到該研究中。其研究結果可幫助研究者確定在首次治療時應該為患者提供何種干預及在不同階段產生不同效果時應該提供何種干預。關于數據分析方法和樣本量計算等詳見相關文獻[29, 31]。

4 實施研究的結局指標
如何對實施效果進行概念化和評估,是實施科學領域的關鍵問題。為了促進對實施過程的理解和提高實施研究的效率,Proctor 等[32, 33]系統提出實施結局的概念和內涵,并將實施結局與臨床結局和服務結局區分開來。實施結局是指為實施新的治療方法、實踐和服務而采取的針對性措施的效果。實施結局可作為實施成功的評價指標,近端反映實施過程,并且是與臨床結局或服務結局在治療效果和醫療質量研究方面相關的關鍵中間結局指標。
根據分類學方法,實施結局被歸納為 8 大指標,包括接受度、采用率、適當性、可行性、保真度、實施成本、覆蓋范圍和可持續性[4, 5, 33]。各指標的實用性定義、相關術語和應用見表 2[34-43]。每個實施結局指標代表評價實施效果的一個重要方面,可作為某個實施項目實際開展情況的指標。但并非所有實施結局指標在實施研究中都同等重要。例如,在實施一項新的干預措施時,研究者主要關注的可能是接受度、采用率、適當性和可行性問題。當中,“接受度”與“適當性”可能會在一些文獻中被混淆使用,但實際上兩者概念有所不同。例如,某種治療措施可能被認為是適當的,但因為費用、設備和技術條件限制等各種原因不被患者或醫療機構所接受。而在實施現有干預措施時,干預措施的實施程度是否符合于最初設計則更為重要(通過保真度進行衡量)。另外,除干預措施本身的成本外,實施成本還取決于所使用的實施策略的復雜性及實施策略的覆蓋范圍和應用場景。“覆蓋范圍”與“可持續性”在概念上和經驗上更為相關,因為更廣的覆蓋范圍可能有助于實施的可持續性。可持續性問題應該從干預的最初階段就加以考慮,但其在衛生干預研究中往往容易被忽視。

5 實施研究的報告規范(standards for reporting implementation studies,StaRI)
StaRI 是一個基于在線德爾菲法和專家共識開發而成的報告框架,涵蓋題目、摘要、背景、目的、方法(描述和評價)、結果、討論、通用信息等 8 個部分共 27 個報告條目,并從實施策略和干預措施兩個方面進行詳細報告[44]。該報告規范強調了報告實施研究中所采用的方法和理論依據,將有助于提高實施研究的方法學質量[45]。因此,研究者在開展實施研究和撰寫實施研究學術論文時,應參考 StaRI 及其清單,進一步規范和提高實施研究報告的透明度、準確性。
6 展望
實施科學作為應對當今社會復雜問題而誕生的新興學科之一,涉及多個學科領域方法和理論。醫療衛生領域中的研究者對其關注度日益增長,得益于實施研究可使干預措施的作用最大限度地在真實世界中發揮。在開展實施研究時應注意以問題為導向,選擇與研究問題相匹配的實施研究方法和設計,并采用合適的實施結局指標對實施情況進行概念化和評估,最后遵循 StaRI 進行全面報告。實施研究的成功開展需要實施者、政策制定者和研究者等不同利益相關者在研究設計和實施過程中協同合作,積極應對現實環境中復雜的實施挑戰。因此,未來應該大力鼓勵不同學科背景的學者參與到實施研究,逐漸建立跨學科的學術組織,并增加對實施研究的支持力度。
實施科學作為新興研究領域逐漸受到重視,其相關研究已廣泛在醫療衛生領域開展[1, 2]。世界衛生組織主張開展實施研究以應對如何在真實世界中實施經過驗證的干預措施的挑戰,同時呼吁將實施研究更多地嵌合到衛生決策中,從而幫助將理論中的可能性轉化為現實中的實踐[3, 4]。
實施研究是對實施問題的科學探究[5]。根據這一定義,實施研究可解決或探討關于實施的任何方面,包括影響實施的因素、實施過程本身及實施的結局或最終產品。換而言之,實施研究側重于以下主題:① 識別常見的實施問題;② 了解促進或阻礙獲得衛生干預措施的因素;③ 在特定背景和環境中,開發和測試用于解決實施障礙的方案;④ 確定將創新引入衛生系統或促進其大規模使用和可持續發展的最佳方式。
實施研究用途廣泛且研究問題具有一定的復雜性,往往需要借助合適的研究方法和設計來實現不同研究目的,并且通過實施結局指標對實施開展情況對實施效果進行描述和評價。因此,本文將介紹醫療衛生領域中實施研究的研究設計、實施結局指標及相關的報告規范,旨在為更好地開展實施研究提供參考。
1 實施研究的目的與實施問題
實施研究的基本目的不僅是要了解哪些干預措施是有效的或無效的,還要了解影響實施成敗的原因和方式及檢驗改進實施的方法[5]。其往往關注的是一項計劃或項目推出或推廣時出現的若干實施問題。圍繞這些實施問題,可進一步把研究目的劃分為探索、描述、充分性分析、合理性分析、概率評估、解釋、預測等(表 1)。基于以問題為導向的原則,研究者應先明確實施過程中遇到的障礙并提出實施問題,然后選用與具體實施問題對應的研究方法。

2 醫療衛生研究的研究設計
醫療衛生領域中,實施科學采用了廣泛存在于各學科中的定性、定量和混合方法來開展實施研究,這些方法有助于研究者了解實施背景與環境、評估實施策略、識別個人和/或組織實踐過程中的變化。與其他研究不同的是,實施研究側重于提供或實施循證實踐的策略,關注其實施效果,旨在系統彌合認知-行為差異,使干預措施的作用最大限度地在真實世界中得以發揮。
定性研究方法側重于描述和理解實施過程中人類行為和經驗看法,并不依賴于對數據的運算處理。定性研究通常包括個別訪談、焦點小組訪談、民族志、田野調查、參與式觀察、文獻分析、個案調查等方法[6, 7]。其中以訪談法最為常見,實施研究中往往將不同層次的關鍵利益相關者作為訪談對象,通過實施理論框架形成訪談提綱并進行半結構化訪談。如基于實施研究整合框架(consolidated framework for implementation research,CFIR),結合其干預特征、外部環境、內部環境、個體特征、實施過程領域形成訪談指南,指導數據收集[8]。
定量研究方法側重于通過結構化的研究設計對實施數據進行量化處理、檢驗和分析,關注干預措施的外部有效性。定量研究可按照是否采用隨機化設計、是否采用干預等進行分類。研究類型包括:觀察性設計,如橫斷面、隊列研究;隨機對照設計,如經典隨機對照試驗(randomized controlled trial,RCT)、整群 RCT、階梯設計(stepped-wedge design,SWD)、效果-實施混合設計(effectiveness-implementation hybrid design,EIHD);準試驗設計(quasi-experimental designs,QED),如中斷時間序列(interrupted time series,ITS)設計、回歸不連續設計、回歸點位移設計;干預優化設計,如多階段優化策略(multiphase optimization strategy,MOST)、多重方案隨機序貫試驗(sequential multiple assignment randomized trial,SMART)和混合設計[4, 5, 9, 10]。本文將于下一部分著重介紹定量研究中常用的研究設計。
混合方法研究是指在同一研究中收集和分析數據時,根據不同組合結構同時采用或按順序采用定性和定量方法[11]。混合方法研究的用途超過 60 種,可歸納為 4 個方面[12, 13]:① 關注研究對象:旨在更充分、更全面地獲取研究對象的樣本信息;② 關注研究工具:旨在測試研究工具的有效性,確保所使用的工具合適且有效;③ 關注實施方案:旨在測量實施方案的保真度,評估干預措施或治療方案是否按設計進行;④ 關注研究結果:旨在最大限度地解釋研究結果,增強研究的意義。
3 常用的實施研究設計
廣義而言,定量研究方法中 5 種研究設計 EIHD、MOST、SWD、QED、SMART 均可稱為實施研究設計,但他們從本質和內涵上稍有不同。其中,EIHD 主要是從研究目的出發,兼顧臨床效果和實施效果的檢驗。MOST 主要是從研究的流程出發,通過三個階段的方法開展一項規范的實施研究。而 SWD、QED、SMART 是真正意義上的實施研究設計。
3.1 SWD
SWD 是一種特殊的群組 RCT 設計,各群組在不同的時間點實施干預,最終所有組都將接受干預,不需設置專門的對照組,既做到平行隨機對照,又避免了倫理學問題[14]。因此,SWD 適用于評價“利大于弊”的干預措施,尤其適用于當資源受限時需要分階段實施干預措施的情況。
SWD 的基本原理是根據研究目的將研究對象分為若干個小組,并對其進行隨機編號,然后按照時間先后順序將干預過程劃分為不同的階段。研究開始后,按照事先確定的隨機編號順序給予對應小組實施干預,已納入的小組將在研究過程中持續接受干預,而未納入的小組則保持空白等待狀態,直到按順序接受干預,如此反復直至所有小組均接受干預(圖 1)。SWD 的結果分析有同期比較和前后比較兩種比較方式,可使用 COX 回歸模型、Logistic 回歸模型及 Poisson 回歸模型等進行分析。

另外,根據研究對象類型不同,SWD 可進一步分為固定隊列 SWD、開放隊列 SWD 和連續入組短期暴露 SWD[15]。
3.2 EIHD
EIHD 是一種既注重評估臨床效果又注重實施的試驗設計,可同時評估干預措施的效果和實施策略。其特點是從臨床試驗開始,首先確定在可控制條件下實施的干預是否有效,然后再繼續進行如整群 RCT 等設計,從而確定在真實世界環境中引入干預的最佳方式。基于研究目標中的效果或實施部分的優先地位,EIHD 設計可劃分為 3 種基本類型[4, 16]:① Ⅰ 型混合試驗設計:主要測試干預措施對健康結局的影響,同時觀察和收集關于實施情況的信息。在此類研究中,測量了研究對象接受干預措施后的功能或癥狀變化,同時通過定性、過程導向或混合方法評價實施方法的可行性和接受度。② Ⅱ 型混合試驗設計:涉及對干預措施和實施策略的雙重測試。③ Ⅲ 型混合試驗設計:主要測試實施策略,同時觀察和收集關于干預措施對健康結局的影響信息,該設計主要使用干預措施的采用率和保真度來測試實施策略。
EIHD 設計不僅加快了原本可能非常耗時的臨床試驗過程,使得研究人員能夠識別重要的干預-實施交互作用,并可利用這些信息為最佳實施方法決策提供參考。研究者在試驗設計過程中可基于 PRECIS-2(pragmatic–explanatory continuum indicator summary)工具綜合考慮試驗的解釋性和實用性程度,避免試驗設計與預期目的不符[17, 18]。PRECIS-2 的輪狀模型包含 9 個維度:分別為納入標準、招募、場景、組織、靈活性、依從性、隨訪、主要結局、主要分析[18, 19]。研究者需要在 PRECIS-2 輪狀模型圖上對各維度進行評分,評分范圍為 1 分(解釋性非常強)到 5 分(實用性非常強)。研究團隊可根據評分結果更仔細地考慮試驗的預期目標,展開內部討論并促進達成共識,從而確保有關試驗設計的決策與試驗的既定目的相一致。研究者可登陸 PRECIS-2 官網(www.precis-2.org)進一步查閱相關的培訓資源、工具指南和試驗數據庫等資料。
3.3 QED
因研究條件限制而不能采用隨機分組或設立平行對照的研究被稱為“準試驗”設計[10]。研究人員在評估真實環境中的干預措施實施時面臨研究設計上的挑戰,需要在保持內部有效性的同時兼顧外部有效性因素(如各亞組的攝入量、可接受性、可持續性和成本)。因而越來越多研究選擇采用 QED,該類設計包括 ITS 設計、回歸不連續設計、回歸點位移設計等[20-23]。這 3 種 QED 在研究目的、設計和分析上較為相似,現以 ITS 為代表進行介紹。
ITS 是一種用于探索干預措施的效應是否顯著大于潛在時間趨勢,評價干預措施效果的準實驗設計[24]。如圖 2 所示,該設計在干預前后均等間隔的時間點(多個時間點)收集常規監測數據,將干預前的數據則作為對照組,估計干預前時間序列的潛在趨勢后,根據潛在趨勢線和干預后的時間序列趨勢評估干預措施效果[25]。其特點是能充分利用縱向數據的信息,考慮干預前指標的發展趨勢,并且一般不受恒定混雜因素的影響。

ITS 步驟如下[25]:① 判斷是否合適采用 ITS。干預是否可清楚分為前、后階段;結局指標最好是能在干預后迅速反應或有明確滯后反應的短期結局指標;干預實施前后的觀察時點較多。② 構建影響模型。基于以往證據進行假設,評估干預可能對結局產生的水平上或斜率上的影響,構建相應的模型。③ 進行描述性分析。可采用散點圖和傳統方法識別潛在趨勢、季節性和離群值。④ 進行回歸分析。常采用時間序列模型進行分析,如 ARIMA 模型、分段回歸時間序列模型。⑤ 不同統計方法細節的考慮。考慮自相關、隨時間變化的混雜因素、采用對照、基于亞組的分層分析、構建非線性模型等。⑥ 模型檢查及敏感性分析。
3.4 MOST
MOST[26-28] 是一種通過使用三個階段的方法來構建、優化和評估多因素干預措施的策略,它可識別干預措施的有效要素,及識別獲得最優結果時每個要素的水平(劑量)。MOST 由篩選階段、優化階段、驗證階段 3 部分組成。
篩選階段:篩選階段的目的在于根據某一干預要素的作用決定其是否被納入綜合干預方案,高效地選擇可能會有效的干預要素,形成干預方案草案。這需以理論為基礎,識別由程序要素和傳遞要素組成的一系列干預要素。可通過析因設計來解釋各個要素的作用,根據結果解決以下問題:① 哪些程序要素有效且可促成正向結果,需要被納入;② 哪些程序要素無效或起反作用,需要被排除;③ 哪些傳遞要素有效、對干預結果有影響或對于維持干預精確度起作用。
優化階段:優化階段的目的是將篩選階段中形成的干預方案草案進行調整,將每一個干預要素優化到最佳水平并形成最終干預方案。研究方法可采用析因設計或 SMART。優化階段關注以下問題:① 哪些干預要素具有最優水平;② 干預要素的最優水平是否受個體或群體的特征影響。
驗證階段:最終優化干預方案草案是驗證階段的起點,這一階段將進行標準的 RCT 來驗證由最佳干預要素組成的干預方案的作用和效果。驗證階段需解決以下問題:① 干預方案是否有效;② 干預方案能否推廣應用到更大樣本人群。
3.5 SMART
SMART[27, 29] 是一種專為建立隨時間變化的適應性干預措施而開發的多階段隨機試驗設計。在每一個階段,所有參與者都被隨機分配到一個干預方案中。通過多次隨機分配參與者,研究者可將多種干預措施嵌入到研究中并評估其在不同階段的效果,從而制定最佳的決策規則與方案。
以一項孕期藥物濫用患者的研究為例[30],該研究關注如何通過調整基于強化理論的治療(reinforcement based treatment,RBT)強度及適用范圍來提高孕期藥物濫用者的療效。該研究設計了 4 種不同干預強度的 RBT,包括簡化 RBT、減量 RBT、常規 RBT、增強 RBT。如圖 3 所示,在研究的第一階段,所有患者隨機接受兩種中等強度干預措施的一種,即減量 RBT 或常規 RBT。兩周后,將第一階段治療無效的患者再次隨機分為兩組,繼續原方案組或加大干預強度組;對第一階段治療有效的患者則隨機分為原方案組或降低干預強度組。最終,將兩階段共 8 種干預方案嵌入到該研究中。其研究結果可幫助研究者確定在首次治療時應該為患者提供何種干預及在不同階段產生不同效果時應該提供何種干預。關于數據分析方法和樣本量計算等詳見相關文獻[29, 31]。

4 實施研究的結局指標
如何對實施效果進行概念化和評估,是實施科學領域的關鍵問題。為了促進對實施過程的理解和提高實施研究的效率,Proctor 等[32, 33]系統提出實施結局的概念和內涵,并將實施結局與臨床結局和服務結局區分開來。實施結局是指為實施新的治療方法、實踐和服務而采取的針對性措施的效果。實施結局可作為實施成功的評價指標,近端反映實施過程,并且是與臨床結局或服務結局在治療效果和醫療質量研究方面相關的關鍵中間結局指標。
根據分類學方法,實施結局被歸納為 8 大指標,包括接受度、采用率、適當性、可行性、保真度、實施成本、覆蓋范圍和可持續性[4, 5, 33]。各指標的實用性定義、相關術語和應用見表 2[34-43]。每個實施結局指標代表評價實施效果的一個重要方面,可作為某個實施項目實際開展情況的指標。但并非所有實施結局指標在實施研究中都同等重要。例如,在實施一項新的干預措施時,研究者主要關注的可能是接受度、采用率、適當性和可行性問題。當中,“接受度”與“適當性”可能會在一些文獻中被混淆使用,但實際上兩者概念有所不同。例如,某種治療措施可能被認為是適當的,但因為費用、設備和技術條件限制等各種原因不被患者或醫療機構所接受。而在實施現有干預措施時,干預措施的實施程度是否符合于最初設計則更為重要(通過保真度進行衡量)。另外,除干預措施本身的成本外,實施成本還取決于所使用的實施策略的復雜性及實施策略的覆蓋范圍和應用場景。“覆蓋范圍”與“可持續性”在概念上和經驗上更為相關,因為更廣的覆蓋范圍可能有助于實施的可持續性。可持續性問題應該從干預的最初階段就加以考慮,但其在衛生干預研究中往往容易被忽視。

5 實施研究的報告規范(standards for reporting implementation studies,StaRI)
StaRI 是一個基于在線德爾菲法和專家共識開發而成的報告框架,涵蓋題目、摘要、背景、目的、方法(描述和評價)、結果、討論、通用信息等 8 個部分共 27 個報告條目,并從實施策略和干預措施兩個方面進行詳細報告[44]。該報告規范強調了報告實施研究中所采用的方法和理論依據,將有助于提高實施研究的方法學質量[45]。因此,研究者在開展實施研究和撰寫實施研究學術論文時,應參考 StaRI 及其清單,進一步規范和提高實施研究報告的透明度、準確性。
6 展望
實施科學作為應對當今社會復雜問題而誕生的新興學科之一,涉及多個學科領域方法和理論。醫療衛生領域中的研究者對其關注度日益增長,得益于實施研究可使干預措施的作用最大限度地在真實世界中發揮。在開展實施研究時應注意以問題為導向,選擇與研究問題相匹配的實施研究方法和設計,并采用合適的實施結局指標對實施情況進行概念化和評估,最后遵循 StaRI 進行全面報告。實施研究的成功開展需要實施者、政策制定者和研究者等不同利益相關者在研究設計和實施過程中協同合作,積極應對現實環境中復雜的實施挑戰。因此,未來應該大力鼓勵不同學科背景的學者參與到實施研究,逐漸建立跨學科的學術組織,并增加對實施研究的支持力度。