隨機對照試驗被認為是確定因果關聯的金標準,常被用以評價醫療干預措施的有效性和安全性。但在某些情況下開展一項隨機對照試驗并不可行。近年來,一種新的框架“目標試驗模擬研究”被正式確立,用以指導基于真實世界數據的觀察性研究的設計與分析,它為基于觀察性研究進行有效的因果推斷提供了方法學支撐。為了便于國內學者理解和應用該框架解決相關臨床問題,本文從基本概念、框架結構與實施步驟、發展現狀、展望等多個方面對目標試驗模擬研究進行了概述。
引用本文: 盧存存, 陳子佳, 張強, 喬萌, 雷超, 謝雁鳴, 王志飛. 基于真實世界數據的目標試驗模擬研究:現狀與展望. 中國循證醫學雜志, 2023, 23(4): 492-496. doi: 10.7507/1672-2531.202209032 復制
因果推斷即確定不同事件(或現象)之間的因果關聯及定量因果效應的大小。如何實現因果推斷一直是科學研究的核心問題,也是生物醫學研究的主要目標之一[1]。在榮獲2021年諾貝爾經濟學獎的三位學者中,兩位是因為對因果分析方法做出了重大貢獻而獲獎。隨機對照試驗被公認為是確定因果關聯的金標準[2-4],是確定醫療干預措施有效性和安全性的最重要流行病學研究設計之一[5-6]。但是,由于成本高昂、醫學倫理等原因,在某些情況下開展隨機對照試驗并不可取或者不可行[3-4]。
隨著海量真實世界數據(例如,電子病歷數據[7])的累積和統計分析方法的進展,基于真實世界數據的高質量觀察性研究將會更好地補充來自隨機對照試驗的證據。然而,與高質量的前瞻性隨機對照試驗不同,基于真實世界數據開展的觀察性研究常會因為存在各種偏倚,導致研究者無法獲得準確的效應估計值。傾向性評分作為一種重要的統計分析方法,常被用在基于真實世界數據的觀察性研究中以減少已知混雜因素的影響[7-9]。但近期的一項方法學研究表明[9],利用傾向性評分方法的觀察性研究和與之匹配的隨機對照試驗的結果間依然存在著重要的差異;而導致出現上述差異的可能原因很多[9],例如,兩類研究在干預措施的定義、結局指標的確定等方面存在差異;使用傾向性評分的觀察性研究仍可能會受到殘余混雜的影響。此外,觀察性研究會因為不恰當的設計而產生其他偏倚[10-12],例如,恒定時間偏倚(immortal time bias)和現用藥者偏倚(prevalent user bias)。近年來,一種新的研究框架“目標試驗模擬研究”(target trial emulation study)被正式確立[13-14]。該框架可以幫助理解和控制前瞻性或回顧性觀察性研究設計和分析中可能存在的偏倚,因而可被用以指導基于真實世界數據的觀察性研究的設計與分析,以實現對目標試驗的模擬[2,5,7,13]。鑒于國內尚無文獻系統地介紹該框架,因此,本文從目標試驗模擬研究的基本概念、框架結構與實施步驟、發展現狀和展望等四個方面對其進行了概述,以期幫助國內學者更好地理解和應用該框架解決所遇到的臨床問題。
1 目標試驗模擬研究的基本概念
早在20世紀50年代的時候就有學者闡述了“目標試驗”的有關思想。Robins于1986年將該概念推廣到時異性處理策略的分析。然而,目標試驗模擬研究的框架直到近年來才被正式確立[2,13-14]。2016年,Hernán等[13]在Am J Epidemiol上發表論文,完善并明確了使用真實世界數據開展目標試驗模擬研究的基本框架和步驟。目前目標試驗模擬研究尚無統一規范的定義,結合已有方法學文獻[5,13,15-17],在本文中初步將一項目標試驗模擬研究定義為:參照隨機對照試驗設計的主要原則,利用合適的真實世界數據和統計分析方法模擬一項已有的或假設的隨機對照試驗(“目標試驗”),盡可能地減少和控制觀察性研究設計和分析中可能被忽視的偏倚,進而實現科學因果推斷的研究過程。
2 目標試驗模擬研究的框架與步驟
目標試驗模擬研究的框架主要包括研究對象的合格標準、治療策略、分配程序、隨訪期、結局指標、關注的因果比較、分析計劃等7個組成部分[5,13,15-17]。以一項評價2型糖尿病強化治療方法有效性和成本的模擬研究為例[15],其主要組成部分見表1。目標試驗模擬研究的實施主要包括三個步驟[13,15,17]:第一步:基于擬解決的研究問題和上述框架的組成部分,制定被模擬的目標試驗的方案。第二步:參照第一步制定的研究方案,基于已有的真實世界數據制定模擬研究的可操作方案并產生模擬數據。第三步:基于第二步確定的分析方案,利用模擬數據完成統計分析以獲得所關注的治療效應的估計值。

3 目標試驗模擬研究的現狀
計算機檢索Web of Science核心合集中的SCIE和SSCI數據庫,搜集關于目標試驗模擬研究的相關文獻,檢索時限為2012年1月1日—2022年9月5日。采用科學計量學方法,運用Excel 2016和VOSviewer 1.6.18軟件繪制目標試驗模擬研究文獻的知識圖譜。結果顯示,近十年來目標試驗模擬研究的文獻數量呈明顯上升趨勢(圖1),反映其關注度逐漸增加。來自哈佛大學陳曾熙公共衛生學院的Hernán MA為該領域的主要貢獻者,且與其他學者存在著緊密的合作。美國和英格蘭參與發表的論文數量最多,且與其他國家或地區的合作比較密切。高頻關鍵詞共現網絡時間圖(已合并同義詞)反映了目標模擬研究應用的主要領域(例如,COVID-19[18])及相關的統計分析方法(例如,傾向性評分和逆概率加權[19])等(圖2)。


4 目標試驗模擬研究的展望
4.1 目標試驗模擬研究為開展醫療器械/藥品的上市后再評價提供了新的思路
上市后再評價是醫療器械/藥品全生命周期評價中的重要環節之一。上市前臨床試驗的樣本量通常較小、隨訪時間不長,且納入的研究對象常常無法很好地代表臨床實踐中的真實人群[20-21],因此,需要在上市后利用真實世界數據對它們進行再評價,從而獲得真實世界的效果與安全性證據。利用目標試驗模擬研究框架指導基于真實世界數據的觀察性研究的設計與分析有望促進觀察性研究的質量,產生低偏倚、高質量的醫療器械/藥品上市后再評價證據,從而補充和驗證來自隨機對照試驗的證據。例如,Dickerman等[17]以他汀類藥物與癌癥發病風險為例,在利用相同的觀察性數據的情況下,基于目標試驗模擬研究框架發現他汀類藥物沒有影響癌癥的發病風險,這與既往的觀察性研究認為他汀類藥物能夠降低癌癥的發病風險的結果相矛盾,但卻與隨機對照試驗結果的發現一致。
安全性評價是上市后再評價的一個重要方面,對于有較強證據支持的具有潛在安全性風險的干預措施開展隨機對照試驗可能并不符合醫學倫理的要求,此時可以考慮基于目標試驗模擬研究框架開展真實世界研究。一項醫療干預措施除了需要考慮其有效性和安全性外,由于需要優化有限醫療資源的配置,還需要考慮其成本問題,因此,有學者近期提出可以基于目標試驗模擬研究開展衛生技術評估研究[15,20]。
4.2 目標試驗模擬研究為提高觀察性研究質量和促進證據整合研究的開展提供了新的視角
目標試驗模擬研究框架能用于確定已有觀察性研究的缺陷[22],而ROBINS-I工具也將非隨機干預性研究視為對其目標試驗模擬研究以進行偏倚風險評價[23]。使用真實世界數據去重復一項已有的隨機對照試驗,當觀察性研究與隨機對照試驗的結果相似或一致時,觀察性研究能佐證并補充隨機對照試驗的發現,當結果存在差異時,二者的對比可以幫助我們更好地理解二者間差異的來源[7];從而可以幫助我們更好地理解觀察性數據的特點與結構,為科學地開展其他觀察性研究提供方法學參考。例如,Hernán等[24]使用護士健康研究的觀察性數據模擬了一項研究絕經后激素使用與冠心病風險關系的隨機對照試驗,作者認為二者之間意向性治療分析結果的差異主要是因為絕經后時間分布和隨訪時間的差異所導致。在缺少對干預措施進行直接比較的隨機對照試驗或開展隨機對照試驗并不可行時,可基于該框架模擬一項隨機對照試驗,進而實現它們的有效比較,從而為衛生決策提供可以值得信賴的研究證據。例如,Hulme等[18]利用OpenSAFELY平臺開展了一項比較兩種疫苗BNT162b2 mRNA和ChAdOx1對COVID-19免疫效果的目標試驗模擬研究,結果發現二者的免疫效果沒有明顯差異。當然,也可將目標試驗模擬研究的結果用于證據整合研究,例如,網狀Meta分析[25]。還可使用真實世界數據去模擬一項正在進行的隨機對照試驗,從而提前預測該隨機對照試驗的結果[6,7,26]。例如,“OPERAND”[7]和“RCT DUPLICATE”[6,26]項目,它們被設計用于重復或預測對應隨機對照試驗的結果。
此外,“估計目標”(estimand)框架近年來被確立用以精確定義臨床試驗中所關注的研究問題[27],建議研究者考慮在開展目標試驗模擬研究時利用該框架精確定義所要研究的問題。基于目標試驗模擬研究框架開展真實世界研究雖然具有一定的前景,但是真實世界數據的可獲得性與質量及適用性、研究設計與統計分析方法的選擇等都會影響能否成功地開展一項模擬研究[7]。同時需要注意的是,目標試驗模擬研究并非一種新的流行病學研究設計,它旨在為開展基于真實世界數據的觀察性研究的設計與分析提供指導性框架,因此仍然無法完全避免觀察性研究本身存在的問題(例如,測量偏倚),且被模擬的試驗本質上也屬于實效性隨機對照試驗[13]。
5 總結
目標試驗模擬研究作為一種新的研究框架,正逐漸受到眾多學者們的青睞。它能用以指導開展基于真實世界數據的觀察性研究,幫助減少和控制觀察性研究中可能被忽略的偏倚(例如,恒定時間偏倚),從而有效地實現暴露因素與結局間因果關聯的推斷。本文主要從基本概念、框架組成與實施步驟、發展現狀和展望四個方面對目標試驗模擬研究進行了概述,希望能夠為國內研究者理解和應用該研究框架提供一定的幫助。
聲明 所有作者均聲明無利益沖突。
因果推斷即確定不同事件(或現象)之間的因果關聯及定量因果效應的大小。如何實現因果推斷一直是科學研究的核心問題,也是生物醫學研究的主要目標之一[1]。在榮獲2021年諾貝爾經濟學獎的三位學者中,兩位是因為對因果分析方法做出了重大貢獻而獲獎。隨機對照試驗被公認為是確定因果關聯的金標準[2-4],是確定醫療干預措施有效性和安全性的最重要流行病學研究設計之一[5-6]。但是,由于成本高昂、醫學倫理等原因,在某些情況下開展隨機對照試驗并不可取或者不可行[3-4]。
隨著海量真實世界數據(例如,電子病歷數據[7])的累積和統計分析方法的進展,基于真實世界數據的高質量觀察性研究將會更好地補充來自隨機對照試驗的證據。然而,與高質量的前瞻性隨機對照試驗不同,基于真實世界數據開展的觀察性研究常會因為存在各種偏倚,導致研究者無法獲得準確的效應估計值。傾向性評分作為一種重要的統計分析方法,常被用在基于真實世界數據的觀察性研究中以減少已知混雜因素的影響[7-9]。但近期的一項方法學研究表明[9],利用傾向性評分方法的觀察性研究和與之匹配的隨機對照試驗的結果間依然存在著重要的差異;而導致出現上述差異的可能原因很多[9],例如,兩類研究在干預措施的定義、結局指標的確定等方面存在差異;使用傾向性評分的觀察性研究仍可能會受到殘余混雜的影響。此外,觀察性研究會因為不恰當的設計而產生其他偏倚[10-12],例如,恒定時間偏倚(immortal time bias)和現用藥者偏倚(prevalent user bias)。近年來,一種新的研究框架“目標試驗模擬研究”(target trial emulation study)被正式確立[13-14]。該框架可以幫助理解和控制前瞻性或回顧性觀察性研究設計和分析中可能存在的偏倚,因而可被用以指導基于真實世界數據的觀察性研究的設計與分析,以實現對目標試驗的模擬[2,5,7,13]。鑒于國內尚無文獻系統地介紹該框架,因此,本文從目標試驗模擬研究的基本概念、框架結構與實施步驟、發展現狀和展望等四個方面對其進行了概述,以期幫助國內學者更好地理解和應用該框架解決所遇到的臨床問題。
1 目標試驗模擬研究的基本概念
早在20世紀50年代的時候就有學者闡述了“目標試驗”的有關思想。Robins于1986年將該概念推廣到時異性處理策略的分析。然而,目標試驗模擬研究的框架直到近年來才被正式確立[2,13-14]。2016年,Hernán等[13]在Am J Epidemiol上發表論文,完善并明確了使用真實世界數據開展目標試驗模擬研究的基本框架和步驟。目前目標試驗模擬研究尚無統一規范的定義,結合已有方法學文獻[5,13,15-17],在本文中初步將一項目標試驗模擬研究定義為:參照隨機對照試驗設計的主要原則,利用合適的真實世界數據和統計分析方法模擬一項已有的或假設的隨機對照試驗(“目標試驗”),盡可能地減少和控制觀察性研究設計和分析中可能被忽視的偏倚,進而實現科學因果推斷的研究過程。
2 目標試驗模擬研究的框架與步驟
目標試驗模擬研究的框架主要包括研究對象的合格標準、治療策略、分配程序、隨訪期、結局指標、關注的因果比較、分析計劃等7個組成部分[5,13,15-17]。以一項評價2型糖尿病強化治療方法有效性和成本的模擬研究為例[15],其主要組成部分見表1。目標試驗模擬研究的實施主要包括三個步驟[13,15,17]:第一步:基于擬解決的研究問題和上述框架的組成部分,制定被模擬的目標試驗的方案。第二步:參照第一步制定的研究方案,基于已有的真實世界數據制定模擬研究的可操作方案并產生模擬數據。第三步:基于第二步確定的分析方案,利用模擬數據完成統計分析以獲得所關注的治療效應的估計值。

3 目標試驗模擬研究的現狀
計算機檢索Web of Science核心合集中的SCIE和SSCI數據庫,搜集關于目標試驗模擬研究的相關文獻,檢索時限為2012年1月1日—2022年9月5日。采用科學計量學方法,運用Excel 2016和VOSviewer 1.6.18軟件繪制目標試驗模擬研究文獻的知識圖譜。結果顯示,近十年來目標試驗模擬研究的文獻數量呈明顯上升趨勢(圖1),反映其關注度逐漸增加。來自哈佛大學陳曾熙公共衛生學院的Hernán MA為該領域的主要貢獻者,且與其他學者存在著緊密的合作。美國和英格蘭參與發表的論文數量最多,且與其他國家或地區的合作比較密切。高頻關鍵詞共現網絡時間圖(已合并同義詞)反映了目標模擬研究應用的主要領域(例如,COVID-19[18])及相關的統計分析方法(例如,傾向性評分和逆概率加權[19])等(圖2)。


4 目標試驗模擬研究的展望
4.1 目標試驗模擬研究為開展醫療器械/藥品的上市后再評價提供了新的思路
上市后再評價是醫療器械/藥品全生命周期評價中的重要環節之一。上市前臨床試驗的樣本量通常較小、隨訪時間不長,且納入的研究對象常常無法很好地代表臨床實踐中的真實人群[20-21],因此,需要在上市后利用真實世界數據對它們進行再評價,從而獲得真實世界的效果與安全性證據。利用目標試驗模擬研究框架指導基于真實世界數據的觀察性研究的設計與分析有望促進觀察性研究的質量,產生低偏倚、高質量的醫療器械/藥品上市后再評價證據,從而補充和驗證來自隨機對照試驗的證據。例如,Dickerman等[17]以他汀類藥物與癌癥發病風險為例,在利用相同的觀察性數據的情況下,基于目標試驗模擬研究框架發現他汀類藥物沒有影響癌癥的發病風險,這與既往的觀察性研究認為他汀類藥物能夠降低癌癥的發病風險的結果相矛盾,但卻與隨機對照試驗結果的發現一致。
安全性評價是上市后再評價的一個重要方面,對于有較強證據支持的具有潛在安全性風險的干預措施開展隨機對照試驗可能并不符合醫學倫理的要求,此時可以考慮基于目標試驗模擬研究框架開展真實世界研究。一項醫療干預措施除了需要考慮其有效性和安全性外,由于需要優化有限醫療資源的配置,還需要考慮其成本問題,因此,有學者近期提出可以基于目標試驗模擬研究開展衛生技術評估研究[15,20]。
4.2 目標試驗模擬研究為提高觀察性研究質量和促進證據整合研究的開展提供了新的視角
目標試驗模擬研究框架能用于確定已有觀察性研究的缺陷[22],而ROBINS-I工具也將非隨機干預性研究視為對其目標試驗模擬研究以進行偏倚風險評價[23]。使用真實世界數據去重復一項已有的隨機對照試驗,當觀察性研究與隨機對照試驗的結果相似或一致時,觀察性研究能佐證并補充隨機對照試驗的發現,當結果存在差異時,二者的對比可以幫助我們更好地理解二者間差異的來源[7];從而可以幫助我們更好地理解觀察性數據的特點與結構,為科學地開展其他觀察性研究提供方法學參考。例如,Hernán等[24]使用護士健康研究的觀察性數據模擬了一項研究絕經后激素使用與冠心病風險關系的隨機對照試驗,作者認為二者之間意向性治療分析結果的差異主要是因為絕經后時間分布和隨訪時間的差異所導致。在缺少對干預措施進行直接比較的隨機對照試驗或開展隨機對照試驗并不可行時,可基于該框架模擬一項隨機對照試驗,進而實現它們的有效比較,從而為衛生決策提供可以值得信賴的研究證據。例如,Hulme等[18]利用OpenSAFELY平臺開展了一項比較兩種疫苗BNT162b2 mRNA和ChAdOx1對COVID-19免疫效果的目標試驗模擬研究,結果發現二者的免疫效果沒有明顯差異。當然,也可將目標試驗模擬研究的結果用于證據整合研究,例如,網狀Meta分析[25]。還可使用真實世界數據去模擬一項正在進行的隨機對照試驗,從而提前預測該隨機對照試驗的結果[6,7,26]。例如,“OPERAND”[7]和“RCT DUPLICATE”[6,26]項目,它們被設計用于重復或預測對應隨機對照試驗的結果。
此外,“估計目標”(estimand)框架近年來被確立用以精確定義臨床試驗中所關注的研究問題[27],建議研究者考慮在開展目標試驗模擬研究時利用該框架精確定義所要研究的問題。基于目標試驗模擬研究框架開展真實世界研究雖然具有一定的前景,但是真實世界數據的可獲得性與質量及適用性、研究設計與統計分析方法的選擇等都會影響能否成功地開展一項模擬研究[7]。同時需要注意的是,目標試驗模擬研究并非一種新的流行病學研究設計,它旨在為開展基于真實世界數據的觀察性研究的設計與分析提供指導性框架,因此仍然無法完全避免觀察性研究本身存在的問題(例如,測量偏倚),且被模擬的試驗本質上也屬于實效性隨機對照試驗[13]。
5 總結
目標試驗模擬研究作為一種新的研究框架,正逐漸受到眾多學者們的青睞。它能用以指導開展基于真實世界數據的觀察性研究,幫助減少和控制觀察性研究中可能被忽略的偏倚(例如,恒定時間偏倚),從而有效地實現暴露因素與結局間因果關聯的推斷。本文主要從基本概念、框架組成與實施步驟、發展現狀和展望四個方面對目標試驗模擬研究進行了概述,希望能夠為國內研究者理解和應用該研究框架提供一定的幫助。
聲明 所有作者均聲明無利益沖突。