隨著信息技術和數據科學的快速發展,基于多樣化的真實世界數據體系形成的真實世界證據,已成為醫療衛生決策的重要來源(如藥械監管、目錄制定、指南制定、疾病管理等)。要產生高質量真實世界證據既需要完整、準確和可用的數據,還需要通過科學合理的研究設計和數據分析過程,最終回答決策需解決的問題。為了促進我國高質量真實世界證據的生產與使用,中國真實世界數據與研究聯盟(ChinaREAL)通過嚴格的方法和流程制作了首批真實世界數據與研究技術規范。ChinaREAL 未來將持續生產相關技術規范,最終提高我國醫療衛生決策水平。
引用本文: 孫鑫, 譚婧, 王雯, 高培, 彭曉霞, 溫澤淮, 王麗, 吳晶, 舒嘯塵, 王楊, 羅劍鋒, 李玲, 李幼平, 姚晨, 趙琨, 陳英耀, 翟所迪, 詹思延, 吳久鴻, 郭劍非, 呂志強, 謝鋒, GordonGuyatt, 代表中國真實世界數據與研究聯盟(ChinaREAL). 建立真實世界數據與研究技術規范,促進中國真實世界證據的生產與使用. 中國循證醫學雜志, 2019, 19(7): 755-762. doi: 10.7507/1672-2531.201905082 復制
1 背景與目的
隨著信息和數據科學技術的快速發展,全球臨床醫療和衛生決策正在發生深刻變革。作為重要的新興領域之一,真實世界數據(real-world data,RWD)與真實世界研究(real-world study,RWS)、以及基于 RWD 所產生的真實世界證據(real-world evidence,RWE),已對醫療衛生決策的各個領域產生了廣泛而深遠的影響。例如,美國食品藥品監督管理局(FDA)對 RWD 和 RWE 高度關注,并制定了相關政策和技術指導意見用于藥械評價和監管[1-3]。尤其是以哨兵計劃(sentinel program)為代表的上市后醫療產品監測系統已成為該領域的典范,并被多國效仿[4]。在醫保藥物遴選和相關政策制定中,以英國 NICE(National Institute for Health and Clinical Excellence)、加拿大 CADTH(Canadian Agency for Drugs and Technologies in Health)為代表的醫保決策部門正越來越多地使用 RWE 支持醫療產品的國家醫保目錄準入決策[5-8]。以英國 NICE 為代表的國際臨床指南機構也越來越多地使用 RWE 用于臨床指南制作[9]。此外,人工智能技術,尤其是機器學習技術引入醫療衛生領域,也促進了 RWD 在臨床輔助決策領域的廣泛使用[10-14]。
RWD 與 RWS 的概念自 2010 年正式引入我國,近十年的發展方興未艾。在以藥械監管、醫保決策、醫療健康管理為代表的三個關鍵領域,RWE 已越來越成為政府部門、醫療衛生執業者和其他利益相關方共同關注的話題[15]。但我國 RWD 和 RWS 目前仍處于早期發展階段,面臨諸多挑戰和誤區[16]。例如:① 缺乏對 RWD 和 RWS 體系的頂層設計與構思;② 在從源數據到研究型數據庫的建設方面,缺乏規范、可行的技術標準;③ 基于 RWD 開展相關研究過程中,在研究設計和數據分析方面仍然存在眾多誤區(如不能設對照、不能隨機、不合理地調整混雜和無限制地加入變量到預測模型等);④ 對 RWE 的評價存在極端化的趨勢。一部分人認為 RWE 等級高于傳統隨機對照試驗(randomized controlled trial,RCT);另一部分人認為低于隨機對照臨床試驗。這些問題很大程度上影響了高質量 RWD 的產生、高質量研究的開展、合理的 RWE 解釋與使用,最終降低醫療衛生決策效率。
為提高我國 RWD 與 RWS 的水平,更好地推進“健康中國 2030”的國家戰略,中國循證醫學中心在 2017 年 7 月聯合全國 32 個科研院所的學術專家,成立了中國 RWD 與 RWS 聯盟(China REal world data and studies ALliance,ChinaREAL),并與多個數據機構(如廈門市健康醫療大數據中心、寧波鄞州區域醫療數據等)建立數據合作伙伴關系。聯盟以建立科學、審慎和可及的中國 RWD 和 RWS 生態系統為目標(圖 1)。同時,邀請來自國家藥品監督管理局、國家醫療保障局的相關專家及在該領域的國內外資深學術專家提供相關指導。針對目前我國在 RWD 和 RWS 當中存在的關鍵問題,ChinaREAL 當前的首要任務是通過科學周密的頂層設計,建立 RWD 與 RWS 的系列技術規范以優化 RWD 體系,促進高質量 RWE 的生產與使用。2018 年 11 月,經過一年籌備,正式啟動技術規范的制作。為讓更多讀者清晰了解總體思路并形成廣泛共識,聯盟工作組和專家組決定共同撰寫本文,簡要介紹系列技術規范的總體設計和制作方法;介紹 RWD 與 RWS 體系的理論框架、關鍵定義、理念和出發點,以幫助讀者在使用該系列技術規范的過程中,更正確、充分理解與運用本技術規范。

RWD:真實世界數據;RWE:真實世界證據
2 技術規范的總體設計與制作方法
2.1 總體思路與設計
RWD 與 RWS 是一個多學科交叉的復雜科學體系。該體系涵蓋信息和數據技術、臨床醫學、臨床/藥物流行病學、循證醫學、醫學統計學、人工智能技術、衛生/藥物經濟學、衛生政策與管理等多學科和關鍵技術。同時,對 RWE 的需求可能來自不同決策者(如藥監、醫保等)和醫療衛生執業者。這些證據使用者的角度差異也可能影響 RWD 與 RWS 中的關鍵技術的使用,及其對證據的解讀。
RWD 與 RWS 體系復雜,同時涉及多個學科和不同的使用者,為制作技術規范帶來了挑戰。為了讓讀者清晰、明確且方便地使用技術規范,ChinaREAL 工作組決定,按照不同的具體技術問題,分別制定相應的技術規范,并按批次制作和發布。每個技術規范將針對具體技術問題說明適用內容和范圍。
此外,由于技術的多樣性和快速發展性,即便是同一技術問題,可能存在多種解決途徑。因此,在篇幅可控又易于閱讀的整體要求下,該系列技術規范著重解決在 RWD 和 RWS 過程中的基本技術要求,而非對具體關鍵技術進行詳細的方法學描述。
此次發布的 5 個技術規范作為 RWD 與 RWS 第一批技術規范,主要解決兩個關鍵問題:① 如何基于 RWD,建立研究型數據庫(這是開展 RWS 的關鍵基礎);② 基于這些研究數據如何開展治療結局的評價(這是目前最關注的問題之一)。其中,技術規范 1 主要針對典型的既有健康醫療數據構建研究型數據庫的技術要求展開討論,技術規范 2 詳細討論了構建患者登記庫的關鍵技術要求,這兩個技術規范主要回答第一個關鍵問題。技術規范 3~4 主要針對利用研究型數據庫,基于觀察性設計評估治療結局(有效性和安全性)的流行病學設計和統計分析問題,技術規范 5 主要討論實效性臨床試驗的相關技術要求,這三個技術規范主要解決第二個關鍵問題。
2.2 技術規范制作過程與方法
為了保證整個技術規范的制作質量,ChinaREAL 預先制定了系統化策略,并按計劃實施。同時建立技術規范工作組、核心工作組、顧問專家組、秘書組等(圖 2,具體人員請見致謝部分)。

2.2.1 搭建技術規范工作組和秘書組
基于聯盟工作組專家,建立了技術規范的工作組,主要負責技術規范的起草。針對每一個技術規范,指定 2~4 名共同召集人(co-convener),共同負責具體策劃和執行。這些共同負責人均在 RWD 與 RWS 領域有較豐富的研究經驗,并且已在權威醫學雜志發表了相應文章。各個技術規范的召集人共同組成技術規范的核心專家組,協調和統一各個技術規范。同時,建立秘書組,負責整個系列技術規范體系的策劃,及其與內外部專家和利益相關方的協調。
2.2.2 建立工作組技術規范制作流程
秘書組和工作組核心專家共同制定了技術規范制作流程。整個工作分為:① 籌備期(2017 年 10 月~2018 年 10 月),主要通過三次工作組討論會,形成共識并最終確定設計和撰寫策略;② 技術規范起草(2018 年 11 月~2019 年 4 月),主要由各個技術規范小組構建相應技術規范,由每個技術規范的共同召集人主筆起草相應技術規范,邀請小組的其他專家參與修訂,并通過微信、電話、現場會議等方式對初稿進行討論,并達成共識。在整個制定過程中,各個技術規范小組同時參考了全球權威部門(如美國 FDA)的重要學術成果的推薦;③技術規范初稿的交叉審核(2019 年 4 月),主要由各個共同技術規范的共同召集人對形成的 5 個技術規范相互交叉檢查,并提出相關意見和建議,確保在思路、方法和語言上的統一。
2.2.3 專家審核與共識
為進一步對技術規范進行確認和修定,聯盟秘書組邀請了藥品監管專家、多學科資深學術專家(包括流行病學、統計學、藥物經濟學、衛生技術評估和臨床藥學)與聯盟工作組專家通過現場會議和書函審評的形式對初步技術規范進行了最終的審定和修改(具體專家列表見致謝部分)。對于現場會議,秘書組和工作組分別介紹了整個技術規范的總體設計和思想,以及具體技術規范。在此基礎上,通過專家討論形成共識。對于函評專家,秘書組通過郵件方式將技術規范提供給各個專家,征集意見。最終,核心工作組基于專家意見修訂技術規范。
2.2.4 利益相關方
為征集更廣泛的意見和建議,聯盟同時邀請了利益相關方參與技術規范的審核和共識會。在整個過程中,邀請相關人員對技術規范提出意見和建議。聯盟工作組在收集意見并通過集體判斷后,確定是否采納。此外,為避免利益沖突,利益相關方不參加最終決策。
3 RWD 與 RWS 體系的相關理論框架和理念
3.1 RWD 與 RWS 體系的理論框架
隨著信息技術、醫學臨床研究理念和技術的快速發展,RWD 與 RWS 已逐漸形成較完善的框架體系(圖 3)。其核心思想是,以研究為導向,通過基于真實世界的健康醫療數據,形成研究型數據庫,并運用研究手段,最終形成證據,從而實現支持臨床和醫療衛生決策的目的。

從技術上講,該體系主要包括三大步驟:① 基于常規健康醫療數據,針對相關研究目標,利用多種信息技術手段和數據治理技術,建立研究型數據庫;② 在建立研究型數據庫基礎上,針對具體的研究問題(如疾病負擔、診斷、治療、預后、成本等),運用不同專業方法學科的技術手段(如臨床/藥物流行病學、生物統計與人工智能、衛生/藥物經濟學等),開展研究設計和數據處理,并最終形成研究證據;③ 將形成的證據用于臨床指南制定、疾病管理、醫療產品評價、監管和目錄準入決策等。
在整個過程中,研究型數據庫的搭建是關鍵的第一步。通常基于常規健康醫療數據構建研究型數據庫具有明確的科研目標。但這些研究目標在多數情況下,并非是某一個具體的研究問題(即研究假設),更多是總體考慮研究的需求。因此,在通過對數據的集成和治理最終形成研究型數據庫的過程中,對科研需求的考慮是非常重要的。
當形成研究型數據庫后,再針對具體研究問題,利用臨床/藥物流行病學、生物統計和人工智能技術等關鍵方法技術,設計研究和處理數據,最終回答研究假設,這個過程就是常稱的“RWS”。但是,在更多的情況下,通常會把建立研究型數據庫、開展研究設計和數據處理的整個過程統稱為 RWS。
RWD 和 RWS 目前已被廣泛用于醫療和衛生各個領域,其主要用途主要包含以下幾方面:① 醫療產品的評估和政策制定(如藥監和醫保決策);② 疾病臨床研究(如患者診斷、預后等);③ 輔助疾病管理和臨床決策(如臨床決策輔助系統和臨床指南);④ 促進醫療質量。后兩者存在較強的聯系。
3.2 RWD 與研究型數據庫
3.2.1 RWD
目前,全球各個部門和領域對 RWD 的定義尚存在差異。美國食品藥品監督管理局(FDA)于 2017 年在使用 RWE 支持醫療監管決策的技術規范文本中[1],對 RWD 進行了明確的定義:除了傳統臨床試驗以外的數據都可作為 RWD。這是一個非常寬泛的定義。但無論采用何種描述,RWD 的核心含義是指:在實際的健康醫療環境下形成和收集的數據;數據的產生和收集過程與臨床醫療過程保持較好一致。
RWD 的類型多種多樣;隨著信息技術和健康醫療模式的轉變,更多的數據類型可能還會不斷涌現。從目前而言,經典的 RWD 包含兩大類:① 既有健康醫療數據,其中比較典型的包含醫院電子病歷數據(EMR)、區域醫療健康數據、醫療保險數據;② 在預先建立數據框架下,圍繞疾病、產品或服務模式建立的患者登記。這些患者登記的數據可能部分來自既有健康醫療數據,也可能來自于主動數據收集系統(如患者自報數據、通過佩戴設備收集的數據等)。除此之外,還包括調查數據(survey data)等其他數據。
3.2.2 從 RWD 到研究型數據庫
既有健康醫療數據從本質上來講,由于更多是用于醫療衛生管理目的,難以直接用于科學研究。其存在的問題包含數據片段化、未標化、未鏈接、無法形成縱向隨訪等各個方面的問題,同時還涉及數據安全和隱私保護等相關倫理方面考慮。因此,這些既有健康醫療的源數據本身不能直接用于科學研究,必須要基于科研目的,對數據進行匯集和治理,最終形成統一、標準化、可使用的研究型數據庫形式(圖 4)[17]。

此外,圍繞疾病、醫療產品、服務模式的患者登記,從本質上講也是在建立明確統一的數據框架,整合多種數據來源的基礎上,通過數據集成和治理而形成的(圖 4)[18]。該過程還可通過主動收集數據獲取研究者或決策者所需的關鍵信息(如腫瘤患者生活質量)和其他無法通過既有健康醫療數據獲取的信息。因此,從數據的質量控制(如準確性、完整性等)可能比既有健康數據更好。
以上兩種情況,其實質都是將 RWD 向研究型數據庫轉變。
3.3 RWS
3.3.1 RWS 的過程
RWS 與傳統臨床研究過程總體上而言是類似的,仍然需要經過提出研究問題,建立研究方案,獲取數據形成研究數據集,分析處理數據和報告等幾個過程(圖 5)。最主要的區別在于:在 RWD 的研究環境下,具體的研究問題可能是在已經建立了研究型數據庫之后產生的。因此,對于數據庫和數據庫框架體系的了解和掌握,很大程度上決定了研究的可行性和科學性。

因此,從 RWS 的思維過程來講,當形成了具體研究問題之后,通常需要對目標數據庫進行探索,以了解數據基本情況和可獲得性,然后再針對具體研究問題形成研究方案,并獲取相應的數據形成數據集,最后分析研究結果。
3.3.2 RWD 研究的頂層設計
RWS 的設計思路總體上而言與傳統臨床研究是類似的,仍然是以具體研究問題為導向的設計(圖 6)。根據不同的研究問題,選擇的流行病學設計可能存在差異(如試驗 vs. 觀察性研究)。同一個研究問題,可選用不同的研究設計來回答。決策者和研究者需要判斷的是,這些不同設計的優缺點,及其可能獲得的證據是否能充分回答研究問題本身。例如,對于評估藥物治療的實際效果而言,基于數據庫的隊列設計和實效性試驗都是可以選擇的方式。但是,實效性試驗,尤其是實效性隨機對照試驗能更好解決選擇性偏倚的問題,因此證據說服力更強[19]。

當然,還需要強調的是,隨機對照研究設計雖然是治療結局評價的優選研究設計類型,但并非能夠回答所有研究問題。例如,對于評估疾病負擔、建立疾病風險預測等問題而言,特別是罕見疾病及罕見結局等問題,是難以通過隨機對照研究設計實現的。
3.3.3 不同視角和專業領域對 RWS 設計思維存在差異
由于 RWD 和 RWS 體系是一個多學科、跨專業的整合科學體系,并在不同領域廣泛應用。因此,對該體系的理解、頂層設計思路,甚至是語言的使用都可能存在差異。此外,不同專業的研究者在考慮 RWS 設計時可能也存在差異。例如,藥物和臨床流行病學專家與藥物經濟學家在使用 RWD 時由于研究目的可能存在較大差異(如:藥品安全性評價 vs. 藥品政策研究),在對研究設計的選擇、研究資源的使用、研究數據的類型和質量等方面都會存在較大的差異。
3.4 RWD 與 RWS 中的倫理學問題
從本質上講,RWD 及其相關研究屬于臨床研究范疇。由于使用了患者或健康人群的個人數據,這些研究本身需要遵守倫理學原則。我們在前期已經針對 RWD 使用和 RWS 中的倫理學問題進行了討論[20],本文不再贅述。目前,針對使用 RWD 開展研究的倫理學規范尚不完善。需要提到的是,無論什么目的的臨床研究,都需要通過倫理審查。
4 小結
RWD 與 RWS 已對醫療衛生決策的各個領域產生了廣泛而深遠的影響。在我國,RWD 及 RWS 還處于起步階段,面臨諸多挑戰和誤區。ChinaREAL 圍繞 RWE 生產中的兩個關鍵問題,包括如何基于 RWD 建立研究型數據庫,如何開展治療結局的評價撰寫了第一批技術規范。未來,我們將圍繞 RWE 的生產與使用中的關鍵問題,分批次建立技術規范,促進 RWE 在我國醫療衛生決策中的合理使用。
致謝 本次首批五個技術規范的草擬均由中國真實世界數據與研究聯盟工作組專家承擔。技術規范的審核得到了來自藥監部門、國內外學術專家的大力支持。具體組織機構、支持機構、審評專家組、工作組構成如下。
發起單位
四川大學華西醫院中國循證醫學中心
中國真實世界數據與研究聯盟
國際藥物經濟學與結果研究協會華西分會
支持單位
國家藥品監督管理局醫療器械監管科學研究基地
四川大學醫療器械監管科學研究院
中國醫師協會循證醫學專委會
中國藥學會藥物經濟學專委會
中國 Cochrane 中心
IDEAL 中國中心
國際藥物經濟學與結果研究協會
技術規范審評專家組
藥品監管專家
會評專家:高國彪、胡增峣、宋海波、盧紅、滕穎影、符祝、林尤海
函評專家:楊志敏、吳桂芝
中華醫學基金會
會評專家:李文凱、周娜
學術咨詢專家
會評專家:李幼平、姚晨、趙琨、陳英耀、翟所迪
函評專家:詹思延、吳久鴻、郭劍非、呂志強、謝鋒、徐福潔、Gordon Guyatt
技術規范工作組
執筆工作組成員(在本文中視為同等貢獻):孫鑫、高培、彭曉霞、溫澤淮、譚婧、王雯、吳晶、王麗、舒嘯塵、王楊、羅劍鋒、李玲
參與工作組成員(按姓名拼音排序):陳進、陳曉凡、竇豐滿、費宇彤、郭曉慧、郭新峰、賀小寧、胡皓、胡明、黎國威、李洪超、劉艷梅、毛琛、聶曉璐、任燕、唐少文、宣建偉、閆盈盈、于川、張玲
秘書組
孫鑫、王雯、譚婧、何俏、劉春容、鄒康
1 背景與目的
隨著信息和數據科學技術的快速發展,全球臨床醫療和衛生決策正在發生深刻變革。作為重要的新興領域之一,真實世界數據(real-world data,RWD)與真實世界研究(real-world study,RWS)、以及基于 RWD 所產生的真實世界證據(real-world evidence,RWE),已對醫療衛生決策的各個領域產生了廣泛而深遠的影響。例如,美國食品藥品監督管理局(FDA)對 RWD 和 RWE 高度關注,并制定了相關政策和技術指導意見用于藥械評價和監管[1-3]。尤其是以哨兵計劃(sentinel program)為代表的上市后醫療產品監測系統已成為該領域的典范,并被多國效仿[4]。在醫保藥物遴選和相關政策制定中,以英國 NICE(National Institute for Health and Clinical Excellence)、加拿大 CADTH(Canadian Agency for Drugs and Technologies in Health)為代表的醫保決策部門正越來越多地使用 RWE 支持醫療產品的國家醫保目錄準入決策[5-8]。以英國 NICE 為代表的國際臨床指南機構也越來越多地使用 RWE 用于臨床指南制作[9]。此外,人工智能技術,尤其是機器學習技術引入醫療衛生領域,也促進了 RWD 在臨床輔助決策領域的廣泛使用[10-14]。
RWD 與 RWS 的概念自 2010 年正式引入我國,近十年的發展方興未艾。在以藥械監管、醫保決策、醫療健康管理為代表的三個關鍵領域,RWE 已越來越成為政府部門、醫療衛生執業者和其他利益相關方共同關注的話題[15]。但我國 RWD 和 RWS 目前仍處于早期發展階段,面臨諸多挑戰和誤區[16]。例如:① 缺乏對 RWD 和 RWS 體系的頂層設計與構思;② 在從源數據到研究型數據庫的建設方面,缺乏規范、可行的技術標準;③ 基于 RWD 開展相關研究過程中,在研究設計和數據分析方面仍然存在眾多誤區(如不能設對照、不能隨機、不合理地調整混雜和無限制地加入變量到預測模型等);④ 對 RWE 的評價存在極端化的趨勢。一部分人認為 RWE 等級高于傳統隨機對照試驗(randomized controlled trial,RCT);另一部分人認為低于隨機對照臨床試驗。這些問題很大程度上影響了高質量 RWD 的產生、高質量研究的開展、合理的 RWE 解釋與使用,最終降低醫療衛生決策效率。
為提高我國 RWD 與 RWS 的水平,更好地推進“健康中國 2030”的國家戰略,中國循證醫學中心在 2017 年 7 月聯合全國 32 個科研院所的學術專家,成立了中國 RWD 與 RWS 聯盟(China REal world data and studies ALliance,ChinaREAL),并與多個數據機構(如廈門市健康醫療大數據中心、寧波鄞州區域醫療數據等)建立數據合作伙伴關系。聯盟以建立科學、審慎和可及的中國 RWD 和 RWS 生態系統為目標(圖 1)。同時,邀請來自國家藥品監督管理局、國家醫療保障局的相關專家及在該領域的國內外資深學術專家提供相關指導。針對目前我國在 RWD 和 RWS 當中存在的關鍵問題,ChinaREAL 當前的首要任務是通過科學周密的頂層設計,建立 RWD 與 RWS 的系列技術規范以優化 RWD 體系,促進高質量 RWE 的生產與使用。2018 年 11 月,經過一年籌備,正式啟動技術規范的制作。為讓更多讀者清晰了解總體思路并形成廣泛共識,聯盟工作組和專家組決定共同撰寫本文,簡要介紹系列技術規范的總體設計和制作方法;介紹 RWD 與 RWS 體系的理論框架、關鍵定義、理念和出發點,以幫助讀者在使用該系列技術規范的過程中,更正確、充分理解與運用本技術規范。

RWD:真實世界數據;RWE:真實世界證據
2 技術規范的總體設計與制作方法
2.1 總體思路與設計
RWD 與 RWS 是一個多學科交叉的復雜科學體系。該體系涵蓋信息和數據技術、臨床醫學、臨床/藥物流行病學、循證醫學、醫學統計學、人工智能技術、衛生/藥物經濟學、衛生政策與管理等多學科和關鍵技術。同時,對 RWE 的需求可能來自不同決策者(如藥監、醫保等)和醫療衛生執業者。這些證據使用者的角度差異也可能影響 RWD 與 RWS 中的關鍵技術的使用,及其對證據的解讀。
RWD 與 RWS 體系復雜,同時涉及多個學科和不同的使用者,為制作技術規范帶來了挑戰。為了讓讀者清晰、明確且方便地使用技術規范,ChinaREAL 工作組決定,按照不同的具體技術問題,分別制定相應的技術規范,并按批次制作和發布。每個技術規范將針對具體技術問題說明適用內容和范圍。
此外,由于技術的多樣性和快速發展性,即便是同一技術問題,可能存在多種解決途徑。因此,在篇幅可控又易于閱讀的整體要求下,該系列技術規范著重解決在 RWD 和 RWS 過程中的基本技術要求,而非對具體關鍵技術進行詳細的方法學描述。
此次發布的 5 個技術規范作為 RWD 與 RWS 第一批技術規范,主要解決兩個關鍵問題:① 如何基于 RWD,建立研究型數據庫(這是開展 RWS 的關鍵基礎);② 基于這些研究數據如何開展治療結局的評價(這是目前最關注的問題之一)。其中,技術規范 1 主要針對典型的既有健康醫療數據構建研究型數據庫的技術要求展開討論,技術規范 2 詳細討論了構建患者登記庫的關鍵技術要求,這兩個技術規范主要回答第一個關鍵問題。技術規范 3~4 主要針對利用研究型數據庫,基于觀察性設計評估治療結局(有效性和安全性)的流行病學設計和統計分析問題,技術規范 5 主要討論實效性臨床試驗的相關技術要求,這三個技術規范主要解決第二個關鍵問題。
2.2 技術規范制作過程與方法
為了保證整個技術規范的制作質量,ChinaREAL 預先制定了系統化策略,并按計劃實施。同時建立技術規范工作組、核心工作組、顧問專家組、秘書組等(圖 2,具體人員請見致謝部分)。

2.2.1 搭建技術規范工作組和秘書組
基于聯盟工作組專家,建立了技術規范的工作組,主要負責技術規范的起草。針對每一個技術規范,指定 2~4 名共同召集人(co-convener),共同負責具體策劃和執行。這些共同負責人均在 RWD 與 RWS 領域有較豐富的研究經驗,并且已在權威醫學雜志發表了相應文章。各個技術規范的召集人共同組成技術規范的核心專家組,協調和統一各個技術規范。同時,建立秘書組,負責整個系列技術規范體系的策劃,及其與內外部專家和利益相關方的協調。
2.2.2 建立工作組技術規范制作流程
秘書組和工作組核心專家共同制定了技術規范制作流程。整個工作分為:① 籌備期(2017 年 10 月~2018 年 10 月),主要通過三次工作組討論會,形成共識并最終確定設計和撰寫策略;② 技術規范起草(2018 年 11 月~2019 年 4 月),主要由各個技術規范小組構建相應技術規范,由每個技術規范的共同召集人主筆起草相應技術規范,邀請小組的其他專家參與修訂,并通過微信、電話、現場會議等方式對初稿進行討論,并達成共識。在整個制定過程中,各個技術規范小組同時參考了全球權威部門(如美國 FDA)的重要學術成果的推薦;③技術規范初稿的交叉審核(2019 年 4 月),主要由各個共同技術規范的共同召集人對形成的 5 個技術規范相互交叉檢查,并提出相關意見和建議,確保在思路、方法和語言上的統一。
2.2.3 專家審核與共識
為進一步對技術規范進行確認和修定,聯盟秘書組邀請了藥品監管專家、多學科資深學術專家(包括流行病學、統計學、藥物經濟學、衛生技術評估和臨床藥學)與聯盟工作組專家通過現場會議和書函審評的形式對初步技術規范進行了最終的審定和修改(具體專家列表見致謝部分)。對于現場會議,秘書組和工作組分別介紹了整個技術規范的總體設計和思想,以及具體技術規范。在此基礎上,通過專家討論形成共識。對于函評專家,秘書組通過郵件方式將技術規范提供給各個專家,征集意見。最終,核心工作組基于專家意見修訂技術規范。
2.2.4 利益相關方
為征集更廣泛的意見和建議,聯盟同時邀請了利益相關方參與技術規范的審核和共識會。在整個過程中,邀請相關人員對技術規范提出意見和建議。聯盟工作組在收集意見并通過集體判斷后,確定是否采納。此外,為避免利益沖突,利益相關方不參加最終決策。
3 RWD 與 RWS 體系的相關理論框架和理念
3.1 RWD 與 RWS 體系的理論框架
隨著信息技術、醫學臨床研究理念和技術的快速發展,RWD 與 RWS 已逐漸形成較完善的框架體系(圖 3)。其核心思想是,以研究為導向,通過基于真實世界的健康醫療數據,形成研究型數據庫,并運用研究手段,最終形成證據,從而實現支持臨床和醫療衛生決策的目的。

從技術上講,該體系主要包括三大步驟:① 基于常規健康醫療數據,針對相關研究目標,利用多種信息技術手段和數據治理技術,建立研究型數據庫;② 在建立研究型數據庫基礎上,針對具體的研究問題(如疾病負擔、診斷、治療、預后、成本等),運用不同專業方法學科的技術手段(如臨床/藥物流行病學、生物統計與人工智能、衛生/藥物經濟學等),開展研究設計和數據處理,并最終形成研究證據;③ 將形成的證據用于臨床指南制定、疾病管理、醫療產品評價、監管和目錄準入決策等。
在整個過程中,研究型數據庫的搭建是關鍵的第一步。通常基于常規健康醫療數據構建研究型數據庫具有明確的科研目標。但這些研究目標在多數情況下,并非是某一個具體的研究問題(即研究假設),更多是總體考慮研究的需求。因此,在通過對數據的集成和治理最終形成研究型數據庫的過程中,對科研需求的考慮是非常重要的。
當形成研究型數據庫后,再針對具體研究問題,利用臨床/藥物流行病學、生物統計和人工智能技術等關鍵方法技術,設計研究和處理數據,最終回答研究假設,這個過程就是常稱的“RWS”。但是,在更多的情況下,通常會把建立研究型數據庫、開展研究設計和數據處理的整個過程統稱為 RWS。
RWD 和 RWS 目前已被廣泛用于醫療和衛生各個領域,其主要用途主要包含以下幾方面:① 醫療產品的評估和政策制定(如藥監和醫保決策);② 疾病臨床研究(如患者診斷、預后等);③ 輔助疾病管理和臨床決策(如臨床決策輔助系統和臨床指南);④ 促進醫療質量。后兩者存在較強的聯系。
3.2 RWD 與研究型數據庫
3.2.1 RWD
目前,全球各個部門和領域對 RWD 的定義尚存在差異。美國食品藥品監督管理局(FDA)于 2017 年在使用 RWE 支持醫療監管決策的技術規范文本中[1],對 RWD 進行了明確的定義:除了傳統臨床試驗以外的數據都可作為 RWD。這是一個非常寬泛的定義。但無論采用何種描述,RWD 的核心含義是指:在實際的健康醫療環境下形成和收集的數據;數據的產生和收集過程與臨床醫療過程保持較好一致。
RWD 的類型多種多樣;隨著信息技術和健康醫療模式的轉變,更多的數據類型可能還會不斷涌現。從目前而言,經典的 RWD 包含兩大類:① 既有健康醫療數據,其中比較典型的包含醫院電子病歷數據(EMR)、區域醫療健康數據、醫療保險數據;② 在預先建立數據框架下,圍繞疾病、產品或服務模式建立的患者登記。這些患者登記的數據可能部分來自既有健康醫療數據,也可能來自于主動數據收集系統(如患者自報數據、通過佩戴設備收集的數據等)。除此之外,還包括調查數據(survey data)等其他數據。
3.2.2 從 RWD 到研究型數據庫
既有健康醫療數據從本質上來講,由于更多是用于醫療衛生管理目的,難以直接用于科學研究。其存在的問題包含數據片段化、未標化、未鏈接、無法形成縱向隨訪等各個方面的問題,同時還涉及數據安全和隱私保護等相關倫理方面考慮。因此,這些既有健康醫療的源數據本身不能直接用于科學研究,必須要基于科研目的,對數據進行匯集和治理,最終形成統一、標準化、可使用的研究型數據庫形式(圖 4)[17]。

此外,圍繞疾病、醫療產品、服務模式的患者登記,從本質上講也是在建立明確統一的數據框架,整合多種數據來源的基礎上,通過數據集成和治理而形成的(圖 4)[18]。該過程還可通過主動收集數據獲取研究者或決策者所需的關鍵信息(如腫瘤患者生活質量)和其他無法通過既有健康醫療數據獲取的信息。因此,從數據的質量控制(如準確性、完整性等)可能比既有健康數據更好。
以上兩種情況,其實質都是將 RWD 向研究型數據庫轉變。
3.3 RWS
3.3.1 RWS 的過程
RWS 與傳統臨床研究過程總體上而言是類似的,仍然需要經過提出研究問題,建立研究方案,獲取數據形成研究數據集,分析處理數據和報告等幾個過程(圖 5)。最主要的區別在于:在 RWD 的研究環境下,具體的研究問題可能是在已經建立了研究型數據庫之后產生的。因此,對于數據庫和數據庫框架體系的了解和掌握,很大程度上決定了研究的可行性和科學性。

因此,從 RWS 的思維過程來講,當形成了具體研究問題之后,通常需要對目標數據庫進行探索,以了解數據基本情況和可獲得性,然后再針對具體研究問題形成研究方案,并獲取相應的數據形成數據集,最后分析研究結果。
3.3.2 RWD 研究的頂層設計
RWS 的設計思路總體上而言與傳統臨床研究是類似的,仍然是以具體研究問題為導向的設計(圖 6)。根據不同的研究問題,選擇的流行病學設計可能存在差異(如試驗 vs. 觀察性研究)。同一個研究問題,可選用不同的研究設計來回答。決策者和研究者需要判斷的是,這些不同設計的優缺點,及其可能獲得的證據是否能充分回答研究問題本身。例如,對于評估藥物治療的實際效果而言,基于數據庫的隊列設計和實效性試驗都是可以選擇的方式。但是,實效性試驗,尤其是實效性隨機對照試驗能更好解決選擇性偏倚的問題,因此證據說服力更強[19]。

當然,還需要強調的是,隨機對照研究設計雖然是治療結局評價的優選研究設計類型,但并非能夠回答所有研究問題。例如,對于評估疾病負擔、建立疾病風險預測等問題而言,特別是罕見疾病及罕見結局等問題,是難以通過隨機對照研究設計實現的。
3.3.3 不同視角和專業領域對 RWS 設計思維存在差異
由于 RWD 和 RWS 體系是一個多學科、跨專業的整合科學體系,并在不同領域廣泛應用。因此,對該體系的理解、頂層設計思路,甚至是語言的使用都可能存在差異。此外,不同專業的研究者在考慮 RWS 設計時可能也存在差異。例如,藥物和臨床流行病學專家與藥物經濟學家在使用 RWD 時由于研究目的可能存在較大差異(如:藥品安全性評價 vs. 藥品政策研究),在對研究設計的選擇、研究資源的使用、研究數據的類型和質量等方面都會存在較大的差異。
3.4 RWD 與 RWS 中的倫理學問題
從本質上講,RWD 及其相關研究屬于臨床研究范疇。由于使用了患者或健康人群的個人數據,這些研究本身需要遵守倫理學原則。我們在前期已經針對 RWD 使用和 RWS 中的倫理學問題進行了討論[20],本文不再贅述。目前,針對使用 RWD 開展研究的倫理學規范尚不完善。需要提到的是,無論什么目的的臨床研究,都需要通過倫理審查。
4 小結
RWD 與 RWS 已對醫療衛生決策的各個領域產生了廣泛而深遠的影響。在我國,RWD 及 RWS 還處于起步階段,面臨諸多挑戰和誤區。ChinaREAL 圍繞 RWE 生產中的兩個關鍵問題,包括如何基于 RWD 建立研究型數據庫,如何開展治療結局的評價撰寫了第一批技術規范。未來,我們將圍繞 RWE 的生產與使用中的關鍵問題,分批次建立技術規范,促進 RWE 在我國醫療衛生決策中的合理使用。
致謝 本次首批五個技術規范的草擬均由中國真實世界數據與研究聯盟工作組專家承擔。技術規范的審核得到了來自藥監部門、國內外學術專家的大力支持。具體組織機構、支持機構、審評專家組、工作組構成如下。
發起單位
四川大學華西醫院中國循證醫學中心
中國真實世界數據與研究聯盟
國際藥物經濟學與結果研究協會華西分會
支持單位
國家藥品監督管理局醫療器械監管科學研究基地
四川大學醫療器械監管科學研究院
中國醫師協會循證醫學專委會
中國藥學會藥物經濟學專委會
中國 Cochrane 中心
IDEAL 中國中心
國際藥物經濟學與結果研究協會
技術規范審評專家組
藥品監管專家
會評專家:高國彪、胡增峣、宋海波、盧紅、滕穎影、符祝、林尤海
函評專家:楊志敏、吳桂芝
中華醫學基金會
會評專家:李文凱、周娜
學術咨詢專家
會評專家:李幼平、姚晨、趙琨、陳英耀、翟所迪
函評專家:詹思延、吳久鴻、郭劍非、呂志強、謝鋒、徐福潔、Gordon Guyatt
技術規范工作組
執筆工作組成員(在本文中視為同等貢獻):孫鑫、高培、彭曉霞、溫澤淮、譚婧、王雯、吳晶、王麗、舒嘯塵、王楊、羅劍鋒、李玲
參與工作組成員(按姓名拼音排序):陳進、陳曉凡、竇豐滿、費宇彤、郭曉慧、郭新峰、賀小寧、胡皓、胡明、黎國威、李洪超、劉艷梅、毛琛、聶曉璐、任燕、唐少文、宣建偉、閆盈盈、于川、張玲
秘書組
孫鑫、王雯、譚婧、何俏、劉春容、鄒康