引用本文: 孫鑫, 譚婧, 唐立, 于川, 李靜, 康德英, 陳進, 李幼平. 重新認識真實世界研究. 中國循證醫學雜志, 2017, 17(2): 126-130. doi: 10.7507/1672-2531.201701088 復制
隨著醫學科學的快速發展、信息技術的不斷進步,以及對醫療衛生循證決策的需求持續增加,近年真實世界研究日益成為醫療衛生領域關注的焦點之一。同時,真實世界證據也成為醫療衛生決策者、執業者、研究者、醫藥企業共同關注的對象。
真實世界研究的理念已存在多年,但在正確認識和實施真實世界研究、恰當理解和運用真實世界證據等方面仍存在諸多誤區。例如,部分人直接將觀察性研究等同于真實世界研究;真實世界研究不需要做質量控制;真實世界研究僅局限于藥物評價等。對真實世界研究的評價更是截然相反,支持者認為真實世界研究是最好的研究設計,可取代隨機對照試驗;而反對者則認為真實世界研究的價值非常有限,研究證據級別較低,無法指導醫療決策。
為準確闡釋真實世界研究的涵義、澄清目前存在的各種誤區,本文將圍繞真實世界研究的一些重要概念、基本理念和關鍵內容等,逐一加以說明。
1 真實世界數據及其來源
1.1 真實世界數據的定義
目前,不同組織或機構基于不同角度,對真實世界數據的定義描述存在一些差異,但本質是相同的。所謂真實世界數據(real world data,RWD)是指研究數據來自真實醫療環境,反映實際診療過程和真實條件下的患者健康狀況;主要是與傳統臨床試驗中人群可能高度選擇、干預和對照可能嚴格控制、隨訪與實際存在差異等各方面形成明確的對比。一些權威機構和組織,如美國食品藥品監督管理局(FDA)、國際藥物經濟學與結果研究協會(ISPOR),將真實世界數據定義為除開傳統臨床試驗以外的數據[1,2]。
根據以上定義,真實世界數據來源非常廣泛。其既可是研究數據,即以特定目的開展的觀察性研究數據,如基于特定研究目的患者調查、患者注冊登記研究(registry study)[3],以及基于真實醫療條件開展的干預性研究(如實效性隨機對照試驗)[4]的數據(表 1);也可是非研究性質的數據,如多種機構(如醫院、醫保部門、民政部門、公共衛生部門)日常監測、記錄、儲存的各類與健康相關的數據,如醫院電子病歷、醫保理賠數據庫、公共衛生調查與公共健康監測(如藥品不良事件監測)、出生/死亡登記項目等(表 1)。

1.2 真實世界數據與醫療大數據
大數據作為一個重要概念已被引入到眾多行業。醫學領域的大數據(big data in medicine)涵蓋范圍廣泛,尚缺乏統一和公認的大數據分類系統,根據數據收集內容的差異,可分為:① 常規醫療和健康數據,包括個人健康和醫療數據(如人口社會學特征、診斷、實驗室檢查、影像學檢查、醫囑、手術、成本數據等),即我們通常所指的醫療大數據(healthcare big data),其典型實例有醫院電子病歷庫(EMR)等;② 在部分或全部收集常規醫療數據的基礎上,根據特定研究目的收集生物標本檢測的檢測數據(如基因組學、蛋白組學、代謝組學等),常被稱為生物醫學大數據。這兩者在數據收集方式和研究目的方面常存在差異。相同的醫療大數據也可從不同收集方式獲取。例如,糖尿病患者的血壓可從醫院的 EMR 獲得,也可從穿戴設備獲取。
從本質上講,醫療大數據滿足真實世界數據的所有特征,屬于真實世界數據。但真實世界數據涵蓋的范疇顯然比醫療大數據更廣,其并不一定要求數據達到海量,也不一定強調數據的多樣性等。醫療大數據是真實世界數據與醫學大數據的一個交集(圖 1)。

2 從真實世界數據到真實世界研究
證據是循證醫療衛生決策的關鍵基礎,但海量的數據或信息不等于證據。要把真實世界數據轉變為真實世界證據需要開展研究。與其他臨床研究一樣,真實世界研究(real world studies/real world research,RWS/RWR)必須圍繞相關科學問題,基于真實世界的數據,綜合運用臨床/藥物流行病學、生物統計學、循證醫學、藥物經濟學等多學科方法技術,整合多種數據資源而開展研究。
2.1 真實世界研究擬解決的科學問題
真實世界研究最早提出是因新藥和醫療器械Ⅲ期臨床試驗存在無法回答的臨床診療和醫療管理決策問題。當時的考慮是建立一套更接近臨床真實條件的方法體系,回答傳統Ⅲ期臨床試驗無法回答的科學問題,如藥物治療的實際效果及人群差異、不同藥物間的比較效果、治療的依從性等。
隨著對真實世界研究的廣泛運用和認識加深,真實世界研究的運用也進一步擴展和延伸。這些變化部分來自研究者推動,部分來自證據使用者(如藥監、醫療管理、醫保等各部門)的需求推動。例如,除了與治療相關的臨床問題外,研究者還需要獲得更貼近自然環境的流行病學數據、包括現有診療措施的依從性、合規性,甚至成本數據。決策者為了更好地管理報銷決策時的不確定性、藥品上市后安全性監測等,需要大量貼近臨床醫療實際的研究結果。
目前,真實世界研究主要用于但不限于解決四類科學問題(表 2)。

2.2 真實世界研究的基本設計:真實世界研究≠觀察性研究
真實世界研究有時會被簡單的理解為觀察性研究,這種認識并不全面。從本質上講,研究問題決定了研究設計,研究設計決定數據獲取方式和過程。盡管真實世界數據來自于真實條件下的數據,這不代表真實世界研究設計局限于觀察性研究。
真實世界研究的基本設計通常包括干預性和觀察性。在真實世界條件下開展干預性研究的常見方式是對臨床已使用的不同干預措施進行隨機分組,在盡量貼近臨床實際情況下對患者進行干預和隨訪,并針對患者、臨床醫生或醫療衛生決策者有重要價值的結局進行評價,常被稱為實效性或實用性隨機對照試驗(pragmatic randomized controlled trial,pRCT)。在 pRCT 的設計中,盡管使用了隨機手段,但患者在研究中所處的環境、干預實施和隨訪過程、數據和結局的收集方式在盡可能貼近真實條件下進行,與真實世界研究的核心實質較好地契合。因此,其仍然屬于真實世界研究的范疇。當然,真實世界條件下的干預性研究并非僅有 pRCT;非隨機的實效性試驗、自適應設計[5]等其他設計也是真實世界研究的可用選擇。
當然,觀察性研究設計是真實世界研究中廣泛使用的設計類型之一。在真實條件下收集相關數據(如患者登記、醫院電子病歷數據、醫保數據和流行病學調查等),建立數據庫,并針對具體研究問題,運用觀察性設計,開展數據分析,是觀察性真實世界研究的自然過程。真實世界研究中的觀察性設計包括:橫斷面研究、隊列研究(前瞻性、回顧性或雙向設計)、病例-對照研究及其衍生設計(如巢式病例-對照、病例-隊列研究)等常用的設計類型。此外,一些新的設計(如續斷性時間序列)[6]也被用于觀察性真實世界研究。
需要明確的是,沒有任何一種設計一定優于其他設計,每種設計都有優勢和不足。沒有任何一種研究設計能回答所有的研究問題,相同的研究問題可以采用不同的設計來解決。應該注意的是研究設計的選擇首先要基于研究問題—— 針對該問題,何種研究設計能最準確和精確地回答該科學問題。此外,研究數據的可得性、難度、質量,研究資源的多少,研究者的經驗和研究合作網絡也會影響研究設計。
2.3 真實世界研究的數據采集與質量控制
盡管基于現實條件,但真實世界研究不等于基于隨意的數據開展研究。作為研究,真實世界研究本身仍然有一套規范嚴格的數據質量控制體系。例如,基于 EMR 的真實世界研究,其重要的研究要素,是建立一套科學規則,對數據進行清理和整合。
不同數據類型的真實世界研究在具體的數據質量控制方式上雖然存在差異,但其數據質量控制體系總體而言是類似的,包括數據收集前準備、數據收集和提取、數據清理和整合多個環節。
2.3.1 數據收集前的準備 對于前瞻性的真實世界研究而言,涉及標準化數據收集手冊制定、開展預研究、明確數據來源、明確數據要素定義和規則、培訓參研人員等;對于回顧型數據來說,需要了解已有數據庫的數據結構、基本數據情況,從而制定數據提取前的數據提取方案。
2.3.2 數據收集 依據數據來源的不同,可分為主動收集/調查和數據提取與合并。和常規前瞻性研究類似,前瞻性真實世界研究中的主動收集/調查是指調查現場或通過遠程聯系獲得數據,其中調查點的選擇、如何選擇和納入研究對象、數據調查表(Case Report Form,CRF)的設計是關鍵環節。雙錄入和報告錄入一致率是保障數據錄入質量的有效手段。回顧性數據提取主要是從已有數據資源(醫院 EMR 系統、醫保系統)中提取數據。通常而言研究者需要與醫學信息工程師進行反復溝通和討論,確保數據提取的準確性和敏感性。
2.3.3 數據清理和整合 這是真實世界研究最核心的部分,其中數據清理耗時較多,包括從制定數據清理手冊,到自動數據清理、人工數據清理、生成質疑報告、返回數據、再次清理、數據編碼等步驟。不少研究開始使用電子化的數據錄入和管理(Electronic Data Capture,EDC)系統進行數據管理,這類系統特別適用于多中心、多用戶的真實世界研究,可同時實現多端口數據錄入(桌面、網頁、APP、微信等)、數據核查和數據儲存等環節,有利于提高真實世界研究數據質量。
2.4 真實世界研究的優勢和局限
真實世界研究具備多種優勢:① 真實世界研究對研究對象常采用相對較少的排除條件,使納入人群有較好代表性,研究結果外部真實性相對更好。② 真實世界研究樣本量通常較大,利于解決罕見疾病和事件所帶來的問題,也可更好地處理治療效應在不同人群之間的差異。③ 真實世界研究采集的數據可利用快速數據設計技術實現多個研究目標,效率較高。④ 真實世界研究相對傳統臨床隨機對照試驗,盡量減少人為干預、容易被研究對象接受,較容易通過倫理審查,成本-效益更優。⑤ 最重要的是真實世界研究提供了傳統隨機對照試驗無法提供的證據,包括真實環境下干預措施的療效、長期用藥的安全性、依從性、疾病負擔等證據,是對傳統臨床研究模式的重要補充。
真實世界研究自身也存在一定局限,這些局限來自于數據本身和相關設計。針對治療結局的評價,除實效性隨機對照試驗外,觀察性真實世界研究由于沒有采用隨機設計方案,組間的基線、預后差異總是或多或少地存在,可能導致結果偏倚;即便使用復雜的統計學方法盡量消除可能的混雜,其在最大程度上也僅能處理已知的混雜因素(無法處理未知的混雜)。此外,數據的準確性、完整性是真實世界研究可能存在的另一主要問題。這在基于回顧性數據庫開展研究時,問題尤其突出。樣本量增大和使用復雜的統計學處理并不能消除數據質量本身缺陷可能導致的偏倚。最后,基于回顧性數據的真實世界研究還面臨事后分析、數據挖掘是否滿足因果準則的問題。
針對其他研究問題(如預后等),真實世界研究面臨的主要挑戰在于數據的準確和完整性。數據質量不足和關鍵數據信息的缺失常導致在開展研究時無法充分地處理結局與相關因素的關系。例如,風險預測研究中,由于數據質量較低或關鍵數據缺失,導致預測功能降低(如區分度降低、曲線下面積減少)。
需要說明的是,不同設計和不同數據來源的真實世界研究,其表現出來的優勢和不足是有差異的。研究者需要針對具體問題進行謹慎分析和理解利弊—— 過度放大優勢或忽略不足都不可取。
3 正確認識真實世界證據
我們處在循證實踐與決策的時代,研究證據是提高臨床和醫療決策效率的核心基礎。真實世界研究的結果用于臨床和醫療決策時被稱為真實世界證據(real world evidence,RWE)。真實世界證據對臨床醫療決策的價值因人而異,甚至是方向性的差異:一部分人認為真實世界證據最接近臨床醫療現實情況,得到的結果最能說明現實條件下的問題,比傳統臨床試驗更可信;另外一部分人認為真實世界缺少嚴格的方法學控制,研究結果存在較大偏倚,故可能完全忽略真實世界證據。這些差異一定程度上反映了對真實世界證據的理解還存在問題。
3.1 最佳證據來源不宜絕對化
循證醫學強調,臨床和醫療決策應基于當前可得的最佳研究證據,但最佳證據來源不宜絕對化。
首先,針對不同的臨床醫療具體問題,最佳研究證據可能存在差異。例如,針對糖尿病并發慢性腎病患者的 10 年心血管死亡率評估(預后評估)這一問題,最佳的證據來源是高質量隊列研究,而不是隨機對照試驗(在預后評估中,RCT 甚至可能無法使用);針對腫瘤篩查的準確性評估,最佳證據來源是高質量的橫斷面研究。因此,最佳證據的判斷首先要區分臨床研究問題 ,針對不同研究問題,最佳證據來源可有不同。
其次,即便針對同一研究問題,研究設計不完全代表證據的強弱。例如,針對評價某一抗腫瘤藥物本身的作用(效能),理論上最佳的研究設計是隨機對照試驗。但如果在研究設計、實施過程中存在重大缺陷,其研究結果的可信度有可能低于針對同一問題且嚴格設計、實施和分析的隊列研究。
3.2 客觀看待真實世界研究證據
真實世界研究可用于不同的臨床研究問題(表 2)。對患病負擔調查、治療模式和利用分析、患者預后和風險預測等,高質量真實世界研究可以起到重要作用;其研究特征很大程度上決定了研究結果能很好地用于循證醫療決策與實踐。事實上,現有針對這些問題的絕大部分研究本身就是真實世界研究。因此,針對這些問題,基于真實世界數據,選擇最佳的研究設計,較好控制數據質量,科學分析所獲得的研究結果本身才可能成為最佳證據。
對防治評價而言,最佳研究證據取決于目的及其研究問題的設定。防治問題如果具體設定不同,最佳的研究證據可能存在差異。真實世界研究和傳統臨床試驗盡管都可用于評價防治的結局,但兩者目的存在顯著差異。前者解決的問題主要是干預措施在真實條件下的實際結果,后者關注干預措施本身是否存在生物學作用(治療效能),在具體設定上可能存在差異(表 3)。以某一高血壓藥物治療的療效評價為例,設置該研究問題的核心要素通常包括:人群及其環境、干預、對照、結局及其隨訪等。若研究問題是評價該高血壓藥物本身是否能起到降壓作用(治療效能),傳統的臨床試驗(人群、干預、對照等進行嚴格限制和界定)是最佳證據;若研究問題關注該藥物在臨床上對復雜患者(如合并糖尿病、CKD、COPD)的實際效果,采用觀察性設計或者基于實效性隨機對照試驗設計是更好的研究證據。

4 結語
真實世界研究作為一種研究理念,提出至今,日益得到認可與共識,并逐漸運用到臨床醫療決策領域。但對真實世界研究的認識和理解一直存在誤區。這些問題導致了真實世界研究證據的不恰當使用—— 過度依賴真實世界證據和錯誤忽略真實世界證據并存。要解決這些問題,需要清晰地認識和正確理解真實世界研究的實質。希望本文能為讀者提供一個正確認識真實世界研究的基礎。未來,我們將陸續推出真實世界研究的相關方法學介紹,以促進我國在該領域的研究與臨床醫療決策的轉化。
隨著醫學科學的快速發展、信息技術的不斷進步,以及對醫療衛生循證決策的需求持續增加,近年真實世界研究日益成為醫療衛生領域關注的焦點之一。同時,真實世界證據也成為醫療衛生決策者、執業者、研究者、醫藥企業共同關注的對象。
真實世界研究的理念已存在多年,但在正確認識和實施真實世界研究、恰當理解和運用真實世界證據等方面仍存在諸多誤區。例如,部分人直接將觀察性研究等同于真實世界研究;真實世界研究不需要做質量控制;真實世界研究僅局限于藥物評價等。對真實世界研究的評價更是截然相反,支持者認為真實世界研究是最好的研究設計,可取代隨機對照試驗;而反對者則認為真實世界研究的價值非常有限,研究證據級別較低,無法指導醫療決策。
為準確闡釋真實世界研究的涵義、澄清目前存在的各種誤區,本文將圍繞真實世界研究的一些重要概念、基本理念和關鍵內容等,逐一加以說明。
1 真實世界數據及其來源
1.1 真實世界數據的定義
目前,不同組織或機構基于不同角度,對真實世界數據的定義描述存在一些差異,但本質是相同的。所謂真實世界數據(real world data,RWD)是指研究數據來自真實醫療環境,反映實際診療過程和真實條件下的患者健康狀況;主要是與傳統臨床試驗中人群可能高度選擇、干預和對照可能嚴格控制、隨訪與實際存在差異等各方面形成明確的對比。一些權威機構和組織,如美國食品藥品監督管理局(FDA)、國際藥物經濟學與結果研究協會(ISPOR),將真實世界數據定義為除開傳統臨床試驗以外的數據[1,2]。
根據以上定義,真實世界數據來源非常廣泛。其既可是研究數據,即以特定目的開展的觀察性研究數據,如基于特定研究目的患者調查、患者注冊登記研究(registry study)[3],以及基于真實醫療條件開展的干預性研究(如實效性隨機對照試驗)[4]的數據(表 1);也可是非研究性質的數據,如多種機構(如醫院、醫保部門、民政部門、公共衛生部門)日常監測、記錄、儲存的各類與健康相關的數據,如醫院電子病歷、醫保理賠數據庫、公共衛生調查與公共健康監測(如藥品不良事件監測)、出生/死亡登記項目等(表 1)。

1.2 真實世界數據與醫療大數據
大數據作為一個重要概念已被引入到眾多行業。醫學領域的大數據(big data in medicine)涵蓋范圍廣泛,尚缺乏統一和公認的大數據分類系統,根據數據收集內容的差異,可分為:① 常規醫療和健康數據,包括個人健康和醫療數據(如人口社會學特征、診斷、實驗室檢查、影像學檢查、醫囑、手術、成本數據等),即我們通常所指的醫療大數據(healthcare big data),其典型實例有醫院電子病歷庫(EMR)等;② 在部分或全部收集常規醫療數據的基礎上,根據特定研究目的收集生物標本檢測的檢測數據(如基因組學、蛋白組學、代謝組學等),常被稱為生物醫學大數據。這兩者在數據收集方式和研究目的方面常存在差異。相同的醫療大數據也可從不同收集方式獲取。例如,糖尿病患者的血壓可從醫院的 EMR 獲得,也可從穿戴設備獲取。
從本質上講,醫療大數據滿足真實世界數據的所有特征,屬于真實世界數據。但真實世界數據涵蓋的范疇顯然比醫療大數據更廣,其并不一定要求數據達到海量,也不一定強調數據的多樣性等。醫療大數據是真實世界數據與醫學大數據的一個交集(圖 1)。

2 從真實世界數據到真實世界研究
證據是循證醫療衛生決策的關鍵基礎,但海量的數據或信息不等于證據。要把真實世界數據轉變為真實世界證據需要開展研究。與其他臨床研究一樣,真實世界研究(real world studies/real world research,RWS/RWR)必須圍繞相關科學問題,基于真實世界的數據,綜合運用臨床/藥物流行病學、生物統計學、循證醫學、藥物經濟學等多學科方法技術,整合多種數據資源而開展研究。
2.1 真實世界研究擬解決的科學問題
真實世界研究最早提出是因新藥和醫療器械Ⅲ期臨床試驗存在無法回答的臨床診療和醫療管理決策問題。當時的考慮是建立一套更接近臨床真實條件的方法體系,回答傳統Ⅲ期臨床試驗無法回答的科學問題,如藥物治療的實際效果及人群差異、不同藥物間的比較效果、治療的依從性等。
隨著對真實世界研究的廣泛運用和認識加深,真實世界研究的運用也進一步擴展和延伸。這些變化部分來自研究者推動,部分來自證據使用者(如藥監、醫療管理、醫保等各部門)的需求推動。例如,除了與治療相關的臨床問題外,研究者還需要獲得更貼近自然環境的流行病學數據、包括現有診療措施的依從性、合規性,甚至成本數據。決策者為了更好地管理報銷決策時的不確定性、藥品上市后安全性監測等,需要大量貼近臨床醫療實際的研究結果。
目前,真實世界研究主要用于但不限于解決四類科學問題(表 2)。

2.2 真實世界研究的基本設計:真實世界研究≠觀察性研究
真實世界研究有時會被簡單的理解為觀察性研究,這種認識并不全面。從本質上講,研究問題決定了研究設計,研究設計決定數據獲取方式和過程。盡管真實世界數據來自于真實條件下的數據,這不代表真實世界研究設計局限于觀察性研究。
真實世界研究的基本設計通常包括干預性和觀察性。在真實世界條件下開展干預性研究的常見方式是對臨床已使用的不同干預措施進行隨機分組,在盡量貼近臨床實際情況下對患者進行干預和隨訪,并針對患者、臨床醫生或醫療衛生決策者有重要價值的結局進行評價,常被稱為實效性或實用性隨機對照試驗(pragmatic randomized controlled trial,pRCT)。在 pRCT 的設計中,盡管使用了隨機手段,但患者在研究中所處的環境、干預實施和隨訪過程、數據和結局的收集方式在盡可能貼近真實條件下進行,與真實世界研究的核心實質較好地契合。因此,其仍然屬于真實世界研究的范疇。當然,真實世界條件下的干預性研究并非僅有 pRCT;非隨機的實效性試驗、自適應設計[5]等其他設計也是真實世界研究的可用選擇。
當然,觀察性研究設計是真實世界研究中廣泛使用的設計類型之一。在真實條件下收集相關數據(如患者登記、醫院電子病歷數據、醫保數據和流行病學調查等),建立數據庫,并針對具體研究問題,運用觀察性設計,開展數據分析,是觀察性真實世界研究的自然過程。真實世界研究中的觀察性設計包括:橫斷面研究、隊列研究(前瞻性、回顧性或雙向設計)、病例-對照研究及其衍生設計(如巢式病例-對照、病例-隊列研究)等常用的設計類型。此外,一些新的設計(如續斷性時間序列)[6]也被用于觀察性真實世界研究。
需要明確的是,沒有任何一種設計一定優于其他設計,每種設計都有優勢和不足。沒有任何一種研究設計能回答所有的研究問題,相同的研究問題可以采用不同的設計來解決。應該注意的是研究設計的選擇首先要基于研究問題—— 針對該問題,何種研究設計能最準確和精確地回答該科學問題。此外,研究數據的可得性、難度、質量,研究資源的多少,研究者的經驗和研究合作網絡也會影響研究設計。
2.3 真實世界研究的數據采集與質量控制
盡管基于現實條件,但真實世界研究不等于基于隨意的數據開展研究。作為研究,真實世界研究本身仍然有一套規范嚴格的數據質量控制體系。例如,基于 EMR 的真實世界研究,其重要的研究要素,是建立一套科學規則,對數據進行清理和整合。
不同數據類型的真實世界研究在具體的數據質量控制方式上雖然存在差異,但其數據質量控制體系總體而言是類似的,包括數據收集前準備、數據收集和提取、數據清理和整合多個環節。
2.3.1 數據收集前的準備 對于前瞻性的真實世界研究而言,涉及標準化數據收集手冊制定、開展預研究、明確數據來源、明確數據要素定義和規則、培訓參研人員等;對于回顧型數據來說,需要了解已有數據庫的數據結構、基本數據情況,從而制定數據提取前的數據提取方案。
2.3.2 數據收集 依據數據來源的不同,可分為主動收集/調查和數據提取與合并。和常規前瞻性研究類似,前瞻性真實世界研究中的主動收集/調查是指調查現場或通過遠程聯系獲得數據,其中調查點的選擇、如何選擇和納入研究對象、數據調查表(Case Report Form,CRF)的設計是關鍵環節。雙錄入和報告錄入一致率是保障數據錄入質量的有效手段。回顧性數據提取主要是從已有數據資源(醫院 EMR 系統、醫保系統)中提取數據。通常而言研究者需要與醫學信息工程師進行反復溝通和討論,確保數據提取的準確性和敏感性。
2.3.3 數據清理和整合 這是真實世界研究最核心的部分,其中數據清理耗時較多,包括從制定數據清理手冊,到自動數據清理、人工數據清理、生成質疑報告、返回數據、再次清理、數據編碼等步驟。不少研究開始使用電子化的數據錄入和管理(Electronic Data Capture,EDC)系統進行數據管理,這類系統特別適用于多中心、多用戶的真實世界研究,可同時實現多端口數據錄入(桌面、網頁、APP、微信等)、數據核查和數據儲存等環節,有利于提高真實世界研究數據質量。
2.4 真實世界研究的優勢和局限
真實世界研究具備多種優勢:① 真實世界研究對研究對象常采用相對較少的排除條件,使納入人群有較好代表性,研究結果外部真實性相對更好。② 真實世界研究樣本量通常較大,利于解決罕見疾病和事件所帶來的問題,也可更好地處理治療效應在不同人群之間的差異。③ 真實世界研究采集的數據可利用快速數據設計技術實現多個研究目標,效率較高。④ 真實世界研究相對傳統臨床隨機對照試驗,盡量減少人為干預、容易被研究對象接受,較容易通過倫理審查,成本-效益更優。⑤ 最重要的是真實世界研究提供了傳統隨機對照試驗無法提供的證據,包括真實環境下干預措施的療效、長期用藥的安全性、依從性、疾病負擔等證據,是對傳統臨床研究模式的重要補充。
真實世界研究自身也存在一定局限,這些局限來自于數據本身和相關設計。針對治療結局的評價,除實效性隨機對照試驗外,觀察性真實世界研究由于沒有采用隨機設計方案,組間的基線、預后差異總是或多或少地存在,可能導致結果偏倚;即便使用復雜的統計學方法盡量消除可能的混雜,其在最大程度上也僅能處理已知的混雜因素(無法處理未知的混雜)。此外,數據的準確性、完整性是真實世界研究可能存在的另一主要問題。這在基于回顧性數據庫開展研究時,問題尤其突出。樣本量增大和使用復雜的統計學處理并不能消除數據質量本身缺陷可能導致的偏倚。最后,基于回顧性數據的真實世界研究還面臨事后分析、數據挖掘是否滿足因果準則的問題。
針對其他研究問題(如預后等),真實世界研究面臨的主要挑戰在于數據的準確和完整性。數據質量不足和關鍵數據信息的缺失常導致在開展研究時無法充分地處理結局與相關因素的關系。例如,風險預測研究中,由于數據質量較低或關鍵數據缺失,導致預測功能降低(如區分度降低、曲線下面積減少)。
需要說明的是,不同設計和不同數據來源的真實世界研究,其表現出來的優勢和不足是有差異的。研究者需要針對具體問題進行謹慎分析和理解利弊—— 過度放大優勢或忽略不足都不可取。
3 正確認識真實世界證據
我們處在循證實踐與決策的時代,研究證據是提高臨床和醫療決策效率的核心基礎。真實世界研究的結果用于臨床和醫療決策時被稱為真實世界證據(real world evidence,RWE)。真實世界證據對臨床醫療決策的價值因人而異,甚至是方向性的差異:一部分人認為真實世界證據最接近臨床醫療現實情況,得到的結果最能說明現實條件下的問題,比傳統臨床試驗更可信;另外一部分人認為真實世界缺少嚴格的方法學控制,研究結果存在較大偏倚,故可能完全忽略真實世界證據。這些差異一定程度上反映了對真實世界證據的理解還存在問題。
3.1 最佳證據來源不宜絕對化
循證醫學強調,臨床和醫療決策應基于當前可得的最佳研究證據,但最佳證據來源不宜絕對化。
首先,針對不同的臨床醫療具體問題,最佳研究證據可能存在差異。例如,針對糖尿病并發慢性腎病患者的 10 年心血管死亡率評估(預后評估)這一問題,最佳的證據來源是高質量隊列研究,而不是隨機對照試驗(在預后評估中,RCT 甚至可能無法使用);針對腫瘤篩查的準確性評估,最佳證據來源是高質量的橫斷面研究。因此,最佳證據的判斷首先要區分臨床研究問題 ,針對不同研究問題,最佳證據來源可有不同。
其次,即便針對同一研究問題,研究設計不完全代表證據的強弱。例如,針對評價某一抗腫瘤藥物本身的作用(效能),理論上最佳的研究設計是隨機對照試驗。但如果在研究設計、實施過程中存在重大缺陷,其研究結果的可信度有可能低于針對同一問題且嚴格設計、實施和分析的隊列研究。
3.2 客觀看待真實世界研究證據
真實世界研究可用于不同的臨床研究問題(表 2)。對患病負擔調查、治療模式和利用分析、患者預后和風險預測等,高質量真實世界研究可以起到重要作用;其研究特征很大程度上決定了研究結果能很好地用于循證醫療決策與實踐。事實上,現有針對這些問題的絕大部分研究本身就是真實世界研究。因此,針對這些問題,基于真實世界數據,選擇最佳的研究設計,較好控制數據質量,科學分析所獲得的研究結果本身才可能成為最佳證據。
對防治評價而言,最佳研究證據取決于目的及其研究問題的設定。防治問題如果具體設定不同,最佳的研究證據可能存在差異。真實世界研究和傳統臨床試驗盡管都可用于評價防治的結局,但兩者目的存在顯著差異。前者解決的問題主要是干預措施在真實條件下的實際結果,后者關注干預措施本身是否存在生物學作用(治療效能),在具體設定上可能存在差異(表 3)。以某一高血壓藥物治療的療效評價為例,設置該研究問題的核心要素通常包括:人群及其環境、干預、對照、結局及其隨訪等。若研究問題是評價該高血壓藥物本身是否能起到降壓作用(治療效能),傳統的臨床試驗(人群、干預、對照等進行嚴格限制和界定)是最佳證據;若研究問題關注該藥物在臨床上對復雜患者(如合并糖尿病、CKD、COPD)的實際效果,采用觀察性設計或者基于實效性隨機對照試驗設計是更好的研究證據。

4 結語
真實世界研究作為一種研究理念,提出至今,日益得到認可與共識,并逐漸運用到臨床醫療決策領域。但對真實世界研究的認識和理解一直存在誤區。這些問題導致了真實世界研究證據的不恰當使用—— 過度依賴真實世界證據和錯誤忽略真實世界證據并存。要解決這些問題,需要清晰地認識和正確理解真實世界研究的實質。希望本文能為讀者提供一個正確認識真實世界研究的基礎。未來,我們將陸續推出真實世界研究的相關方法學介紹,以促進我國在該領域的研究與臨床醫療決策的轉化。