真實世界數據和真實世界證據日益受到廣泛重視。患者登記研究作為一種觀察性設計是真實世界研究的重要組成。本文介紹了患者登記研究的概念、分類與應用,探討了患者登記研究的策劃與患者登記數據庫構建,為開展高質量患者登記研究提供方法引導。
引用本文: 譚婧, 程亮亮, 王雯, 劉艷梅, 張桂婷, 孫鑫. 患者登記研究的策劃與患者登記數據庫構建:基于觀察性設計的真實世界研究. 中國循證醫學雜志, 2017, 17(12): 1365-1372. doi: 10.7507/1672-2531.201711112 復制
目前,真實世界數據(real world data,RWD)和真實世界證據(real world evidence,RWE)逐漸受到專家和學者的廣泛重視。2017 年 8 月,美國 FDA 提出將 RWE 用于醫療器械的監管和決策[1],此舉引起了各界學者對 RWD 和 RWE 的關注。值得注意的是,RWD 和 RWE 都屬于廣義的概念,并非某一種數據來源或某一種研究形成的證據[2]。RWD 需要通過開展研究轉變成 RWE。這些研究常被稱為真實世界研究(real world study,RWS),包括試驗性設計(實效性隨機對照試驗[3])和觀察性設計的研究。
觀察性 RWS 根據原始數據是否基于特定研究目的分為兩類。一類是基于具體的研究假設收集數據開展研究,如患者登記研究。這類研究與傳統的研究方式類似,都是首先建立明確的研究假設,形成清晰的研究目的,繼而建立研究方案,在不破壞實際醫療方案的基礎上(僅觀察)收集數據,建立研究數據庫,進行數據處理和分析。第二類是在已有的數據庫基礎上(如醫院電子病歷數據、醫保理賠數據庫、民政部門和公共衛生部門的出生/死亡登記、公共衛生調查和公共健康監測數據等[2])設定研究假設,然后利用數據庫已有數據開展研究。這類研究的過程與傳統研究方式存在較大差異。本文作為觀察性 RWS 系列文章的第一篇,將詳細介紹基于患者登記研究的策劃與數據庫構建。
1 針對患者結局的患者登記研究
1.1 患者登記的概念
美國醫療保健研究與質量局(Agency for Healthcare Research and Quality,AHRQ)在 2007 年首次發布了《評估患者結局的登記研究的使用者手冊》(Registries for evaluating patient outcomes: a user’s guide),對患者登記的概念、流程、設計和評估等方面做了詳細闡述,并在 2014 年進行了第三次更新[4]。該手冊所指的“登記”是指收集、儲存數據和數據記錄產生的過程。
登記研究(registry study),又稱患者登記研究,是以臨床治療或衛生政策制定為研究目的,采用觀察性研究方法來收集一致性數據的組織系統,用于評估某種疾病、狀態或者暴露人群的特定結局,通常具備幾個要素(表 1)[4]。

首先,患者登記研究往往有明確的研究目的,或至少部分數據需要基于特定目的專門進行收集,這是區分于其他登記系統的重要特征;其次,患者登記的數據來源于醫療環境中的“自然”狀態,是屬于真實世界數據的范疇;再次,研究設計者并不干預患者診療方案,僅屬于觀察性研究;最后,患者登記是在既定研究目的基礎上,收集真實世界患者數據,建立患者登記數據庫,研究并回答多種與醫療相關的問題,其研究設計與觀察性研究無異。
從形式上看,患者登記研究與傳統前瞻性隊列研究具有許多共同點。但前者具有更大的靈活性,包括在研究過程中調整研究目的、研究人群、收集數據、數據收集方式等。而傳統前瞻性隊列研究往往在研究過程中,對整個方案調整較少,尤其是針對主要結局指標等關鍵設定的修改較少。
在醫學領域中,現存很多不同的登記系統。常見的包括:臨床試驗登記系統[5, 6]、器官移植登記系統[7]、出生缺陷登記[8]、法定傳染病監測系統[9]等。這些登記系統和本文涉及的患者登記研究存在本質上的區別。前者盡管在名義上也稱為登記,但這些系統建立的初衷主要用于管理和監測,在建立之初可能并未考慮研究的需求和目的。當然,基于這些系統收集的數據仍可用于研究,但和本文闡述的患者登記研究不同。
1.2 患者登記研究的類型
根據研究對象不同,患者登記研究大致可分為 3 類:① 醫療產品登記,是指患者暴露于某種醫療產品。納入標準是患者服用某種藥品或使用某項醫療器械,此類研究目的往往是評價醫療產品的安全性、在真實醫療環境中的有效性和患者依從性等,如接受藥物洗脫支架患者的登記研究[10]。② 特定疾病或醫療狀態的患者登記。納入標準是患者診斷為特定疾病或具備特定醫療狀態,如急性缺血性腦卒中患者登記[11]。③ 醫療服務登記。將暴露于某種醫療服務的人群作為患者人群納入標準,如冠狀動脈旁路搭橋手術登記[12, 13],此外還包括參與某種疾病管理方案、質量控制措施或評估計劃患者人群[14]。此類登記一般是評估特定的醫療服務患者結局,是開展預后研究的重要數據來源。
當然,上述患者登記的類型可能有交叉和混合。如筆者正開展的非小細胞肺癌患者登記研究,屬于特定疾病的患者登記;基于相同的人群可能同時開展特定靶向治療藥物的醫療產品登記,也可能開展針對特定手術切除術式的醫療服務登記。
1.3 患者登記研究的主要應用
患者登記研究可解決的科學問題多種多樣,本文主要介紹目前最主要應用。相比回顧性數據庫數據(如醫院電子病歷系統),患者登記能收集影響預后的因素(如生活行為因素、生物標志物等),形成較完整隨訪,獲得患者遠期結局,明顯提高預測效果。同時,患者登記的數據收集流程和質量控制措施更加嚴格,盡可能控制了錯分偏倚(misclassification bias)、回憶偏倚(recall bias)等,為進一步研究提供了高質量的數據來源。
1.3.1 流行病學特征和病因研究
通過開展特定疾病人群的登記研究了解疾病情況和分布特征,如我國開展的國家腫瘤登記[15]、國家血友病登記[16]等。患者登記也是病因研究的重要工具,尤其是對生活行為習慣、環境因素等患者自報變量與結局的相關性研究[17, 18]。此外,患者登記前瞻性隨訪患者結局,對研究疾病自然史也起到重要作用。
1.3.2 治療相關問題
患者登記是研究治療結局的重要手段,目前在效果比較研究(comparative effectiveness research,CER)和以患者為中心的結局指標研究(patient-centered outcomes research,PCOR)中廣泛應用[4, 19],以評價多種干預措施在實際醫療環境中的療效、危害和對患者報告結局影響。患者登記研究在治療領域的應用主要集中于以下幾個方面:治療方式和模式調查,尤其是對于干預復雜的疾病[20];治療依從性和相關影響因素[21];現有診療過程中未滿足的需求調查;實際療效和比較效果分析;對納入人群的限制較少、可能存在多種合并癥和合并用藥情況[22, 23];治療安全性及其影響因素分析[24];治療異質性分析[25]等。
1.3.3 預后與預測問題
由于較完整地記錄了患者診療過程,并可隨訪獲得患者結局,因此患者登記可適用于臨床預后研究。即可探索疾病發展的相關預后因素,也可基于多種預后因素建立風險預測模型。我國在多個領域開展了基于預后問題的患者登記研究,如急性中風患者預后研究[26, 27]、急性冠脈事件預后研究[28]、乙肝孕婦預后研究[29, 30]等。
1.3.4 醫療政策問題
患者登記同樣適用于醫療管理和醫療政策領域研究。一方面可開展與醫療費用和成本相關的衛生/藥物經濟學研究[31],患者登記可獲得患者完整診療過程和轉歸結局,又可獲得相關費用信息。另一方面,開展臨床醫療質量評價,特別是在干預復雜、目標結局多元化的情況下,多來源和多維度的信息可全面評價某項醫療政策對醫療質量的影響[32]。
1.3.5 特殊考慮
除上述 4 個方面外,登記研究還適用于臨床試驗不符合倫理要求而無法實施的情況。如少數醫療器械的臨床研究與評價中,由于無法設立相關對照,而采用器械登記研究方式。此外,罕見病治療也是基于注冊登記開展研究。
2 患者登記研究的策劃和準備
一個成功的患者登記研究,其基礎是研究策劃。這不僅包含了科學層面的考慮,同時也包含對研究組織、資源考量。患者登記研究由于需要前瞻性收集數據和設計患者隨訪,因此在人力、物力和財力的需求往往較回顧性數據庫研究更高。以下將具體介紹患者登記研究在策劃過程中需要考慮的內容。
2.1 明確患者登記研究的目的
明確患者登記研究的目的是患者登記研究的第一步,也是最重要的一步。在策劃研究時,首先需要明確擬解決的科學問題:這可能是一個問題,也可能是多個問題;在考慮多個問題時,需要明確哪些是主要問題,哪些是次要問題。有時,臨床醫生或決策者可能會關心眾多的研究問題,因此,需要評估這些研究問題能被回答的可行性。此外,還需要明確需要什么樣的核心數據,才能回答這些研究問題。
2.2 判斷開展患者登記研究是否必要
判斷是否有必要開展患者登記研究受多個因素影響。首要考慮的是,所需數據是否已存在?回顧性數據庫(如醫院電子病歷數據、醫保數據、區域醫療數據)已為研究者提供了不同類型的醫療、成本和健康數據。在可能的情況下,使用這些數據是相對便捷和快速解決問題的辦法。但在特定情況下,一些重要的數據并未被常規收集,如腫瘤患者生活質量數據、患者的院外結局、自購藥情況、患者的生活行為習慣、社會經濟特征等,回顧性數據庫一般無法獲得。在這樣的情況下,需要開展患者登記研究。
此外,需要同等考慮的重要問題是這些數據是否可使用?如數據存在,但無使用權,基于回顧性數據庫開展研究的計劃也只能放棄,從而選擇開展前瞻性的登記研究。
最后,數據質量是否能滿足分析的要求?基于管理目的形成回顧性數據庫往往存在數據缺失、變量定義不一致、沒有嚴格質量控制等局限性。因此,即使能通過上述數據庫獲得部分研究所需數據,但受數據準確性、完整性的限制,可能仍然無法回答研究者想要了解的問題。這時患者登記研究是較好的選擇。判斷是否開展患者登記研究的框架見圖 1。

2.3 評估患者登記研究的可行性
患者登記的可行性判斷主要基于研究目的、研究資源、項目經費和人員配備方面等因素。研究者需要根據研究目的從科學層面考慮人群納入的范圍和數量、隨訪時間長短、獲得數據方式、需前瞻收集的數據量。但這些問題并不是固定不變的,需要根據研究發起者擁有的資源、經費和能力進行調整。如開展多中心患者登記研究,研究者首先需要確定能否在多個醫療機構獲得患者資源;其次,當部分數據需要從醫院電子病歷數據庫中獲得時,研究者是否能在各個醫療機構獲得這部分數據;此外,數據收集的嚴謹程度與數據質量密切相關,采用電子化的收集模式可以實現在線傳輸、中央監控、即時報錯等功能,但會增加成本。這些問題將大大影響研究的可行性,在資源和能力范圍內開展研究是研究成功的關鍵。
2.4 組建研究團隊
患者登記研究團隊的人員構成與研究目的、人群數量和范圍等因素相關。小型、單中心患者登記可由單個研究者及其團隊組織。但大規模多中心患者登記研究通常需要跨學科團隊構成,至少應該包括:臨床團隊(主要由臨床專業人員構成)、方法學團隊(主要由臨床流行病、藥物流行病、統計專業人員構成)、研究管理和協調團隊(主要由具備臨床研究經驗的協調人員構成)、信息化團隊(主要由信息技術專業人員構成)。這些團隊在研究中的職責存在差異,具體職責的劃分會根據不同研究略有差異,需團隊間協商確定。在一些研究中,也可能存在多個團隊職責由同一群人承擔的情況。此外,大規模多中心患者登記研究最核心的構成是由主要臨床專業人員、主要方法學人員和主要項目管理人員組成的協調小組,整體負責研究的策劃、實施、報告和分析,通常也稱為指導委員會(steering committee)。
2.5 制定研究計劃書
研究計劃書是一個多學科共同協作完成的結果。通常,質量高、可行性強的研究計劃書是由指導委員會完成的。研究計劃書內容至少包括:研究目的、研究內容、研究團隊及其職責、目標人群、數據來源、數據收集方法、數據收集流程、數據變量定義和規則、研究進度安排、質量控制措施等。與臨床隨機對照試驗不同,患者登記研究雖然不需要強制性在公共平臺注冊,但我們仍推薦研究者注冊患者登記研究,目前已有多個注冊平臺可供選擇[5, 6]。此外,還會涉及到倫理以及知情同意的考慮,不再贅述。
3 患者登記數據庫的構建流程
構建患者登記數據庫是開展患者登記的核心內容,涉及兩個重要方面,即人和數據。因此,接下來我們將從這兩方面闡述患者登記數據庫的構建流程[4]。
3.1 研究對象的招募與管理
3.1.1 患者登記的目標人群
根據患者登記的分類,目標人群大致有以下 3 類:診斷為特定疾病、出現特定結局或具備某種狀態的人群;涉及某種具體暴露的人群,這里的“暴露”是廣義的概念,包括服藥、使用醫療器械、診療流程或者其它醫療衛生服務[12, 33];參與某種疾病管理方案、質量控制措施或者評估計劃的人群[14]。在確定了患者類型后,需要進一步明確患者的分布和范圍,以及明確的納入標準。
3.1.2 如何招募目標患者
上述目標人群可根據研究目的不同而存在 3 個層次的招募。首先是招募個體患者,如招募被診斷為某種罕見疾病的個體;其次是招募醫生,即在該醫生處就診的所有目標個體都被納入研究;最后是招募醫院,即在該醫院就診的所有目標個體都被納入研究。采用何種招募形式取決于研究目的、疾病患病率或發病率高低、研究時間安排、研究資源多少等,最終目的是為了獲得偏倚較小的代表性人群。連續性納入是常用的入組方法,可減少選擇偏倚。
3.1.3 樣本量的計算
對于患者登記而言,根據研究目的不同,不一定需要進行樣本量的估算。當建立患者登記數據庫的目的是醫療管理時,可能存在多維度的目標結局,需要連續收集患者數據持續評估和監測,往往也缺乏樣本量計算所需參數,此時樣本量的計算不是必要。其次,在有明確的研究目的且需要樣本量計算時,登記樣本量計算主要考慮主要結局指標、登記的時間安排、臨床效應的大小、研究設計、擬分析的數據結構和預算影響。在資源充分時,更多應考慮在計劃樣本量情況下如何確保數據收集質量。
3.1.4 患者的隨訪和維持
由于需要前瞻性收集數據,如何進行登記的隨訪和維持是保障研究質量的關鍵。常用的隨訪方法有多種,如電話隨訪、網絡隨訪等。為減少失訪發生,在常見的隨訪方法上可能還需要采用多種技巧提高患者在隨訪期間的應答率。如對研究人員定期開展培訓會,加強項目進展的溝通和宣傳;對參與研究的各個研究地點或者醫生開展定期數據質量評價和反饋;采用專門調查人員協助臨床醫生追蹤患者;共享數據資源,提高研究人員的積極性等。總的來說,與回顧性數據庫研究相比,患者登記研究的開展需要更多的人力、財力和周密的計劃,因此專業的研究設計和數據管理團隊的參與能有效提高研究質量。
3.2 數據的收集與管理
建立高質量的患者登記數據庫需要嚴格的數據收集和管理流程,主要的流程和步驟總結如圖 2 所示。

3.2.1 制作病例報告表(case report form,CRF)
制作 CRF 表是臨床研究的重要內容,首先應根據研究目的篩選數據要素,常見的數據要素包括:研究對象聯系信息、納入標準、疾病史、環境暴露、人口社會學特征、醫療服務提供者特征、經濟學信息、主要結局指標、次要結局指標等。對于數據要素的選擇除了研究對象聯系信息、納入標準等必要項目外,主要應平衡研究目標和資源。在資源有限的情況下,CRF 表過于冗繁,如隨訪次數過多或者隨訪期過長,都可能導致明顯的數據缺失和研究對象拒答,降低數據收集的質量。
3.2.2 制定標準化的數據收集手冊
制定標準化的數據收集手冊的目的是采用統一和系統化的方法收集研究數據。標準化的數據收集手冊至少應包含以下內容:研究計劃書、患者納入排除標準、數據收集工具、數據要素的定義和規則、患者識別號的產生和分配規則、重復記錄的預防和處理、CRF 表使用者手冊等。其中數據要素的定義和規則具有重要意義,包括以下兩個方面,一是數據字典,涵蓋數據定義、數據來源、編碼信息等;二是數據驗證規則,包括數據邏輯核查規則、參考值范圍等。
3.2.3 倫理審批
雖然患者登記研究沒有人為干預患者接受何種醫療措施,但仍需將研究方案提交當地倫理審查委員會(institutional review board,IRB)接受審查和批準。對于多中心研究,建議在各中心均提交方案至當地倫理審查委員會以供審查;對于無倫理委員會的單位,一般可由項目負責單位完成倫理審查。由于需要前瞻性收集患者數據,患者登記研究需研究對象簽署患者知情同意書,說明此次調查的數據和從其他來源獲得的供研究使用的患者數據等相關內容。同時應特別注意隱藏患者個人信息,采取措施保障患者隱私和數據安全。
3.2.4 開展預試驗
預試驗是對患者登記研究中的研究流程、CRF 表、數據收集工具等方面進行測試,從而改進和優化研究。選擇預實驗的對象和范圍應充分考慮我國醫療環境的異質性,不同醫療機構診療流程、疾病管理模式有較大差異,可能會出現既定的研究流程在部分研究現場無法開展的情況。開展預試驗能幫助研究人員熟悉研究流程,及時溝通和反饋研究各個環節可能存在的問題。
3.2.5 明確研究人員的安排和職責
患者登記需要較多人力投入,故需在研究開始前明確所有研究人員的職責。除患者和提供醫療服務的醫生外,可能還需要現場調查員、現場協調員、數據錄入員、數據審查員、數據分析員、數據工程師等。
3.2.6 明確數據來源
根據研究目的和計劃,數據來源可分為主要數據和次要數據。前者主要是指與登記目的直接相關的數據,需要通過事先制定標準化數據收集方法主動性收集。后者主要指與登記主要目的以外另需收集的數據,可通過整合已有數據庫獲得,如 HIS/EMR 數據庫、醫保數據庫、人口出生/死亡登記等。
根據數據收集對象的不同,數據來源也可分為:需要向患者主動收集的新數據;臨床醫生或病歷系統中新的或已存在的數據;醫療輔助系統中存在的其他數據,如實驗室檢查。第一種屬于患者自報數據,后兩種屬于醫生或醫院報告數據。一般情況,患者自報數據需要主動性收集,醫生或者醫院報告數據可來自已有的醫院管理數據庫。
3.2.7 數據提取
由于患者登記的部分數據可能來自已有的數據庫,所以需要將部分數據從各種管理檔案或者數據庫中提取出來。數據提取與回顧性觀察性研究類似,需要明確指標定義、規范化培訓調查員、標準化的數據提取工具、采用重復錄入的方式報告數據提取的準確率。從紙質病歷或者 EMR 系統中提取數據是常見的提取方式,然后將數據轉化成登記所需格式,再上傳到登記數據庫。
3.2.8 數據錄入
多種數據錄入方式可供選擇,包括紙質 CRF 填寫后再錄入登記數據庫、電子 CRF 直接錄入、移動客服端(如微信、app)錄入、語音錄入、掃描錄入等。不同錄入方式的選擇主要取決與數據要素的數量、參與的研究單位數、研究單位的分布、登記的研究時間跨度、隨訪頻率等因素。
目前,基于網絡的電子化數據收集系統(electronic data capturing,EDC)在大型患者登記研究中使用非常廣泛[34]。除能實現本地錄入/在線錄入外,還能基于網絡上傳,以實現中央監控和云端儲存,其功能已大大超過數據錄入的范疇。通過設定數據邏輯和數據參考值范圍,能在錄入時盡可能減少錯誤的發生,自動完成第一次數據核查。通過連接網絡,還能實時監控數據,了解數據收集進度,便于統計人員進行績效評價,并能實現初步的統計分析,是數據管理的有利工具,推薦有條件的研究組織者使用該系統。
3.2.9 數據清理和儲存
數據清理是對數據核查和糾錯過程。首先應提前制作數據清理手冊,包括需要清理的變量、預設的邏輯問題、數據的參考值范圍等;其次,在數據錄入時基于數據錄入系統開展第一次自動數據清理,然后再對獲得數據進行人工數據清理;對可疑的問題生成數據質疑報告,返回數據收集單位進行核實和更正;最后進行數據編碼,并儲存數據。
4 患者登記和傳統隊列研究的區別
患者登記研究與傳統隊列研究有較多相似之處。有時,部分研究者甚至會將兩者等同起來。總體而言,隨著醫學和信息技術的發展,兩者融合越來越高,兩者間確實有較大程度重疊,這在臨床醫療(而非公共衛生)研究環境中尤其如此。但兩者之間仍存在重要差異。
患者登記研究首先是一種數據收集模式,在明確研究目的和數據收集流程下,建立患者登記數據庫。基于患者登記數據庫,可根據不同研究目的,采用不同的流行病學研究設計,如隊列研究[35]、病例-對照研究[36]、病例-隊列研究[37]、橫斷面研究[38]、甚至包括基于登記的隨機對照試驗[39]等。嚴格意義上講,患者登記并不是某一種研究設計,而是先圍繞目的形成的數據來源。此外,患者登記研究具有較強的靈活性,可在過程中調整研究目的、變換相關數據收集等。這在傳統隊列研究中是較少發生的。
傳統隊列研究是一種具體的流行病學研究設計,用于探討特定暴露與結局的關系,常采用前瞻性隨訪。傳統隊列研究的數據也可來源于患者登記(這也是許多研究者將患者登記等同于前瞻性隊列的原因之一)。在研究策劃階段,傳統隊列研究會形成明確的分組(即建立確切的暴露和非暴露),而患者登記根據類型的不同,不一定有分組。如在基于疾病的患者登記中(如非小細胞肺癌登記),臨床醫生和研究者關心的暴露因素可能會隨著研究問題的變化而發生改變。
5 小結
患者登記研究在眾多臨床醫療和衛生決策領域具有重要價值。同其他臨床研究一樣,高質量患者登記研究需要科學的研究設計、嚴謹的研究實施、準確的數據分析和多學科的緊密合作。由于篇幅限制,患者登記研究的其他內容將在后文撰述。
目前,真實世界數據(real world data,RWD)和真實世界證據(real world evidence,RWE)逐漸受到專家和學者的廣泛重視。2017 年 8 月,美國 FDA 提出將 RWE 用于醫療器械的監管和決策[1],此舉引起了各界學者對 RWD 和 RWE 的關注。值得注意的是,RWD 和 RWE 都屬于廣義的概念,并非某一種數據來源或某一種研究形成的證據[2]。RWD 需要通過開展研究轉變成 RWE。這些研究常被稱為真實世界研究(real world study,RWS),包括試驗性設計(實效性隨機對照試驗[3])和觀察性設計的研究。
觀察性 RWS 根據原始數據是否基于特定研究目的分為兩類。一類是基于具體的研究假設收集數據開展研究,如患者登記研究。這類研究與傳統的研究方式類似,都是首先建立明確的研究假設,形成清晰的研究目的,繼而建立研究方案,在不破壞實際醫療方案的基礎上(僅觀察)收集數據,建立研究數據庫,進行數據處理和分析。第二類是在已有的數據庫基礎上(如醫院電子病歷數據、醫保理賠數據庫、民政部門和公共衛生部門的出生/死亡登記、公共衛生調查和公共健康監測數據等[2])設定研究假設,然后利用數據庫已有數據開展研究。這類研究的過程與傳統研究方式存在較大差異。本文作為觀察性 RWS 系列文章的第一篇,將詳細介紹基于患者登記研究的策劃與數據庫構建。
1 針對患者結局的患者登記研究
1.1 患者登記的概念
美國醫療保健研究與質量局(Agency for Healthcare Research and Quality,AHRQ)在 2007 年首次發布了《評估患者結局的登記研究的使用者手冊》(Registries for evaluating patient outcomes: a user’s guide),對患者登記的概念、流程、設計和評估等方面做了詳細闡述,并在 2014 年進行了第三次更新[4]。該手冊所指的“登記”是指收集、儲存數據和數據記錄產生的過程。
登記研究(registry study),又稱患者登記研究,是以臨床治療或衛生政策制定為研究目的,采用觀察性研究方法來收集一致性數據的組織系統,用于評估某種疾病、狀態或者暴露人群的特定結局,通常具備幾個要素(表 1)[4]。

首先,患者登記研究往往有明確的研究目的,或至少部分數據需要基于特定目的專門進行收集,這是區分于其他登記系統的重要特征;其次,患者登記的數據來源于醫療環境中的“自然”狀態,是屬于真實世界數據的范疇;再次,研究設計者并不干預患者診療方案,僅屬于觀察性研究;最后,患者登記是在既定研究目的基礎上,收集真實世界患者數據,建立患者登記數據庫,研究并回答多種與醫療相關的問題,其研究設計與觀察性研究無異。
從形式上看,患者登記研究與傳統前瞻性隊列研究具有許多共同點。但前者具有更大的靈活性,包括在研究過程中調整研究目的、研究人群、收集數據、數據收集方式等。而傳統前瞻性隊列研究往往在研究過程中,對整個方案調整較少,尤其是針對主要結局指標等關鍵設定的修改較少。
在醫學領域中,現存很多不同的登記系統。常見的包括:臨床試驗登記系統[5, 6]、器官移植登記系統[7]、出生缺陷登記[8]、法定傳染病監測系統[9]等。這些登記系統和本文涉及的患者登記研究存在本質上的區別。前者盡管在名義上也稱為登記,但這些系統建立的初衷主要用于管理和監測,在建立之初可能并未考慮研究的需求和目的。當然,基于這些系統收集的數據仍可用于研究,但和本文闡述的患者登記研究不同。
1.2 患者登記研究的類型
根據研究對象不同,患者登記研究大致可分為 3 類:① 醫療產品登記,是指患者暴露于某種醫療產品。納入標準是患者服用某種藥品或使用某項醫療器械,此類研究目的往往是評價醫療產品的安全性、在真實醫療環境中的有效性和患者依從性等,如接受藥物洗脫支架患者的登記研究[10]。② 特定疾病或醫療狀態的患者登記。納入標準是患者診斷為特定疾病或具備特定醫療狀態,如急性缺血性腦卒中患者登記[11]。③ 醫療服務登記。將暴露于某種醫療服務的人群作為患者人群納入標準,如冠狀動脈旁路搭橋手術登記[12, 13],此外還包括參與某種疾病管理方案、質量控制措施或評估計劃患者人群[14]。此類登記一般是評估特定的醫療服務患者結局,是開展預后研究的重要數據來源。
當然,上述患者登記的類型可能有交叉和混合。如筆者正開展的非小細胞肺癌患者登記研究,屬于特定疾病的患者登記;基于相同的人群可能同時開展特定靶向治療藥物的醫療產品登記,也可能開展針對特定手術切除術式的醫療服務登記。
1.3 患者登記研究的主要應用
患者登記研究可解決的科學問題多種多樣,本文主要介紹目前最主要應用。相比回顧性數據庫數據(如醫院電子病歷系統),患者登記能收集影響預后的因素(如生活行為因素、生物標志物等),形成較完整隨訪,獲得患者遠期結局,明顯提高預測效果。同時,患者登記的數據收集流程和質量控制措施更加嚴格,盡可能控制了錯分偏倚(misclassification bias)、回憶偏倚(recall bias)等,為進一步研究提供了高質量的數據來源。
1.3.1 流行病學特征和病因研究
通過開展特定疾病人群的登記研究了解疾病情況和分布特征,如我國開展的國家腫瘤登記[15]、國家血友病登記[16]等。患者登記也是病因研究的重要工具,尤其是對生活行為習慣、環境因素等患者自報變量與結局的相關性研究[17, 18]。此外,患者登記前瞻性隨訪患者結局,對研究疾病自然史也起到重要作用。
1.3.2 治療相關問題
患者登記是研究治療結局的重要手段,目前在效果比較研究(comparative effectiveness research,CER)和以患者為中心的結局指標研究(patient-centered outcomes research,PCOR)中廣泛應用[4, 19],以評價多種干預措施在實際醫療環境中的療效、危害和對患者報告結局影響。患者登記研究在治療領域的應用主要集中于以下幾個方面:治療方式和模式調查,尤其是對于干預復雜的疾病[20];治療依從性和相關影響因素[21];現有診療過程中未滿足的需求調查;實際療效和比較效果分析;對納入人群的限制較少、可能存在多種合并癥和合并用藥情況[22, 23];治療安全性及其影響因素分析[24];治療異質性分析[25]等。
1.3.3 預后與預測問題
由于較完整地記錄了患者診療過程,并可隨訪獲得患者結局,因此患者登記可適用于臨床預后研究。即可探索疾病發展的相關預后因素,也可基于多種預后因素建立風險預測模型。我國在多個領域開展了基于預后問題的患者登記研究,如急性中風患者預后研究[26, 27]、急性冠脈事件預后研究[28]、乙肝孕婦預后研究[29, 30]等。
1.3.4 醫療政策問題
患者登記同樣適用于醫療管理和醫療政策領域研究。一方面可開展與醫療費用和成本相關的衛生/藥物經濟學研究[31],患者登記可獲得患者完整診療過程和轉歸結局,又可獲得相關費用信息。另一方面,開展臨床醫療質量評價,特別是在干預復雜、目標結局多元化的情況下,多來源和多維度的信息可全面評價某項醫療政策對醫療質量的影響[32]。
1.3.5 特殊考慮
除上述 4 個方面外,登記研究還適用于臨床試驗不符合倫理要求而無法實施的情況。如少數醫療器械的臨床研究與評價中,由于無法設立相關對照,而采用器械登記研究方式。此外,罕見病治療也是基于注冊登記開展研究。
2 患者登記研究的策劃和準備
一個成功的患者登記研究,其基礎是研究策劃。這不僅包含了科學層面的考慮,同時也包含對研究組織、資源考量。患者登記研究由于需要前瞻性收集數據和設計患者隨訪,因此在人力、物力和財力的需求往往較回顧性數據庫研究更高。以下將具體介紹患者登記研究在策劃過程中需要考慮的內容。
2.1 明確患者登記研究的目的
明確患者登記研究的目的是患者登記研究的第一步,也是最重要的一步。在策劃研究時,首先需要明確擬解決的科學問題:這可能是一個問題,也可能是多個問題;在考慮多個問題時,需要明確哪些是主要問題,哪些是次要問題。有時,臨床醫生或決策者可能會關心眾多的研究問題,因此,需要評估這些研究問題能被回答的可行性。此外,還需要明確需要什么樣的核心數據,才能回答這些研究問題。
2.2 判斷開展患者登記研究是否必要
判斷是否有必要開展患者登記研究受多個因素影響。首要考慮的是,所需數據是否已存在?回顧性數據庫(如醫院電子病歷數據、醫保數據、區域醫療數據)已為研究者提供了不同類型的醫療、成本和健康數據。在可能的情況下,使用這些數據是相對便捷和快速解決問題的辦法。但在特定情況下,一些重要的數據并未被常規收集,如腫瘤患者生活質量數據、患者的院外結局、自購藥情況、患者的生活行為習慣、社會經濟特征等,回顧性數據庫一般無法獲得。在這樣的情況下,需要開展患者登記研究。
此外,需要同等考慮的重要問題是這些數據是否可使用?如數據存在,但無使用權,基于回顧性數據庫開展研究的計劃也只能放棄,從而選擇開展前瞻性的登記研究。
最后,數據質量是否能滿足分析的要求?基于管理目的形成回顧性數據庫往往存在數據缺失、變量定義不一致、沒有嚴格質量控制等局限性。因此,即使能通過上述數據庫獲得部分研究所需數據,但受數據準確性、完整性的限制,可能仍然無法回答研究者想要了解的問題。這時患者登記研究是較好的選擇。判斷是否開展患者登記研究的框架見圖 1。

2.3 評估患者登記研究的可行性
患者登記的可行性判斷主要基于研究目的、研究資源、項目經費和人員配備方面等因素。研究者需要根據研究目的從科學層面考慮人群納入的范圍和數量、隨訪時間長短、獲得數據方式、需前瞻收集的數據量。但這些問題并不是固定不變的,需要根據研究發起者擁有的資源、經費和能力進行調整。如開展多中心患者登記研究,研究者首先需要確定能否在多個醫療機構獲得患者資源;其次,當部分數據需要從醫院電子病歷數據庫中獲得時,研究者是否能在各個醫療機構獲得這部分數據;此外,數據收集的嚴謹程度與數據質量密切相關,采用電子化的收集模式可以實現在線傳輸、中央監控、即時報錯等功能,但會增加成本。這些問題將大大影響研究的可行性,在資源和能力范圍內開展研究是研究成功的關鍵。
2.4 組建研究團隊
患者登記研究團隊的人員構成與研究目的、人群數量和范圍等因素相關。小型、單中心患者登記可由單個研究者及其團隊組織。但大規模多中心患者登記研究通常需要跨學科團隊構成,至少應該包括:臨床團隊(主要由臨床專業人員構成)、方法學團隊(主要由臨床流行病、藥物流行病、統計專業人員構成)、研究管理和協調團隊(主要由具備臨床研究經驗的協調人員構成)、信息化團隊(主要由信息技術專業人員構成)。這些團隊在研究中的職責存在差異,具體職責的劃分會根據不同研究略有差異,需團隊間協商確定。在一些研究中,也可能存在多個團隊職責由同一群人承擔的情況。此外,大規模多中心患者登記研究最核心的構成是由主要臨床專業人員、主要方法學人員和主要項目管理人員組成的協調小組,整體負責研究的策劃、實施、報告和分析,通常也稱為指導委員會(steering committee)。
2.5 制定研究計劃書
研究計劃書是一個多學科共同協作完成的結果。通常,質量高、可行性強的研究計劃書是由指導委員會完成的。研究計劃書內容至少包括:研究目的、研究內容、研究團隊及其職責、目標人群、數據來源、數據收集方法、數據收集流程、數據變量定義和規則、研究進度安排、質量控制措施等。與臨床隨機對照試驗不同,患者登記研究雖然不需要強制性在公共平臺注冊,但我們仍推薦研究者注冊患者登記研究,目前已有多個注冊平臺可供選擇[5, 6]。此外,還會涉及到倫理以及知情同意的考慮,不再贅述。
3 患者登記數據庫的構建流程
構建患者登記數據庫是開展患者登記的核心內容,涉及兩個重要方面,即人和數據。因此,接下來我們將從這兩方面闡述患者登記數據庫的構建流程[4]。
3.1 研究對象的招募與管理
3.1.1 患者登記的目標人群
根據患者登記的分類,目標人群大致有以下 3 類:診斷為特定疾病、出現特定結局或具備某種狀態的人群;涉及某種具體暴露的人群,這里的“暴露”是廣義的概念,包括服藥、使用醫療器械、診療流程或者其它醫療衛生服務[12, 33];參與某種疾病管理方案、質量控制措施或者評估計劃的人群[14]。在確定了患者類型后,需要進一步明確患者的分布和范圍,以及明確的納入標準。
3.1.2 如何招募目標患者
上述目標人群可根據研究目的不同而存在 3 個層次的招募。首先是招募個體患者,如招募被診斷為某種罕見疾病的個體;其次是招募醫生,即在該醫生處就診的所有目標個體都被納入研究;最后是招募醫院,即在該醫院就診的所有目標個體都被納入研究。采用何種招募形式取決于研究目的、疾病患病率或發病率高低、研究時間安排、研究資源多少等,最終目的是為了獲得偏倚較小的代表性人群。連續性納入是常用的入組方法,可減少選擇偏倚。
3.1.3 樣本量的計算
對于患者登記而言,根據研究目的不同,不一定需要進行樣本量的估算。當建立患者登記數據庫的目的是醫療管理時,可能存在多維度的目標結局,需要連續收集患者數據持續評估和監測,往往也缺乏樣本量計算所需參數,此時樣本量的計算不是必要。其次,在有明確的研究目的且需要樣本量計算時,登記樣本量計算主要考慮主要結局指標、登記的時間安排、臨床效應的大小、研究設計、擬分析的數據結構和預算影響。在資源充分時,更多應考慮在計劃樣本量情況下如何確保數據收集質量。
3.1.4 患者的隨訪和維持
由于需要前瞻性收集數據,如何進行登記的隨訪和維持是保障研究質量的關鍵。常用的隨訪方法有多種,如電話隨訪、網絡隨訪等。為減少失訪發生,在常見的隨訪方法上可能還需要采用多種技巧提高患者在隨訪期間的應答率。如對研究人員定期開展培訓會,加強項目進展的溝通和宣傳;對參與研究的各個研究地點或者醫生開展定期數據質量評價和反饋;采用專門調查人員協助臨床醫生追蹤患者;共享數據資源,提高研究人員的積極性等。總的來說,與回顧性數據庫研究相比,患者登記研究的開展需要更多的人力、財力和周密的計劃,因此專業的研究設計和數據管理團隊的參與能有效提高研究質量。
3.2 數據的收集與管理
建立高質量的患者登記數據庫需要嚴格的數據收集和管理流程,主要的流程和步驟總結如圖 2 所示。

3.2.1 制作病例報告表(case report form,CRF)
制作 CRF 表是臨床研究的重要內容,首先應根據研究目的篩選數據要素,常見的數據要素包括:研究對象聯系信息、納入標準、疾病史、環境暴露、人口社會學特征、醫療服務提供者特征、經濟學信息、主要結局指標、次要結局指標等。對于數據要素的選擇除了研究對象聯系信息、納入標準等必要項目外,主要應平衡研究目標和資源。在資源有限的情況下,CRF 表過于冗繁,如隨訪次數過多或者隨訪期過長,都可能導致明顯的數據缺失和研究對象拒答,降低數據收集的質量。
3.2.2 制定標準化的數據收集手冊
制定標準化的數據收集手冊的目的是采用統一和系統化的方法收集研究數據。標準化的數據收集手冊至少應包含以下內容:研究計劃書、患者納入排除標準、數據收集工具、數據要素的定義和規則、患者識別號的產生和分配規則、重復記錄的預防和處理、CRF 表使用者手冊等。其中數據要素的定義和規則具有重要意義,包括以下兩個方面,一是數據字典,涵蓋數據定義、數據來源、編碼信息等;二是數據驗證規則,包括數據邏輯核查規則、參考值范圍等。
3.2.3 倫理審批
雖然患者登記研究沒有人為干預患者接受何種醫療措施,但仍需將研究方案提交當地倫理審查委員會(institutional review board,IRB)接受審查和批準。對于多中心研究,建議在各中心均提交方案至當地倫理審查委員會以供審查;對于無倫理委員會的單位,一般可由項目負責單位完成倫理審查。由于需要前瞻性收集患者數據,患者登記研究需研究對象簽署患者知情同意書,說明此次調查的數據和從其他來源獲得的供研究使用的患者數據等相關內容。同時應特別注意隱藏患者個人信息,采取措施保障患者隱私和數據安全。
3.2.4 開展預試驗
預試驗是對患者登記研究中的研究流程、CRF 表、數據收集工具等方面進行測試,從而改進和優化研究。選擇預實驗的對象和范圍應充分考慮我國醫療環境的異質性,不同醫療機構診療流程、疾病管理模式有較大差異,可能會出現既定的研究流程在部分研究現場無法開展的情況。開展預試驗能幫助研究人員熟悉研究流程,及時溝通和反饋研究各個環節可能存在的問題。
3.2.5 明確研究人員的安排和職責
患者登記需要較多人力投入,故需在研究開始前明確所有研究人員的職責。除患者和提供醫療服務的醫生外,可能還需要現場調查員、現場協調員、數據錄入員、數據審查員、數據分析員、數據工程師等。
3.2.6 明確數據來源
根據研究目的和計劃,數據來源可分為主要數據和次要數據。前者主要是指與登記目的直接相關的數據,需要通過事先制定標準化數據收集方法主動性收集。后者主要指與登記主要目的以外另需收集的數據,可通過整合已有數據庫獲得,如 HIS/EMR 數據庫、醫保數據庫、人口出生/死亡登記等。
根據數據收集對象的不同,數據來源也可分為:需要向患者主動收集的新數據;臨床醫生或病歷系統中新的或已存在的數據;醫療輔助系統中存在的其他數據,如實驗室檢查。第一種屬于患者自報數據,后兩種屬于醫生或醫院報告數據。一般情況,患者自報數據需要主動性收集,醫生或者醫院報告數據可來自已有的醫院管理數據庫。
3.2.7 數據提取
由于患者登記的部分數據可能來自已有的數據庫,所以需要將部分數據從各種管理檔案或者數據庫中提取出來。數據提取與回顧性觀察性研究類似,需要明確指標定義、規范化培訓調查員、標準化的數據提取工具、采用重復錄入的方式報告數據提取的準確率。從紙質病歷或者 EMR 系統中提取數據是常見的提取方式,然后將數據轉化成登記所需格式,再上傳到登記數據庫。
3.2.8 數據錄入
多種數據錄入方式可供選擇,包括紙質 CRF 填寫后再錄入登記數據庫、電子 CRF 直接錄入、移動客服端(如微信、app)錄入、語音錄入、掃描錄入等。不同錄入方式的選擇主要取決與數據要素的數量、參與的研究單位數、研究單位的分布、登記的研究時間跨度、隨訪頻率等因素。
目前,基于網絡的電子化數據收集系統(electronic data capturing,EDC)在大型患者登記研究中使用非常廣泛[34]。除能實現本地錄入/在線錄入外,還能基于網絡上傳,以實現中央監控和云端儲存,其功能已大大超過數據錄入的范疇。通過設定數據邏輯和數據參考值范圍,能在錄入時盡可能減少錯誤的發生,自動完成第一次數據核查。通過連接網絡,還能實時監控數據,了解數據收集進度,便于統計人員進行績效評價,并能實現初步的統計分析,是數據管理的有利工具,推薦有條件的研究組織者使用該系統。
3.2.9 數據清理和儲存
數據清理是對數據核查和糾錯過程。首先應提前制作數據清理手冊,包括需要清理的變量、預設的邏輯問題、數據的參考值范圍等;其次,在數據錄入時基于數據錄入系統開展第一次自動數據清理,然后再對獲得數據進行人工數據清理;對可疑的問題生成數據質疑報告,返回數據收集單位進行核實和更正;最后進行數據編碼,并儲存數據。
4 患者登記和傳統隊列研究的區別
患者登記研究與傳統隊列研究有較多相似之處。有時,部分研究者甚至會將兩者等同起來。總體而言,隨著醫學和信息技術的發展,兩者融合越來越高,兩者間確實有較大程度重疊,這在臨床醫療(而非公共衛生)研究環境中尤其如此。但兩者之間仍存在重要差異。
患者登記研究首先是一種數據收集模式,在明確研究目的和數據收集流程下,建立患者登記數據庫。基于患者登記數據庫,可根據不同研究目的,采用不同的流行病學研究設計,如隊列研究[35]、病例-對照研究[36]、病例-隊列研究[37]、橫斷面研究[38]、甚至包括基于登記的隨機對照試驗[39]等。嚴格意義上講,患者登記并不是某一種研究設計,而是先圍繞目的形成的數據來源。此外,患者登記研究具有較強的靈活性,可在過程中調整研究目的、變換相關數據收集等。這在傳統隊列研究中是較少發生的。
傳統隊列研究是一種具體的流行病學研究設計,用于探討特定暴露與結局的關系,常采用前瞻性隨訪。傳統隊列研究的數據也可來源于患者登記(這也是許多研究者將患者登記等同于前瞻性隊列的原因之一)。在研究策劃階段,傳統隊列研究會形成明確的分組(即建立確切的暴露和非暴露),而患者登記根據類型的不同,不一定有分組。如在基于疾病的患者登記中(如非小細胞肺癌登記),臨床醫生和研究者關心的暴露因素可能會隨著研究問題的變化而發生改變。
5 小結
患者登記研究在眾多臨床醫療和衛生決策領域具有重要價值。同其他臨床研究一樣,高質量患者登記研究需要科學的研究設計、嚴謹的研究實施、準確的數據分析和多學科的緊密合作。由于篇幅限制,患者登記研究的其他內容將在后文撰述。