新型冠狀病毒肺炎(COVID-19)已被世界衛生組織(WHO)評估為大流行病。盡管已研發了多個保護效果超過 50% 的疫苗,但在治療方面,瑞德西韋仍是經過美國食品藥品監督管理局(FDA)有條件批準用于治療 COVID-19 的抗病毒藥物,而其他治療方案均未有足夠的臨床證據推薦使用。國內外已注冊了多個臨床試驗以開發安全有效的治療藥物或疫苗。為更好地促進 COVID-19 臨床研究數據的采集、制表與分析,提高臨床研究效率,同時促進多個同類研究數據整合、共享和二次分析,臨床數據交換標準協會(CDISC)開發了 COVID-19 治療領域標準用戶指南及基于 WHO 和國際嚴重急性呼吸道與新興感染聯合會聯合開發的用來收集 COVID-19 相關臨床特征的注釋病例報告表(aCRF)和數據相關映射表格。此外,CDISC 開發制訂了《因 COVID-19 暴發而中斷運行的研究的指南》及臨時分析數據模型(ADaM)指南,以幫助受影響的臨床試驗采集存儲和分析相關數據。本文介紹該指南及其相關標準的結構與內容,以期促進其在國內的 COVID-19 臨床試驗及因 COVID-19 大流行而中斷運行的研究中的應用。
引用本文: 李庚, 溫澤淮. CDISC COVID-19 治療領域標準用戶指南及其相關標準解讀. 中國循證醫學雜志, 2021, 21(11): 1358-1364. doi: 10.7507/1672-2531.202105129 復制
1 背景
新型冠狀病毒肺炎(coronavirus disease 2019,COVID-19)是一種不同于已有冠狀病毒如嚴重急性呼吸道綜合征(severe acute respiratory syndrome,SARS)和中東呼吸綜合征(middle east respiratory syndrome,MERS)的新型冠狀病毒所致疾病。該病病毒傳播迅速,疫情暴發呈指數增長[1]。2020 年 3 月 11 日,世界衛生組織(world health organization,WHO)評估認定 COVID-19 為大流行病[2]。截至 2021 年 4 月 7 日,WHO 公布全球確診病例已超過 1.3 億,死亡病例超過 286 萬[3]。目前已有多個 COVID-19 疫苗宣布并公布了 Ⅲ 期安慰劑對照臨床試驗的安全性和有效性,其保護效果超過 WHO 在 2020 年初確定的 50% 的最低要求[4]。但在治療方面,瑞德西韋仍是經過美國食品藥品監督管理局(food and drug administration,FDA)有條件批準用于 COVID-19 治療的抗病毒藥物,而其他治療方案諸如地塞米松抗感染治療、免疫抑制藥物治療(如 IL-6 抑制劑、IL-1 抑制劑、干擾素α或干擾素 β、酪氨酸激酶抑制劑等),均未有足夠的臨床證據推薦使用[5,6]。為研發有效安全的 COVID-19 治療藥物,全世界已開展了多個臨床研究,僅美國臨床試驗注冊網(ClinicalTrials.gov)[7]登記的涉及 COVID-19 的臨床研究就有 5 273 項(截至 2021 年 4 月 7 日)。WHO 指出為實現成效最大化,國際社會需要真正意義上的齊心協力和共同協作,其中就包括制訂關于研究數據、病毒和相關技術的共享協議,從而加速治療藥物和疫苗研發工作,同時為超越當前疫情暴發的長期研究和開發奠定基礎[1]。
臨床數據交換標準協會(clinical data interchange standards consortium,CDISC)建立了一系列數據交換標準以支持臨床前及臨床研究數據采集、制表、統計分析、遞交等過程[8]。目前,FDA 和日本藥品與醫療器械管理局(pharmaceuticals and medical devices agency,PMDA)已明確規定新藥臨床研究必須采用 CDISC 標準進行數據遞交[9,10],而我國國家藥品監督管理局藥品審評中心也鼓勵申辦方參照 CDISC 標準遞交臨床試驗數據及相關的申報資料。為更好地促進臨床相關治療領域中臨床研究數據標準化,CDISC 發起并制訂治療領域(therapeutic area,TA)標準。TA 標準是針對特定疾病領域對 CDISC 基礎標準的擴展[11]。鑒于 COVID-19 對公共衛生安全的重要性,CDISC 在 2020 年 3 月份快速成立了一個 COVID-19 研究數據標準化小組,開發、制訂了 COVID-19 TA 標準及其用戶指南,以便研究人員更有效、規范地收集、構建和分析數據,以體現數據的全部價值,推動臨床研究向前發展,并改善全球健康狀況[12]。本文將對 COVID-19 TA 標準用戶指南及其相關標準進行介紹,以期推動其在國內臨床研究中的應用,從而促進在國內開展的各類 COVID-19 相關臨床研究數據的標準化,及不同試驗和隊列數據的再次分析與共享。
2 COVID-19 相關標準的組成
2020 年 4 月 21 日,CDISC 發布了 COVID-19 臨時用戶指南(CDISC interim user guide for COVID-19 v1.0,COVID-19-IUG)、因 COVID-19 暴發而中斷運行的研究指南(以下簡稱為“中斷指南”)及一些為公共衛生研究人員提供的相關資源。其中,針對 WHO 和國際嚴重急性呼吸道與新興感染聯合會(international severe acute respiratory and emerging infection consortium,ISARIC)聯合開發的用來描述 COVID-19 相關臨床特征的數據工具,CDISC 提供了注釋病例報告表(annotated case report form,aCRF)和數據相關映射表格(mapping spreadsheet,MS)用來輔助各個國家公共衛生研究人員進行COVID-19相關研究[12]。2021 年 7 月 8 日,CDISC 更新并發布了 COVID-19 TA 標準(COVID-19 therapeutic area user guide v1.0,TAUG-COVID-19),并增加了針對因 COVID-19 流行而中斷運行的研究的臨時分析數據模型(analysis data model,ADaM)指南和疫苗管理指南(主要包括最小數據元和元數據映射管理,以促進與疫苗接種/管理文件相關的數據收集、存儲、處理和共享)[13]。本文將重點介紹 TAUG-COVID-19、中斷指南和為公共衛生研究人員提供的相關資源。
2.1 COIVID-19 治療領域標準用戶指南
TAUG-COVID-19 共有 15 章,除去第一章(簡介)和最后一章(附件),其余各章均為 COVID-19 臨床研究可能會采集的臨床數據的具體內容。大部分章節都提供了相應章節的解釋(包括為什么需要使用這些領域及如何使用)及研究數據制表模型(study data tabulation model,SDTM)示例(表 1)。

2.2 中斷指南
受 COVID-19 大流行影響,全球很多臨床試驗的訪視、評估和試驗流程無法正常進行,為協助申辦者確保臨床試驗受試者安全、保持良好的臨床操作規范并盡量減少在 COVID-19 突發公共衛生事件期間對試驗數據完整性的風險,美國 FDA 于 2020 年 3 月份發布了《FDA 關于 COVID-19 突發公共衛生事件期間醫療產品臨床試驗實施指南》[15]。申辦者應確認在病例報告表上清楚地報告了受試者未進行訪視、檢查等信息。CDISC 開發、制訂了中斷指南,以幫助受 COVID-19 影響的臨床試驗采集存儲相關數據。其主要內容包括:列出 COVID-19 相關影響作為臨床研究報告(CSR)的一部分,通過概念圖展示臨床試驗與 COVID-19 的關系以及相關數據采集與制表說明與示例。
2.2.1 列出 COVID-19 相關影響作為臨床研究報告的一部分
本節列出了 FDA 指南中的討論要點以及獲取和展示關聯數據的推薦方法。由于每個申辦者收集和管理數據的方式不同,因而無法指定如何收集所有可能的數據;相反,它概述了可能需要收集的數據。例如,有些申辦者在電子數據收集系統中可能有一個標志,以指示何時沒有進行訪視,而其他申辦者可能將其記錄在 CRF 中,還有一些申辦者可能從監查信息中得到。無論采用哪種方式,COVID-19 相關信息都必須包括錯過了哪些訪視以及其原因。
2.2.2 與 COVID-19 的關系
本節主要討論了受試者如何被疾病大流行影響。可能的影響方式有兩種,一是受試者患有大流行性疾病,二是研究活動受到疾病大流行的干擾。另外,本節列出了可用來存儲這些影響的域,也給出了另外一些數據存儲的建議。
2.2.3 相關領域使用說明與示例
見表 2。

2.3 為公共衛生研究人員提供的相關資源
此部分主要包括 2 個文件:根據 ISARIC/WHO 數據采集工具開發的 aCRF 和 MS。
2.3.1 aCRF
基于 CDISC SDTM 標準制訂的 aCRF,針對每個采集的字段,提供的 SDTM 標準變量及相關控制術語(若有,用{}括起來表示),比如種族采用 RACE 變量,其控制術語為 {RACE},見圖 1 中藍色框圈中內容。

2.3.2 MS
MS 中每個工作表都與 ISARIC/WHO 核心 CRF 灰色標題一一對應。比如圖 1 中灰色標題為人口學特征(DEMOGRAPHICS)(圖 1 中綠色框圈中內容),在 MS 中相應有一個表單為人口學特征(Demographics)與之對應(圖 2 中紅色框圈中內容)。MS 提供了 CRF 每個字段在 SDTM 中所在域、SDTM 變量及 SDTM 值域(控制術語,如有)、CDASH 變量(如果與 SDTM 變量不同時)及說明。

3 討論
目前,全球 COVID-19 疫情依然嚴峻,仍缺乏有效和安全的治療藥物。因此,各國政府和研究人員均在整合資源開展各類干預措施和疫苗的臨床研究。目前,除計劃開展的試驗外,即便是已注冊的 COVID-19 臨床試驗仍有未開始患者招募、正進行患者篩選或已進入中期階段但未完成的情況,仍會涉及數據的采集、整理和分析。一個標準化數據庫將為此提供良好支撐,TAUG-COVID-19 則提供從數據采集到數據庫建立的指導以支持標準化臨床研究數據庫建設。
TAUG-COVID-19 整合了目前 COVID-19 臨床試驗可能需要采集的數據,就這些數據如何標準化提供了指導,并針對 ISARIC 與 WHO 開發的 COVID-19 核心 CRF 制訂了基于 SDTM 的 aCRF 以及 MS;同時,針對 FDA 法規要求為受 COVID-19 大流行影響的臨床試驗相關數據采集和整理提供了思路及標準化方法。2020 年 9 月 CDISC 針對 COVID-19 研究相關標準的使用情況做了一次調查[16],調查對象包括生物技術、合同研究組織(contract research organization,CRO)、醫療保健、醫藥公司和學術研究等多種利益相關群體,結果發現約 50% 的用戶使用了中斷指南,49% 用戶使用了 COVID-19 臨時用戶指南,而只有 10% 用戶使用了 aCRF。使用 COVID-19-IUG 的主要領域是治療或干預領域(55%),其次是疫苗研究(24%)、診斷性或檢驗類研究為 9%,其他類研究為 12%。知曉 CDISC COVID-19 相關資源比例達到了 93%,且 91% 的用戶對這些資源表示滿意。
TAUG-COVID-19 及其相關標準擴展了 CDISC 基礎標準,并在此基礎上開發了 COVID-19 疾病特異性的內容。此外,對于一些暫時未在 CDISC 標準中進行標準化內容,TAUG-COVID-19 也提供了一些建議和參考,比如使用非標準化變量(non-standard variables,NSVs)及自定義域進行數據收集。采用統一標準收集、保存和提交數據,能促進各個地區乃至全球同類臨床試驗數據的比較、整合、共享與二次分析,為不同試驗數據的合并、分析獲得新的科學思路也提供良好的標準化數據支持。數據標準化是保證數據收集準確性、再現性和完整性的基礎,TAUG-COVID-19 及其相關標準的應用一方面能節約臨床研究資源提高研究效率,另一方面也能提高新藥注冊審批的效率,加快監管決策速度。可以設想,COVID-19 TA 標準及其用戶指南的制訂,既可為其他突發傳染性疾病臨床試驗數據標準的制訂提供借鑒,也可為其他慢性疾病治療領域標準的制訂做出示范。
1 背景
新型冠狀病毒肺炎(coronavirus disease 2019,COVID-19)是一種不同于已有冠狀病毒如嚴重急性呼吸道綜合征(severe acute respiratory syndrome,SARS)和中東呼吸綜合征(middle east respiratory syndrome,MERS)的新型冠狀病毒所致疾病。該病病毒傳播迅速,疫情暴發呈指數增長[1]。2020 年 3 月 11 日,世界衛生組織(world health organization,WHO)評估認定 COVID-19 為大流行病[2]。截至 2021 年 4 月 7 日,WHO 公布全球確診病例已超過 1.3 億,死亡病例超過 286 萬[3]。目前已有多個 COVID-19 疫苗宣布并公布了 Ⅲ 期安慰劑對照臨床試驗的安全性和有效性,其保護效果超過 WHO 在 2020 年初確定的 50% 的最低要求[4]。但在治療方面,瑞德西韋仍是經過美國食品藥品監督管理局(food and drug administration,FDA)有條件批準用于 COVID-19 治療的抗病毒藥物,而其他治療方案諸如地塞米松抗感染治療、免疫抑制藥物治療(如 IL-6 抑制劑、IL-1 抑制劑、干擾素α或干擾素 β、酪氨酸激酶抑制劑等),均未有足夠的臨床證據推薦使用[5,6]。為研發有效安全的 COVID-19 治療藥物,全世界已開展了多個臨床研究,僅美國臨床試驗注冊網(ClinicalTrials.gov)[7]登記的涉及 COVID-19 的臨床研究就有 5 273 項(截至 2021 年 4 月 7 日)。WHO 指出為實現成效最大化,國際社會需要真正意義上的齊心協力和共同協作,其中就包括制訂關于研究數據、病毒和相關技術的共享協議,從而加速治療藥物和疫苗研發工作,同時為超越當前疫情暴發的長期研究和開發奠定基礎[1]。
臨床數據交換標準協會(clinical data interchange standards consortium,CDISC)建立了一系列數據交換標準以支持臨床前及臨床研究數據采集、制表、統計分析、遞交等過程[8]。目前,FDA 和日本藥品與醫療器械管理局(pharmaceuticals and medical devices agency,PMDA)已明確規定新藥臨床研究必須采用 CDISC 標準進行數據遞交[9,10],而我國國家藥品監督管理局藥品審評中心也鼓勵申辦方參照 CDISC 標準遞交臨床試驗數據及相關的申報資料。為更好地促進臨床相關治療領域中臨床研究數據標準化,CDISC 發起并制訂治療領域(therapeutic area,TA)標準。TA 標準是針對特定疾病領域對 CDISC 基礎標準的擴展[11]。鑒于 COVID-19 對公共衛生安全的重要性,CDISC 在 2020 年 3 月份快速成立了一個 COVID-19 研究數據標準化小組,開發、制訂了 COVID-19 TA 標準及其用戶指南,以便研究人員更有效、規范地收集、構建和分析數據,以體現數據的全部價值,推動臨床研究向前發展,并改善全球健康狀況[12]。本文將對 COVID-19 TA 標準用戶指南及其相關標準進行介紹,以期推動其在國內臨床研究中的應用,從而促進在國內開展的各類 COVID-19 相關臨床研究數據的標準化,及不同試驗和隊列數據的再次分析與共享。
2 COVID-19 相關標準的組成
2020 年 4 月 21 日,CDISC 發布了 COVID-19 臨時用戶指南(CDISC interim user guide for COVID-19 v1.0,COVID-19-IUG)、因 COVID-19 暴發而中斷運行的研究指南(以下簡稱為“中斷指南”)及一些為公共衛生研究人員提供的相關資源。其中,針對 WHO 和國際嚴重急性呼吸道與新興感染聯合會(international severe acute respiratory and emerging infection consortium,ISARIC)聯合開發的用來描述 COVID-19 相關臨床特征的數據工具,CDISC 提供了注釋病例報告表(annotated case report form,aCRF)和數據相關映射表格(mapping spreadsheet,MS)用來輔助各個國家公共衛生研究人員進行COVID-19相關研究[12]。2021 年 7 月 8 日,CDISC 更新并發布了 COVID-19 TA 標準(COVID-19 therapeutic area user guide v1.0,TAUG-COVID-19),并增加了針對因 COVID-19 流行而中斷運行的研究的臨時分析數據模型(analysis data model,ADaM)指南和疫苗管理指南(主要包括最小數據元和元數據映射管理,以促進與疫苗接種/管理文件相關的數據收集、存儲、處理和共享)[13]。本文將重點介紹 TAUG-COVID-19、中斷指南和為公共衛生研究人員提供的相關資源。
2.1 COIVID-19 治療領域標準用戶指南
TAUG-COVID-19 共有 15 章,除去第一章(簡介)和最后一章(附件),其余各章均為 COVID-19 臨床研究可能會采集的臨床數據的具體內容。大部分章節都提供了相應章節的解釋(包括為什么需要使用這些領域及如何使用)及研究數據制表模型(study data tabulation model,SDTM)示例(表 1)。

2.2 中斷指南
受 COVID-19 大流行影響,全球很多臨床試驗的訪視、評估和試驗流程無法正常進行,為協助申辦者確保臨床試驗受試者安全、保持良好的臨床操作規范并盡量減少在 COVID-19 突發公共衛生事件期間對試驗數據完整性的風險,美國 FDA 于 2020 年 3 月份發布了《FDA 關于 COVID-19 突發公共衛生事件期間醫療產品臨床試驗實施指南》[15]。申辦者應確認在病例報告表上清楚地報告了受試者未進行訪視、檢查等信息。CDISC 開發、制訂了中斷指南,以幫助受 COVID-19 影響的臨床試驗采集存儲相關數據。其主要內容包括:列出 COVID-19 相關影響作為臨床研究報告(CSR)的一部分,通過概念圖展示臨床試驗與 COVID-19 的關系以及相關數據采集與制表說明與示例。
2.2.1 列出 COVID-19 相關影響作為臨床研究報告的一部分
本節列出了 FDA 指南中的討論要點以及獲取和展示關聯數據的推薦方法。由于每個申辦者收集和管理數據的方式不同,因而無法指定如何收集所有可能的數據;相反,它概述了可能需要收集的數據。例如,有些申辦者在電子數據收集系統中可能有一個標志,以指示何時沒有進行訪視,而其他申辦者可能將其記錄在 CRF 中,還有一些申辦者可能從監查信息中得到。無論采用哪種方式,COVID-19 相關信息都必須包括錯過了哪些訪視以及其原因。
2.2.2 與 COVID-19 的關系
本節主要討論了受試者如何被疾病大流行影響。可能的影響方式有兩種,一是受試者患有大流行性疾病,二是研究活動受到疾病大流行的干擾。另外,本節列出了可用來存儲這些影響的域,也給出了另外一些數據存儲的建議。
2.2.3 相關領域使用說明與示例
見表 2。

2.3 為公共衛生研究人員提供的相關資源
此部分主要包括 2 個文件:根據 ISARIC/WHO 數據采集工具開發的 aCRF 和 MS。
2.3.1 aCRF
基于 CDISC SDTM 標準制訂的 aCRF,針對每個采集的字段,提供的 SDTM 標準變量及相關控制術語(若有,用{}括起來表示),比如種族采用 RACE 變量,其控制術語為 {RACE},見圖 1 中藍色框圈中內容。

2.3.2 MS
MS 中每個工作表都與 ISARIC/WHO 核心 CRF 灰色標題一一對應。比如圖 1 中灰色標題為人口學特征(DEMOGRAPHICS)(圖 1 中綠色框圈中內容),在 MS 中相應有一個表單為人口學特征(Demographics)與之對應(圖 2 中紅色框圈中內容)。MS 提供了 CRF 每個字段在 SDTM 中所在域、SDTM 變量及 SDTM 值域(控制術語,如有)、CDASH 變量(如果與 SDTM 變量不同時)及說明。

3 討論
目前,全球 COVID-19 疫情依然嚴峻,仍缺乏有效和安全的治療藥物。因此,各國政府和研究人員均在整合資源開展各類干預措施和疫苗的臨床研究。目前,除計劃開展的試驗外,即便是已注冊的 COVID-19 臨床試驗仍有未開始患者招募、正進行患者篩選或已進入中期階段但未完成的情況,仍會涉及數據的采集、整理和分析。一個標準化數據庫將為此提供良好支撐,TAUG-COVID-19 則提供從數據采集到數據庫建立的指導以支持標準化臨床研究數據庫建設。
TAUG-COVID-19 整合了目前 COVID-19 臨床試驗可能需要采集的數據,就這些數據如何標準化提供了指導,并針對 ISARIC 與 WHO 開發的 COVID-19 核心 CRF 制訂了基于 SDTM 的 aCRF 以及 MS;同時,針對 FDA 法規要求為受 COVID-19 大流行影響的臨床試驗相關數據采集和整理提供了思路及標準化方法。2020 年 9 月 CDISC 針對 COVID-19 研究相關標準的使用情況做了一次調查[16],調查對象包括生物技術、合同研究組織(contract research organization,CRO)、醫療保健、醫藥公司和學術研究等多種利益相關群體,結果發現約 50% 的用戶使用了中斷指南,49% 用戶使用了 COVID-19 臨時用戶指南,而只有 10% 用戶使用了 aCRF。使用 COVID-19-IUG 的主要領域是治療或干預領域(55%),其次是疫苗研究(24%)、診斷性或檢驗類研究為 9%,其他類研究為 12%。知曉 CDISC COVID-19 相關資源比例達到了 93%,且 91% 的用戶對這些資源表示滿意。
TAUG-COVID-19 及其相關標準擴展了 CDISC 基礎標準,并在此基礎上開發了 COVID-19 疾病特異性的內容。此外,對于一些暫時未在 CDISC 標準中進行標準化內容,TAUG-COVID-19 也提供了一些建議和參考,比如使用非標準化變量(non-standard variables,NSVs)及自定義域進行數據收集。采用統一標準收集、保存和提交數據,能促進各個地區乃至全球同類臨床試驗數據的比較、整合、共享與二次分析,為不同試驗數據的合并、分析獲得新的科學思路也提供良好的標準化數據支持。數據標準化是保證數據收集準確性、再現性和完整性的基礎,TAUG-COVID-19 及其相關標準的應用一方面能節約臨床研究資源提高研究效率,另一方面也能提高新藥注冊審批的效率,加快監管決策速度。可以設想,COVID-19 TA 標準及其用戶指南的制訂,既可為其他突發傳染性疾病臨床試驗數據標準的制訂提供借鑒,也可為其他慢性疾病治療領域標準的制訂做出示范。