臨床試驗是科學評價藥物療效和安全性最可靠的方法,是醫藥創新產業發展中最為關鍵且投資最多的環節。近年來,國家制定了一系列鼓勵醫藥創新發展的政策及指導原則,推動了我國自主醫藥創新產業發展及臨床試驗能力提升。為進一步提高我國研究人員開展臨床試驗的能力,國家心血管病中心、中國醫學科學院阜外醫院國家心血管疾病臨床醫學研究中心組織臨床試驗方法學、臨床試驗監管等多學科領域專家,針對普遍存在疑問和模糊認識的受試者入選、受試者保留、研究終點選擇、研究質量控制、信息技術應用及數據安全倫理等臨床試驗關鍵環節中的問題,結合國內外相關的指導原則及最新的研究進展,綜合國內專家的建議和意見,共同制定本共識,旨在為廣大臨床試驗研究者提供參考和指導,并為相關部門制定臨床試驗管理政策提供依據。
引用本文: 國家心血管病中心中國醫學科學院阜外醫院藥物臨床試驗設計與實施中疑難問題處理的專家共識組,中華醫學會心血管病學分會心血管病臨床研究學組. 藥物臨床試驗設計與實施中疑難問題處理的專家共識. 中國循證醫學雜志, 2022, 22(3): 249-260. doi: 10.7507/1672-2531.202109156 復制
1 前言
臨床試驗是科學評價藥物療效和安全性最可靠的方法,為藥物上市和臨床循證決策提供堅實的科學依據,是醫藥創新產業中最為關鍵且投資最多的環節。近年來,隨著鼓勵醫藥創新產業發展政策的出臺,我國自主醫藥的創新產業取得了快速發展,并且已開始走向國際市場。國家藥品監督管理局也發布了一系列技術指導原則,旨在提升臨床試驗能力,規范臨床試驗活動。與此同時,面對臨床試驗費用、時間成本日益高昂的現狀,優化臨床試驗的設計和實施過程,完善監管和質控措施,在保證結果可靠的前提下,提高試驗的成本效益,是當下亟待解決的主要難題。此外,倫理批準是臨床試驗實施的前提條件,數據安全和相關的醫學倫理問題日益受到重視。
為進一步提高我國研究人員開展臨床試驗的能力,針對臨床試驗關鍵環節的普遍疑問和模糊認識,國家心血管病中心、中國醫學科學院阜外醫院國家心血管疾病臨床醫學研究中心組織臨床試驗方法學、臨床試驗監管、心血管病學和腫瘤病學等領域專家共同制定此共識,涵蓋受試者入選、受試者保留、研究終點選擇、研究質量控制、信息技術應用和數據安全倫理等方面,旨在為廣大臨床試驗研究者提供參考和指導。
2 提升受試者的多樣性
受試者入選是臨床試驗正式開始的重要標志之一,如何盡可能納入更廣泛多樣的獲益群體,保證入選的受試者充分代表上市后的使用人群,是臨床試驗設計中的一個重要問題。臨床試驗往往被認為會排除或較少入選某些特定亞組人群,例如高齡、合并肝腎功能不全或女性等,因而難以獲得候選藥物在這些特定人群中的療效評價證據。提升受試者的多樣性,納入更為廣泛的適應證人群,有助于更好地評估候選藥物在特定亞組人群中的療效和安全性。美國食品藥品監督管理局于2020年11月發布了“改善臨床試驗人群的多樣性—入選標準、招募措施和試驗設計的行業指南”[1],該指南提倡臨床試驗申請人擴大受試者的合格標準,避免不必要地將特定亞組人群排除在外。我國目前尚沒有針對如何提升受試者多樣性的指導原則。本共識將從受試者入選標準的制定、受試者相關因素和監管機構因素3個方面進行闡述,為提升受試者多樣性提供建議舉措,以期為我國的臨床試驗研究者提供參考指導。
2.1 適當拓寬入選標準,避免不必要的排除標準
在制定入選標準時,研究者應考慮臨床實踐中可能使用該藥物的患者的多樣性,包括年齡、性別等特征,適當擴大入選標準可在一定程度上提高臨床試驗結果的可推廣性[1],也可考慮采用適應性設計(adaptive design,詳見本文“5適應性設計及其應用”),在獲得更多安全性數據后,擴展到更大人群范圍[2]。證據充分時,確證性臨床試驗不必限于成人人群,可考慮同時納入兒童和青少年,甚至妊娠婦女。
在制定排除標準時,在確保受試者的安全和實現研究目標的前提下,應評估每條標準是否都確有必要,并剔除或修改非必要的排除標準,例如器官功能障礙較輕但可耐受試驗藥物,且有較大可能從試驗中獲益的受試者人群。通過早期臨床試驗[1],分析不同受試者人群的藥物代謝特征,例如老年人和肝腎功能障礙者,能夠為后期臨床試驗中是否有必要排除某些受試者提供客觀依據,也可為不同受試者人群中的劑量優化方案提供參考依據。
對于某些臨床試驗類型,放寬入選標準十分重要。在富集(enrichment)適應性設計的臨床試驗中(詳見本文“適應性設計的主要類型和注意事項”),應盡可能設定更為廣泛的入選標準,避免排除某些特定的受試者人群。富集是指前瞻性地使用特定的臨床或生物學特征篩選受試者人群,使得在該人群中檢測到藥物效應(如果確實存在藥物效應)的可能性比未選擇人群中更大。合理地放寬入選標準能夠從更廣泛人群中篩選出更多潛在的獲益群體。此外,由于受試者數量十分有限,對于罕見病的臨床試驗,避免入選標準過嚴,保證受試者最大限度地參與亦十分重要。在很有限的情況下,如果不存在非預期安全性問題,且早期試驗用藥并不改變疾病進程,可考慮將已參加過早期安全性試驗的受試者再次納入到療效性探索或確證性試驗中[1]。
2.2 受試者相關因素
研究者應考慮采取包容性的入選措施,幫助易被忽視和較少被納入的亞組人群參加臨床試驗。可與社區、患者權益組織等建立聯系,獲得其協助,以更好地理解潛在受試者的需求,從而有針對性地調整入選措施[3]。在研究中心的選擇上,可考慮少數族裔或少數民族等聚居區附近的醫院[4]。在工作人員的選擇上,考慮不同的文化背景和語言差異,招募多元文化背景的工作人員幫助有語言溝通障礙的受試者參加。
在運行過程中,研究者可考慮采取措施減輕受試者負擔,從而讓更多受試者愿意參與臨床試驗,在一定程度上有助于改善受試者的多樣性[5]。例如調整隨訪間隔時間或時間窗,或采取電話、郵件或視頻等方式來替代面對面訪視,特殊情況也可考慮由研究人員去受試者家中訪視。對于罕見病患者,由于地理分布上較分散,疾病本身也可能不同程度地影響其出行,研究人員需要付出更多努力保證受試者的入選。也可考慮在試驗結束后進行開放標簽,使安慰劑組患者也能獲得活性研究藥物,從而鼓勵更多受試者參加臨床試驗。
2.3 監管機構相關因素
監管機構的指南或政策文件,有助于引導研究者或申辦者在臨床試驗設計和實施時提高臨床試驗入選人群的多樣性,充分考慮各國人群和候選藥物潛在適用人群的年齡、性別、種族等特征,提前制定好計劃,招募具有不同人口學特征的受試者,尤其是常常被忽視和較少納入的一些亞組人群,如少數族裔和老年人群等。要求使用統一的人口學變量格式和定義,便于對不同研究的數據進行匯總分析,也便于對不同研究的結果進行比較。此外,監管機構要求報告不同人口學特征亞組人群的療效和安全性結果,可更全面地反映候選藥物的療效和安全性[6]。
此外,監管機構還可設置專門的促進受試者多樣性的部門,采取多種措施,如制作臨床試驗科普材料、通過多媒體宣傳臨床試驗參與的重要性等,提高廣大人群對臨床試驗的認識,幫助被忽視的群體參與臨床試驗[5,7]。
綜上所述,適當拓寬入選標準、采取更具包容性的入組措施和一些監管措施,能夠提高受試者對藥物適用目標人群的代表性,幫助醫生了解藥物針對更大范圍人群的安全性和有效性,使更多群體獲益。
3 受試者失訪與剔除
在臨床試驗的實施過程中,難免會出現受試者的失訪、違背納入與排除標準和依從性差等問題。失訪率高或不恰當地處理相關數據都會嚴重影響試驗結果的可靠性。研究者必須考慮在設計和實施階段采取措施減少受試者的失訪,并謹慎處理失訪者的數據。對于很多研究者而言,這些問題仍然是較大的挑戰。在面對違背納入排除標準、違背方案合并用藥、錯誤分組、依從性差等情況時,如何進行受試者剔除(excluding patients from analysis)也是較為棘手的問題。
3.1 失訪處理
失訪(loss to follow- up)是指受試者在臨床試驗過程中由于各種原因沒有按預定方案完成隨訪,研究者未能獲得其隨訪數據,屬于脫落(drop out)的一種情況。隨著脫落率升高,試驗結果的準確性下降。
如前所述(本文“受試者相關因素”),研究者應該在設計階段考慮受試者參加臨床試驗可能存在的困難,采取合理措施,以減少失訪的風險。常見的失訪原因包括受試者搬遷、失去聯系、發生藥物不良反應等。受試者失去聯系是導致失訪的常見原因之一。在發生失訪時,研究者應該采取補救措施盡可能獲得隨訪數據。為避免受試者失去聯系,簽署知情同意書時,在征得受試者及其家屬同意的情況下,應盡可能留下多個受試者親屬(特別是不與受試者同住的親屬)的聯系方式。當受試者搬遷時,可通過上門訪問等方法盡最大可能獲得隨訪數據。對于因藥物不良反應導致的失訪,應盡可能與受試者及其家屬取得聯系。一方面,需要詳細收集記錄不良反應的程度和分類、與試驗藥物的相關性、起止時間和轉歸,并按照研究方案、醫療規范及時妥善處理;另一方面,應取得受試者及家屬理解,受試者發生不良反應而無法耐受治療時可停止研究治療,但仍需按照研究方案的要求完成完整隨訪。
常用缺失值處理方法有:末次觀測值結轉、基線觀測值結轉、均值填補、回歸填補、多重填補、最差值填補及臨界點法。對于失訪造成的主要療效指標的缺失,應將方案和統計分析計劃中事先規定的數據填補方法作為主分析方法進行處理[8,9],并將上述其余填補方法作為敏感性分析方法。如果敏感性分析結果與主分析結果一致,說明結果可靠。一般來說,缺失數據的處理方法應遵循保守療效估計的原則。
3.2 受試者剔除
在臨床試驗中,可能發生違反納入排除標準、違反方案規定的合并用藥、交叉治療、依從性差等情況,不能簡單予以剔除。應遵循方案中事先規定的受試者剔除原則,確定統計分析數據集。受試者剔除標準需要在試驗數據庫鎖定之前制定。對于剔除的每一位受試者,都需要給出詳細的理由。定義分析數據集時遵循2個原則[9]:① 盡可能減少偏倚;② 防止增加Ⅰ類錯誤概率。一般情況下,對于優效試驗,意向性治療(intention-to-treat,ITT)是數據分析的基本原則,要求將所有隨機化的受試者按照隨機分配的組別進行分析,不考慮受試者實際接受了何種治療,也不考慮是否違背方案或失訪。遵循ITT原則對療效的估計是最保守的,要求對所有隨機化受試者完成隨訪以獲得研究結局。這在實踐中有時難以達到,只能獲得盡可能接近符合意向性治療原則的理想受試者集—全分析集(full analysis set,FAS)。FAS僅在非常有限的情況下才可剔除已經隨機化的受試者,通常包括:違反重要入選標準、受試者未接受試驗用藥物的治療、隨機化后無任何觀測數據等。需要強調的是,剔除每一位受試者都需要對剔除的合理性進行充分論證,并事先說明。其他常用的分析數據集還包括符合方案集(per protocol set,PPS)和安全性分析集(safety set,SS)等。PPS納入的受試者需要有較好的方案依從性,需要完成事先設定的試驗藥物的最小暴露劑量,主要指標的數據均可獲得,且沒有重大違背試驗方案。隨機化后至少接受一次治療且有安全性評價數據的受試者均應納入SS。
對每一位從統計分析數據集中排除的受試者,都應該在盲態審核時闡明理由,并在揭盲之前以文件形式寫明。根據不同的研究目的,需要在臨床研究方案和統計分析計劃中明確描述3個數據集的定義,同時明確定義違背方案、脫落或缺失數據的處理方法。在優效試驗中,應采用ITT/FAS作為主要分析數據集;在等效或非劣效試驗中,如果試驗質量欠佳,發生較多失訪、退出、替代治療或組間交叉等問題,可能會縮小組間療效差異,此時采用ITT/FAS容易得出假陰性結論,需要同時采用ITT/FAS和PPS分析。兩個數據集結論一致時可增加試驗結果的可信度。如果結論不一致,可能存在偏倚,應分析并合理解釋出現不一致的原因。
3.3 在設計階段提高受試者依從性,減少失訪和受試者剔除
出現失訪或需要將受試者從統計分析數據集中剔除,都是比較被動的局面,更為明智的做法是,從研究設計階段即充分考慮受試者依從性和研究質量問題,制定合適的措施提高受試者的依從性,例如:① 在隨機之前排除可能搬遷或不依從的受試者;② 盡量使干預措施簡單且易于實施;③ 采用易于測量的指標,提高依從性;④ 設計合理的隨訪頻次。此外,在研究實施過程中,研究者與受試者應建立良好的人際關系,研究者應始終關注受試者,及時處理實施過程中發現的問題。通過科學嚴謹的設計、規范高效的實施,盡可能降低受試者的失訪率,提高隨訪質量,將盡可能多的受試者納入統計分析數據集,獲得真實準確可靠的臨床試驗結果。
4 研究終點和多終點設計
研究終點是評價藥物療效的關鍵指標,設定多個研究終點在臨床試驗并不少見。對于Ⅰ/Ⅱ期臨床試驗,多終點十分常見,但是由于是探索性研究,樣本量估計時可不考慮對Ⅰ/Ⅱ類錯誤的控制。對于Ⅲ期確證性研究,雙終點和多終點的應用亦較常見,能夠增加試驗效率[10-11],但須注意遵循相應的原則。下面將重點介紹臨床試驗研究終點的定義、分類和選擇原則,并以抗腫瘤新藥臨床試驗為例,闡述臨床試驗多終點的設計考量要點。
4.1 臨床試驗的研究終點
4.1.1 定義
研究終點是可通過客觀測量并輔助研究者決定是否接受或拒絕無效假設(兩種治療方法或策略之間在研究終點上沒有統計學意義的顯著差異,H0)的一個重要指標;在特定時限內的臨床試驗中,研究終點是指對臨床結局的觀測與評價,包括生存期、生活質量/臨床癥狀等。
4.1.2 分類
基于臨床獲益的價值,可分為:① 臨床終點(clinical endpoint),直接代表最重要的臨床獲益,即延長生存,改善癥狀和生活質量,主要用于常規批準新藥上市(traditional approval,TA)。② 替代終點(surrogate endpoint),可用于加速批準(accelerated approval,AA),包括兩大類,一是間接代表臨床獲益且經過驗證與臨床終點相關的替代終點,二是未經驗證但很可能預測臨床獲益的替代終點。
基于需回答的研究問題的重要性,可分為:① 主要終點(primary endpoint):是指與臨床試驗所關注的主要問題(主要研究目的)直接相關的,能夠提供最具臨床意義和令人信服證據的研究終點,樣本量計算和評價試驗是否達到主要目的都是基于主要終點。② 次要終點(secondary endpoint):一般為多個,可包括關鍵次要終點(與主要終點共同納入Ⅰ類錯誤控制,用于支持藥物說明書聲稱的獲益)。③ 探索性研究終點:一般與藥物療效預測標志物或者試驗藥物引起的機體變化有關。
基于依據來源,以抗腫瘤藥物臨床試驗的研究終點為例,可分為:① 生存相關研究終點。描述死亡事件的終點:如OS(overall survival,總生存,從治療開始或隨機至死亡的時間)和OS率(特定時間段內生存患者占試驗剛開始時總患者數的比例)等。基于腫瘤測量的終點:包括ORR(objective response rate,客觀緩解率,治療后達到完全緩解或者部分緩解的受試者占試驗剛開始時總患者數的比例),DCR(disease control rate,疾病控制率,治療后達到完全緩解或部分緩解及疾病穩定的受試者占試驗剛開始時總患者數的比例),DoR(duration of response,療效持續時間,治療后達到完全緩解或部分緩解的患者,從首次評估有效到疾病進展或死亡時間),PFS(progression free survival,無進展生存,從治療開始或隨機入組至疾病進展或死亡的時間),DFS(disease free survival,無復發生存,從隨機入組到疾病復發或任何原因導致死亡的時間),EFS(event free survival,無事件生存,從隨機入組到疾病復發或任何原因導致死亡的時間)等。如以腫瘤測量相關研究終點為唯一療效指標,藥物上市批準前可能需要評價臨床終點如OS的臨床試驗驗證。② 生活質量相關研究終點:主要為癥狀評估終點,包括癥狀減輕或緩解時間、生活質量(quality of life,QoL)和癌癥癥狀進展時間(time to progression of cancer symptoms,TTP)和患者報告結果(patient report outcome,PRO,即直接來自于患者對自身健康狀況、功能狀態及治療感受的報告,不包括醫護人員及其他任何人員的說明)。需要注意的是,包含生活質量的復合癥狀終點中的不同癥狀指標應具有相似的臨床重要性,其臨床獲益不僅歸因于單個指標的改善,對此類復合癥狀終點進行分析時應包含對具體單個指標的分析[12]。
4.1.3 臨床終點的選擇
① 必要條件:具有臨床意義且與疾病過程相關,例如PFS是用于評估藥物能否延遲疾病進展;能夠回答試驗的主要問題,例如DFS是用于評估治療是否延遲復發);終點事件發生頻率足夠高,使研究具有足夠的統計能力,例如OS適用于生存期短的人群,心血管疾病的臨床試驗通常選擇主要不良心血管事件(major adverse cardiac event,MACE)、心血管死亡或者全因死亡等硬終點指標。② 評估優化:若結果存在偏倚或不確定性,需要通過統計學方法優化;需考慮是否計劃加速審批,如ORR、PFS等終點均有可能支持加速審批。③ 如計劃在一個研究中回答多個臨床問題,應考慮選擇多終點。
4.2 臨床試驗多終點
臨床試驗多終點是指一項研究中同時設置可能代表試驗藥物臨床獲益的多個指標作為研究終點。臨床試驗多終點會產生多重性問題(multiplicity issues),即在一項完整的臨床研究中,需要經過不只一次的統計推斷(多重檢驗)得出研究結論的相關問題[13]。常用的臨床試驗多終點包括以下3類:① 共同主要終點(co-primary endpoint):要求2個或以上不同的主要終點均有統計學顯著意義時才認為研究藥物具有療效。② 多終點(multiple endpoint):評估幾個主要終點,其中至少一個具有治療效果就能確定臨床獲益。③ 復合終點(composite endpoint):將多個臨床相關結局合并為一個單一變量,抗腫瘤藥物的臨床試驗中常用PFS、DFS、EFS等復合終點;心血管疾病的臨床試驗中常用MACE作為復合終點。
臨床試驗多終點的使用場景及統計分析注意事項。確證性臨床試驗中:單一主要終點較為常見,但某些情況下會涉及多個主要終點,包括共同主要終點和多終點兩類,前者要求多個主要終點均具有統計學意義,后者則是多個主要終點中至少一個有統計學意義就認為研究藥物有效。二者在進行方案的統計學設計時需要注意Ⅰ類錯誤和Ⅱ類錯誤膨脹問題。① 共同主要終點:會增大Ⅱ類錯誤發生率,從而降低檢驗效能。檢驗效能降低的程度與主要終點的個數和主要終點之間的相關性有關,個數越多、相關性越弱,檢驗效能降低的幅度越大。② 多終點:會增加Ⅰ類錯誤發生率,需要采取適當的策略和方法控制總的Ⅰ類錯誤率(family-wise error rate,FWER),如進行多重性調整。可通過統計學方法的α分配和/或α傳遞來管理Ⅰ類錯誤,如:平行策略(Bonferroni法、前瞻性α分配法),序貫策略(Holm法、Hochberg法、固定順序法、回退法),分階段的整體決策策略(較經典的α分割方法有Pocock法、O’Brien-Fleming法和Haybittle-Peto法)等[10,14]。在非確證性臨床試驗中:主要終點為多個的情況較常見,不需要統計學假設,不需考慮Ⅰ類和Ⅱ類錯誤的膨脹問題。
4.3 臨床試驗多終點的選擇
臨床試驗多終點在抗腫瘤新藥研發領域更為多見,因而以此為例說明多終點選擇需要考量的要點。首先,最常見的抗腫瘤新藥確證性研究的多終點選擇為PFS和OS,如果設定共同主要終點,PFS和OS終點必須同時達到,臨床試驗的樣本量估算按照OS的統計學假設來計算;部分研究設計以PFS和OS作為多終點,兩個終點達到其一即為研究成功,需要進行多重性調整,可通過分配或者傳遞α值來減少Ⅰ類錯誤。
目前抗腫瘤新藥臨床試驗常用到籃式設計(一種疾病多個藥物)、傘式設計(同種藥物多個疾病)和平臺設計(多種藥物、多個疾病)等復雜設計方案,如果子研究是獨立研究,且回答各自的臨床問題,比如針對不同的腫瘤或者目標人群等,則無需進行多重性調整。
在臨床試驗方案和統計分析計劃中,應事先明確多重性問題和多重性調整的策略和方法,并鼓勵在設計階段與監管機構充分溝通。同時,若在臨床試驗過程中進行調整,亦應與監管機構及時溝通。
5 適應性設計及其應用
隨著創新藥物尤其是抗腫瘤新藥的不斷涌現,臨床試驗設計的要求不斷提高,尤其是很多新靶點的制劑或免疫制劑具有獨特的藥理特點,例如劑量-反應關系不唯一、延遲毒性和延遲有效性等,為探索藥物的安全性和有效性帶來了巨大挑戰。與此同時,Ⅰ期、Ⅱ期和Ⅲ期臨床試驗的邊界越來越模糊,創新試驗模式往往提倡各階段的融合,以提高數據利用度并加快藥物的研發進程。
適應性設計是一類創新性的臨床試驗設計,是指按照預先設定的計劃,在期中分析時使用試驗期間累計的數據對試驗設計的一個或多個方面做出相應修改的臨床試驗設計,修改的內容和目的包括:修正初始設計的偏差,提高研究的統計學效能,使試驗更加符合倫理學要求;增加研究的外推性和可解釋性,提高試驗效率,降低時間和成本投入[2,15]。
近年來,臨床試驗研究者、藥物研發企業和監督管理機構對適應性設計的臨床試驗給予極大關注,各國政府監管機構陸續出臺適應性設計的相關指導原則,例如美國食品藥品監督管理局于2019年發布了《藥物和生物制品臨床試驗適應性設計行業指南》,我國國家藥品監督管理局亦于2021年發布了《藥物臨床試驗適應性設計指導原則(試行)》。盡管如此,很多研究者對適應性設計的應用原則、范圍和注意事項仍缺少充分地了解和認識,本共識將主要針對上述問題進行闡述。
5.1 適應性設計的原則
適應性設計既可用于探索性臨床試驗,亦可用于確證性臨床試驗。在選擇使用適應性臨床試驗之前,需要考慮以下4項基本的應用原則:① 在期中分析階段進行的方案修改需要在原始方案中預先設定,而非臨時提出,原始方案中應該明確說明期中分析的時間、次數、適應性設計的類型、所使用的統計方法及期中分析目的等;② 嚴格和充分控制Ⅰ類錯誤在合理水平(例如,雙側檢驗水平為0.05);③ 選擇準確的效應估計方法,減少偏倚的引入,確保結果的可靠;④ 避免期中分析的結果泄露從而影響研究后續操作和受試者入組,保證臨床試驗的完整性。期中分析或方案調整應由獨立的數據監察委員會(independent data monitoring committee,IDMC)執行,以保證申辦方和研究者處于盲態。有關IDMC的更多內容,可參閱《藥物臨床試驗的生物統計學指導原則》等。
5.2 適應性設計的主要類型和注意事項
適應性設計可體現在研究設計的多個環節,下面簡述不同的適應性設計類型及其需要注意的問題:
① 成組序貫設計(adaptive group sequential design):預先計劃在試驗中進行一次或者多次期中分析(interim analysis),根據每次期中分析的結果做出后續的試驗決策。期中分析的時間點一般基于累計數據的占比(如受試者入組比例或發生目標事件數的比例等),期中分析的次數、時間點及I類錯誤調整方法需要在試驗方案中給予明確規定,在試驗實施過程中嚴格按照方案執行,不可隨意進行計劃外的期中分析,以確保整個試驗的科學性和完整性。如果存在以優效性提前終止試驗的可能,選擇時間點時應考慮期中分析時的信息量是否可提供足夠的檢驗效能。
② 樣本量再估計(sample size re-estimation):根據預先設定的期中分析,利用累計的試驗數據重新估算樣本量,以保證在可容許的Ⅰ類錯誤概率范圍內達到預先設定的目標。同時需要注意:如果重新估算得到的樣本量比原樣本量大,那么接下來的研究中采用新樣本量;否則仍使用最初估計的樣本量。
③ Ⅰ/Ⅱ期或者Ⅱ/Ⅲ期無縫設計(phase Ⅰ/Ⅱ,Ⅱ/Ⅲ two stage seamless design):無縫設計是將傳統的兩個獨立的臨床試驗階段,整合為一個試驗的2個階段,將前一階段臨床試驗結束時的分析作為期中分析,并據此進行后期試驗的設計或者劑量選擇。無縫設計可縮短臨床試驗周期,在保證一定的檢驗功效的前提下,使用相對較少的樣本量達到兩期試驗的目的。其中,Ⅱ期試驗結果會影響后續Ⅲ期試驗的Ⅱ/Ⅲ期無縫設計,需要在研究設計中事先設定自適應相關內容,使最終分析可使用Ⅱ/Ⅲ期研究中的全部數據,尤其需要控制試驗的總體Ⅰ類錯誤率,應使用適當的統計學方法來防止Ⅰ類錯誤膨脹,常用的有Fisher組合檢驗法及序貫設計方法等。
④ 適應性富集設計(adaptive enrichment):根據試驗的前期結果分析哪些對象最可能獲益,在后續試驗中增加其入組比例,從而達到放大治療效果、避免更多受試者暴露于可能的毒副作用的目的,同時也提高了試驗效率。例如根據研究適應證不同,使用實踐經驗、病理學特征、基因組學特征或者其他研究經驗等方法來確定受試者類型等。例如基于標記物的最優序貫富集設計(optimal sequential enrichment design,OSED),首先對陽性生物標記物亞組進行兩階段設計,在確定藥物對陽性生物標記物亞組有效之后,對陰性標記物亞組進行兩階段設計,該設計的期中決策準則是通過最大化一個特定的效用函數,并同時控制Ⅰ和Ⅱ類錯誤而得到。
⑤ 適應性主方案試驗設計(master protocol with adaptive design):指方案中包含多個子方案,如籃式設計(一種疾病多個藥物)、傘式設計(同種藥物多個疾病)、平臺設計(多種藥物,多個疾病)等。在籃式設計的臨床試驗中,評估藥效的兩種常用方法是匯集分析和獨立分析。匯集分析有助于提高統計檢驗功效,但當試驗藥物在不同的籃子中的療效有差異時,該方法將導致嚴重的估計偏倚和Ⅰ類錯誤率膨脹。而獨立分析僅使用每個籃子的數據獨立評估試驗藥物在此籃子中的療效,在籃子之間并不進行任何信息借用,因此避免了估計偏倚和Ⅰ類錯誤膨脹問題,但由于每個籃子的樣本量有限,往往缺乏足夠的檢驗效能。考慮到不同籃子間異質性,可利用試驗中觀測到的數據自適應地在籃子之間借用信息,包括:兩階段籃子設計、貝葉斯分層模型籃子設計、校準貝葉斯分層模型的籃子設計及潛在亞組籃子設計等。平臺研究的適應性設計方法主要有MIDAS(multi-candidate iterative design with adaptive selection)貝葉斯Ⅱ期臨床試驗設計方法,允許以高效、無縫的方式持續篩選大量候選藥物,只需要一個主方案和一個對照組,有利于簡化試驗過程,降低新藥研發成本。
⑥ 適應性標志物設計(biomarker-adaptive design):根據臨床試驗進行過程中探索的分子標志物進行后續臨床試驗入組人群篩選的設計。常用的設計方法有標志物策略設計(marker-strategy design,MSD),是用于識別和驗證預測標志物的設計。還有標志物分層設計(marker-stratified design,MSTD)是根據標志物陽性或陰性對受試者進行分層,然后在每一層內將受試者隨機分配到對照組或試驗組進行治療。其他還有最優標志物自適應設計等。
⑦ 適應性劑量遞增(adaptive dose escalation):在I期試驗中根據前期爬坡劑量的結果進行后續劑量選擇的方法,主要用于確定試驗藥物的最大耐受劑量和劑量限制性毒性,常用的設計方法包括貝葉斯基于算法的Rolling6設計,基于模型的TITE-CRM設計、DA-CRM設計、TITE-BOIN設計、TITE-Keyboard設計、Simon兩階段設計等。
⑧ 多重適應性設計(multiple adaptive design):一個試驗中采用大于一種適應性方法的方案設計,此時應注意控制概率Ⅰ類錯誤。
其他適應性設計的方法還包括:適應性治療轉換(adaptive treatment-switching),無效藥物剔除設計(drop-the-loser design),假設性自適應設計(adaptive-hypothesis design),多臂多階段(multi-arm multi-stage)設計等。
5.3 其他考量
設計適應性臨床試驗需要結合實際情況考慮下列問題。首先,原則上一般不允許在試驗進行過程中進行非預設的變更,但在臨床試驗的操作實踐中,基于試驗過程中產生的數據提示需要進行非預先設定的修改時,應經過謹慎考慮后,在保證不破壞合理性、完整性和可行性的前提下做出修改,并需要提前與監管機構進行溝通確認。第二,適應性設計通常會與先進的統計學方法和科學技術相結合,例如貝葉斯方法、新穎替代終點指標及模擬技術等,操作更復雜,通常需要更高的臨床試驗實施質量保駕護航。研究者需要充分考慮獲取的信息量、受試者招募速度、研究者的理解程度和時間成本等因素,如果適應性設計獲取的信息少于傳統設計,則可能導致入選進度變慢、納入的受試者特征發生改變、或因試驗設計過于復雜,導致研究質量受到嚴重影響,此時選擇適應性試驗設計應該謹慎。
此外,要注意的是,基于外部數據對進行中的臨床試驗做出的修改通常不屬于適應性設計,例如同一類藥物剛完成的試驗顯示某主要終點的選擇不合適,或新發布的相應指南對主要終點另有定義,需要修改主要終點;新的標準治療的改變,需要修改標準治療的對照組,或因無法繼續入組患者而需要提前終止試驗等。
總之,適應性設計由于其靈活的特點,能夠節約研發成本和投入時間,在某些情況下也更加符合倫理要求,因而相關的研究應用日趨廣泛,但是適應性設計較傳統臨床試驗更為復雜,對研究運行質量的要求更高,且無法彌補試驗中已經存在的缺陷,因此在設計、實施和管理中要更為謹慎。
6 大規模試驗應采用簡單易行的運行和質控方式
在心血管疾病等慢病領域,評價藥物對重要臨床結局的影響往往需要開展大規模的臨床試驗反復驗證,入選超過數千例受試者,隨訪數年[16-17]。大規模是結論可靠的重要保障,唯有采用簡單易行的操作方式,才能實現[18]。大規模與小規模臨床試驗存在的質量風險不盡相同,應結合其特點采用針對性的運行管理方法與質控措施。首先,大規模臨床試驗應采用易于確定且重要的臨床終點,例如死亡、心肌梗死等,其作為客觀指標判斷依據明確,基于受試者的報告很少會發生遺漏。其次,由臨床事件委員會(clinical event committee,CEC)按照統一的標準對可能的終點事件進行中心性判定,誤判的可能性會降到最低。再次,試驗采用雙盲設計,且樣本量足夠大,個別受試者數據記錄的偏差并不會影響研究結論。相反,如果操作過于復雜,研究規模不足,可能對研究結論造成致命性影響。簡單易行意味著在設計和運行方面簡單易行,緊抓決定臨床試驗質量的關鍵環節,避免讓非必需內容徒增成本和復雜性。因此,簡單易行的方式不是犧牲研究質量,而是為更好地保障研究結論的科學性。
近20年來,全球臨床試驗的領軍機構之一英國牛津大學在SHARP[19]、HPS-THRIVE[20]、REVEAL[21]和EMPA-KIDNEY等一系列國際多中心大規模藥物臨床試驗中發展了簡單易行(streamlining)的運行質控方式,并不斷完善,已得到美國食品藥品監督管理局等國際權威機構的認可,代表了未來臨床試驗方法學的重要趨勢。鑒于此,我們對簡單易行的質控運行方式的核心環節進行簡介。
6.1 研究數據采集
完善的電子數據采集系統(electronic data capture,EDC)是大規模臨床試驗以簡單易行方式運行的重要基礎。EDC系統應界面友好,只采集必要的數據,研究數據主要來自于詳細且結構化的受試者訪視,以及本地和中心實驗室結果,不使用紙質的病例報告表(case report form,CRF)。在大規模的臨床試驗中,受試者是最直接的數據來源,因為其能夠報告所有的醫學情況,也包括不良事件(adverse event,AE)和終點事件。在長達數年的隨訪中,受試者可能在不同的醫院接受診療,研究者僅依靠本院的病歷系統未必能完全了解受試者的所有就醫信息,所以只有受試者能夠提供本人最新的健康和用藥信息。在每次隨訪時,研究者收集受試者的所有住院和任何其他不良事件的詳細信息,并特別詢問因藥物導致的嚴重不良事件。研究者直接將來自于受試者報告的信息/數據錄入到EDC中(對于難以從受試者本人處獲得的信息/數據,也可從親屬或者其他醫生處獲得)。此外,針對任何不可信或不一致的數值或回答,電子系統中將自動彈出消息予以警示,解決該問題后數據才能保存。這些措施有助于確保數據的質量。
基于前面所述的理由,即使受試者忘記而漏報少量的事件也不會影響研究結果的可靠性[22]。因此,此類試驗實施過程中,可不要求研究者定期查閱紙質或者電子版的醫院記錄來發現不良事件,反而是基于電子化的研究數據的中心性監查可有效幫助、及時發現潛在的問題。
6.2 基于風險的監查
在簡單易行的運行方式中,基于風險的監查(risk based monitoring,RBM)方法是提高數據質量和保證受試者安全的重要手段[22]。基于風險的監查需要結合研究設計的復雜程度,包括終點類型、研究人群的復雜性、試驗藥物的安全性等因素,全面評估可能影響臨床試驗質量和受試者安全的風險,針對關鍵的風險進行監查。
監查可采用中心化遠程監查與現場監查相結合的方式進行。中心化監查是保證研究質量的最主要手段。EDC除了提供實時的CRF信息之外,還能夠同時記錄研究者數據采集等操作的相關信息。基于電子化的研究數據,建立研究管理系統,進行中心性的數據分析,有助于及時發現傳統的現場監查難以發現的問題。利用中心性監查能夠識別明顯偏離平均水平的研究中心,發現訪視問卷完成耗時過短、訪視問卷集中于非正常訪視時間完成等異常現象,這些現象提示數據質量可能存在問題,從而為針對性監查提供線索。基于實時數據分析的中心化監查可發現90%的重要問題[22],其效力遠遠大于現場監察。
現場監查作為中心化監查的補充,可核實中心化監查發現的疑點或到現場檢查必要的記錄,幫助研究者解決研究中出現的問題,必要時對其提供額外的針對性培訓。在可能的情況下,經受試者同意,監查員可觀察受試者訪視的過程。通過現場監查,監查員可根據研究需要隨機抽檢各種記錄,但視研究的規模和具體情況而定,不一定需要常規檢查病歷以發現漏報的不良事件、嚴重不良事件或其他研究終點。中心化監查的結果可用于指導現場監查的時間和性質。
6.3 源文件歸檔
源文件指臨床試驗中產生的原始記錄、文件和數據。在簡單易行的臨床試驗中,電子CRF以電子數據方式將受試者的回答記錄保存于服務器,便于核查,其中包括依從性評估、受試者報告終點事件、不良事件和研究藥物發放記錄等。電子CRF的記錄方式與門診病歷記錄一樣,完成后導出打印,可作為門診病歷歸檔,遵循《藥物臨床試驗質量管理規范(2020)》關于“以患者為受試者的臨床試驗,相關的醫療記錄應當載入門診或者住院病歷系統”的要求[8]。此外,研究的源文件還包括當地或中心實驗室分析結果,不良事件(AEs)的相關支持性資料等。
總而言之,采用簡單易行的運行管理及質量控制方式,確保試驗質量,是未來大規模臨床試驗發展的趨勢。在研究者發起的臨床試驗中,如果藥物的安全性已經有非常充分的證據,可采用更加簡單易行的方式。近期由美國杜克大學研究團隊在《新英格蘭醫學雜志》發表的ADAPTABLE研究[23],旨在比較阿司匹林81 mg/日和325 mg/日對于預防嚴重血管事件的療效和安全性,采取了電子知情同意書、受試者門戶網站隨訪、受試者自行購買研究藥物、受試者自報研究結局等簡單易行方式,受到了廣泛關注。
7 信息技術的相關問題
新冠肺炎疫情對當代臨床試驗的格局產生了重大影響,導致受試者入組困難、受試者依從性降低和研究時間延長等諸多問題,數字化信息技術有望成為一項重要的應對策略。數字化、遠程化和智能化等新型信息技術的發展推動了臨床試驗范式的變革,為臨床試驗的實施和開展帶來了新機遇。充分利用這些技術優勢,能夠在一定程度上擴大受試者的招募范圍,加速入組和降低脫落率,還能夠實現遠程監管,從而提升臨床試驗效率,降低臨床試驗成本[24-25]。但是,如何將信息技術合理高效地應用于臨床試驗,合理規避應用過程中的倫理風險和數據安全問題,并采取措施進行質量控制,仍然是一項重大挑戰。本共識將針對上述問題的應對策略進行探討。
7.1 臨床試驗設計的信息化適應
數字化背景下,在方案設計時,研究者需要充分考慮數字化、遠程化、智能化等信息技術的適用性及應用場景,充分結合目標適應證的臨床特點選擇適當的信息化媒介[26]。需要強調的是,并不是所有臨床試驗、受試者人群或適應證都能采用信息化手段,例如腫瘤I期臨床試驗和某些急性疾病的研究,涉及到影像、病理活檢、高風險干預等內容,需要研究者密切監測并隨訪受試者,可能不完全適合遠程化技術的應用。此種情況下,考慮數字化、智能化與傳統臨床試驗相結合的模式,是一種較為可靠的實施策略。近年來有研究者采取網絡社交媒體招募受試者,這種方法可能引入選擇性偏倚。研究者應該謹慎使用遠程化手段評估的研究終點,其有效性需要進行充分驗證。在臨床試驗設計時,需根據臨床試驗的特點,采用最合適的信息化技術。當缺乏足夠信息進行判斷時,可先開展小規模預試驗評估可行性[25]。
7.2 信息技術在臨床試驗中的倫理問題
在信息技術的應用中,研究者需要重點關注某些倫理問題,尤其是保證遠程參與的受試者的充分知情和同意確認。數字化技術支持下的臨床試驗中,通過網絡招募的受試者可能面臨個人信息和個人隱私的泄露(如個人身份信息、地理位置信息等)的巨大風險。應對這些問題,必須要事先制定與電子知情同意相關的標準操作規程,采用包括文本、圖形、音視頻、生物識別器和讀卡器等方式傳達與研究有關的信息,并獲得知情同意的記錄[26],同時對個人信息和個人隱私進行脫敏,盡可能地保護受試者的個人權益。遠程簽署電子知情同意時,應符合《電子簽名法》等相關法規的相關要求。相關內容在“保證數據安全的措施”中有更詳盡闡述。
7.3 數據的安全性、可靠性和合規性
在臨床試驗運行過程中,應確保數據能夠安全可靠地采集、傳輸和儲存。研究者應參考監管機構發布的相關指導原則以及行業專家達成的共識(或者規范),例如《藥物臨床試驗質量管理規范》《新冠肺炎疫情期間藥物臨床試驗管理指導原則(試行)》《藥物臨床試驗的電子數據采集技術指導原則》及FDA 21 CFR Part 11等,確保流程的合規性及數據的可靠性和安全性。
數據采集的信息化系統需要經過規范測試和嚴格認證,并將網絡安全作為認證的重要內容,確保系統的安全性、穩定性和合規性。在數據訪問權限上,依據“需要知道”和“最少特權”的安全原則[25],定期審查和更新,以防出現隱私泄露的風險。此外,應用區塊鏈技術可在一定程度上降低數據泄露的風險[27]。
7.4 實施過程中的質量和風險管控
電子化數據采集及管理方式在臨床試驗中的應用,對質量風險管理提出新的要求。在臨床試驗院外操作授權、遠程受試者招募、電子化知情同意、遠程訪視和監查、受試者隱私保護等遠程化、智能化操作方面需要設立嚴格的風險控制措施。此外,在信息化背景下,受試者的隨訪、數據采集、藥物配送、生物標本采集與運輸等都可能通過遠程化方式執行,使操作更為便利。但缺少與受試者的當面溝通可能影響其依從性,需要額外加以注意。可考慮通過提供日記卡或可穿戴設備,以及定期聯系(通過電話、電子郵件等方式)受試者了解試驗情況等方法,提高受試者的依從性。
臨床試驗的信息化建設屬于新興領域,為臨床試驗帶來了新的研究方式。試驗設計、獲得倫理委員會批準、受試者招募、受試者知情同意、研究數據采集、受試者訪視、數據監查、重點指標測量、不良反應報告、統計分析等各環節都可通過數字化、遠程化、智能化方式開展,但也面臨諸多挑戰。基本原則是盡早與監管機構及倫理委員會溝通,咨詢并征求其意見和建議。在合規的前提下,組建多元化的研究團隊,包括臨床專家、方法學專家、倫理專家、數據管理分析專家、網絡安全專家、工程師等,不斷探索完善,穩步推進實施,以滿足監管與注冊要求。
8 數據安全的倫理問題
臨床試驗采集的受試者相關研究數據,可包括健康狀況數據、醫療應用數據、醫療支付數據、臨床研究病例數據和生物組學數據等個人屬性數據。隨著時代的發展進步,研究中受試者的隱私,個人信息及數據安全等問題日益受到了廣泛關注。受試者隱私或個人信息的泄露可能造成其社會污名化或歧視,進而造成精神性和社會適應性的傷害。我國法律規定,受試者的個人信息和個人隱私受法律保護。涉及人類遺傳資源相關信息屬于國家秘密的,還需依規實施保密管理。開展數據處理活動,需履行數據安全保護義務。如發生信息泄露,研究者將承擔相應的法律責任[28-36]。為此,開展臨床試驗必須對研究數據的收集、存儲、使用、加工、傳輸、提供和公開等各項活動采取切實可行的必要措施,保護個人信息及個人隱私信息,保證數據的安全性[37]。
8.1 尊重受試者的知情權
研究者有義務為潛在的受試者提供充分的信息,從而讓受試者自由選擇是否參加研究。無論是用于特定的研究項目,還是目前尚無特定目的的未來研究,均需獲得受試者的知情同意。研究者還應保證允許受試者在試驗過程中無條件撤回授權以滿足知情的選擇退出程序[33]。對于目前尚無特定目的的未來研究,可采用廣泛知情同意的方式。倫理接受廣泛知情同意的前提是有合宜的研究管理,且研究目的明確后,需再次經倫理審查批準方可開展研究[28-29,36,38]。
遺傳數據難以做到完全匿名化,理論上可把個人數據與有遺傳信息和標識符的生物學樣本聯系起來,因此對于遺傳數據應有更多的保護措施[29]。按規定,對于涉及采集我國人類遺傳資源的研究,需事先告知受試者并獲得其書面知情同意[30]。如需利用臨床/研究剩余標本或者遺傳數據進行其他目的的研究,則必須經倫理委員會審查批準并再次獲得受試者同意[29,35]。
研究者必須全面、真實和準確地告知受試者試驗過程中與所收集數據相關的內容,并確保數據的使用不超過知情同意告知的范圍。告知內容包括:數據收集的目的、收集方法、數據儲存、數據處理(如匿名化或去標識化處理)、數據使用范圍、數據保管、研究數據的保密范圍和措施、可能的數據泄露風險,并且應告知受試者有自愿參與和隨時無條件退出的權力,以及研究過程中可撤回其數據以及如何撤回。此外,還需告知以下內容:是否告知研究目的以外的研究發現,以及相應的實施方式;數據分析結果可能與個人信息的哪些來源相關聯;什么類型的研究需要獲得受試者的再次同意才能實施;誰將從研究中受益;向受試者通報研究結果的機制;如何確保受試者的權益不受損害等[28-29,35,39]。
8.2 保證數據安全的措施
盡管臨床試驗結束時可將數據匿名化,但研究過程中仍然存在有身份標識的個人信息被泄露的風險。在設計臨床試驗時,研究者必須針對個人信息及數據安全采取措施,確保數據處于有效保護和合法利用的狀態,并具備保障持續安全狀態的能力。具體措施可考慮但不限于以下方面[8,36-40]:
① 建立數據保密制度:數據保密是臨床試驗過程中必須遵守的基本原則,研究機構應設定程序保證研究數據的保密性,建立及簽署保密協議以規范相應人員的行為,建立保密系統防止數據庫的泄密。
② 分權限管理數據:對數據控制者及數據使用者執行功能和數據訪問分權限管理,并限制第三方對數據的使用權限。
③ 去標識化:在不影響數據完整性的條件下,對敏感的個人屬性信息進行處理,針對可唯一識別到個人或披露后會給個人造成重大影響的信息,應去除個人屬性信息;針對可間接關聯到個人的信息,宜進行泛化、轉化等處理,例如數據匿名化或去標識化。去標識化所使用的代碼,應嚴格保密,原則上代碼索引僅由開展研究的醫療機構保存,企業不能獲得未去標識化的數據。
④ 數據加密處理:對數據進行加密處理,保證數據存儲,傳輸的保密性和完整性,加密數據和密鑰應分別存儲。
⑤ 控制數據使用數量:僅使用所需的最小數據集。
⑥ 有數據修改的過程管理:確保數據管理過程可溯源,研究者對數據進行修改需要簽名,中間過程數據需保存,不得覆蓋原有過程記錄。
⑦ 制定數據備份集恢復策略:定期對數據進行備份,建立介質存取、驗證和轉存管理制度。
⑧ 數據核查:建立數據核查機制。在不違反保密原則和相關法規的前提下,監查員、稽查員、倫理委員會和藥品監督管理部門檢查人員可查閱受試者的原始醫學記錄,以核實臨床試驗的過程和數據。
⑨ 數據發布和共享:發布臨床試驗結果時受試者的身份信息應保密。去標識化后的數據可在研究者之間自由共享。
9 結語
臨床試驗是醫藥創新和改善診療過程中不可或缺的環節。科學的設計和實施是確保臨床試驗獲得可靠結論的基石。期待我國廣大臨床試驗研究者和相關從業人員不斷提升能力,開展更多高質量的臨床試驗,為打造具備國際競爭力的創新醫藥生態系統提供有力支持,為臨床決策提供更多科學證據。
《藥物臨床試驗設計與實施中疑難問題處理的專家共識》專家名單
執筆:李濟賓(中山大學腫瘤防治中心),王書航(中國醫學科學院腫瘤醫院),李婧(中國醫學科學院皮膚病醫院),張麗華(中國醫學科學院阜外醫院),馮芳(中國醫學科學院阜外醫院),李靜(中國醫學科學院阜外醫院)
專家共識寫作組(按姓氏拼音排序):
白樺(中國醫學科學院北京協和醫院),曹國英(復旦大學附屬華山醫院),曹玉(青島大學附屬醫院),陳懋(福建省立醫院),車宇航(中國醫學科學院整形醫院),董志強(內蒙古科技大學包頭醫學院第一附屬醫院),馮芳(中國醫學科學院阜外醫院),郭彩霞(首都醫科大學附屬北京同仁醫院),宦靜(中國醫學科學院皮膚病醫院),姜敏(江西省人民醫院),蔣發燁(廣東省人民醫院),李海燕(北京大學第三醫院),李靜(中國醫學科學院阜外醫院),李婧(中國醫學科學院皮膚病醫院),李濟賓(中山大學腫瘤防治中心),李衛(中國醫學科學院阜外醫院),李雪寧(復旦大學附屬中山醫院),李卓(中南大學湘雅二醫院),林陽(首都醫科大學附屬北京安貞醫院),劉玨(武漢市中心醫院),劉利軍(中國醫學科學院血液病醫院),劉中國(山西醫科大學第一醫院),阮鄒榮(浙江大學醫學院附屬第二醫院),商樸(中國醫學科學院阜外醫院),孫明媛(中國醫學科學院血液病醫院),唐蕾(中山大學附屬第一醫院),王白璐(山東大學齊魯醫院),王彩娥(河南科技大學第一附屬醫院),王煥玲(中國醫學科學院北京協和醫院),王清(中日友好醫院),王書航(中國醫學科學院腫瘤醫院),王淑梅(河北醫科大學第二醫院),王婷(蘭州大學第一醫院),王曉霞(山西醫科大學第二醫院),王欣(北京醫院),向瑾(四川大學華西醫院),徐懿萍(上海交通大學附屬瑞金醫院),陽國平(中南大學湘雅三醫院),岳熠(中國醫學科學院血液病醫院),鄒燕琴(中山大學孫逸仙紀念醫院),張海波(中國醫學科學院阜外醫院),張慶瑜(天津醫科大學總醫院),鄭姣(湖南省人民醫院),張麗華(中國醫學科學院阜外醫院),鄭昕(中國醫學科學院阜外醫院)
利益沖突:所有作者均聲明不存在利益沖突。
1 前言
臨床試驗是科學評價藥物療效和安全性最可靠的方法,為藥物上市和臨床循證決策提供堅實的科學依據,是醫藥創新產業中最為關鍵且投資最多的環節。近年來,隨著鼓勵醫藥創新產業發展政策的出臺,我國自主醫藥的創新產業取得了快速發展,并且已開始走向國際市場。國家藥品監督管理局也發布了一系列技術指導原則,旨在提升臨床試驗能力,規范臨床試驗活動。與此同時,面對臨床試驗費用、時間成本日益高昂的現狀,優化臨床試驗的設計和實施過程,完善監管和質控措施,在保證結果可靠的前提下,提高試驗的成本效益,是當下亟待解決的主要難題。此外,倫理批準是臨床試驗實施的前提條件,數據安全和相關的醫學倫理問題日益受到重視。
為進一步提高我國研究人員開展臨床試驗的能力,針對臨床試驗關鍵環節的普遍疑問和模糊認識,國家心血管病中心、中國醫學科學院阜外醫院國家心血管疾病臨床醫學研究中心組織臨床試驗方法學、臨床試驗監管、心血管病學和腫瘤病學等領域專家共同制定此共識,涵蓋受試者入選、受試者保留、研究終點選擇、研究質量控制、信息技術應用和數據安全倫理等方面,旨在為廣大臨床試驗研究者提供參考和指導。
2 提升受試者的多樣性
受試者入選是臨床試驗正式開始的重要標志之一,如何盡可能納入更廣泛多樣的獲益群體,保證入選的受試者充分代表上市后的使用人群,是臨床試驗設計中的一個重要問題。臨床試驗往往被認為會排除或較少入選某些特定亞組人群,例如高齡、合并肝腎功能不全或女性等,因而難以獲得候選藥物在這些特定人群中的療效評價證據。提升受試者的多樣性,納入更為廣泛的適應證人群,有助于更好地評估候選藥物在特定亞組人群中的療效和安全性。美國食品藥品監督管理局于2020年11月發布了“改善臨床試驗人群的多樣性—入選標準、招募措施和試驗設計的行業指南”[1],該指南提倡臨床試驗申請人擴大受試者的合格標準,避免不必要地將特定亞組人群排除在外。我國目前尚沒有針對如何提升受試者多樣性的指導原則。本共識將從受試者入選標準的制定、受試者相關因素和監管機構因素3個方面進行闡述,為提升受試者多樣性提供建議舉措,以期為我國的臨床試驗研究者提供參考指導。
2.1 適當拓寬入選標準,避免不必要的排除標準
在制定入選標準時,研究者應考慮臨床實踐中可能使用該藥物的患者的多樣性,包括年齡、性別等特征,適當擴大入選標準可在一定程度上提高臨床試驗結果的可推廣性[1],也可考慮采用適應性設計(adaptive design,詳見本文“5適應性設計及其應用”),在獲得更多安全性數據后,擴展到更大人群范圍[2]。證據充分時,確證性臨床試驗不必限于成人人群,可考慮同時納入兒童和青少年,甚至妊娠婦女。
在制定排除標準時,在確保受試者的安全和實現研究目標的前提下,應評估每條標準是否都確有必要,并剔除或修改非必要的排除標準,例如器官功能障礙較輕但可耐受試驗藥物,且有較大可能從試驗中獲益的受試者人群。通過早期臨床試驗[1],分析不同受試者人群的藥物代謝特征,例如老年人和肝腎功能障礙者,能夠為后期臨床試驗中是否有必要排除某些受試者提供客觀依據,也可為不同受試者人群中的劑量優化方案提供參考依據。
對于某些臨床試驗類型,放寬入選標準十分重要。在富集(enrichment)適應性設計的臨床試驗中(詳見本文“適應性設計的主要類型和注意事項”),應盡可能設定更為廣泛的入選標準,避免排除某些特定的受試者人群。富集是指前瞻性地使用特定的臨床或生物學特征篩選受試者人群,使得在該人群中檢測到藥物效應(如果確實存在藥物效應)的可能性比未選擇人群中更大。合理地放寬入選標準能夠從更廣泛人群中篩選出更多潛在的獲益群體。此外,由于受試者數量十分有限,對于罕見病的臨床試驗,避免入選標準過嚴,保證受試者最大限度地參與亦十分重要。在很有限的情況下,如果不存在非預期安全性問題,且早期試驗用藥并不改變疾病進程,可考慮將已參加過早期安全性試驗的受試者再次納入到療效性探索或確證性試驗中[1]。
2.2 受試者相關因素
研究者應考慮采取包容性的入選措施,幫助易被忽視和較少被納入的亞組人群參加臨床試驗。可與社區、患者權益組織等建立聯系,獲得其協助,以更好地理解潛在受試者的需求,從而有針對性地調整入選措施[3]。在研究中心的選擇上,可考慮少數族裔或少數民族等聚居區附近的醫院[4]。在工作人員的選擇上,考慮不同的文化背景和語言差異,招募多元文化背景的工作人員幫助有語言溝通障礙的受試者參加。
在運行過程中,研究者可考慮采取措施減輕受試者負擔,從而讓更多受試者愿意參與臨床試驗,在一定程度上有助于改善受試者的多樣性[5]。例如調整隨訪間隔時間或時間窗,或采取電話、郵件或視頻等方式來替代面對面訪視,特殊情況也可考慮由研究人員去受試者家中訪視。對于罕見病患者,由于地理分布上較分散,疾病本身也可能不同程度地影響其出行,研究人員需要付出更多努力保證受試者的入選。也可考慮在試驗結束后進行開放標簽,使安慰劑組患者也能獲得活性研究藥物,從而鼓勵更多受試者參加臨床試驗。
2.3 監管機構相關因素
監管機構的指南或政策文件,有助于引導研究者或申辦者在臨床試驗設計和實施時提高臨床試驗入選人群的多樣性,充分考慮各國人群和候選藥物潛在適用人群的年齡、性別、種族等特征,提前制定好計劃,招募具有不同人口學特征的受試者,尤其是常常被忽視和較少納入的一些亞組人群,如少數族裔和老年人群等。要求使用統一的人口學變量格式和定義,便于對不同研究的數據進行匯總分析,也便于對不同研究的結果進行比較。此外,監管機構要求報告不同人口學特征亞組人群的療效和安全性結果,可更全面地反映候選藥物的療效和安全性[6]。
此外,監管機構還可設置專門的促進受試者多樣性的部門,采取多種措施,如制作臨床試驗科普材料、通過多媒體宣傳臨床試驗參與的重要性等,提高廣大人群對臨床試驗的認識,幫助被忽視的群體參與臨床試驗[5,7]。
綜上所述,適當拓寬入選標準、采取更具包容性的入組措施和一些監管措施,能夠提高受試者對藥物適用目標人群的代表性,幫助醫生了解藥物針對更大范圍人群的安全性和有效性,使更多群體獲益。
3 受試者失訪與剔除
在臨床試驗的實施過程中,難免會出現受試者的失訪、違背納入與排除標準和依從性差等問題。失訪率高或不恰當地處理相關數據都會嚴重影響試驗結果的可靠性。研究者必須考慮在設計和實施階段采取措施減少受試者的失訪,并謹慎處理失訪者的數據。對于很多研究者而言,這些問題仍然是較大的挑戰。在面對違背納入排除標準、違背方案合并用藥、錯誤分組、依從性差等情況時,如何進行受試者剔除(excluding patients from analysis)也是較為棘手的問題。
3.1 失訪處理
失訪(loss to follow- up)是指受試者在臨床試驗過程中由于各種原因沒有按預定方案完成隨訪,研究者未能獲得其隨訪數據,屬于脫落(drop out)的一種情況。隨著脫落率升高,試驗結果的準確性下降。
如前所述(本文“受試者相關因素”),研究者應該在設計階段考慮受試者參加臨床試驗可能存在的困難,采取合理措施,以減少失訪的風險。常見的失訪原因包括受試者搬遷、失去聯系、發生藥物不良反應等。受試者失去聯系是導致失訪的常見原因之一。在發生失訪時,研究者應該采取補救措施盡可能獲得隨訪數據。為避免受試者失去聯系,簽署知情同意書時,在征得受試者及其家屬同意的情況下,應盡可能留下多個受試者親屬(特別是不與受試者同住的親屬)的聯系方式。當受試者搬遷時,可通過上門訪問等方法盡最大可能獲得隨訪數據。對于因藥物不良反應導致的失訪,應盡可能與受試者及其家屬取得聯系。一方面,需要詳細收集記錄不良反應的程度和分類、與試驗藥物的相關性、起止時間和轉歸,并按照研究方案、醫療規范及時妥善處理;另一方面,應取得受試者及家屬理解,受試者發生不良反應而無法耐受治療時可停止研究治療,但仍需按照研究方案的要求完成完整隨訪。
常用缺失值處理方法有:末次觀測值結轉、基線觀測值結轉、均值填補、回歸填補、多重填補、最差值填補及臨界點法。對于失訪造成的主要療效指標的缺失,應將方案和統計分析計劃中事先規定的數據填補方法作為主分析方法進行處理[8,9],并將上述其余填補方法作為敏感性分析方法。如果敏感性分析結果與主分析結果一致,說明結果可靠。一般來說,缺失數據的處理方法應遵循保守療效估計的原則。
3.2 受試者剔除
在臨床試驗中,可能發生違反納入排除標準、違反方案規定的合并用藥、交叉治療、依從性差等情況,不能簡單予以剔除。應遵循方案中事先規定的受試者剔除原則,確定統計分析數據集。受試者剔除標準需要在試驗數據庫鎖定之前制定。對于剔除的每一位受試者,都需要給出詳細的理由。定義分析數據集時遵循2個原則[9]:① 盡可能減少偏倚;② 防止增加Ⅰ類錯誤概率。一般情況下,對于優效試驗,意向性治療(intention-to-treat,ITT)是數據分析的基本原則,要求將所有隨機化的受試者按照隨機分配的組別進行分析,不考慮受試者實際接受了何種治療,也不考慮是否違背方案或失訪。遵循ITT原則對療效的估計是最保守的,要求對所有隨機化受試者完成隨訪以獲得研究結局。這在實踐中有時難以達到,只能獲得盡可能接近符合意向性治療原則的理想受試者集—全分析集(full analysis set,FAS)。FAS僅在非常有限的情況下才可剔除已經隨機化的受試者,通常包括:違反重要入選標準、受試者未接受試驗用藥物的治療、隨機化后無任何觀測數據等。需要強調的是,剔除每一位受試者都需要對剔除的合理性進行充分論證,并事先說明。其他常用的分析數據集還包括符合方案集(per protocol set,PPS)和安全性分析集(safety set,SS)等。PPS納入的受試者需要有較好的方案依從性,需要完成事先設定的試驗藥物的最小暴露劑量,主要指標的數據均可獲得,且沒有重大違背試驗方案。隨機化后至少接受一次治療且有安全性評價數據的受試者均應納入SS。
對每一位從統計分析數據集中排除的受試者,都應該在盲態審核時闡明理由,并在揭盲之前以文件形式寫明。根據不同的研究目的,需要在臨床研究方案和統計分析計劃中明確描述3個數據集的定義,同時明確定義違背方案、脫落或缺失數據的處理方法。在優效試驗中,應采用ITT/FAS作為主要分析數據集;在等效或非劣效試驗中,如果試驗質量欠佳,發生較多失訪、退出、替代治療或組間交叉等問題,可能會縮小組間療效差異,此時采用ITT/FAS容易得出假陰性結論,需要同時采用ITT/FAS和PPS分析。兩個數據集結論一致時可增加試驗結果的可信度。如果結論不一致,可能存在偏倚,應分析并合理解釋出現不一致的原因。
3.3 在設計階段提高受試者依從性,減少失訪和受試者剔除
出現失訪或需要將受試者從統計分析數據集中剔除,都是比較被動的局面,更為明智的做法是,從研究設計階段即充分考慮受試者依從性和研究質量問題,制定合適的措施提高受試者的依從性,例如:① 在隨機之前排除可能搬遷或不依從的受試者;② 盡量使干預措施簡單且易于實施;③ 采用易于測量的指標,提高依從性;④ 設計合理的隨訪頻次。此外,在研究實施過程中,研究者與受試者應建立良好的人際關系,研究者應始終關注受試者,及時處理實施過程中發現的問題。通過科學嚴謹的設計、規范高效的實施,盡可能降低受試者的失訪率,提高隨訪質量,將盡可能多的受試者納入統計分析數據集,獲得真實準確可靠的臨床試驗結果。
4 研究終點和多終點設計
研究終點是評價藥物療效的關鍵指標,設定多個研究終點在臨床試驗并不少見。對于Ⅰ/Ⅱ期臨床試驗,多終點十分常見,但是由于是探索性研究,樣本量估計時可不考慮對Ⅰ/Ⅱ類錯誤的控制。對于Ⅲ期確證性研究,雙終點和多終點的應用亦較常見,能夠增加試驗效率[10-11],但須注意遵循相應的原則。下面將重點介紹臨床試驗研究終點的定義、分類和選擇原則,并以抗腫瘤新藥臨床試驗為例,闡述臨床試驗多終點的設計考量要點。
4.1 臨床試驗的研究終點
4.1.1 定義
研究終點是可通過客觀測量并輔助研究者決定是否接受或拒絕無效假設(兩種治療方法或策略之間在研究終點上沒有統計學意義的顯著差異,H0)的一個重要指標;在特定時限內的臨床試驗中,研究終點是指對臨床結局的觀測與評價,包括生存期、生活質量/臨床癥狀等。
4.1.2 分類
基于臨床獲益的價值,可分為:① 臨床終點(clinical endpoint),直接代表最重要的臨床獲益,即延長生存,改善癥狀和生活質量,主要用于常規批準新藥上市(traditional approval,TA)。② 替代終點(surrogate endpoint),可用于加速批準(accelerated approval,AA),包括兩大類,一是間接代表臨床獲益且經過驗證與臨床終點相關的替代終點,二是未經驗證但很可能預測臨床獲益的替代終點。
基于需回答的研究問題的重要性,可分為:① 主要終點(primary endpoint):是指與臨床試驗所關注的主要問題(主要研究目的)直接相關的,能夠提供最具臨床意義和令人信服證據的研究終點,樣本量計算和評價試驗是否達到主要目的都是基于主要終點。② 次要終點(secondary endpoint):一般為多個,可包括關鍵次要終點(與主要終點共同納入Ⅰ類錯誤控制,用于支持藥物說明書聲稱的獲益)。③ 探索性研究終點:一般與藥物療效預測標志物或者試驗藥物引起的機體變化有關。
基于依據來源,以抗腫瘤藥物臨床試驗的研究終點為例,可分為:① 生存相關研究終點。描述死亡事件的終點:如OS(overall survival,總生存,從治療開始或隨機至死亡的時間)和OS率(特定時間段內生存患者占試驗剛開始時總患者數的比例)等。基于腫瘤測量的終點:包括ORR(objective response rate,客觀緩解率,治療后達到完全緩解或者部分緩解的受試者占試驗剛開始時總患者數的比例),DCR(disease control rate,疾病控制率,治療后達到完全緩解或部分緩解及疾病穩定的受試者占試驗剛開始時總患者數的比例),DoR(duration of response,療效持續時間,治療后達到完全緩解或部分緩解的患者,從首次評估有效到疾病進展或死亡時間),PFS(progression free survival,無進展生存,從治療開始或隨機入組至疾病進展或死亡的時間),DFS(disease free survival,無復發生存,從隨機入組到疾病復發或任何原因導致死亡的時間),EFS(event free survival,無事件生存,從隨機入組到疾病復發或任何原因導致死亡的時間)等。如以腫瘤測量相關研究終點為唯一療效指標,藥物上市批準前可能需要評價臨床終點如OS的臨床試驗驗證。② 生活質量相關研究終點:主要為癥狀評估終點,包括癥狀減輕或緩解時間、生活質量(quality of life,QoL)和癌癥癥狀進展時間(time to progression of cancer symptoms,TTP)和患者報告結果(patient report outcome,PRO,即直接來自于患者對自身健康狀況、功能狀態及治療感受的報告,不包括醫護人員及其他任何人員的說明)。需要注意的是,包含生活質量的復合癥狀終點中的不同癥狀指標應具有相似的臨床重要性,其臨床獲益不僅歸因于單個指標的改善,對此類復合癥狀終點進行分析時應包含對具體單個指標的分析[12]。
4.1.3 臨床終點的選擇
① 必要條件:具有臨床意義且與疾病過程相關,例如PFS是用于評估藥物能否延遲疾病進展;能夠回答試驗的主要問題,例如DFS是用于評估治療是否延遲復發);終點事件發生頻率足夠高,使研究具有足夠的統計能力,例如OS適用于生存期短的人群,心血管疾病的臨床試驗通常選擇主要不良心血管事件(major adverse cardiac event,MACE)、心血管死亡或者全因死亡等硬終點指標。② 評估優化:若結果存在偏倚或不確定性,需要通過統計學方法優化;需考慮是否計劃加速審批,如ORR、PFS等終點均有可能支持加速審批。③ 如計劃在一個研究中回答多個臨床問題,應考慮選擇多終點。
4.2 臨床試驗多終點
臨床試驗多終點是指一項研究中同時設置可能代表試驗藥物臨床獲益的多個指標作為研究終點。臨床試驗多終點會產生多重性問題(multiplicity issues),即在一項完整的臨床研究中,需要經過不只一次的統計推斷(多重檢驗)得出研究結論的相關問題[13]。常用的臨床試驗多終點包括以下3類:① 共同主要終點(co-primary endpoint):要求2個或以上不同的主要終點均有統計學顯著意義時才認為研究藥物具有療效。② 多終點(multiple endpoint):評估幾個主要終點,其中至少一個具有治療效果就能確定臨床獲益。③ 復合終點(composite endpoint):將多個臨床相關結局合并為一個單一變量,抗腫瘤藥物的臨床試驗中常用PFS、DFS、EFS等復合終點;心血管疾病的臨床試驗中常用MACE作為復合終點。
臨床試驗多終點的使用場景及統計分析注意事項。確證性臨床試驗中:單一主要終點較為常見,但某些情況下會涉及多個主要終點,包括共同主要終點和多終點兩類,前者要求多個主要終點均具有統計學意義,后者則是多個主要終點中至少一個有統計學意義就認為研究藥物有效。二者在進行方案的統計學設計時需要注意Ⅰ類錯誤和Ⅱ類錯誤膨脹問題。① 共同主要終點:會增大Ⅱ類錯誤發生率,從而降低檢驗效能。檢驗效能降低的程度與主要終點的個數和主要終點之間的相關性有關,個數越多、相關性越弱,檢驗效能降低的幅度越大。② 多終點:會增加Ⅰ類錯誤發生率,需要采取適當的策略和方法控制總的Ⅰ類錯誤率(family-wise error rate,FWER),如進行多重性調整。可通過統計學方法的α分配和/或α傳遞來管理Ⅰ類錯誤,如:平行策略(Bonferroni法、前瞻性α分配法),序貫策略(Holm法、Hochberg法、固定順序法、回退法),分階段的整體決策策略(較經典的α分割方法有Pocock法、O’Brien-Fleming法和Haybittle-Peto法)等[10,14]。在非確證性臨床試驗中:主要終點為多個的情況較常見,不需要統計學假設,不需考慮Ⅰ類和Ⅱ類錯誤的膨脹問題。
4.3 臨床試驗多終點的選擇
臨床試驗多終點在抗腫瘤新藥研發領域更為多見,因而以此為例說明多終點選擇需要考量的要點。首先,最常見的抗腫瘤新藥確證性研究的多終點選擇為PFS和OS,如果設定共同主要終點,PFS和OS終點必須同時達到,臨床試驗的樣本量估算按照OS的統計學假設來計算;部分研究設計以PFS和OS作為多終點,兩個終點達到其一即為研究成功,需要進行多重性調整,可通過分配或者傳遞α值來減少Ⅰ類錯誤。
目前抗腫瘤新藥臨床試驗常用到籃式設計(一種疾病多個藥物)、傘式設計(同種藥物多個疾病)和平臺設計(多種藥物、多個疾病)等復雜設計方案,如果子研究是獨立研究,且回答各自的臨床問題,比如針對不同的腫瘤或者目標人群等,則無需進行多重性調整。
在臨床試驗方案和統計分析計劃中,應事先明確多重性問題和多重性調整的策略和方法,并鼓勵在設計階段與監管機構充分溝通。同時,若在臨床試驗過程中進行調整,亦應與監管機構及時溝通。
5 適應性設計及其應用
隨著創新藥物尤其是抗腫瘤新藥的不斷涌現,臨床試驗設計的要求不斷提高,尤其是很多新靶點的制劑或免疫制劑具有獨特的藥理特點,例如劑量-反應關系不唯一、延遲毒性和延遲有效性等,為探索藥物的安全性和有效性帶來了巨大挑戰。與此同時,Ⅰ期、Ⅱ期和Ⅲ期臨床試驗的邊界越來越模糊,創新試驗模式往往提倡各階段的融合,以提高數據利用度并加快藥物的研發進程。
適應性設計是一類創新性的臨床試驗設計,是指按照預先設定的計劃,在期中分析時使用試驗期間累計的數據對試驗設計的一個或多個方面做出相應修改的臨床試驗設計,修改的內容和目的包括:修正初始設計的偏差,提高研究的統計學效能,使試驗更加符合倫理學要求;增加研究的外推性和可解釋性,提高試驗效率,降低時間和成本投入[2,15]。
近年來,臨床試驗研究者、藥物研發企業和監督管理機構對適應性設計的臨床試驗給予極大關注,各國政府監管機構陸續出臺適應性設計的相關指導原則,例如美國食品藥品監督管理局于2019年發布了《藥物和生物制品臨床試驗適應性設計行業指南》,我國國家藥品監督管理局亦于2021年發布了《藥物臨床試驗適應性設計指導原則(試行)》。盡管如此,很多研究者對適應性設計的應用原則、范圍和注意事項仍缺少充分地了解和認識,本共識將主要針對上述問題進行闡述。
5.1 適應性設計的原則
適應性設計既可用于探索性臨床試驗,亦可用于確證性臨床試驗。在選擇使用適應性臨床試驗之前,需要考慮以下4項基本的應用原則:① 在期中分析階段進行的方案修改需要在原始方案中預先設定,而非臨時提出,原始方案中應該明確說明期中分析的時間、次數、適應性設計的類型、所使用的統計方法及期中分析目的等;② 嚴格和充分控制Ⅰ類錯誤在合理水平(例如,雙側檢驗水平為0.05);③ 選擇準確的效應估計方法,減少偏倚的引入,確保結果的可靠;④ 避免期中分析的結果泄露從而影響研究后續操作和受試者入組,保證臨床試驗的完整性。期中分析或方案調整應由獨立的數據監察委員會(independent data monitoring committee,IDMC)執行,以保證申辦方和研究者處于盲態。有關IDMC的更多內容,可參閱《藥物臨床試驗的生物統計學指導原則》等。
5.2 適應性設計的主要類型和注意事項
適應性設計可體現在研究設計的多個環節,下面簡述不同的適應性設計類型及其需要注意的問題:
① 成組序貫設計(adaptive group sequential design):預先計劃在試驗中進行一次或者多次期中分析(interim analysis),根據每次期中分析的結果做出后續的試驗決策。期中分析的時間點一般基于累計數據的占比(如受試者入組比例或發生目標事件數的比例等),期中分析的次數、時間點及I類錯誤調整方法需要在試驗方案中給予明確規定,在試驗實施過程中嚴格按照方案執行,不可隨意進行計劃外的期中分析,以確保整個試驗的科學性和完整性。如果存在以優效性提前終止試驗的可能,選擇時間點時應考慮期中分析時的信息量是否可提供足夠的檢驗效能。
② 樣本量再估計(sample size re-estimation):根據預先設定的期中分析,利用累計的試驗數據重新估算樣本量,以保證在可容許的Ⅰ類錯誤概率范圍內達到預先設定的目標。同時需要注意:如果重新估算得到的樣本量比原樣本量大,那么接下來的研究中采用新樣本量;否則仍使用最初估計的樣本量。
③ Ⅰ/Ⅱ期或者Ⅱ/Ⅲ期無縫設計(phase Ⅰ/Ⅱ,Ⅱ/Ⅲ two stage seamless design):無縫設計是將傳統的兩個獨立的臨床試驗階段,整合為一個試驗的2個階段,將前一階段臨床試驗結束時的分析作為期中分析,并據此進行后期試驗的設計或者劑量選擇。無縫設計可縮短臨床試驗周期,在保證一定的檢驗功效的前提下,使用相對較少的樣本量達到兩期試驗的目的。其中,Ⅱ期試驗結果會影響后續Ⅲ期試驗的Ⅱ/Ⅲ期無縫設計,需要在研究設計中事先設定自適應相關內容,使最終分析可使用Ⅱ/Ⅲ期研究中的全部數據,尤其需要控制試驗的總體Ⅰ類錯誤率,應使用適當的統計學方法來防止Ⅰ類錯誤膨脹,常用的有Fisher組合檢驗法及序貫設計方法等。
④ 適應性富集設計(adaptive enrichment):根據試驗的前期結果分析哪些對象最可能獲益,在后續試驗中增加其入組比例,從而達到放大治療效果、避免更多受試者暴露于可能的毒副作用的目的,同時也提高了試驗效率。例如根據研究適應證不同,使用實踐經驗、病理學特征、基因組學特征或者其他研究經驗等方法來確定受試者類型等。例如基于標記物的最優序貫富集設計(optimal sequential enrichment design,OSED),首先對陽性生物標記物亞組進行兩階段設計,在確定藥物對陽性生物標記物亞組有效之后,對陰性標記物亞組進行兩階段設計,該設計的期中決策準則是通過最大化一個特定的效用函數,并同時控制Ⅰ和Ⅱ類錯誤而得到。
⑤ 適應性主方案試驗設計(master protocol with adaptive design):指方案中包含多個子方案,如籃式設計(一種疾病多個藥物)、傘式設計(同種藥物多個疾病)、平臺設計(多種藥物,多個疾病)等。在籃式設計的臨床試驗中,評估藥效的兩種常用方法是匯集分析和獨立分析。匯集分析有助于提高統計檢驗功效,但當試驗藥物在不同的籃子中的療效有差異時,該方法將導致嚴重的估計偏倚和Ⅰ類錯誤率膨脹。而獨立分析僅使用每個籃子的數據獨立評估試驗藥物在此籃子中的療效,在籃子之間并不進行任何信息借用,因此避免了估計偏倚和Ⅰ類錯誤膨脹問題,但由于每個籃子的樣本量有限,往往缺乏足夠的檢驗效能。考慮到不同籃子間異質性,可利用試驗中觀測到的數據自適應地在籃子之間借用信息,包括:兩階段籃子設計、貝葉斯分層模型籃子設計、校準貝葉斯分層模型的籃子設計及潛在亞組籃子設計等。平臺研究的適應性設計方法主要有MIDAS(multi-candidate iterative design with adaptive selection)貝葉斯Ⅱ期臨床試驗設計方法,允許以高效、無縫的方式持續篩選大量候選藥物,只需要一個主方案和一個對照組,有利于簡化試驗過程,降低新藥研發成本。
⑥ 適應性標志物設計(biomarker-adaptive design):根據臨床試驗進行過程中探索的分子標志物進行后續臨床試驗入組人群篩選的設計。常用的設計方法有標志物策略設計(marker-strategy design,MSD),是用于識別和驗證預測標志物的設計。還有標志物分層設計(marker-stratified design,MSTD)是根據標志物陽性或陰性對受試者進行分層,然后在每一層內將受試者隨機分配到對照組或試驗組進行治療。其他還有最優標志物自適應設計等。
⑦ 適應性劑量遞增(adaptive dose escalation):在I期試驗中根據前期爬坡劑量的結果進行后續劑量選擇的方法,主要用于確定試驗藥物的最大耐受劑量和劑量限制性毒性,常用的設計方法包括貝葉斯基于算法的Rolling6設計,基于模型的TITE-CRM設計、DA-CRM設計、TITE-BOIN設計、TITE-Keyboard設計、Simon兩階段設計等。
⑧ 多重適應性設計(multiple adaptive design):一個試驗中采用大于一種適應性方法的方案設計,此時應注意控制概率Ⅰ類錯誤。
其他適應性設計的方法還包括:適應性治療轉換(adaptive treatment-switching),無效藥物剔除設計(drop-the-loser design),假設性自適應設計(adaptive-hypothesis design),多臂多階段(multi-arm multi-stage)設計等。
5.3 其他考量
設計適應性臨床試驗需要結合實際情況考慮下列問題。首先,原則上一般不允許在試驗進行過程中進行非預設的變更,但在臨床試驗的操作實踐中,基于試驗過程中產生的數據提示需要進行非預先設定的修改時,應經過謹慎考慮后,在保證不破壞合理性、完整性和可行性的前提下做出修改,并需要提前與監管機構進行溝通確認。第二,適應性設計通常會與先進的統計學方法和科學技術相結合,例如貝葉斯方法、新穎替代終點指標及模擬技術等,操作更復雜,通常需要更高的臨床試驗實施質量保駕護航。研究者需要充分考慮獲取的信息量、受試者招募速度、研究者的理解程度和時間成本等因素,如果適應性設計獲取的信息少于傳統設計,則可能導致入選進度變慢、納入的受試者特征發生改變、或因試驗設計過于復雜,導致研究質量受到嚴重影響,此時選擇適應性試驗設計應該謹慎。
此外,要注意的是,基于外部數據對進行中的臨床試驗做出的修改通常不屬于適應性設計,例如同一類藥物剛完成的試驗顯示某主要終點的選擇不合適,或新發布的相應指南對主要終點另有定義,需要修改主要終點;新的標準治療的改變,需要修改標準治療的對照組,或因無法繼續入組患者而需要提前終止試驗等。
總之,適應性設計由于其靈活的特點,能夠節約研發成本和投入時間,在某些情況下也更加符合倫理要求,因而相關的研究應用日趨廣泛,但是適應性設計較傳統臨床試驗更為復雜,對研究運行質量的要求更高,且無法彌補試驗中已經存在的缺陷,因此在設計、實施和管理中要更為謹慎。
6 大規模試驗應采用簡單易行的運行和質控方式
在心血管疾病等慢病領域,評價藥物對重要臨床結局的影響往往需要開展大規模的臨床試驗反復驗證,入選超過數千例受試者,隨訪數年[16-17]。大規模是結論可靠的重要保障,唯有采用簡單易行的操作方式,才能實現[18]。大規模與小規模臨床試驗存在的質量風險不盡相同,應結合其特點采用針對性的運行管理方法與質控措施。首先,大規模臨床試驗應采用易于確定且重要的臨床終點,例如死亡、心肌梗死等,其作為客觀指標判斷依據明確,基于受試者的報告很少會發生遺漏。其次,由臨床事件委員會(clinical event committee,CEC)按照統一的標準對可能的終點事件進行中心性判定,誤判的可能性會降到最低。再次,試驗采用雙盲設計,且樣本量足夠大,個別受試者數據記錄的偏差并不會影響研究結論。相反,如果操作過于復雜,研究規模不足,可能對研究結論造成致命性影響。簡單易行意味著在設計和運行方面簡單易行,緊抓決定臨床試驗質量的關鍵環節,避免讓非必需內容徒增成本和復雜性。因此,簡單易行的方式不是犧牲研究質量,而是為更好地保障研究結論的科學性。
近20年來,全球臨床試驗的領軍機構之一英國牛津大學在SHARP[19]、HPS-THRIVE[20]、REVEAL[21]和EMPA-KIDNEY等一系列國際多中心大規模藥物臨床試驗中發展了簡單易行(streamlining)的運行質控方式,并不斷完善,已得到美國食品藥品監督管理局等國際權威機構的認可,代表了未來臨床試驗方法學的重要趨勢。鑒于此,我們對簡單易行的質控運行方式的核心環節進行簡介。
6.1 研究數據采集
完善的電子數據采集系統(electronic data capture,EDC)是大規模臨床試驗以簡單易行方式運行的重要基礎。EDC系統應界面友好,只采集必要的數據,研究數據主要來自于詳細且結構化的受試者訪視,以及本地和中心實驗室結果,不使用紙質的病例報告表(case report form,CRF)。在大規模的臨床試驗中,受試者是最直接的數據來源,因為其能夠報告所有的醫學情況,也包括不良事件(adverse event,AE)和終點事件。在長達數年的隨訪中,受試者可能在不同的醫院接受診療,研究者僅依靠本院的病歷系統未必能完全了解受試者的所有就醫信息,所以只有受試者能夠提供本人最新的健康和用藥信息。在每次隨訪時,研究者收集受試者的所有住院和任何其他不良事件的詳細信息,并特別詢問因藥物導致的嚴重不良事件。研究者直接將來自于受試者報告的信息/數據錄入到EDC中(對于難以從受試者本人處獲得的信息/數據,也可從親屬或者其他醫生處獲得)。此外,針對任何不可信或不一致的數值或回答,電子系統中將自動彈出消息予以警示,解決該問題后數據才能保存。這些措施有助于確保數據的質量。
基于前面所述的理由,即使受試者忘記而漏報少量的事件也不會影響研究結果的可靠性[22]。因此,此類試驗實施過程中,可不要求研究者定期查閱紙質或者電子版的醫院記錄來發現不良事件,反而是基于電子化的研究數據的中心性監查可有效幫助、及時發現潛在的問題。
6.2 基于風險的監查
在簡單易行的運行方式中,基于風險的監查(risk based monitoring,RBM)方法是提高數據質量和保證受試者安全的重要手段[22]。基于風險的監查需要結合研究設計的復雜程度,包括終點類型、研究人群的復雜性、試驗藥物的安全性等因素,全面評估可能影響臨床試驗質量和受試者安全的風險,針對關鍵的風險進行監查。
監查可采用中心化遠程監查與現場監查相結合的方式進行。中心化監查是保證研究質量的最主要手段。EDC除了提供實時的CRF信息之外,還能夠同時記錄研究者數據采集等操作的相關信息。基于電子化的研究數據,建立研究管理系統,進行中心性的數據分析,有助于及時發現傳統的現場監查難以發現的問題。利用中心性監查能夠識別明顯偏離平均水平的研究中心,發現訪視問卷完成耗時過短、訪視問卷集中于非正常訪視時間完成等異常現象,這些現象提示數據質量可能存在問題,從而為針對性監查提供線索。基于實時數據分析的中心化監查可發現90%的重要問題[22],其效力遠遠大于現場監察。
現場監查作為中心化監查的補充,可核實中心化監查發現的疑點或到現場檢查必要的記錄,幫助研究者解決研究中出現的問題,必要時對其提供額外的針對性培訓。在可能的情況下,經受試者同意,監查員可觀察受試者訪視的過程。通過現場監查,監查員可根據研究需要隨機抽檢各種記錄,但視研究的規模和具體情況而定,不一定需要常規檢查病歷以發現漏報的不良事件、嚴重不良事件或其他研究終點。中心化監查的結果可用于指導現場監查的時間和性質。
6.3 源文件歸檔
源文件指臨床試驗中產生的原始記錄、文件和數據。在簡單易行的臨床試驗中,電子CRF以電子數據方式將受試者的回答記錄保存于服務器,便于核查,其中包括依從性評估、受試者報告終點事件、不良事件和研究藥物發放記錄等。電子CRF的記錄方式與門診病歷記錄一樣,完成后導出打印,可作為門診病歷歸檔,遵循《藥物臨床試驗質量管理規范(2020)》關于“以患者為受試者的臨床試驗,相關的醫療記錄應當載入門診或者住院病歷系統”的要求[8]。此外,研究的源文件還包括當地或中心實驗室分析結果,不良事件(AEs)的相關支持性資料等。
總而言之,采用簡單易行的運行管理及質量控制方式,確保試驗質量,是未來大規模臨床試驗發展的趨勢。在研究者發起的臨床試驗中,如果藥物的安全性已經有非常充分的證據,可采用更加簡單易行的方式。近期由美國杜克大學研究團隊在《新英格蘭醫學雜志》發表的ADAPTABLE研究[23],旨在比較阿司匹林81 mg/日和325 mg/日對于預防嚴重血管事件的療效和安全性,采取了電子知情同意書、受試者門戶網站隨訪、受試者自行購買研究藥物、受試者自報研究結局等簡單易行方式,受到了廣泛關注。
7 信息技術的相關問題
新冠肺炎疫情對當代臨床試驗的格局產生了重大影響,導致受試者入組困難、受試者依從性降低和研究時間延長等諸多問題,數字化信息技術有望成為一項重要的應對策略。數字化、遠程化和智能化等新型信息技術的發展推動了臨床試驗范式的變革,為臨床試驗的實施和開展帶來了新機遇。充分利用這些技術優勢,能夠在一定程度上擴大受試者的招募范圍,加速入組和降低脫落率,還能夠實現遠程監管,從而提升臨床試驗效率,降低臨床試驗成本[24-25]。但是,如何將信息技術合理高效地應用于臨床試驗,合理規避應用過程中的倫理風險和數據安全問題,并采取措施進行質量控制,仍然是一項重大挑戰。本共識將針對上述問題的應對策略進行探討。
7.1 臨床試驗設計的信息化適應
數字化背景下,在方案設計時,研究者需要充分考慮數字化、遠程化、智能化等信息技術的適用性及應用場景,充分結合目標適應證的臨床特點選擇適當的信息化媒介[26]。需要強調的是,并不是所有臨床試驗、受試者人群或適應證都能采用信息化手段,例如腫瘤I期臨床試驗和某些急性疾病的研究,涉及到影像、病理活檢、高風險干預等內容,需要研究者密切監測并隨訪受試者,可能不完全適合遠程化技術的應用。此種情況下,考慮數字化、智能化與傳統臨床試驗相結合的模式,是一種較為可靠的實施策略。近年來有研究者采取網絡社交媒體招募受試者,這種方法可能引入選擇性偏倚。研究者應該謹慎使用遠程化手段評估的研究終點,其有效性需要進行充分驗證。在臨床試驗設計時,需根據臨床試驗的特點,采用最合適的信息化技術。當缺乏足夠信息進行判斷時,可先開展小規模預試驗評估可行性[25]。
7.2 信息技術在臨床試驗中的倫理問題
在信息技術的應用中,研究者需要重點關注某些倫理問題,尤其是保證遠程參與的受試者的充分知情和同意確認。數字化技術支持下的臨床試驗中,通過網絡招募的受試者可能面臨個人信息和個人隱私的泄露(如個人身份信息、地理位置信息等)的巨大風險。應對這些問題,必須要事先制定與電子知情同意相關的標準操作規程,采用包括文本、圖形、音視頻、生物識別器和讀卡器等方式傳達與研究有關的信息,并獲得知情同意的記錄[26],同時對個人信息和個人隱私進行脫敏,盡可能地保護受試者的個人權益。遠程簽署電子知情同意時,應符合《電子簽名法》等相關法規的相關要求。相關內容在“保證數據安全的措施”中有更詳盡闡述。
7.3 數據的安全性、可靠性和合規性
在臨床試驗運行過程中,應確保數據能夠安全可靠地采集、傳輸和儲存。研究者應參考監管機構發布的相關指導原則以及行業專家達成的共識(或者規范),例如《藥物臨床試驗質量管理規范》《新冠肺炎疫情期間藥物臨床試驗管理指導原則(試行)》《藥物臨床試驗的電子數據采集技術指導原則》及FDA 21 CFR Part 11等,確保流程的合規性及數據的可靠性和安全性。
數據采集的信息化系統需要經過規范測試和嚴格認證,并將網絡安全作為認證的重要內容,確保系統的安全性、穩定性和合規性。在數據訪問權限上,依據“需要知道”和“最少特權”的安全原則[25],定期審查和更新,以防出現隱私泄露的風險。此外,應用區塊鏈技術可在一定程度上降低數據泄露的風險[27]。
7.4 實施過程中的質量和風險管控
電子化數據采集及管理方式在臨床試驗中的應用,對質量風險管理提出新的要求。在臨床試驗院外操作授權、遠程受試者招募、電子化知情同意、遠程訪視和監查、受試者隱私保護等遠程化、智能化操作方面需要設立嚴格的風險控制措施。此外,在信息化背景下,受試者的隨訪、數據采集、藥物配送、生物標本采集與運輸等都可能通過遠程化方式執行,使操作更為便利。但缺少與受試者的當面溝通可能影響其依從性,需要額外加以注意。可考慮通過提供日記卡或可穿戴設備,以及定期聯系(通過電話、電子郵件等方式)受試者了解試驗情況等方法,提高受試者的依從性。
臨床試驗的信息化建設屬于新興領域,為臨床試驗帶來了新的研究方式。試驗設計、獲得倫理委員會批準、受試者招募、受試者知情同意、研究數據采集、受試者訪視、數據監查、重點指標測量、不良反應報告、統計分析等各環節都可通過數字化、遠程化、智能化方式開展,但也面臨諸多挑戰。基本原則是盡早與監管機構及倫理委員會溝通,咨詢并征求其意見和建議。在合規的前提下,組建多元化的研究團隊,包括臨床專家、方法學專家、倫理專家、數據管理分析專家、網絡安全專家、工程師等,不斷探索完善,穩步推進實施,以滿足監管與注冊要求。
8 數據安全的倫理問題
臨床試驗采集的受試者相關研究數據,可包括健康狀況數據、醫療應用數據、醫療支付數據、臨床研究病例數據和生物組學數據等個人屬性數據。隨著時代的發展進步,研究中受試者的隱私,個人信息及數據安全等問題日益受到了廣泛關注。受試者隱私或個人信息的泄露可能造成其社會污名化或歧視,進而造成精神性和社會適應性的傷害。我國法律規定,受試者的個人信息和個人隱私受法律保護。涉及人類遺傳資源相關信息屬于國家秘密的,還需依規實施保密管理。開展數據處理活動,需履行數據安全保護義務。如發生信息泄露,研究者將承擔相應的法律責任[28-36]。為此,開展臨床試驗必須對研究數據的收集、存儲、使用、加工、傳輸、提供和公開等各項活動采取切實可行的必要措施,保護個人信息及個人隱私信息,保證數據的安全性[37]。
8.1 尊重受試者的知情權
研究者有義務為潛在的受試者提供充分的信息,從而讓受試者自由選擇是否參加研究。無論是用于特定的研究項目,還是目前尚無特定目的的未來研究,均需獲得受試者的知情同意。研究者還應保證允許受試者在試驗過程中無條件撤回授權以滿足知情的選擇退出程序[33]。對于目前尚無特定目的的未來研究,可采用廣泛知情同意的方式。倫理接受廣泛知情同意的前提是有合宜的研究管理,且研究目的明確后,需再次經倫理審查批準方可開展研究[28-29,36,38]。
遺傳數據難以做到完全匿名化,理論上可把個人數據與有遺傳信息和標識符的生物學樣本聯系起來,因此對于遺傳數據應有更多的保護措施[29]。按規定,對于涉及采集我國人類遺傳資源的研究,需事先告知受試者并獲得其書面知情同意[30]。如需利用臨床/研究剩余標本或者遺傳數據進行其他目的的研究,則必須經倫理委員會審查批準并再次獲得受試者同意[29,35]。
研究者必須全面、真實和準確地告知受試者試驗過程中與所收集數據相關的內容,并確保數據的使用不超過知情同意告知的范圍。告知內容包括:數據收集的目的、收集方法、數據儲存、數據處理(如匿名化或去標識化處理)、數據使用范圍、數據保管、研究數據的保密范圍和措施、可能的數據泄露風險,并且應告知受試者有自愿參與和隨時無條件退出的權力,以及研究過程中可撤回其數據以及如何撤回。此外,還需告知以下內容:是否告知研究目的以外的研究發現,以及相應的實施方式;數據分析結果可能與個人信息的哪些來源相關聯;什么類型的研究需要獲得受試者的再次同意才能實施;誰將從研究中受益;向受試者通報研究結果的機制;如何確保受試者的權益不受損害等[28-29,35,39]。
8.2 保證數據安全的措施
盡管臨床試驗結束時可將數據匿名化,但研究過程中仍然存在有身份標識的個人信息被泄露的風險。在設計臨床試驗時,研究者必須針對個人信息及數據安全采取措施,確保數據處于有效保護和合法利用的狀態,并具備保障持續安全狀態的能力。具體措施可考慮但不限于以下方面[8,36-40]:
① 建立數據保密制度:數據保密是臨床試驗過程中必須遵守的基本原則,研究機構應設定程序保證研究數據的保密性,建立及簽署保密協議以規范相應人員的行為,建立保密系統防止數據庫的泄密。
② 分權限管理數據:對數據控制者及數據使用者執行功能和數據訪問分權限管理,并限制第三方對數據的使用權限。
③ 去標識化:在不影響數據完整性的條件下,對敏感的個人屬性信息進行處理,針對可唯一識別到個人或披露后會給個人造成重大影響的信息,應去除個人屬性信息;針對可間接關聯到個人的信息,宜進行泛化、轉化等處理,例如數據匿名化或去標識化。去標識化所使用的代碼,應嚴格保密,原則上代碼索引僅由開展研究的醫療機構保存,企業不能獲得未去標識化的數據。
④ 數據加密處理:對數據進行加密處理,保證數據存儲,傳輸的保密性和完整性,加密數據和密鑰應分別存儲。
⑤ 控制數據使用數量:僅使用所需的最小數據集。
⑥ 有數據修改的過程管理:確保數據管理過程可溯源,研究者對數據進行修改需要簽名,中間過程數據需保存,不得覆蓋原有過程記錄。
⑦ 制定數據備份集恢復策略:定期對數據進行備份,建立介質存取、驗證和轉存管理制度。
⑧ 數據核查:建立數據核查機制。在不違反保密原則和相關法規的前提下,監查員、稽查員、倫理委員會和藥品監督管理部門檢查人員可查閱受試者的原始醫學記錄,以核實臨床試驗的過程和數據。
⑨ 數據發布和共享:發布臨床試驗結果時受試者的身份信息應保密。去標識化后的數據可在研究者之間自由共享。
9 結語
臨床試驗是醫藥創新和改善診療過程中不可或缺的環節。科學的設計和實施是確保臨床試驗獲得可靠結論的基石。期待我國廣大臨床試驗研究者和相關從業人員不斷提升能力,開展更多高質量的臨床試驗,為打造具備國際競爭力的創新醫藥生態系統提供有力支持,為臨床決策提供更多科學證據。
《藥物臨床試驗設計與實施中疑難問題處理的專家共識》專家名單
執筆:李濟賓(中山大學腫瘤防治中心),王書航(中國醫學科學院腫瘤醫院),李婧(中國醫學科學院皮膚病醫院),張麗華(中國醫學科學院阜外醫院),馮芳(中國醫學科學院阜外醫院),李靜(中國醫學科學院阜外醫院)
專家共識寫作組(按姓氏拼音排序):
白樺(中國醫學科學院北京協和醫院),曹國英(復旦大學附屬華山醫院),曹玉(青島大學附屬醫院),陳懋(福建省立醫院),車宇航(中國醫學科學院整形醫院),董志強(內蒙古科技大學包頭醫學院第一附屬醫院),馮芳(中國醫學科學院阜外醫院),郭彩霞(首都醫科大學附屬北京同仁醫院),宦靜(中國醫學科學院皮膚病醫院),姜敏(江西省人民醫院),蔣發燁(廣東省人民醫院),李海燕(北京大學第三醫院),李靜(中國醫學科學院阜外醫院),李婧(中國醫學科學院皮膚病醫院),李濟賓(中山大學腫瘤防治中心),李衛(中國醫學科學院阜外醫院),李雪寧(復旦大學附屬中山醫院),李卓(中南大學湘雅二醫院),林陽(首都醫科大學附屬北京安貞醫院),劉玨(武漢市中心醫院),劉利軍(中國醫學科學院血液病醫院),劉中國(山西醫科大學第一醫院),阮鄒榮(浙江大學醫學院附屬第二醫院),商樸(中國醫學科學院阜外醫院),孫明媛(中國醫學科學院血液病醫院),唐蕾(中山大學附屬第一醫院),王白璐(山東大學齊魯醫院),王彩娥(河南科技大學第一附屬醫院),王煥玲(中國醫學科學院北京協和醫院),王清(中日友好醫院),王書航(中國醫學科學院腫瘤醫院),王淑梅(河北醫科大學第二醫院),王婷(蘭州大學第一醫院),王曉霞(山西醫科大學第二醫院),王欣(北京醫院),向瑾(四川大學華西醫院),徐懿萍(上海交通大學附屬瑞金醫院),陽國平(中南大學湘雅三醫院),岳熠(中國醫學科學院血液病醫院),鄒燕琴(中山大學孫逸仙紀念醫院),張海波(中國醫學科學院阜外醫院),張慶瑜(天津醫科大學總醫院),鄭姣(湖南省人民醫院),張麗華(中國醫學科學院阜外醫院),鄭昕(中國醫學科學院阜外醫院)
利益沖突:所有作者均聲明不存在利益沖突。