引用本文: 馬越, 吳堯, 馬愛霞, 李洪超. 籃式試驗的腫瘤藥物經濟學評價方法. 中國循證醫學雜志, 2022, 22(7): 862-868. doi: 10.7507/1672-2531.202201113 復制
近年來,全球腫瘤疾病負擔逐年增加,2020年新發癌癥病例已達1 925萬[1]。在此背景下,開發創新抗腫瘤藥成為各國醫藥衛生領域的熱點[2]。隨著基因組學和分子生物學的進步,在精準醫療框架下的藥物治療發展迅速,已有基因靶向藥物、免疫治療藥物等多種創新抗腫瘤藥在多國獲批上市,較傳統放、化療藥物可顯著提高患者健康獲益[3]。同時,在精準醫療思路驅動下不斷涌現新型臨床試驗設計,主要包括“籃式試驗(basket trial)”和“傘式試驗(umbrella trial)”[4]。前者也稱籃子試驗,通常納入具有相同基因和分子變異的不同組織學類型腫瘤患者,用于評估某個靶點明確的靶向藥物治療多個腫瘤類型患者的安全性和有效性[5]。籃式試驗因臨床應用范圍更為廣泛,其臨床試驗注冊數近年快速增加,2021年已注冊臨床試驗數為31個,是2020年注冊總數16個的近兩倍[6]。鑒于試驗設計的特殊性,籃式試驗為相關腫瘤藥物經濟學評價帶來了巨大挑戰。目前國內外尚無公開發表的有關籃式試驗腫瘤藥物經濟學評價的方法學研究和指南[7],因此探究合理的籃式試驗的腫瘤藥物經濟學評價方法能夠彌補方法學空白,推動中國藥物經濟學評價研究發展。
本文將根據籃式試驗特點和加拿大藥物與衛生技術局(Canadian agency for drugs and technologies in health,CADTH)的評估報告案例,介紹兩種有關籃式試驗的藥物經濟學評價方法并分析優劣,以期為中國腫瘤藥物經濟學評價及相關決策提供參考。
1 籃式試驗與藥物經濟學評價
1.1 籃式試驗特點
籃式試驗是一種新型臨床試驗,并常用于抗腫瘤藥物評估[8]。由于其特殊的試驗設計思路(圖1),目標藥品針對的是相同基因突變的多癌種腫瘤,能夠解決傳統臨床試驗單獨針對某一具體罕見癌種導致的樣本量小和統計效能不足等問題,大大節省了臨床試驗時間和資源,提高了創新抗腫瘤藥的評估效率[9-11]。

與傳統臨床試驗相比,籃式試驗在目標人群和對照人群兩方面有較大差別。在目標人群方面,傳統臨床試驗無論是單臂試驗還是隨機對照試驗,目標人群入組時均有嚴格的納入與排除標準,即患者必須患有同一類型腫瘤,甚至對疾病嚴重程度和并發癥等有所要求,以保證入組人群基線特征相似和各組間有較強的可比性。而對于籃式試驗,只要求目標人群具有相同的特定生物標志物或分子改變,各組患者可患有不同類型腫瘤,不同亞組癌種患者間基線特征不同,異質性較大。此外,由于部分亞組癌種為罕見病,使得入組的部分亞組癌種人群樣本量較小,甚至僅有個位數。在對照組方面,傳統臨床試驗常采用隨機化的方法,選取安慰劑或陽性治療藥物作為對照治療,以比較兩治療方案間的療效差異。在傳統臨床試驗設計中,由于隨機對照試驗干預和對照所針對的患者為同一癌種患者且基線特征相似,研究者很容易為對照組患者選取統一的干預方案并對研究結果做出解釋。而對于籃式試驗,由于目標人群亞組癌種不同且每個亞組癌種往往都有各自的標準治療方案,使得對照選取不統一,導致較難構建統一治療方案的對照臂,故籃式試驗通常被設計為單臂非隨機化的形式。
1.2 一般腫瘤藥物經濟學評價方法不適用籃式試驗的經濟性研究
慢性疾病藥物經濟學評價需要基于干預方案和對照方案對治療目標人群所獲健康獲益和資源消耗進行長期模擬。在一般腫瘤藥物經濟學評價中,用于模擬患者長期生存情況的數據通常來自單臂或隨機對照試驗。研究者往往可通過臨床試驗患者個體數據(individual patients data,IPD)或根據公開發表的臨床試驗中的無進展生存(progression free survival,PFS)曲線和總生存(overall survival,OS)曲線重構IPD,對目標人群疾病進展和生存情況進行外推擬合。再把生存外推結果用于馬爾科夫模型(Markov model)或分區生存模型(partitioned survival model),而后結合醫療資源單位成本和疾病各健康狀態效用值等參數,模擬各組患者長期人均健康獲益和成本消耗。最后,計算得到增量成本-效果比(incremental cost effectiveness ratio,ICER),將ICER與閾值比較,判斷干預方案與對照相比是否具有衛生經濟性。
籃式試驗納入患者為多癌種混合狀態,異質性較大,導致干預組藥物對各癌種的療效可能不一致,即各癌種治療后進展速度或死亡速度不同,導致各時間點各癌種患者的分布不同,而且不同癌種不同健康狀態患者的成本和效用值也有所差別。由于各時間點各癌種患者的分布比例不同,難以計算某一周期總的成本和健康產出。另一方面,如果籃式試驗選取已發表的不同癌種標準治療方案的臨床試驗結果作為對照,也會出現對照組內各癌種亞組人群異質性較大的問題,同樣無法直接使用統一的PFS或OS數據作為對照進行長期模擬。因此,一般腫瘤藥物經濟學評價方法并不適用于籃式試驗的腫瘤藥物經濟學研究。
2 籃式試驗的藥物經濟學評價案例分析
目前國內外尚無有關籃式臨床試驗的藥物經濟學評價方法學研究和指南公開發表。但CADTH的加拿大腫瘤藥物共同評議組(pan-Canadian oncology drug review,pCODR)在2019年發布了1份有關籃式試驗經濟性評價的經濟指南報告(economic guidance report,EGR),作為拉羅替尼(larotrectinib)申請納入加拿大醫保報銷范圍所提交經濟性證據的審查結果[12]。此EGR中描述了針對拉羅替尼的籃式試驗的經濟性評價方法和結果。故本文對此案例進行分析,以介紹和探討籃式試驗的腫瘤藥物經濟學評價方法。
2.1 案例概述
該案例基線年為2018年,研究時限為5年,從加拿大醫療衛生系統角度出發,研究拉羅替尼與標準治療或常用治療方案相比治療成人和兒童神經營養因子受體酪氨酸激酶(neuro trophin receptor kinase,NTRK)基因融合陽性的局部晚期或轉移性實體瘤的衛生經濟性。拉羅替尼為口服制劑,劑量為成人患者200mg qd,兒童患者100mg/m2(不超過100mg bid)。拉羅替尼的安全性和有效性數據來自3個臨床試驗,3個臨床試驗均為籃式試驗(Ⅰ期LOXO-TRK-14001、Ⅱ期LOXO-TRK-15002及Ⅰ/Ⅱ期LOXO-TRK-15003),共納入73例成人和兒童患者,涉及包括結直腸癌(colorectal cancer,CRC)、非小細胞肺癌(non-small cell lung cancer,NSCLC)、黑色素瘤(melanoma)、甲狀腺癌(thyroid cancer,TC)、成人軟組織肉瘤(soft tissue sarcoma,STS)和兒童STS等在內的14個癌種。此案例通過合并分析(pooled analysis)和區分癌種分析(tumor-specific analysis)兩種方法對籃式試驗結果進行分析,并基于臨床試驗獲取部分模型參數,選用經典三狀態(PFS/PD/死亡)分區生存模型對患者治療后的終身治療成本、生命年(life year,LY)及質量調整生命年(quality-adjusted life year,QALY)進行模擬(模擬周期為28天)。而后采用成本-效果分析(cost-effectiveness analysis,CEA)和成本-效用分析(cost-utility analysis,CUA)計算兩種方法各自的ICER值來判斷拉羅替尼的經濟性。上述合并分析和區分癌種分析兩種分析方法是籃式試驗常用的藥物經濟學評價方法,我們對此進行重點描述。
2.2 合并分析
此案例所應用的合并分析方法示意圖見圖2。其思路為:對目標藥品拉羅替尼組不區分癌種亞型,統一分析所有癌種患者的疾病進展和生存情況。繪制拉羅替尼組唯一的PFS和OS生存曲線,并通過參數生存分析進行長期外推。最后,通過模型模擬出拉羅替尼組患者的長期成本和健康產出(模型每周期成本和各健康效用值參數被設定為常數)。在對照方案選擇上,此方法選取了各癌種標準治療方案作為對照,且以臨床試驗報告的標準治療方案療效作為數據來源,通過各癌種生存曲線分別對各癌種PFS和OS曲線進行長期外推。再按外推結果通過模型分別計算各癌種標準治療方案患者的長期成本和健康產出,而后按拉羅替尼組各癌種患者人數對對照組結果進行加權,從而得到合并后的唯一對照組結果。最后,再根據兩組各自唯一的成本(△C為415 167美元)和健康產出(△E為0.833 QALY)結果計算ICER,為499 577美元/QALY。

LY:生命年;QALY:質量調整生命年;ICER:增量成本-效果比。
合并分析結果與一般腫瘤藥物經濟學評價結果類似,能夠得到拉羅替尼與對照相比治療一類基因突變相似癌種的唯一ICER。決策者可根據此ICER與閾值作比較,得出是否具有衛生經濟性的結論。合并分析在一定程度上解決了籃式試驗納入多個癌種難以評價的問題。然而,此種方法并沒有解決籃式試驗人群異質性問題,在很大程度上增加了藥物經濟學評價結果的不確定性。對于拉羅替尼組來說,各個癌種患者在同一時間疾病進展或死亡的風險不同,即各癌種患者分布隨時間發生變化,違背了模型的人群同質性假設;而且將模型每周期成本和各健康效用值參數設定為常數,無法估計每周期因人群分布變化導致的成本和健康產出的變化。此外,唯一的經濟性結論可能會“掩蓋”目標藥品治療某一具體癌種的實際經濟性結論,使唯一的經濟性結論相對于某一具體癌種為“假陽性”或“假陰性”。從而誘導錯誤決策,影響最終的資源配置效率。對于對照組來說,將不同的對照方案結果加權合并后雖能得到唯一對照方案模擬結果,但對照方案間的差異使得唯一結果難以被解釋。合并分析方法的特點詳見表1。

2.3 區分癌種分析
此案例所應用的區分癌種分析的方法示意圖見圖3。其思路為:按各癌種區分拉羅替尼組患者,且對每一亞組患者疾病進展和生存情況進行分析。繪制癌種亞組人群的PFS和OS生存曲線,并通過參數生存分析進行長期外推。最后,通過模型模擬拉羅替尼各癌種亞組患者的長期成本和健康產出(各癌種亞組設置特定的每周期成本和健康效用值)。不過,由于區分亞組后部分罕見癌種患者樣本量不足,此案例僅構建6個模型對6個樣本量較大的癌種亞組進行分析,包括CRC、NSCLC、黑色素瘤、TC、成人STS和兒童STS。對于對照方案,此方法選取了各癌種標準治療方案及陽性對照方案作為對照(如對NSCLC腫瘤亞型,除選用標準治療方案外還將納武利尤單抗作為對照治療藥物)。同樣以臨床試驗報告的各對照結果作為數據來源,通過各癌種臨床試驗報告的生存曲線分別對PFS和OS曲線進行長期外推。再根據外推結果通過模型分別計算各癌種對照方案患者長期成本和健康產出。最后,計算拉羅替尼組各癌種亞組與其相應對照方案的多個ICER。此案例根據6個癌種亞組及其對照,共計算得到11個ICER,詳見表2。其中最小ICER為169 381美元/QALY,是拉羅替尼對比標準治療方案治療CRC的結果;最大ICER為1 295 244美元/QALY,是全劑量拉羅替尼對比標準治療方案治療兒童STS(大于2歲)的結果。

LY:生命年;QALY:質量調整生命年;ICER:增量成本-效果比。

區分癌種分析對籃式試驗中各癌種患者進行了亞組分析,即評估目標藥品治療每一癌種的衛生經濟性,在很大程度上解決了目標人群異質性大的問題。然而,此種分析方法計算結果并不唯一,得到的是多個ICER。無法得出目標藥品治療基因突變相同的所有癌種的經濟性結論,從而難以支持相關決策。此外,對于相同基因型突變所致罕見腫瘤而言,籃式試驗納入該罕見腫瘤患者樣本量不足,研究者無法對罕見癌種亞組進行經濟性評價,最終會導致醫保報銷相關決策信息缺失。同時,如果決策者根據同一藥品的多個ICER區分適應癥作出決策,會增加藥品在實際報銷中的管理難度,不利于決策結果落地。區分癌種分析方法的特點詳見表3。

2.4 CADTH再分析及決策結果
由于CADTH對此案例采用的經濟性評價方法的合理性有分歧,故其對此案例中提交的模型進行了再分析以降低經濟性評價結果的不確定性。CADTH再分析的主要調整為延長了研究時限、考慮了生存曲線的不確定性、考慮了更大的成本范圍及進一步區分了成人/兒童STS患者亞組。雖然CADTH再分析考慮了更多影響評價結果的因素,且調整模型后增加了模型的合理性,但由于籃式試驗本身的特點,CADTH也未能解決合并分析人群存在異質性和各健康狀態效用值假設為常數,區分癌種分析樣本量不足等重要問題。
最終pCODR專家審評委員會的決策結果為不推薦將拉羅替尼(治療成人/兒童局部晚期或轉移性NTRK基因融合實體瘤)納入醫療保險報銷范圍。此決策原因除拉羅替尼與現有治療或標準治療方案相比,額外臨床獲益的不確定性較大外,還由于籃式試驗人群異質性過大等問題導致無法得到拉羅替尼與對照相比是否具有經濟性的確切結論。pCODR專家審評委員會建議證據提供方未來需要提供更多的證據以支持決策,證據來源可以是已納入臨床試驗的更新數據、其他臨床試驗數據和真實世界數據等。
拉羅替尼被拒絕納入加拿大醫療保險報銷范圍1年后,證據提供方再次向CADTH遞交了納入醫療保險報銷范圍的申請。此次證據提供方更新了拉羅替尼臨床試驗數據,將患者樣本量由73例擴大到164例,同樣應用合并分析和區分癌種分析對其進行衛生經濟學評價,且區分癌種分析由6個癌種增加到11個癌種。后經CADTH再分析,pCODR專家審評委員會最終推薦拉羅替尼為有附加條件報銷(reimburse with conditions)。由此可見,雖然拉羅替尼更新證據后被納入加拿大醫療保險報銷范圍,但主要原因為其有效性證據更為充分,而經濟性評價結果仍被認為不確定性較大[13]。
3 討論
自2017年國家醫保局組織創新藥品醫保目錄準入談判以來,中國已完成5輪《國家基本醫療保險、工商保險和生育保險藥品目錄》(以下簡稱“醫保目錄”)動態調整工作[14]。由于中國腫瘤疾病負擔較重,抗腫瘤藥在歷年談判中都是重點類別。如2021年最新一輪談判有17種抗腫瘤藥談判成功,占所有談判成功目錄外藥品的1/4以上[14]。藥物經濟學評價結果作為經濟性證據,在抗腫瘤藥醫保目錄準入相關決策中發揮了重要作用[15]。
抗腫瘤藥藥物經濟學評價往往依托其臨床試驗,籃式試驗作為精準醫療下的新型試驗設計,為相關藥物經濟學評價帶來了巨大挑戰。籃式試驗最大特點就是目標人群異質性較大,主要表現在各癌種患者基線風險、相對療效、健康狀態效用值和資源消耗等方面的差異。如果根據現有分析方法對籃式試驗目標藥品治療某特定生物標志物相關的一系列疾病的衛生經濟性進行評價,還存在諸多不足。如合并分析方法難以解決人群異質性問題,區分癌種分析難以解決具體癌種樣本量不足的問題等,在很大程度上增加了藥物經濟學評價結果的不確定性。
本文通過案例分析介紹了目前有關籃式試驗的初步藥物經濟學評價方法,并有如下幾點建議供相關藥物經濟學評價研究者、相關政策決策者及提交經濟性證據的企業參考:① 研究者應用現有合并分析或區分癌種分析時要充分報告和分析不同方法的不足之處,尤其是人群異質性導致的研究假設和亞組分析樣本量小導致的決策信息缺失,為決策者呈現客觀的分析結果及其不確定性。同時,研究者應探索解決人群異質性的合并評價方法,以提高特定生物標志物相關治療方案治療多癌種藥物經濟學評價結果的合理性和確定性,從而回答目標藥品治療多癌種是否經濟的問題,降低決策難度。② 決策者要充分考慮應用現有合并分析或區分癌種分析的藥物經濟學評價結果的不確定性,在決策時可根據證據質量考慮將多癌種統一納入報銷范圍或僅將證據充分的單一癌種納入報銷范圍。同時,決策者也可考慮建立適合中國國情的風險共擔機制[16-17],以分擔相關決策的不確定性風險,保證醫保基金可持續發展。由于籃式試驗特點,采用該類設計的目標藥品醫保準入問題與多適應癥藥品醫保準入問題有相似之處。然而,中國尚未建立多適應癥藥品醫保準入標準程序,政策制定者制定相關準入政策時可能需要兼顧上述兩類問題。③ 對于提交經濟性證據的企業來說,證據質量是影響藥品能否成功納入醫保報銷范圍的重要因素。因此,制藥企業應及時更新籃式試驗臨床試驗數據,并在藥品上市后主動收集其治療各癌種的真實世界數據[18],以擴充各亞型癌種樣本量,從而滿足衛生經濟學評價數據需求,避免部分癌種經濟性證據的缺失。
隨著生物技術發展,籃式試驗等新型試驗設計應用越來越廣泛,為相關腫瘤藥物經濟學評價帶來一定挑戰。本文對目前有關籃式試驗的評價方法進行案例分析和介紹,以期為相關評價和決策提供參考。但文中所提方法還存在較大局限性和不確定性,不能完全滿足藥物經濟學評價需求,唯有藥物經濟學評價研究者、相關政策決策者和提交經濟性證據的企業共同努力,才能降低相關評價結果和決策的不確定性,從而促進醫療衛生資源合理配置。
近年來,全球腫瘤疾病負擔逐年增加,2020年新發癌癥病例已達1 925萬[1]。在此背景下,開發創新抗腫瘤藥成為各國醫藥衛生領域的熱點[2]。隨著基因組學和分子生物學的進步,在精準醫療框架下的藥物治療發展迅速,已有基因靶向藥物、免疫治療藥物等多種創新抗腫瘤藥在多國獲批上市,較傳統放、化療藥物可顯著提高患者健康獲益[3]。同時,在精準醫療思路驅動下不斷涌現新型臨床試驗設計,主要包括“籃式試驗(basket trial)”和“傘式試驗(umbrella trial)”[4]。前者也稱籃子試驗,通常納入具有相同基因和分子變異的不同組織學類型腫瘤患者,用于評估某個靶點明確的靶向藥物治療多個腫瘤類型患者的安全性和有效性[5]。籃式試驗因臨床應用范圍更為廣泛,其臨床試驗注冊數近年快速增加,2021年已注冊臨床試驗數為31個,是2020年注冊總數16個的近兩倍[6]。鑒于試驗設計的特殊性,籃式試驗為相關腫瘤藥物經濟學評價帶來了巨大挑戰。目前國內外尚無公開發表的有關籃式試驗腫瘤藥物經濟學評價的方法學研究和指南[7],因此探究合理的籃式試驗的腫瘤藥物經濟學評價方法能夠彌補方法學空白,推動中國藥物經濟學評價研究發展。
本文將根據籃式試驗特點和加拿大藥物與衛生技術局(Canadian agency for drugs and technologies in health,CADTH)的評估報告案例,介紹兩種有關籃式試驗的藥物經濟學評價方法并分析優劣,以期為中國腫瘤藥物經濟學評價及相關決策提供參考。
1 籃式試驗與藥物經濟學評價
1.1 籃式試驗特點
籃式試驗是一種新型臨床試驗,并常用于抗腫瘤藥物評估[8]。由于其特殊的試驗設計思路(圖1),目標藥品針對的是相同基因突變的多癌種腫瘤,能夠解決傳統臨床試驗單獨針對某一具體罕見癌種導致的樣本量小和統計效能不足等問題,大大節省了臨床試驗時間和資源,提高了創新抗腫瘤藥的評估效率[9-11]。

與傳統臨床試驗相比,籃式試驗在目標人群和對照人群兩方面有較大差別。在目標人群方面,傳統臨床試驗無論是單臂試驗還是隨機對照試驗,目標人群入組時均有嚴格的納入與排除標準,即患者必須患有同一類型腫瘤,甚至對疾病嚴重程度和并發癥等有所要求,以保證入組人群基線特征相似和各組間有較強的可比性。而對于籃式試驗,只要求目標人群具有相同的特定生物標志物或分子改變,各組患者可患有不同類型腫瘤,不同亞組癌種患者間基線特征不同,異質性較大。此外,由于部分亞組癌種為罕見病,使得入組的部分亞組癌種人群樣本量較小,甚至僅有個位數。在對照組方面,傳統臨床試驗常采用隨機化的方法,選取安慰劑或陽性治療藥物作為對照治療,以比較兩治療方案間的療效差異。在傳統臨床試驗設計中,由于隨機對照試驗干預和對照所針對的患者為同一癌種患者且基線特征相似,研究者很容易為對照組患者選取統一的干預方案并對研究結果做出解釋。而對于籃式試驗,由于目標人群亞組癌種不同且每個亞組癌種往往都有各自的標準治療方案,使得對照選取不統一,導致較難構建統一治療方案的對照臂,故籃式試驗通常被設計為單臂非隨機化的形式。
1.2 一般腫瘤藥物經濟學評價方法不適用籃式試驗的經濟性研究
慢性疾病藥物經濟學評價需要基于干預方案和對照方案對治療目標人群所獲健康獲益和資源消耗進行長期模擬。在一般腫瘤藥物經濟學評價中,用于模擬患者長期生存情況的數據通常來自單臂或隨機對照試驗。研究者往往可通過臨床試驗患者個體數據(individual patients data,IPD)或根據公開發表的臨床試驗中的無進展生存(progression free survival,PFS)曲線和總生存(overall survival,OS)曲線重構IPD,對目標人群疾病進展和生存情況進行外推擬合。再把生存外推結果用于馬爾科夫模型(Markov model)或分區生存模型(partitioned survival model),而后結合醫療資源單位成本和疾病各健康狀態效用值等參數,模擬各組患者長期人均健康獲益和成本消耗。最后,計算得到增量成本-效果比(incremental cost effectiveness ratio,ICER),將ICER與閾值比較,判斷干預方案與對照相比是否具有衛生經濟性。
籃式試驗納入患者為多癌種混合狀態,異質性較大,導致干預組藥物對各癌種的療效可能不一致,即各癌種治療后進展速度或死亡速度不同,導致各時間點各癌種患者的分布不同,而且不同癌種不同健康狀態患者的成本和效用值也有所差別。由于各時間點各癌種患者的分布比例不同,難以計算某一周期總的成本和健康產出。另一方面,如果籃式試驗選取已發表的不同癌種標準治療方案的臨床試驗結果作為對照,也會出現對照組內各癌種亞組人群異質性較大的問題,同樣無法直接使用統一的PFS或OS數據作為對照進行長期模擬。因此,一般腫瘤藥物經濟學評價方法并不適用于籃式試驗的腫瘤藥物經濟學研究。
2 籃式試驗的藥物經濟學評價案例分析
目前國內外尚無有關籃式臨床試驗的藥物經濟學評價方法學研究和指南公開發表。但CADTH的加拿大腫瘤藥物共同評議組(pan-Canadian oncology drug review,pCODR)在2019年發布了1份有關籃式試驗經濟性評價的經濟指南報告(economic guidance report,EGR),作為拉羅替尼(larotrectinib)申請納入加拿大醫保報銷范圍所提交經濟性證據的審查結果[12]。此EGR中描述了針對拉羅替尼的籃式試驗的經濟性評價方法和結果。故本文對此案例進行分析,以介紹和探討籃式試驗的腫瘤藥物經濟學評價方法。
2.1 案例概述
該案例基線年為2018年,研究時限為5年,從加拿大醫療衛生系統角度出發,研究拉羅替尼與標準治療或常用治療方案相比治療成人和兒童神經營養因子受體酪氨酸激酶(neuro trophin receptor kinase,NTRK)基因融合陽性的局部晚期或轉移性實體瘤的衛生經濟性。拉羅替尼為口服制劑,劑量為成人患者200mg qd,兒童患者100mg/m2(不超過100mg bid)。拉羅替尼的安全性和有效性數據來自3個臨床試驗,3個臨床試驗均為籃式試驗(Ⅰ期LOXO-TRK-14001、Ⅱ期LOXO-TRK-15002及Ⅰ/Ⅱ期LOXO-TRK-15003),共納入73例成人和兒童患者,涉及包括結直腸癌(colorectal cancer,CRC)、非小細胞肺癌(non-small cell lung cancer,NSCLC)、黑色素瘤(melanoma)、甲狀腺癌(thyroid cancer,TC)、成人軟組織肉瘤(soft tissue sarcoma,STS)和兒童STS等在內的14個癌種。此案例通過合并分析(pooled analysis)和區分癌種分析(tumor-specific analysis)兩種方法對籃式試驗結果進行分析,并基于臨床試驗獲取部分模型參數,選用經典三狀態(PFS/PD/死亡)分區生存模型對患者治療后的終身治療成本、生命年(life year,LY)及質量調整生命年(quality-adjusted life year,QALY)進行模擬(模擬周期為28天)。而后采用成本-效果分析(cost-effectiveness analysis,CEA)和成本-效用分析(cost-utility analysis,CUA)計算兩種方法各自的ICER值來判斷拉羅替尼的經濟性。上述合并分析和區分癌種分析兩種分析方法是籃式試驗常用的藥物經濟學評價方法,我們對此進行重點描述。
2.2 合并分析
此案例所應用的合并分析方法示意圖見圖2。其思路為:對目標藥品拉羅替尼組不區分癌種亞型,統一分析所有癌種患者的疾病進展和生存情況。繪制拉羅替尼組唯一的PFS和OS生存曲線,并通過參數生存分析進行長期外推。最后,通過模型模擬出拉羅替尼組患者的長期成本和健康產出(模型每周期成本和各健康效用值參數被設定為常數)。在對照方案選擇上,此方法選取了各癌種標準治療方案作為對照,且以臨床試驗報告的標準治療方案療效作為數據來源,通過各癌種生存曲線分別對各癌種PFS和OS曲線進行長期外推。再按外推結果通過模型分別計算各癌種標準治療方案患者的長期成本和健康產出,而后按拉羅替尼組各癌種患者人數對對照組結果進行加權,從而得到合并后的唯一對照組結果。最后,再根據兩組各自唯一的成本(△C為415 167美元)和健康產出(△E為0.833 QALY)結果計算ICER,為499 577美元/QALY。

LY:生命年;QALY:質量調整生命年;ICER:增量成本-效果比。
合并分析結果與一般腫瘤藥物經濟學評價結果類似,能夠得到拉羅替尼與對照相比治療一類基因突變相似癌種的唯一ICER。決策者可根據此ICER與閾值作比較,得出是否具有衛生經濟性的結論。合并分析在一定程度上解決了籃式試驗納入多個癌種難以評價的問題。然而,此種方法并沒有解決籃式試驗人群異質性問題,在很大程度上增加了藥物經濟學評價結果的不確定性。對于拉羅替尼組來說,各個癌種患者在同一時間疾病進展或死亡的風險不同,即各癌種患者分布隨時間發生變化,違背了模型的人群同質性假設;而且將模型每周期成本和各健康效用值參數設定為常數,無法估計每周期因人群分布變化導致的成本和健康產出的變化。此外,唯一的經濟性結論可能會“掩蓋”目標藥品治療某一具體癌種的實際經濟性結論,使唯一的經濟性結論相對于某一具體癌種為“假陽性”或“假陰性”。從而誘導錯誤決策,影響最終的資源配置效率。對于對照組來說,將不同的對照方案結果加權合并后雖能得到唯一對照方案模擬結果,但對照方案間的差異使得唯一結果難以被解釋。合并分析方法的特點詳見表1。

2.3 區分癌種分析
此案例所應用的區分癌種分析的方法示意圖見圖3。其思路為:按各癌種區分拉羅替尼組患者,且對每一亞組患者疾病進展和生存情況進行分析。繪制癌種亞組人群的PFS和OS生存曲線,并通過參數生存分析進行長期外推。最后,通過模型模擬拉羅替尼各癌種亞組患者的長期成本和健康產出(各癌種亞組設置特定的每周期成本和健康效用值)。不過,由于區分亞組后部分罕見癌種患者樣本量不足,此案例僅構建6個模型對6個樣本量較大的癌種亞組進行分析,包括CRC、NSCLC、黑色素瘤、TC、成人STS和兒童STS。對于對照方案,此方法選取了各癌種標準治療方案及陽性對照方案作為對照(如對NSCLC腫瘤亞型,除選用標準治療方案外還將納武利尤單抗作為對照治療藥物)。同樣以臨床試驗報告的各對照結果作為數據來源,通過各癌種臨床試驗報告的生存曲線分別對PFS和OS曲線進行長期外推。再根據外推結果通過模型分別計算各癌種對照方案患者長期成本和健康產出。最后,計算拉羅替尼組各癌種亞組與其相應對照方案的多個ICER。此案例根據6個癌種亞組及其對照,共計算得到11個ICER,詳見表2。其中最小ICER為169 381美元/QALY,是拉羅替尼對比標準治療方案治療CRC的結果;最大ICER為1 295 244美元/QALY,是全劑量拉羅替尼對比標準治療方案治療兒童STS(大于2歲)的結果。

LY:生命年;QALY:質量調整生命年;ICER:增量成本-效果比。

區分癌種分析對籃式試驗中各癌種患者進行了亞組分析,即評估目標藥品治療每一癌種的衛生經濟性,在很大程度上解決了目標人群異質性大的問題。然而,此種分析方法計算結果并不唯一,得到的是多個ICER。無法得出目標藥品治療基因突變相同的所有癌種的經濟性結論,從而難以支持相關決策。此外,對于相同基因型突變所致罕見腫瘤而言,籃式試驗納入該罕見腫瘤患者樣本量不足,研究者無法對罕見癌種亞組進行經濟性評價,最終會導致醫保報銷相關決策信息缺失。同時,如果決策者根據同一藥品的多個ICER區分適應癥作出決策,會增加藥品在實際報銷中的管理難度,不利于決策結果落地。區分癌種分析方法的特點詳見表3。

2.4 CADTH再分析及決策結果
由于CADTH對此案例采用的經濟性評價方法的合理性有分歧,故其對此案例中提交的模型進行了再分析以降低經濟性評價結果的不確定性。CADTH再分析的主要調整為延長了研究時限、考慮了生存曲線的不確定性、考慮了更大的成本范圍及進一步區分了成人/兒童STS患者亞組。雖然CADTH再分析考慮了更多影響評價結果的因素,且調整模型后增加了模型的合理性,但由于籃式試驗本身的特點,CADTH也未能解決合并分析人群存在異質性和各健康狀態效用值假設為常數,區分癌種分析樣本量不足等重要問題。
最終pCODR專家審評委員會的決策結果為不推薦將拉羅替尼(治療成人/兒童局部晚期或轉移性NTRK基因融合實體瘤)納入醫療保險報銷范圍。此決策原因除拉羅替尼與現有治療或標準治療方案相比,額外臨床獲益的不確定性較大外,還由于籃式試驗人群異質性過大等問題導致無法得到拉羅替尼與對照相比是否具有經濟性的確切結論。pCODR專家審評委員會建議證據提供方未來需要提供更多的證據以支持決策,證據來源可以是已納入臨床試驗的更新數據、其他臨床試驗數據和真實世界數據等。
拉羅替尼被拒絕納入加拿大醫療保險報銷范圍1年后,證據提供方再次向CADTH遞交了納入醫療保險報銷范圍的申請。此次證據提供方更新了拉羅替尼臨床試驗數據,將患者樣本量由73例擴大到164例,同樣應用合并分析和區分癌種分析對其進行衛生經濟學評價,且區分癌種分析由6個癌種增加到11個癌種。后經CADTH再分析,pCODR專家審評委員會最終推薦拉羅替尼為有附加條件報銷(reimburse with conditions)。由此可見,雖然拉羅替尼更新證據后被納入加拿大醫療保險報銷范圍,但主要原因為其有效性證據更為充分,而經濟性評價結果仍被認為不確定性較大[13]。
3 討論
自2017年國家醫保局組織創新藥品醫保目錄準入談判以來,中國已完成5輪《國家基本醫療保險、工商保險和生育保險藥品目錄》(以下簡稱“醫保目錄”)動態調整工作[14]。由于中國腫瘤疾病負擔較重,抗腫瘤藥在歷年談判中都是重點類別。如2021年最新一輪談判有17種抗腫瘤藥談判成功,占所有談判成功目錄外藥品的1/4以上[14]。藥物經濟學評價結果作為經濟性證據,在抗腫瘤藥醫保目錄準入相關決策中發揮了重要作用[15]。
抗腫瘤藥藥物經濟學評價往往依托其臨床試驗,籃式試驗作為精準醫療下的新型試驗設計,為相關藥物經濟學評價帶來了巨大挑戰。籃式試驗最大特點就是目標人群異質性較大,主要表現在各癌種患者基線風險、相對療效、健康狀態效用值和資源消耗等方面的差異。如果根據現有分析方法對籃式試驗目標藥品治療某特定生物標志物相關的一系列疾病的衛生經濟性進行評價,還存在諸多不足。如合并分析方法難以解決人群異質性問題,區分癌種分析難以解決具體癌種樣本量不足的問題等,在很大程度上增加了藥物經濟學評價結果的不確定性。
本文通過案例分析介紹了目前有關籃式試驗的初步藥物經濟學評價方法,并有如下幾點建議供相關藥物經濟學評價研究者、相關政策決策者及提交經濟性證據的企業參考:① 研究者應用現有合并分析或區分癌種分析時要充分報告和分析不同方法的不足之處,尤其是人群異質性導致的研究假設和亞組分析樣本量小導致的決策信息缺失,為決策者呈現客觀的分析結果及其不確定性。同時,研究者應探索解決人群異質性的合并評價方法,以提高特定生物標志物相關治療方案治療多癌種藥物經濟學評價結果的合理性和確定性,從而回答目標藥品治療多癌種是否經濟的問題,降低決策難度。② 決策者要充分考慮應用現有合并分析或區分癌種分析的藥物經濟學評價結果的不確定性,在決策時可根據證據質量考慮將多癌種統一納入報銷范圍或僅將證據充分的單一癌種納入報銷范圍。同時,決策者也可考慮建立適合中國國情的風險共擔機制[16-17],以分擔相關決策的不確定性風險,保證醫保基金可持續發展。由于籃式試驗特點,采用該類設計的目標藥品醫保準入問題與多適應癥藥品醫保準入問題有相似之處。然而,中國尚未建立多適應癥藥品醫保準入標準程序,政策制定者制定相關準入政策時可能需要兼顧上述兩類問題。③ 對于提交經濟性證據的企業來說,證據質量是影響藥品能否成功納入醫保報銷范圍的重要因素。因此,制藥企業應及時更新籃式試驗臨床試驗數據,并在藥品上市后主動收集其治療各癌種的真實世界數據[18],以擴充各亞型癌種樣本量,從而滿足衛生經濟學評價數據需求,避免部分癌種經濟性證據的缺失。
隨著生物技術發展,籃式試驗等新型試驗設計應用越來越廣泛,為相關腫瘤藥物經濟學評價帶來一定挑戰。本文對目前有關籃式試驗的評價方法進行案例分析和介紹,以期為相關評價和決策提供參考。但文中所提方法還存在較大局限性和不確定性,不能完全滿足藥物經濟學評價需求,唯有藥物經濟學評價研究者、相關政策決策者和提交經濟性證據的企業共同努力,才能降低相關評價結果和決策的不確定性,從而促進醫療衛生資源合理配置。