患者報告結局(patient-reported outcome,PRO)在肺癌外科日益受到重視,逐步成為肺癌外科臨床研究的重要結局指標和癥狀管理的重要工具。常用的肺癌特異性PRO量表包括:肺癌癥狀量表、歐洲癌癥研究和治療組織生活質量核心量表及肺癌特異性量表、癌癥治療功能評估量表-肺癌子表、安德森癥狀量表-肺癌子表、肺癌患者術后癥狀量表和肺圍手術期癥狀量表。在肺癌外科領域中,目前肺癌特異性PRO量表的應用在量表選擇、數據采集和結局應用等方面尚缺乏權威的實施規范。本綜述旨在描述PRO量表在肺癌外科領域的應用現狀。
肺癌是目前發病率第二、死亡率第一的惡性腫瘤,嚴重威脅人類健康[1]。近年來,由于人們健康意識的提高和胸部電子計算機斷層掃描被廣泛應用于肺癌的篩查[2-3],早期肺癌的檢出率逐漸升高。手術是治療肺癌的重要手段之一[4-5]。有關肺癌的臨床研究目前更多關注的是術后并發癥、住院時間和長期生存率等傳統指標,但患者術后癥狀負擔重[6],傳統指標并不能反應患者的自身感受。患者報告結局(patient-reported outcome,PRO)是美國食品藥品監督管理局推薦使用的新型臨床結局指標[7],其能更好地反映來自患者的感受,可在評價不同治療方式和實施癥狀管理等方面能發揮重要作用。眾多高質量研究顯示[8-13]:基于PRO的癥狀監測可減輕患者的癥狀負擔、提高患者對治療的反應、提高患者的整體預后、改善患者與醫護之間的溝通以及提高患者的滿意度等。肺癌患者的癥狀負擔常使用PRO量表來評估,但目前肺癌PRO量表多被應用于藥物臨床試驗中[14-15],在肺癌外科領域中的應用尚未普及且存在較多亟待的問題[16-17]。本文擬對肺癌PRO量表在肺癌外科的應用現狀進行綜述,以促進其在肺癌外科領域更好地應用。
1 肺癌外科常用患者報告結局量表
1.1 肺癌癥狀量表
肺癌癥狀量表(lung cancer symptom scale,LCSS)是由Hollen等[18]于1985年開發的肺癌特異性量表,其內容包括患者的癥狀、對日常生活的干擾和生活質量3個方面。LCSS主要通過9個條目來評估患者過去24 h的癥狀,包括食欲、疲勞、咳嗽、呼吸困難、咯血和疼痛6個與肺癌相關的癥狀條目和癥狀總體嚴重程度、對生活的影響以及目前的總體生活質量3個總體條目。此外,該量表提供了一個用于醫師或觀察者填寫的量表,包括食欲、疲勞、咳嗽、氣促、痰中帶血和疼痛等6個條目。患者填寫的量表采用視覺模擬評分法,得分越高表示癥狀負擔越嚴重。觀察者填寫的量表評分為5個等級,0分表示“最嚴重”,25分表示“嚴重”,50分表示“中等”,75分表示“有一點”,100分表示“沒有”。國外多個研究對LCSS進行了信效度檢驗[18-20],它具有良好的心理測量學屬性,是一種可靠、有效的測量工具,但該量表在國內的應用較少。LCSS量表的優勢在于其內容簡單明了,并且提供了一份用于測量人員填寫的量表,但其評估范圍相比其它量表可能不夠全面[21],并且視覺模擬評分得出的數據分析難度較大。
1.2 歐洲癌癥研究和治療組織生活質量核心量表及肺癌特異性量表
歐洲癌癥研究與治療組織(European Organization for Research and Treatment of Cancer,EORTC)在1986年開發了癌癥患者生活質量核心量表EORTC QLQ-C30(Core 30 items)[22],目的是全方面評估癌癥患者的生活質量。QLQ-C30共30個條目分4個維度:功能狀態(身體、角色、情感、社會和認知共15個條目)、癥狀條目(疼痛、乏力、惡心和嘔吐共7個條目)、總體狀況(2個條目)和單條目癥狀(呼吸困難、失眠、食欲不振、腹瀉、便秘和經濟困難共6個條目)。該量表的回顧時間段為過去1周,條目1~28分為4個等級:1分表示“沒有”,2分表示“有點”,3分表示“相當”,4分表示“非常”,條目29、30分為7個等級:1表示“非常差”,7分表示“非常好”。
1994年EORTC在核心模塊基礎之上開發了肺癌生活質量子表QLQ-LC13(Quality of Life Questionnaire-Lung Cancer Module)[23],其通常和QLQ-C30一起使用,是目前臨床和研究中最常用的肺癌生活質量評估量表。QLQ-LC13主要用于評估肺癌患者特異性癥狀,包括單條目癥狀:咳嗽、咯血和使用止痛藥,多條目癥狀包括呼吸困難(3個條目)、疼痛(3個條目)、治療副作用(4個條目),回顧時間段和條目評分和QLQ-C30一樣。國外研究[24-26]發現EORTC QLQ-C30,QLQ-LC13具有良好的心理測量學屬性,國際健康結果測量聯盟也推薦這些量表作為肺癌患者的隨訪工具[27]。國內同樣有文獻報道了EORTC QLQ-C30,QLQ-LC13在中國肺癌人群中仍然具有良好的心理測量學屬性[28-29]。
最近,EORTC將舊量表QLQ-LC13更新為新量表QLQ-LC29 [30-31]。QLQ-LC29保留了既往13個條目中的12條,新增了17條,其中5條是僅用于肺癌手術患者的評估,其回顧時間段和條目評分和QLQ-C30一樣。國外研究[31-32]發現QLQ-LC29具有良好的心理測量學屬性。目前,我國學者[33]已經完成QLQ-LC29的漢化工作,該工具在我國正處于信效度檢驗階段。與QLQ-LC13相比,QLQ-LC29的優勢在于它能評估目前新興治療方式(如靶向治療、免疫治療和微創胸腔鏡手術治療等)產生的癥狀,但它目前在中國肺癌人群中的心理測量學屬性仍需進一步研究。
1.3 癌癥治療功能評估量表-肺癌子表
肺癌治療功能評估量表(Functional Assessment of Cancer Therapy,FACT)是Cella等[34]于1993年開發的一個評估癌癥患者整體生活質量的量表,從生理狀況(7個條目)、社會/家庭狀況(7個條目)、功能狀況(7個條目)和情感狀況(6個條目)等4個維度來評估患者生活質量[35]。FACT-L是在核心量表基礎上進行了補充的肺癌特異性量表,它的回顧時間段為過去1周,新增了氣促、體重下降、思維清晰、咳嗽、脫發困擾、食欲好、胸悶、呼吸通暢和是否曾抽過煙等9個條目[36,37]。目前,第四版FACT-L已經被翻譯成多種語言且廣泛應用于肺癌患者生活質量的評估[38-39]。FACT-L通常與FACT核心量表共同使用,分為5個等級,0分表示“一點也不”,1分表示“有一點”,2分表示“有些”,3表示“相當”,4分表示“非常”。萬崇華等[40]的研究驗證了FACT-L在中國肺癌人群中具有良好的心理測量學屬性。FACT-L的優勢在于它能在治療前區分不同臨床狀態的患者,可評估臨床相關的變化和癥狀的差異,但該量表條目多,患者的填寫負擔可能較重。
1.4 安德森癥狀量表-肺癌子表
MD安德森癥狀量表(MD Anderson Symptom Inventory,MDASI)是由美國MD安德森癌癥中心于2000年開發的用于評估癌癥癥狀的嚴重程度或其治療方法的核心模塊[41],包括了疼痛、疲勞/乏力、惡心、睡眠不安、苦惱、氣促、健忘、胃口差、瞌睡/昏昏欲睡、口干、悲傷感、嘔吐、麻木感共13個評估癌癥患者常見癥狀條目,和一般活動、情緒、工作、與他人的關系、走路、生活樂趣共6個評估生理和心理功能的條目。在MDASI的基礎之上,MD安德森癌癥中心開發了肺癌特異性量表(MD Anderson Symptom Inventory-Lung Cancer module,MDASI-LC)[42]。MDASI-LC包括了核心模塊中的13個癥狀和3個肺癌特異性癥狀(咳嗽、便秘和嗓子疼)。研究[43-45]表明其在國內外肺癌人群中具有良好的心理測量學屬性。而張立力等[46]的研究發現:該肺癌模塊所包含的癥狀可能不完全符合國內肺癌患者的現狀,因此其對MDASI-LC進行了適當的修訂,修訂后的量表包含6個肺癌特異性模塊(咳嗽、咳痰、咯血、胸悶、便秘和體重下降),并驗證了其在中國肺癌人群中具有良好的心理測量學屬性。另外,筆者所在團隊將MDASI-LC量表在肺癌手術患者中也做了信效度驗證,研究結果提示信效度均較高,相關文章正在投稿中。MDASI-LC的所有條目均采用0~10計分法,評分越高表示癥狀負擔越嚴重或功能被干擾越嚴重。0代表無任何癥狀或無任何功能干擾,10代表能想象的最嚴重癥狀或功能完全被干擾。MDASI-LC的優勢在于量表的回顧時間短(24 h),條目數量相對少,故它特別適合圍手術期癥狀快速變化的測量。另外,其內容易于理解且范圍相對全面;同時它還評估了這些癥狀對日常功能的干擾的嚴重程度。但是,該量表的開發和驗證是基于放化療人群完成的,對于肺癌手術患者的癥狀評估可能存在不全面之處。
1.5 肺癌患者術后癥狀量表
肺癌患者術后癥狀量表是由我國胸外科車國衛教授團隊[47]于2017年在MDASI-LC量表基礎之上修訂而成,用于評估肺癌患者術后的癥狀及嚴重程度。該量表包括咳嗽、疼痛、氣促、疲勞、虛汗、便秘、咽喉疼痛和失眠共8個癥狀條目,用以對患者肺癌術后的癥狀類型及其嚴重程度進行評估,經信效度驗證在中國肺癌手術人群中具有良好的心理測量學屬性[47]。該量表用于對患者癥狀的即時評估,條目評分采用0~10分計分法,0分表示“無癥狀”,10分表示“能想像的最嚴重程度”。國內有學者[48]使用該量表評估胸腔鏡下肺癌手術后患者1個月內的生活質量,發現胸腔鏡術后疼痛、咳嗽和氣促持續時間較其它癥狀更長,且咳嗽程度在術后30 d內有加重的趨勢。該量表的優勢在于它用于患者癥狀的即時評估,有效的消除了回憶偏倚。但該量表研制的時間較晚,且僅有中文版,目前國內應用亦較少。
1.6 肺圍手術期癥狀量表
肺圍手術期癥狀量表(Perioperative Symptom Assessment for Lung Surgery,PSA-Lung)是由石丘玲教授團隊[49]通過歐美醫藥管理部門推薦的PRO量表制定標準步驟[7]開發的一個特異性、靈敏性和可行性兼具的肺圍手術期癥狀量表。具體開發步驟包括:質性訪談及專家意見生成條目草稿、條目語言標化、心理測量學信效度驗證和應用參數的制定。該量表包括疼痛、咳嗽、氣促、睡眠不安、疲乏(乏力)、瞌睡(昏昏欲睡)、苦惱共7個癥狀條目和行走困難、日常活動困難2個功能條目。PSA-Lung的回顧時間段為過去24 h,條目評分采用0~10分計分法,0分表示“無癥狀”,10分表示“能想像的最嚴重程度”。該量表在肺圍手術期人群中開發,是專用于肺圍手術期癥狀評估的量表,并且已經在肺癌圍手術期人群中得到驗證,具有良好的信效度,信效度驗證的結果已經在2021年國際生活質量研究學會(International Society for Quality of Life Research,ISOQOL)大會上公布[49]。該量表的優勢在于回顧時間短,內容簡單明了,條目數少,患者填寫時負擔輕,且特別適合于肺手術患者圍手術期癥狀的高頻次測量。由于PSA-Lung是一個最新的肺手術特異性量表,它的臨床應用尚處于起步階段。
2 患者報告結局量表在肺癌外科的應用現狀
2.1 患者報告結局量表的選擇
在臨床和科研工作中,如何選擇適宜的PRO量表是研究者首要面臨的問題。目前,針對肺癌手術患者主要有6種常用的肺癌特異性評估量表,即LCSS、EORTC QLQ-C30+QLQ-LC13及QLQ-LC29、FACT-L、MDASI-LC、肺癌患者術后癥狀量表和PSA-Lung,其中僅后兩者完全是在肺手術患者中研制的量表。EORTC更新的QLQ-LC29、肺癌患者術后癥狀量表和PSA-Lung適用于肺癌手術患者的癥狀測量。肺癌外科PRO研究多為運用PRO量表比較不同手術方式和描述肺癌患者術后癥狀及日常功能受干擾情況的變化過程等方面[50-51]。不同量表評估的側重點不同,部分量表側重于癥狀評估、部分側重與生活質量評估。EORTC QLQ-C30 + QLQ-LC13是目前使用最多的肺癌患者PRO測量工具[24]。EORTC QLQ-C30 + QLQ-LC13和FACT-L評估范圍較全面,但患者的量表填寫負擔重,這可能會增加數據缺失的概率。有研究發現對于部分晚期肺癌患者,失訪或問卷填寫不完整患者較多[52]。FACT-L關注的更多是社會心理問題而不是肺癌的癥狀。與FACT-L不同,MDASI-LC則將評估重點放在癥狀和功能上[53-54]。LCSS的最大特點是它的簡潔性,但是它對于患者生活質量的評估全面性比EORTC和 FACT-L略顯不足,它忽略了患者的心理和社會領域方面的問題。
多個國家的專家共同起草、修訂的健康測量工具遴選標準指南旨在為測量者選擇合適的PRO測量提供依據,但目前該指南較多應用于指導系統評價的標準步驟[55]。PRO量表作為測量工具,其效果與其是否被恰當、規范地使用有關。例如,在選擇測量工具時應考慮量表的回顧時間段。另外,在選擇PRO量表時應該注意其適用人群,嚴格規范其使用過程、并正確解讀其結果參數時才能正確評估對患者預后的影響[12,24-56]。目前PRO量表的應用在肺癌外科領域仍處于初級階段[57-58],但最近2年才研發成功的QLQ-LC29、肺癌患者術后癥狀量表和PSA-Lung等量表的使用,有望實現肺癌PRO量表在肺癌外科患者中的精準應用。
2.2 患者報告結局量表的數據采集
目前,肺癌外科PRO量表在數據采集時間點和采集方式等方面尚無統一標準,可能會導致不同研究的結果的可比性差等問題。在肺癌外科領域中,目前尚無基于循證醫學證據的PRO量表的最佳采集時間點。以往有關肺癌術后PRO的研究中,采集時間點不盡相同[50-51,59-61]。既往僅有部分研究給出了PRO量表的標準使用流程[62]。PRO數據采集時患者對于疾病的疑慮需要臨床醫師的及時反饋,需要規范的指南來指導患者可能會發生的問題[63]。ISOQOL于2019年發布了 PRO量表用戶使用指南,但目前在肺癌外科尚無具體實施規范。
目前,量表的采集方式主要包括紙質版問卷、電子版問卷、電話和訪談等方式。國外有研究發現不同采集方式之間差異并不明顯[64],但有研究發現使用電子癥狀采集系統可對患者的預后產生積極的影響[65]。使用測量工具采集數據時,無論使用紙質版或電子版,應嚴格遵守量表的固有格式,不能隨意調整條目順序。隨著電子化PRO平臺的出現,有效地解決了傳統紙質版量表失訪率高、采集整理困難等不足,同時減輕了采集人員的工作負擔。但特殊人群(如高齡患者)使用電子化量表目前仍存在諸多障礙,在數據分析及結果解讀時應充分考慮由此帶來的選擇性偏倚。由于PRO的定義和內涵具有要求“患者獨立完成”的屬性,因此在保證數據采集質量方面提出了較常規數據采集更高的要求。研究人員需要充分理解PRO的定義,在數據采集前對患者交代清楚完成量表的重要性,采集人員需在采集完成后檢查數據的完整性,量表需注明采集時間與采集人員,以保證數據的可溯源性,進而保證數據的質量[7]。但是臨床上的確有部分患者難以獨立完成量表,這時候可靈活采取一些措施,比如采用研究者或者照護者大聲讀出量表內容,然后患者回答的形式。
2.3 患者報告結局量表的結局應用
結局指標的采用應根據具體研究目的而定。PRO量表的條目眾多,但并不是所有的條目都要作為結局指標進行分析,這需要根據具體的研究目的來確定。比如,一些研究使用所有條目而另一些研究使用主要條目作為結局[50-51],一些研究使用條目的平均值而另一些研究使用比例進行分析[54,66-67]。Wei等[50]使用MDASI-LC所有條目的平均分來比較胸腔鏡與開放手術后的患者的癥狀,而Dai等[51]應用MADSI-LC量表中6個主要癥狀的重度評分的占比來比較不同手術方式的癥狀負擔。另外,在進行結果解讀時需要注意結果的臨床意義,如最小臨床重要性差值(Minimal Clinically Important Difference,MCID)。但目前多數研究的關注重點往往是P值[10,44],對MCID并未提及。Xu等[68]的研究發現疼痛和疲勞可作為評價胸腔鏡肺切除術后患者癥狀是否恢復的指標,癥狀評分減少30%(最小臨床重要改善)可作為有臨床意義恢復的閾值。在進行PRO研究結果解讀時,我們不僅需要關注統計學上的差異,還應關注指標是否具有臨床意義。另外,肺癌外科PRO量表在進行臨床應用時,采用條目評分的比例,比如中重度癥狀的占比,可能比平均分更具有臨床意義和可操作性。例如,肺癌患者術后癥狀多且嚴重程度各不相同,影響患者日常生活和醫生采取措施的往往是中重度核心癥狀,比如≥4分的疼痛。
3 總結與展望
PRO量表在我國肺癌外科的應用主要存在以下幾個問題。首先,PRO量表選擇不恰當。在PRO量表的選擇上應充分圍繞研究目的展開,在選擇測量量表時應充分考慮以下問題:(1)該量表能否應用于目標人群(特異性);(2)該量表的回顧時間段是否符合研究目的;(3)該量表在國內是否具有漢化版本;(4)該量表在目標人群中是否具有良好的信效度;(5)該量表是否能夠精確的反應出干預措施隨時間的變化情況。其次,肺癌外科PRO量表的采集規范目前尚不完善。ISOQOL指南和專家意見僅對PRO的應用進行了概述,對肺癌外科PRO的使用尚無具體的標準操作流程,比如在PRO數據采集時間點和采集方式等方面尚無實施規范。目前急需基于高質量臨床研究證據的實施規范來指導實踐[69]。最后,在PRO量表結果指標的選用和解讀上,需要重點關注指標的臨床意義。比如,在明確兩組P值大小的同時更應關注兩組間差異值是否大于MCID,只有P值有統計學差異且兩組差異值大于MCID才具有臨床意義。
綜上,PRO既是一個測量工具,又是一個來源于患者自身感受的新型臨床結局指標。肺癌PRO量表在肺癌外科領域的規范運用仍具有較長的距離,目前在量表選擇、數據采集和結局應用等方面尚需要強有力的循證醫學證據支持。但肺癌PRO量表在肺癌外科領域的應用具有廣闊的前景,仍值得我們不斷進行探索。
利益沖突:無。
作者貢獻:張崎負責論文撰寫;戴維、魏星負論文修改和論文審閱;李強負責對文章的知識性內容作批評性審閱。
肺癌是目前發病率第二、死亡率第一的惡性腫瘤,嚴重威脅人類健康[1]。近年來,由于人們健康意識的提高和胸部電子計算機斷層掃描被廣泛應用于肺癌的篩查[2-3],早期肺癌的檢出率逐漸升高。手術是治療肺癌的重要手段之一[4-5]。有關肺癌的臨床研究目前更多關注的是術后并發癥、住院時間和長期生存率等傳統指標,但患者術后癥狀負擔重[6],傳統指標并不能反應患者的自身感受。患者報告結局(patient-reported outcome,PRO)是美國食品藥品監督管理局推薦使用的新型臨床結局指標[7],其能更好地反映來自患者的感受,可在評價不同治療方式和實施癥狀管理等方面能發揮重要作用。眾多高質量研究顯示[8-13]:基于PRO的癥狀監測可減輕患者的癥狀負擔、提高患者對治療的反應、提高患者的整體預后、改善患者與醫護之間的溝通以及提高患者的滿意度等。肺癌患者的癥狀負擔常使用PRO量表來評估,但目前肺癌PRO量表多被應用于藥物臨床試驗中[14-15],在肺癌外科領域中的應用尚未普及且存在較多亟待的問題[16-17]。本文擬對肺癌PRO量表在肺癌外科的應用現狀進行綜述,以促進其在肺癌外科領域更好地應用。
1 肺癌外科常用患者報告結局量表
1.1 肺癌癥狀量表
肺癌癥狀量表(lung cancer symptom scale,LCSS)是由Hollen等[18]于1985年開發的肺癌特異性量表,其內容包括患者的癥狀、對日常生活的干擾和生活質量3個方面。LCSS主要通過9個條目來評估患者過去24 h的癥狀,包括食欲、疲勞、咳嗽、呼吸困難、咯血和疼痛6個與肺癌相關的癥狀條目和癥狀總體嚴重程度、對生活的影響以及目前的總體生活質量3個總體條目。此外,該量表提供了一個用于醫師或觀察者填寫的量表,包括食欲、疲勞、咳嗽、氣促、痰中帶血和疼痛等6個條目。患者填寫的量表采用視覺模擬評分法,得分越高表示癥狀負擔越嚴重。觀察者填寫的量表評分為5個等級,0分表示“最嚴重”,25分表示“嚴重”,50分表示“中等”,75分表示“有一點”,100分表示“沒有”。國外多個研究對LCSS進行了信效度檢驗[18-20],它具有良好的心理測量學屬性,是一種可靠、有效的測量工具,但該量表在國內的應用較少。LCSS量表的優勢在于其內容簡單明了,并且提供了一份用于測量人員填寫的量表,但其評估范圍相比其它量表可能不夠全面[21],并且視覺模擬評分得出的數據分析難度較大。
1.2 歐洲癌癥研究和治療組織生活質量核心量表及肺癌特異性量表
歐洲癌癥研究與治療組織(European Organization for Research and Treatment of Cancer,EORTC)在1986年開發了癌癥患者生活質量核心量表EORTC QLQ-C30(Core 30 items)[22],目的是全方面評估癌癥患者的生活質量。QLQ-C30共30個條目分4個維度:功能狀態(身體、角色、情感、社會和認知共15個條目)、癥狀條目(疼痛、乏力、惡心和嘔吐共7個條目)、總體狀況(2個條目)和單條目癥狀(呼吸困難、失眠、食欲不振、腹瀉、便秘和經濟困難共6個條目)。該量表的回顧時間段為過去1周,條目1~28分為4個等級:1分表示“沒有”,2分表示“有點”,3分表示“相當”,4分表示“非常”,條目29、30分為7個等級:1表示“非常差”,7分表示“非常好”。
1994年EORTC在核心模塊基礎之上開發了肺癌生活質量子表QLQ-LC13(Quality of Life Questionnaire-Lung Cancer Module)[23],其通常和QLQ-C30一起使用,是目前臨床和研究中最常用的肺癌生活質量評估量表。QLQ-LC13主要用于評估肺癌患者特異性癥狀,包括單條目癥狀:咳嗽、咯血和使用止痛藥,多條目癥狀包括呼吸困難(3個條目)、疼痛(3個條目)、治療副作用(4個條目),回顧時間段和條目評分和QLQ-C30一樣。國外研究[24-26]發現EORTC QLQ-C30,QLQ-LC13具有良好的心理測量學屬性,國際健康結果測量聯盟也推薦這些量表作為肺癌患者的隨訪工具[27]。國內同樣有文獻報道了EORTC QLQ-C30,QLQ-LC13在中國肺癌人群中仍然具有良好的心理測量學屬性[28-29]。
最近,EORTC將舊量表QLQ-LC13更新為新量表QLQ-LC29 [30-31]。QLQ-LC29保留了既往13個條目中的12條,新增了17條,其中5條是僅用于肺癌手術患者的評估,其回顧時間段和條目評分和QLQ-C30一樣。國外研究[31-32]發現QLQ-LC29具有良好的心理測量學屬性。目前,我國學者[33]已經完成QLQ-LC29的漢化工作,該工具在我國正處于信效度檢驗階段。與QLQ-LC13相比,QLQ-LC29的優勢在于它能評估目前新興治療方式(如靶向治療、免疫治療和微創胸腔鏡手術治療等)產生的癥狀,但它目前在中國肺癌人群中的心理測量學屬性仍需進一步研究。
1.3 癌癥治療功能評估量表-肺癌子表
肺癌治療功能評估量表(Functional Assessment of Cancer Therapy,FACT)是Cella等[34]于1993年開發的一個評估癌癥患者整體生活質量的量表,從生理狀況(7個條目)、社會/家庭狀況(7個條目)、功能狀況(7個條目)和情感狀況(6個條目)等4個維度來評估患者生活質量[35]。FACT-L是在核心量表基礎上進行了補充的肺癌特異性量表,它的回顧時間段為過去1周,新增了氣促、體重下降、思維清晰、咳嗽、脫發困擾、食欲好、胸悶、呼吸通暢和是否曾抽過煙等9個條目[36,37]。目前,第四版FACT-L已經被翻譯成多種語言且廣泛應用于肺癌患者生活質量的評估[38-39]。FACT-L通常與FACT核心量表共同使用,分為5個等級,0分表示“一點也不”,1分表示“有一點”,2分表示“有些”,3表示“相當”,4分表示“非常”。萬崇華等[40]的研究驗證了FACT-L在中國肺癌人群中具有良好的心理測量學屬性。FACT-L的優勢在于它能在治療前區分不同臨床狀態的患者,可評估臨床相關的變化和癥狀的差異,但該量表條目多,患者的填寫負擔可能較重。
1.4 安德森癥狀量表-肺癌子表
MD安德森癥狀量表(MD Anderson Symptom Inventory,MDASI)是由美國MD安德森癌癥中心于2000年開發的用于評估癌癥癥狀的嚴重程度或其治療方法的核心模塊[41],包括了疼痛、疲勞/乏力、惡心、睡眠不安、苦惱、氣促、健忘、胃口差、瞌睡/昏昏欲睡、口干、悲傷感、嘔吐、麻木感共13個評估癌癥患者常見癥狀條目,和一般活動、情緒、工作、與他人的關系、走路、生活樂趣共6個評估生理和心理功能的條目。在MDASI的基礎之上,MD安德森癌癥中心開發了肺癌特異性量表(MD Anderson Symptom Inventory-Lung Cancer module,MDASI-LC)[42]。MDASI-LC包括了核心模塊中的13個癥狀和3個肺癌特異性癥狀(咳嗽、便秘和嗓子疼)。研究[43-45]表明其在國內外肺癌人群中具有良好的心理測量學屬性。而張立力等[46]的研究發現:該肺癌模塊所包含的癥狀可能不完全符合國內肺癌患者的現狀,因此其對MDASI-LC進行了適當的修訂,修訂后的量表包含6個肺癌特異性模塊(咳嗽、咳痰、咯血、胸悶、便秘和體重下降),并驗證了其在中國肺癌人群中具有良好的心理測量學屬性。另外,筆者所在團隊將MDASI-LC量表在肺癌手術患者中也做了信效度驗證,研究結果提示信效度均較高,相關文章正在投稿中。MDASI-LC的所有條目均采用0~10計分法,評分越高表示癥狀負擔越嚴重或功能被干擾越嚴重。0代表無任何癥狀或無任何功能干擾,10代表能想象的最嚴重癥狀或功能完全被干擾。MDASI-LC的優勢在于量表的回顧時間短(24 h),條目數量相對少,故它特別適合圍手術期癥狀快速變化的測量。另外,其內容易于理解且范圍相對全面;同時它還評估了這些癥狀對日常功能的干擾的嚴重程度。但是,該量表的開發和驗證是基于放化療人群完成的,對于肺癌手術患者的癥狀評估可能存在不全面之處。
1.5 肺癌患者術后癥狀量表
肺癌患者術后癥狀量表是由我國胸外科車國衛教授團隊[47]于2017年在MDASI-LC量表基礎之上修訂而成,用于評估肺癌患者術后的癥狀及嚴重程度。該量表包括咳嗽、疼痛、氣促、疲勞、虛汗、便秘、咽喉疼痛和失眠共8個癥狀條目,用以對患者肺癌術后的癥狀類型及其嚴重程度進行評估,經信效度驗證在中國肺癌手術人群中具有良好的心理測量學屬性[47]。該量表用于對患者癥狀的即時評估,條目評分采用0~10分計分法,0分表示“無癥狀”,10分表示“能想像的最嚴重程度”。國內有學者[48]使用該量表評估胸腔鏡下肺癌手術后患者1個月內的生活質量,發現胸腔鏡術后疼痛、咳嗽和氣促持續時間較其它癥狀更長,且咳嗽程度在術后30 d內有加重的趨勢。該量表的優勢在于它用于患者癥狀的即時評估,有效的消除了回憶偏倚。但該量表研制的時間較晚,且僅有中文版,目前國內應用亦較少。
1.6 肺圍手術期癥狀量表
肺圍手術期癥狀量表(Perioperative Symptom Assessment for Lung Surgery,PSA-Lung)是由石丘玲教授團隊[49]通過歐美醫藥管理部門推薦的PRO量表制定標準步驟[7]開發的一個特異性、靈敏性和可行性兼具的肺圍手術期癥狀量表。具體開發步驟包括:質性訪談及專家意見生成條目草稿、條目語言標化、心理測量學信效度驗證和應用參數的制定。該量表包括疼痛、咳嗽、氣促、睡眠不安、疲乏(乏力)、瞌睡(昏昏欲睡)、苦惱共7個癥狀條目和行走困難、日常活動困難2個功能條目。PSA-Lung的回顧時間段為過去24 h,條目評分采用0~10分計分法,0分表示“無癥狀”,10分表示“能想像的最嚴重程度”。該量表在肺圍手術期人群中開發,是專用于肺圍手術期癥狀評估的量表,并且已經在肺癌圍手術期人群中得到驗證,具有良好的信效度,信效度驗證的結果已經在2021年國際生活質量研究學會(International Society for Quality of Life Research,ISOQOL)大會上公布[49]。該量表的優勢在于回顧時間短,內容簡單明了,條目數少,患者填寫時負擔輕,且特別適合于肺手術患者圍手術期癥狀的高頻次測量。由于PSA-Lung是一個最新的肺手術特異性量表,它的臨床應用尚處于起步階段。
2 患者報告結局量表在肺癌外科的應用現狀
2.1 患者報告結局量表的選擇
在臨床和科研工作中,如何選擇適宜的PRO量表是研究者首要面臨的問題。目前,針對肺癌手術患者主要有6種常用的肺癌特異性評估量表,即LCSS、EORTC QLQ-C30+QLQ-LC13及QLQ-LC29、FACT-L、MDASI-LC、肺癌患者術后癥狀量表和PSA-Lung,其中僅后兩者完全是在肺手術患者中研制的量表。EORTC更新的QLQ-LC29、肺癌患者術后癥狀量表和PSA-Lung適用于肺癌手術患者的癥狀測量。肺癌外科PRO研究多為運用PRO量表比較不同手術方式和描述肺癌患者術后癥狀及日常功能受干擾情況的變化過程等方面[50-51]。不同量表評估的側重點不同,部分量表側重于癥狀評估、部分側重與生活質量評估。EORTC QLQ-C30 + QLQ-LC13是目前使用最多的肺癌患者PRO測量工具[24]。EORTC QLQ-C30 + QLQ-LC13和FACT-L評估范圍較全面,但患者的量表填寫負擔重,這可能會增加數據缺失的概率。有研究發現對于部分晚期肺癌患者,失訪或問卷填寫不完整患者較多[52]。FACT-L關注的更多是社會心理問題而不是肺癌的癥狀。與FACT-L不同,MDASI-LC則將評估重點放在癥狀和功能上[53-54]。LCSS的最大特點是它的簡潔性,但是它對于患者生活質量的評估全面性比EORTC和 FACT-L略顯不足,它忽略了患者的心理和社會領域方面的問題。
多個國家的專家共同起草、修訂的健康測量工具遴選標準指南旨在為測量者選擇合適的PRO測量提供依據,但目前該指南較多應用于指導系統評價的標準步驟[55]。PRO量表作為測量工具,其效果與其是否被恰當、規范地使用有關。例如,在選擇測量工具時應考慮量表的回顧時間段。另外,在選擇PRO量表時應該注意其適用人群,嚴格規范其使用過程、并正確解讀其結果參數時才能正確評估對患者預后的影響[12,24-56]。目前PRO量表的應用在肺癌外科領域仍處于初級階段[57-58],但最近2年才研發成功的QLQ-LC29、肺癌患者術后癥狀量表和PSA-Lung等量表的使用,有望實現肺癌PRO量表在肺癌外科患者中的精準應用。
2.2 患者報告結局量表的數據采集
目前,肺癌外科PRO量表在數據采集時間點和采集方式等方面尚無統一標準,可能會導致不同研究的結果的可比性差等問題。在肺癌外科領域中,目前尚無基于循證醫學證據的PRO量表的最佳采集時間點。以往有關肺癌術后PRO的研究中,采集時間點不盡相同[50-51,59-61]。既往僅有部分研究給出了PRO量表的標準使用流程[62]。PRO數據采集時患者對于疾病的疑慮需要臨床醫師的及時反饋,需要規范的指南來指導患者可能會發生的問題[63]。ISOQOL于2019年發布了 PRO量表用戶使用指南,但目前在肺癌外科尚無具體實施規范。
目前,量表的采集方式主要包括紙質版問卷、電子版問卷、電話和訪談等方式。國外有研究發現不同采集方式之間差異并不明顯[64],但有研究發現使用電子癥狀采集系統可對患者的預后產生積極的影響[65]。使用測量工具采集數據時,無論使用紙質版或電子版,應嚴格遵守量表的固有格式,不能隨意調整條目順序。隨著電子化PRO平臺的出現,有效地解決了傳統紙質版量表失訪率高、采集整理困難等不足,同時減輕了采集人員的工作負擔。但特殊人群(如高齡患者)使用電子化量表目前仍存在諸多障礙,在數據分析及結果解讀時應充分考慮由此帶來的選擇性偏倚。由于PRO的定義和內涵具有要求“患者獨立完成”的屬性,因此在保證數據采集質量方面提出了較常規數據采集更高的要求。研究人員需要充分理解PRO的定義,在數據采集前對患者交代清楚完成量表的重要性,采集人員需在采集完成后檢查數據的完整性,量表需注明采集時間與采集人員,以保證數據的可溯源性,進而保證數據的質量[7]。但是臨床上的確有部分患者難以獨立完成量表,這時候可靈活采取一些措施,比如采用研究者或者照護者大聲讀出量表內容,然后患者回答的形式。
2.3 患者報告結局量表的結局應用
結局指標的采用應根據具體研究目的而定。PRO量表的條目眾多,但并不是所有的條目都要作為結局指標進行分析,這需要根據具體的研究目的來確定。比如,一些研究使用所有條目而另一些研究使用主要條目作為結局[50-51],一些研究使用條目的平均值而另一些研究使用比例進行分析[54,66-67]。Wei等[50]使用MDASI-LC所有條目的平均分來比較胸腔鏡與開放手術后的患者的癥狀,而Dai等[51]應用MADSI-LC量表中6個主要癥狀的重度評分的占比來比較不同手術方式的癥狀負擔。另外,在進行結果解讀時需要注意結果的臨床意義,如最小臨床重要性差值(Minimal Clinically Important Difference,MCID)。但目前多數研究的關注重點往往是P值[10,44],對MCID并未提及。Xu等[68]的研究發現疼痛和疲勞可作為評價胸腔鏡肺切除術后患者癥狀是否恢復的指標,癥狀評分減少30%(最小臨床重要改善)可作為有臨床意義恢復的閾值。在進行PRO研究結果解讀時,我們不僅需要關注統計學上的差異,還應關注指標是否具有臨床意義。另外,肺癌外科PRO量表在進行臨床應用時,采用條目評分的比例,比如中重度癥狀的占比,可能比平均分更具有臨床意義和可操作性。例如,肺癌患者術后癥狀多且嚴重程度各不相同,影響患者日常生活和醫生采取措施的往往是中重度核心癥狀,比如≥4分的疼痛。
3 總結與展望
PRO量表在我國肺癌外科的應用主要存在以下幾個問題。首先,PRO量表選擇不恰當。在PRO量表的選擇上應充分圍繞研究目的展開,在選擇測量量表時應充分考慮以下問題:(1)該量表能否應用于目標人群(特異性);(2)該量表的回顧時間段是否符合研究目的;(3)該量表在國內是否具有漢化版本;(4)該量表在目標人群中是否具有良好的信效度;(5)該量表是否能夠精確的反應出干預措施隨時間的變化情況。其次,肺癌外科PRO量表的采集規范目前尚不完善。ISOQOL指南和專家意見僅對PRO的應用進行了概述,對肺癌外科PRO的使用尚無具體的標準操作流程,比如在PRO數據采集時間點和采集方式等方面尚無實施規范。目前急需基于高質量臨床研究證據的實施規范來指導實踐[69]。最后,在PRO量表結果指標的選用和解讀上,需要重點關注指標的臨床意義。比如,在明確兩組P值大小的同時更應關注兩組間差異值是否大于MCID,只有P值有統計學差異且兩組差異值大于MCID才具有臨床意義。
綜上,PRO既是一個測量工具,又是一個來源于患者自身感受的新型臨床結局指標。肺癌PRO量表在肺癌外科領域的規范運用仍具有較長的距離,目前在量表選擇、數據采集和結局應用等方面尚需要強有力的循證醫學證據支持。但肺癌PRO量表在肺癌外科領域的應用具有廣闊的前景,仍值得我們不斷進行探索。
利益沖突:無。
作者貢獻:張崎負責論文撰寫;戴維、魏星負論文修改和論文審閱;李強負責對文章的知識性內容作批評性審閱。