引用本文: 劉勇, 汪曉東, 朱佳怡, 李立, 周總光. 數據庫研究第十部分:結直腸癌的輔助治療特征分析. 中國普外基礎與臨床雜志, 2021, 28(7): 937-944. doi: 10.7507/1007-9424.202105044 復制
華西腸癌數據庫(Database from Colorectal Cancer,DACCA)是四川大學華西醫院結直腸外科專業團隊以真實世界研究為思路和理念而建設的數據庫。筆者團隊已推出系列數據庫報道,包括數據庫研究、數據庫建設、數據庫解讀、數據庫決策等章節[1-2]。本研究內容為數據庫研究系列報道的第一章第十部分,將對 DACCA 數據庫中結直腸癌的輔助治療特征進行分析研究。
1 資料與方法
1.1 數據庫版本
本次數據分析選取的 DACCA 版本為 2020 年 8 月 1 日更新版。
1.2 DACCA 數據庫的應用參數
本研究涉及的數據項目的定義會在“數據庫建設”系列報道的第十部分中詳細說明及闡述。本研究中分析的是輔助治療中方案的設計、實施與效果模塊,其指標包括:輔助策略(輔助擬定方案)、輔依(患者對輔助治療的依從性)、化指(輔助化療的指征選擇)、化接(輔助化療的接受度)、化程(輔助化療實際治療的周期數)、化效(輔助化療的效果)、化規(輔助化療的規范化應用)、口靶(口服靶向藥物的使用)、靜靶(靜脈靶向藥物的使用)、放指(輔助放療的指征選擇)、放接(輔助放療的接受程度)和放效(輔助放療的效果)。
1.3 DACCA 數據庫的篩選方案
根據本研究的需要,筆者團隊按照總數據庫信息篩選,根據標題 1.2 下所選參數,選擇在 DACCA 數據庫中必須至少其中 1 項條件不為“空”的條目。本次數據庫篩選完成時間為 2020 年 8 月 30 日。
1.4 統計學方法
本次 DACCA 數據庫分析的應用工具為 Excel(Office 365,Microsoft,Redmond,WA,USA)與 SPSS 22.0。經典統計學描述和正態性檢驗由 SPSS 22.0 完成,可視化由 Excel 統計圖表與工具完成。計數資料以“條”進行描述并采用 χ2 檢驗;服從正態分布的計量資料以均數±標準差(±s)表示,不服從正態分布者以中位數表示。檢驗水準 α=0.05。
2 結果
截至 2020 年 8 月 1 日,本次研究從總數據庫中篩選出信息 68 866 條,數據庫疊加后,符合篩選條件的數據病案(數據行,lines)總量為 3 955 條。具體篩選過程及結果見圖 1。

2.1 輔助治療情況
2.1.1 輔助策略選擇情況
在 DACCA 數據庫中,2007–2020 年期間“輔助策略”一欄的有效數據行共 2 611 條,占所有分析數據的 66.0%(2 611/3 955)。各輔助策略選擇情況見表 1,從表 1 可見,選擇“輔助治療”的數據構成比最高(35.6%),選擇“夾心治療”的數據構成比最低(2.0%)。在此 2 611 條有效數據中“入院日期”一欄不為空的數據行共 2 606 條,其輔助策略選擇結果隨年份變化的分布情況見圖 2a。


2.1.2 輔助治療的依從性
在 DACCA 數據庫中,2007–2020 年期間“輔助治療依從性”一欄的有效數據行共 2 362 條,占所有分析數據的 59.7%(2 362/3 955)。各輔助治療依從性情況見表 2,從表 2 可見,“配合”的數據構成比最高(28.1%),“過度”的數據構成比最低(0.8%)。在此 2 362 條有效數據中“入院日期”一欄不為空的數據行共 2 353 條,其隨年份變化的分布情況見圖 2b。

2.2 輔助化療情況
2.2.1 輔助化療的指征評估
在 DACCA 數據庫中,2007–2020 年期間“輔助化療指征評估”一欄的有效數據行共 2 963 條,占所有分析數據的 74.9%(2 963/3 955)。各輔助化療指征評估結果見表 3,從表 3 可見,“必須”的數據構成比最高(38.6%),“只能”的數據構成比最低(5.1%)。在此 2 963 條有效數據中“入院日期”一欄不為空的數據行共 2 955 條,其隨年份變化的分布情況見圖 3a。


a–e:輔助化療的指征評估(a)、接受度(b)、周期數(c)、效果(d)及規范化應用程度(e)結果;f–h:輔助放療的指征評估(f)、接受度(g)及效果(h)結果;i、j:口服(i)和靜脈(j)靶向藥物選擇結果
2.2.2 輔助化療的接受度
在 DACCA 數據庫中,2007–2020 年期間“輔助化療接受度”一欄的有效數據行共 2 586 條,占所有分析數據的 65.4%(2 586/3 955)。輔助化療接受度結果:“拒絕”1 373 條(53.1%),“接受”1 213 條(46.9%)。在此 2 586 條有效數據中“入院日期”一欄不為空的數據行共 2 576 條,其隨年份變化的分布情況見圖 3b。
2.2.3 輔助化療的強度
在 DACCA 數據庫中,2007–2020 年期間“輔助化療強度”一欄的有效數據行共 2 722 條,占所有分析數據的 68.8%(2 722/3 955)。輔助化療強度即輔助化療周期數量分布情況見表 4,從表 4 可見,在有具體化療周期數量的數據中,顯示為 6 周期輔助化療的數據構成比最高(12.4%),而超過 16 周期輔助化療的數據構成比均較低。在此 2 722 條有效數據中“入院日期”一欄不為空的數據行共 2 713 條,對此數據進行變化趨勢分析的結果見圖 3c,該圖中未見輔助化療周期數呈現出特定的變化趨勢。

2.2.4 輔助化療的效果
在 DACCA 數據庫中,2007–2020 年期間“輔助化療效果”一欄的有效數據行共 1 031 條,占所有數據的 26.1%(1 031 /3 955)。各輔助化療效果情況見表 5,從表 5 可見,“穩定”的數據構成比最高(59.9%),“敏感”的數據構成比最低(0.5%)。在此 1 031 條有效數據中“入院日期”一欄不為空的數據行共 1 024 條,其隨年份變化的分布情況見圖 3d。

2.2.5 輔助化療的規范化應用
在 DACCA 數據庫中,2007–2020 年期間“輔助化療規范化應用程度”一欄的有效數據行共 1 149 條,占所有數據的 29.1%(1 149/3 955)。輔助化療規范化應用程度情況:“不涉及”57 條(5.0%)、“是”(表示完全按照國家指南意見進行輔助化療的數據)903 條(78.6%)、“否”(表示未完全按照國家指南意見進行輔助化療的數據)189 條(16.4%)。在此 1 149 條有效數據中“入院日期”一欄不為空的數據行共 1 146 條,其隨年份變化的分布情況見圖 3e。
2.2.6 具備輔助化療指征與最終接受化療之間的關系
在 DACCA 數據庫中 2007–2020 年期間同時具備“輔助化療指征評估”和“輔助化療接受度”數據共 2 506 條,占所有分析數據的 63.4%(2 506/3 955)。在數據分析時,將 DACCA 數據庫中“輔助化療指征評估”標記為“必須”“強推”“推薦”“只能”這 4 種評估結果的數據項歸為“應該”即具備化療指征的數據;標記為“可選”和“無須”的數據項不做變化。具備輔助化療指征與最終接受化療之間的關系分析采用 χ2檢驗(χ2=505.262,P<0.001),提示在真實臨床背景下,輔助化療的應用客觀上是符合標準的,而對于拒絕接受輔助化療的大部分患者可能并沒有接受更為合理的臨床治療,同時,在輔助化療的推薦程度有限的情況下,明顯發現患者接受程度降低,這也符合客觀情況,這些結果揭示了提高患者對輔助化療的接受程度將可能對當前的臨床診療規范化及治療效果提升有幫助。結果見表 6。

2.3 輔助放療情況
2.3.1 輔助放療的指征評估
在 DACCA 數據庫中,2007–2020 年期間“輔助放療指征評估”一欄的有效數據行共 2 915 條,占所有數據的 73.7%(2 915/3 955)。各輔助放療的指征評估結果見表 7,從表 7 可見,評估為“無須”的數據構成比最高(49.1%)、評估為“可選”的數據構成比最低(1.4%)。在此 2 915 條有效數據中“入院日期”一欄不為空的數據行共 2 852 條,其隨年份變化的分布情況見圖 3f。

2.3.2 輔助放療的接受度
在 DACCA 數據庫中,2007–2020 年期間“輔助放療接受度”一欄的有效數據行共 2 803 條,占所有數據的 70.9%(2 803/3 955)。輔助放療接受度情況:“拒絕” 2 629 條(93.8%)、“接受” 174 條(6.2%)。在此 2 803 條有效數據中“入院日期”一欄不為空的數據行共 2 746 條,其隨年份變化的分布情況見圖 3g。
2.3.3 輔助放療的效果
在 DACCA 數據庫中,2007–2020 年期間“輔助放療效果”一欄的有效數據行共 118 條,占所有數據的 3.0%(118/3 955)。輔助放療的效果結果見表 8。從表 8 可見,輔助放療效果“穩定”的數據構成比最高(38.1%)、“無效”的數據構成比最低(4.2%)。在此 118 條有效數據中“入院日期”一欄不為空的數據行共 111 條,其隨年份變化的分布情況見圖 3h。

2.3.4 輔助放療指征評估結果與最終接受放療間的關系
在 DACCA 數據庫中 2007–2020 年期間同時具備“輔助放療指征評估”和“輔助放療接受度”數據者共 2 440 條,占所有分析數據的 61.7%(2 506/3 955)。在分析二者的關系時,將數據進行了調整,即將 DACCA 數據庫中輔助放療指征評估結果為“必須”“強推”及“推薦”者的數據項歸為“應該”,即具備放療指征的數據;DACCA 數據庫中輔助放療指征評估結果為“可選”和“無須”的數據項不變。采用 χ2 檢驗分析輔助放療指征評估結果與最終接受放療間的關系發現,在輔助放療指征評估結果為“接受”的患者中,最終接受放療為“應該”的占比最高;在輔助放療指征評估結果為“拒絕”的患者中,最終接受放療為“可選”和“無須”者占比更高(χ2=139.593,P<0.001),見表 9。結果提示,在真實臨床背景下,輔助放療的應用客觀上是符合標準的,而對于拒絕接受輔助放療的大部分患者可能并沒有接受更為合理的臨床治療;同時發現,在輔助放療的推薦程度有限的情況下,患者接受度降低。

2.4 靶向藥物情況
2.4.1 口服靶向藥物的使用
在 DACCA 數據庫中,2007–2020 年期間“口服靶向藥物”一欄的有效數據行共 2 520 條,占所有數據的 63.7%(2 520/3 955)。在口服靶向藥物選擇時,選擇“否”的數據有 2 121 條(84.2%)、選擇“是”的數據有 399 條(15.8%)。在此 2 520 條有效數據中“入院日期”一欄不為空的數據行共 2 512 條,其隨年份變化的分布情況見圖 3i。
2.4.2 靜脈靶向藥物的使用
在 DACCA 數據庫中,2007–2020 年期間“靜脈靶向藥物”一欄的有效數據行共 281 條,占所有數據的 7.1%(281/3 955)。在靜脈靶向藥物的選擇時,選擇“否”的數據有 206 條(73.3%)、選擇“是”的數據有 75 條(26.7%)。在此 281 條有效數據中“入院日期”一欄不為空的數據行共 280 條,其隨年份變化的分布情況見圖 3j。
3 討論
3.1 輔助治療的真實世界特征
真實世界研究最早提出就是針對藥物效果的評價,其區別于經典設計型研究的最大特點就是數據來源與患者應用藥物的真實情況,減少嚴格的試驗方案設計帶來的不真實性和不適用性[3-4]。在結直腸癌的輔助治療中,這種真實世界研究的理念恰好適用。采用國際和國內的結直腸癌指南[5-10],為醫師提供了便利的治療決策依據,但是無法掌握治療過程中患者及家庭因素帶來治療的最終接受情況的變化,也無法支持醫師在患者接受治療過程出現病情變化時做出的措施調整。因此,我們在判斷輔助治療效果時無法回避這些行為所致的治療細節變化,可能對于最終結果帶來的影響。而在此階段,最終結果可能就直接涉及到患者的生存率[11-14]。如何選擇合適的方式、獲取輔助治療的細節,必然是結直腸癌專科醫生所需要長期討論的話題。在全球多個可提供大數據的結直腸癌數據庫中均沒有一個統一輔助治療數據的采集方式就足以說明這一話題的復雜性。
本團隊在長達 15 年的結直腸癌數據庫管理經驗總結中發現,如果按照患者的輔助放化療方案詳細記錄藥物劑量、放療的劑量、每次治療的藥物參數等,在數據庫實際操作中是不可行的,且無法對于預后進行有效關聯分析,所以目前結直腸癌數據庫采用的方式是:醫生計劃如何的方案,患者是否接受方案,方案的完整度如何以及是否偏離指南或偏離計劃的思路,更加注重行為特征和總體判斷(如按照計劃完成術后的 6 周期化療)而不再做不必要的細節數據采集(如每次化療采用 CapeOX 并記錄卡培他濱用法為 1.5 g、口服、2 次/d 等[1]),從而將“行為—結果”的特征充分地體現出來,這種描述結直腸癌輔助治療階段真實世界數據的獲取方式,為利用數據決策預后創造了條件。從近期本團隊的數據分析來看,通過這樣的方式確實可以更為有效地利用大數據技術工具[15-17]去分析和預測預后的關聯性。
3.2 輔助放化療的實施
從輔助化療是否需要實施的數據看,評估為“無須”輔助化療的患者比例大約在 15.3%,這個比例大約與結直腸癌Ⅰ期和低風險組Ⅱ期的數據接近。但對于需要或可能需要輔助化療的患者,在 DACCA 數據庫中進行了更多的劃分:“必須”進行輔助化療的行為表達醫生對于治療需求的強調,做出“必須”的選擇就是對患者來說是最為緊迫的選擇,這多數情況下表示輔助治療在指南中也說明了其必要性;而“推薦”則更具備指南中多數文字描述的口吻,因為指南作為綜合性的意見庫,更多是推薦如何進行治療可能會更好。在 DACCA 數據庫中,我們將“必須”和“推薦”這兩種強度不同的治療要求進行了劃分,便于確定輔助治療對于患者的重要性。在整個數據庫分析的數據中,這兩類數據占比也最高(分別為 38.6% 和 26.0%),從這一數據可以看出,在結直腸癌患者中,無論是醫生的觀點還是指南的引導,現在就診的結直腸癌患者中需要施行輔助化療的患者可能會超過 1/2,這也從另一個角度反映了實際上在院接受了手術的結直腸癌患者中多數都可能是具有風險或分期偏晚的人群。另外,從本次數據分析中我們可以看出,對于輔助化療的接受程度并不如我們預想中這么滿意,實際上可能超過一半(53.1%)的患者對于接納輔助化療是處于拒絕的態度,這種進行輔助化療的實際需求與患者最終是否愿意接納輔助化療的反差也顯露了醫患雙方對于輔助化療的理解和認同上的差異,這樣的反差在輔助放療的數據中也有類似的發現,輔助放療中屬于“必須”(12.3%)和“推薦”(30.3%)的數據相加也接近約 1/2 的患者有輔助放療的必要,但是患者實際表現出來的態度則是 93.8% 的患者拒絕接受輔助放療。于是我們猜想,從真實世界的狀態下分析,患者和家屬可能把結直腸癌的治療訴求放在了手術環節,也默認為手術是治療結直腸癌最主要甚至是唯一的途徑,而手術后伴隨結直腸癌早晚程度的評估完成,患者和家屬對于治療疾病的態度就可能出現變化,不一定還會保持原有對于治療的強烈訴求,再加之患者和家屬可能存在對于輔助化療未知不良反應、術后身體恢復狀態等諸多的擔憂導致了對于輔助治療的懼怕,這一現象提示了我們,實際上我們在進行術后 5 年隨訪的結直腸癌患者很可能不是按預期進行了輔助治療的患者,那么指南中的推薦意見在實際需求中就顯得應用價值偏低,而我們更應該考慮是否對結直腸癌患者提出更具有實用性或者說更符合中國患者實際需要的治療意見,這種意見更多的是把握患者術后治療的總體安排,讓患者更容易接受和更有利于獲取長期的療效。當然,這樣的想法還需要一些研究來加以分析,在這種情況下,可能就正好是利用大數據技術去剖析這些復雜關系的時機。
3.3 輔助治療的效果
對于輔助治療的效果評估,除了長期預后的分析(前述提到了這是一個難點)外,還有治療后近期的效果。輔助治療的近期效果還不同于新輔助治療,后者可以選擇比較客觀的參數(如腫瘤消退分級)或相對客觀的參數(如轉化切除率、保肛率)等作參照。但是輔助治療的近期效果的參數特征會更加復雜,有可測量病灶(如復發灶和轉移灶)時可以利用腫瘤大小的改變作評估,但沒有可測量病灶時就會轉而依賴以時間作參數的腫瘤標志物(如 CEA、CA19-9 等)和影像學變化。所以為了闡述這種輔助治療的效果,DACCA 數據庫提供了一套新的分類編碼方式。從該分類方式看,輔助化療能獲得“穩定”效果的患者處于多數(59.9%),但要達到“敏感”效果的患者則極少(0.5%),這種“穩定”的效果常常表現在需要輔助化療的患者,各方面隨訪指標的穩定,而“敏感”則會需要腫瘤標志物等對于輔助治療有明顯的治療反應,而且反應的表現非常積極,有利于患者的預后。現在,對于輔助治療的敏感與否,其實已經引入了錯配修復缺陷、微衛星不穩定性水平等精準醫療的檢驗參數[6, 18-19]。如果將臨床特征的敏感與否甚至是整個輔助治療效果的分類體系與精準醫療的檢驗檢測相融合,想必會衍生出具有創新性的精準醫療決策工具,從這一點上看,很可能為以后以數據為基礎、決策為目標的輔助治療方案管理提供新的思路。同樣的情況也在輔助放療的數據中得到的體現,研究分析中發現,臨床特征判斷的輔助放療“無效”的患者,通常并不單單是來自測量病灶的大小變化,還來自患者腫瘤標志物、影像學等的變化,那么這種“無效”與放療所帶來的損傷/獲益比例是否有關系,是否可以用于進一步推演術后輔助放療患者的選擇方案,都還需要更多的數據關系分析。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:劉勇負責文章的主要撰寫工作;汪曉東負責文章部分撰寫和修改工作;朱佳怡負責數據整理、部分內容撰寫工作;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員;周總光負責數據庫理論及應用、質量控制及研究監督。
倫理聲明:本研究已通過四川大學華西醫院倫理學委員會的審核并同意[批文編號:2019 年審(140)號]。
華西腸癌數據庫(Database from Colorectal Cancer,DACCA)是四川大學華西醫院結直腸外科專業團隊以真實世界研究為思路和理念而建設的數據庫。筆者團隊已推出系列數據庫報道,包括數據庫研究、數據庫建設、數據庫解讀、數據庫決策等章節[1-2]。本研究內容為數據庫研究系列報道的第一章第十部分,將對 DACCA 數據庫中結直腸癌的輔助治療特征進行分析研究。
1 資料與方法
1.1 數據庫版本
本次數據分析選取的 DACCA 版本為 2020 年 8 月 1 日更新版。
1.2 DACCA 數據庫的應用參數
本研究涉及的數據項目的定義會在“數據庫建設”系列報道的第十部分中詳細說明及闡述。本研究中分析的是輔助治療中方案的設計、實施與效果模塊,其指標包括:輔助策略(輔助擬定方案)、輔依(患者對輔助治療的依從性)、化指(輔助化療的指征選擇)、化接(輔助化療的接受度)、化程(輔助化療實際治療的周期數)、化效(輔助化療的效果)、化規(輔助化療的規范化應用)、口靶(口服靶向藥物的使用)、靜靶(靜脈靶向藥物的使用)、放指(輔助放療的指征選擇)、放接(輔助放療的接受程度)和放效(輔助放療的效果)。
1.3 DACCA 數據庫的篩選方案
根據本研究的需要,筆者團隊按照總數據庫信息篩選,根據標題 1.2 下所選參數,選擇在 DACCA 數據庫中必須至少其中 1 項條件不為“空”的條目。本次數據庫篩選完成時間為 2020 年 8 月 30 日。
1.4 統計學方法
本次 DACCA 數據庫分析的應用工具為 Excel(Office 365,Microsoft,Redmond,WA,USA)與 SPSS 22.0。經典統計學描述和正態性檢驗由 SPSS 22.0 完成,可視化由 Excel 統計圖表與工具完成。計數資料以“條”進行描述并采用 χ2 檢驗;服從正態分布的計量資料以均數±標準差(±s)表示,不服從正態分布者以中位數表示。檢驗水準 α=0.05。
2 結果
截至 2020 年 8 月 1 日,本次研究從總數據庫中篩選出信息 68 866 條,數據庫疊加后,符合篩選條件的數據病案(數據行,lines)總量為 3 955 條。具體篩選過程及結果見圖 1。

2.1 輔助治療情況
2.1.1 輔助策略選擇情況
在 DACCA 數據庫中,2007–2020 年期間“輔助策略”一欄的有效數據行共 2 611 條,占所有分析數據的 66.0%(2 611/3 955)。各輔助策略選擇情況見表 1,從表 1 可見,選擇“輔助治療”的數據構成比最高(35.6%),選擇“夾心治療”的數據構成比最低(2.0%)。在此 2 611 條有效數據中“入院日期”一欄不為空的數據行共 2 606 條,其輔助策略選擇結果隨年份變化的分布情況見圖 2a。


2.1.2 輔助治療的依從性
在 DACCA 數據庫中,2007–2020 年期間“輔助治療依從性”一欄的有效數據行共 2 362 條,占所有分析數據的 59.7%(2 362/3 955)。各輔助治療依從性情況見表 2,從表 2 可見,“配合”的數據構成比最高(28.1%),“過度”的數據構成比最低(0.8%)。在此 2 362 條有效數據中“入院日期”一欄不為空的數據行共 2 353 條,其隨年份變化的分布情況見圖 2b。

2.2 輔助化療情況
2.2.1 輔助化療的指征評估
在 DACCA 數據庫中,2007–2020 年期間“輔助化療指征評估”一欄的有效數據行共 2 963 條,占所有分析數據的 74.9%(2 963/3 955)。各輔助化療指征評估結果見表 3,從表 3 可見,“必須”的數據構成比最高(38.6%),“只能”的數據構成比最低(5.1%)。在此 2 963 條有效數據中“入院日期”一欄不為空的數據行共 2 955 條,其隨年份變化的分布情況見圖 3a。


a–e:輔助化療的指征評估(a)、接受度(b)、周期數(c)、效果(d)及規范化應用程度(e)結果;f–h:輔助放療的指征評估(f)、接受度(g)及效果(h)結果;i、j:口服(i)和靜脈(j)靶向藥物選擇結果
2.2.2 輔助化療的接受度
在 DACCA 數據庫中,2007–2020 年期間“輔助化療接受度”一欄的有效數據行共 2 586 條,占所有分析數據的 65.4%(2 586/3 955)。輔助化療接受度結果:“拒絕”1 373 條(53.1%),“接受”1 213 條(46.9%)。在此 2 586 條有效數據中“入院日期”一欄不為空的數據行共 2 576 條,其隨年份變化的分布情況見圖 3b。
2.2.3 輔助化療的強度
在 DACCA 數據庫中,2007–2020 年期間“輔助化療強度”一欄的有效數據行共 2 722 條,占所有分析數據的 68.8%(2 722/3 955)。輔助化療強度即輔助化療周期數量分布情況見表 4,從表 4 可見,在有具體化療周期數量的數據中,顯示為 6 周期輔助化療的數據構成比最高(12.4%),而超過 16 周期輔助化療的數據構成比均較低。在此 2 722 條有效數據中“入院日期”一欄不為空的數據行共 2 713 條,對此數據進行變化趨勢分析的結果見圖 3c,該圖中未見輔助化療周期數呈現出特定的變化趨勢。

2.2.4 輔助化療的效果
在 DACCA 數據庫中,2007–2020 年期間“輔助化療效果”一欄的有效數據行共 1 031 條,占所有數據的 26.1%(1 031 /3 955)。各輔助化療效果情況見表 5,從表 5 可見,“穩定”的數據構成比最高(59.9%),“敏感”的數據構成比最低(0.5%)。在此 1 031 條有效數據中“入院日期”一欄不為空的數據行共 1 024 條,其隨年份變化的分布情況見圖 3d。

2.2.5 輔助化療的規范化應用
在 DACCA 數據庫中,2007–2020 年期間“輔助化療規范化應用程度”一欄的有效數據行共 1 149 條,占所有數據的 29.1%(1 149/3 955)。輔助化療規范化應用程度情況:“不涉及”57 條(5.0%)、“是”(表示完全按照國家指南意見進行輔助化療的數據)903 條(78.6%)、“否”(表示未完全按照國家指南意見進行輔助化療的數據)189 條(16.4%)。在此 1 149 條有效數據中“入院日期”一欄不為空的數據行共 1 146 條,其隨年份變化的分布情況見圖 3e。
2.2.6 具備輔助化療指征與最終接受化療之間的關系
在 DACCA 數據庫中 2007–2020 年期間同時具備“輔助化療指征評估”和“輔助化療接受度”數據共 2 506 條,占所有分析數據的 63.4%(2 506/3 955)。在數據分析時,將 DACCA 數據庫中“輔助化療指征評估”標記為“必須”“強推”“推薦”“只能”這 4 種評估結果的數據項歸為“應該”即具備化療指征的數據;標記為“可選”和“無須”的數據項不做變化。具備輔助化療指征與最終接受化療之間的關系分析采用 χ2檢驗(χ2=505.262,P<0.001),提示在真實臨床背景下,輔助化療的應用客觀上是符合標準的,而對于拒絕接受輔助化療的大部分患者可能并沒有接受更為合理的臨床治療,同時,在輔助化療的推薦程度有限的情況下,明顯發現患者接受程度降低,這也符合客觀情況,這些結果揭示了提高患者對輔助化療的接受程度將可能對當前的臨床診療規范化及治療效果提升有幫助。結果見表 6。

2.3 輔助放療情況
2.3.1 輔助放療的指征評估
在 DACCA 數據庫中,2007–2020 年期間“輔助放療指征評估”一欄的有效數據行共 2 915 條,占所有數據的 73.7%(2 915/3 955)。各輔助放療的指征評估結果見表 7,從表 7 可見,評估為“無須”的數據構成比最高(49.1%)、評估為“可選”的數據構成比最低(1.4%)。在此 2 915 條有效數據中“入院日期”一欄不為空的數據行共 2 852 條,其隨年份變化的分布情況見圖 3f。

2.3.2 輔助放療的接受度
在 DACCA 數據庫中,2007–2020 年期間“輔助放療接受度”一欄的有效數據行共 2 803 條,占所有數據的 70.9%(2 803/3 955)。輔助放療接受度情況:“拒絕” 2 629 條(93.8%)、“接受” 174 條(6.2%)。在此 2 803 條有效數據中“入院日期”一欄不為空的數據行共 2 746 條,其隨年份變化的分布情況見圖 3g。
2.3.3 輔助放療的效果
在 DACCA 數據庫中,2007–2020 年期間“輔助放療效果”一欄的有效數據行共 118 條,占所有數據的 3.0%(118/3 955)。輔助放療的效果結果見表 8。從表 8 可見,輔助放療效果“穩定”的數據構成比最高(38.1%)、“無效”的數據構成比最低(4.2%)。在此 118 條有效數據中“入院日期”一欄不為空的數據行共 111 條,其隨年份變化的分布情況見圖 3h。

2.3.4 輔助放療指征評估結果與最終接受放療間的關系
在 DACCA 數據庫中 2007–2020 年期間同時具備“輔助放療指征評估”和“輔助放療接受度”數據者共 2 440 條,占所有分析數據的 61.7%(2 506/3 955)。在分析二者的關系時,將數據進行了調整,即將 DACCA 數據庫中輔助放療指征評估結果為“必須”“強推”及“推薦”者的數據項歸為“應該”,即具備放療指征的數據;DACCA 數據庫中輔助放療指征評估結果為“可選”和“無須”的數據項不變。采用 χ2 檢驗分析輔助放療指征評估結果與最終接受放療間的關系發現,在輔助放療指征評估結果為“接受”的患者中,最終接受放療為“應該”的占比最高;在輔助放療指征評估結果為“拒絕”的患者中,最終接受放療為“可選”和“無須”者占比更高(χ2=139.593,P<0.001),見表 9。結果提示,在真實臨床背景下,輔助放療的應用客觀上是符合標準的,而對于拒絕接受輔助放療的大部分患者可能并沒有接受更為合理的臨床治療;同時發現,在輔助放療的推薦程度有限的情況下,患者接受度降低。

2.4 靶向藥物情況
2.4.1 口服靶向藥物的使用
在 DACCA 數據庫中,2007–2020 年期間“口服靶向藥物”一欄的有效數據行共 2 520 條,占所有數據的 63.7%(2 520/3 955)。在口服靶向藥物選擇時,選擇“否”的數據有 2 121 條(84.2%)、選擇“是”的數據有 399 條(15.8%)。在此 2 520 條有效數據中“入院日期”一欄不為空的數據行共 2 512 條,其隨年份變化的分布情況見圖 3i。
2.4.2 靜脈靶向藥物的使用
在 DACCA 數據庫中,2007–2020 年期間“靜脈靶向藥物”一欄的有效數據行共 281 條,占所有數據的 7.1%(281/3 955)。在靜脈靶向藥物的選擇時,選擇“否”的數據有 206 條(73.3%)、選擇“是”的數據有 75 條(26.7%)。在此 281 條有效數據中“入院日期”一欄不為空的數據行共 280 條,其隨年份變化的分布情況見圖 3j。
3 討論
3.1 輔助治療的真實世界特征
真實世界研究最早提出就是針對藥物效果的評價,其區別于經典設計型研究的最大特點就是數據來源與患者應用藥物的真實情況,減少嚴格的試驗方案設計帶來的不真實性和不適用性[3-4]。在結直腸癌的輔助治療中,這種真實世界研究的理念恰好適用。采用國際和國內的結直腸癌指南[5-10],為醫師提供了便利的治療決策依據,但是無法掌握治療過程中患者及家庭因素帶來治療的最終接受情況的變化,也無法支持醫師在患者接受治療過程出現病情變化時做出的措施調整。因此,我們在判斷輔助治療效果時無法回避這些行為所致的治療細節變化,可能對于最終結果帶來的影響。而在此階段,最終結果可能就直接涉及到患者的生存率[11-14]。如何選擇合適的方式、獲取輔助治療的細節,必然是結直腸癌專科醫生所需要長期討論的話題。在全球多個可提供大數據的結直腸癌數據庫中均沒有一個統一輔助治療數據的采集方式就足以說明這一話題的復雜性。
本團隊在長達 15 年的結直腸癌數據庫管理經驗總結中發現,如果按照患者的輔助放化療方案詳細記錄藥物劑量、放療的劑量、每次治療的藥物參數等,在數據庫實際操作中是不可行的,且無法對于預后進行有效關聯分析,所以目前結直腸癌數據庫采用的方式是:醫生計劃如何的方案,患者是否接受方案,方案的完整度如何以及是否偏離指南或偏離計劃的思路,更加注重行為特征和總體判斷(如按照計劃完成術后的 6 周期化療)而不再做不必要的細節數據采集(如每次化療采用 CapeOX 并記錄卡培他濱用法為 1.5 g、口服、2 次/d 等[1]),從而將“行為—結果”的特征充分地體現出來,這種描述結直腸癌輔助治療階段真實世界數據的獲取方式,為利用數據決策預后創造了條件。從近期本團隊的數據分析來看,通過這樣的方式確實可以更為有效地利用大數據技術工具[15-17]去分析和預測預后的關聯性。
3.2 輔助放化療的實施
從輔助化療是否需要實施的數據看,評估為“無須”輔助化療的患者比例大約在 15.3%,這個比例大約與結直腸癌Ⅰ期和低風險組Ⅱ期的數據接近。但對于需要或可能需要輔助化療的患者,在 DACCA 數據庫中進行了更多的劃分:“必須”進行輔助化療的行為表達醫生對于治療需求的強調,做出“必須”的選擇就是對患者來說是最為緊迫的選擇,這多數情況下表示輔助治療在指南中也說明了其必要性;而“推薦”則更具備指南中多數文字描述的口吻,因為指南作為綜合性的意見庫,更多是推薦如何進行治療可能會更好。在 DACCA 數據庫中,我們將“必須”和“推薦”這兩種強度不同的治療要求進行了劃分,便于確定輔助治療對于患者的重要性。在整個數據庫分析的數據中,這兩類數據占比也最高(分別為 38.6% 和 26.0%),從這一數據可以看出,在結直腸癌患者中,無論是醫生的觀點還是指南的引導,現在就診的結直腸癌患者中需要施行輔助化療的患者可能會超過 1/2,這也從另一個角度反映了實際上在院接受了手術的結直腸癌患者中多數都可能是具有風險或分期偏晚的人群。另外,從本次數據分析中我們可以看出,對于輔助化療的接受程度并不如我們預想中這么滿意,實際上可能超過一半(53.1%)的患者對于接納輔助化療是處于拒絕的態度,這種進行輔助化療的實際需求與患者最終是否愿意接納輔助化療的反差也顯露了醫患雙方對于輔助化療的理解和認同上的差異,這樣的反差在輔助放療的數據中也有類似的發現,輔助放療中屬于“必須”(12.3%)和“推薦”(30.3%)的數據相加也接近約 1/2 的患者有輔助放療的必要,但是患者實際表現出來的態度則是 93.8% 的患者拒絕接受輔助放療。于是我們猜想,從真實世界的狀態下分析,患者和家屬可能把結直腸癌的治療訴求放在了手術環節,也默認為手術是治療結直腸癌最主要甚至是唯一的途徑,而手術后伴隨結直腸癌早晚程度的評估完成,患者和家屬對于治療疾病的態度就可能出現變化,不一定還會保持原有對于治療的強烈訴求,再加之患者和家屬可能存在對于輔助化療未知不良反應、術后身體恢復狀態等諸多的擔憂導致了對于輔助治療的懼怕,這一現象提示了我們,實際上我們在進行術后 5 年隨訪的結直腸癌患者很可能不是按預期進行了輔助治療的患者,那么指南中的推薦意見在實際需求中就顯得應用價值偏低,而我們更應該考慮是否對結直腸癌患者提出更具有實用性或者說更符合中國患者實際需要的治療意見,這種意見更多的是把握患者術后治療的總體安排,讓患者更容易接受和更有利于獲取長期的療效。當然,這樣的想法還需要一些研究來加以分析,在這種情況下,可能就正好是利用大數據技術去剖析這些復雜關系的時機。
3.3 輔助治療的效果
對于輔助治療的效果評估,除了長期預后的分析(前述提到了這是一個難點)外,還有治療后近期的效果。輔助治療的近期效果還不同于新輔助治療,后者可以選擇比較客觀的參數(如腫瘤消退分級)或相對客觀的參數(如轉化切除率、保肛率)等作參照。但是輔助治療的近期效果的參數特征會更加復雜,有可測量病灶(如復發灶和轉移灶)時可以利用腫瘤大小的改變作評估,但沒有可測量病灶時就會轉而依賴以時間作參數的腫瘤標志物(如 CEA、CA19-9 等)和影像學變化。所以為了闡述這種輔助治療的效果,DACCA 數據庫提供了一套新的分類編碼方式。從該分類方式看,輔助化療能獲得“穩定”效果的患者處于多數(59.9%),但要達到“敏感”效果的患者則極少(0.5%),這種“穩定”的效果常常表現在需要輔助化療的患者,各方面隨訪指標的穩定,而“敏感”則會需要腫瘤標志物等對于輔助治療有明顯的治療反應,而且反應的表現非常積極,有利于患者的預后。現在,對于輔助治療的敏感與否,其實已經引入了錯配修復缺陷、微衛星不穩定性水平等精準醫療的檢驗參數[6, 18-19]。如果將臨床特征的敏感與否甚至是整個輔助治療效果的分類體系與精準醫療的檢驗檢測相融合,想必會衍生出具有創新性的精準醫療決策工具,從這一點上看,很可能為以后以數據為基礎、決策為目標的輔助治療方案管理提供新的思路。同樣的情況也在輔助放療的數據中得到的體現,研究分析中發現,臨床特征判斷的輔助放療“無效”的患者,通常并不單單是來自測量病灶的大小變化,還來自患者腫瘤標志物、影像學等的變化,那么這種“無效”與放療所帶來的損傷/獲益比例是否有關系,是否可以用于進一步推演術后輔助放療患者的選擇方案,都還需要更多的數據關系分析。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:劉勇負責文章的主要撰寫工作;汪曉東負責文章部分撰寫和修改工作;朱佳怡負責數據整理、部分內容撰寫工作;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員;周總光負責數據庫理論及應用、質量控制及研究監督。
倫理聲明:本研究已通過四川大學華西醫院倫理學委員會的審核并同意[批文編號:2019 年審(140)號]。