引用本文: 汪曉東, 李立. 數據庫研究第十一部分:結直腸癌的隨訪. 中國普外基礎與臨床雜志, 2021, 28(9): 1209-1214. doi: 10.7507/1007-9424.202107054 復制
華西腸癌數據庫(Database from Colorectal Cancer,DACCA)是四川大學華西醫院結直腸外科專業團隊以真實世界研究為思路和理念而建設的數據庫[1-2]。筆者團隊已推出系列數據庫報道,包括數據庫研究、數據庫建設等章節。本研究內容為數據庫研究系列報道的第一章最后一部分,將對 DACCA 數據庫中結直腸癌的隨訪數據進行分析研究。
1 資料與方法
1.1 數據庫版本
本研究中數據分析選取的 DACCA 版本為 2021 年 6 月 22 日更新版。
1.2 DACCA 數據庫的應用參數
本研究涉及的完整數據項目的定義,會在“數據庫建設”系列報道的第十一部分中詳細說明及闡述。本研究中針對數據庫中隨訪結果及隨訪管理數據進行分析,其指標包括:生存(survival),應對方式(醫生隨訪行為的應對方式,attitude and reaction for follow-up),是否選擇門診(out-patient)、微信(wechat)、QQ(qq tools)、電話(phone call)、短信(text message)、APP 隨訪(mobile application)、病房(face-to-face),門診隨訪次數,電話隨訪次數,以及術后 5 年內每年隨訪次數。
1.3 DACCA 數據庫的篩選方案
根據本研究的需要,筆者所在團隊對總數據庫信息進行篩選,從總數據中按照手術日期及隨訪日期中任有其一作為對象。本次數據篩選完成時間為 2021 年 7 月 4 日。
1.4 統計學方法
本次 D A C C A 數據庫分析的應用工具為 Excel(Office 365,Microsoft,Redmond,WA,USA)與 SPSS 22.0。經典統計學描述和正態性檢驗由 SPSS 22.0 完成,可視化由 Excel 統計圖表與工具完成。計數資料以“條”進行描述;計量資料不服從正態分布,以中位數(四分位數)表示。
2 結果
截至 2021 年 7 月 4 日,本次研究從總數據庫的 27 543 條中篩選出數據病案(數據行,lines)總量為 6 437 條,年份跨度為 2004–2021 年。具體篩選過程及結果見圖 1。

2.1 隨訪時間
在 DACCA 數據庫中,2004–2021 年期間按照“手術日期”與“隨訪終期”的差值可以計算出隨訪時間的數據共計 6 437 條,占所有本次分析數據的 100%。所有數據隨訪時間為 0~201 個月、中位隨訪時間(四分位數)為 36(13,72)個月。根據患者手術日期作為索引,隨訪時間分布情況見圖 2a。按照結直腸癌的 5 年隨訪期選取其中截至 2021 年已經達到 5 年(2004–2015 年)的數據 3 642 條,占上述可以計算隨訪時間數據(6 437 條)的 56.6%。以該數據分析,滿 5 年隨訪期的數據中,隨訪時間為 0~201、中位隨訪時間(四分位數)為 67(26,97)個月。

a:隨訪終期結直腸癌患者的隨訪時間(月);b:達 5 年隨訪期結直腸癌患者的生存結果;c:結直腸癌患者對于隨訪的應對方式分布;d:按年份的原手術團隊門診隨訪數據分布;e:按年份的結直腸癌相關非原手術團隊門診隨訪數據分布;f:按年份的便民門診隨訪數據分布;g:按年份的非結直腸癌相關專家門診隨訪數據分布;h:按年份的電話隨訪數據分布;i:第 1 年隨訪總次數按年份分布;j:第 2 年隨訪總次數按年份分布;k:第 3 年隨訪總次數按年份分布;l:第 4 年隨訪總次數按年份分布;m:第 5 年隨訪總次數按年份分布;n:5 年以上隨訪總次數按年份分布
2.2 生存結果
在 DACCA 數據庫中,本次的生存分析將隨訪結果的結局分為“生存”或者“死亡”。經篩選后 2004–2021 年提供生存結果的數據共計 5 787 條,占本次分析數據總數的 89.9%。其中“生存”數據 4 611 條,占提供生存結果數據的 79.7%;“死亡”數據 1 176 條,占比 20.3%。按照結直腸癌的 5 年隨訪期選取 2004–2015 年的數據 3 401 條,占提供生存結果數據的 58.8%。該數據中“生存”數據 2 550 條,占提供 5 年隨訪期數據的 75.0%; “死亡”數據 851 條,占比 25.0%。按照年份分布的隨訪結果見圖 2b。由圖 2b 可見,除去 2004–2006 年數據量較少外,2008 年滿 5 年隨訪期的生存率最高,為 91.4%(235/257);2012 年滿 5 年隨訪期的生存率最低,為 69.6%(327/470)。
2.3 醫生隨訪應對方式
在 DACCA 數據庫中,2004–2021 年期間有醫生對于隨訪應對方式的數據共計 2 762 條,占所有本次分析數據的 42.9%。具體分布見圖 2c。從數據中可見,醫生能主動進行隨訪的數據最多,共計 2 121 條,占提供隨訪應對方式數據的 76.8%;主動隨訪與被動隨訪相結合的隨訪數據最少,共計 26 條,占提供隨訪應對方式數據的 0.9%。
2.4 隨訪途徑
在 DACCA 數據庫中,2004–2021 年能夠提供隨訪途徑的數據為 4 676 條(其中 1 條數據可包含多種隨訪方式),占本次分析總數據的 72.6%。其中,采用門診方式進行隨訪的數據為 4 236 條,占所有可以提供隨訪途徑數據的 90.6%;采用微信方式進行隨訪的數據為 752 條,占 16.1%;采用 QQ 方式隨訪的數據僅 2 條,<0.1%;采用電話方式隨訪的數據為 2 852 條,占 61.0%;采用短信方式隨訪的數據為 75 條,占 1.6%;采用手機應用 APP 隨訪的數據為 50 條,占 1.1%;采用病房當面隨訪的數據為 13 條,占 0.3%。
2.5 隨訪次數
在 DACCA 數據庫中,2004–2021 年可提供隨訪次數的數據為 4 380 條(其中 1 條數據可包含多種隨訪方式),占本次分析總數據的 68.0%。其中,由原手術團隊進行的門診隨訪數據為 4 380 條,占可提供隨訪次數數據的 100%;由結直腸癌相關非原手術團隊進行的門診隨訪數據為 3 198 條,占可提供隨訪次數數據的 73.0%;由便民門診進行隨訪的數據為 3 179 條,占可提供隨訪次數數據的 72.6%;其他非結直腸癌相關專家進行的門診隨訪數據為 3 175 條,占可提供隨訪次數數據的 72.5%。通過電話隨訪的次數數據為 3 808 條,占可提供隨訪次數數據的 86.9%。
由上述 5 種不同的隨訪方式隨訪的具體次數,按照年份分布情況詳見圖 2d-2h。其中,原手術團隊隨訪具體次數為 0~130 次、中位數(四分位數)為 5(2,10)次;結直腸癌相關非原手術團隊隨訪具體次數為 0~100 次、中位數(四分位數)為 0(0,1)次;便民門診隨訪具體次數為 0~217 次、中位數(四分位數)為 0(0,1)次;其他非結直腸癌相關專家處隨訪具體次數為 0~23 次、中位數(四分位數)為 1(1,1)次;電話隨訪的具體次數為 0~68 次、中位數(四分位數)為 0(0,1)次。2004–2021 年,按照每年隨訪次數總數量有數據的為 3 386 條,占本次可分析數據的 52.6%。其中第 1 年隨訪次數有數據的為 3 044 條,占所有有隨訪次數總數量數據的 89.9%;第 2 年隨訪次數有數據的為 1 335 條,占所有有隨訪次數總數量數據的 39.4%;第 3 年隨訪次數有數據的為 779 條,占所有有隨訪次數總數量數據的 23.0%;第 4 年隨訪次數有數據的為 550 條,占所有有隨訪次數總數量數據的 16.2%;第 5 年隨訪次數有數據的為 423 條,占所有有隨訪次數總數量數據的 12.5%;5 年以上隨訪次數有數據的為 328 條,占所有有隨訪次數總數量數據的 9.7%。
隨訪總數量按照隨訪年次,其年份分布情況見圖 2i-2n。其中第 1 年隨訪具體次數為 0~73 次、中位數(四分位數)為 5(3,9)次;第 2 年隨訪具體次數為 0~35 次、中位數(四分位數)為 2(1,5)次;第 3 年隨訪具體次數為 0~40 次、中位數(四分位數)為 1(0,4)次;第 4 年隨訪具體次數為 0~56 次、中位數(四分位數)為 1(0,3)次;第 5 年隨訪具體次數為 0~22 次、中位數(四分位數)為 1(0,2)次;5 年以上隨訪具體次數為 0~36 次、中位數(四分位數)為 0(0,2)次。
3 討論
3.1 結直腸癌的隨訪與預后
手術是結直腸癌根治的主要措施,而評估結直腸癌治療最終結果需要預后信息。結直腸癌的預后需要長達 5 年的隨訪期,因此如何獲取長期的預后結果是提供對于結直腸癌的療效評價的關鍵[3]。在 DACCA 最后的一部分模塊設計中,對于隨訪數據的管理進行了詳細的規化。不僅可以獲取結直腸癌的隨訪結果,還對于如何進行的隨訪給予了記錄,是希望通過這樣詳細的記錄過程,充分地解讀目前結直腸癌隨訪中存在的問題,以及提出更具有價值的提高隨訪率的措施。
目前,公開的癌癥數據庫以及部分專病數據庫已經逐步在嘗試展示不同地區人群的結直腸癌預后結果[4-7]。這一結果不同于通過抽樣和推算方式進行的全人群癌癥病死率的數據。專病數據庫承載有數據隊列的特征,具備更多具有專病特點的數據參數,這與全人群癌癥病死率的報道具有互補的作用,而且專病數據庫更能體現對于某種特定疾病預后預測模型及相應產品的應用級研發價值。所以,我們需要根據專病數據庫級全人群癌癥預后數據的不同特點,加以有效的整合,才能為某一特定癌癥提供具有數據挖掘價值的數據池。
正如在 DACCA 系列報道的開篇我們所提到的,現在已經提供的數據可以初步獲得一些可以參考的結直腸癌生存率數據[1]。最新 GLOBALCAN 提供 2020 年數據為結直腸癌所占人群死亡率為 9/10 萬[8],來自美國癌癥協會(American Cancer Society,ACS)的數據[9]顯示,結腸癌疾病相關 5 年生存率為 63%,直腸癌疾病相關 5 年生存率為 67%。從本數據庫所獲取的結直腸癌隨訪數據可以看到,5 年隨訪數據相關的中位隨訪時間(四分位數)為 67(26,97)個月,生存率為 75.0%。本數據庫提供的單中心結直腸癌生存率數據是不能與代表某一國家全國水平的生存率數據作比較的,而這種單中心數據的結果與人群總體數據的差異主要是用于尋找對于預后存在影響的因素之間的差異。本數據庫本次提供的數據,是完成新一輪 10 年隨訪后所得,但是仍舊發現有部分結直腸癌的患者隨訪數據存在缺失。因此我們初步認為,源自本數據庫提供的在本醫療中心診治的結直腸癌患者的生存率波動在 75% 上下,而這個數據更適合用于評估對于該數據庫中結直腸癌的多種與預后相關的醫療行為的決策研究。但是全人群數據和專病數據仍需要通過預后數據作為關聯,因此,未來還需要進一步細化對結直腸癌專病數據庫的獲取與解讀,才能更進一步建立具有價值的結直腸癌專病標準數據集。也需要借助全人群數據對結直腸癌專病預后的預測提供更多的數據挖掘空間。
3.2 結直腸癌患者的隨訪行為
對結直腸癌患者的隨訪是一項醫患雙方行為高度相關的醫療環節,醫生可以主動獲取隨訪結果,如因臨床研究需要進行的隨訪等;患者也可以主動進行隨訪,如經典的門診定期復診等[10]。無論是哪種形式,都是與個人行為有關,也自然存在其不可預知性。這也能解釋為什么獲取癌癥相關隨訪結果如此困難,使隨訪成為制約評估結直腸癌治療效果的瓶頸。
目前國際和國內都有結直腸癌隨訪的指南[11-12],對于隨訪方式、頻率等的設計都比較相似。但是最終可以按照指南進行的隨訪畢竟仍舊為少數。所以了解目前結直腸癌隨訪的特點,可以為如何提高有效隨訪提供依據。從本數據庫的數據分析中可以看到,完全是由于醫生主動發起的隨訪行為占多數(76.8%),這也說明為獲取隨訪的信息,專業醫生會處于更為主動的角色中。由于數據庫的持續更新等需要,數據庫相關專業團隊也必然更容易發起隨訪,而且從聯系方式上看,在倫理學同意的基礎上,醫生會相對更容易利用被倫理學和臨床研究所允許的隨訪;相反,結直腸患者及家屬要主動尋求醫生獲取隨訪交流則較為困難,需要采取多種隨訪的途徑。本研究中也分析到患者會采用多種形式的隨訪途徑,其中最主要的途徑就是門診隨訪方式(90.6%),這一結果也符合目前我國癌癥隨診的特點(定期門診復查)。但是這樣的隨訪方式,需要高度依賴患者的隨訪意愿,而患者可能因為家庭、經濟、地域等諸多因素導致無法完全按照計劃意愿完成隨訪。因此有越來越多的醫療團隊嘗試了更多的方式,開展隨訪,包括利用醫療服務 APP、微信等。但是這些隨訪手段還屬于利用新型技術的過程,一部分患者還不會利用手機進行隨訪,同時還沒有達到可以替代傳統門診隨訪的方式。從現有數據庫數據中可以看到,目前采用微信方式隨訪的僅為 16.1%,手機應用 APP 歲的僅為 1.1%。若需要進一步的降低傳統門診隨訪的頻率,為患者提供可能更為便捷的隨訪方式,則需要進一步在國家“互聯互通”的政策[13]下積極挖掘結直腸癌隨訪的應用場景。
另一方面,結直腸癌患者對于門診方式隨訪的依賴程度,也成為數據庫隨訪特征了解的內容。本數據庫提供的門診隨訪的次數來自于數據庫可以覆蓋到的醫療機構,難以測算患者曾達到的所有醫療機構的隨訪情況。可以初步判斷的是,患者基本都有返回原手術團隊門診隨訪的情況,這顯示出患者對于曾為其施行手術的醫生的高度依賴。而從隨訪總數量數據分析可以看出,從術后第 1 年到術后第 5 年,結直腸癌患者隨訪總量表現出逐年遞減的特點,其中第 1 年為 5(3,9)次;第 2 年為 2(1,5)次;第 3 年為 1(0,4)次;第 4 年為 1(0,3)次;第 5 年為 1(0,2)次。這種遞減的隨訪頻次也符合患者術后 5 年的隨訪需要,而這種源自真實世界場景下的隨訪數據,也表明患者的隨訪確實與現行指南中需要的頻次有所不同,應該根據患者的實際情況,對于患者隨訪制定更為靈活、個性化的方案。
總之,結直腸癌的隨訪是最為關鍵的全生命周期數據參數之一,是為結直腸癌所有診治方案提供答案的評判因素。本研究作為系列數據庫研究的最后一部分,僅對數據庫中結直腸癌的隨訪特點以及基于本數據庫的數據隊列的預后進行分析評價。未來還需要利用隨訪重點結果更深入地進行數據挖掘,探究結直腸癌全程診療的諸多細節。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:汪曉東負責文章的主要撰寫工作;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員。
倫理聲明:本研究已通過四川大學華西醫院倫理學委員會的審核并同意[批文編號:2019 年審(140)號]。
華西腸癌數據庫(Database from Colorectal Cancer,DACCA)是四川大學華西醫院結直腸外科專業團隊以真實世界研究為思路和理念而建設的數據庫[1-2]。筆者團隊已推出系列數據庫報道,包括數據庫研究、數據庫建設等章節。本研究內容為數據庫研究系列報道的第一章最后一部分,將對 DACCA 數據庫中結直腸癌的隨訪數據進行分析研究。
1 資料與方法
1.1 數據庫版本
本研究中數據分析選取的 DACCA 版本為 2021 年 6 月 22 日更新版。
1.2 DACCA 數據庫的應用參數
本研究涉及的完整數據項目的定義,會在“數據庫建設”系列報道的第十一部分中詳細說明及闡述。本研究中針對數據庫中隨訪結果及隨訪管理數據進行分析,其指標包括:生存(survival),應對方式(醫生隨訪行為的應對方式,attitude and reaction for follow-up),是否選擇門診(out-patient)、微信(wechat)、QQ(qq tools)、電話(phone call)、短信(text message)、APP 隨訪(mobile application)、病房(face-to-face),門診隨訪次數,電話隨訪次數,以及術后 5 年內每年隨訪次數。
1.3 DACCA 數據庫的篩選方案
根據本研究的需要,筆者所在團隊對總數據庫信息進行篩選,從總數據中按照手術日期及隨訪日期中任有其一作為對象。本次數據篩選完成時間為 2021 年 7 月 4 日。
1.4 統計學方法
本次 D A C C A 數據庫分析的應用工具為 Excel(Office 365,Microsoft,Redmond,WA,USA)與 SPSS 22.0。經典統計學描述和正態性檢驗由 SPSS 22.0 完成,可視化由 Excel 統計圖表與工具完成。計數資料以“條”進行描述;計量資料不服從正態分布,以中位數(四分位數)表示。
2 結果
截至 2021 年 7 月 4 日,本次研究從總數據庫的 27 543 條中篩選出數據病案(數據行,lines)總量為 6 437 條,年份跨度為 2004–2021 年。具體篩選過程及結果見圖 1。

2.1 隨訪時間
在 DACCA 數據庫中,2004–2021 年期間按照“手術日期”與“隨訪終期”的差值可以計算出隨訪時間的數據共計 6 437 條,占所有本次分析數據的 100%。所有數據隨訪時間為 0~201 個月、中位隨訪時間(四分位數)為 36(13,72)個月。根據患者手術日期作為索引,隨訪時間分布情況見圖 2a。按照結直腸癌的 5 年隨訪期選取其中截至 2021 年已經達到 5 年(2004–2015 年)的數據 3 642 條,占上述可以計算隨訪時間數據(6 437 條)的 56.6%。以該數據分析,滿 5 年隨訪期的數據中,隨訪時間為 0~201、中位隨訪時間(四分位數)為 67(26,97)個月。

a:隨訪終期結直腸癌患者的隨訪時間(月);b:達 5 年隨訪期結直腸癌患者的生存結果;c:結直腸癌患者對于隨訪的應對方式分布;d:按年份的原手術團隊門診隨訪數據分布;e:按年份的結直腸癌相關非原手術團隊門診隨訪數據分布;f:按年份的便民門診隨訪數據分布;g:按年份的非結直腸癌相關專家門診隨訪數據分布;h:按年份的電話隨訪數據分布;i:第 1 年隨訪總次數按年份分布;j:第 2 年隨訪總次數按年份分布;k:第 3 年隨訪總次數按年份分布;l:第 4 年隨訪總次數按年份分布;m:第 5 年隨訪總次數按年份分布;n:5 年以上隨訪總次數按年份分布
2.2 生存結果
在 DACCA 數據庫中,本次的生存分析將隨訪結果的結局分為“生存”或者“死亡”。經篩選后 2004–2021 年提供生存結果的數據共計 5 787 條,占本次分析數據總數的 89.9%。其中“生存”數據 4 611 條,占提供生存結果數據的 79.7%;“死亡”數據 1 176 條,占比 20.3%。按照結直腸癌的 5 年隨訪期選取 2004–2015 年的數據 3 401 條,占提供生存結果數據的 58.8%。該數據中“生存”數據 2 550 條,占提供 5 年隨訪期數據的 75.0%; “死亡”數據 851 條,占比 25.0%。按照年份分布的隨訪結果見圖 2b。由圖 2b 可見,除去 2004–2006 年數據量較少外,2008 年滿 5 年隨訪期的生存率最高,為 91.4%(235/257);2012 年滿 5 年隨訪期的生存率最低,為 69.6%(327/470)。
2.3 醫生隨訪應對方式
在 DACCA 數據庫中,2004–2021 年期間有醫生對于隨訪應對方式的數據共計 2 762 條,占所有本次分析數據的 42.9%。具體分布見圖 2c。從數據中可見,醫生能主動進行隨訪的數據最多,共計 2 121 條,占提供隨訪應對方式數據的 76.8%;主動隨訪與被動隨訪相結合的隨訪數據最少,共計 26 條,占提供隨訪應對方式數據的 0.9%。
2.4 隨訪途徑
在 DACCA 數據庫中,2004–2021 年能夠提供隨訪途徑的數據為 4 676 條(其中 1 條數據可包含多種隨訪方式),占本次分析總數據的 72.6%。其中,采用門診方式進行隨訪的數據為 4 236 條,占所有可以提供隨訪途徑數據的 90.6%;采用微信方式進行隨訪的數據為 752 條,占 16.1%;采用 QQ 方式隨訪的數據僅 2 條,<0.1%;采用電話方式隨訪的數據為 2 852 條,占 61.0%;采用短信方式隨訪的數據為 75 條,占 1.6%;采用手機應用 APP 隨訪的數據為 50 條,占 1.1%;采用病房當面隨訪的數據為 13 條,占 0.3%。
2.5 隨訪次數
在 DACCA 數據庫中,2004–2021 年可提供隨訪次數的數據為 4 380 條(其中 1 條數據可包含多種隨訪方式),占本次分析總數據的 68.0%。其中,由原手術團隊進行的門診隨訪數據為 4 380 條,占可提供隨訪次數數據的 100%;由結直腸癌相關非原手術團隊進行的門診隨訪數據為 3 198 條,占可提供隨訪次數數據的 73.0%;由便民門診進行隨訪的數據為 3 179 條,占可提供隨訪次數數據的 72.6%;其他非結直腸癌相關專家進行的門診隨訪數據為 3 175 條,占可提供隨訪次數數據的 72.5%。通過電話隨訪的次數數據為 3 808 條,占可提供隨訪次數數據的 86.9%。
由上述 5 種不同的隨訪方式隨訪的具體次數,按照年份分布情況詳見圖 2d-2h。其中,原手術團隊隨訪具體次數為 0~130 次、中位數(四分位數)為 5(2,10)次;結直腸癌相關非原手術團隊隨訪具體次數為 0~100 次、中位數(四分位數)為 0(0,1)次;便民門診隨訪具體次數為 0~217 次、中位數(四分位數)為 0(0,1)次;其他非結直腸癌相關專家處隨訪具體次數為 0~23 次、中位數(四分位數)為 1(1,1)次;電話隨訪的具體次數為 0~68 次、中位數(四分位數)為 0(0,1)次。2004–2021 年,按照每年隨訪次數總數量有數據的為 3 386 條,占本次可分析數據的 52.6%。其中第 1 年隨訪次數有數據的為 3 044 條,占所有有隨訪次數總數量數據的 89.9%;第 2 年隨訪次數有數據的為 1 335 條,占所有有隨訪次數總數量數據的 39.4%;第 3 年隨訪次數有數據的為 779 條,占所有有隨訪次數總數量數據的 23.0%;第 4 年隨訪次數有數據的為 550 條,占所有有隨訪次數總數量數據的 16.2%;第 5 年隨訪次數有數據的為 423 條,占所有有隨訪次數總數量數據的 12.5%;5 年以上隨訪次數有數據的為 328 條,占所有有隨訪次數總數量數據的 9.7%。
隨訪總數量按照隨訪年次,其年份分布情況見圖 2i-2n。其中第 1 年隨訪具體次數為 0~73 次、中位數(四分位數)為 5(3,9)次;第 2 年隨訪具體次數為 0~35 次、中位數(四分位數)為 2(1,5)次;第 3 年隨訪具體次數為 0~40 次、中位數(四分位數)為 1(0,4)次;第 4 年隨訪具體次數為 0~56 次、中位數(四分位數)為 1(0,3)次;第 5 年隨訪具體次數為 0~22 次、中位數(四分位數)為 1(0,2)次;5 年以上隨訪具體次數為 0~36 次、中位數(四分位數)為 0(0,2)次。
3 討論
3.1 結直腸癌的隨訪與預后
手術是結直腸癌根治的主要措施,而評估結直腸癌治療最終結果需要預后信息。結直腸癌的預后需要長達 5 年的隨訪期,因此如何獲取長期的預后結果是提供對于結直腸癌的療效評價的關鍵[3]。在 DACCA 最后的一部分模塊設計中,對于隨訪數據的管理進行了詳細的規化。不僅可以獲取結直腸癌的隨訪結果,還對于如何進行的隨訪給予了記錄,是希望通過這樣詳細的記錄過程,充分地解讀目前結直腸癌隨訪中存在的問題,以及提出更具有價值的提高隨訪率的措施。
目前,公開的癌癥數據庫以及部分專病數據庫已經逐步在嘗試展示不同地區人群的結直腸癌預后結果[4-7]。這一結果不同于通過抽樣和推算方式進行的全人群癌癥病死率的數據。專病數據庫承載有數據隊列的特征,具備更多具有專病特點的數據參數,這與全人群癌癥病死率的報道具有互補的作用,而且專病數據庫更能體現對于某種特定疾病預后預測模型及相應產品的應用級研發價值。所以,我們需要根據專病數據庫級全人群癌癥預后數據的不同特點,加以有效的整合,才能為某一特定癌癥提供具有數據挖掘價值的數據池。
正如在 DACCA 系列報道的開篇我們所提到的,現在已經提供的數據可以初步獲得一些可以參考的結直腸癌生存率數據[1]。最新 GLOBALCAN 提供 2020 年數據為結直腸癌所占人群死亡率為 9/10 萬[8],來自美國癌癥協會(American Cancer Society,ACS)的數據[9]顯示,結腸癌疾病相關 5 年生存率為 63%,直腸癌疾病相關 5 年生存率為 67%。從本數據庫所獲取的結直腸癌隨訪數據可以看到,5 年隨訪數據相關的中位隨訪時間(四分位數)為 67(26,97)個月,生存率為 75.0%。本數據庫提供的單中心結直腸癌生存率數據是不能與代表某一國家全國水平的生存率數據作比較的,而這種單中心數據的結果與人群總體數據的差異主要是用于尋找對于預后存在影響的因素之間的差異。本數據庫本次提供的數據,是完成新一輪 10 年隨訪后所得,但是仍舊發現有部分結直腸癌的患者隨訪數據存在缺失。因此我們初步認為,源自本數據庫提供的在本醫療中心診治的結直腸癌患者的生存率波動在 75% 上下,而這個數據更適合用于評估對于該數據庫中結直腸癌的多種與預后相關的醫療行為的決策研究。但是全人群數據和專病數據仍需要通過預后數據作為關聯,因此,未來還需要進一步細化對結直腸癌專病數據庫的獲取與解讀,才能更進一步建立具有價值的結直腸癌專病標準數據集。也需要借助全人群數據對結直腸癌專病預后的預測提供更多的數據挖掘空間。
3.2 結直腸癌患者的隨訪行為
對結直腸癌患者的隨訪是一項醫患雙方行為高度相關的醫療環節,醫生可以主動獲取隨訪結果,如因臨床研究需要進行的隨訪等;患者也可以主動進行隨訪,如經典的門診定期復診等[10]。無論是哪種形式,都是與個人行為有關,也自然存在其不可預知性。這也能解釋為什么獲取癌癥相關隨訪結果如此困難,使隨訪成為制約評估結直腸癌治療效果的瓶頸。
目前國際和國內都有結直腸癌隨訪的指南[11-12],對于隨訪方式、頻率等的設計都比較相似。但是最終可以按照指南進行的隨訪畢竟仍舊為少數。所以了解目前結直腸癌隨訪的特點,可以為如何提高有效隨訪提供依據。從本數據庫的數據分析中可以看到,完全是由于醫生主動發起的隨訪行為占多數(76.8%),這也說明為獲取隨訪的信息,專業醫生會處于更為主動的角色中。由于數據庫的持續更新等需要,數據庫相關專業團隊也必然更容易發起隨訪,而且從聯系方式上看,在倫理學同意的基礎上,醫生會相對更容易利用被倫理學和臨床研究所允許的隨訪;相反,結直腸患者及家屬要主動尋求醫生獲取隨訪交流則較為困難,需要采取多種隨訪的途徑。本研究中也分析到患者會采用多種形式的隨訪途徑,其中最主要的途徑就是門診隨訪方式(90.6%),這一結果也符合目前我國癌癥隨診的特點(定期門診復查)。但是這樣的隨訪方式,需要高度依賴患者的隨訪意愿,而患者可能因為家庭、經濟、地域等諸多因素導致無法完全按照計劃意愿完成隨訪。因此有越來越多的醫療團隊嘗試了更多的方式,開展隨訪,包括利用醫療服務 APP、微信等。但是這些隨訪手段還屬于利用新型技術的過程,一部分患者還不會利用手機進行隨訪,同時還沒有達到可以替代傳統門診隨訪的方式。從現有數據庫數據中可以看到,目前采用微信方式隨訪的僅為 16.1%,手機應用 APP 歲的僅為 1.1%。若需要進一步的降低傳統門診隨訪的頻率,為患者提供可能更為便捷的隨訪方式,則需要進一步在國家“互聯互通”的政策[13]下積極挖掘結直腸癌隨訪的應用場景。
另一方面,結直腸癌患者對于門診方式隨訪的依賴程度,也成為數據庫隨訪特征了解的內容。本數據庫提供的門診隨訪的次數來自于數據庫可以覆蓋到的醫療機構,難以測算患者曾達到的所有醫療機構的隨訪情況。可以初步判斷的是,患者基本都有返回原手術團隊門診隨訪的情況,這顯示出患者對于曾為其施行手術的醫生的高度依賴。而從隨訪總數量數據分析可以看出,從術后第 1 年到術后第 5 年,結直腸癌患者隨訪總量表現出逐年遞減的特點,其中第 1 年為 5(3,9)次;第 2 年為 2(1,5)次;第 3 年為 1(0,4)次;第 4 年為 1(0,3)次;第 5 年為 1(0,2)次。這種遞減的隨訪頻次也符合患者術后 5 年的隨訪需要,而這種源自真實世界場景下的隨訪數據,也表明患者的隨訪確實與現行指南中需要的頻次有所不同,應該根據患者的實際情況,對于患者隨訪制定更為靈活、個性化的方案。
總之,結直腸癌的隨訪是最為關鍵的全生命周期數據參數之一,是為結直腸癌所有診治方案提供答案的評判因素。本研究作為系列數據庫研究的最后一部分,僅對數據庫中結直腸癌的隨訪特點以及基于本數據庫的數據隊列的預后進行分析評價。未來還需要利用隨訪重點結果更深入地進行數據挖掘,探究結直腸癌全程診療的諸多細節。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:汪曉東負責文章的主要撰寫工作;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員。
倫理聲明:本研究已通過四川大學華西醫院倫理學委員會的審核并同意[批文編號:2019 年審(140)號]。