引用本文: 汪曉東, 劉健博, 安麗珉, 李立. 數據庫研究第四部分:結直腸癌的術前 專科檢查與評估. 中國普外基礎與臨床雜志, 2019, 26(10): 1230-1238. doi: 10.7507/1007-9424.201909002 復制
華西腸癌數據庫(Database from Colorectal Cancer,DACCA)是華西醫院結直腸外科以真實世界研究(RWS)為思路和理念而建設的數據庫。如前述,筆者團隊將推出系列數據庫報道,包括:數據庫研究、數據庫建設、數據庫解讀、數據庫決策等[1-6]。本文為數據庫研究第 1 章的第 4 部分。
對結直腸癌患者治療方案的確定,不僅需要作為金標準的全結直腸鏡檢查[7],還需要通過一系列影像學檢查,如 CT、MRI、腔內超聲等,以對手術前患者的腫瘤狀態進行初步的評估,也稱為術前分期[8]。術前分期的結果,可指導對患者的治療決策導向,如是優先考慮手術還是考慮新輔助化療[9]。因此,無論是我國的結直腸癌診療指南,還是國際上通用的美國國立綜合癌癥網絡(National Comprehensive Cancer Network,NCCN)結直腸癌指南,都對結直腸癌患者完成術前分期后,作出相應的推薦治療意見[10-12]。故結直腸癌的術前專科檢查,是尤為重要的術前決策內容。
然而,我們對具體的術前專科檢查方式進行詳細解讀后,可以發現,無論是全結直腸鏡還是影像學檢查,由于受到檢查人員、設備、醫院等多方面的影響,導致最終用于術前決策的這些專科檢查,可能呈現出不同的報告質量。然而,我們容易忽略對于這些專科檢查準確性的預先判斷,從而導致我們在開始術前決策時就存在偏差,甚至嚴重地影響治療方向。
因此,對于結直腸癌患者術前專科檢查的質量評價,是我們為后續治療決策做的重要準備工作。我們不僅要記錄這些患者在初次就診并納入數據庫時已經有的專科檢查,進行詳細的登記和結構化調整;還特別需要在數據庫中,比對這些專科檢查的結果,到底存在多少的誤差。本研究針對這一問題,結合 DACCA 數據庫的術前專科檢查的數據框架設計,對此進行一概要的展示。
1 資料和方法
1.1 數據庫版本
本次數據分析選取的 DACCA 版本為 2019 年7 月 25 日更新版。
1.2 收集的 DACCA 數據庫應用參數
本次研究選取的數據項目的基礎定義,將在“數據庫建設”系列報道四中詳細說明。本次選擇的部分數據項目包括:術前分期(combined preoperative stage)、術前分期契合度(integrating degree of combined preoperative stage)、術前診斷強度(preoperative diagnostic intensity)、腸鏡準確性(accuracy of colonoscopy)、活檢腫瘤性質結果(tumorous type by biopsy)、活檢腫瘤分化程度(tumor differentiation by biopsy)、胸部 CT 完成情況(completion of chest CT)、CT 總分期(CT stage)、CT 總分期評估準確性(accuracy of CT stage)、腔內超聲結果(outcome of transrectal ultrasound)、肝臟超聲結果(outcome of liver ultrasound)、MRI 總分期(MRI stage)、MRI 總分期評估準確性(accuracy of MRI stage)、PET-CT 結果(outcome of PET-CT)、骨掃描結果(outcome of bone scanning)、臨床初診診斷方式(diagnostic way at first visit)和誤診誤治(misdiagnosis and mistreatment)。
1.3 DACCA 數據庫的篩選方案
根據本研究的需要,筆者團隊以手術日期作為排序條件,并依次進行篩選:① 總數據庫的信息篩選(22 824 條);② 以“手術日期”為條件,篩除沒有該項信息的數據行(余 14 631 條);③ 剔除以上應用參數完全為空的數據行(余 4 956 條);④ 剔除數據條目可疑或查實重復的數據(余 4 484 條)。具體篩選過程見圖 1。本次數據庫篩選完成時間為 2019 年 7 月 28 日。

1.4 統計學方法
本次 DACCA 數據庫分析的工具為 Excel(Office 365,Microsoft,Redmond,WA,USA)。經典統計學描述由 Excel 統計圖表工具完成。
2 結果
截至 2019 年 7 月 25 日,數據庫疊加后,符合篩選條件的數據病案(數據行,lines)總量為 4 484 條。
2.1 DACCA 數據庫中的術前 CT 分期與評估準確度
DACCA 數據庫中,對術前 CT 檢查作出了準確度標記的數據行共計 3 877 條,占本次分析數據的 86.5%。其中,833 條顯示為“未做”(數據庫標簽“x”),占有準確度標記項目的 21.5%;有判斷準確性的數據行 3 044 條,占有準確度標記項目的 78.5%。
DACCA 數據庫中,術前 CT 有分期結果的數據行共計 3 166 條,占本次分析數據的 70.6%。按照 TNM 分期的原則,Ⅰ~Ⅳ期占比見圖 2a,可見Ⅲ期占比最高(32.7%),Ⅰ期最低(17.5%)。

a:術前 CT 評價分期的總體分布;b:術前 CT 評價準確度的變化趨勢;c:術前 MRI 評價分期的總體分布;d:術前 MRI 評價準確度的變化趨勢;e:術前綜合分期契合度的變化趨勢
在 DACCA 數據庫中,不僅有術前 CT 分期的結果,還有對分期進行準確度判斷的數據行共計2 615 條,占有術前 CT 分期數據行的 82.6%,占有準確度判斷數據行的 67.4%。根據術前 CT 分期和準確度的關系,出現準確、低估和高估的分布情況詳見表 1。由表 1 可見,在對術前 CT 分期的判斷中,Ⅳ期的判斷準確度最高(86.6%),Ⅰ期判斷結果低估了分期的最多(30.4%),Ⅲ期判斷結果高估了分期的最多(21.8%)。隨時間變化,在有效數據覆蓋的 2007–2019 年期間,不同準確度判斷的年度構成變化見圖 2b,可見總體的術前 CT 判斷準確度,除去數據行過少帶來的誤差,其他年份的準確率浮動在 70% 上下(66.8%~83.7%)。

2.2 DACCA 數據庫中的術前 MRI 分期與評估準確度
DACCA 數據庫中,對術前 MRI 檢查作出了準確度標記的數據行共計 3 480 條,占本次分析數據的 77.6%。其中,3 219 條顯示為“未做”,占有準確度標記項目的 92.5%;在顯示為“未做”者中,標記為“未做但應該做”的(數據庫標簽“xg”)有 2 123 條,占未做術前 MRI 數據行的 66.0%。可見未做術前 MRI 和其中應該做的比例都很高。
DACCA 數據庫中,對術前 MRI 評價有分期結果的數據行共計 286 條,占本次分析數據的 6.4%,這一比例遠遠低于術前 CT 評價分期。按照 TNM 的分期原則,劃分Ⅰ~Ⅳ期的構成比見圖 2c,可見 MRI 判斷術前分期中Ⅲ期占絕大多數(53.5%),而Ⅰ期最少(5.2%)。
在數據庫中,不僅有術前 MRI 分期的結果,還有對分期進行準確度判斷的數據行共計 257 條,占有術前 MRI 分期數據行的 89.9%,占有準確度判斷數據行(3 480 條有準確度記錄,3 219 條標記為未做,實際準確度有結果的 261 條)的 98.5%。根據術前 MRI 分期和準確度的關系,出現準確、低估和高估的分布情況詳見表 2。由表 2 可見,在對術前 MRI 分期的判斷中,Ⅳ期的判斷準確度最高(89.1%),Ⅰ期判斷結果低估了分期的最多(33.3%),Ⅲ期判斷結果高估了分期的最多(13.3%)。隨時間變化,在有效數據覆蓋的 2011–2019 年期間,不同準確度判斷的年度構成變化見圖 2d,可見由于每一年的數據量都太少,總體的術前 MRI 判斷準確度浮動較大,在 2016–2019 年期間逐漸出現升高的趨勢。

2.3 DACCA 數據庫中的術前直腸超聲、肝臟超聲、骨掃描及 PET-CT 檢查的評估準確度
DACCA 數據庫中,對術前直腸超聲的檢查,主要用于評估直腸癌局部 T(浸潤深度)分期和 N(區域淋巴結)分期,對該檢查作出了準確度標記的數據行共計 3 607 條,占本次分析數據的 80.4%。其中,3 233 條顯示為“未做”,占有準確度標記項目的 89.6%;在顯示為“未做”的條目中,標記為“未做但應該做”的有 825 條,占未做術前直腸超聲數據行的 25.5%。
DACCA 數據庫中,對術前肝臟超聲的檢查,主要用于評估結直腸癌可疑肝轉移者的 M 分期,對該檢查作出了準確度標記的數據行共計 2 736 條,占本次分析數據的 61.0%。其中,2 590 條顯示為“未做”,占有準確度標記項目的 94.7%;在顯示為“未做”的條目中,標記為“未做但應該做”的有 972 條,占未做術前肝臟超聲數據行的 37.5%。
DACCA 數據庫中,對術前骨掃描的檢查,主要用于評估結直腸癌可疑骨轉移的 M 分期,對該檢查作出了準確度標記的數據行共計 3 570 條,占本次分析數據的 79.6%。其中,3 265 條顯示為“未做”,占有準確度標記項目的 91.5%;在顯示為“未做”的條目中,標記為“未做但應該做”的有 1 221 條,占未做術前骨掃描數據行的 37.4%。
DACCA 數據庫中,對術前 PET-CT 的檢查,主要用于評估結直腸癌全身可疑多發轉移的 M 分期,對該檢查作出了準確度標記的數據行共計 3 490 條,占本次分析數據的 77.8%。其中,3 474 條顯示為“未做”,占有準確度標記項目的 99.5%;在顯示為“未做”的條目中,標記為“未做但應該做”的有 356 條,占未做術前 PET-CT 數據行的 10.2%。
從這幾項術前評估檢查來看,術前未做的構成比都較高。在 DACCA 數據庫中可以查閱,一旦有準確度判斷的數據條,都有對應的術前評估分期。其中,術前直腸超聲 374 條,肝臟超聲 146 條,骨掃描 305 條,PET-CT 檢查 16 條。這些有術前評估分期的結直腸癌患者的具體分期評估準確度的分布見下表 3。由表 3 可見,無論是直腸超聲、肝臟超聲,還是骨掃描和 PET-CT,術前分期的準確度都較高。

2.4 DACCA 數據庫中術前腸鏡檢查評估
DACCA 數據庫中,對術前腸鏡檢查,共有 3 847 條有效的分析數據,占總分析數據條的 85.8%。其中,標記為術前完成了腸鏡的數據條目為 3 688 條(占 95.9%),未完成腸鏡的數據條目為 159 條(占 4.1%)。在已經完成腸鏡的數據條目中,由四川大學華西醫院完成腸鏡的數據 1 291 條(占 35.0%),由非四川大學華西醫院完成腸鏡的數據 2 397 條(占 65.0%)。
DACCA 數據庫中,由腸鏡下取腫瘤組織,進行病理學檢測后獲得病理類型,有記錄結果的數據共計 3 636 條,占分析用數據的 81.1%。根據腸鏡下活檢的結果進行類型劃分,其數據量和占比見表 4,可見最多的腸鏡下病理類型為腺癌,占 82.2%;同時也有腸鏡下初步診斷為良性疾病的病理類型,如輕~重度非典型增生(占 4.4%)、腺瘤(3.0%)、炎癥(1.8%)、息肉(0.2%)等。腸鏡下報告了病理學類型的同時,部分活檢結果還報告了分化程度,共計 46 條數據,占總體腸鏡有活檢病理結果的 1.3%。其中,數據顯示高分化癌者 8 條,占有分化程度報告的 17.4%;顯示中分化癌者 17 條,占 37.0%;顯示為低分化癌者 21 條,占 45.6%。

2.5 DACCA 數據庫中術前綜合診斷的依據強度
DACCA 數據庫中,能夠綜合患者多種術前評估手段,對診斷的依據強度進行劃分的數據為 3 981 條(88.8%)。其中,診斷依據強度 A 級(高診斷效能)的數據為 3 445 條,占對診斷依據有評價的總數據 86.5%;診斷依據強度 B 級(基本診斷效能)的數據為 316 條,占 7.9%;診斷依據強度 C 級(低診斷效能)為 220 條,占 5.5%。診斷依據強度反映了在手術前,多種檢查結果綜合判斷后對于結直腸癌診斷的準確度的支撐依據,該數據的定義將在數據庫建設的第四部分詳述。
2.6 DACCA 數據庫中術前綜合分期與最終病理分期契合度的關系
DACCA 數據庫中,針對術前的綜合分期(結合所有術前檢查評估、腸鏡和臨床表現的分期)有效數據共計 2 346 條,占分析總數據的 52.3%;其中,經數據審核后有明確分期結果者 2 232 條,占有效數據的 95.1%,還不能明確分期結果者 114 條,占 4.9%。明確術前綜合分期中,按照 TNM 分期原則,Ⅰ期 109 條(占 4.9%),Ⅱ期 615 條(占 27.5%),Ⅲ期 1 263 條(占 56.6%),Ⅳ期 245 條(占 11.0%)。
經數據庫前后信息比對后,完成了與最終病理分期契合度關系分析的有效數據 2 209 條,占總分析數據的 49.3%。將術前綜合分期與最終病理分期進行契合度分析,具體結果如表 5,可見:針對Ⅳ期的術前綜合分期契合度最高,為 98.7%;Ⅱ期的術前綜合分期低估率最高,為 28.3%;Ⅲ期的術前綜合分期高估率最高,為 20.6%。隨時間變化,在有效數據覆蓋的 2008–2019 年期間,不同準確度判斷的年度構成變化見圖 2e,可見術前綜合分期與最終病理分期契合度的準確性較單純的術前 CT 分期更高,浮動在 80% 上下(70.8%~87.7%)。

2.7 DACCA 數據庫中首診臨床因素的特點
DACCA 數據庫中,在結直腸癌患者對病史反饋的過程中,闡述了其因何種臨床原因開始進行疾病的診斷治療,此為定義的首診臨床因素。在數據庫中可以進行分析的有效數據為 3 466 條,占總分析數據的 77.3%。根據其類型劃分結果詳見表 6,可見因指檢后發現腸癌的患者最多,占 64.0%;而由于出血、梗阻等癥狀發現者其次,為 28.2%;因考慮有家族史,就診發現結直腸癌的最少,有 1 條,占比小于 0.1%。

2.8 DACCA 數據庫中確診結直腸癌前出現誤診誤治的情況
DACCA 數據庫中,在確診前由于誤診和誤治的發生,導致最終開始治療結直腸癌的時間有所延遲。在數據庫中對此有明確標記的共計 3 411 條,占總分析數據的 76.1%。其中,標記患者在診斷結直腸癌過程中,沒有誤診和誤治行為的數據 2 969 條,占有明確標記數據的 87.0%;有誤診和誤治行為的數據 442 條,占 13.0%。其具體的分類詳見表 7,可見先期誤診為痔瘡的數據最多,為 207 條,占 46.8%。

3 討論
3.1 結直腸癌術前影像學檢查評估的效能
DACCA 數據庫對于結直腸癌術前檢查與評估,進行了新的數據采集方式調整。不僅對結直腸癌術前常用的影像學檢查,如:CT、MRI、骨掃描、PET-CT 等的診斷結果進行采集和整理,更重要的是對診斷的結果進行效果判定,用準確、低估和高估的劃分方式,建立對于術前影像報告的評價。這是 DACCA 數據庫具有“數據+判斷”功能的重要展示。
由于結直腸癌的術前治療方向決策中,根據影像學進行的分期是最重要的依據之一。因此,CT 和 MRI 檢查對于患者的術前影像分期的準確性尤為重要。這需要通過后期病理學結果和手術發現進行對比后才能得知。早期的研究,已經對于 CT 和 MRI 與病理學結果之間的符合程度進行過多種研究,并有一定的結果報道,總體來說,CT 檢查對于結直腸癌的分期診斷準確性可以達到 75.5%~82.1%;MRI 檢查的術前分期診斷準確性可以達到 72.0%~92.5%[13-16]。從 DACCA 數據庫的真實世界數據報道中,我們也可以發現,術前 CT 評估的準確度可以達到 73.5%,基本和國內外的報道一致。術前 MRI 評估的準確度受到數據量有限的影響,但是也可以達到 80.5%,略高于術前 CT 評估的準確度,特別是針對Ⅳ期結直腸癌患者的診斷準確度更高。
而影像學評價分期中最容易出現分期高估的情況,從本次數據分析上看,主要發生在Ⅲ期的影像學診斷上:術前 CT 評估Ⅲ期的高估率為 21.8%,術前 MRI 評估Ⅲ期的高估率為 13.3%。從影像學上看,評估為Ⅲ期的最主要原因,可能是對于淋巴結轉移為陽性的高估為主。對于Ⅲ期的影像學高估,則可能導致患者本應該直接選擇手術切除的時候,而優先推薦了新輔助治療,這可能導致患者在綜合治療中,出現過度醫療的情況。
然而,無論是術前 CT 評估還是 MRI 評估,從近 10 年的數據來看,診斷的效能變化并不大。這可能是現有影像學診斷技術達到某一個瓶頸后的表現,如何突破最后的 20% 才是重點所在。由于近年來人工智能的算法突飛猛進[17-18],影像組學技術的出現和發展[19-20],為進一步提高影像學診斷的效能提供了助力。目前確切有一部分報道,提示采用影像組學技術進行的術前分期,可以有更高的術前分期診斷效能[21]。這還有賴于人工智能的算法的進一步提升。因此,從結直腸癌數據庫建設的角度上看,“影像組學+人工智能”將成為 DACCA 數據庫重要的延展數據庫之一。通過更為精確的算法,獲得影像學分期診斷后,再鏈接到 DACCA 數據庫中,是下一步需要完善的工作。
3.2 結直腸癌的術前綜合分期與價值探討
本研究團隊早在 10 年前就對“多模式的術前評估”進行了系列探討,部分研究成果也在國內外進行了報道[22-28]。從當時的觀點上來看,我們就已經認為,單純的 CT 或者 MRI 分期評估是不夠的,融合了直腸超聲、腫瘤標志物以及炎性因子后,可以增強單純選擇 CT 和(或)MRI 檢查進行評估的效果。后續又有其他的研究者[29]對于這些綜合評估的因素進行了更多的研究。這一理念在隨后的 10 年中,因臨床研究結果的轉化,切實在臨床上進行了長期的應用。所以,目前的結直腸癌術前評估,不會只評價 CT 和 MRI 檢查的結果,還會密切聯系超聲評估、腸鏡圖像以及專科醫生的肛門指檢判斷。尤其是對于直腸超低位癌及其更低部位的患者,專科醫生行肛門指檢判斷 T4b 期是最為準確的方式之一。
本研究對于術前綜合分期進行了真實世界數據報道,實際上代表在手術前,專科醫生綜合多項檢驗檢查結果以及查體后,給出的總術前分期。這一綜合術前分期的結果,Ⅰ~Ⅳ期都有超過 70% 的評估準確性,總體判斷準確性也有 77.1%。
但如前 3.1 所述,影像組學基礎與 DACCA 數據庫的鏈接目前尚未完成,腫瘤標志物和炎性因子盡管在數據庫中也有展示,但是還未作為綜合分期的鏈接數據加以應用。因此在這方面的工作,還有待下一步數據庫的建設者進一步去完善。
3.3 結直腸癌的術前腸鏡
全結直腸鏡是診斷結直腸癌的金標準。其關鍵在于,通過腸鏡下的病理活檢,可以對患者的腫瘤進行病理學診斷。從真實世界的數據可以看出,并非每一例最終行結直腸癌手術的患者,在初次腸鏡和病理活檢時,都能確診為腸癌。也有大量的患者的病理學結果報道為良性腫瘤,比如:輕~重度非典型增生(4.4%)、腺瘤(3.0%)、炎癥(1.8%)等。這與部分其他研究報道[30-31]有一定的相似性。從專科醫生的臨床經驗上看,也能理解,由于腸鏡時取材的部位、深度等因素,都可能導致病理學無法確診腺癌。這就要求,在術前評估過程中,還需要充分參考腸鏡下的大體類型、影像學評價以及專科醫生的肛門指檢,綜合作出判斷。術前專科檢查和評估的目的,不只是評價患者是否確診結直腸癌,還需要判定下一步的治療方向。因此,對于專科醫生的綜合決策能力有相當的要求。DACCA 數據庫在設置這些數據項目時,正是基于醫生的行為模式進行的設計,以便于未來進行結直腸癌的數據模型決策時,有更為準確的源數據和模型基礎。
此外,術前腸鏡的診斷誤差,在本次研究中也進行了展示。可以發現,腸鏡檢查也并非完全準確,甚至會有“誤診”的情況。在 DACCA 數據庫中,就有 3 條腸鏡下漏診腫瘤的數據(0.7%),以及多原發癌漏診的數據 5 條(1.1%)。“漏診”腸鏡的報道,是對專科醫療的重要質量控制,數據庫采納了這些數據指標,是對專科疾病治療的綜合管理。
3.4 結直腸癌的初診與誤診誤治
結直腸癌的及時診治是整個醫療流程中的第1 環。癌癥的三級預防強調了針對病因(一級預防)和“三早”(早期發現、早期診斷和早期治療,為二級預防)[32]。從 DACCA 數據庫反映的真實世界數據,就能更好地理解結直腸癌的三級預防是否真的得到了應用。從數據上看,以篩查為目的的初診,包括:家族史(<0.1%)和體檢(1.1%),都處于一個極低的水平。這真實地反映了目前結直腸癌篩查的不足。作為我國重要的癌癥疾病負擔之一[33],國家正在積極推進篩查工作[34],就是旨在扭轉目前篩查率低下的現狀,為患者盡早發現結直腸癌提供幫助,并可以減少病情延遲到中晚期甚至晚期才進行治療的現狀。
除此以外,通過對于 DACCA 數據庫中的誤診和誤治信息分析,可以提示我們,提高及時診斷和診斷的準確性也尤為重要。多數結直腸癌患者先期表現的不典型的臨床癥狀,可能會由于考慮為腸道良性疾病而進行了治療,從本次數據顯示看,有 18.5% 的結直腸癌患者早期都按照胃腸炎進行處理,而一旦可能的炎癥得到緩解后,又進一步延遲了診斷的時間。
DACCA 數據庫展示真實世界的重要目的之一,就是通過對于診治過程中存在的問題,提供準確的臨床真實依據,并為下一步臨床工作的改進提供參考。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:汪曉東主要負責 DACCA 數據庫構建、系列文章分段設計、數據解讀和文章撰寫;劉健博主要負責數據整理、統計描述及分析、制圖和參考文獻整理;安麗珉主要負責數據整理、統計描述及分析;李立主要負責理論建立、DACCA 數據庫構建、系列文章分段設計以及數據解讀。
倫理聲明:本研究已通過四川大學華西醫院倫理學委員會審核并同意(批準文號:2019-140 號)。
華西腸癌數據庫(Database from Colorectal Cancer,DACCA)是華西醫院結直腸外科以真實世界研究(RWS)為思路和理念而建設的數據庫。如前述,筆者團隊將推出系列數據庫報道,包括:數據庫研究、數據庫建設、數據庫解讀、數據庫決策等[1-6]。本文為數據庫研究第 1 章的第 4 部分。
對結直腸癌患者治療方案的確定,不僅需要作為金標準的全結直腸鏡檢查[7],還需要通過一系列影像學檢查,如 CT、MRI、腔內超聲等,以對手術前患者的腫瘤狀態進行初步的評估,也稱為術前分期[8]。術前分期的結果,可指導對患者的治療決策導向,如是優先考慮手術還是考慮新輔助化療[9]。因此,無論是我國的結直腸癌診療指南,還是國際上通用的美國國立綜合癌癥網絡(National Comprehensive Cancer Network,NCCN)結直腸癌指南,都對結直腸癌患者完成術前分期后,作出相應的推薦治療意見[10-12]。故結直腸癌的術前專科檢查,是尤為重要的術前決策內容。
然而,我們對具體的術前專科檢查方式進行詳細解讀后,可以發現,無論是全結直腸鏡還是影像學檢查,由于受到檢查人員、設備、醫院等多方面的影響,導致最終用于術前決策的這些專科檢查,可能呈現出不同的報告質量。然而,我們容易忽略對于這些專科檢查準確性的預先判斷,從而導致我們在開始術前決策時就存在偏差,甚至嚴重地影響治療方向。
因此,對于結直腸癌患者術前專科檢查的質量評價,是我們為后續治療決策做的重要準備工作。我們不僅要記錄這些患者在初次就診并納入數據庫時已經有的專科檢查,進行詳細的登記和結構化調整;還特別需要在數據庫中,比對這些專科檢查的結果,到底存在多少的誤差。本研究針對這一問題,結合 DACCA 數據庫的術前專科檢查的數據框架設計,對此進行一概要的展示。
1 資料和方法
1.1 數據庫版本
本次數據分析選取的 DACCA 版本為 2019 年7 月 25 日更新版。
1.2 收集的 DACCA 數據庫應用參數
本次研究選取的數據項目的基礎定義,將在“數據庫建設”系列報道四中詳細說明。本次選擇的部分數據項目包括:術前分期(combined preoperative stage)、術前分期契合度(integrating degree of combined preoperative stage)、術前診斷強度(preoperative diagnostic intensity)、腸鏡準確性(accuracy of colonoscopy)、活檢腫瘤性質結果(tumorous type by biopsy)、活檢腫瘤分化程度(tumor differentiation by biopsy)、胸部 CT 完成情況(completion of chest CT)、CT 總分期(CT stage)、CT 總分期評估準確性(accuracy of CT stage)、腔內超聲結果(outcome of transrectal ultrasound)、肝臟超聲結果(outcome of liver ultrasound)、MRI 總分期(MRI stage)、MRI 總分期評估準確性(accuracy of MRI stage)、PET-CT 結果(outcome of PET-CT)、骨掃描結果(outcome of bone scanning)、臨床初診診斷方式(diagnostic way at first visit)和誤診誤治(misdiagnosis and mistreatment)。
1.3 DACCA 數據庫的篩選方案
根據本研究的需要,筆者團隊以手術日期作為排序條件,并依次進行篩選:① 總數據庫的信息篩選(22 824 條);② 以“手術日期”為條件,篩除沒有該項信息的數據行(余 14 631 條);③ 剔除以上應用參數完全為空的數據行(余 4 956 條);④ 剔除數據條目可疑或查實重復的數據(余 4 484 條)。具體篩選過程見圖 1。本次數據庫篩選完成時間為 2019 年 7 月 28 日。

1.4 統計學方法
本次 DACCA 數據庫分析的工具為 Excel(Office 365,Microsoft,Redmond,WA,USA)。經典統計學描述由 Excel 統計圖表工具完成。
2 結果
截至 2019 年 7 月 25 日,數據庫疊加后,符合篩選條件的數據病案(數據行,lines)總量為 4 484 條。
2.1 DACCA 數據庫中的術前 CT 分期與評估準確度
DACCA 數據庫中,對術前 CT 檢查作出了準確度標記的數據行共計 3 877 條,占本次分析數據的 86.5%。其中,833 條顯示為“未做”(數據庫標簽“x”),占有準確度標記項目的 21.5%;有判斷準確性的數據行 3 044 條,占有準確度標記項目的 78.5%。
DACCA 數據庫中,術前 CT 有分期結果的數據行共計 3 166 條,占本次分析數據的 70.6%。按照 TNM 分期的原則,Ⅰ~Ⅳ期占比見圖 2a,可見Ⅲ期占比最高(32.7%),Ⅰ期最低(17.5%)。

a:術前 CT 評價分期的總體分布;b:術前 CT 評價準確度的變化趨勢;c:術前 MRI 評價分期的總體分布;d:術前 MRI 評價準確度的變化趨勢;e:術前綜合分期契合度的變化趨勢
在 DACCA 數據庫中,不僅有術前 CT 分期的結果,還有對分期進行準確度判斷的數據行共計2 615 條,占有術前 CT 分期數據行的 82.6%,占有準確度判斷數據行的 67.4%。根據術前 CT 分期和準確度的關系,出現準確、低估和高估的分布情況詳見表 1。由表 1 可見,在對術前 CT 分期的判斷中,Ⅳ期的判斷準確度最高(86.6%),Ⅰ期判斷結果低估了分期的最多(30.4%),Ⅲ期判斷結果高估了分期的最多(21.8%)。隨時間變化,在有效數據覆蓋的 2007–2019 年期間,不同準確度判斷的年度構成變化見圖 2b,可見總體的術前 CT 判斷準確度,除去數據行過少帶來的誤差,其他年份的準確率浮動在 70% 上下(66.8%~83.7%)。

2.2 DACCA 數據庫中的術前 MRI 分期與評估準確度
DACCA 數據庫中,對術前 MRI 檢查作出了準確度標記的數據行共計 3 480 條,占本次分析數據的 77.6%。其中,3 219 條顯示為“未做”,占有準確度標記項目的 92.5%;在顯示為“未做”者中,標記為“未做但應該做”的(數據庫標簽“xg”)有 2 123 條,占未做術前 MRI 數據行的 66.0%。可見未做術前 MRI 和其中應該做的比例都很高。
DACCA 數據庫中,對術前 MRI 評價有分期結果的數據行共計 286 條,占本次分析數據的 6.4%,這一比例遠遠低于術前 CT 評價分期。按照 TNM 的分期原則,劃分Ⅰ~Ⅳ期的構成比見圖 2c,可見 MRI 判斷術前分期中Ⅲ期占絕大多數(53.5%),而Ⅰ期最少(5.2%)。
在數據庫中,不僅有術前 MRI 分期的結果,還有對分期進行準確度判斷的數據行共計 257 條,占有術前 MRI 分期數據行的 89.9%,占有準確度判斷數據行(3 480 條有準確度記錄,3 219 條標記為未做,實際準確度有結果的 261 條)的 98.5%。根據術前 MRI 分期和準確度的關系,出現準確、低估和高估的分布情況詳見表 2。由表 2 可見,在對術前 MRI 分期的判斷中,Ⅳ期的判斷準確度最高(89.1%),Ⅰ期判斷結果低估了分期的最多(33.3%),Ⅲ期判斷結果高估了分期的最多(13.3%)。隨時間變化,在有效數據覆蓋的 2011–2019 年期間,不同準確度判斷的年度構成變化見圖 2d,可見由于每一年的數據量都太少,總體的術前 MRI 判斷準確度浮動較大,在 2016–2019 年期間逐漸出現升高的趨勢。

2.3 DACCA 數據庫中的術前直腸超聲、肝臟超聲、骨掃描及 PET-CT 檢查的評估準確度
DACCA 數據庫中,對術前直腸超聲的檢查,主要用于評估直腸癌局部 T(浸潤深度)分期和 N(區域淋巴結)分期,對該檢查作出了準確度標記的數據行共計 3 607 條,占本次分析數據的 80.4%。其中,3 233 條顯示為“未做”,占有準確度標記項目的 89.6%;在顯示為“未做”的條目中,標記為“未做但應該做”的有 825 條,占未做術前直腸超聲數據行的 25.5%。
DACCA 數據庫中,對術前肝臟超聲的檢查,主要用于評估結直腸癌可疑肝轉移者的 M 分期,對該檢查作出了準確度標記的數據行共計 2 736 條,占本次分析數據的 61.0%。其中,2 590 條顯示為“未做”,占有準確度標記項目的 94.7%;在顯示為“未做”的條目中,標記為“未做但應該做”的有 972 條,占未做術前肝臟超聲數據行的 37.5%。
DACCA 數據庫中,對術前骨掃描的檢查,主要用于評估結直腸癌可疑骨轉移的 M 分期,對該檢查作出了準確度標記的數據行共計 3 570 條,占本次分析數據的 79.6%。其中,3 265 條顯示為“未做”,占有準確度標記項目的 91.5%;在顯示為“未做”的條目中,標記為“未做但應該做”的有 1 221 條,占未做術前骨掃描數據行的 37.4%。
DACCA 數據庫中,對術前 PET-CT 的檢查,主要用于評估結直腸癌全身可疑多發轉移的 M 分期,對該檢查作出了準確度標記的數據行共計 3 490 條,占本次分析數據的 77.8%。其中,3 474 條顯示為“未做”,占有準確度標記項目的 99.5%;在顯示為“未做”的條目中,標記為“未做但應該做”的有 356 條,占未做術前 PET-CT 數據行的 10.2%。
從這幾項術前評估檢查來看,術前未做的構成比都較高。在 DACCA 數據庫中可以查閱,一旦有準確度判斷的數據條,都有對應的術前評估分期。其中,術前直腸超聲 374 條,肝臟超聲 146 條,骨掃描 305 條,PET-CT 檢查 16 條。這些有術前評估分期的結直腸癌患者的具體分期評估準確度的分布見下表 3。由表 3 可見,無論是直腸超聲、肝臟超聲,還是骨掃描和 PET-CT,術前分期的準確度都較高。

2.4 DACCA 數據庫中術前腸鏡檢查評估
DACCA 數據庫中,對術前腸鏡檢查,共有 3 847 條有效的分析數據,占總分析數據條的 85.8%。其中,標記為術前完成了腸鏡的數據條目為 3 688 條(占 95.9%),未完成腸鏡的數據條目為 159 條(占 4.1%)。在已經完成腸鏡的數據條目中,由四川大學華西醫院完成腸鏡的數據 1 291 條(占 35.0%),由非四川大學華西醫院完成腸鏡的數據 2 397 條(占 65.0%)。
DACCA 數據庫中,由腸鏡下取腫瘤組織,進行病理學檢測后獲得病理類型,有記錄結果的數據共計 3 636 條,占分析用數據的 81.1%。根據腸鏡下活檢的結果進行類型劃分,其數據量和占比見表 4,可見最多的腸鏡下病理類型為腺癌,占 82.2%;同時也有腸鏡下初步診斷為良性疾病的病理類型,如輕~重度非典型增生(占 4.4%)、腺瘤(3.0%)、炎癥(1.8%)、息肉(0.2%)等。腸鏡下報告了病理學類型的同時,部分活檢結果還報告了分化程度,共計 46 條數據,占總體腸鏡有活檢病理結果的 1.3%。其中,數據顯示高分化癌者 8 條,占有分化程度報告的 17.4%;顯示中分化癌者 17 條,占 37.0%;顯示為低分化癌者 21 條,占 45.6%。

2.5 DACCA 數據庫中術前綜合診斷的依據強度
DACCA 數據庫中,能夠綜合患者多種術前評估手段,對診斷的依據強度進行劃分的數據為 3 981 條(88.8%)。其中,診斷依據強度 A 級(高診斷效能)的數據為 3 445 條,占對診斷依據有評價的總數據 86.5%;診斷依據強度 B 級(基本診斷效能)的數據為 316 條,占 7.9%;診斷依據強度 C 級(低診斷效能)為 220 條,占 5.5%。診斷依據強度反映了在手術前,多種檢查結果綜合判斷后對于結直腸癌診斷的準確度的支撐依據,該數據的定義將在數據庫建設的第四部分詳述。
2.6 DACCA 數據庫中術前綜合分期與最終病理分期契合度的關系
DACCA 數據庫中,針對術前的綜合分期(結合所有術前檢查評估、腸鏡和臨床表現的分期)有效數據共計 2 346 條,占分析總數據的 52.3%;其中,經數據審核后有明確分期結果者 2 232 條,占有效數據的 95.1%,還不能明確分期結果者 114 條,占 4.9%。明確術前綜合分期中,按照 TNM 分期原則,Ⅰ期 109 條(占 4.9%),Ⅱ期 615 條(占 27.5%),Ⅲ期 1 263 條(占 56.6%),Ⅳ期 245 條(占 11.0%)。
經數據庫前后信息比對后,完成了與最終病理分期契合度關系分析的有效數據 2 209 條,占總分析數據的 49.3%。將術前綜合分期與最終病理分期進行契合度分析,具體結果如表 5,可見:針對Ⅳ期的術前綜合分期契合度最高,為 98.7%;Ⅱ期的術前綜合分期低估率最高,為 28.3%;Ⅲ期的術前綜合分期高估率最高,為 20.6%。隨時間變化,在有效數據覆蓋的 2008–2019 年期間,不同準確度判斷的年度構成變化見圖 2e,可見術前綜合分期與最終病理分期契合度的準確性較單純的術前 CT 分期更高,浮動在 80% 上下(70.8%~87.7%)。

2.7 DACCA 數據庫中首診臨床因素的特點
DACCA 數據庫中,在結直腸癌患者對病史反饋的過程中,闡述了其因何種臨床原因開始進行疾病的診斷治療,此為定義的首診臨床因素。在數據庫中可以進行分析的有效數據為 3 466 條,占總分析數據的 77.3%。根據其類型劃分結果詳見表 6,可見因指檢后發現腸癌的患者最多,占 64.0%;而由于出血、梗阻等癥狀發現者其次,為 28.2%;因考慮有家族史,就診發現結直腸癌的最少,有 1 條,占比小于 0.1%。

2.8 DACCA 數據庫中確診結直腸癌前出現誤診誤治的情況
DACCA 數據庫中,在確診前由于誤診和誤治的發生,導致最終開始治療結直腸癌的時間有所延遲。在數據庫中對此有明確標記的共計 3 411 條,占總分析數據的 76.1%。其中,標記患者在診斷結直腸癌過程中,沒有誤診和誤治行為的數據 2 969 條,占有明確標記數據的 87.0%;有誤診和誤治行為的數據 442 條,占 13.0%。其具體的分類詳見表 7,可見先期誤診為痔瘡的數據最多,為 207 條,占 46.8%。

3 討論
3.1 結直腸癌術前影像學檢查評估的效能
DACCA 數據庫對于結直腸癌術前檢查與評估,進行了新的數據采集方式調整。不僅對結直腸癌術前常用的影像學檢查,如:CT、MRI、骨掃描、PET-CT 等的診斷結果進行采集和整理,更重要的是對診斷的結果進行效果判定,用準確、低估和高估的劃分方式,建立對于術前影像報告的評價。這是 DACCA 數據庫具有“數據+判斷”功能的重要展示。
由于結直腸癌的術前治療方向決策中,根據影像學進行的分期是最重要的依據之一。因此,CT 和 MRI 檢查對于患者的術前影像分期的準確性尤為重要。這需要通過后期病理學結果和手術發現進行對比后才能得知。早期的研究,已經對于 CT 和 MRI 與病理學結果之間的符合程度進行過多種研究,并有一定的結果報道,總體來說,CT 檢查對于結直腸癌的分期診斷準確性可以達到 75.5%~82.1%;MRI 檢查的術前分期診斷準確性可以達到 72.0%~92.5%[13-16]。從 DACCA 數據庫的真實世界數據報道中,我們也可以發現,術前 CT 評估的準確度可以達到 73.5%,基本和國內外的報道一致。術前 MRI 評估的準確度受到數據量有限的影響,但是也可以達到 80.5%,略高于術前 CT 評估的準確度,特別是針對Ⅳ期結直腸癌患者的診斷準確度更高。
而影像學評價分期中最容易出現分期高估的情況,從本次數據分析上看,主要發生在Ⅲ期的影像學診斷上:術前 CT 評估Ⅲ期的高估率為 21.8%,術前 MRI 評估Ⅲ期的高估率為 13.3%。從影像學上看,評估為Ⅲ期的最主要原因,可能是對于淋巴結轉移為陽性的高估為主。對于Ⅲ期的影像學高估,則可能導致患者本應該直接選擇手術切除的時候,而優先推薦了新輔助治療,這可能導致患者在綜合治療中,出現過度醫療的情況。
然而,無論是術前 CT 評估還是 MRI 評估,從近 10 年的數據來看,診斷的效能變化并不大。這可能是現有影像學診斷技術達到某一個瓶頸后的表現,如何突破最后的 20% 才是重點所在。由于近年來人工智能的算法突飛猛進[17-18],影像組學技術的出現和發展[19-20],為進一步提高影像學診斷的效能提供了助力。目前確切有一部分報道,提示采用影像組學技術進行的術前分期,可以有更高的術前分期診斷效能[21]。這還有賴于人工智能的算法的進一步提升。因此,從結直腸癌數據庫建設的角度上看,“影像組學+人工智能”將成為 DACCA 數據庫重要的延展數據庫之一。通過更為精確的算法,獲得影像學分期診斷后,再鏈接到 DACCA 數據庫中,是下一步需要完善的工作。
3.2 結直腸癌的術前綜合分期與價值探討
本研究團隊早在 10 年前就對“多模式的術前評估”進行了系列探討,部分研究成果也在國內外進行了報道[22-28]。從當時的觀點上來看,我們就已經認為,單純的 CT 或者 MRI 分期評估是不夠的,融合了直腸超聲、腫瘤標志物以及炎性因子后,可以增強單純選擇 CT 和(或)MRI 檢查進行評估的效果。后續又有其他的研究者[29]對于這些綜合評估的因素進行了更多的研究。這一理念在隨后的 10 年中,因臨床研究結果的轉化,切實在臨床上進行了長期的應用。所以,目前的結直腸癌術前評估,不會只評價 CT 和 MRI 檢查的結果,還會密切聯系超聲評估、腸鏡圖像以及專科醫生的肛門指檢判斷。尤其是對于直腸超低位癌及其更低部位的患者,專科醫生行肛門指檢判斷 T4b 期是最為準確的方式之一。
本研究對于術前綜合分期進行了真實世界數據報道,實際上代表在手術前,專科醫生綜合多項檢驗檢查結果以及查體后,給出的總術前分期。這一綜合術前分期的結果,Ⅰ~Ⅳ期都有超過 70% 的評估準確性,總體判斷準確性也有 77.1%。
但如前 3.1 所述,影像組學基礎與 DACCA 數據庫的鏈接目前尚未完成,腫瘤標志物和炎性因子盡管在數據庫中也有展示,但是還未作為綜合分期的鏈接數據加以應用。因此在這方面的工作,還有待下一步數據庫的建設者進一步去完善。
3.3 結直腸癌的術前腸鏡
全結直腸鏡是診斷結直腸癌的金標準。其關鍵在于,通過腸鏡下的病理活檢,可以對患者的腫瘤進行病理學診斷。從真實世界的數據可以看出,并非每一例最終行結直腸癌手術的患者,在初次腸鏡和病理活檢時,都能確診為腸癌。也有大量的患者的病理學結果報道為良性腫瘤,比如:輕~重度非典型增生(4.4%)、腺瘤(3.0%)、炎癥(1.8%)等。這與部分其他研究報道[30-31]有一定的相似性。從專科醫生的臨床經驗上看,也能理解,由于腸鏡時取材的部位、深度等因素,都可能導致病理學無法確診腺癌。這就要求,在術前評估過程中,還需要充分參考腸鏡下的大體類型、影像學評價以及專科醫生的肛門指檢,綜合作出判斷。術前專科檢查和評估的目的,不只是評價患者是否確診結直腸癌,還需要判定下一步的治療方向。因此,對于專科醫生的綜合決策能力有相當的要求。DACCA 數據庫在設置這些數據項目時,正是基于醫生的行為模式進行的設計,以便于未來進行結直腸癌的數據模型決策時,有更為準確的源數據和模型基礎。
此外,術前腸鏡的診斷誤差,在本次研究中也進行了展示。可以發現,腸鏡檢查也并非完全準確,甚至會有“誤診”的情況。在 DACCA 數據庫中,就有 3 條腸鏡下漏診腫瘤的數據(0.7%),以及多原發癌漏診的數據 5 條(1.1%)。“漏診”腸鏡的報道,是對專科醫療的重要質量控制,數據庫采納了這些數據指標,是對專科疾病治療的綜合管理。
3.4 結直腸癌的初診與誤診誤治
結直腸癌的及時診治是整個醫療流程中的第1 環。癌癥的三級預防強調了針對病因(一級預防)和“三早”(早期發現、早期診斷和早期治療,為二級預防)[32]。從 DACCA 數據庫反映的真實世界數據,就能更好地理解結直腸癌的三級預防是否真的得到了應用。從數據上看,以篩查為目的的初診,包括:家族史(<0.1%)和體檢(1.1%),都處于一個極低的水平。這真實地反映了目前結直腸癌篩查的不足。作為我國重要的癌癥疾病負擔之一[33],國家正在積極推進篩查工作[34],就是旨在扭轉目前篩查率低下的現狀,為患者盡早發現結直腸癌提供幫助,并可以減少病情延遲到中晚期甚至晚期才進行治療的現狀。
除此以外,通過對于 DACCA 數據庫中的誤診和誤治信息分析,可以提示我們,提高及時診斷和診斷的準確性也尤為重要。多數結直腸癌患者先期表現的不典型的臨床癥狀,可能會由于考慮為腸道良性疾病而進行了治療,從本次數據顯示看,有 18.5% 的結直腸癌患者早期都按照胃腸炎進行處理,而一旦可能的炎癥得到緩解后,又進一步延遲了診斷的時間。
DACCA 數據庫展示真實世界的重要目的之一,就是通過對于診治過程中存在的問題,提供準確的臨床真實依據,并為下一步臨床工作的改進提供參考。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:汪曉東主要負責 DACCA 數據庫構建、系列文章分段設計、數據解讀和文章撰寫;劉健博主要負責數據整理、統計描述及分析、制圖和參考文獻整理;安麗珉主要負責數據整理、統計描述及分析;李立主要負責理論建立、DACCA 數據庫構建、系列文章分段設計以及數據解讀。
倫理聲明:本研究已通過四川大學華西醫院倫理學委員會審核并同意(批準文號:2019-140 號)。