源于真實世界場景的華西腸癌數據庫(database from colorectal cancer,DACCA),為結直腸癌數據的結構化應用提供了基礎[1-2]。如前系列報道,筆者團隊已經對于數據庫的構建方式和數據庫呈現的基本數據狀態完成了第 1 板塊(數據構建)和第 2 板塊(數據研究)的闡述。后續筆者團隊將在第 3 板塊(數據庫解讀)和第 4 板塊(數據庫決策)中展示利用 DACCA 數據如何回答在結直腸癌(colorectal cancer,CRC)全生命周期中的諸多臨床問題。
本研究團隊將對數據庫解讀第 1 章(人群特征)的居住地址部分進行解讀。近年來,中國居民CRC的發病率逐年增高[3]。據研究[4]報道,以四川大學華西醫院作為區域性醫療中心,就診的CRC患者的各省級分布主要是以四川省的中東部為中心的西南地區,主要包括重慶市、云南省及貴州省的部分區域;四川省內市級分布區域主要是以“綿陽市—成都市—雅安市”為軸線的東部區域,成都市為核心;成都市內區(縣)級分布區域主要以武侯區、金牛區、青羊區等為核心的三環路以內。此前少有研究CRC患者居住地與腫瘤學特征的關系,但由于各地居民生活方式與飲食模式的不同,CRC的發病率與腫瘤學特征不盡相同。故本研究借助 DACCA 數據庫提供的數據,討論居住地與CRC患者腫瘤學特征的關系。
1 資料與方法
1.1 數據庫版本
本次數據分析選取的 DACCA 數據庫版本為2022 年 1 月 5 日更新版。
1.2 收集DACCA 數據庫應用參數
1.2.1 參數的選擇
本研究選用的分組指標為居住地,選擇分析的數據項目為癌前病變、癌家族史、腫瘤部位、腫瘤形態、腫瘤方位、腫瘤病理學性質、腫瘤分化程度和術前腫瘤 TNM 分期。且本次研究僅針對數據庫中單原發CRC患者的數據進行分析,而對多原發腫瘤患者的數據不做分析。
1.2.2 研究相關參數的定義
根據數據庫中CRC患者居住地的區域分布進行分組[4],分為四川組和非四川組,四川組再分為四川成都組和四川非成都組。本研究選取的其他數據項目的基礎定義詳見《數據庫建設第五部分:結直腸癌的腫瘤特征—模塊的設計(一)》[1]和《數據庫建設第五部分:結直腸癌的腫瘤特征—模塊的設計(二)》[2]。
1.3 DACCA 數據庫的篩選方案
根據研究需要,筆者團隊以“手術日期”和“居住地”作為排序條件,并按下述條件依次進行篩選:① 以“首次住院號”列為條件,剔除重復數據;② 以“居住地”列為條件,剔除無效數據;③ 剔除研究參數所在行全部為空值數據。
1.4 統計學方法
本次 DACCA 數據庫分析的統計描述工具為Excel(Office 365,Microsoft,Redmond,WA,USA),數據分析工具為 SPSS 27.0 軟件。計數資料以條(%)進行描述;計量資料經 Kolmogorov Smirnov 檢驗,符合正態分布時以均數±標準差(±s) 表示,不服從正態分布者以中位數和四分位間距表示。本研究中分化程度和術前 TNM 分期為等級數據;癌前病變、癌家族史、腫瘤部位、腫瘤形態、腫瘤方位和腫瘤病理學性質為分類數據。針對不同的數據類型統計學方法分別采用秩和檢驗和卡方檢驗,對于卡方檢驗受限數據采用 Fisher 精確檢驗和蒙特卡洛精確檢驗。檢驗水準 α=0.05。
2 結果
對 2022 年 1 月 5 日更新的數據庫,按照篩選條件得到7 232條患者數據,具體流程詳見圖1。

2.1 居住地的分布
本研究中,CRC患者居住地分布廣泛,幾乎中國各個省市都有,其中四川省最多。按照上述居住地分組原則,四川組數據量6 635條(占所有研究數據的91.7%),非四川組數據量597條(占所有研究數據的 8.3%);在四川組數據中,四川成都組數據量2 867條(占所有研究數據的 39.6%),四川非成都組數據量3 768條(占所有研究數據的 52.1%)。
2.2 CRC患者的癌前病變與居住地的關系
本次研究中,CRC患者無癌前病變的數據6 918條(占所有研究數據的95.7%),有癌前病變的數據 314條(占所有研究數據的4.3%)。 癌前病變包括家族性腺瘤性息肉病7 條(2.2%,7/314),結腸息肉病75條(23.9%,75/314),腺瘤 72條(22.9%,72/314),血吸蟲病107條(34.1%,107/314),炎性腸病 53條(16.9%,53/314)。不同居住地CRC患者的癌前病變結果見表1。由表1可見,四川組與非四川組CRC患者的癌前病變種類構成比情況比較差異有統計學意義(χ2=14.462,P=0.003);四川成都組與四川非成都組CRC患者的癌前病變種類構成比情況比較差異無統計學意義(χ2=7.591,P=0.101)。在不同居住地CRC患者是否伴有癌前病變中,四川組(292/6 635)與非四川組(22/597)比較差異無統計學意義(χ2=0.676,P=0.411),四川成都組(145/2 867) 與四川非成都組(147/3 768)比較差異有統計學意義(χ2=5.174,P=0.023)。

2.3 CRC患者的癌家族史與居住地的關系
本次研究中,CRC患者中有癌家族史的數據1 255條(占所有研究數據的17.4%),無癌家族史數據 5 977條(占所有研究數據的82.6%)。在有癌家族史的患者中,患者本人有癌癥病史者313條(占有癌家族史者的 24.9%),其中CRC病史者 151條(占本人有癌癥病史者的 48.2%),其他消化系統癌病史者 43 條(占本人有癌癥病史者的 13.7%),其他系統癌病史者 119 條(占本人有癌癥病史者的 38.0%)。 在各居住地中,四川組有癌家族史者1 174條(占有癌家族史者的 93.5%),非四川組有癌家族史者81條(占有癌家族史者的6.5%);四川成都組有癌家族史者586條(占四川組有癌家族史者的49.9%),四川非成都組有癌家族史者588條(占四川組有癌家族史者的50.1%)。 不同居住地分組之間,四川組與非四川組以及四川成都組與四川非成都組的患者本人癌家族史中不同腫瘤病史的構成比差異均無統計學意義(χ2=1.121,P=0.606;χ2=1.047,P=0.621),具體見表2。在有癌家族史的患者中,患者親屬有癌癥病史者942條,其中患者親屬有結直腸癌病史者 392 條(占親屬有癌癥病史者的41.6%),其他消化系統癌病史者339條(占親屬有癌癥病史者的36.0%),其他系統癌病史者211條(占親屬有癌癥病史者的22.4%)。不同居住地分組之間,四川組與非四川組以及四川成都組與四川非成都組的親屬癌家族史中不同腫瘤病史構成比的差異均無統計學意義(χ2=0.813,P=0.692;χ2=2.696,P=0.262),具體見表3。本研究也探究了是否有癌家族史在四川成都組、四川非成都組和非四川組3組之間的關系,結果顯示差異具有統計學意義(χ2=32.673,P<0.001),其中四川組與非四川組比較差異有統計學意義(χ2=6.502,P=0.011),四川成都組與四川非成都組比較差異也有統計學意義(χ2=26.129,P<0.001)。


2.4 CRC患者的腫瘤部位與居住地的關系
本次研究中,只分析了CRC單原發癌數量的分布情況,有具體腫瘤部位的數據且為單原發癌6 686條(占所有研究數據的92.5%),缺失546條(占所有研究數據的7.5%)。不同居住地CRC患者的腫瘤部位情況詳見表4。不同居住地分組之間,四川組與非四川組患者的腫瘤部位比較差異無統計學意義(χ2=0.476,P=0.490),四川成都組與四川非成都組患者的腫瘤部位比較差異有統計學意義(χ2=36.216,P<0.001)。

2.5 CRC患者的腫瘤形態與居住地的關系
本次研究中,有具體腫瘤形態的數據5 667條(占所有研究數據的78.4%),缺失1 565條(占所有研究數據的21.6%)。 不同居住地CRC的腫瘤形態見表5。由表5可見,四川組與非四川組CRC患者的腫瘤形態比較差異有統計學意義(χ2=19.560,P<0.001);四川成都組與四川非成都組CRC患者的腫瘤形態比較差異無統計學意義(χ2=5.377,P=0.247)。

2.6 CRC患者腫瘤方位與居住地的關系
本研究中,有腫瘤方位的數據 6 272條(占所有研究數據的 86.7%),缺失960條(占所有研究數據的13.3%)。不同居住地CRC患者的腫瘤方位情況詳見表6。由表6可見,四川組與非四川組以及四川成都組與四川非成都組之間腫瘤方位的構成比差異均有統計學意義(χ2=17.484,P=0.005;χ2=26.820,P<0.001),其中腫瘤方位為累及腸壁1圈者最多(47.1%,2 954/6 272)。

2.7 CRC患者腫瘤病理學性質與居住地的關系
本次研究中,腫瘤病理學性質有效數據5 479 條(占所有研究數據的75.8%),缺失 1 753條(占所有研究數據的24.2%)。不同居住地CRC患者的腫瘤病理學性質詳見表7。由表7可見,四川組與非四川組以及四川成都組和四川非成都組CRC患者的病理學性質比較差異均無統計學意義(χ2=8.136,P=0.408;χ2=7.278,P=0.506),其中腺癌最多(78.4%, 4 295/5 479)。

2.8 CRC患者腫瘤分化程度與居住地的關系
本研究中,CRC分化程度有數據者5 764條(占所有研究數據的79.7%),缺失1 468條(占所有研究數據的20.3%)。不同居住地CRC患者的腫瘤分化程度見表8。 由表8可見,四川組與非四川組以及四川成都組和四川非成都組之間,腫瘤不同分化程度的構成比差異均無統計學意義(H=0.289,P=0.591;H=0.156,P=0.693);其中,中分化者最多,有 3 677 條(占分化程度有數據者的63.8%),高分化者最少,有226條(占分化程度有數據者的3.9%)。

2.9 CRC患者術前腫瘤 TNM 分期與居住地的關系
本研究中,CRC患者術前腫瘤TNM 分期有數據者4 325條(占所有研究數據的59.8%),缺失2 907條(占所有研究數據的40.2%)。不同居住地CRC患者的術前腫瘤TNM分期見表9。由表9可見,四川組與非四川組之間,CRC患者術前 腫瘤TNM 分期的構成比差異有統計學意義(H=8.023,P=0.005);四川成都組與四川非成都組之間,CRC患者術前腫瘤 TNM 分期的構成比差異無統計學意義(H=0.218,P=0.640)。

3 討論
3.1 居住地與CRC的發生
CRC是當今世界最常見的惡性腫瘤之一[5]。位居惡性腫瘤發病譜的第3位,是癌癥死亡的第2大原因[6]。近年的一些研究[7-9]表明,CRC發病率和死亡率與地理差異相關聯,且不同居住地的人在患病后的生存率存在差異。最近,一些歐洲和北美國家的CRC發病率和死亡率有所下降,但中國結直腸癌發病率和死亡率卻繼續上升,且中國癌癥譜系正向著發達國家轉變,這可能與經濟、飲食等因素有關[10-12]。不斷增高的發病率會導致我國CRC的疾病負擔進一步加重,并威脅人們壽命狀態。因此,關注CRC與居住地的關系具有一定的現實意義。然而,由于醫院所處地理位置的原因,筆者在利用 DACCA 進行數據挖掘時發現這部分患者大多來自四川省(6 635條),其中將近一半來自成都市(2 867條),這可能會導致結論具有一定局限性。本次研究重點關注了居住地與多種CRC腫瘤相關特征的關系,嘗試探索居住地是否帶來了腫瘤學特征的差異,期待發現一定規律,進而促進特定區域癌癥管理計劃的規劃與實施。
從病史來看,DACCA 由于需要獲取部分既往信息,因此筆者嘗試分析居住地與CRC發生的部分風險關系。從本研究結果中可以看出,四川省患者與非四川省患者在就診時是否伴有癌前病變與居住地之間不存在相關性(χ2=0.676,P=0.411)。但四川省患者與非四川省患者癌前病變種類構成比與居住地之間存在相關性(χ2=14.462,P=0.003),而四川成都患者與四川省非成都患者癌前病變種類構成比與居住地之間不存在相關性(χ2=7.591,P=0.101)。這可能是由于四川省與其他省份之間存在更大的差異,如地理位置、生活習慣、飲食習慣等。在這些癌前病變中,四川省內占比最大是血吸蟲病(35.6%),非四川省為炎性腸病(36.4%)占比最大。其中血吸蟲病曾在我國重度流行,包括四川省在內的長江流域及其以南的12個省(直轄市、自治區),部分重度流行區人群血吸蟲感染率超過90%[13-14],但其是否會導致CRC的發生還有待探索[15]。有研究表明,早期檢測并切除癌前病變(如腺瘤、息肉等)對降低CRC的發病率和死亡率有重大意義[16-17]。
本研究進一步分析了居住地與癌家族史的關系。 之前已有文章表明癌家族史是發生CRC的危險因素,且CRC患者的親屬患病風險比沒有CRC家族史的人高近3倍,但在不同區域存在差異[18-21]。本研究結果顯示,是否有癌家族史在不同居住地之間的差異具有統計學意義(χ2=32.673,P<0.001)。其中在四川成都組(49.9%)和四川非成都組(50.1%)存在有癌家族史的CRC患者比例相對更高,當然這有可能是樣本量大多來自四川省的緣故,也與就醫的距離遠近、經濟發展等因素有關。同時,本研究對癌家族史的種類構成比進行了分析,但幾個地區中癌家族史種類構成比與居住地之間差異均沒有統計學意義。在本人癌家族史中,存在有本人CRC史的CRC患者比例相對更高(48.2%),在親屬癌家族史中,也是存在有親屬CRC史的CRC患者比例相對更高(41.6%)。
3.2 居住地與CRC的腫瘤學特征
本次研究也重點關注了居住地與CRC的腫瘤學特征之間的關系,嘗試探索居住地是否帶來了腫瘤學特征的差異,以為臨床診療提供輔助建議。
本研究結果顯示,腫瘤分化程度構成比和腫瘤病理學性質構成比在不同居住地之間的差異均無統計學意義。在腫瘤病理學性質構成比中,腺癌所占比例最大(78.4%),在四川成都組(78.5%)、四川非成都組(78.3%)和非四川組(78.3%)均如此。在腫瘤分化程度方面,最常見的為中分化(63.8%,3 677/5 764),四川成都組(63.7%),四川非成都組(63.6%)和非四川組(65.9%)均如此。一項中國廣東的研究[22]也表明,腺癌在腫瘤病理學性質構成中占比最大(75.6%),在腫瘤分化程度中高分化與中分化占比最大(74.7%),且廣東4個不同地區的CRC患者在腫瘤病理學性質和分化程度上的差異具有統計學意義。而在本研究中沒有發現這種差異,可能是由于我們的地理分區范圍較大、不夠細致導致的。
本研究重點分析了這些患者腫瘤部位種類構成比情況。 結果表明,CRC患者腫瘤位于直腸或結腸在四川成都組與四川非成都組之間的差異有統計學意義(χ2=36.216,P<0.001),其中直腸癌(75.6%)高于結腸癌(24.4%)。而在四川組與非四川組中,腫瘤部位存在于直腸或結腸之間的差異沒有統計學意義(χ2=0.476,P=0.490),直腸癌(75.4%)也高于結腸癌(24.6%)。從解剖角度來看,直腸癌的患病風險是結腸癌的4倍[23],這與本研究的結論相似。在過去幾十年中,CRC的發病率和死亡率有所下降,特別是位于左半結腸的腫瘤結局明顯改善,發病率和死亡率穩步下降,而位于右半結腸的腫瘤結局改善不明顯[24]。因此需要提高對右半結腸腫瘤的關注,探索更好的治療策略。
在不同居住地的CRC患者腫瘤形態構成比中, 四川組與非四川組存在差異(χ2=19.560,P<0.001),其中四川組(59.9%)與非四川組(55.3%)均為潰瘍型發生最多。這與2019年9月26日更新版DACCA數據庫統計結果相近,腫瘤形態中潰瘍型最常見(42.4%)[25]。除了潰瘍型這種常見的病理大體類型外,在 DACCA 數據庫中有著更為復雜的病理大體類型的分類方式,針對少見的CRC病理大體類型也應該提前了解以制定出合理的治療方案,這具有很大的挑戰。在不同居住地的CRC患者腫瘤方位構成比中,四川成都組與四川非成都組存在差異(χ2=26.820,P<0.001),四川組與非四川組也存在差異(χ2=17.484,P=0.005)。其中腫瘤累積腸壁1圈者居多(47.1%),在后壁的最少(4.7%,293/6 272)。
作為CRC嚴重程度的指標之一,術前腫瘤TNM分期非常重要。本研究發現,在不同居住地分組之間,四川組與非四川組的術前腫瘤TNM分期構成比存在差異(H=8.023,P=0.005);同時還發現,2組CRC患者術前腫瘤TNM 分期為Ⅲ期的患者構成比均超過了 40%,系Ⅲ~Ⅳ期者的比例高達 71.2%(3 080/4 325)),其中非四川組術前腫瘤TNM分期處于Ⅲ~Ⅳ期的所占比例更大(76.9%,256/333)。提示如今各地CRC發現時大多已經處于中晚期狀態,且在本研究中外省就醫患者相對更多處于中晚期狀態。 腫瘤的術前TNM分期是預測CRC患者預后的重要因素[26-27],不管是來自哪里的患者,都應做好CRC的篩查,讓腫瘤在早期就能被發現,從而改善治療結果和預后。
4 結論
通過DACCA中的數據分析發現,CRC患者的居住地與腫瘤學特征存在多種關聯。不同居住地的CRC患者與其癌前病變種類構成存在差異。在癌家族史中CRC的比例更高。從腫瘤發生部位來看,腫瘤位于直腸的占比高于結腸。在各地區腫瘤形態構成中,均為潰瘍型最多。CRC患者的腫瘤方位構成不同,累及腸壁1圈者最多。大多數CRC患者發現腫瘤時已是中晚期,非四川省的中晚期患者所占比例更高。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:唐盈主要負責數據統計和描述、結果制圖、文章撰寫;龔佳祺主要負責大綱梳理、文章修改;吳桂儀主要負責統計分析、數據描述;汪曉東主要負責文章數據源、文章修改;李立主要負責文章指導。
倫理聲明:本研究已通過了四川大學華西醫院生物醫學倫理審查委員會的審批[批文編號 2019 年審(140 號)]。
源于真實世界場景的華西腸癌數據庫(database from colorectal cancer,DACCA),為結直腸癌數據的結構化應用提供了基礎[1-2]。如前系列報道,筆者團隊已經對于數據庫的構建方式和數據庫呈現的基本數據狀態完成了第 1 板塊(數據構建)和第 2 板塊(數據研究)的闡述。后續筆者團隊將在第 3 板塊(數據庫解讀)和第 4 板塊(數據庫決策)中展示利用 DACCA 數據如何回答在結直腸癌(colorectal cancer,CRC)全生命周期中的諸多臨床問題。
本研究團隊將對數據庫解讀第 1 章(人群特征)的居住地址部分進行解讀。近年來,中國居民CRC的發病率逐年增高[3]。據研究[4]報道,以四川大學華西醫院作為區域性醫療中心,就診的CRC患者的各省級分布主要是以四川省的中東部為中心的西南地區,主要包括重慶市、云南省及貴州省的部分區域;四川省內市級分布區域主要是以“綿陽市—成都市—雅安市”為軸線的東部區域,成都市為核心;成都市內區(縣)級分布區域主要以武侯區、金牛區、青羊區等為核心的三環路以內。此前少有研究CRC患者居住地與腫瘤學特征的關系,但由于各地居民生活方式與飲食模式的不同,CRC的發病率與腫瘤學特征不盡相同。故本研究借助 DACCA 數據庫提供的數據,討論居住地與CRC患者腫瘤學特征的關系。
1 資料與方法
1.1 數據庫版本
本次數據分析選取的 DACCA 數據庫版本為2022 年 1 月 5 日更新版。
1.2 收集DACCA 數據庫應用參數
1.2.1 參數的選擇
本研究選用的分組指標為居住地,選擇分析的數據項目為癌前病變、癌家族史、腫瘤部位、腫瘤形態、腫瘤方位、腫瘤病理學性質、腫瘤分化程度和術前腫瘤 TNM 分期。且本次研究僅針對數據庫中單原發CRC患者的數據進行分析,而對多原發腫瘤患者的數據不做分析。
1.2.2 研究相關參數的定義
根據數據庫中CRC患者居住地的區域分布進行分組[4],分為四川組和非四川組,四川組再分為四川成都組和四川非成都組。本研究選取的其他數據項目的基礎定義詳見《數據庫建設第五部分:結直腸癌的腫瘤特征—模塊的設計(一)》[1]和《數據庫建設第五部分:結直腸癌的腫瘤特征—模塊的設計(二)》[2]。
1.3 DACCA 數據庫的篩選方案
根據研究需要,筆者團隊以“手術日期”和“居住地”作為排序條件,并按下述條件依次進行篩選:① 以“首次住院號”列為條件,剔除重復數據;② 以“居住地”列為條件,剔除無效數據;③ 剔除研究參數所在行全部為空值數據。
1.4 統計學方法
本次 DACCA 數據庫分析的統計描述工具為Excel(Office 365,Microsoft,Redmond,WA,USA),數據分析工具為 SPSS 27.0 軟件。計數資料以條(%)進行描述;計量資料經 Kolmogorov Smirnov 檢驗,符合正態分布時以均數±標準差(±s) 表示,不服從正態分布者以中位數和四分位間距表示。本研究中分化程度和術前 TNM 分期為等級數據;癌前病變、癌家族史、腫瘤部位、腫瘤形態、腫瘤方位和腫瘤病理學性質為分類數據。針對不同的數據類型統計學方法分別采用秩和檢驗和卡方檢驗,對于卡方檢驗受限數據采用 Fisher 精確檢驗和蒙特卡洛精確檢驗。檢驗水準 α=0.05。
2 結果
對 2022 年 1 月 5 日更新的數據庫,按照篩選條件得到7 232條患者數據,具體流程詳見圖1。

2.1 居住地的分布
本研究中,CRC患者居住地分布廣泛,幾乎中國各個省市都有,其中四川省最多。按照上述居住地分組原則,四川組數據量6 635條(占所有研究數據的91.7%),非四川組數據量597條(占所有研究數據的 8.3%);在四川組數據中,四川成都組數據量2 867條(占所有研究數據的 39.6%),四川非成都組數據量3 768條(占所有研究數據的 52.1%)。
2.2 CRC患者的癌前病變與居住地的關系
本次研究中,CRC患者無癌前病變的數據6 918條(占所有研究數據的95.7%),有癌前病變的數據 314條(占所有研究數據的4.3%)。 癌前病變包括家族性腺瘤性息肉病7 條(2.2%,7/314),結腸息肉病75條(23.9%,75/314),腺瘤 72條(22.9%,72/314),血吸蟲病107條(34.1%,107/314),炎性腸病 53條(16.9%,53/314)。不同居住地CRC患者的癌前病變結果見表1。由表1可見,四川組與非四川組CRC患者的癌前病變種類構成比情況比較差異有統計學意義(χ2=14.462,P=0.003);四川成都組與四川非成都組CRC患者的癌前病變種類構成比情況比較差異無統計學意義(χ2=7.591,P=0.101)。在不同居住地CRC患者是否伴有癌前病變中,四川組(292/6 635)與非四川組(22/597)比較差異無統計學意義(χ2=0.676,P=0.411),四川成都組(145/2 867) 與四川非成都組(147/3 768)比較差異有統計學意義(χ2=5.174,P=0.023)。

2.3 CRC患者的癌家族史與居住地的關系
本次研究中,CRC患者中有癌家族史的數據1 255條(占所有研究數據的17.4%),無癌家族史數據 5 977條(占所有研究數據的82.6%)。在有癌家族史的患者中,患者本人有癌癥病史者313條(占有癌家族史者的 24.9%),其中CRC病史者 151條(占本人有癌癥病史者的 48.2%),其他消化系統癌病史者 43 條(占本人有癌癥病史者的 13.7%),其他系統癌病史者 119 條(占本人有癌癥病史者的 38.0%)。 在各居住地中,四川組有癌家族史者1 174條(占有癌家族史者的 93.5%),非四川組有癌家族史者81條(占有癌家族史者的6.5%);四川成都組有癌家族史者586條(占四川組有癌家族史者的49.9%),四川非成都組有癌家族史者588條(占四川組有癌家族史者的50.1%)。 不同居住地分組之間,四川組與非四川組以及四川成都組與四川非成都組的患者本人癌家族史中不同腫瘤病史的構成比差異均無統計學意義(χ2=1.121,P=0.606;χ2=1.047,P=0.621),具體見表2。在有癌家族史的患者中,患者親屬有癌癥病史者942條,其中患者親屬有結直腸癌病史者 392 條(占親屬有癌癥病史者的41.6%),其他消化系統癌病史者339條(占親屬有癌癥病史者的36.0%),其他系統癌病史者211條(占親屬有癌癥病史者的22.4%)。不同居住地分組之間,四川組與非四川組以及四川成都組與四川非成都組的親屬癌家族史中不同腫瘤病史構成比的差異均無統計學意義(χ2=0.813,P=0.692;χ2=2.696,P=0.262),具體見表3。本研究也探究了是否有癌家族史在四川成都組、四川非成都組和非四川組3組之間的關系,結果顯示差異具有統計學意義(χ2=32.673,P<0.001),其中四川組與非四川組比較差異有統計學意義(χ2=6.502,P=0.011),四川成都組與四川非成都組比較差異也有統計學意義(χ2=26.129,P<0.001)。


2.4 CRC患者的腫瘤部位與居住地的關系
本次研究中,只分析了CRC單原發癌數量的分布情況,有具體腫瘤部位的數據且為單原發癌6 686條(占所有研究數據的92.5%),缺失546條(占所有研究數據的7.5%)。不同居住地CRC患者的腫瘤部位情況詳見表4。不同居住地分組之間,四川組與非四川組患者的腫瘤部位比較差異無統計學意義(χ2=0.476,P=0.490),四川成都組與四川非成都組患者的腫瘤部位比較差異有統計學意義(χ2=36.216,P<0.001)。

2.5 CRC患者的腫瘤形態與居住地的關系
本次研究中,有具體腫瘤形態的數據5 667條(占所有研究數據的78.4%),缺失1 565條(占所有研究數據的21.6%)。 不同居住地CRC的腫瘤形態見表5。由表5可見,四川組與非四川組CRC患者的腫瘤形態比較差異有統計學意義(χ2=19.560,P<0.001);四川成都組與四川非成都組CRC患者的腫瘤形態比較差異無統計學意義(χ2=5.377,P=0.247)。

2.6 CRC患者腫瘤方位與居住地的關系
本研究中,有腫瘤方位的數據 6 272條(占所有研究數據的 86.7%),缺失960條(占所有研究數據的13.3%)。不同居住地CRC患者的腫瘤方位情況詳見表6。由表6可見,四川組與非四川組以及四川成都組與四川非成都組之間腫瘤方位的構成比差異均有統計學意義(χ2=17.484,P=0.005;χ2=26.820,P<0.001),其中腫瘤方位為累及腸壁1圈者最多(47.1%,2 954/6 272)。

2.7 CRC患者腫瘤病理學性質與居住地的關系
本次研究中,腫瘤病理學性質有效數據5 479 條(占所有研究數據的75.8%),缺失 1 753條(占所有研究數據的24.2%)。不同居住地CRC患者的腫瘤病理學性質詳見表7。由表7可見,四川組與非四川組以及四川成都組和四川非成都組CRC患者的病理學性質比較差異均無統計學意義(χ2=8.136,P=0.408;χ2=7.278,P=0.506),其中腺癌最多(78.4%, 4 295/5 479)。

2.8 CRC患者腫瘤分化程度與居住地的關系
本研究中,CRC分化程度有數據者5 764條(占所有研究數據的79.7%),缺失1 468條(占所有研究數據的20.3%)。不同居住地CRC患者的腫瘤分化程度見表8。 由表8可見,四川組與非四川組以及四川成都組和四川非成都組之間,腫瘤不同分化程度的構成比差異均無統計學意義(H=0.289,P=0.591;H=0.156,P=0.693);其中,中分化者最多,有 3 677 條(占分化程度有數據者的63.8%),高分化者最少,有226條(占分化程度有數據者的3.9%)。

2.9 CRC患者術前腫瘤 TNM 分期與居住地的關系
本研究中,CRC患者術前腫瘤TNM 分期有數據者4 325條(占所有研究數據的59.8%),缺失2 907條(占所有研究數據的40.2%)。不同居住地CRC患者的術前腫瘤TNM分期見表9。由表9可見,四川組與非四川組之間,CRC患者術前 腫瘤TNM 分期的構成比差異有統計學意義(H=8.023,P=0.005);四川成都組與四川非成都組之間,CRC患者術前腫瘤 TNM 分期的構成比差異無統計學意義(H=0.218,P=0.640)。

3 討論
3.1 居住地與CRC的發生
CRC是當今世界最常見的惡性腫瘤之一[5]。位居惡性腫瘤發病譜的第3位,是癌癥死亡的第2大原因[6]。近年的一些研究[7-9]表明,CRC發病率和死亡率與地理差異相關聯,且不同居住地的人在患病后的生存率存在差異。最近,一些歐洲和北美國家的CRC發病率和死亡率有所下降,但中國結直腸癌發病率和死亡率卻繼續上升,且中國癌癥譜系正向著發達國家轉變,這可能與經濟、飲食等因素有關[10-12]。不斷增高的發病率會導致我國CRC的疾病負擔進一步加重,并威脅人們壽命狀態。因此,關注CRC與居住地的關系具有一定的現實意義。然而,由于醫院所處地理位置的原因,筆者在利用 DACCA 進行數據挖掘時發現這部分患者大多來自四川省(6 635條),其中將近一半來自成都市(2 867條),這可能會導致結論具有一定局限性。本次研究重點關注了居住地與多種CRC腫瘤相關特征的關系,嘗試探索居住地是否帶來了腫瘤學特征的差異,期待發現一定規律,進而促進特定區域癌癥管理計劃的規劃與實施。
從病史來看,DACCA 由于需要獲取部分既往信息,因此筆者嘗試分析居住地與CRC發生的部分風險關系。從本研究結果中可以看出,四川省患者與非四川省患者在就診時是否伴有癌前病變與居住地之間不存在相關性(χ2=0.676,P=0.411)。但四川省患者與非四川省患者癌前病變種類構成比與居住地之間存在相關性(χ2=14.462,P=0.003),而四川成都患者與四川省非成都患者癌前病變種類構成比與居住地之間不存在相關性(χ2=7.591,P=0.101)。這可能是由于四川省與其他省份之間存在更大的差異,如地理位置、生活習慣、飲食習慣等。在這些癌前病變中,四川省內占比最大是血吸蟲病(35.6%),非四川省為炎性腸病(36.4%)占比最大。其中血吸蟲病曾在我國重度流行,包括四川省在內的長江流域及其以南的12個省(直轄市、自治區),部分重度流行區人群血吸蟲感染率超過90%[13-14],但其是否會導致CRC的發生還有待探索[15]。有研究表明,早期檢測并切除癌前病變(如腺瘤、息肉等)對降低CRC的發病率和死亡率有重大意義[16-17]。
本研究進一步分析了居住地與癌家族史的關系。 之前已有文章表明癌家族史是發生CRC的危險因素,且CRC患者的親屬患病風險比沒有CRC家族史的人高近3倍,但在不同區域存在差異[18-21]。本研究結果顯示,是否有癌家族史在不同居住地之間的差異具有統計學意義(χ2=32.673,P<0.001)。其中在四川成都組(49.9%)和四川非成都組(50.1%)存在有癌家族史的CRC患者比例相對更高,當然這有可能是樣本量大多來自四川省的緣故,也與就醫的距離遠近、經濟發展等因素有關。同時,本研究對癌家族史的種類構成比進行了分析,但幾個地區中癌家族史種類構成比與居住地之間差異均沒有統計學意義。在本人癌家族史中,存在有本人CRC史的CRC患者比例相對更高(48.2%),在親屬癌家族史中,也是存在有親屬CRC史的CRC患者比例相對更高(41.6%)。
3.2 居住地與CRC的腫瘤學特征
本次研究也重點關注了居住地與CRC的腫瘤學特征之間的關系,嘗試探索居住地是否帶來了腫瘤學特征的差異,以為臨床診療提供輔助建議。
本研究結果顯示,腫瘤分化程度構成比和腫瘤病理學性質構成比在不同居住地之間的差異均無統計學意義。在腫瘤病理學性質構成比中,腺癌所占比例最大(78.4%),在四川成都組(78.5%)、四川非成都組(78.3%)和非四川組(78.3%)均如此。在腫瘤分化程度方面,最常見的為中分化(63.8%,3 677/5 764),四川成都組(63.7%),四川非成都組(63.6%)和非四川組(65.9%)均如此。一項中國廣東的研究[22]也表明,腺癌在腫瘤病理學性質構成中占比最大(75.6%),在腫瘤分化程度中高分化與中分化占比最大(74.7%),且廣東4個不同地區的CRC患者在腫瘤病理學性質和分化程度上的差異具有統計學意義。而在本研究中沒有發現這種差異,可能是由于我們的地理分區范圍較大、不夠細致導致的。
本研究重點分析了這些患者腫瘤部位種類構成比情況。 結果表明,CRC患者腫瘤位于直腸或結腸在四川成都組與四川非成都組之間的差異有統計學意義(χ2=36.216,P<0.001),其中直腸癌(75.6%)高于結腸癌(24.4%)。而在四川組與非四川組中,腫瘤部位存在于直腸或結腸之間的差異沒有統計學意義(χ2=0.476,P=0.490),直腸癌(75.4%)也高于結腸癌(24.6%)。從解剖角度來看,直腸癌的患病風險是結腸癌的4倍[23],這與本研究的結論相似。在過去幾十年中,CRC的發病率和死亡率有所下降,特別是位于左半結腸的腫瘤結局明顯改善,發病率和死亡率穩步下降,而位于右半結腸的腫瘤結局改善不明顯[24]。因此需要提高對右半結腸腫瘤的關注,探索更好的治療策略。
在不同居住地的CRC患者腫瘤形態構成比中, 四川組與非四川組存在差異(χ2=19.560,P<0.001),其中四川組(59.9%)與非四川組(55.3%)均為潰瘍型發生最多。這與2019年9月26日更新版DACCA數據庫統計結果相近,腫瘤形態中潰瘍型最常見(42.4%)[25]。除了潰瘍型這種常見的病理大體類型外,在 DACCA 數據庫中有著更為復雜的病理大體類型的分類方式,針對少見的CRC病理大體類型也應該提前了解以制定出合理的治療方案,這具有很大的挑戰。在不同居住地的CRC患者腫瘤方位構成比中,四川成都組與四川非成都組存在差異(χ2=26.820,P<0.001),四川組與非四川組也存在差異(χ2=17.484,P=0.005)。其中腫瘤累積腸壁1圈者居多(47.1%),在后壁的最少(4.7%,293/6 272)。
作為CRC嚴重程度的指標之一,術前腫瘤TNM分期非常重要。本研究發現,在不同居住地分組之間,四川組與非四川組的術前腫瘤TNM分期構成比存在差異(H=8.023,P=0.005);同時還發現,2組CRC患者術前腫瘤TNM 分期為Ⅲ期的患者構成比均超過了 40%,系Ⅲ~Ⅳ期者的比例高達 71.2%(3 080/4 325)),其中非四川組術前腫瘤TNM分期處于Ⅲ~Ⅳ期的所占比例更大(76.9%,256/333)。提示如今各地CRC發現時大多已經處于中晚期狀態,且在本研究中外省就醫患者相對更多處于中晚期狀態。 腫瘤的術前TNM分期是預測CRC患者預后的重要因素[26-27],不管是來自哪里的患者,都應做好CRC的篩查,讓腫瘤在早期就能被發現,從而改善治療結果和預后。
4 結論
通過DACCA中的數據分析發現,CRC患者的居住地與腫瘤學特征存在多種關聯。不同居住地的CRC患者與其癌前病變種類構成存在差異。在癌家族史中CRC的比例更高。從腫瘤發生部位來看,腫瘤位于直腸的占比高于結腸。在各地區腫瘤形態構成中,均為潰瘍型最多。CRC患者的腫瘤方位構成不同,累及腸壁1圈者最多。大多數CRC患者發現腫瘤時已是中晚期,非四川省的中晚期患者所占比例更高。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:唐盈主要負責數據統計和描述、結果制圖、文章撰寫;龔佳祺主要負責大綱梳理、文章修改;吳桂儀主要負責統計分析、數據描述;汪曉東主要負責文章數據源、文章修改;李立主要負責文章指導。
倫理聲明:本研究已通過了四川大學華西醫院生物醫學倫理審查委員會的審批[批文編號 2019 年審(140 號)]。