引用本文: 林瑾怡, 劉婧, 龐霽蕓, 汪曉東, 李立. 結直腸癌患者婚姻狀況與長期生存預后的關系:基于DACCA的真實世界分析. 中國普外基礎與臨床雜志, 2023, 30(6): 660-665. doi: 10.7507/1007-9424.202303081 復制
基于真實世界場景建立的華西腸癌數據庫(Database from Colorectal Cancer,DACCA)為結直腸癌數據的結構化與應用提供了基礎。在此之前,數據庫解讀第1章(人群特征)已經發布了第1部分(身體質量指數的系列研究內容)和第2部分(年齡相關的系列研究內容)的研究內容,本研究團隊將對第3部分(婚姻狀況的系列研究內容)進行解讀。與前述系列研究[1-2]不同的是,年齡和身體質量指數作為患者最常用的基線數據對于診治過程具有指導意義,而婚姻狀況對于結直腸癌的意義還不明確。有研究[3-5]顯示,婚姻狀況作為重要的社會心理因素,對結直腸癌患者的生存預后有顯著影響,非在婚結直腸癌患者的生存時間比在婚患者的生存時間短。此外,以往對婚姻狀況與結直腸癌關系的研究往往只區分在婚和非在婚,而并未對未婚、離婚、再婚、喪偶等人群加以區分[6]。因此,本研究提取華西DACCA中婚姻狀況與生存預后的相關數據,借助區域真實數據進一步探討婚姻狀況對結直腸癌患者長期生存預后的影響。
1 資料與方法
1.1 數據庫版本
采用2023年1月13日更新版DACCA中的數據。
1.2 數據參數的選擇及定義
本研究分析所用的數據參數包括:年齡、性別、婚姻關系、腫瘤部位、腫瘤性質、病理TNM(pathological TNM,pTNM)分期、手術日期、隨訪終止日期、出院日期和生存狀況。DACCA中編碼體系相關參數的定義詳見《數據庫建設第五部分·結直腸癌的腫瘤特征—模塊的設計(二)》 [7]、《數據庫建設第六部分:結直腸癌分期的標簽與結構化》 [8]和《數據庫建設第十一部分:結直腸癌隨訪的標簽與結構化》 [9]。
根據本次研究需要,將DACCA中登記的婚姻狀況劃分為有配偶 [初婚和再婚(包括再婚和復婚)] 及無配偶 [未婚、離婚和喪偶(即配偶去世)]共5種狀況進行研究,以分析不同婚姻狀況患者之間的特征差異。生存時間(月)定義為從手術日期至隨訪終期所持續的時間或從手術日期至死亡日期所持續的時間,并進行總生存時間(overall survival,OS)和疾病特異性生存時間(disease specific survival,DSS)的分析,其中,OS定義為從隨機化開始至(因任何原因)死亡的時間,DSS定義為從隨機化開始至疾病復發或(因任何原因)死亡的時間。按照隨訪數據提示的時間劃分為3年和5年2個隨訪時間點;同時將腫瘤部位合并為直腸、結腸和結直腸3類。
1.3 數據篩選方案
根據本次研究需要,筆者團隊以“手術日期”和“婚姻狀況”為排序條件,對數據庫的信息按照下述條件依次進行篩選:① 剔除重復、無效數據;② 以“手術日期”為條件,剔除缺失數據;③ 以“婚姻狀況”為條件,剔除缺失數據;④ 剔除“隨訪日期”或“生存狀況”缺失的數據。
1.4 統計學方法
數據分析采用SPSS 26.0軟件。定性資料采用“條(%)”描述;計量資料采用 Kolmogorov-Smirnov 檢驗,符合正態分布者用均數±標準差(±s)描述,不符合者采用中位數(median,M)和上下四分位數(P25,P75)描述。計數資料的比較采用R×C列聯表χ2檢驗或秩和檢驗;采用Kaplan-Meier法繪制生存曲線及計算生存率,采用log-rank檢驗比較生存曲線差異;使用Z檢驗評估各時點下的生存差異的顯著性;并采用多因素Cox比例風險回歸(簡稱“Cox回歸” )進行預后影響因素分析并計算危險比(risk ratio,RR)及其對應的95%置信區間(confidence interval,CI)。所有檢驗均為雙側,檢驗水準為α=0.05。
2 結果
截至2022年8月31日,從數據庫篩選出符合本次研究的數據7 373條。具體篩選過程及結果見圖1。納入患者的基本情況見表1。


2.1 納入患者的基本情況
符合本次研究的數據總共7 373條,其中女3 027條(41.1%),男4 346條(58.9%);年齡17~104歲,中位年齡(上下四分位數)為61(51,68)歲。其中初婚6 696條(90.8%),未婚108條(1.5%),離婚198條(2.7%),再婚22條(0.3%),喪偶349條(4.7%)。有明確腫瘤部位記錄的數據6 985條,其中直腸5 477條(78.4%),結腸1 425條(20.4%),結直腸83條(1.2%)。有明確腫瘤性質記錄的數據6 982條,其中腺癌5 568條(79.7%),黏液腺癌1 423條(20.4%),印戒細胞癌120條(1.7%),神經內分泌癌85條(1.2%),鱗狀細胞癌31條(0.4%),惡性黑色素瘤19條(0.3%),惡性淋巴瘤14條(0.2%),黏液囊腺瘤8條(0.1%),間質瘤3條(0.0%),平滑肌肉瘤13條(0.2%)。有明確pTNM分期記錄的數據4 221條,其中0期123條(2.9%),Ⅰ期433條(10.3%),Ⅱ期1 118條(26.5%),Ⅲ期890條(21.1%),Ⅳ期1 657條(39.3%)。
2.2 不同婚姻狀況患者的基線資料比較結果
5種婚姻狀況患者的性別、年齡、pTNM分期、腫瘤部位和腫瘤性質比較差異有統計學意義(P<0.05),見表1。
2.3 不同婚姻狀況患者的OS和DSS比較結果
5種婚姻狀況患者OS和DSS的Kaplan-Meier生存曲線(圖2)比較差異均無統計學意義(χ2=2.692,P=0.611;χ2=2.927,P=0.570)。3年累積總生存率和疾病特異性生存率總體比較差異有統計學意義(χ2=24.65,P<0.001;χ2=18.63,P=0.001),但5年累積總生存率和疾病特異性生存率總體比較差異無統計學意義(χ2=8.18,P=0.085;χ2=5.73,P=0.220),見表2;進一步兩兩比較(表3)發現,初婚患者的3年累積總生存率和疾病特異性生存率均高于喪偶者(Z=3.36,P<0.01;Z=3.02,P<0.01),暫未發現其他婚姻狀況患者之間在3年累積總生存率和疾病特異性生存率方面比較差異有統計學意義(P>0.05)。



2.4 影響結直腸癌患者OS和DSS的單因素和多因素分析結果
單因素分析結果(表4)顯示,結直腸癌患者的性別、年齡、pTNM分期、腫瘤性質均與結直腸癌患者的OS和DSS有關,而且還發現腫瘤部位與結直腸癌患者的DSS有關(P<0.05);將單因素分析結果中有統計學意義的因素并綜合專業認識和既往研究結論納入相關因素進行多因素分析的結果(表5)顯示,男性、患者年齡大(≥65歲)、pTNM分期晚(Ⅳ期)、腫瘤部位(位于結直腸)及腫瘤性質為神經內分泌癌者,其OS和DSS縮短的風險更大(P<0.05),未發現婚姻狀況與患者的OS和DSS有關(P>0.05)。


3 討論
婚姻狀況是一種重要的社會心理因素,以往研究[3]結果提示結直腸癌的生存預后與婚姻狀況有關,且得出了較為一致的結論,即在婚患者的生存預后優于非在婚患者:如劉敏靈[3]和李馨[6]報道,在婚結直腸癌患者的OS優于非在婚患者;Lee等[10]對一項隨機對照試驗的前瞻性隨訪隊列進行二次分析以評估婚姻狀況對生存結局的影響發現,與在婚結直腸癌患者相比,離婚/分居/喪偶患者的OS、無疾病生存時間、無復發生存時間均更差(HR=1.44,P=0.002;HR=1.35,P=0.02;HR=1.40,P=0.01),而與未婚患者比較未發現差異有統計學意義(P>0.05);Zhou等[11]基于SEER數據庫的研究發現,在婚患者的OS和DSS優于未婚患者(P<0.001),并且多因素分析發現婚姻狀況是結直腸癌患者OS的獨立預測因子;Chen等[12]基于SEER數據庫的多因素分析結果也得出了相同的結論。雖然以上研究得出的結論較為一致,但由于不同文獻對婚姻狀況的分組標準不一致,因此需要進一步探討婚姻狀況對結直腸癌患者生存預后的影響。
本研究中,相較于以往多數研究[3, 10-12]將婚姻狀況分組僅分為在婚組和非在婚組,本研究將不同婚姻狀況患者分為有配偶(初婚和再婚)及無配偶(未婚、離婚和喪偶),選擇了目前研究中較為常用的生存分析指標OS和DSS,對不同婚姻狀況結直腸癌患者的3年和5年總生存率和疾病無特異性生存率進行了比較。首先對不同婚姻狀況患者之間基線信息進行了比較發現差異有統計學意義(P<0.05),筆者團隊分析可能與不同婚姻狀況患者之間樣本量差距較大有關,今后需要平衡樣本量進一步進行檢驗,以排除基線資料對結局的影響。本研究中發現,初婚結直腸癌患者的3年累積總生存率和累積疾病無特異性生存率均高于喪偶者(P<0.01),但未發現其他不同婚姻狀況患者的3、5年總生存率和累積疾病無特異性生存率的兩兩間比較差異有統計學意義(P>0.05);多因素分析未發現婚姻狀況與患者的中位OS和DSS有關(P>0.05),這與目前已發表的大多數研究結論較為一致,但與Zhou等[11]和Chen等[12]的基于SEER數據庫的研究結論存在差異。由于SEER數據庫是基于美國人群建立的腫瘤數據庫,而DACCA中數據為中國人(亞洲人群),筆者團隊分析這可能是結論不一致的原因之一。但相比于DACCA,SEER數據庫的樣本量更大,因此本研究結論還需要進一步驗證。
對本研究得出的結論及結合文獻進行分析,從社會支持和心理方面看,初婚狀況結直腸癌患者相較于其他婚姻狀況患者的3年累積總生存率更好可能有多方面原因:① 早期篩查;② 早期診斷和治療;③ 情感支持。如Gram等[13]的研究指出,婚姻狀況與參與結直腸癌篩查密切相關,在婚人群的篩查參與率更高。Chen等[12]的多因素logistic回歸模型表明,在婚患者比非在婚患者更有可能在早期階段確診并及時接受手術治療和放化療。究其根本原因,筆者團隊推測可能與配偶在健康維系方面提供的支持有關。Yang等[14]的研究也指出,配偶可以提供情感支持,并可以在監測健康相關行為方面發揮監督作用。基于以上分析,筆者團隊建議,對非在婚結直腸癌患者的生存預后比如在術后康復過程及隨訪過程中需更加主動加強關注。
總之,本研究基于四川大學華西醫院DACCA中結直腸癌患者婚姻狀況與生存預后的關系分析發現,初婚結直腸癌患者的3年累積總生存率和疾病特異性生存率均高于喪偶患者,而暫時未發現其他不同婚姻狀況患者在3、5年累積總生存率和疾病特異性生存率方面比較差異有統計學意義。但在進行多因素分析中未發現婚姻狀況對中位OS和DSS有影響,這種原因值得探索。對本研究得出的結論也需謹慎看待,因為本研究尚存在一些局限性:首先,本研究是回顧性研究,因此無法避免選擇偏倚,比如本研究的基線資料比較差異有統計學意義,其可比性的原因需要進一步驗證,是否與樣本量有關;其次,除初婚狀況患者外,其他婚姻狀況的患者病例數較少,構成比不均衡,這可能影響檢驗效能;此外,DACCA中未記錄其他與婚姻有關的因素,如婚姻質量、婚姻時間長短等,這也可能對結果造成一定的影響。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:林瑾怡主要負責數據分析、數據描述、文章撰寫和文章修改;劉婧主要負責數據統計和數據分析;龐霽蕓主要負責數據篩選和數據統計;汪曉東主要負責文章數據源提供及文章修改;李立主要負責文章指導。
倫理聲明:本研究通過了四川大學華西醫院生物醫學倫理審查委員會的審批 [批文編號:2021 年審(155)號]。
基于真實世界場景建立的華西腸癌數據庫(Database from Colorectal Cancer,DACCA)為結直腸癌數據的結構化與應用提供了基礎。在此之前,數據庫解讀第1章(人群特征)已經發布了第1部分(身體質量指數的系列研究內容)和第2部分(年齡相關的系列研究內容)的研究內容,本研究團隊將對第3部分(婚姻狀況的系列研究內容)進行解讀。與前述系列研究[1-2]不同的是,年齡和身體質量指數作為患者最常用的基線數據對于診治過程具有指導意義,而婚姻狀況對于結直腸癌的意義還不明確。有研究[3-5]顯示,婚姻狀況作為重要的社會心理因素,對結直腸癌患者的生存預后有顯著影響,非在婚結直腸癌患者的生存時間比在婚患者的生存時間短。此外,以往對婚姻狀況與結直腸癌關系的研究往往只區分在婚和非在婚,而并未對未婚、離婚、再婚、喪偶等人群加以區分[6]。因此,本研究提取華西DACCA中婚姻狀況與生存預后的相關數據,借助區域真實數據進一步探討婚姻狀況對結直腸癌患者長期生存預后的影響。
1 資料與方法
1.1 數據庫版本
采用2023年1月13日更新版DACCA中的數據。
1.2 數據參數的選擇及定義
本研究分析所用的數據參數包括:年齡、性別、婚姻關系、腫瘤部位、腫瘤性質、病理TNM(pathological TNM,pTNM)分期、手術日期、隨訪終止日期、出院日期和生存狀況。DACCA中編碼體系相關參數的定義詳見《數據庫建設第五部分·結直腸癌的腫瘤特征—模塊的設計(二)》 [7]、《數據庫建設第六部分:結直腸癌分期的標簽與結構化》 [8]和《數據庫建設第十一部分:結直腸癌隨訪的標簽與結構化》 [9]。
根據本次研究需要,將DACCA中登記的婚姻狀況劃分為有配偶 [初婚和再婚(包括再婚和復婚)] 及無配偶 [未婚、離婚和喪偶(即配偶去世)]共5種狀況進行研究,以分析不同婚姻狀況患者之間的特征差異。生存時間(月)定義為從手術日期至隨訪終期所持續的時間或從手術日期至死亡日期所持續的時間,并進行總生存時間(overall survival,OS)和疾病特異性生存時間(disease specific survival,DSS)的分析,其中,OS定義為從隨機化開始至(因任何原因)死亡的時間,DSS定義為從隨機化開始至疾病復發或(因任何原因)死亡的時間。按照隨訪數據提示的時間劃分為3年和5年2個隨訪時間點;同時將腫瘤部位合并為直腸、結腸和結直腸3類。
1.3 數據篩選方案
根據本次研究需要,筆者團隊以“手術日期”和“婚姻狀況”為排序條件,對數據庫的信息按照下述條件依次進行篩選:① 剔除重復、無效數據;② 以“手術日期”為條件,剔除缺失數據;③ 以“婚姻狀況”為條件,剔除缺失數據;④ 剔除“隨訪日期”或“生存狀況”缺失的數據。
1.4 統計學方法
數據分析采用SPSS 26.0軟件。定性資料采用“條(%)”描述;計量資料采用 Kolmogorov-Smirnov 檢驗,符合正態分布者用均數±標準差(±s)描述,不符合者采用中位數(median,M)和上下四分位數(P25,P75)描述。計數資料的比較采用R×C列聯表χ2檢驗或秩和檢驗;采用Kaplan-Meier法繪制生存曲線及計算生存率,采用log-rank檢驗比較生存曲線差異;使用Z檢驗評估各時點下的生存差異的顯著性;并采用多因素Cox比例風險回歸(簡稱“Cox回歸” )進行預后影響因素分析并計算危險比(risk ratio,RR)及其對應的95%置信區間(confidence interval,CI)。所有檢驗均為雙側,檢驗水準為α=0.05。
2 結果
截至2022年8月31日,從數據庫篩選出符合本次研究的數據7 373條。具體篩選過程及結果見圖1。納入患者的基本情況見表1。


2.1 納入患者的基本情況
符合本次研究的數據總共7 373條,其中女3 027條(41.1%),男4 346條(58.9%);年齡17~104歲,中位年齡(上下四分位數)為61(51,68)歲。其中初婚6 696條(90.8%),未婚108條(1.5%),離婚198條(2.7%),再婚22條(0.3%),喪偶349條(4.7%)。有明確腫瘤部位記錄的數據6 985條,其中直腸5 477條(78.4%),結腸1 425條(20.4%),結直腸83條(1.2%)。有明確腫瘤性質記錄的數據6 982條,其中腺癌5 568條(79.7%),黏液腺癌1 423條(20.4%),印戒細胞癌120條(1.7%),神經內分泌癌85條(1.2%),鱗狀細胞癌31條(0.4%),惡性黑色素瘤19條(0.3%),惡性淋巴瘤14條(0.2%),黏液囊腺瘤8條(0.1%),間質瘤3條(0.0%),平滑肌肉瘤13條(0.2%)。有明確pTNM分期記錄的數據4 221條,其中0期123條(2.9%),Ⅰ期433條(10.3%),Ⅱ期1 118條(26.5%),Ⅲ期890條(21.1%),Ⅳ期1 657條(39.3%)。
2.2 不同婚姻狀況患者的基線資料比較結果
5種婚姻狀況患者的性別、年齡、pTNM分期、腫瘤部位和腫瘤性質比較差異有統計學意義(P<0.05),見表1。
2.3 不同婚姻狀況患者的OS和DSS比較結果
5種婚姻狀況患者OS和DSS的Kaplan-Meier生存曲線(圖2)比較差異均無統計學意義(χ2=2.692,P=0.611;χ2=2.927,P=0.570)。3年累積總生存率和疾病特異性生存率總體比較差異有統計學意義(χ2=24.65,P<0.001;χ2=18.63,P=0.001),但5年累積總生存率和疾病特異性生存率總體比較差異無統計學意義(χ2=8.18,P=0.085;χ2=5.73,P=0.220),見表2;進一步兩兩比較(表3)發現,初婚患者的3年累積總生存率和疾病特異性生存率均高于喪偶者(Z=3.36,P<0.01;Z=3.02,P<0.01),暫未發現其他婚姻狀況患者之間在3年累積總生存率和疾病特異性生存率方面比較差異有統計學意義(P>0.05)。



2.4 影響結直腸癌患者OS和DSS的單因素和多因素分析結果
單因素分析結果(表4)顯示,結直腸癌患者的性別、年齡、pTNM分期、腫瘤性質均與結直腸癌患者的OS和DSS有關,而且還發現腫瘤部位與結直腸癌患者的DSS有關(P<0.05);將單因素分析結果中有統計學意義的因素并綜合專業認識和既往研究結論納入相關因素進行多因素分析的結果(表5)顯示,男性、患者年齡大(≥65歲)、pTNM分期晚(Ⅳ期)、腫瘤部位(位于結直腸)及腫瘤性質為神經內分泌癌者,其OS和DSS縮短的風險更大(P<0.05),未發現婚姻狀況與患者的OS和DSS有關(P>0.05)。


3 討論
婚姻狀況是一種重要的社會心理因素,以往研究[3]結果提示結直腸癌的生存預后與婚姻狀況有關,且得出了較為一致的結論,即在婚患者的生存預后優于非在婚患者:如劉敏靈[3]和李馨[6]報道,在婚結直腸癌患者的OS優于非在婚患者;Lee等[10]對一項隨機對照試驗的前瞻性隨訪隊列進行二次分析以評估婚姻狀況對生存結局的影響發現,與在婚結直腸癌患者相比,離婚/分居/喪偶患者的OS、無疾病生存時間、無復發生存時間均更差(HR=1.44,P=0.002;HR=1.35,P=0.02;HR=1.40,P=0.01),而與未婚患者比較未發現差異有統計學意義(P>0.05);Zhou等[11]基于SEER數據庫的研究發現,在婚患者的OS和DSS優于未婚患者(P<0.001),并且多因素分析發現婚姻狀況是結直腸癌患者OS的獨立預測因子;Chen等[12]基于SEER數據庫的多因素分析結果也得出了相同的結論。雖然以上研究得出的結論較為一致,但由于不同文獻對婚姻狀況的分組標準不一致,因此需要進一步探討婚姻狀況對結直腸癌患者生存預后的影響。
本研究中,相較于以往多數研究[3, 10-12]將婚姻狀況分組僅分為在婚組和非在婚組,本研究將不同婚姻狀況患者分為有配偶(初婚和再婚)及無配偶(未婚、離婚和喪偶),選擇了目前研究中較為常用的生存分析指標OS和DSS,對不同婚姻狀況結直腸癌患者的3年和5年總生存率和疾病無特異性生存率進行了比較。首先對不同婚姻狀況患者之間基線信息進行了比較發現差異有統計學意義(P<0.05),筆者團隊分析可能與不同婚姻狀況患者之間樣本量差距較大有關,今后需要平衡樣本量進一步進行檢驗,以排除基線資料對結局的影響。本研究中發現,初婚結直腸癌患者的3年累積總生存率和累積疾病無特異性生存率均高于喪偶者(P<0.01),但未發現其他不同婚姻狀況患者的3、5年總生存率和累積疾病無特異性生存率的兩兩間比較差異有統計學意義(P>0.05);多因素分析未發現婚姻狀況與患者的中位OS和DSS有關(P>0.05),這與目前已發表的大多數研究結論較為一致,但與Zhou等[11]和Chen等[12]的基于SEER數據庫的研究結論存在差異。由于SEER數據庫是基于美國人群建立的腫瘤數據庫,而DACCA中數據為中國人(亞洲人群),筆者團隊分析這可能是結論不一致的原因之一。但相比于DACCA,SEER數據庫的樣本量更大,因此本研究結論還需要進一步驗證。
對本研究得出的結論及結合文獻進行分析,從社會支持和心理方面看,初婚狀況結直腸癌患者相較于其他婚姻狀況患者的3年累積總生存率更好可能有多方面原因:① 早期篩查;② 早期診斷和治療;③ 情感支持。如Gram等[13]的研究指出,婚姻狀況與參與結直腸癌篩查密切相關,在婚人群的篩查參與率更高。Chen等[12]的多因素logistic回歸模型表明,在婚患者比非在婚患者更有可能在早期階段確診并及時接受手術治療和放化療。究其根本原因,筆者團隊推測可能與配偶在健康維系方面提供的支持有關。Yang等[14]的研究也指出,配偶可以提供情感支持,并可以在監測健康相關行為方面發揮監督作用。基于以上分析,筆者團隊建議,對非在婚結直腸癌患者的生存預后比如在術后康復過程及隨訪過程中需更加主動加強關注。
總之,本研究基于四川大學華西醫院DACCA中結直腸癌患者婚姻狀況與生存預后的關系分析發現,初婚結直腸癌患者的3年累積總生存率和疾病特異性生存率均高于喪偶患者,而暫時未發現其他不同婚姻狀況患者在3、5年累積總生存率和疾病特異性生存率方面比較差異有統計學意義。但在進行多因素分析中未發現婚姻狀況對中位OS和DSS有影響,這種原因值得探索。對本研究得出的結論也需謹慎看待,因為本研究尚存在一些局限性:首先,本研究是回顧性研究,因此無法避免選擇偏倚,比如本研究的基線資料比較差異有統計學意義,其可比性的原因需要進一步驗證,是否與樣本量有關;其次,除初婚狀況患者外,其他婚姻狀況的患者病例數較少,構成比不均衡,這可能影響檢驗效能;此外,DACCA中未記錄其他與婚姻有關的因素,如婚姻質量、婚姻時間長短等,這也可能對結果造成一定的影響。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:林瑾怡主要負責數據分析、數據描述、文章撰寫和文章修改;劉婧主要負責數據統計和數據分析;龐霽蕓主要負責數據篩選和數據統計;汪曉東主要負責文章數據源提供及文章修改;李立主要負責文章指導。
倫理聲明:本研究通過了四川大學華西醫院生物醫學倫理審查委員會的審批 [批文編號:2021 年審(155)號]。