引用本文: 張嘯天, 程志遠, 張子凡, 張玲, 林寒, 辛磊, 王天驕, 孟茜茜, 馬佳怡, 王洛偉. 基于 199 例胃鱗狀細胞癌的預后預測模型——列線圖. 中國普外基礎與臨床雜志, 2021, 28(1): 27-32. doi: 10.7507/1007-9424.202004068 復制
胃癌是世界上第四大最常見的惡性腫瘤,也是第四大惡性腫瘤死因[1]。原發性胃鱗狀細胞癌是預后較差的特殊組織類型之一[2],必須依靠病理學檢查才能確診,且胃鏡活檢的確診率低[3]。胃鱗狀細胞癌的發病機制尚不清楚[2]。胃鱗狀細胞癌是由于胃黏膜上皮在慢性炎癥基礎上發生鱗狀化生,或是原發性胃腺癌中鱗狀成分過度增生而形成的,其占所有胃癌的 0.04%~0.07%[4],這使得其流行病學特征難以總結,并且也是制定醫學指南的主要障礙。監視、流行病學和最終結果(Surveillance,Epidemiology,and End Results,SEER)數據庫從美國多個醫療中心收集數據,提供了大量罕見惡性腫瘤的患者信息,為罕見病例的流行病學研究提供了足夠的樣本[5]。本研究使用 SEER 數據庫對胃鱗狀細胞癌進行統計學分析,探討影響胃鱗狀細胞癌生存期的預后因素,以幫助醫生確定患者的狀況,探索胃癌預后的潛在干預措施,為胃鱗狀細胞癌的治療方案提供設計依據,此外還建立了相對可靠的預測模型并繪制成列線圖,以幫助個性化治療。
1 資料和方法
1.1 資源來源
使用 SEER Stat 軟件(版本 8.3.5)獲取 SEER 數據庫中 2004–2015 年期間被診斷為原發性胃鱗狀細胞癌的患者信息。
1.2 病例篩選
納入標準:① 診斷年份為 2004–2015 年;② 病理確診為原發性胃鱗狀細胞癌;③ 臨床資料完整,包括年齡、性別、種族、婚姻狀況、原發部位、是否手術、組織學類型、病理分級、腫瘤 TNM 分期和存活時間。排除標準:① 臨床資料缺失或不完整;② 存活時間未知的病例;③ 首發原發癌不是胃鱗狀細胞癌。
共篩選出 199 例符合要求的病例,年齡 25~92 歲,中位年齡為 65 歲。男 150 例,女 49 例,男女比為 3∶1,其中發生肝、肺、骨和腦轉移的患者數量分別為 23、8、7 和 0 例。本組無分級為Ⅳ級的患者,多數(54.3%)患者為Ⅲ級。在組織學類型中,最常見是鱗狀細胞癌(87.9%),最罕見的類型是梭形細胞型鱗狀細胞癌。其他臨床特征見表 1。

1.3 統計學方法
對于年齡,本研究使用 X-tile 軟件確定該年齡的最佳截斷值為 75 歲。通過 SPSS 25.0 和 log-rank 法分析胃鱗狀細胞癌的預后因素。根據單因素分析結果和專業認知選擇變量引入 Cox 比例風險回歸模型進行多因素分析,得出影響胃鱗狀細胞癌預后的獨立因素。使用 R studio 軟件將模型可視化,繪制成列線圖。使用 C-index 評估構建的列線圖的預測效果。使用 1 000 次重采樣繪制校正曲線,以完成列線圖的內部驗證。C-index 的最大值為 1,表示 100% 的預測精度,最小值為 0.5。檢驗水準 α=0.05。
2 結果
本組所有患者獲訪 1~129 個月,中位隨訪時間為 31 個月。本組患者的中位生存時間為 8 個月[95%CI 為(4.985,11.015)]。
2.1 預后單因素分析
本組患者的 1、3 和 5 年累積生存率分別為 40.7%、22.4% 和 15.4%。年齡、原發部位、種族、手術、病理分級、T 分期和 M 分期與患者的生存時間相關(P<0.05),見表 1 和圖 1a–1g。

a–g:不同年齡(a)、種族(b)、原發部位(c)、手術(d)、病理分級(e)、T 分期(f)和 M 分期(g)患者的生存曲線;h:預測胃鱗狀細胞癌的 1 年和 3 年生存率的列線圖,原發部位中0 表示賁門、1 表示胃底、2 表示胃體、3 表示胃竇、4 表示胃小彎、5 表示胃大彎、6 表示胃重疊病灶、7 表示病灶部位未知;i 和 j:列線圖的 1 年校準曲線(i)和 3 年校準曲線(j),x 軸顯示的是列線圖預測的生存率,y 軸顯示的是使用 Kaplan-Meier 方法估算的實際生存率
2.2 預后多因素分析
將表 1 中的所有變量引入 Cox 比例風險回歸模型進行多因素分析。結果顯示:年齡 [HR=1.831,95%CI 為(1.289,2.601)]、原發部位 [HR=1.105,95%CI 為(1.019,1.199)]、M 分期 [HR=2.222,95%CI 為(1.552,3.179)] 和手術 [HR=0.561,95%CI 為(0.377,0.835)] 是影響患者生存的獨立預后因素(表 2)。

2.3 預測模型列線圖的開發和驗證
根據多因素分析結果,構造列線圖。由每個變量計算得出的加權總分,估算對應的 1 年和 3 年總生存率(圖 1h)。結果 C-index 為 0.700 [95%CI 為(0.696,0.704)],表明模型具有良好的辨別力。校準曲線顯示列線圖預測情況與觀察到的實際情況擬合良好,即預測接近現實(圖 1i 和圖 1j)。
3 討論
3.1 胃鱗狀細胞癌的流行病學數據
胃癌有幾種不同的組織學類型,大多數胃癌患者病理診斷為腺癌,而原發性胃鱗狀細胞癌則非常罕見[6]。由于發病率低以及確診困難,原發性胃鱗狀細胞癌于 1895 年首次被發現,但是直到 1967 年,其診斷標準才首次被正式闡述[7-8]。根據 Patnayak 等[9]的研究,截至 2015 年,全球僅報道了 100 例相關病例。本研究對 199 例胃鱗狀細胞癌患者進行了分析,研究顯示,胃鱗狀細胞癌患者的中位生存時間為 8 個月,1、3 和 5 年生存率分別為 40.7%、22.4% 和 15.4%,明顯低于胃癌的總體水平[10]。大多數患者年齡在 75 歲以下。
3.2 影響胃鱗狀細胞癌預后的因素
本研究的單因素分析結果表明,年齡、種族、原發部位、病理分級、手術、T 分期和 M 分期是胃鱗狀細胞癌預后的影響因素。多因素分析結果表明,年齡、原發部位、手術和 M 分期是預后的獨立影響因素;另一方面,性別、婚姻狀況、組織學類型和 N 分期對患者預后沒有顯著影響。關于胃鱗狀細胞癌預后影響因素的研究很少,因此,本研究將胃鱗狀細胞癌和胃癌整體進行比較分析。
種族是胃腺癌預后的危險因素之一,但不同種族的胃腺癌生存率差異可能只是社會經濟差異的體現[11-12]。在本研究中,胃鱗狀細胞癌與一般的胃癌相同,高齡是生存不良的重要危險因素,并且隨著年齡的增長,胃癌死亡的風險顯著增加[13]。盡管老年患者預后較差,但年輕患者的發病率較高,這一特性與顯性基因疾病相似[14]。
婚姻狀況對胃鱗狀細胞癌患者預后方面無顯著影響。不過在一般的胃癌研究中,婚姻狀況會影響患者的預后[15-17]。根據經驗,筆者認為,這種差異是因為婚姻狀況通過影響內分泌增加胃腺癌的發生率,而胃鱗狀細胞癌的發生與內分泌無關。
Dong 等[18]的研究結果表明,腫瘤分期是胃癌的獨立預后因素。有研究[19]的單因素分析結果顯示,腫瘤 T 分期、浸潤深度、遠處轉移和 pTNM 分期為胃癌預后的不良因素;多因素分析結果顯示,腫瘤 T 分期、遠處轉移和 pTNM 分期均為影響胃癌預后的獨立危險因素。王胤奎等[20]的單中心數據分析發現,殘胃癌的病理 T 分期是預后的獨立影響因素。但是本研究結果表明,單因素分析中 T 分期是預后影響因素,但多因素分析中 T 分期不是獨立的影響因素。此外,N 分期對胃癌患者的預后有重要意義[21],但對胃鱗狀細胞癌患者的預后沒有太大影響[22-23],這可能是胃鱗狀細胞癌的特異之處,也可能是因為 TNM 分期的第 7 版在預測胃鱗狀細胞癌的預后方面還不夠好。因此,需要開發更可靠的預測模型指導疾病的治療,這也是本研究構建列線圖的動機之一。
本研究結果表明,胃鱗狀細胞癌在許多方面與當前對胃癌的認識是一致的。Yoshikawa[24]的研究詳細介紹了原發部位的影響。本研究結果表明,胃賁門部的原發鱗狀細胞癌最多(87.4%),其他部位的鱗狀細胞癌樣本量很小,需要進一步研究。另外,原發部位不同的患者預后不同,提示這些部位之間存在差異。一些研究人員支持胃賁門鱗狀細胞癌是一種食管癌[25],通過比較胃賁門鱗狀細胞癌和食管下段鱗狀上皮細胞瘤之間的差異,或許可以獲得更準確的結論。
目前尚無關于如何治療這種疾病的共識[26]。然而先前的研究[27]表明,根治性手術切除可以明顯改善胃鱗狀細胞癌的預后。在本研究中,63 例接受手術的胃鱗狀細胞癌患者的中位生存時間為 18 個月,比未接受手術患者的中位生存時間更長(5 個月),這符合一般的臨床認知。
3.3 列線圖
對于惡性腫瘤,治療和預后一直是醫生和患者非常關注的問題。在本研究中,T 分期和 N 分期均沒有獨立的預測價值,TNM 分期不能滿足胃鱗狀細胞癌患者的預后評估需求。必須建立準確的預測模型以幫助醫生評估患者狀況。因此基于 SEER 數據庫,本研究開發了預測模型并繪制出列線圖,為判斷胃鱗狀細胞癌患者的預后提供了更準確和適用的評估系統。C-index 結果表明,本研究構建的列線圖在預測準確性方面表現良好。此外,本研究的校準曲線同樣顯示出列線圖預測與實際生存之間有較好的一致性。
3.4 研究局限性
需要聲明的是,本研究存在一些局限性。首先,本研究排除了一些隨訪信息缺失的病例,這可能導致預測模型的偏差。其次,SEER 數據庫未記錄遺傳信息和干預措施,包括家族史、基因組狀態、體質量和吸煙,如果能納入這些信息和干預措施,模型的預測準確性也許能夠提高。第三,盡管化學療法、放射療法、內分泌療法和靶向療法都記錄在 SEER 數據庫中,但由于數據不完整和患者治療意愿導致的偏差,未將這些信息納入模型。第四,本研究是一項基于臨床大數據的回顧性分析,研究的性質決定了它的局限性,只有通過前瞻性隊列研究才可以更好地驗證模型預測的準確性。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:張嘯天負責數據分析和論文主體撰寫,程志遠和張子凡負責數據獲取及論文撰寫,張玲、林寒、辛磊、王天驕、孟茜茜和馬佳怡完成了數據整理、校驗和論文修訂,王洛偉設計并指導了課題。
胃癌是世界上第四大最常見的惡性腫瘤,也是第四大惡性腫瘤死因[1]。原發性胃鱗狀細胞癌是預后較差的特殊組織類型之一[2],必須依靠病理學檢查才能確診,且胃鏡活檢的確診率低[3]。胃鱗狀細胞癌的發病機制尚不清楚[2]。胃鱗狀細胞癌是由于胃黏膜上皮在慢性炎癥基礎上發生鱗狀化生,或是原發性胃腺癌中鱗狀成分過度增生而形成的,其占所有胃癌的 0.04%~0.07%[4],這使得其流行病學特征難以總結,并且也是制定醫學指南的主要障礙。監視、流行病學和最終結果(Surveillance,Epidemiology,and End Results,SEER)數據庫從美國多個醫療中心收集數據,提供了大量罕見惡性腫瘤的患者信息,為罕見病例的流行病學研究提供了足夠的樣本[5]。本研究使用 SEER 數據庫對胃鱗狀細胞癌進行統計學分析,探討影響胃鱗狀細胞癌生存期的預后因素,以幫助醫生確定患者的狀況,探索胃癌預后的潛在干預措施,為胃鱗狀細胞癌的治療方案提供設計依據,此外還建立了相對可靠的預測模型并繪制成列線圖,以幫助個性化治療。
1 資料和方法
1.1 資源來源
使用 SEER Stat 軟件(版本 8.3.5)獲取 SEER 數據庫中 2004–2015 年期間被診斷為原發性胃鱗狀細胞癌的患者信息。
1.2 病例篩選
納入標準:① 診斷年份為 2004–2015 年;② 病理確診為原發性胃鱗狀細胞癌;③ 臨床資料完整,包括年齡、性別、種族、婚姻狀況、原發部位、是否手術、組織學類型、病理分級、腫瘤 TNM 分期和存活時間。排除標準:① 臨床資料缺失或不完整;② 存活時間未知的病例;③ 首發原發癌不是胃鱗狀細胞癌。
共篩選出 199 例符合要求的病例,年齡 25~92 歲,中位年齡為 65 歲。男 150 例,女 49 例,男女比為 3∶1,其中發生肝、肺、骨和腦轉移的患者數量分別為 23、8、7 和 0 例。本組無分級為Ⅳ級的患者,多數(54.3%)患者為Ⅲ級。在組織學類型中,最常見是鱗狀細胞癌(87.9%),最罕見的類型是梭形細胞型鱗狀細胞癌。其他臨床特征見表 1。

1.3 統計學方法
對于年齡,本研究使用 X-tile 軟件確定該年齡的最佳截斷值為 75 歲。通過 SPSS 25.0 和 log-rank 法分析胃鱗狀細胞癌的預后因素。根據單因素分析結果和專業認知選擇變量引入 Cox 比例風險回歸模型進行多因素分析,得出影響胃鱗狀細胞癌預后的獨立因素。使用 R studio 軟件將模型可視化,繪制成列線圖。使用 C-index 評估構建的列線圖的預測效果。使用 1 000 次重采樣繪制校正曲線,以完成列線圖的內部驗證。C-index 的最大值為 1,表示 100% 的預測精度,最小值為 0.5。檢驗水準 α=0.05。
2 結果
本組所有患者獲訪 1~129 個月,中位隨訪時間為 31 個月。本組患者的中位生存時間為 8 個月[95%CI 為(4.985,11.015)]。
2.1 預后單因素分析
本組患者的 1、3 和 5 年累積生存率分別為 40.7%、22.4% 和 15.4%。年齡、原發部位、種族、手術、病理分級、T 分期和 M 分期與患者的生存時間相關(P<0.05),見表 1 和圖 1a–1g。

a–g:不同年齡(a)、種族(b)、原發部位(c)、手術(d)、病理分級(e)、T 分期(f)和 M 分期(g)患者的生存曲線;h:預測胃鱗狀細胞癌的 1 年和 3 年生存率的列線圖,原發部位中0 表示賁門、1 表示胃底、2 表示胃體、3 表示胃竇、4 表示胃小彎、5 表示胃大彎、6 表示胃重疊病灶、7 表示病灶部位未知;i 和 j:列線圖的 1 年校準曲線(i)和 3 年校準曲線(j),x 軸顯示的是列線圖預測的生存率,y 軸顯示的是使用 Kaplan-Meier 方法估算的實際生存率
2.2 預后多因素分析
將表 1 中的所有變量引入 Cox 比例風險回歸模型進行多因素分析。結果顯示:年齡 [HR=1.831,95%CI 為(1.289,2.601)]、原發部位 [HR=1.105,95%CI 為(1.019,1.199)]、M 分期 [HR=2.222,95%CI 為(1.552,3.179)] 和手術 [HR=0.561,95%CI 為(0.377,0.835)] 是影響患者生存的獨立預后因素(表 2)。

2.3 預測模型列線圖的開發和驗證
根據多因素分析結果,構造列線圖。由每個變量計算得出的加權總分,估算對應的 1 年和 3 年總生存率(圖 1h)。結果 C-index 為 0.700 [95%CI 為(0.696,0.704)],表明模型具有良好的辨別力。校準曲線顯示列線圖預測情況與觀察到的實際情況擬合良好,即預測接近現實(圖 1i 和圖 1j)。
3 討論
3.1 胃鱗狀細胞癌的流行病學數據
胃癌有幾種不同的組織學類型,大多數胃癌患者病理診斷為腺癌,而原發性胃鱗狀細胞癌則非常罕見[6]。由于發病率低以及確診困難,原發性胃鱗狀細胞癌于 1895 年首次被發現,但是直到 1967 年,其診斷標準才首次被正式闡述[7-8]。根據 Patnayak 等[9]的研究,截至 2015 年,全球僅報道了 100 例相關病例。本研究對 199 例胃鱗狀細胞癌患者進行了分析,研究顯示,胃鱗狀細胞癌患者的中位生存時間為 8 個月,1、3 和 5 年生存率分別為 40.7%、22.4% 和 15.4%,明顯低于胃癌的總體水平[10]。大多數患者年齡在 75 歲以下。
3.2 影響胃鱗狀細胞癌預后的因素
本研究的單因素分析結果表明,年齡、種族、原發部位、病理分級、手術、T 分期和 M 分期是胃鱗狀細胞癌預后的影響因素。多因素分析結果表明,年齡、原發部位、手術和 M 分期是預后的獨立影響因素;另一方面,性別、婚姻狀況、組織學類型和 N 分期對患者預后沒有顯著影響。關于胃鱗狀細胞癌預后影響因素的研究很少,因此,本研究將胃鱗狀細胞癌和胃癌整體進行比較分析。
種族是胃腺癌預后的危險因素之一,但不同種族的胃腺癌生存率差異可能只是社會經濟差異的體現[11-12]。在本研究中,胃鱗狀細胞癌與一般的胃癌相同,高齡是生存不良的重要危險因素,并且隨著年齡的增長,胃癌死亡的風險顯著增加[13]。盡管老年患者預后較差,但年輕患者的發病率較高,這一特性與顯性基因疾病相似[14]。
婚姻狀況對胃鱗狀細胞癌患者預后方面無顯著影響。不過在一般的胃癌研究中,婚姻狀況會影響患者的預后[15-17]。根據經驗,筆者認為,這種差異是因為婚姻狀況通過影響內分泌增加胃腺癌的發生率,而胃鱗狀細胞癌的發生與內分泌無關。
Dong 等[18]的研究結果表明,腫瘤分期是胃癌的獨立預后因素。有研究[19]的單因素分析結果顯示,腫瘤 T 分期、浸潤深度、遠處轉移和 pTNM 分期為胃癌預后的不良因素;多因素分析結果顯示,腫瘤 T 分期、遠處轉移和 pTNM 分期均為影響胃癌預后的獨立危險因素。王胤奎等[20]的單中心數據分析發現,殘胃癌的病理 T 分期是預后的獨立影響因素。但是本研究結果表明,單因素分析中 T 分期是預后影響因素,但多因素分析中 T 分期不是獨立的影響因素。此外,N 分期對胃癌患者的預后有重要意義[21],但對胃鱗狀細胞癌患者的預后沒有太大影響[22-23],這可能是胃鱗狀細胞癌的特異之處,也可能是因為 TNM 分期的第 7 版在預測胃鱗狀細胞癌的預后方面還不夠好。因此,需要開發更可靠的預測模型指導疾病的治療,這也是本研究構建列線圖的動機之一。
本研究結果表明,胃鱗狀細胞癌在許多方面與當前對胃癌的認識是一致的。Yoshikawa[24]的研究詳細介紹了原發部位的影響。本研究結果表明,胃賁門部的原發鱗狀細胞癌最多(87.4%),其他部位的鱗狀細胞癌樣本量很小,需要進一步研究。另外,原發部位不同的患者預后不同,提示這些部位之間存在差異。一些研究人員支持胃賁門鱗狀細胞癌是一種食管癌[25],通過比較胃賁門鱗狀細胞癌和食管下段鱗狀上皮細胞瘤之間的差異,或許可以獲得更準確的結論。
目前尚無關于如何治療這種疾病的共識[26]。然而先前的研究[27]表明,根治性手術切除可以明顯改善胃鱗狀細胞癌的預后。在本研究中,63 例接受手術的胃鱗狀細胞癌患者的中位生存時間為 18 個月,比未接受手術患者的中位生存時間更長(5 個月),這符合一般的臨床認知。
3.3 列線圖
對于惡性腫瘤,治療和預后一直是醫生和患者非常關注的問題。在本研究中,T 分期和 N 分期均沒有獨立的預測價值,TNM 分期不能滿足胃鱗狀細胞癌患者的預后評估需求。必須建立準確的預測模型以幫助醫生評估患者狀況。因此基于 SEER 數據庫,本研究開發了預測模型并繪制出列線圖,為判斷胃鱗狀細胞癌患者的預后提供了更準確和適用的評估系統。C-index 結果表明,本研究構建的列線圖在預測準確性方面表現良好。此外,本研究的校準曲線同樣顯示出列線圖預測與實際生存之間有較好的一致性。
3.4 研究局限性
需要聲明的是,本研究存在一些局限性。首先,本研究排除了一些隨訪信息缺失的病例,這可能導致預測模型的偏差。其次,SEER 數據庫未記錄遺傳信息和干預措施,包括家族史、基因組狀態、體質量和吸煙,如果能納入這些信息和干預措施,模型的預測準確性也許能夠提高。第三,盡管化學療法、放射療法、內分泌療法和靶向療法都記錄在 SEER 數據庫中,但由于數據不完整和患者治療意愿導致的偏差,未將這些信息納入模型。第四,本研究是一項基于臨床大數據的回顧性分析,研究的性質決定了它的局限性,只有通過前瞻性隊列研究才可以更好地驗證模型預測的準確性。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:張嘯天負責數據分析和論文主體撰寫,程志遠和張子凡負責數據獲取及論文撰寫,張玲、林寒、辛磊、王天驕、孟茜茜和馬佳怡完成了數據整理、校驗和論文修訂,王洛偉設計并指導了課題。