引用本文: 陳鑫容, 李希, 汪曉東, 李卡. 結直腸癌風險在線預測計算器的臨床應用進展. 中國普外基礎與臨床雜志, 2019, 26(1): 106-109. doi: 10.7507/1007-9424.201805081 復制
基于人群的早期篩查已被顯示能有效降低結直腸癌(colorectal cancer,CRC)的發病率和死亡率[1-3],而準確的風險預測可以提高篩查的效率[4-5],其方法是將高風險患者作為目標進行早期或更頻繁的篩查,比如糞便潛血試驗、糞便脫落細胞檢測、斷層掃描成像、腫瘤生物標志物檢測、腸鏡檢查等[6-9],并對極低風險個體進行延遲或前瞻性篩查。通過將篩查強度和預防措施調整到預測的風險水平,從而提高篩查的效率[10]。鑒于 CRC 的高發病率、高致死率[11]、高經濟負擔率[12]以及篩查試驗的可行性[13],設計預測 CRC 風險的評估模型或評分系統,來估計個體發展成為 CRC 的可能性,能用于幫助醫生和患者確定篩選方案,同時可用于設計預防和干預策略,這是一項非常值得探索的研究。CRC-PRO(Colorectal Cancer Predicted Risk Online)計算器則是由 Wells 等[14]于 2014 年為預測個體 CRC 風險而新開發的工具。筆者將就此工具的概況和應用現狀作一綜述,以分析其在我國可能具有的實用價值。
1 CRC-PRO 的開發背景
研究[15-18]發現,目前用于 CRC 篩查的策略有一定的局限性,由于衛生資源的短缺、檢查費用的負擔、潛在的風險因素以及較低的依從性,國家篩查指南[19]考慮在進行篩查程序之前預測未來無癥狀個體原發 CRC 的風險。一項系統評價[20]分析了 52 種風險模型和 6 項外部驗證研究,共考慮了 87 項不同的風險因素,其結果表明,有多種風險模型可用于預測無癥狀人群發生 CRC 的風險,并且有可能鑒定出患有高風險疾病的個體。此時如果我們能利用風險評估模型準確區分個體患 CRC 的可能性,進而將篩查和預防策略靶向最有可能獲益的人群,同時使疾病低風險的人群免于不必要的直接或間接的篩查程序,這可能會提高 CRC 篩查的成本效益[21],并可減輕對資源需求、結腸鏡檢查能力及依從性的擔憂,在一定程度上緩解了當前的困境。
目前常見的幾種經過獨立人群驗證的 CRC 的風險評估模型有:哈佛癌癥風險指數模型[22]、Freedman’s 模型[4]、亞太 CRC 篩查風險評分系統[23]、MMR 風險評估模型(MMRpro)[24]、Imperiale’s 模型[25]等,此外又基于前兩種模型進一步開發了 CRC 風險計算器。利用哈佛癌癥風險指數模型創建的計算器在一定程度上糾正了其直接使用產生的誤判,但它僅預測結腸癌的風險,這限制了它在臨床上的使用[26]。美國國家癌癥研究所(National Cancer Institute,NCI)利用 Freedman’s 模型創建的計算器[27],可以估計男性和女性患 CRC 的風險,但需要 5~8 min 才能回答所有問題以獲得風險評估。哈佛癌癥風險指數模型和 Freedman’s 模型都是采用病例對照研究的數據創建的,這些研究在實際中很容易出現明顯的偏倚,可能會使計算器在將來應用于無癥狀患者時出現偏差;同時兩者依據的病例對照研究的大多數研究參與者都是白人,故無法估計其他種族或族裔群體的風險[4, 22]。NCI[28]于 2004 年在華盛頓召開的癌癥風險預測模型研討會上建議,風險預測模型應納入更多的少數民族患者,并鼓勵建立新的風險模型,且新模型應簡單易用,所以我們需要一種更精準及更簡易的適用于多民族人群的風險預測工具。CRC-PRO 則是利用來自多民族隊列研究(the multiethnic cohort study,MEC)的數據創建的 10 年 CRC 風險預測計算器,其目的不是評估個體變量和 CRC 風險之間的關系,而是為定制篩選和預防策略而開發的最準確的總體風險預測工具,旨在讓臨床醫生更準確地識別高風險人群,更好地預測 CRC 的風險,從而能夠改善預防策略。
2 CRC-PRO 的建立
2.1 數據的獲取與選擇
MEC 為創建 CRC-PRO 提供了潛在的數據源。Kolonel 等[29]為研究美國少數民族飲食和癌癥的關系,納入了包括 215 251 名生活在夏威夷和加利福尼亞州的成年男性和女性(基線年齡 45~75 歲)人群,其人口分布包括非裔美國人、拉丁裔、日裔美國人、夏威夷原住民、白人和其他民族;患者的隨訪時間長達 11.5 年,失訪率<1%。Wells 等[14]利用此數據源,排除了具有 CRC 或腺瘤性息肉病史的患者,最終樣本量為 180 630 例患者,其中 2 762 例患有 CRC。以下危險因素在 MEC 基線時進行了測量,并作為最終模型中的候選變量:年齡、性別、個人的癌癥史、體質量指數、定期使用阿司匹林、結腸癌家族史、雌激素使用、每日飲酒量、定期使用多種維生素、每天中等或劇烈活動的小時數、種族、糖尿病史、受教育年限、吸煙年限、定期使用非甾體類抗炎藥物(non-steroidal anti-inflammatory drugs,NSAIDs)、每天攝入紅肉量和偏好熟肉。連續變量使用限制性立方樣條建模,并用微積分來描述預測變量與結果之間的非線性關系。由于男性和女性之間潛在的風險差異,研究者[14]決定為他們分別創建單獨的風險計算器。
2.2 數據的統計分析
采用 logistic 向前逐步回歸方法進行變量選擇,發現以下因素與 CRC 的風險顯著相關:年齡、種族、吸煙年限、每日飲酒量、結腸癌家族史、定期使用多種維生素、糖尿病史和定期使用 NSAIDs。只有在針對男性患者的未經校準的分析中,受教育年限和每天中等或劇烈活動的小時數與 CRC 有關,而每天攝入紅肉量、偏好熟肉和雌激素使用僅與女性患有 CRC 有關[14]。
2.3 CRC-PRO 的驗證和校準[5 ]
使用十折交叉驗證對模型進行內部驗證,以評估區分能力(c 統計量)和校準(以圖表評估),結果顯示,對于男性和女性來說,年齡對模型準確性的影響最大;種族/民族是兩性的第二重要變量,而其他變量對于男性和女性的相對重要性不同。最終男性模型包含 12 個變量(年齡、種族、吸煙年限、每日飲酒量、體質量指數、受教育年限、定期使用阿司匹林、結腸癌家族史、定期使用多種維生素、每天攝入紅肉量、糖尿病史和每天中等或劇烈活動的小時數),女性模型包含 11 個變量(年齡、種族、受教育年限、雌激素使用、糖尿病史、吸煙年限、結腸癌家族史、定期使用多種維生素、體質量指數、定期使用 NSAIDs 和每日飲酒量)。基于對建立模型的內部驗證(諾模圖)來確定最終模型的變量系數。
3 CRC-PRO 的特點
3.1 探討 CRC-PRO 的變量選擇
CRC-PRO 模型納入的變量包括已確定的 CRC 危險因素、尚未確立的其他危險因素以及幾種可能的 CRC 保護因素,然后進行合并分析,確立最終模型變量;MEC 的初步調查并沒有詢問結直腸鏡的檢查史,因為在此之前所有人的基線信息是未知的,故此模型也未包括;MEC 不包含有關炎癥性腸病(inflammatory bowel disease,IBD)的信息,雖然這是已知的 CRC 風險因素,但由于其高發病率和特異性,IBD 患者應該接受更積極的篩查和預防策略,并需為此類人群單獨建立指南,將 IBD 患者排除在創建風險計算器之外是理想的選擇;沒有包括詳細的飲食問題,因為某些因素的效用還未證實;在之前的研究中,連續變量經常被分類[30],這會導致信息丟失和預測精度下降,而使用基于計算機的計算器界面則不再需要將其分類[31],保證了其完整性;模型復雜性和預測精確性之間需要達到一定的平衡,該模型僅限于 11 或 12 個變量,因為超出此模型規模的準確性增益微乎其微。
3.2 CRC-PRO 應用的優劣勢
CRC-PRO 計算器簡單易操作,具有很好的預測準確性。且它分別建立男性和女性模型,消除了隱藏的交互效應,納入了多個變量比僅憑單變量的預測模型更準確。由于數據集和變量定義的差異,CRC-PRO 計算器的準確性未能與 NCI 計算器進行比較。理論上,由于 CRC-PRO 計算器依據的樣本量大,進行了前瞻性數據分析以及避免對連續變量進行分類,從 CRC-PRO 計算器獲得的預測值應該比 NCI 模型更準確。MEC 男性患者中 CRC 預計 10 年風險低于 1% 的比例為 29.5%,而女性患者中該比例>48%[14],這表明在臨床上推遲或放棄一些極低風險患者的結腸鏡檢查可能是合理的。對于女性來說更是如此,因為 1 475 例女性患者的預測風險<1% 時至少需達到 65 歲[14]。一些專家已經建議,對于低風險患者,一生一次的結腸鏡篩查可能具有成本效益[32]。
CRC-PRO 計算器是利用來自 MEC 的數據創建的,此前瞻性隊列在種族構成方面是獨一無二的;其次是它對社會階層具有廣泛的代表性,允許跨不同人群進行有效比較,且采用隊列研究避免了回憶偏倚。但是現在還尚未有其他使用 CRC-PRO 工具的研究,對于此計算器的可行性、有效性、實用性、臨床效果、成本效益等積極影響和負面作用還未確定。此工具旨在能夠幫助改善個體患 CRC 風險的評估,并鼓勵使用絕對風險閾值進行決策,但對于這種改進的預測還未確定其確切的影響。
4 CRC-PRO 的推廣與展望
在中國使用的 CRC 風險預測工具大多數是篩查評分系統[33-35],根據某些危險因素評分后對患者進行風險分級,再對不同風險級別的患者采取相應的策略,這種方式在處理時會忽略一部分信息,且不能明確給出風險概率值,其精準度似乎還不能達到滿意的效果。CRC-PRO 在中國進行試用可能具有一定的實用價值,此工具不僅能具體給出風險概率值,而且簡單易操作,但是基于地域的差異,在 CRC-PRO 的推廣中,需要開展多中心研究,以在更多不同的人群中進行更廣泛的臨床分析驗證,進一步擴展此工具的應用范圍。
基于人群的早期篩查已被顯示能有效降低結直腸癌(colorectal cancer,CRC)的發病率和死亡率[1-3],而準確的風險預測可以提高篩查的效率[4-5],其方法是將高風險患者作為目標進行早期或更頻繁的篩查,比如糞便潛血試驗、糞便脫落細胞檢測、斷層掃描成像、腫瘤生物標志物檢測、腸鏡檢查等[6-9],并對極低風險個體進行延遲或前瞻性篩查。通過將篩查強度和預防措施調整到預測的風險水平,從而提高篩查的效率[10]。鑒于 CRC 的高發病率、高致死率[11]、高經濟負擔率[12]以及篩查試驗的可行性[13],設計預測 CRC 風險的評估模型或評分系統,來估計個體發展成為 CRC 的可能性,能用于幫助醫生和患者確定篩選方案,同時可用于設計預防和干預策略,這是一項非常值得探索的研究。CRC-PRO(Colorectal Cancer Predicted Risk Online)計算器則是由 Wells 等[14]于 2014 年為預測個體 CRC 風險而新開發的工具。筆者將就此工具的概況和應用現狀作一綜述,以分析其在我國可能具有的實用價值。
1 CRC-PRO 的開發背景
研究[15-18]發現,目前用于 CRC 篩查的策略有一定的局限性,由于衛生資源的短缺、檢查費用的負擔、潛在的風險因素以及較低的依從性,國家篩查指南[19]考慮在進行篩查程序之前預測未來無癥狀個體原發 CRC 的風險。一項系統評價[20]分析了 52 種風險模型和 6 項外部驗證研究,共考慮了 87 項不同的風險因素,其結果表明,有多種風險模型可用于預測無癥狀人群發生 CRC 的風險,并且有可能鑒定出患有高風險疾病的個體。此時如果我們能利用風險評估模型準確區分個體患 CRC 的可能性,進而將篩查和預防策略靶向最有可能獲益的人群,同時使疾病低風險的人群免于不必要的直接或間接的篩查程序,這可能會提高 CRC 篩查的成本效益[21],并可減輕對資源需求、結腸鏡檢查能力及依從性的擔憂,在一定程度上緩解了當前的困境。
目前常見的幾種經過獨立人群驗證的 CRC 的風險評估模型有:哈佛癌癥風險指數模型[22]、Freedman’s 模型[4]、亞太 CRC 篩查風險評分系統[23]、MMR 風險評估模型(MMRpro)[24]、Imperiale’s 模型[25]等,此外又基于前兩種模型進一步開發了 CRC 風險計算器。利用哈佛癌癥風險指數模型創建的計算器在一定程度上糾正了其直接使用產生的誤判,但它僅預測結腸癌的風險,這限制了它在臨床上的使用[26]。美國國家癌癥研究所(National Cancer Institute,NCI)利用 Freedman’s 模型創建的計算器[27],可以估計男性和女性患 CRC 的風險,但需要 5~8 min 才能回答所有問題以獲得風險評估。哈佛癌癥風險指數模型和 Freedman’s 模型都是采用病例對照研究的數據創建的,這些研究在實際中很容易出現明顯的偏倚,可能會使計算器在將來應用于無癥狀患者時出現偏差;同時兩者依據的病例對照研究的大多數研究參與者都是白人,故無法估計其他種族或族裔群體的風險[4, 22]。NCI[28]于 2004 年在華盛頓召開的癌癥風險預測模型研討會上建議,風險預測模型應納入更多的少數民族患者,并鼓勵建立新的風險模型,且新模型應簡單易用,所以我們需要一種更精準及更簡易的適用于多民族人群的風險預測工具。CRC-PRO 則是利用來自多民族隊列研究(the multiethnic cohort study,MEC)的數據創建的 10 年 CRC 風險預測計算器,其目的不是評估個體變量和 CRC 風險之間的關系,而是為定制篩選和預防策略而開發的最準確的總體風險預測工具,旨在讓臨床醫生更準確地識別高風險人群,更好地預測 CRC 的風險,從而能夠改善預防策略。
2 CRC-PRO 的建立
2.1 數據的獲取與選擇
MEC 為創建 CRC-PRO 提供了潛在的數據源。Kolonel 等[29]為研究美國少數民族飲食和癌癥的關系,納入了包括 215 251 名生活在夏威夷和加利福尼亞州的成年男性和女性(基線年齡 45~75 歲)人群,其人口分布包括非裔美國人、拉丁裔、日裔美國人、夏威夷原住民、白人和其他民族;患者的隨訪時間長達 11.5 年,失訪率<1%。Wells 等[14]利用此數據源,排除了具有 CRC 或腺瘤性息肉病史的患者,最終樣本量為 180 630 例患者,其中 2 762 例患有 CRC。以下危險因素在 MEC 基線時進行了測量,并作為最終模型中的候選變量:年齡、性別、個人的癌癥史、體質量指數、定期使用阿司匹林、結腸癌家族史、雌激素使用、每日飲酒量、定期使用多種維生素、每天中等或劇烈活動的小時數、種族、糖尿病史、受教育年限、吸煙年限、定期使用非甾體類抗炎藥物(non-steroidal anti-inflammatory drugs,NSAIDs)、每天攝入紅肉量和偏好熟肉。連續變量使用限制性立方樣條建模,并用微積分來描述預測變量與結果之間的非線性關系。由于男性和女性之間潛在的風險差異,研究者[14]決定為他們分別創建單獨的風險計算器。
2.2 數據的統計分析
采用 logistic 向前逐步回歸方法進行變量選擇,發現以下因素與 CRC 的風險顯著相關:年齡、種族、吸煙年限、每日飲酒量、結腸癌家族史、定期使用多種維生素、糖尿病史和定期使用 NSAIDs。只有在針對男性患者的未經校準的分析中,受教育年限和每天中等或劇烈活動的小時數與 CRC 有關,而每天攝入紅肉量、偏好熟肉和雌激素使用僅與女性患有 CRC 有關[14]。
2.3 CRC-PRO 的驗證和校準[5 ]
使用十折交叉驗證對模型進行內部驗證,以評估區分能力(c 統計量)和校準(以圖表評估),結果顯示,對于男性和女性來說,年齡對模型準確性的影響最大;種族/民族是兩性的第二重要變量,而其他變量對于男性和女性的相對重要性不同。最終男性模型包含 12 個變量(年齡、種族、吸煙年限、每日飲酒量、體質量指數、受教育年限、定期使用阿司匹林、結腸癌家族史、定期使用多種維生素、每天攝入紅肉量、糖尿病史和每天中等或劇烈活動的小時數),女性模型包含 11 個變量(年齡、種族、受教育年限、雌激素使用、糖尿病史、吸煙年限、結腸癌家族史、定期使用多種維生素、體質量指數、定期使用 NSAIDs 和每日飲酒量)。基于對建立模型的內部驗證(諾模圖)來確定最終模型的變量系數。
3 CRC-PRO 的特點
3.1 探討 CRC-PRO 的變量選擇
CRC-PRO 模型納入的變量包括已確定的 CRC 危險因素、尚未確立的其他危險因素以及幾種可能的 CRC 保護因素,然后進行合并分析,確立最終模型變量;MEC 的初步調查并沒有詢問結直腸鏡的檢查史,因為在此之前所有人的基線信息是未知的,故此模型也未包括;MEC 不包含有關炎癥性腸病(inflammatory bowel disease,IBD)的信息,雖然這是已知的 CRC 風險因素,但由于其高發病率和特異性,IBD 患者應該接受更積極的篩查和預防策略,并需為此類人群單獨建立指南,將 IBD 患者排除在創建風險計算器之外是理想的選擇;沒有包括詳細的飲食問題,因為某些因素的效用還未證實;在之前的研究中,連續變量經常被分類[30],這會導致信息丟失和預測精度下降,而使用基于計算機的計算器界面則不再需要將其分類[31],保證了其完整性;模型復雜性和預測精確性之間需要達到一定的平衡,該模型僅限于 11 或 12 個變量,因為超出此模型規模的準確性增益微乎其微。
3.2 CRC-PRO 應用的優劣勢
CRC-PRO 計算器簡單易操作,具有很好的預測準確性。且它分別建立男性和女性模型,消除了隱藏的交互效應,納入了多個變量比僅憑單變量的預測模型更準確。由于數據集和變量定義的差異,CRC-PRO 計算器的準確性未能與 NCI 計算器進行比較。理論上,由于 CRC-PRO 計算器依據的樣本量大,進行了前瞻性數據分析以及避免對連續變量進行分類,從 CRC-PRO 計算器獲得的預測值應該比 NCI 模型更準確。MEC 男性患者中 CRC 預計 10 年風險低于 1% 的比例為 29.5%,而女性患者中該比例>48%[14],這表明在臨床上推遲或放棄一些極低風險患者的結腸鏡檢查可能是合理的。對于女性來說更是如此,因為 1 475 例女性患者的預測風險<1% 時至少需達到 65 歲[14]。一些專家已經建議,對于低風險患者,一生一次的結腸鏡篩查可能具有成本效益[32]。
CRC-PRO 計算器是利用來自 MEC 的數據創建的,此前瞻性隊列在種族構成方面是獨一無二的;其次是它對社會階層具有廣泛的代表性,允許跨不同人群進行有效比較,且采用隊列研究避免了回憶偏倚。但是現在還尚未有其他使用 CRC-PRO 工具的研究,對于此計算器的可行性、有效性、實用性、臨床效果、成本效益等積極影響和負面作用還未確定。此工具旨在能夠幫助改善個體患 CRC 風險的評估,并鼓勵使用絕對風險閾值進行決策,但對于這種改進的預測還未確定其確切的影響。
4 CRC-PRO 的推廣與展望
在中國使用的 CRC 風險預測工具大多數是篩查評分系統[33-35],根據某些危險因素評分后對患者進行風險分級,再對不同風險級別的患者采取相應的策略,這種方式在處理時會忽略一部分信息,且不能明確給出風險概率值,其精準度似乎還不能達到滿意的效果。CRC-PRO 在中國進行試用可能具有一定的實用價值,此工具不僅能具體給出風險概率值,而且簡單易操作,但是基于地域的差異,在 CRC-PRO 的推廣中,需要開展多中心研究,以在更多不同的人群中進行更廣泛的臨床分析驗證,進一步擴展此工具的應用范圍。