引用本文: 汪曉東, 劉健博, 安麗珉, 何欣林, 李立. 數據庫建設第四部分:結直腸癌的術前專科檢查與評估的標簽與結構化. 中國普外基礎與臨床雜志, 2019, 26(11): 1337-1341. doi: 10.7507/1007-9424.201909057 復制
續前系列研究,本團隊對華西腸癌數據庫(Database from Colorectal Cancer,DACCA)的構建基本思路進行了總體闡述,并對個人數據、住院管理流程、術前內外科合并癥等也進行了前序的闡述和報道[1-5]。承接《中國普外基礎與臨床雜志》第 10 期發表的“數據庫研究第四部分:結直腸癌的術前專科檢查和評估”所做的研究報道,筆者現將對華西 DACCA 中的術前專科檢查及評估細節的具體概念、標簽與結構化進行詳細的闡述。
1 結直腸癌術前專科檢查模塊的構成
1.1 定義
在華西 DACCA 中,選擇作為結直腸癌術前專科檢查源數據的項目包括:腸鏡、CT、MRI、腔內超聲、肝臟超聲、骨掃描和 PET-CT 檢查。
1.1.1 腸鏡
此包括全結直腸鏡(colonoscopy)、乙狀結腸鏡(sigmoidoscopy)和直腸鏡(proctoscopy)[6]。若患者在任何醫院完成了腸鏡檢查且只有一份腸鏡報告時,則以此報告為信息的數據來源;若患者在多家醫院完成了腸鏡檢查時,則選擇醫院級別最高者作為信息的數據來源。術前腸鏡的結果,需要根據腸鏡的圖像、報告、是否完整進行全結直腸檢查以及對應的病理活檢結果,將其信息拆分后保留為相應的各類數據,如術前腸鏡的信息,在華西 DACCA 中會被拆分為“活檢腫瘤性質(nature of tumorby biopsy)”、“活檢腫瘤分化程度(differentiation gradeof tumor by biopsy)”、“腸鏡是否完成(complete ofcolonoscopy)”等幾個數據列。
1.1.2 CT 檢查
此包括了腹部、胸部、頭部等部位的 CT 檢查結果[7-9]。若患者的 CT 檢查既有增強又有平掃檢查,則以增強檢查的結果為準。若患者有多家醫院的 CT 檢查結果,則選擇醫院級別最高者作為信息的數據來源。CT 檢查的結果劃分為總的 CT 分期結果和單列的胸部 CT 分期結果,并以分期作為保存信息。
1.1.3 MRI 檢查
此是針對腹部、盆腔的 MRI 檢查結果[10-11]。若患者的 MRI 檢查有增強和普通檢查,則以增強檢查的結果為準。針對直腸癌的判斷中,若同時有“下腹部+盆腔檢測”和“盆腔直腸專科檢測”時,則以“盆腔直腸專科檢測”的結果為準。若患者有多家醫院的 MRI 檢查,則選擇醫院級別最高者作為信息來源。MRI 檢查的結果只針對總的 MRI 分期結果。若 MRI 檢查不完善如只有上腹部 MRI 檢查,則以已有的檢查作分期判斷或者部分型分期判斷。
1.1.4 腔內超聲
此是專門針對直腸癌患者的檢查結果[12-15]。要求必須為來自經直腸腔內的超聲檢查,不能為單純經肛周進行的檢查。直腸腔內超聲的檢查結果,只選取其對于 T 和 N 分期的判斷。
1.1.5 肝臟超聲
此是專門針對可疑肝臟轉移的結直腸癌患者的檢查結果[16-17]。要求必須有增強超聲的結果,其結果只選取其對于肝臟部位的 M 分期的判斷。
1.1.6 骨掃描
此是指患者在手術前進行的該項檢查結果[18],結果的判斷以是否提示有“骨轉移”為標準,不對判斷骨良性疾病作為判斷。
1.1.7 PET-CT
此是指患者在手術前進行的檢查[19-20],結果只選取其對于 M 分期的判斷。
1.2 分期
華西 DACCA 中的分期,根據術前檢查評估的效能分別需要記錄不同的分期信息。其中術前 CT 和術前 MRI 檢查需要有完整的 TNM 分期,分期的原則參照文獻[21-23]報道的方法,分期的結果按照 TNM 分期格式記錄并分別保存在術前 CT 和術前 MRI 的數據列內。
1.2.1 部分型分期
此主要是針對直腸腔內超聲、肝臟超聲、骨掃描及 PET-CT 的結果。① 直腸腔內超聲重點用于評價 T 分期和 N 分期,其分期的原則參照文獻[24]報道的方法,在數據列中直接保留為 TN 分期的格式。② 肝臟超聲用于評價肝臟轉移相關的 M 分期,其分期時按照“無肝轉移為 M0、可疑肝轉移為 M1ax、確定肝轉移為 M1a”判斷。③ 骨掃描用于評價遠處骨轉移相關的 M 分期,分期時按照“無骨轉移為 M0、可疑骨轉移為 M1ax、確定骨轉移為 M1a”判斷。④ PET-CT 用于評價遠處轉移相關的 M 分期,分期時按照“無遠處轉移為 M0、可疑遠處轉移為 Mx(其中單發轉移為 M1ax,多發轉移為 M1bx)、確定遠處單發轉移為 M1a、確定遠處多發轉移為 M1b”判斷。
1.2.2 綜合分期
華西 DACCA 中的綜合分期,是指結合了包括術前 CT、MRI、直腸腔內超聲、肝臟超聲、骨掃描和 PET-CT 所有可以提供的影像學分期,以及術前腸鏡、臨床癥狀和指檢后給出的綜合評價的分期。按照 A、B、C、D 對其嚴重程度進行分級,A 級等同于“早期”,B 級等同于“中期”,C 級等同于“中晚期”,D 級等同于“晚期”。此分級不同于 Dukes 分期體系[25]。
1.3 準確性
準確性是華西 DACCA 中帶有的評價功能,需要結直腸癌專科醫生背景的數據人員對于與臨床表現推論的結果進行效果判斷。準確性是指當術前對于結直腸癌患者的分期進行劃分后,最終實際上與術后綜合病理分期的符合程度,也可以描述為“契合度”。華西 DACCA 中的所有術前評估結果都需要有準確性判斷,包括術前 CT、MRI、直腸腔內超聲、肝臟超聲、骨掃描、PET-CT、腸鏡檢查結果以及綜合分期判斷。準確性的判斷按照“準確”、“低估”和“高估”的方式進行分類。
1.4 標簽與結構化
1.4.1 檢查結果標簽
① 華西 DACCA 中的“腸鏡”數據列中,華西醫院出具的腸鏡結果標記為“內”,非華西醫院出局的腸鏡結果標記為“外”。無論哪家醫院提供的腸鏡結果,由于任何原因腸鏡沒有做完全者(即腸鏡沒有最終做到回盲部)都標記為“未”[26-29]。“活檢”數據列是指腸鏡下“活檢腫瘤性質”,數據的標簽保存為一串文字形式,其中文字的內容以腸鏡所得的活檢結果為準,但是只保留病理性質的描述,如“腺癌”、“黏液腺癌”等;若沒有活檢結果者,則標記為“x”。“分化”數據列是指腸鏡下活檢的惡性腫瘤的“分化程度”,數據的標簽保存為文本“G”+數字的形式,如高分化為“G1”,中分化為“G2”,低分化為“G3”;若沒有分化程度的描述,則標記為“x”。② 華西 DACCA 中,對于術前 CT、MRI、直腸腔內超聲、肝臟超聲、骨掃描和 PET-CT 的結果都轉換為分期進行標記。按照前面分期的原則轉換后,按照“T?N?”或“T?N?M?”或“M?”的方式保留一串“字母+數值”的文本。標簽中不含有“分期”字樣,即分期中無中文文字出現。
1.4.2 檢查結果評估執行標簽
華西 DACCA 中術前檢查執行情況的數據標簽方式,首先需要根據是否有此項信息進行區分,若有可查閱出術前檢查相關信息者,則可以進行數據框內的標記,如為未檢查者標記為“x”,如為未檢查且評價為應該檢查者標記為“xg”。若無可查閱出術前檢查相關信息者,則在數據框內不做任何標記,數據留空(blank)。此外,單獨針對骨掃描和 PET-CT,由于二者只提供 M 分期,因此,在這種部分型分期前對分期進行概括型標記,如部分型分期判斷為“正常”則標記為“0”、“可疑”標記為“1”、“轉移確定”標記為“2”。每個數據框內會包含多項數據信息,每個信息之間用連字符號“-”連接,如骨掃描檢查評估后判斷為有轉移,則在數據框內填寫“2-M1a”,表示“轉移確定的遠處單發轉移”。
1.4.3 檢查結果準確性標簽
華西 DACCA 中,需要對于準確性進行標簽化。針對有術前 TNM 完整分期和 TN 分期的術前檢查評估,包括術前 CT、MRI、直腸腔內超聲、肝臟超聲的部分型分期以及綜合分期,都需要標記準確性,如準確性為“準確”者標記為“0”、“低估”者標記為“1”、“高估”者標記為“2”。每個數據框內會包含多項數據信息,每個信息之間用連字符號“-”連接,如術前 CT 檢查評估后判斷為 T3N0M0 且經過術后綜合病理分期核對后的準確度一致者,則在數據框內填寫為“0-T3N0M0”,表示“術前 CT 判斷 T3N0M0 是準確的”。
1.4.4 結構化
所有術前檢查評估的數據框內,都以完整的標簽化數據為填寫內容。根據數據庫具備的自動提取功能,則以功能替代數據列的增加。整個數據框內的信息,都在標簽基礎上作為文本型結構化。
1.5 糾錯
華西 DACCA 中,針對術前檢查評估的糾錯,主要包括錄入錯誤糾正和判斷糾正。糾錯主要針對數據錄入過程的填寫,避免錯誤輸入;在需要進行轉換后再輸入數據者,還應該避免轉換錯誤,也就是一旦需要分期的數據,首先需要分期無誤后填寫才會無誤,需要嚴格按照分期標準進行。在數據庫智能化應用過程中,整個分期數據可以自動換算,能避免整個分期錯誤的問題。而在人工智能的角度上看,分期可以直接通過 CT 或者 MRI 的影像組學基礎解決,分期更為精確。華西 DACCA 中有準確度判斷的數據,錯誤糾正可以在術后隨訪開始前通過再次審核數據時進行,以確保分期對比準確度無誤,特別是針對“低估”和“高估”的情況。
2 結直腸癌的術前綜合評價
2.1 定義
在華西 DACCA 中結直腸癌的術前綜合評價由“綜合分期”和“診斷強度”兩項數據列聯合判斷。其中“綜合分期”已如前述;而診斷強度(diagnostic intensity)是指結直腸癌患者初診后,完善相關術前腸鏡以準備為下一步治療做出決策時所具備的“確診結直腸癌”的價值強度,強度越高,越提示術前準備得越完善,決策依據越充分。
按照術前檢查評估的完善程度分為 A、B、C 級,其中 A 級表示術前檢查一定包括了本院(華西醫院)或者其他三甲醫院完整的腸鏡+病理結果陽性(即病理診斷結直腸惡性腫瘤);B 級表示術前檢查一定有本院(華西醫院)腸鏡,但是病理結果懷疑為結直腸惡性腫瘤而臨床癥狀又明確提示陽性,如肛門指檢捫及惡性腫瘤的占位、腹部捫及腫塊等;C 級表示在術前評估過程中,對于結直腸惡性腫瘤的診斷幾乎脫離了腸鏡,而主要依靠臨床指檢、影像、癌胚抗原(CEA)等非金標準的評估項目作為評價,完全沒有病理依據,甚至部分患者需要在術中進行快速冰凍病理檢查[30]以再次確定。
2.2 標簽與結構化
華西 DACCA 中,對于“綜合分期”的標簽和結構化,在前面已描述。針對“診斷強度”,由于有明確的分級,在華西 DACCA 中則將 A 級診斷強度標記為“A”、B 級診斷強度標記為“B”、C 級診斷強度標記為“C ”。在數據庫結構化中,將標簽的信息按照短文本形式進行保留。
2.3 糾錯
華西 DACCA 中針對“綜合分期”需要考慮的上述糾錯需求外,針對“診斷強度”則需要重點采用復核的形式進行糾錯。由于結直腸癌患者在初診后開始決策治療方案前有足夠的時間建立術前評估準備,則需要對于評估中的腸鏡信息進行詳細核實,并綜合判斷腸鏡下的病理報告描述部分以及是否有可以聯合判斷用的臨床癥狀。
3 結直腸癌術前初診臨床因素與誤診誤治的設定
3.1 術前初診臨床因素
3.1.1 定義
術前初診臨床因素,在華西 DACCA 中,以縮寫為“臨床”二字作為數據列標題。這里的術前初診臨床因素是指,患者在確診或者高度懷疑為結直腸癌前,因何種原因開始疾病的診斷,也可以理解為就診原因,或者部分信息可以近似于醫院信息系統(hospital information system,HIS)中采集患者主訴和病史的內容。根據目前華西 DACCA 中的數據情況,主要包含的術前初診臨床因素有:腸道癥狀(如便血、梗阻等)、無癥狀腹部包塊以及由于篩查所發現。其中,篩查可能的因素又包括:體檢(實驗室檢查異常)、肛門指檢、由于家族史所發起的篩查等。
3.1.2 標簽與結構化
華西 DACCA 中,術前初診臨床因素屬于可以增加的新類型的數據列,以短文本作為數據的結構化處理。其中,已經有的“術前初診臨床因素”,如前述,則直接文字描述在數據框內,但是不需要寫詳細的初診后情況,如 HIS 中可以描述為“便血 3 個月、外院腸鏡提示直腸占位 5 d”,在 DACCA 數據框內,只需要保留“癥狀”二字。
3.1.3 糾錯
華西 DACCA 中,對于“術前初診臨床因素”的糾錯,主要還是與 HIS 中的主訴與病史進行核對。若患者病史較長,仍需要追溯到最早的“臨床因素”,需要與臨床過程中床旁追問病史相結合。由于“術前初診臨床因素”會關聯到后續的“誤診與誤治”、術前“診斷強度”等信息,因此尤為重要,也是華西 DACCA 反饋結直腸癌篩查信息的重要數據列。
3.2 誤診與誤治
3.2.1 定義
華西 DACCA 中,對結直腸癌患者是否出現“誤診”和“誤治”進行了判斷,該信息無法通過 HIS 直接獲取,多數情況下仍需要通過對于病史的判斷,以確定是否屬于“誤診”和“誤治”。其中“誤診”是指結直腸癌患者在確診前,由于首先診斷為其他的疾病。“誤治”是指由于診斷為其他的疾病后并開始對應的治療,在治療后期才發現應考慮為結直腸癌并治療;“誤治”還包括患者已經診斷為結直腸癌,但是因為個人原因或者其他因素導致患者開始治療的時間不是在確診結直腸癌后的即刻。“誤診”和“誤治”需要與前述的“術前初診臨床因素”相結合,由于兩者需要展示的信息是不同的,因此,在華西 DACCA 中對此進行了分列,后者的數據列標題為“誤治和誤治”。
3.2.2 標簽與結構化
華西 DACCA 中,“誤診和誤治”屬于可以增加的新類型的數據列,以短文本作為數據的結構化處理。“誤診和誤治”用文字直接描述,若為誤診或者誤治為某種疾病以及對應的治療程序,可以直接縮略性描述,如“患者因考慮痔瘡行相關治療而效果不佳,經腸鏡檢查后發現直腸癌”時則只需要記錄“痔瘡”;若由于“痔瘡”治療時間過長而延誤了直腸癌的治療,如“痔瘡治療后半年……”時則需要記錄為“痔瘡,6 個月”。按照數據記錄的格式,“誤診”和“誤治”文字可以用英文符號“,”分隔。
3.2.3 糾錯
華西 DACCA 中,對于“誤診和誤治”的糾錯,也需要對 HIS 中的主訴與病史進行核對。追溯“誤診和誤治”的關鍵還是原因和時間兩個點,先確定可能存在的臨床癥狀和就診原因,判斷是不是屬于“誤診”,再判斷這些“誤診”是否存在有“誤治”的情況。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:汪曉東負責本文的主要撰寫工作及修改;劉健博、安麗珉和何欣林共同負責本文的部分撰寫工作和參考文獻引用;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員。
續前系列研究,本團隊對華西腸癌數據庫(Database from Colorectal Cancer,DACCA)的構建基本思路進行了總體闡述,并對個人數據、住院管理流程、術前內外科合并癥等也進行了前序的闡述和報道[1-5]。承接《中國普外基礎與臨床雜志》第 10 期發表的“數據庫研究第四部分:結直腸癌的術前專科檢查和評估”所做的研究報道,筆者現將對華西 DACCA 中的術前專科檢查及評估細節的具體概念、標簽與結構化進行詳細的闡述。
1 結直腸癌術前專科檢查模塊的構成
1.1 定義
在華西 DACCA 中,選擇作為結直腸癌術前專科檢查源數據的項目包括:腸鏡、CT、MRI、腔內超聲、肝臟超聲、骨掃描和 PET-CT 檢查。
1.1.1 腸鏡
此包括全結直腸鏡(colonoscopy)、乙狀結腸鏡(sigmoidoscopy)和直腸鏡(proctoscopy)[6]。若患者在任何醫院完成了腸鏡檢查且只有一份腸鏡報告時,則以此報告為信息的數據來源;若患者在多家醫院完成了腸鏡檢查時,則選擇醫院級別最高者作為信息的數據來源。術前腸鏡的結果,需要根據腸鏡的圖像、報告、是否完整進行全結直腸檢查以及對應的病理活檢結果,將其信息拆分后保留為相應的各類數據,如術前腸鏡的信息,在華西 DACCA 中會被拆分為“活檢腫瘤性質(nature of tumorby biopsy)”、“活檢腫瘤分化程度(differentiation gradeof tumor by biopsy)”、“腸鏡是否完成(complete ofcolonoscopy)”等幾個數據列。
1.1.2 CT 檢查
此包括了腹部、胸部、頭部等部位的 CT 檢查結果[7-9]。若患者的 CT 檢查既有增強又有平掃檢查,則以增強檢查的結果為準。若患者有多家醫院的 CT 檢查結果,則選擇醫院級別最高者作為信息的數據來源。CT 檢查的結果劃分為總的 CT 分期結果和單列的胸部 CT 分期結果,并以分期作為保存信息。
1.1.3 MRI 檢查
此是針對腹部、盆腔的 MRI 檢查結果[10-11]。若患者的 MRI 檢查有增強和普通檢查,則以增強檢查的結果為準。針對直腸癌的判斷中,若同時有“下腹部+盆腔檢測”和“盆腔直腸專科檢測”時,則以“盆腔直腸專科檢測”的結果為準。若患者有多家醫院的 MRI 檢查,則選擇醫院級別最高者作為信息來源。MRI 檢查的結果只針對總的 MRI 分期結果。若 MRI 檢查不完善如只有上腹部 MRI 檢查,則以已有的檢查作分期判斷或者部分型分期判斷。
1.1.4 腔內超聲
此是專門針對直腸癌患者的檢查結果[12-15]。要求必須為來自經直腸腔內的超聲檢查,不能為單純經肛周進行的檢查。直腸腔內超聲的檢查結果,只選取其對于 T 和 N 分期的判斷。
1.1.5 肝臟超聲
此是專門針對可疑肝臟轉移的結直腸癌患者的檢查結果[16-17]。要求必須有增強超聲的結果,其結果只選取其對于肝臟部位的 M 分期的判斷。
1.1.6 骨掃描
此是指患者在手術前進行的該項檢查結果[18],結果的判斷以是否提示有“骨轉移”為標準,不對判斷骨良性疾病作為判斷。
1.1.7 PET-CT
此是指患者在手術前進行的檢查[19-20],結果只選取其對于 M 分期的判斷。
1.2 分期
華西 DACCA 中的分期,根據術前檢查評估的效能分別需要記錄不同的分期信息。其中術前 CT 和術前 MRI 檢查需要有完整的 TNM 分期,分期的原則參照文獻[21-23]報道的方法,分期的結果按照 TNM 分期格式記錄并分別保存在術前 CT 和術前 MRI 的數據列內。
1.2.1 部分型分期
此主要是針對直腸腔內超聲、肝臟超聲、骨掃描及 PET-CT 的結果。① 直腸腔內超聲重點用于評價 T 分期和 N 分期,其分期的原則參照文獻[24]報道的方法,在數據列中直接保留為 TN 分期的格式。② 肝臟超聲用于評價肝臟轉移相關的 M 分期,其分期時按照“無肝轉移為 M0、可疑肝轉移為 M1ax、確定肝轉移為 M1a”判斷。③ 骨掃描用于評價遠處骨轉移相關的 M 分期,分期時按照“無骨轉移為 M0、可疑骨轉移為 M1ax、確定骨轉移為 M1a”判斷。④ PET-CT 用于評價遠處轉移相關的 M 分期,分期時按照“無遠處轉移為 M0、可疑遠處轉移為 Mx(其中單發轉移為 M1ax,多發轉移為 M1bx)、確定遠處單發轉移為 M1a、確定遠處多發轉移為 M1b”判斷。
1.2.2 綜合分期
華西 DACCA 中的綜合分期,是指結合了包括術前 CT、MRI、直腸腔內超聲、肝臟超聲、骨掃描和 PET-CT 所有可以提供的影像學分期,以及術前腸鏡、臨床癥狀和指檢后給出的綜合評價的分期。按照 A、B、C、D 對其嚴重程度進行分級,A 級等同于“早期”,B 級等同于“中期”,C 級等同于“中晚期”,D 級等同于“晚期”。此分級不同于 Dukes 分期體系[25]。
1.3 準確性
準確性是華西 DACCA 中帶有的評價功能,需要結直腸癌專科醫生背景的數據人員對于與臨床表現推論的結果進行效果判斷。準確性是指當術前對于結直腸癌患者的分期進行劃分后,最終實際上與術后綜合病理分期的符合程度,也可以描述為“契合度”。華西 DACCA 中的所有術前評估結果都需要有準確性判斷,包括術前 CT、MRI、直腸腔內超聲、肝臟超聲、骨掃描、PET-CT、腸鏡檢查結果以及綜合分期判斷。準確性的判斷按照“準確”、“低估”和“高估”的方式進行分類。
1.4 標簽與結構化
1.4.1 檢查結果標簽
① 華西 DACCA 中的“腸鏡”數據列中,華西醫院出具的腸鏡結果標記為“內”,非華西醫院出局的腸鏡結果標記為“外”。無論哪家醫院提供的腸鏡結果,由于任何原因腸鏡沒有做完全者(即腸鏡沒有最終做到回盲部)都標記為“未”[26-29]。“活檢”數據列是指腸鏡下“活檢腫瘤性質”,數據的標簽保存為一串文字形式,其中文字的內容以腸鏡所得的活檢結果為準,但是只保留病理性質的描述,如“腺癌”、“黏液腺癌”等;若沒有活檢結果者,則標記為“x”。“分化”數據列是指腸鏡下活檢的惡性腫瘤的“分化程度”,數據的標簽保存為文本“G”+數字的形式,如高分化為“G1”,中分化為“G2”,低分化為“G3”;若沒有分化程度的描述,則標記為“x”。② 華西 DACCA 中,對于術前 CT、MRI、直腸腔內超聲、肝臟超聲、骨掃描和 PET-CT 的結果都轉換為分期進行標記。按照前面分期的原則轉換后,按照“T?N?”或“T?N?M?”或“M?”的方式保留一串“字母+數值”的文本。標簽中不含有“分期”字樣,即分期中無中文文字出現。
1.4.2 檢查結果評估執行標簽
華西 DACCA 中術前檢查執行情況的數據標簽方式,首先需要根據是否有此項信息進行區分,若有可查閱出術前檢查相關信息者,則可以進行數據框內的標記,如為未檢查者標記為“x”,如為未檢查且評價為應該檢查者標記為“xg”。若無可查閱出術前檢查相關信息者,則在數據框內不做任何標記,數據留空(blank)。此外,單獨針對骨掃描和 PET-CT,由于二者只提供 M 分期,因此,在這種部分型分期前對分期進行概括型標記,如部分型分期判斷為“正常”則標記為“0”、“可疑”標記為“1”、“轉移確定”標記為“2”。每個數據框內會包含多項數據信息,每個信息之間用連字符號“-”連接,如骨掃描檢查評估后判斷為有轉移,則在數據框內填寫“2-M1a”,表示“轉移確定的遠處單發轉移”。
1.4.3 檢查結果準確性標簽
華西 DACCA 中,需要對于準確性進行標簽化。針對有術前 TNM 完整分期和 TN 分期的術前檢查評估,包括術前 CT、MRI、直腸腔內超聲、肝臟超聲的部分型分期以及綜合分期,都需要標記準確性,如準確性為“準確”者標記為“0”、“低估”者標記為“1”、“高估”者標記為“2”。每個數據框內會包含多項數據信息,每個信息之間用連字符號“-”連接,如術前 CT 檢查評估后判斷為 T3N0M0 且經過術后綜合病理分期核對后的準確度一致者,則在數據框內填寫為“0-T3N0M0”,表示“術前 CT 判斷 T3N0M0 是準確的”。
1.4.4 結構化
所有術前檢查評估的數據框內,都以完整的標簽化數據為填寫內容。根據數據庫具備的自動提取功能,則以功能替代數據列的增加。整個數據框內的信息,都在標簽基礎上作為文本型結構化。
1.5 糾錯
華西 DACCA 中,針對術前檢查評估的糾錯,主要包括錄入錯誤糾正和判斷糾正。糾錯主要針對數據錄入過程的填寫,避免錯誤輸入;在需要進行轉換后再輸入數據者,還應該避免轉換錯誤,也就是一旦需要分期的數據,首先需要分期無誤后填寫才會無誤,需要嚴格按照分期標準進行。在數據庫智能化應用過程中,整個分期數據可以自動換算,能避免整個分期錯誤的問題。而在人工智能的角度上看,分期可以直接通過 CT 或者 MRI 的影像組學基礎解決,分期更為精確。華西 DACCA 中有準確度判斷的數據,錯誤糾正可以在術后隨訪開始前通過再次審核數據時進行,以確保分期對比準確度無誤,特別是針對“低估”和“高估”的情況。
2 結直腸癌的術前綜合評價
2.1 定義
在華西 DACCA 中結直腸癌的術前綜合評價由“綜合分期”和“診斷強度”兩項數據列聯合判斷。其中“綜合分期”已如前述;而診斷強度(diagnostic intensity)是指結直腸癌患者初診后,完善相關術前腸鏡以準備為下一步治療做出決策時所具備的“確診結直腸癌”的價值強度,強度越高,越提示術前準備得越完善,決策依據越充分。
按照術前檢查評估的完善程度分為 A、B、C 級,其中 A 級表示術前檢查一定包括了本院(華西醫院)或者其他三甲醫院完整的腸鏡+病理結果陽性(即病理診斷結直腸惡性腫瘤);B 級表示術前檢查一定有本院(華西醫院)腸鏡,但是病理結果懷疑為結直腸惡性腫瘤而臨床癥狀又明確提示陽性,如肛門指檢捫及惡性腫瘤的占位、腹部捫及腫塊等;C 級表示在術前評估過程中,對于結直腸惡性腫瘤的診斷幾乎脫離了腸鏡,而主要依靠臨床指檢、影像、癌胚抗原(CEA)等非金標準的評估項目作為評價,完全沒有病理依據,甚至部分患者需要在術中進行快速冰凍病理檢查[30]以再次確定。
2.2 標簽與結構化
華西 DACCA 中,對于“綜合分期”的標簽和結構化,在前面已描述。針對“診斷強度”,由于有明確的分級,在華西 DACCA 中則將 A 級診斷強度標記為“A”、B 級診斷強度標記為“B”、C 級診斷強度標記為“C ”。在數據庫結構化中,將標簽的信息按照短文本形式進行保留。
2.3 糾錯
華西 DACCA 中針對“綜合分期”需要考慮的上述糾錯需求外,針對“診斷強度”則需要重點采用復核的形式進行糾錯。由于結直腸癌患者在初診后開始決策治療方案前有足夠的時間建立術前評估準備,則需要對于評估中的腸鏡信息進行詳細核實,并綜合判斷腸鏡下的病理報告描述部分以及是否有可以聯合判斷用的臨床癥狀。
3 結直腸癌術前初診臨床因素與誤診誤治的設定
3.1 術前初診臨床因素
3.1.1 定義
術前初診臨床因素,在華西 DACCA 中,以縮寫為“臨床”二字作為數據列標題。這里的術前初診臨床因素是指,患者在確診或者高度懷疑為結直腸癌前,因何種原因開始疾病的診斷,也可以理解為就診原因,或者部分信息可以近似于醫院信息系統(hospital information system,HIS)中采集患者主訴和病史的內容。根據目前華西 DACCA 中的數據情況,主要包含的術前初診臨床因素有:腸道癥狀(如便血、梗阻等)、無癥狀腹部包塊以及由于篩查所發現。其中,篩查可能的因素又包括:體檢(實驗室檢查異常)、肛門指檢、由于家族史所發起的篩查等。
3.1.2 標簽與結構化
華西 DACCA 中,術前初診臨床因素屬于可以增加的新類型的數據列,以短文本作為數據的結構化處理。其中,已經有的“術前初診臨床因素”,如前述,則直接文字描述在數據框內,但是不需要寫詳細的初診后情況,如 HIS 中可以描述為“便血 3 個月、外院腸鏡提示直腸占位 5 d”,在 DACCA 數據框內,只需要保留“癥狀”二字。
3.1.3 糾錯
華西 DACCA 中,對于“術前初診臨床因素”的糾錯,主要還是與 HIS 中的主訴與病史進行核對。若患者病史較長,仍需要追溯到最早的“臨床因素”,需要與臨床過程中床旁追問病史相結合。由于“術前初診臨床因素”會關聯到后續的“誤診與誤治”、術前“診斷強度”等信息,因此尤為重要,也是華西 DACCA 反饋結直腸癌篩查信息的重要數據列。
3.2 誤診與誤治
3.2.1 定義
華西 DACCA 中,對結直腸癌患者是否出現“誤診”和“誤治”進行了判斷,該信息無法通過 HIS 直接獲取,多數情況下仍需要通過對于病史的判斷,以確定是否屬于“誤診”和“誤治”。其中“誤診”是指結直腸癌患者在確診前,由于首先診斷為其他的疾病。“誤治”是指由于診斷為其他的疾病后并開始對應的治療,在治療后期才發現應考慮為結直腸癌并治療;“誤治”還包括患者已經診斷為結直腸癌,但是因為個人原因或者其他因素導致患者開始治療的時間不是在確診結直腸癌后的即刻。“誤診”和“誤治”需要與前述的“術前初診臨床因素”相結合,由于兩者需要展示的信息是不同的,因此,在華西 DACCA 中對此進行了分列,后者的數據列標題為“誤治和誤治”。
3.2.2 標簽與結構化
華西 DACCA 中,“誤診和誤治”屬于可以增加的新類型的數據列,以短文本作為數據的結構化處理。“誤診和誤治”用文字直接描述,若為誤診或者誤治為某種疾病以及對應的治療程序,可以直接縮略性描述,如“患者因考慮痔瘡行相關治療而效果不佳,經腸鏡檢查后發現直腸癌”時則只需要記錄“痔瘡”;若由于“痔瘡”治療時間過長而延誤了直腸癌的治療,如“痔瘡治療后半年……”時則需要記錄為“痔瘡,6 個月”。按照數據記錄的格式,“誤診”和“誤治”文字可以用英文符號“,”分隔。
3.2.3 糾錯
華西 DACCA 中,對于“誤診和誤治”的糾錯,也需要對 HIS 中的主訴與病史進行核對。追溯“誤診和誤治”的關鍵還是原因和時間兩個點,先確定可能存在的臨床癥狀和就診原因,判斷是不是屬于“誤診”,再判斷這些“誤診”是否存在有“誤治”的情況。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:汪曉東負責本文的主要撰寫工作及修改;劉健博、安麗珉和何欣林共同負責本文的部分撰寫工作和參考文獻引用;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員。