引用本文: 汪曉東, 劉健博, 李立. 數據庫建設第五部分:結直腸癌的腫瘤特征—模塊的設計(一). 中國普外基礎與臨床雜志, 2020, 27(3): 345-349. doi: 10.7507/1007-9424.201912027 復制
續前系列研究,本研究團隊對華西腸癌數據庫(Database from Colorectal Cancer,DACCA)的構建基本思路進行了總體闡述,同時對個人數據、住院管理流程、術前內外科合并癥等也進行了相應的闡述和報道[1-10]。本研究承接《中國普外基礎與臨床雜志》2020 年第 2 期發表的“數據庫研究第五部分:結直腸癌的腫瘤特征”所做的臨床研究報道[11],筆者現將對華西 DACCA 中結直腸癌的腫瘤特征的具體概念、標簽與結構化進行詳細闡述。
1 DACCA 中結直腸癌的腫瘤特征模塊的構成及標簽與結構化設計
1.1 總體構成
在華西 DACCA 中,選擇作為結直腸癌的腫瘤特征模塊的項目包括:癌前病變、癌家族、腫瘤部位、緣距、腫瘤形態、大小、方位、發生、分化、腫瘤病理性質、Ki67、梗阻、套疊、穿孔、疼痛、水腫、出血。根據項目的類別,腫瘤特征模塊含有病史相關數據源、經典病理學特征數據源和腫瘤合并癥相關數據源。
1.2 標簽與結構化設計的總原則
在華西 DACCA 中,腫瘤特征模塊的數據標簽主要采用文字和數字兩種形式填寫和標記。其中癌前病變、腫瘤部位、腫瘤形態、方位、發生、分化、腫瘤病理性質這 7 項采用單條文字形式進行入庫填寫和標記,均以短文本形式保存,可用于分類化的信息處理;癌家族則采用文本形式且是多條文本數據,數據框內錄入的信息是家族關系和對應關系下的癌癥類型,后期數據分析時采用自動識別提取的形式處理;緣距、大小、Ki67、梗阻、套疊、穿孔、疼痛、水腫、出血用數字形式標記,均為數值型數據資料,其中梗阻、套疊、穿孔、疼痛、水腫及出血的數字表達為等級,作為分級標識的標簽。
2 DACCA 中結直腸癌的腫瘤特征模塊構成的定義及解讀
本研究中對結直腸癌的腫瘤特征模塊項目中的前 4 項(癌前病變、癌家族、腫瘤部位、緣距)進行介紹,余下項目后期相應章節介紹。
2.1 癌前病變
2.1.1 定義
癌前病變(precancerous lesions)是指某些具有癌變潛能的良性病變,若長期不治療,有的可轉變為癌[12]。以 ASCRS[13]的介紹為例,目前比較公認的結直腸癌癌前病變包括:腺瘤性息肉(adenomatous polyposis)、家族性腺瘤息肉病(familial adenomatous polyposis)以及炎性腸病(inflammatory bowel disease)。由于對于如何演變為結直腸癌的機制及機理一直還在研究進展中[14],所以是否還有更多的相關疾病可能可以逐步定義為本病的癌前病變。因此,在構建 DACCA 時,我們將可能相關的疾病均進行了數據采集。
2.1.2 目前的分類
根據 DACCA 中現階段的數據采集,屬于需要錄入 DACCA 中癌前病變信息有:息肉(polyp),包括多發息肉(multiple polyps)、家族性息肉病(familial polyposis)、彌漫性息肉病(diffuse polyposis);腺瘤(adenoma),包括多發腺瘤(multiple adenomas);炎性腸病(inflammatory bowel disease),包括潰瘍性結腸炎(ulcerative colitis)、克羅恩病(Crohn disease)、炎性腸病未定型(undefined inflammatory bowel disease);慢性結腸炎(chronic colitis);便秘(constipation),包括結腸黑變病(melanosis coli);血吸蟲病(schistosomiasis)等。
2.1.3 標簽與結構化
癌前病變的數據采用短文本形式作為標簽進行錄入和保存。統一采用中文表達,不選取英文縮寫,如潰瘍性結腸炎不保留“UC”。在對數據庫中的數據進行分析時,以整個短文本作為結構化標記。
2.1.4 糾錯與更新
在 DACCA 中,對于癌前病變的首次錄入主要在術前評估階段,結合腸鏡等手段進行完善。在錄入過程中,重點需要注意錄入文字不能發生錯誤。數據庫統一結構化后,可以采用菜單的形式進行錯誤規避。除此以外,在手術過程中還可以通過手術中的探查情況如剖視切除腸道標本的檢視以補充患者是否有相關的癌前病變信息。
2.2 癌家族
2.2.1 定義
癌家族(cancer family)的定義在 DACCA 中不僅包括明確的家族性癌疾病[15],還包括在有血緣關系的直系親屬中出現癌疾病的情況,也包括在相似或共同環境因素下的親屬中出現癌疾病的情況,如若患者為男性,被診斷為“直腸上段癌”,在信息采集時如果發現患者妻子曾患有“乳腺癌”時也應該做數據記錄。癌家族中需要獲取的信息不僅僅是指結直腸癌這樣與 DACCA 一致的癌疾病,還包括非結直腸癌的其他癌疾病。
2.2.2 填寫形式
由于結直腸癌患者可能存在有多個符合 DACCA 所定義的癌家族信息。在癌家族數據框中的數據錄入形式采用每一位癌家族符合人員的信息都錄入其中,每一個信息之間用英文“,”隔開。每一位癌家族符合人員的信息由“關系”加“癌疾病”的方式填寫,“關系”和“癌疾病”數據之間用連字線半字符“-”連接,如母-宮頸癌。若某一位癌家族符合人員為多癌患者,則“癌疾病”部分用“/”隔開每種癌疾病,如父-直腸癌/鼻咽癌。
2.2.3 標簽與結構化
癌家族數據采用短文本形式作為標簽,包括連字線半字符“-”在內一并進行錄入和保存。統一采用中文表達。在數據庫分析時,除去連字線符號,分別單獨將“關系”和“癌疾病”作為結構化數據的內容。在對數據庫中的數據進行分析時直接指向結構化數據進行提取。
2.2.4 糾錯與更新
癌家族信息的錄入時間點主要在術前評估階段,通過病史采集獲取[16]。首先應該注意在家族史采集過程中避免遺漏或錯誤信息,但由于部分患者會在就診期間刻意或者無意影響癌家族信息的采集,因此,在后續的治療和隨訪過程中還需要繼續追加家族史的采集和更新。
2.3 腫瘤部位
2.3.1 定義
在 DACCA 中,腫瘤部位是指結直腸癌患者在首次納入數據庫時評估腫瘤所在部位。入庫的結直腸癌患者不僅包括首次在四川大學華西醫院就診的結直腸癌患者,還包括既往在四川大學華西醫院或者其他醫院就診后由于結直腸癌復發(recurrence)或再發(second primary colorectal cancer)而再次到四川大學華西醫院就診的患者,因此還涵蓋了“復發性”和“再發性”結直腸癌信息,故在腫瘤部位的數據庫定義中,還包括吻合口(anastomosis)和吻合口周圍(perianastomotic region)。
2.3.2 劃分方式
除去吻合口和吻合口周圍的數據外,其他腫瘤部位的劃分建立在結直腸基本解剖基礎上。根據結直腸基本解剖圖示(圖 1)所述進行腫瘤部位劃分時,首先分別解讀結腸的劃分,再解讀直腸的劃分,特別是對于直腸部位的劃分,最基本的參考依據來自早期在《中國普外基礎與臨床雜志》所發表的《四川大學華西醫院結直腸癌手術治療指南》系列中的描述[17-23]。

2.3.2.1 結腸
DACCA 中,結腸的部位劃分總共分為 9 段,按照起始走行分別為回盲部(ileocecus)、升結腸(ascending colon)、結腸肝曲(hepatic flexure of colon)、橫結腸近肝曲(transverse colon close to hepatic flexure)、橫結腸(transverse colon)、橫結腸近脾曲(transverse colon close to splenic flexure)、結腸脾曲(splenic flexure of colon)、降結腸(descending colon)和乙狀結腸(sigmoid colon)。① 回盲部是結腸起始部位,包括闌尾(appendix)及回盲瓣(ileocecal valve)的區域,腫瘤受累區域主要位于盲腸時定義為此部位。② 升結腸的部位定義主要是腫瘤主體位于升結腸腸段且沒有累及到結腸肝曲韌帶附著區域。③ 結腸肝曲則是腫瘤主要位于肝曲內,在結腸肝曲韌帶附著區域,在手術中必須松解結腸肝曲后才能達到 R0 切除[24]的腫瘤部位。④ 橫結腸按照傳統的定義,位于結腸肝曲與結腸脾曲之間,由于從腫瘤的特征以及手術操作可能帶來的不同,我們將橫結腸分為三段,橫結腸中份為主的 3/5 長度的區域為 DACCA 中的橫結腸部位,而更靠近結腸肝曲的一段橫結腸定義為橫結腸近肝曲,腫瘤未完全累及到結腸肝曲韌帶附著部位但是從手術切除過程上判斷都需要完成結腸肝曲游離并行右半結腸切除手術方式;更靠近結腸脾曲的一段橫結腸定義為橫結腸近脾曲,腫瘤未完全累及到結腸脾曲韌帶附著部位但是從手術切除過程上判斷都需要完成結腸脾曲游離并行左半結腸切除手術方式。對于 DACCA 中,橫結腸部位的腫瘤,則可以按照經典的橫結腸癌根治手術方式進行,并且在吻合重建的術式當中,更多可以有機會選擇側側吻合[25]。⑤ 結腸脾曲則是腫瘤主要位于脾曲內,在結腸脾曲韌帶附著區域,在手術中必須松解結腸脾曲后才能行 R0 切除且尤其需要注意該區域內大網膜和脾臟相關結構分離的腫瘤部位。⑥ 降結腸的部位定義主要是腫瘤主體位于降結腸,且未累及到結腸脾曲韌帶附著區域。⑦ 乙狀結腸延續在降結腸遠端,通常借助系膜形成“S”狀,在該區域內的腫瘤部位劃分在乙狀結腸;從解剖角度上看,還存在的降乙交界部,在 DACCA 中的劃分過程中納入降結腸錄入,而直乙交界部則如下面 2.3.2.2 所述,納入直腸部位劃分。
2.3.2.2 直腸
在 DACCA 的直腸部位劃分中,遵照《四川大學華西醫院結直腸癌手術治療指南》[17-23]進行,包括直腸乙狀結腸交界部(rectosigmoid junction)、直腸上段(upper rectum)、直腸中段(mid rectum)、直腸腹膜返折部(peritoneal reflection of rectum)、直腸低位(lower rectum)、直腸超低位(ultra-lower rectum)、直腸肛管(anorectum)和肛管(anal canal)。由于直腸的解剖較為特殊,腫瘤可能處于的部位不同,對于術前評估、手術方式、術后并發癥、預后等臨床決策的環節都可以帶來影響。① 直腸乙狀結腸交界部位通常是指距離齒狀線 20~22 cm 處的一段直腸,與乙狀結腸相連,但是在手術方式和治療方案評估時按照直腸進行評價。② 直腸上段是距離齒狀線 16~19 cm 的部位。③ 直腸中段是距離齒狀線 11~15 cm 的部位。④ 直腸腹膜返折部是指腫瘤累及直腸腹膜返折區域,多數情況下腫瘤可能橫跨腹膜返折上下部位,該部位的腫瘤轉移途徑以及手術操作方式都與直腸上段和中段有較大的區別。⑤ 直腸低位則是腫瘤的上緣都已經位于腹膜返折以下,但是下緣在齒狀線 3 cm 以上。⑥ 直腸超低位時腫瘤下緣距離齒狀線在 1~3 cm。⑦ 直腸肛管部,最重要的一點是腫瘤跨入外科學肛管區域,通常腫瘤下緣侵及到齒狀線上下 1 cm 的范圍。⑧ 肛管部則是指腫瘤的主體都位于外科肛管區域內,瘤體更多可能在解剖肛管的范圍。
2.3.3 標簽與結構化
腫瘤部位采用短文本形式作為標簽,采用中文表達,按照劃分方式標準化標簽中的信息內容。對數據庫中的數據進行分析時,腫瘤部位的標準化文本表達標簽作為結構化數據的內容。
2.3.4 糾錯與更新
腫瘤部位信息的錄入,首次會在術前評估階段對于患者腸鏡報告的解讀。但是由于腸鏡下對于結直腸癌的部位報道很可能與實際解剖的定位有差異[26],因而需要通過肛門指檢、術前影像學評估以及術中所見最終得出符合 DACCA 要求的規范部位。因此,除去首次錄入腸鏡報告的腫瘤部位外,還需要在后期治療過程中對于腫瘤部位做出及時的糾正和更新。在錄入過程中,不僅要避免部位的錯誤,還應該注意規范化的文本表達。
2.4 緣距
2.4.1 定義
在 DACCA 中緣距(distance to dentate line)的定義就是指腫瘤下緣距離肛齒狀線的距離,單位用“cm”表示。如前面所述,數據庫中對于直腸癌部位的定義中有直腸肛管部位和肛管部位的直腸腫瘤,其都可能累及到肛齒狀線即可能位于其上方也可能位于其下方,因此,緣距有可能為負值。
2.4.2 標簽與結構化
緣距在 DACCA 中只針對直腸癌的錄入形式,采用數值儲存為標簽,含小數點后 1 位數值,且有正號“+”和負號“–”。在 DACCA 中的數據框內,正號“+”則默認為正數值而不需要添加“+”,但負號“–”則需要在數據框內添加。對數據庫中的數據進行分析時,按照完整的符號加數值的形式作為結構化分析的數據源。在 DACCA 中不錄入結腸癌的緣距信息。
2.4.3 糾錯與更新
由于在 DACCA 中,只有直腸癌的數據需要保留緣距的信息。因此,在錄入過程中,首先需要準確界定直腸癌的部位信息。在確定了直腸癌的部位后,首先需要結合腸鏡對于緣距進行錄入。對于直腸腹膜返折部、直腸低位、直腸超低位、直腸肛管和肛管部位的腫瘤則必須在手術前結合肛門指檢對緣距進行校正。在后期的手術治療過程中,在術中腫瘤切除前以及切除后的標本剖視階段也需要對于腫瘤部位再次認定,同時糾正“緣距”可能不準確時的數據信息。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:汪曉東負責本文的主要撰寫工作;劉健博負責本文的部分撰寫工作和參考文獻引用;汪曉東和李立共同為華西 DACCA 的數據庫構建者和主要應用分析人員。
續前系列研究,本研究團隊對華西腸癌數據庫(Database from Colorectal Cancer,DACCA)的構建基本思路進行了總體闡述,同時對個人數據、住院管理流程、術前內外科合并癥等也進行了相應的闡述和報道[1-10]。本研究承接《中國普外基礎與臨床雜志》2020 年第 2 期發表的“數據庫研究第五部分:結直腸癌的腫瘤特征”所做的臨床研究報道[11],筆者現將對華西 DACCA 中結直腸癌的腫瘤特征的具體概念、標簽與結構化進行詳細闡述。
1 DACCA 中結直腸癌的腫瘤特征模塊的構成及標簽與結構化設計
1.1 總體構成
在華西 DACCA 中,選擇作為結直腸癌的腫瘤特征模塊的項目包括:癌前病變、癌家族、腫瘤部位、緣距、腫瘤形態、大小、方位、發生、分化、腫瘤病理性質、Ki67、梗阻、套疊、穿孔、疼痛、水腫、出血。根據項目的類別,腫瘤特征模塊含有病史相關數據源、經典病理學特征數據源和腫瘤合并癥相關數據源。
1.2 標簽與結構化設計的總原則
在華西 DACCA 中,腫瘤特征模塊的數據標簽主要采用文字和數字兩種形式填寫和標記。其中癌前病變、腫瘤部位、腫瘤形態、方位、發生、分化、腫瘤病理性質這 7 項采用單條文字形式進行入庫填寫和標記,均以短文本形式保存,可用于分類化的信息處理;癌家族則采用文本形式且是多條文本數據,數據框內錄入的信息是家族關系和對應關系下的癌癥類型,后期數據分析時采用自動識別提取的形式處理;緣距、大小、Ki67、梗阻、套疊、穿孔、疼痛、水腫、出血用數字形式標記,均為數值型數據資料,其中梗阻、套疊、穿孔、疼痛、水腫及出血的數字表達為等級,作為分級標識的標簽。
2 DACCA 中結直腸癌的腫瘤特征模塊構成的定義及解讀
本研究中對結直腸癌的腫瘤特征模塊項目中的前 4 項(癌前病變、癌家族、腫瘤部位、緣距)進行介紹,余下項目后期相應章節介紹。
2.1 癌前病變
2.1.1 定義
癌前病變(precancerous lesions)是指某些具有癌變潛能的良性病變,若長期不治療,有的可轉變為癌[12]。以 ASCRS[13]的介紹為例,目前比較公認的結直腸癌癌前病變包括:腺瘤性息肉(adenomatous polyposis)、家族性腺瘤息肉病(familial adenomatous polyposis)以及炎性腸病(inflammatory bowel disease)。由于對于如何演變為結直腸癌的機制及機理一直還在研究進展中[14],所以是否還有更多的相關疾病可能可以逐步定義為本病的癌前病變。因此,在構建 DACCA 時,我們將可能相關的疾病均進行了數據采集。
2.1.2 目前的分類
根據 DACCA 中現階段的數據采集,屬于需要錄入 DACCA 中癌前病變信息有:息肉(polyp),包括多發息肉(multiple polyps)、家族性息肉病(familial polyposis)、彌漫性息肉病(diffuse polyposis);腺瘤(adenoma),包括多發腺瘤(multiple adenomas);炎性腸病(inflammatory bowel disease),包括潰瘍性結腸炎(ulcerative colitis)、克羅恩病(Crohn disease)、炎性腸病未定型(undefined inflammatory bowel disease);慢性結腸炎(chronic colitis);便秘(constipation),包括結腸黑變病(melanosis coli);血吸蟲病(schistosomiasis)等。
2.1.3 標簽與結構化
癌前病變的數據采用短文本形式作為標簽進行錄入和保存。統一采用中文表達,不選取英文縮寫,如潰瘍性結腸炎不保留“UC”。在對數據庫中的數據進行分析時,以整個短文本作為結構化標記。
2.1.4 糾錯與更新
在 DACCA 中,對于癌前病變的首次錄入主要在術前評估階段,結合腸鏡等手段進行完善。在錄入過程中,重點需要注意錄入文字不能發生錯誤。數據庫統一結構化后,可以采用菜單的形式進行錯誤規避。除此以外,在手術過程中還可以通過手術中的探查情況如剖視切除腸道標本的檢視以補充患者是否有相關的癌前病變信息。
2.2 癌家族
2.2.1 定義
癌家族(cancer family)的定義在 DACCA 中不僅包括明確的家族性癌疾病[15],還包括在有血緣關系的直系親屬中出現癌疾病的情況,也包括在相似或共同環境因素下的親屬中出現癌疾病的情況,如若患者為男性,被診斷為“直腸上段癌”,在信息采集時如果發現患者妻子曾患有“乳腺癌”時也應該做數據記錄。癌家族中需要獲取的信息不僅僅是指結直腸癌這樣與 DACCA 一致的癌疾病,還包括非結直腸癌的其他癌疾病。
2.2.2 填寫形式
由于結直腸癌患者可能存在有多個符合 DACCA 所定義的癌家族信息。在癌家族數據框中的數據錄入形式采用每一位癌家族符合人員的信息都錄入其中,每一個信息之間用英文“,”隔開。每一位癌家族符合人員的信息由“關系”加“癌疾病”的方式填寫,“關系”和“癌疾病”數據之間用連字線半字符“-”連接,如母-宮頸癌。若某一位癌家族符合人員為多癌患者,則“癌疾病”部分用“/”隔開每種癌疾病,如父-直腸癌/鼻咽癌。
2.2.3 標簽與結構化
癌家族數據采用短文本形式作為標簽,包括連字線半字符“-”在內一并進行錄入和保存。統一采用中文表達。在數據庫分析時,除去連字線符號,分別單獨將“關系”和“癌疾病”作為結構化數據的內容。在對數據庫中的數據進行分析時直接指向結構化數據進行提取。
2.2.4 糾錯與更新
癌家族信息的錄入時間點主要在術前評估階段,通過病史采集獲取[16]。首先應該注意在家族史采集過程中避免遺漏或錯誤信息,但由于部分患者會在就診期間刻意或者無意影響癌家族信息的采集,因此,在后續的治療和隨訪過程中還需要繼續追加家族史的采集和更新。
2.3 腫瘤部位
2.3.1 定義
在 DACCA 中,腫瘤部位是指結直腸癌患者在首次納入數據庫時評估腫瘤所在部位。入庫的結直腸癌患者不僅包括首次在四川大學華西醫院就診的結直腸癌患者,還包括既往在四川大學華西醫院或者其他醫院就診后由于結直腸癌復發(recurrence)或再發(second primary colorectal cancer)而再次到四川大學華西醫院就診的患者,因此還涵蓋了“復發性”和“再發性”結直腸癌信息,故在腫瘤部位的數據庫定義中,還包括吻合口(anastomosis)和吻合口周圍(perianastomotic region)。
2.3.2 劃分方式
除去吻合口和吻合口周圍的數據外,其他腫瘤部位的劃分建立在結直腸基本解剖基礎上。根據結直腸基本解剖圖示(圖 1)所述進行腫瘤部位劃分時,首先分別解讀結腸的劃分,再解讀直腸的劃分,特別是對于直腸部位的劃分,最基本的參考依據來自早期在《中國普外基礎與臨床雜志》所發表的《四川大學華西醫院結直腸癌手術治療指南》系列中的描述[17-23]。

2.3.2.1 結腸
DACCA 中,結腸的部位劃分總共分為 9 段,按照起始走行分別為回盲部(ileocecus)、升結腸(ascending colon)、結腸肝曲(hepatic flexure of colon)、橫結腸近肝曲(transverse colon close to hepatic flexure)、橫結腸(transverse colon)、橫結腸近脾曲(transverse colon close to splenic flexure)、結腸脾曲(splenic flexure of colon)、降結腸(descending colon)和乙狀結腸(sigmoid colon)。① 回盲部是結腸起始部位,包括闌尾(appendix)及回盲瓣(ileocecal valve)的區域,腫瘤受累區域主要位于盲腸時定義為此部位。② 升結腸的部位定義主要是腫瘤主體位于升結腸腸段且沒有累及到結腸肝曲韌帶附著區域。③ 結腸肝曲則是腫瘤主要位于肝曲內,在結腸肝曲韌帶附著區域,在手術中必須松解結腸肝曲后才能達到 R0 切除[24]的腫瘤部位。④ 橫結腸按照傳統的定義,位于結腸肝曲與結腸脾曲之間,由于從腫瘤的特征以及手術操作可能帶來的不同,我們將橫結腸分為三段,橫結腸中份為主的 3/5 長度的區域為 DACCA 中的橫結腸部位,而更靠近結腸肝曲的一段橫結腸定義為橫結腸近肝曲,腫瘤未完全累及到結腸肝曲韌帶附著部位但是從手術切除過程上判斷都需要完成結腸肝曲游離并行右半結腸切除手術方式;更靠近結腸脾曲的一段橫結腸定義為橫結腸近脾曲,腫瘤未完全累及到結腸脾曲韌帶附著部位但是從手術切除過程上判斷都需要完成結腸脾曲游離并行左半結腸切除手術方式。對于 DACCA 中,橫結腸部位的腫瘤,則可以按照經典的橫結腸癌根治手術方式進行,并且在吻合重建的術式當中,更多可以有機會選擇側側吻合[25]。⑤ 結腸脾曲則是腫瘤主要位于脾曲內,在結腸脾曲韌帶附著區域,在手術中必須松解結腸脾曲后才能行 R0 切除且尤其需要注意該區域內大網膜和脾臟相關結構分離的腫瘤部位。⑥ 降結腸的部位定義主要是腫瘤主體位于降結腸,且未累及到結腸脾曲韌帶附著區域。⑦ 乙狀結腸延續在降結腸遠端,通常借助系膜形成“S”狀,在該區域內的腫瘤部位劃分在乙狀結腸;從解剖角度上看,還存在的降乙交界部,在 DACCA 中的劃分過程中納入降結腸錄入,而直乙交界部則如下面 2.3.2.2 所述,納入直腸部位劃分。
2.3.2.2 直腸
在 DACCA 的直腸部位劃分中,遵照《四川大學華西醫院結直腸癌手術治療指南》[17-23]進行,包括直腸乙狀結腸交界部(rectosigmoid junction)、直腸上段(upper rectum)、直腸中段(mid rectum)、直腸腹膜返折部(peritoneal reflection of rectum)、直腸低位(lower rectum)、直腸超低位(ultra-lower rectum)、直腸肛管(anorectum)和肛管(anal canal)。由于直腸的解剖較為特殊,腫瘤可能處于的部位不同,對于術前評估、手術方式、術后并發癥、預后等臨床決策的環節都可以帶來影響。① 直腸乙狀結腸交界部位通常是指距離齒狀線 20~22 cm 處的一段直腸,與乙狀結腸相連,但是在手術方式和治療方案評估時按照直腸進行評價。② 直腸上段是距離齒狀線 16~19 cm 的部位。③ 直腸中段是距離齒狀線 11~15 cm 的部位。④ 直腸腹膜返折部是指腫瘤累及直腸腹膜返折區域,多數情況下腫瘤可能橫跨腹膜返折上下部位,該部位的腫瘤轉移途徑以及手術操作方式都與直腸上段和中段有較大的區別。⑤ 直腸低位則是腫瘤的上緣都已經位于腹膜返折以下,但是下緣在齒狀線 3 cm 以上。⑥ 直腸超低位時腫瘤下緣距離齒狀線在 1~3 cm。⑦ 直腸肛管部,最重要的一點是腫瘤跨入外科學肛管區域,通常腫瘤下緣侵及到齒狀線上下 1 cm 的范圍。⑧ 肛管部則是指腫瘤的主體都位于外科肛管區域內,瘤體更多可能在解剖肛管的范圍。
2.3.3 標簽與結構化
腫瘤部位采用短文本形式作為標簽,采用中文表達,按照劃分方式標準化標簽中的信息內容。對數據庫中的數據進行分析時,腫瘤部位的標準化文本表達標簽作為結構化數據的內容。
2.3.4 糾錯與更新
腫瘤部位信息的錄入,首次會在術前評估階段對于患者腸鏡報告的解讀。但是由于腸鏡下對于結直腸癌的部位報道很可能與實際解剖的定位有差異[26],因而需要通過肛門指檢、術前影像學評估以及術中所見最終得出符合 DACCA 要求的規范部位。因此,除去首次錄入腸鏡報告的腫瘤部位外,還需要在后期治療過程中對于腫瘤部位做出及時的糾正和更新。在錄入過程中,不僅要避免部位的錯誤,還應該注意規范化的文本表達。
2.4 緣距
2.4.1 定義
在 DACCA 中緣距(distance to dentate line)的定義就是指腫瘤下緣距離肛齒狀線的距離,單位用“cm”表示。如前面所述,數據庫中對于直腸癌部位的定義中有直腸肛管部位和肛管部位的直腸腫瘤,其都可能累及到肛齒狀線即可能位于其上方也可能位于其下方,因此,緣距有可能為負值。
2.4.2 標簽與結構化
緣距在 DACCA 中只針對直腸癌的錄入形式,采用數值儲存為標簽,含小數點后 1 位數值,且有正號“+”和負號“–”。在 DACCA 中的數據框內,正號“+”則默認為正數值而不需要添加“+”,但負號“–”則需要在數據框內添加。對數據庫中的數據進行分析時,按照完整的符號加數值的形式作為結構化分析的數據源。在 DACCA 中不錄入結腸癌的緣距信息。
2.4.3 糾錯與更新
由于在 DACCA 中,只有直腸癌的數據需要保留緣距的信息。因此,在錄入過程中,首先需要準確界定直腸癌的部位信息。在確定了直腸癌的部位后,首先需要結合腸鏡對于緣距進行錄入。對于直腸腹膜返折部、直腸低位、直腸超低位、直腸肛管和肛管部位的腫瘤則必須在手術前結合肛門指檢對緣距進行校正。在后期的手術治療過程中,在術中腫瘤切除前以及切除后的標本剖視階段也需要對于腫瘤部位再次認定,同時糾正“緣距”可能不準確時的數據信息。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:汪曉東負責本文的主要撰寫工作;劉健博負責本文的部分撰寫工作和參考文獻引用;汪曉東和李立共同為華西 DACCA 的數據庫構建者和主要應用分析人員。