引用本文: 汪曉東, 林容若, 劉健博, 李立. 數據庫建設第七部分:結直腸癌手術特征的標簽與結構化(一). 中國普外基礎與臨床雜志, 2020, 27(9): 1150-1152. doi: 10.7507/1007-9424.202007136 復制
續前系列研究[1-15],本研究團隊對華西腸癌數據庫(Database from Colorectal Cancer,DACCA)的構建基本思路進行了總體闡述,同時對個人數據、住院管理流程、術前內外科合并癥、腫瘤特征等進行了相應的闡述和報道。本研究承接《中國普外基礎與臨床雜志》2020 年第 8 期發表的“數據庫研究第七部分:結直腸癌手術的特征(一)”[16]所做的臨床研究報道,本章節現對華西 DACCA 中結直腸癌手術特征的總體設計及其部分內容的概念、標簽與結構化進行詳細闡述。
1 DACCA 中結直腸癌手術特征模塊的構成、標簽與結構化設計
1.1 總體構成
在華西 DACCA 中,結直腸癌的手術特征模塊主要分為手術特色、手術術式、手術操作細節、手術難點以及手術質量評價這五大部分。① 手術特色部分包括手術特色、時機、水平;② 手術術式部分包括手術名稱、手術性質、保肛意愿、造口類型、造口還納日期、手術路徑、擴大切除、經括約肌間切除術(ISR)類型;③ 手術操作細節部分包括吻合類型、吻合口形式、吻合器械型號、術中加固、吻合口填塞、引流安置、網膜覆蓋、防粘連措施、盆腹膜修復、術中污染、術中化療;④ 手術難點部分包括手術時長、解剖難度、骨盆、肥胖、粘連、系膜狀態、臟器肥大、腸管質量;⑤ 手術質量評價部分包括術后死亡風險、組織損傷風險、復發預判、轉移預判、滲漏風險、手術難度自評、總體預后預判、手術質量自評。對于手術特征模塊的設計,更重視除經典的手術名稱、根治程度外對于手術的具體操作進行分解并提供主觀與客觀相結合的質量評價機制。
1.2 標簽與結構化設計的總原則
在華西 DACCA 中,手術特征模塊的數據標簽仍舊主要采用文字和數字兩種形式的填寫和標記。由于經典手術的名稱等數據都有標準化的名稱規范,因此,可以有效地進行結構化設計。但是對于手術細節等部分,由于目前這方面的評價機制相對不足,衡量手術質量的方式也一直存在爭議。因此,本數據庫構建過程中,著力完成對這些拆解手術細節的內容進行設計,為以后更好地建立評估機制,多數數據采用可以結構化的方式進行,也多考慮到了分級的結構化方式。
2 DACCA 中結直腸癌的手術特征模塊構成的定義及解讀
在本章節內容中首先解讀手術特征模塊中的手術特色部分這一部分,余下 4 個部分后期章節介紹。
2.1 手術特色部分
2.1.1 手術特色
2.1.1.1 定義
在華西 DACCA 中設計的手術特色內容是指患者在因結直腸癌接受主要手術時的特殊特色,該特色能代表不同于常規手術的技術特征或創新技術。對于結直腸癌的創新技術系列在本團隊早期發表的文獻[17-31]中曾做過詳細介紹,這些創新技術從創立至今有了較多變化,特別是伴隨技術同質化的過程,部分手術技術(如 ISR 技術)已逐步被更多結直腸外科醫生所掌握[32-35],所以,這部分技術在 DACCA 中不再屬于此項數據需要標注的。因此,對于手術特色數據的填寫在不斷更新中,目前主要內容包括極限或超極限保肛、晚期癌(聯合或不聯合新輔助治療后)極限保肛、前閉合技術等,因而這些內容目前還不能進行系統分析,還需要下一步對更新后的創新術式再次整理后進行規范手術劃分。
2.1.1.2 標簽與結構化
手術特色的數據用短文本形式作為標簽進行錄入和保存,統一用中文表達,不用英文縮寫。在對數據庫中的數據進行分析時,可對相同類型的手術特色分類進行結構化分析。
2.1.1.3 糾錯與更新
在 DACCA 中,對于手術特色的判定需要結合對于經典手術和近年來的創新手術進行判斷,需要明確為更具有特點的創新術式。因此,需在手術完成后即由高年資的主刀醫生親自完成是否為創新手術的判斷及數據錄入。雖然后續也可通過手術記錄等進行回顧,但是更建議盡早完成且避免信息填寫錯誤。
2.1.2 時機
2.1.2.1 定義
時機在 DACCA 中是指手術時機的意思,是特別指代結直腸癌患者在確診后是進行及時的限期手術、等待治療后才手術還是只是姑息治療為主的綜合治療[36]中手術安排的時間點。手術時機的數據采集是對外科醫生對于如何選擇合適的手術時間點這一問題的數據管理。手術時機是臨床實際的行為,而不是按照指南描述的綜合治療方案選擇的結果[37-38],其目的是用于判定給結直腸癌患者制定方案是否真實地改變了患者長期的預后。因此,手術時機是一項預測相關性指標。
2.1.2.2 分類
在 DACCA 中,對于手術時機的分類包括:① 在診斷為結直腸癌后及時進行手術;② 經過術前治療 2~3 個月后進行限期手術;③ 經過治療 4~6 個月后進行限期手術;④ 計劃為內科姑息治療但由于出現腫瘤合并癥而進行手術。
2.1.2.3 標簽與結構化
時機的數據以短文本形式作為標簽保留,在數據列中根據 2.1.2.2 的分類分別表示為“a”“b”“c”“d”這 4 種分類。在進行數據分析時,手術時機的數據結構化按照“a~d”分為 4 類作分類分析。
2.1.2.4 更新與糾錯
時機通常在開始手術前即可確定,一旦患者進行手術,術前治療經過就是固定的,所以手術時機可以作為數據進行記錄。可以通過后期的數據回顧,再次檢查并核實是否填寫準確。特別需要注意的是,容易填寫錯誤的是 b 和 c 類,需要通過對新輔助治療時間的準確判斷后才能保證填寫正確。
2.1.3 水平
2.1.3.1 定義
DACCA 中的水平是指手術技術水平,這個技術水平是指該結直腸癌患者的手術所完成的手術類型和手術完成情況達到結直腸癌同行中的水平高低。設計手術水平是對手術特征模塊中完成的整個手術處于怎樣的專業技術水平進行初步的評估,同時便于后期對于結直腸癌的創新技術進行創新價值的追蹤。
2.1.3.2 分類
在 DACCA 中,手術水平按照分級的方式設計,對標水平為非專業化操作的普外科醫生和完全專業化操作的結直腸外科醫生。若結直腸癌患者的手術為普通水平,即可以認為是絕大多數普外科醫生可以完成,則在數據庫中標記為“普通水平”;若絕大多數普外科醫生完成困難,但是作為結直腸外科專業醫生基本可以完成者,則標記為“超過普通”;若結直腸外科專業醫生可以完成,但是有相當大難度的,可能帶來術后并發癥增加且恢復困難者,則標記為“超過同行”;若在結直腸外科領域能完成該手術的專業醫生都非常少且手術難度極大者,則標記為“超過同業”。該分類級別的劃分也是手術難度逐步提高的分類方式。
2.1.3.3 標簽與結構化
在 DACCA 中,“水平”的數據標簽是采用數字形式進行保存的。其中“0”表示普通水平,“1”表示超過普通,“2”表示超過同行,“3”表示超過同業。在結構化分析中,按照分級的方式對于 0~3 四個級別進行數據分析。
2.1.3.4 糾錯與更新
對于 DACCA 中,描述手術技術水平是有一定難度的工作。通常需要對于國內結直腸外科的整體技術水平有充分的了解。所以在數據庫管理過程中,只能由長期結直腸外科專業經驗的醫療組長來判斷,需要結合國內實際情況給出數據標識。因此,該數據很難從后續的工作中進行更新和糾錯,需要及時地經符合條件的醫生完成填寫。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:汪曉東負責文章的主要撰寫工作;林容若負責文章的部分撰寫工作和參考文獻引用;劉健博負責部分文章修改工作;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員。
續前系列研究[1-15],本研究團隊對華西腸癌數據庫(Database from Colorectal Cancer,DACCA)的構建基本思路進行了總體闡述,同時對個人數據、住院管理流程、術前內外科合并癥、腫瘤特征等進行了相應的闡述和報道。本研究承接《中國普外基礎與臨床雜志》2020 年第 8 期發表的“數據庫研究第七部分:結直腸癌手術的特征(一)”[16]所做的臨床研究報道,本章節現對華西 DACCA 中結直腸癌手術特征的總體設計及其部分內容的概念、標簽與結構化進行詳細闡述。
1 DACCA 中結直腸癌手術特征模塊的構成、標簽與結構化設計
1.1 總體構成
在華西 DACCA 中,結直腸癌的手術特征模塊主要分為手術特色、手術術式、手術操作細節、手術難點以及手術質量評價這五大部分。① 手術特色部分包括手術特色、時機、水平;② 手術術式部分包括手術名稱、手術性質、保肛意愿、造口類型、造口還納日期、手術路徑、擴大切除、經括約肌間切除術(ISR)類型;③ 手術操作細節部分包括吻合類型、吻合口形式、吻合器械型號、術中加固、吻合口填塞、引流安置、網膜覆蓋、防粘連措施、盆腹膜修復、術中污染、術中化療;④ 手術難點部分包括手術時長、解剖難度、骨盆、肥胖、粘連、系膜狀態、臟器肥大、腸管質量;⑤ 手術質量評價部分包括術后死亡風險、組織損傷風險、復發預判、轉移預判、滲漏風險、手術難度自評、總體預后預判、手術質量自評。對于手術特征模塊的設計,更重視除經典的手術名稱、根治程度外對于手術的具體操作進行分解并提供主觀與客觀相結合的質量評價機制。
1.2 標簽與結構化設計的總原則
在華西 DACCA 中,手術特征模塊的數據標簽仍舊主要采用文字和數字兩種形式的填寫和標記。由于經典手術的名稱等數據都有標準化的名稱規范,因此,可以有效地進行結構化設計。但是對于手術細節等部分,由于目前這方面的評價機制相對不足,衡量手術質量的方式也一直存在爭議。因此,本數據庫構建過程中,著力完成對這些拆解手術細節的內容進行設計,為以后更好地建立評估機制,多數數據采用可以結構化的方式進行,也多考慮到了分級的結構化方式。
2 DACCA 中結直腸癌的手術特征模塊構成的定義及解讀
在本章節內容中首先解讀手術特征模塊中的手術特色部分這一部分,余下 4 個部分后期章節介紹。
2.1 手術特色部分
2.1.1 手術特色
2.1.1.1 定義
在華西 DACCA 中設計的手術特色內容是指患者在因結直腸癌接受主要手術時的特殊特色,該特色能代表不同于常規手術的技術特征或創新技術。對于結直腸癌的創新技術系列在本團隊早期發表的文獻[17-31]中曾做過詳細介紹,這些創新技術從創立至今有了較多變化,特別是伴隨技術同質化的過程,部分手術技術(如 ISR 技術)已逐步被更多結直腸外科醫生所掌握[32-35],所以,這部分技術在 DACCA 中不再屬于此項數據需要標注的。因此,對于手術特色數據的填寫在不斷更新中,目前主要內容包括極限或超極限保肛、晚期癌(聯合或不聯合新輔助治療后)極限保肛、前閉合技術等,因而這些內容目前還不能進行系統分析,還需要下一步對更新后的創新術式再次整理后進行規范手術劃分。
2.1.1.2 標簽與結構化
手術特色的數據用短文本形式作為標簽進行錄入和保存,統一用中文表達,不用英文縮寫。在對數據庫中的數據進行分析時,可對相同類型的手術特色分類進行結構化分析。
2.1.1.3 糾錯與更新
在 DACCA 中,對于手術特色的判定需要結合對于經典手術和近年來的創新手術進行判斷,需要明確為更具有特點的創新術式。因此,需在手術完成后即由高年資的主刀醫生親自完成是否為創新手術的判斷及數據錄入。雖然后續也可通過手術記錄等進行回顧,但是更建議盡早完成且避免信息填寫錯誤。
2.1.2 時機
2.1.2.1 定義
時機在 DACCA 中是指手術時機的意思,是特別指代結直腸癌患者在確診后是進行及時的限期手術、等待治療后才手術還是只是姑息治療為主的綜合治療[36]中手術安排的時間點。手術時機的數據采集是對外科醫生對于如何選擇合適的手術時間點這一問題的數據管理。手術時機是臨床實際的行為,而不是按照指南描述的綜合治療方案選擇的結果[37-38],其目的是用于判定給結直腸癌患者制定方案是否真實地改變了患者長期的預后。因此,手術時機是一項預測相關性指標。
2.1.2.2 分類
在 DACCA 中,對于手術時機的分類包括:① 在診斷為結直腸癌后及時進行手術;② 經過術前治療 2~3 個月后進行限期手術;③ 經過治療 4~6 個月后進行限期手術;④ 計劃為內科姑息治療但由于出現腫瘤合并癥而進行手術。
2.1.2.3 標簽與結構化
時機的數據以短文本形式作為標簽保留,在數據列中根據 2.1.2.2 的分類分別表示為“a”“b”“c”“d”這 4 種分類。在進行數據分析時,手術時機的數據結構化按照“a~d”分為 4 類作分類分析。
2.1.2.4 更新與糾錯
時機通常在開始手術前即可確定,一旦患者進行手術,術前治療經過就是固定的,所以手術時機可以作為數據進行記錄。可以通過后期的數據回顧,再次檢查并核實是否填寫準確。特別需要注意的是,容易填寫錯誤的是 b 和 c 類,需要通過對新輔助治療時間的準確判斷后才能保證填寫正確。
2.1.3 水平
2.1.3.1 定義
DACCA 中的水平是指手術技術水平,這個技術水平是指該結直腸癌患者的手術所完成的手術類型和手術完成情況達到結直腸癌同行中的水平高低。設計手術水平是對手術特征模塊中完成的整個手術處于怎樣的專業技術水平進行初步的評估,同時便于后期對于結直腸癌的創新技術進行創新價值的追蹤。
2.1.3.2 分類
在 DACCA 中,手術水平按照分級的方式設計,對標水平為非專業化操作的普外科醫生和完全專業化操作的結直腸外科醫生。若結直腸癌患者的手術為普通水平,即可以認為是絕大多數普外科醫生可以完成,則在數據庫中標記為“普通水平”;若絕大多數普外科醫生完成困難,但是作為結直腸外科專業醫生基本可以完成者,則標記為“超過普通”;若結直腸外科專業醫生可以完成,但是有相當大難度的,可能帶來術后并發癥增加且恢復困難者,則標記為“超過同行”;若在結直腸外科領域能完成該手術的專業醫生都非常少且手術難度極大者,則標記為“超過同業”。該分類級別的劃分也是手術難度逐步提高的分類方式。
2.1.3.3 標簽與結構化
在 DACCA 中,“水平”的數據標簽是采用數字形式進行保存的。其中“0”表示普通水平,“1”表示超過普通,“2”表示超過同行,“3”表示超過同業。在結構化分析中,按照分級的方式對于 0~3 四個級別進行數據分析。
2.1.3.4 糾錯與更新
對于 DACCA 中,描述手術技術水平是有一定難度的工作。通常需要對于國內結直腸外科的整體技術水平有充分的了解。所以在數據庫管理過程中,只能由長期結直腸外科專業經驗的醫療組長來判斷,需要結合國內實際情況給出數據標識。因此,該數據很難從后續的工作中進行更新和糾錯,需要及時地經符合條件的醫生完成填寫。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:汪曉東負責文章的主要撰寫工作;林容若負責文章的部分撰寫工作和參考文獻引用;劉健博負責部分文章修改工作;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員。