引用本文: 汪曉東, 曾渝, 李立. 數據庫建設第十部分:結直腸癌輔助治療的標簽與結構化. 中國普外基礎與臨床雜志, 2021, 28(8): 1070-1077. doi: 10.7507/1007-9424.202106113 復制
本團隊在《中國普外基礎與臨床雜志》上發表了一系列報道,對四川大學華西醫院腸癌數據庫(Database from Colorectal Cancer,DACCA)的構建思路進行了詳細闡述[1-2]。筆者現主要對 DACCA “結直腸癌輔助治療”板塊中相關數據項目的定義、分類、標簽、結構化及解讀進行詳細介紹。
1 整體框架
DACCA 中對于輔助治療數據項目的設計,經過 10 余年的反復調整,最終形成當前的數據項目結構。按照國內可參閱的公開數據庫所顯示的內容[3-5],多數數據庫的構建團隊將輔助治療內容構建為由輔助治療的方案、周期、不良反應、實體瘤療效評價標準(Response Evaluation Criteria in Solid Tumors,RECIST)等指標所構成的體系。這樣的指標體系更注重結直腸癌輔助治療的細節,而忽略治療方案決策中,醫生、患者及可參考治療標準/指南[6]之間的相互關系,以及醫患的行為。從本團隊的經驗上看,更為注重細節的輔助治療數據庫的搭建,比較適合用于治療方法的療效評價,容易形成大量輔助治療相關研究的集合,是傳統意義上的藥物真實世界研究。因而本團隊選擇的方式,更考量了輔助治療中諸多決策的行為與最終結果之間的關系,是具備“行為-結果”特征的人群真實世界的數據庫構建方式。但比較哪種數據庫的搭建方式更優并沒有意義。從單一專業病種全生命周期數據的整體構建理念上看,本團隊所選擇的方法更容易為數據應用級平臺搭建基礎。
2 輔策
2.1 定義
DACCA 中“輔策”是表示對于結直腸癌患者輔助治療的整體策略,是整個術后治療的計劃方案。截止于手術早期康復階段,患者實際上已經經歷了入院評估、術前評估和方案施行、手術評估和方案施行,以及腫瘤嚴重程度的評價,從而形成了結直腸癌術后治療的背景。根據這些背景信息,專業醫生需要提供術后的治療安排以及隨訪計劃。輔助治療整體策略就是對于術后治療的計劃,是對于患者術后治療選擇的總體指導。在 DACCA 的設計中,數據庫建設團隊將輔助治療的整體策略劃分為 7 類,詳見表 1。

2.2 標簽與結構化
在 DACCA 中,“輔策”信息的標簽采用短文本形式進行記錄,短文本的內容則為上述表格中的文字信息。在進行結構化分析中,可以采用分類的數據形式進行分析。
2.3 糾錯與更新
DACCA 中的輔助治療整體策略是在結直腸癌術后恢復期制訂的,若已經開始輔助治療,則這種策略信息的后補沒有意義,并不會為患者提供有效的指導。所以“輔策”的數據錄入需要保證及時性,這樣的信息也無法通過回顧 HIS 中的文書記錄做補充。因此對于該數據的錄入應在專業醫生對術后腫瘤嚴重程度進行最終評估后,立即記錄到 DACCA 中。這種策略信息的錄入,只能代表在術后決策點時專業醫生的臨床決策結果,而患者最終是否按照這樣的計劃進行輔助治療,則需要通過 DACCA 中其他的輔助治療數據條目做展示。
3 化指
3.1 定義
DACCA 中“化指”是指結直腸癌患者術后選擇輔助靜脈化療的必要性。一般來說,提到“指征”就是適應證,是醫生根據患者具體情況決定某種治療是否可行。在 DACCA 中結直腸癌輔助靜脈化療的指征分類詳見表 2。

需要說明的是,輔助化療中若為靜脈化療聯合口服藥物方案,如 Cape OX[7-8]等,也在此數據列中統一進行記錄。
3.2 標簽與結構化
DACCA 中的“化指”采用短文本形式進行錄入,按照上述表 2 的類型進行劃分分類,每種分類的文本作為標簽記錄在數據庫中。在進行結構化分析時,采用分類的方式進行數據分析。
3.3 糾錯與更新
結直腸癌輔助靜脈化療的推薦意見是需要參考 cpi 分期的結果,故在手術后、腫瘤嚴重程度評估完成后就可以確定主要的輔助治療策略。故“化指”的錄入還可以通過后期回溯 DACCA 數據的記錄進行審核,但是患者的身體狀態情況多數需要參考患者術后 3~4 周時的實際狀態,也較難通過數據回顧獲取信息,因此對于“化指”的錄入更建議在腫瘤嚴重程度評估完成后盡快錄入,否則也存在記憶錄入上的誤差。
4 化接
4.1 定義
在 DACCA 中“化接”是指結直腸癌的患者最終對于輔助化療的接受情況。在數據庫中,患者是否接受醫生安排的輔助化療是醫患互動行為的重要表現。基于人文、地域、經濟等諸多因素的影響,多數患者在手術后是否選擇進行治療仍舊持有比較保守的觀點,更可能出現應該輔助化療卻拒絕輔助化療的情況[9]。這種符合輔助化療條件(符合指南提供的輔助化療的適用條件),表示了經典的輔助化療的狀態,這樣的狀態更符合大量臨床隨機對照研究所需要的狀態,因而更能利用這些臨床研究去解釋和推論患者的預后。而沒有按照計劃進行化療的患者,則呈現出相對更為無序的治療與隨訪過程,這一過程呈現的狀態更符合真實世界場景。因此,DACCA 中用“化接”的數據展示了這一場景的關鍵點。
按照是否接受輔助化療,將“化接”劃分為:“是”和“否”兩類。需要說明的是,在 DACCA 前期構架過程中,對于輔助化療接受程度,采用了依據患者輔助治療整體依從性分類的方式,這樣的方式在 DACCA 中有數據記錄,具體分類詳見表 3。因此在“數據庫研究第十部分:結直腸癌的輔助治療特征分析”中有展示。但是在 DACCA 近期的調整中,數據庫建設團隊對于這項數據進行了分析,認為患者在輔助治療期間其依從性存在有多種可變的形式,難以通過單一數據進行展示,故更改為分別針對輔助化療和輔助放療的“是”和“否”的二分類形式。

4.2 標簽與結構化
在 DACCA 中,輔助化療接受情況采用數值形式建立標簽,分別由 0 表示“無”,1 表示“是”。在結構化分析中,“化接”采用二分類的方式進行數據分析。
對于上述 DACCA 前期構建方案,輔助治療的接受程度(及依從性)則是采用文本形式建立標簽,具體分類詳見表 3。在進行結構化分析中,則采用分類的方式進行數據分析。為數據庫應用分析的需要,所以本研究在此就不同時期的輔助治療接受情況的標簽與結構化進行闡述,便于讀者對此進行理解。
4.3 糾錯與更新
結直腸癌患者是否接受輔助化療是一個過程,通常需要經歷專科醫師指定方案、患者及家屬商量、到最終輔助化療的實施。所以只有在最終明確患者確實進行了輔助化療后,才能確定其數據可以填寫。“化接”的填寫重點是及時填寫,在確定實施輔助化療后及時進行填寫,避免數據遺漏。當然這一數據也是可以通過后期的隨訪進行補充和更新的,在隨訪中對于患者的術后就診信息進行核查,以及與患者及家屬進行溝通,有利于幫助該信息的完善。而且,部分患者可能在剛接觸到輔助化療的概念時是存在抵觸情緒的,后來經考慮后最終選擇進行了輔助化療,這樣的情況也應該作為接受了輔助化療。
5 化程
5.1 定義
DACCA 中“化程”是指結直腸癌輔助化療的療程數量。在經典的輔助化療方案設計中,都會對患者接受輔助化療的周期數或者時長進行一定的限制,這是因為輔助化療的有效性多數體現為患者某一個階段內的最佳效果。然而,就如前述所提到的,患者可能不一定會完全按照規定的輔助化療周期數或者時長來進行,減少或者增加周期的情況也較多見。因此,存在規范的輔助化療過程與不規范的輔助化療過程,通過療程數量的數據也能體現輔助化療的真實場景。
5.2 標簽與結構化
在 DACCA 中,輔助化療療程數量采用數值形式進行標簽記錄,數字的單位為“周期”,取整數。若明確患者未進行輔助化療,數字填寫為 0,其他均填寫不為 0 的整數。在結構化分析中,針對數值進行數據分析。
5.3 糾錯與更新
輔助化療的療程數量可以通過多種形式進行數據錄入,在輔助化療確定完成后,可以選擇在 DACCA 內填寫。還可以通過 HIS 系統對于信息進行回溯,檢查輔助化療療程數量的準確性,并有利于后期反復核對。應注意的是,部分患者可能會在一定階段后額外追加輔助化療,這種情況的出現就需要通過隨訪,及時對療程數量進行更新。
6 化毒
6.1 定義
DACCA 中“化毒”是指結直腸癌輔助化療中遇到的毒性反應。輔助化療過程中的毒副反應的分級目前是通過通用毒性標準(common toxicity criteria,CTC)進行的[7, 10-11],由于這些毒副反應可能會影響輔助化療方案的最終執行情況,如:是否完成計劃方案、是否減量等,所以可以認為這種分級的毒副反應是一個中間信息。因此,在 DACCA 中對于輔助化療的毒副反應采用有無的方式作為主要記錄方式,并對于Ⅲ級以上的毒副反應進行文字記錄,但不用作全生命周期的數據分析。
6.2 標簽與結構化
在 DACCA 中,采用數值形式作為標簽,記錄是否出現毒副反應,其中 0 表示無,1 表示是。然后再用短文本形式作為標簽,記錄毒副反應的具體名稱。在進行結構化分析時,僅提取是否出現毒副反應數據,按照分類資料進行數據分析。
6.3 糾錯與更新
輔助化療的毒副反應需要在治療的過程中進行記錄,所以可以通過 HIS 對病程進行詳細的回顧后記錄。這種記錄的方式相對比較可靠。尤其是對Ⅲ級以上的毒副反應通常在臨床管理過程中有一定的處置醫囑,所以后期的數據糾錯比較好進行。需要注意的是,結直腸癌患者的輔助化療可能根據自身情況,選擇在任一有資質的醫療機構進行,而醫療機構之間的 HIS 是不相通的,所以對于這種無法便捷地回顧 HIS 文字記錄的情況,則需要通過隨訪過程中患者的描述及時進行辨別并記錄。而且盡可能在輔助治療期間就對該數據進行記錄,避免記憶性記錄帶來的錯誤。
7 化效
7.1 定義
DACCA 中“化效”的定義是指結直腸癌輔助化療后初步評估的療效。并非所有接受輔助治療的結直腸癌患者都還處于帶瘤狀態,因此通過實體腫瘤縮小程度(采用 RESICT 標準)評價患者的輔助治療效果通常是不可行的。同時,目前我們對于接受輔助治療的結直腸癌患者,要做出療效評價時,則會選擇結合隨訪的結果,通過評估復發率、死亡率等預后指標進行評價,這也是最為主流的輔助治療效果評價方式。但在一定時間內接受輔助治療的結直腸癌患者,是否有較為滿意的效果,是否需要對于治療方案進行調整,則還缺乏相應的指標。在 DACCA 的設計中,數據庫管理團隊采用了本文所述的輔助化療效果的近期結果評價方式,嘗試建立更為快捷的輔助治療結果評價機制。其分類方式詳見表 4。

7.2 標簽與結構化
在 DACCA 中,輔助化療的效果采用短文本形式進行標簽記錄。其標簽的內容則為表 4 中分類的文字。在結構化分析中,采用分類的方式進行數據分析。
7.3 糾錯與更新
DACCA 中“化效”的記錄也需要及時。對于輔助化療效果的評價,通常不是單純依賴某一指標,而需要結合患者實際進行輔助化療的完成程度,同時需要多次腫瘤標志物的對比,以及影像學資料的對比獲得。所以在輔助治療進行中,就需要由專業醫生及時進行判斷,尤其是“無效”或者“較差”的判斷,不僅是效果評價,還是對于醫生治療決策的指導建議,可以幫助醫生及時做出方案的調整。因此,需在輔助治療期間及時對于該數據進行錄入,后期將無法進行準確的補充。
8 化規
8.1 定義
DACCA 中“化規”是指結直腸癌患者在確定完成輔助化療后,最終的化療方案是否與國家結直腸癌診療中的規范方案[6]相符,反映輔助化療的規范化程度。結直腸診療指南中對于輔助化療有相應的規范,并對于化療方案及周期都進行了設計。當在真實世界場景下,患者完成了指南所述的輔助治療方案,則在數據表中填寫“是”,反之為“否”。
8.2 標簽與結構化
在 DACCA 中,輔助化療規范化程度采用數值形式作為標簽,其中數字 1 表示“是”,數字 2 表示“否”。在結構化分析時,輔助化療規范化程度的信息采用二分類的方式進行數據分析。
8.3 糾錯與更新
輔助化療是否按照結直腸癌診療指南進行是相對比較好進行多次核對的數據信息。所以數據錄入的時候,通常會選擇在患者輔助治療完成后,通過 HIS 中提供的患者輔助治療信息,確定患者的輔助化療方案是否遵照結直腸癌診療指南進行。在對數據進行糾錯時,尤其需要注意的是,若患者不是在一家醫療機構完成輔助治療的,則需要確定不同機構提供的治療方案是否都符合結直腸癌診療指南,并匯總整體的輔助治療,這也是采用全生命周期數據庫管理的重要作用。
9 靶向治療
9.1 定義
在 DACCA 中分別由“口靶”和“靜靶”來體現靶向治療的信息,分別代表口服靶向藥物治療和靜脈應用靶向藥物的意思[12]。在數據庫中將靶向治療的信息單獨提出,是便于在后期評估應用靶向治療是否對改善預后的決策提供了數據參數。在 DACCA 中,對應“口靶”和“靜靶”的數據框中,直接填寫所使用靶向藥物的藥物名稱。
9.2 標簽與結構化
在 DACCA 中“口靶”和“靜靶”采用短文本形式進行標簽記錄,若患者使用多種靶向藥物,則每一種靶向藥物之間用“,”隔開。在結構化分析中,將分別提取每種靶向藥物,并將同一種靶向藥物歸為一類,進行分類數據分析。
9.3 糾錯與更新
在 DACCA 中對于靶向藥物的使用信息記錄就是采用治療后記錄的方式,所以重點還是針對輔助治療中選擇的靶向治療藥物進行記錄,當治療記錄中明確有使用靶向藥物時,按照不同類型記錄在對應的數據列中。需要注意的是,當患者在多家醫療機構治療時,要避免靶向藥物治療情況記錄的遺漏。
10 放指
10.1 定義
DACCA 中“放指”是指結直腸癌患者術后選擇輔助放療的必要性,同前所述輔助化療的說明。在 DACCA 中結直腸癌輔助放療的指征分類詳見表 5。

10.2 標簽與結構化
DACCA 中的“放指”采用短文本形式進行錄入,按照表 5 的類型進行劃分分類,每種分類的文本作為標簽記錄在數據庫中。在進行結構化分析時,采用分類的方式進行數據分析。
10.3 糾錯與更新
結直腸癌輔助放療的推薦意見需要參考 cpi 分期的結果,以及高風險因素和腫瘤部位,故與輔助化療的推薦意見相似,在手術后、腫瘤嚴重程度評估完成后就可以確定輔助放療的策略。“放指”的錄入也可以通過后期回溯 DACCA 數據的記錄進行審核,對于“放指”的錄入也建議在腫瘤嚴重程度評估完成后盡快錄入,否則也存在記憶錄入上的誤差。
11 放推
11.1 定義
DACCA 中“放推”的定義指專業醫生向結直腸癌患者推薦輔助放療的情況。基于文化、地域、經濟等諸多因素,在西南地區患者的輔助放療接受度一直不高。由于 DACCA 的源數據多來自西部地區的結直腸癌患者,因此在對數據庫進行構架時,筆者所在團隊將該因素作為數據參數納入數據庫的構建中。而輔助放療的接納情況也還需要更多的人群研究做依據,該數據參數可以作為未來數據分析的依據之一。按照專業醫生是否向患者推薦輔助放療,分為“是”和“否”兩類。
11.2 標簽與結構化
在 DACCA 中,輔助放療推薦情況采用數值形式作為標簽,其中數字 1 表示“是”,數字 0 表示“否”。在結構化分析時,按照二分類方式進行數據分析。
11.3 糾錯與更新
由于是否推薦輔助放療是專業醫生醫療行為相關的數據,是需要對于醫生在實際臨床決策過程中的選擇做出記錄,因此需要將專業醫生的臨床決策及時錄入 DACCA 中。該數據仍舊需要注意其及時性,時間點也適宜選擇在輔助放療是否推薦以后。通常通過回顧的形式難以對行為數據進行補充。我們也可以通過在隨訪患者過程中,向患者及家屬采集相應的信息來進行后期的數據更新。但這樣的方式可能會有一定的誤差,因來自患者及家屬對于醫生決策行為的記憶錯誤,甚至于理解層面存在誤差。
12 放接
12.1 定義
DACCA 中“放接”是指結直腸癌患者最終對于輔助放療的接受情況。而對于輔助放療接受情況的理解如前段輔助化療部分的內容。按照是否接受輔助化療,將“化接”劃分為“是”和“否”兩類。
12.2 標簽與結構化
在 DACCA 中,輔助放療接受情況采用數值形式建立標簽,分別由 0 表示“否”,1 表示“是”。在結構化分析中,“化接”則采用二分類的形式進行數據分析。
12.3 糾錯與更新
針對輔助放療接受情況的糾錯與更新注意事項,可以參考輔助化療接受情況的說明。應注意的是,結直腸癌患者可能術后進行了輔助放化療聯合治療[13],在進行信息確認以及數據錄入的過程中,要注意核實是否進行了放療與化療相結合的治療方式,避免遺漏其中任一一種輔助治療的信息。
13 副作用
13.1 定義
DACCA 中“副作用”是指在結直腸癌輔助放療中及治療后長期隨訪期間表現出的放療相關的不良反應。這里也需要區別于輔助化療的信息。輔助放療不良反應只記錄放療相關的不良反應,只記錄類型不記錄嚴重程度。而且由于輔助放療不良反應發生的特殊性,部分不良反應會在長期隨訪階段被發現和確診。一旦確診就需要在此進行記錄。其記錄的形式為,直接將輔助放療不良反應的疾病診斷記錄在數據框內。
13.2 標簽與結構化
在 DACCA 中輔助放療不良反應采用短文本形式進行記錄,每一種不良反應的疾病診斷按照 ICD-10 的標準描述進行文字書寫,若有多種不良反應的疾病診斷,則每種診斷之間用“,”隔開。在進行結構化分析的時候,按照疾病診斷分類后進行分類數據的分析。
13.3 糾錯與更新
對于輔助放療不良反應的記錄需要持續一段較長的時間,通常還需要多次通過后續的疾病診斷補充到 DACCA 中。因此該數據的重點是持續更新。而對于輔助放療不良反應的監控,重點在明確疾病的診斷后才做記錄。如比較常見的直腸癌輔助放療后放療性直腸炎,需要在明確診斷后才做記錄,而在患者剛出現一些輕微的肛門墜脹及異常分泌物時,可以暫時不作為需錄入的數據。
14 效果
14.1 定義
DACCA 中“效果”是特指結直腸癌患者輔助放療后的效果。由于患者可能接受輔助放化療的聯合治療,在聯合治療的階段,輔助治療的效果統一記錄在輔助化療的數據列中,當遇到原治療計劃中未選擇輔助放療,而后調整增加了輔助放療,以及僅僅應用輔助放療(含輔助放療聯合單藥口服)的情況時,才在該數據列記錄相關數據。其分類的方式見表 6。

14.2 標簽與結構化
在 DACCA 中,輔助放療的效果采用短文本形式進行記錄,其標簽內容按照上述的分類文字進行記錄。在結構化分析中,采用分類的形式進行數據分析。
14.3 糾錯與更新
如同輔助化療的效果評價,DACCA 中對于輔助放療的效果也是需要綜合過程和治療后幾個階段的效果評估。其內容的理解參照輔助化療效果評價的數據糾錯與更新。重點仍舊是記錄的及時性。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:汪曉東負責文章的主要撰寫工作;曾渝負責文章部分撰寫工作;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員。
倫理聲明:本研究已通過四川大學華西醫院倫理學委員會的審核并同意[批文編號:2019 年審(140)號]。
本團隊在《中國普外基礎與臨床雜志》上發表了一系列報道,對四川大學華西醫院腸癌數據庫(Database from Colorectal Cancer,DACCA)的構建思路進行了詳細闡述[1-2]。筆者現主要對 DACCA “結直腸癌輔助治療”板塊中相關數據項目的定義、分類、標簽、結構化及解讀進行詳細介紹。
1 整體框架
DACCA 中對于輔助治療數據項目的設計,經過 10 余年的反復調整,最終形成當前的數據項目結構。按照國內可參閱的公開數據庫所顯示的內容[3-5],多數數據庫的構建團隊將輔助治療內容構建為由輔助治療的方案、周期、不良反應、實體瘤療效評價標準(Response Evaluation Criteria in Solid Tumors,RECIST)等指標所構成的體系。這樣的指標體系更注重結直腸癌輔助治療的細節,而忽略治療方案決策中,醫生、患者及可參考治療標準/指南[6]之間的相互關系,以及醫患的行為。從本團隊的經驗上看,更為注重細節的輔助治療數據庫的搭建,比較適合用于治療方法的療效評價,容易形成大量輔助治療相關研究的集合,是傳統意義上的藥物真實世界研究。因而本團隊選擇的方式,更考量了輔助治療中諸多決策的行為與最終結果之間的關系,是具備“行為-結果”特征的人群真實世界的數據庫構建方式。但比較哪種數據庫的搭建方式更優并沒有意義。從單一專業病種全生命周期數據的整體構建理念上看,本團隊所選擇的方法更容易為數據應用級平臺搭建基礎。
2 輔策
2.1 定義
DACCA 中“輔策”是表示對于結直腸癌患者輔助治療的整體策略,是整個術后治療的計劃方案。截止于手術早期康復階段,患者實際上已經經歷了入院評估、術前評估和方案施行、手術評估和方案施行,以及腫瘤嚴重程度的評價,從而形成了結直腸癌術后治療的背景。根據這些背景信息,專業醫生需要提供術后的治療安排以及隨訪計劃。輔助治療整體策略就是對于術后治療的計劃,是對于患者術后治療選擇的總體指導。在 DACCA 的設計中,數據庫建設團隊將輔助治療的整體策略劃分為 7 類,詳見表 1。

2.2 標簽與結構化
在 DACCA 中,“輔策”信息的標簽采用短文本形式進行記錄,短文本的內容則為上述表格中的文字信息。在進行結構化分析中,可以采用分類的數據形式進行分析。
2.3 糾錯與更新
DACCA 中的輔助治療整體策略是在結直腸癌術后恢復期制訂的,若已經開始輔助治療,則這種策略信息的后補沒有意義,并不會為患者提供有效的指導。所以“輔策”的數據錄入需要保證及時性,這樣的信息也無法通過回顧 HIS 中的文書記錄做補充。因此對于該數據的錄入應在專業醫生對術后腫瘤嚴重程度進行最終評估后,立即記錄到 DACCA 中。這種策略信息的錄入,只能代表在術后決策點時專業醫生的臨床決策結果,而患者最終是否按照這樣的計劃進行輔助治療,則需要通過 DACCA 中其他的輔助治療數據條目做展示。
3 化指
3.1 定義
DACCA 中“化指”是指結直腸癌患者術后選擇輔助靜脈化療的必要性。一般來說,提到“指征”就是適應證,是醫生根據患者具體情況決定某種治療是否可行。在 DACCA 中結直腸癌輔助靜脈化療的指征分類詳見表 2。

需要說明的是,輔助化療中若為靜脈化療聯合口服藥物方案,如 Cape OX[7-8]等,也在此數據列中統一進行記錄。
3.2 標簽與結構化
DACCA 中的“化指”采用短文本形式進行錄入,按照上述表 2 的類型進行劃分分類,每種分類的文本作為標簽記錄在數據庫中。在進行結構化分析時,采用分類的方式進行數據分析。
3.3 糾錯與更新
結直腸癌輔助靜脈化療的推薦意見是需要參考 cpi 分期的結果,故在手術后、腫瘤嚴重程度評估完成后就可以確定主要的輔助治療策略。故“化指”的錄入還可以通過后期回溯 DACCA 數據的記錄進行審核,但是患者的身體狀態情況多數需要參考患者術后 3~4 周時的實際狀態,也較難通過數據回顧獲取信息,因此對于“化指”的錄入更建議在腫瘤嚴重程度評估完成后盡快錄入,否則也存在記憶錄入上的誤差。
4 化接
4.1 定義
在 DACCA 中“化接”是指結直腸癌的患者最終對于輔助化療的接受情況。在數據庫中,患者是否接受醫生安排的輔助化療是醫患互動行為的重要表現。基于人文、地域、經濟等諸多因素的影響,多數患者在手術后是否選擇進行治療仍舊持有比較保守的觀點,更可能出現應該輔助化療卻拒絕輔助化療的情況[9]。這種符合輔助化療條件(符合指南提供的輔助化療的適用條件),表示了經典的輔助化療的狀態,這樣的狀態更符合大量臨床隨機對照研究所需要的狀態,因而更能利用這些臨床研究去解釋和推論患者的預后。而沒有按照計劃進行化療的患者,則呈現出相對更為無序的治療與隨訪過程,這一過程呈現的狀態更符合真實世界場景。因此,DACCA 中用“化接”的數據展示了這一場景的關鍵點。
按照是否接受輔助化療,將“化接”劃分為:“是”和“否”兩類。需要說明的是,在 DACCA 前期構架過程中,對于輔助化療接受程度,采用了依據患者輔助治療整體依從性分類的方式,這樣的方式在 DACCA 中有數據記錄,具體分類詳見表 3。因此在“數據庫研究第十部分:結直腸癌的輔助治療特征分析”中有展示。但是在 DACCA 近期的調整中,數據庫建設團隊對于這項數據進行了分析,認為患者在輔助治療期間其依從性存在有多種可變的形式,難以通過單一數據進行展示,故更改為分別針對輔助化療和輔助放療的“是”和“否”的二分類形式。

4.2 標簽與結構化
在 DACCA 中,輔助化療接受情況采用數值形式建立標簽,分別由 0 表示“無”,1 表示“是”。在結構化分析中,“化接”采用二分類的方式進行數據分析。
對于上述 DACCA 前期構建方案,輔助治療的接受程度(及依從性)則是采用文本形式建立標簽,具體分類詳見表 3。在進行結構化分析中,則采用分類的方式進行數據分析。為數據庫應用分析的需要,所以本研究在此就不同時期的輔助治療接受情況的標簽與結構化進行闡述,便于讀者對此進行理解。
4.3 糾錯與更新
結直腸癌患者是否接受輔助化療是一個過程,通常需要經歷專科醫師指定方案、患者及家屬商量、到最終輔助化療的實施。所以只有在最終明確患者確實進行了輔助化療后,才能確定其數據可以填寫。“化接”的填寫重點是及時填寫,在確定實施輔助化療后及時進行填寫,避免數據遺漏。當然這一數據也是可以通過后期的隨訪進行補充和更新的,在隨訪中對于患者的術后就診信息進行核查,以及與患者及家屬進行溝通,有利于幫助該信息的完善。而且,部分患者可能在剛接觸到輔助化療的概念時是存在抵觸情緒的,后來經考慮后最終選擇進行了輔助化療,這樣的情況也應該作為接受了輔助化療。
5 化程
5.1 定義
DACCA 中“化程”是指結直腸癌輔助化療的療程數量。在經典的輔助化療方案設計中,都會對患者接受輔助化療的周期數或者時長進行一定的限制,這是因為輔助化療的有效性多數體現為患者某一個階段內的最佳效果。然而,就如前述所提到的,患者可能不一定會完全按照規定的輔助化療周期數或者時長來進行,減少或者增加周期的情況也較多見。因此,存在規范的輔助化療過程與不規范的輔助化療過程,通過療程數量的數據也能體現輔助化療的真實場景。
5.2 標簽與結構化
在 DACCA 中,輔助化療療程數量采用數值形式進行標簽記錄,數字的單位為“周期”,取整數。若明確患者未進行輔助化療,數字填寫為 0,其他均填寫不為 0 的整數。在結構化分析中,針對數值進行數據分析。
5.3 糾錯與更新
輔助化療的療程數量可以通過多種形式進行數據錄入,在輔助化療確定完成后,可以選擇在 DACCA 內填寫。還可以通過 HIS 系統對于信息進行回溯,檢查輔助化療療程數量的準確性,并有利于后期反復核對。應注意的是,部分患者可能會在一定階段后額外追加輔助化療,這種情況的出現就需要通過隨訪,及時對療程數量進行更新。
6 化毒
6.1 定義
DACCA 中“化毒”是指結直腸癌輔助化療中遇到的毒性反應。輔助化療過程中的毒副反應的分級目前是通過通用毒性標準(common toxicity criteria,CTC)進行的[7, 10-11],由于這些毒副反應可能會影響輔助化療方案的最終執行情況,如:是否完成計劃方案、是否減量等,所以可以認為這種分級的毒副反應是一個中間信息。因此,在 DACCA 中對于輔助化療的毒副反應采用有無的方式作為主要記錄方式,并對于Ⅲ級以上的毒副反應進行文字記錄,但不用作全生命周期的數據分析。
6.2 標簽與結構化
在 DACCA 中,采用數值形式作為標簽,記錄是否出現毒副反應,其中 0 表示無,1 表示是。然后再用短文本形式作為標簽,記錄毒副反應的具體名稱。在進行結構化分析時,僅提取是否出現毒副反應數據,按照分類資料進行數據分析。
6.3 糾錯與更新
輔助化療的毒副反應需要在治療的過程中進行記錄,所以可以通過 HIS 對病程進行詳細的回顧后記錄。這種記錄的方式相對比較可靠。尤其是對Ⅲ級以上的毒副反應通常在臨床管理過程中有一定的處置醫囑,所以后期的數據糾錯比較好進行。需要注意的是,結直腸癌患者的輔助化療可能根據自身情況,選擇在任一有資質的醫療機構進行,而醫療機構之間的 HIS 是不相通的,所以對于這種無法便捷地回顧 HIS 文字記錄的情況,則需要通過隨訪過程中患者的描述及時進行辨別并記錄。而且盡可能在輔助治療期間就對該數據進行記錄,避免記憶性記錄帶來的錯誤。
7 化效
7.1 定義
DACCA 中“化效”的定義是指結直腸癌輔助化療后初步評估的療效。并非所有接受輔助治療的結直腸癌患者都還處于帶瘤狀態,因此通過實體腫瘤縮小程度(采用 RESICT 標準)評價患者的輔助治療效果通常是不可行的。同時,目前我們對于接受輔助治療的結直腸癌患者,要做出療效評價時,則會選擇結合隨訪的結果,通過評估復發率、死亡率等預后指標進行評價,這也是最為主流的輔助治療效果評價方式。但在一定時間內接受輔助治療的結直腸癌患者,是否有較為滿意的效果,是否需要對于治療方案進行調整,則還缺乏相應的指標。在 DACCA 的設計中,數據庫管理團隊采用了本文所述的輔助化療效果的近期結果評價方式,嘗試建立更為快捷的輔助治療結果評價機制。其分類方式詳見表 4。

7.2 標簽與結構化
在 DACCA 中,輔助化療的效果采用短文本形式進行標簽記錄。其標簽的內容則為表 4 中分類的文字。在結構化分析中,采用分類的方式進行數據分析。
7.3 糾錯與更新
DACCA 中“化效”的記錄也需要及時。對于輔助化療效果的評價,通常不是單純依賴某一指標,而需要結合患者實際進行輔助化療的完成程度,同時需要多次腫瘤標志物的對比,以及影像學資料的對比獲得。所以在輔助治療進行中,就需要由專業醫生及時進行判斷,尤其是“無效”或者“較差”的判斷,不僅是效果評價,還是對于醫生治療決策的指導建議,可以幫助醫生及時做出方案的調整。因此,需在輔助治療期間及時對于該數據進行錄入,后期將無法進行準確的補充。
8 化規
8.1 定義
DACCA 中“化規”是指結直腸癌患者在確定完成輔助化療后,最終的化療方案是否與國家結直腸癌診療中的規范方案[6]相符,反映輔助化療的規范化程度。結直腸診療指南中對于輔助化療有相應的規范,并對于化療方案及周期都進行了設計。當在真實世界場景下,患者完成了指南所述的輔助治療方案,則在數據表中填寫“是”,反之為“否”。
8.2 標簽與結構化
在 DACCA 中,輔助化療規范化程度采用數值形式作為標簽,其中數字 1 表示“是”,數字 2 表示“否”。在結構化分析時,輔助化療規范化程度的信息采用二分類的方式進行數據分析。
8.3 糾錯與更新
輔助化療是否按照結直腸癌診療指南進行是相對比較好進行多次核對的數據信息。所以數據錄入的時候,通常會選擇在患者輔助治療完成后,通過 HIS 中提供的患者輔助治療信息,確定患者的輔助化療方案是否遵照結直腸癌診療指南進行。在對數據進行糾錯時,尤其需要注意的是,若患者不是在一家醫療機構完成輔助治療的,則需要確定不同機構提供的治療方案是否都符合結直腸癌診療指南,并匯總整體的輔助治療,這也是采用全生命周期數據庫管理的重要作用。
9 靶向治療
9.1 定義
在 DACCA 中分別由“口靶”和“靜靶”來體現靶向治療的信息,分別代表口服靶向藥物治療和靜脈應用靶向藥物的意思[12]。在數據庫中將靶向治療的信息單獨提出,是便于在后期評估應用靶向治療是否對改善預后的決策提供了數據參數。在 DACCA 中,對應“口靶”和“靜靶”的數據框中,直接填寫所使用靶向藥物的藥物名稱。
9.2 標簽與結構化
在 DACCA 中“口靶”和“靜靶”采用短文本形式進行標簽記錄,若患者使用多種靶向藥物,則每一種靶向藥物之間用“,”隔開。在結構化分析中,將分別提取每種靶向藥物,并將同一種靶向藥物歸為一類,進行分類數據分析。
9.3 糾錯與更新
在 DACCA 中對于靶向藥物的使用信息記錄就是采用治療后記錄的方式,所以重點還是針對輔助治療中選擇的靶向治療藥物進行記錄,當治療記錄中明確有使用靶向藥物時,按照不同類型記錄在對應的數據列中。需要注意的是,當患者在多家醫療機構治療時,要避免靶向藥物治療情況記錄的遺漏。
10 放指
10.1 定義
DACCA 中“放指”是指結直腸癌患者術后選擇輔助放療的必要性,同前所述輔助化療的說明。在 DACCA 中結直腸癌輔助放療的指征分類詳見表 5。

10.2 標簽與結構化
DACCA 中的“放指”采用短文本形式進行錄入,按照表 5 的類型進行劃分分類,每種分類的文本作為標簽記錄在數據庫中。在進行結構化分析時,采用分類的方式進行數據分析。
10.3 糾錯與更新
結直腸癌輔助放療的推薦意見需要參考 cpi 分期的結果,以及高風險因素和腫瘤部位,故與輔助化療的推薦意見相似,在手術后、腫瘤嚴重程度評估完成后就可以確定輔助放療的策略。“放指”的錄入也可以通過后期回溯 DACCA 數據的記錄進行審核,對于“放指”的錄入也建議在腫瘤嚴重程度評估完成后盡快錄入,否則也存在記憶錄入上的誤差。
11 放推
11.1 定義
DACCA 中“放推”的定義指專業醫生向結直腸癌患者推薦輔助放療的情況。基于文化、地域、經濟等諸多因素,在西南地區患者的輔助放療接受度一直不高。由于 DACCA 的源數據多來自西部地區的結直腸癌患者,因此在對數據庫進行構架時,筆者所在團隊將該因素作為數據參數納入數據庫的構建中。而輔助放療的接納情況也還需要更多的人群研究做依據,該數據參數可以作為未來數據分析的依據之一。按照專業醫生是否向患者推薦輔助放療,分為“是”和“否”兩類。
11.2 標簽與結構化
在 DACCA 中,輔助放療推薦情況采用數值形式作為標簽,其中數字 1 表示“是”,數字 0 表示“否”。在結構化分析時,按照二分類方式進行數據分析。
11.3 糾錯與更新
由于是否推薦輔助放療是專業醫生醫療行為相關的數據,是需要對于醫生在實際臨床決策過程中的選擇做出記錄,因此需要將專業醫生的臨床決策及時錄入 DACCA 中。該數據仍舊需要注意其及時性,時間點也適宜選擇在輔助放療是否推薦以后。通常通過回顧的形式難以對行為數據進行補充。我們也可以通過在隨訪患者過程中,向患者及家屬采集相應的信息來進行后期的數據更新。但這樣的方式可能會有一定的誤差,因來自患者及家屬對于醫生決策行為的記憶錯誤,甚至于理解層面存在誤差。
12 放接
12.1 定義
DACCA 中“放接”是指結直腸癌患者最終對于輔助放療的接受情況。而對于輔助放療接受情況的理解如前段輔助化療部分的內容。按照是否接受輔助化療,將“化接”劃分為“是”和“否”兩類。
12.2 標簽與結構化
在 DACCA 中,輔助放療接受情況采用數值形式建立標簽,分別由 0 表示“否”,1 表示“是”。在結構化分析中,“化接”則采用二分類的形式進行數據分析。
12.3 糾錯與更新
針對輔助放療接受情況的糾錯與更新注意事項,可以參考輔助化療接受情況的說明。應注意的是,結直腸癌患者可能術后進行了輔助放化療聯合治療[13],在進行信息確認以及數據錄入的過程中,要注意核實是否進行了放療與化療相結合的治療方式,避免遺漏其中任一一種輔助治療的信息。
13 副作用
13.1 定義
DACCA 中“副作用”是指在結直腸癌輔助放療中及治療后長期隨訪期間表現出的放療相關的不良反應。這里也需要區別于輔助化療的信息。輔助放療不良反應只記錄放療相關的不良反應,只記錄類型不記錄嚴重程度。而且由于輔助放療不良反應發生的特殊性,部分不良反應會在長期隨訪階段被發現和確診。一旦確診就需要在此進行記錄。其記錄的形式為,直接將輔助放療不良反應的疾病診斷記錄在數據框內。
13.2 標簽與結構化
在 DACCA 中輔助放療不良反應采用短文本形式進行記錄,每一種不良反應的疾病診斷按照 ICD-10 的標準描述進行文字書寫,若有多種不良反應的疾病診斷,則每種診斷之間用“,”隔開。在進行結構化分析的時候,按照疾病診斷分類后進行分類數據的分析。
13.3 糾錯與更新
對于輔助放療不良反應的記錄需要持續一段較長的時間,通常還需要多次通過后續的疾病診斷補充到 DACCA 中。因此該數據的重點是持續更新。而對于輔助放療不良反應的監控,重點在明確疾病的診斷后才做記錄。如比較常見的直腸癌輔助放療后放療性直腸炎,需要在明確診斷后才做記錄,而在患者剛出現一些輕微的肛門墜脹及異常分泌物時,可以暫時不作為需錄入的數據。
14 效果
14.1 定義
DACCA 中“效果”是特指結直腸癌患者輔助放療后的效果。由于患者可能接受輔助放化療的聯合治療,在聯合治療的階段,輔助治療的效果統一記錄在輔助化療的數據列中,當遇到原治療計劃中未選擇輔助放療,而后調整增加了輔助放療,以及僅僅應用輔助放療(含輔助放療聯合單藥口服)的情況時,才在該數據列記錄相關數據。其分類的方式見表 6。

14.2 標簽與結構化
在 DACCA 中,輔助放療的效果采用短文本形式進行記錄,其標簽內容按照上述的分類文字進行記錄。在結構化分析中,采用分類的形式進行數據分析。
14.3 糾錯與更新
如同輔助化療的效果評價,DACCA 中對于輔助放療的效果也是需要綜合過程和治療后幾個階段的效果評估。其內容的理解參照輔助化療效果評價的數據糾錯與更新。重點仍舊是記錄的及時性。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:汪曉東負責文章的主要撰寫工作;曾渝負責文章部分撰寫工作;汪曉東和李立共同為華西 DACCA 的構建者和主要應用分析人員。
倫理聲明:本研究已通過四川大學華西醫院倫理學委員會的審核并同意[批文編號:2019 年審(140)號]。