引用本文: 劉一鷗, 史潔, 李雪松, 嚴超, 張冰清, 賀晶, 王思瑜, 周文靜. 基于中國抗癲癇協會新版腦電報告系統的癲癇患者腦電大數據初分析. 癲癇雜志, 2022, 8(6): 524-528. doi: 10.7507/2096-0247.202209001 復制
在一個前所未有的高度合作和數據共享的時代,大數據研究已經成為時代所需,它滿足了快速處理大量不同數據的需求[1-2]。癲癇是一種在臨床和研究領域都具有廣泛異質性的疾病,因此適合大數據概念和技術[3]。癲癇數據是多模態的,需要大數據原則來妥善處理,特別是腦電圖數據,涵蓋背景活動、睡眠波形、異常放電模式、發作類型等各個方面,因此需要更加專業、便捷并能實現數據分析、共享的平臺來承載腦電圖數據[4]。然而目前中國存在腦電報告術語及報告界面不規范、大量腦電數據無法共享的問題。CAAE主持研發的新版腦電圖報告系統(Clinical EEG report software,CERS)便是在這一契機下應用而生。CERS參考國際抗癲癇聯盟歐洲委員會的“基于計算機的標準化腦電圖報告系統”(Standardized computer-based organized reporting of EEG,SCORE)的標準,SCORE實現了報告流程的規范化、癲癇專業術語的統一,并可以實現數據共享、教學指導作用,成為癲癇診療的重要臨床工具[5-6]。因此,2019年CAAE神經電生理分會參照SCORE模式,主持并研發了CERS系統,該系統同時參照了權威的診斷及分類指南,如國際抗癲癇聯盟(International League Against Epilepsy,ILAE)于2017年推出的“可操作性癲癇發作分類方案”等,目的是實現癲癇術語標準化。同時,CERS在腦電軟件錄入界面附有癲癇相關概念注釋,相當于對癲癇本體論的進一步解讀,更加專業和實用[7]。CERS能夠實現統一的數據上傳、存儲、進一步實現資源及數據共享,為臨床研究提供了便利的條件和巨大的空間。經過兩年多的臨床使用、CERS因其內容的規范、便捷的使用界面已經被廣大腦電圖醫生接受,但其在科研方面的應用的價值還不為醫生熟知。本文應用CERS系統導出的腦電圖數據資料、結合已有數據庫資料進行大數據初分析,旨在探討CERS的科研應用機制,從而探索三級癲癇診療中心腦電大數據庫的建立模式,并希望以此建立多中心合作的腦電圖大數據共享模式。
1 資料與方法
CERS是 CAAE腦電圖和神經電生理分會與華科精準公司合作研發的標準化腦電圖報告系統。CERS采用國際通用標準化腦電圖術語,涵蓋符合國際規范要求的各項腦電圖報告內容(圖1)。我癲癇中心作為率先試用的腦電圖培訓基地、參與該系統的論證和設計過程。

點擊紅框內問號可以顯示對該錄入選項的詳細分類解讀
Figure1. CERS "Attack Event" entry interfaceClick the question mark in the red box to display a detailed classification of this option
該研究回顧性納入2021年5月—2022年5月在清華大學玉泉醫院癲癇中心行腦電圖檢查、并應用CAAE新版腦電報告系統出具腦電報告的患者6 380例,腦電圖醫生根據系統界面提示進行患者腦電相關信息錄入,包括基本信息、背景活動、睡眠周期、發作間期癲癇樣放電、發作事件、腦電圖診斷等。信息錄入過程自動生成報告并將這些特性提供給數據庫,最后將腦電圖數據導出。同時將這6 380例患者導出的腦電圖數據和既往本癲癇中心的患者信息數據庫進行數據整合,該信息數據庫涵蓋了所有門診就診患者所有相關信息,包括基本信息(性別、年齡等)、所屬地域信息、腦電圖報告PDF資料、影像學資料、基因報告等,手術病人還包括手術信息、影像后處理結果、術后回訪信息等。從而初步搭建患者的腦電報告數據庫, 并進一步進行相關數據分析。該研究獲得清華大學玉泉醫院醫學倫理委員會審核批準。
2 結 果
2.1 結合6380例患者在已有數據庫資料的相關資料分析
在6 380例患者中,男3 790例(59.4%)、女2 590例(40.6%)。新版腦電報告系統自動定義并歸類不同年齡組:所有行腦電圖檢查患者中,各年齡段比例分別為兒童3 290例(51.0%)、成人1 372例(22.0%)、青少年 753 例(12.0%)、幼兒730例(11.0 %),嬰兒235例(4.0%)。腦電總記錄時間:總記錄時間≤4 h的3 226例,4 h<總記錄時間<24 h的1 182例,總記錄時間≥24 h的1972例。其中正常腦電報告2 253例(35.3%),異常腦電報告 4 031例(63.2%),界限性腦電圖96例。總共有1 466例(23.0%)患者記錄到發作事件(詳見以下GERS具體發作分型)。通過和既往數據庫資料整合分析發現這些腦電圖檢查患者地域分布以北京周邊省份為主(圖2),其中患者所在地最多的省份分別是河北、山東、河南、山西、內蒙古。

2.2 基于CERS的臨床大數據分析
2.2.1 6380例患者年齡構成比
在所有腦電圖報告中,正常腦電圖共2 253例,各年齡段所占比例分別為兒童2156例(34.0%)、成人768例(12.0%)、幼兒543例(9.0%),青少年399例(6.0%)、嬰兒165例(3.0%);異常腦電報告 4 031例,各年齡段所占比例分別為兒童1089例(17.0%)、成人566例(9.0%)、青少年344例(5.0%),幼兒184例(3.0%),嬰兒70例(1.0%)(圖3)。

內環顯示所有腦電圖報告中,正常腦電圖和異常腦電圖所占比例。外環顯示在正常和異常腦電報告中不同年齡階段患者所占比例
Figure3. The distribution of 6380 EEG patients in different age groupsThe inner circle shows the proportion of normal EEG and abnormal EEG in all EEG reports. The outer circle shows the proportion of patients at different ages in the normal and abnormal EEG groups
2.2.2 6380例患者癲癇發作類型
對6380例患者的發作類型進行統計學分析,共計1 466例(23.0%)患者記錄到發作事件。在這1 466例患者中,癲癇發作874例,占總發作事件的60.0%;非癲癇事件517例,占總發作事件的35.0%,其余為電發作或發作性質不能確定;電發作59例,占4.0%,不確定事件16例,占1.0%。在874例癲癇臨床發作中,局灶性發作473例,占癲癇發作的54.0%;全面性發作299例,占癲癇發作的34.0%。在全面性發作中,最常見的發作類型分別為痙攣發作 166例、肌陣攣發作58例,強直陣攣發作42例、典型失神發作23例;在局灶性發作中,最常見的是發作類型不明 264例,痙攣發作78例,強直發作78例,繼發強直陣攣發作53例(圖4)。

右圖顯示發作性事件占總數的比例。左圖內層圓環顯示這些發作性事件中癲癇發作和非癲癇發作所占比例,外層圓環顯示這些癲癇發作中全面性發作和局灶性發作所占比例,中間圓環顯示不同發作類型所占比例
Figure4. Classification of episodic events in 6380 EEG patientsThe right panel shows the proportion of episodic events in the total. The inner circle on the left shows the proportion of seizures and non-seizures among these episodic events, the outer circle shows the proportion of generalized and focal seizures , The middle circle shows the proportion of different seizure types
3 討 論
大數據時代的到來為科學及健康領域帶來新的契機和挑戰。癲癇因其廣泛異質性,涵蓋多個學科領域,非常適合大數據領域[8-9]。特別是作為癲癇重要的檢查工具—腦電圖,涵蓋背景活動、睡眠波形、異常放電模式、發作類型等各個方面,適合大數據概念和技術。同時,腦電圖的規范化解讀也非常重要,腦電圖的誤讀可能影響對患者病情的解讀和治療,因此,有必要尋找計算機工具以提高臨床腦電圖報告的質量并能實現數據分析[10]。CAAE主持研發的,提供了一個專業的、可以共享的腦電報告平臺,不僅體現了癲癇本體論的概念體系,兼具檢索和教學作用,還可以實現資源共享和大數據分析。
通過CERS系統導出的腦電圖數據,可以很容易與患者的基本資料數據庫進行匹配(通過姓名、出生日期匹配),得到腦電圖檢查患者完整的數據資料。這樣在得到一份完整的腦電報告的時候、還可以了解到這些患者的相關信息,為臨床診療提供指導。比如本研究發現了至本癲癇中心行腦電圖檢查患者是有地域分布的規律,體現了這些地區來北京就醫的需求情況。此外,還對6 380例患者的年齡分布、發作類型進行初分析,發現這些患者的年齡段分布情況,最多的是兒童,其次為成人、青少年。一方面提示該年齡段可能是癲癇發作的高危年齡段,也為我們今后工作定位提供了方向,針對兒童患者的更加人性化的服務。從6 380例患者的發作類型看,總共有1 466例患者記錄到發作事件。在這1 466例患者當中,癲癇發作有874例,占總發作事件的60%;非癲癇事件有517例,占總發作事件的35%。不確定性事件僅有16例。提示腦電圖抓發作還是鑒別癲癇發作的重要工具。但如此多的非癲癇性事件,也提示我們當前患者或患者家屬對癲癇認知度的提高,警覺性增強,需要抓發做來明確診斷,另一方面也提示我們有必要對患者進行更多的科學知識普及,是否可以對一些常見的明確不是癲癇發作的情況進行初篩或辨別,減少不必要的醫療資源消耗。
在874例癲癇臨床發作中,局灶性發作473例,占癲癇發作的54%,提示這些局灶性發作所占的巨大比例,除一些特定的病因以外(如兒童自限性癲癇等),可能很多病例都有潛在的治病灶,是否有進一步手術的空間?在局灶性發作中,大部分發作類型不明確,共264例患者,這些發作類型無法歸類到已有的癲癇發作分型或者是閱圖醫生不能很準確的識別發作類型,一方面表明癲癇發作癥狀學的復雜,同時也為今后的工作提出了挑戰,腦電圖醫生應該更加細化臨床工作、通過多次記錄臨床發作或科內討論等形式、明確發作類型及發作起始模式,查找癲癇病因,為今后診療提供依據。
當然,本研究數據研究只是冰山一角,CERS導出的很多相關數據還等待我們挖掘,比如腦電圖背景活動、患者用藥情況、發作起始放電模式等,都給我們提供可研究的大數據資料。CERS 為癲癇大數據研究提供了有力工具,當然我們的目標遠不止如此,我們同時正在完善患者基本信息數據庫(包括患者影像資料、基因報告、腦電圖及影像后處理結果等)、患者病史資料數據庫(癲癇調查問卷系統)。豐富數據庫構架,這些數據庫的整合,可以多維度整合大數據。通過大數據統計方法,我們還可以總結癲癇疾病病因、癲癇發作類型、用藥情況等多方面信息、同時還可以通過機器學習、深度學習,最終實現疾病診斷人工智能化及精準治療[11],減少人力成本,節省醫療資源。
綜上,CERS為我們提供了一個規范的腦電報告系統,其價值在于為腦電大數據提供支持。當然一個癲癇中心的數據還是有限的, 但是一旦搭建起來規范的、可共享的腦電數據庫平臺,多中心就可以實現數據整合,從而實現大數據分析。我們需要搭建的不僅僅是腦電數據平臺、在這個基礎上、進一步完善患者相關信息如病史資料數據庫、檢查資料數據庫等[12],從而實現大數據的深度學習和研究,揭開病因、癥狀學及電生理等之間的關聯,這是我們今后努力的方向。
利益沖突聲明 所有作者無利益沖突。
在一個前所未有的高度合作和數據共享的時代,大數據研究已經成為時代所需,它滿足了快速處理大量不同數據的需求[1-2]。癲癇是一種在臨床和研究領域都具有廣泛異質性的疾病,因此適合大數據概念和技術[3]。癲癇數據是多模態的,需要大數據原則來妥善處理,特別是腦電圖數據,涵蓋背景活動、睡眠波形、異常放電模式、發作類型等各個方面,因此需要更加專業、便捷并能實現數據分析、共享的平臺來承載腦電圖數據[4]。然而目前中國存在腦電報告術語及報告界面不規范、大量腦電數據無法共享的問題。CAAE主持研發的新版腦電圖報告系統(Clinical EEG report software,CERS)便是在這一契機下應用而生。CERS參考國際抗癲癇聯盟歐洲委員會的“基于計算機的標準化腦電圖報告系統”(Standardized computer-based organized reporting of EEG,SCORE)的標準,SCORE實現了報告流程的規范化、癲癇專業術語的統一,并可以實現數據共享、教學指導作用,成為癲癇診療的重要臨床工具[5-6]。因此,2019年CAAE神經電生理分會參照SCORE模式,主持并研發了CERS系統,該系統同時參照了權威的診斷及分類指南,如國際抗癲癇聯盟(International League Against Epilepsy,ILAE)于2017年推出的“可操作性癲癇發作分類方案”等,目的是實現癲癇術語標準化。同時,CERS在腦電軟件錄入界面附有癲癇相關概念注釋,相當于對癲癇本體論的進一步解讀,更加專業和實用[7]。CERS能夠實現統一的數據上傳、存儲、進一步實現資源及數據共享,為臨床研究提供了便利的條件和巨大的空間。經過兩年多的臨床使用、CERS因其內容的規范、便捷的使用界面已經被廣大腦電圖醫生接受,但其在科研方面的應用的價值還不為醫生熟知。本文應用CERS系統導出的腦電圖數據資料、結合已有數據庫資料進行大數據初分析,旨在探討CERS的科研應用機制,從而探索三級癲癇診療中心腦電大數據庫的建立模式,并希望以此建立多中心合作的腦電圖大數據共享模式。
1 資料與方法
CERS是 CAAE腦電圖和神經電生理分會與華科精準公司合作研發的標準化腦電圖報告系統。CERS采用國際通用標準化腦電圖術語,涵蓋符合國際規范要求的各項腦電圖報告內容(圖1)。我癲癇中心作為率先試用的腦電圖培訓基地、參與該系統的論證和設計過程。

點擊紅框內問號可以顯示對該錄入選項的詳細分類解讀
Figure1. CERS "Attack Event" entry interfaceClick the question mark in the red box to display a detailed classification of this option
該研究回顧性納入2021年5月—2022年5月在清華大學玉泉醫院癲癇中心行腦電圖檢查、并應用CAAE新版腦電報告系統出具腦電報告的患者6 380例,腦電圖醫生根據系統界面提示進行患者腦電相關信息錄入,包括基本信息、背景活動、睡眠周期、發作間期癲癇樣放電、發作事件、腦電圖診斷等。信息錄入過程自動生成報告并將這些特性提供給數據庫,最后將腦電圖數據導出。同時將這6 380例患者導出的腦電圖數據和既往本癲癇中心的患者信息數據庫進行數據整合,該信息數據庫涵蓋了所有門診就診患者所有相關信息,包括基本信息(性別、年齡等)、所屬地域信息、腦電圖報告PDF資料、影像學資料、基因報告等,手術病人還包括手術信息、影像后處理結果、術后回訪信息等。從而初步搭建患者的腦電報告數據庫, 并進一步進行相關數據分析。該研究獲得清華大學玉泉醫院醫學倫理委員會審核批準。
2 結 果
2.1 結合6380例患者在已有數據庫資料的相關資料分析
在6 380例患者中,男3 790例(59.4%)、女2 590例(40.6%)。新版腦電報告系統自動定義并歸類不同年齡組:所有行腦電圖檢查患者中,各年齡段比例分別為兒童3 290例(51.0%)、成人1 372例(22.0%)、青少年 753 例(12.0%)、幼兒730例(11.0 %),嬰兒235例(4.0%)。腦電總記錄時間:總記錄時間≤4 h的3 226例,4 h<總記錄時間<24 h的1 182例,總記錄時間≥24 h的1972例。其中正常腦電報告2 253例(35.3%),異常腦電報告 4 031例(63.2%),界限性腦電圖96例。總共有1 466例(23.0%)患者記錄到發作事件(詳見以下GERS具體發作分型)。通過和既往數據庫資料整合分析發現這些腦電圖檢查患者地域分布以北京周邊省份為主(圖2),其中患者所在地最多的省份分別是河北、山東、河南、山西、內蒙古。

2.2 基于CERS的臨床大數據分析
2.2.1 6380例患者年齡構成比
在所有腦電圖報告中,正常腦電圖共2 253例,各年齡段所占比例分別為兒童2156例(34.0%)、成人768例(12.0%)、幼兒543例(9.0%),青少年399例(6.0%)、嬰兒165例(3.0%);異常腦電報告 4 031例,各年齡段所占比例分別為兒童1089例(17.0%)、成人566例(9.0%)、青少年344例(5.0%),幼兒184例(3.0%),嬰兒70例(1.0%)(圖3)。

內環顯示所有腦電圖報告中,正常腦電圖和異常腦電圖所占比例。外環顯示在正常和異常腦電報告中不同年齡階段患者所占比例
Figure3. The distribution of 6380 EEG patients in different age groupsThe inner circle shows the proportion of normal EEG and abnormal EEG in all EEG reports. The outer circle shows the proportion of patients at different ages in the normal and abnormal EEG groups
2.2.2 6380例患者癲癇發作類型
對6380例患者的發作類型進行統計學分析,共計1 466例(23.0%)患者記錄到發作事件。在這1 466例患者中,癲癇發作874例,占總發作事件的60.0%;非癲癇事件517例,占總發作事件的35.0%,其余為電發作或發作性質不能確定;電發作59例,占4.0%,不確定事件16例,占1.0%。在874例癲癇臨床發作中,局灶性發作473例,占癲癇發作的54.0%;全面性發作299例,占癲癇發作的34.0%。在全面性發作中,最常見的發作類型分別為痙攣發作 166例、肌陣攣發作58例,強直陣攣發作42例、典型失神發作23例;在局灶性發作中,最常見的是發作類型不明 264例,痙攣發作78例,強直發作78例,繼發強直陣攣發作53例(圖4)。

右圖顯示發作性事件占總數的比例。左圖內層圓環顯示這些發作性事件中癲癇發作和非癲癇發作所占比例,外層圓環顯示這些癲癇發作中全面性發作和局灶性發作所占比例,中間圓環顯示不同發作類型所占比例
Figure4. Classification of episodic events in 6380 EEG patientsThe right panel shows the proportion of episodic events in the total. The inner circle on the left shows the proportion of seizures and non-seizures among these episodic events, the outer circle shows the proportion of generalized and focal seizures , The middle circle shows the proportion of different seizure types
3 討 論
大數據時代的到來為科學及健康領域帶來新的契機和挑戰。癲癇因其廣泛異質性,涵蓋多個學科領域,非常適合大數據領域[8-9]。特別是作為癲癇重要的檢查工具—腦電圖,涵蓋背景活動、睡眠波形、異常放電模式、發作類型等各個方面,適合大數據概念和技術。同時,腦電圖的規范化解讀也非常重要,腦電圖的誤讀可能影響對患者病情的解讀和治療,因此,有必要尋找計算機工具以提高臨床腦電圖報告的質量并能實現數據分析[10]。CAAE主持研發的,提供了一個專業的、可以共享的腦電報告平臺,不僅體現了癲癇本體論的概念體系,兼具檢索和教學作用,還可以實現資源共享和大數據分析。
通過CERS系統導出的腦電圖數據,可以很容易與患者的基本資料數據庫進行匹配(通過姓名、出生日期匹配),得到腦電圖檢查患者完整的數據資料。這樣在得到一份完整的腦電報告的時候、還可以了解到這些患者的相關信息,為臨床診療提供指導。比如本研究發現了至本癲癇中心行腦電圖檢查患者是有地域分布的規律,體現了這些地區來北京就醫的需求情況。此外,還對6 380例患者的年齡分布、發作類型進行初分析,發現這些患者的年齡段分布情況,最多的是兒童,其次為成人、青少年。一方面提示該年齡段可能是癲癇發作的高危年齡段,也為我們今后工作定位提供了方向,針對兒童患者的更加人性化的服務。從6 380例患者的發作類型看,總共有1 466例患者記錄到發作事件。在這1 466例患者當中,癲癇發作有874例,占總發作事件的60%;非癲癇事件有517例,占總發作事件的35%。不確定性事件僅有16例。提示腦電圖抓發作還是鑒別癲癇發作的重要工具。但如此多的非癲癇性事件,也提示我們當前患者或患者家屬對癲癇認知度的提高,警覺性增強,需要抓發做來明確診斷,另一方面也提示我們有必要對患者進行更多的科學知識普及,是否可以對一些常見的明確不是癲癇發作的情況進行初篩或辨別,減少不必要的醫療資源消耗。
在874例癲癇臨床發作中,局灶性發作473例,占癲癇發作的54%,提示這些局灶性發作所占的巨大比例,除一些特定的病因以外(如兒童自限性癲癇等),可能很多病例都有潛在的治病灶,是否有進一步手術的空間?在局灶性發作中,大部分發作類型不明確,共264例患者,這些發作類型無法歸類到已有的癲癇發作分型或者是閱圖醫生不能很準確的識別發作類型,一方面表明癲癇發作癥狀學的復雜,同時也為今后的工作提出了挑戰,腦電圖醫生應該更加細化臨床工作、通過多次記錄臨床發作或科內討論等形式、明確發作類型及發作起始模式,查找癲癇病因,為今后診療提供依據。
當然,本研究數據研究只是冰山一角,CERS導出的很多相關數據還等待我們挖掘,比如腦電圖背景活動、患者用藥情況、發作起始放電模式等,都給我們提供可研究的大數據資料。CERS 為癲癇大數據研究提供了有力工具,當然我們的目標遠不止如此,我們同時正在完善患者基本信息數據庫(包括患者影像資料、基因報告、腦電圖及影像后處理結果等)、患者病史資料數據庫(癲癇調查問卷系統)。豐富數據庫構架,這些數據庫的整合,可以多維度整合大數據。通過大數據統計方法,我們還可以總結癲癇疾病病因、癲癇發作類型、用藥情況等多方面信息、同時還可以通過機器學習、深度學習,最終實現疾病診斷人工智能化及精準治療[11],減少人力成本,節省醫療資源。
綜上,CERS為我們提供了一個規范的腦電報告系統,其價值在于為腦電大數據提供支持。當然一個癲癇中心的數據還是有限的, 但是一旦搭建起來規范的、可共享的腦電數據庫平臺,多中心就可以實現數據整合,從而實現大數據分析。我們需要搭建的不僅僅是腦電數據平臺、在這個基礎上、進一步完善患者相關信息如病史資料數據庫、檢查資料數據庫等[12],從而實現大數據的深度學習和研究,揭開病因、癥狀學及電生理等之間的關聯,這是我們今后努力的方向。
利益沖突聲明 所有作者無利益沖突。