引用本文: 陸葉婷, 來峰, 李秉宜, 朱翔毅, 潘圣潔, 徐敏, 方琪, 胡小偉. 棘波自動檢測在顳葉癲癇患者長程腦電圖中應用價值的初步研究. 癲癇雜志, 2023, 9(1): 5-10. doi: 10.7507/2096-0247.202209011 復制
長程腦電圖監測在癲癇領域的運用已相當廣泛。棘波作為最典型的癲癇樣波形,其密度、形態學特點對癲癇的診斷、評估及治療具有重要的作用[1]。但是,長程腦電圖數據量大,不同棘波存在差異,有時會與生理性波形如睡眠期頂尖波、心電偽差混淆,人工目測閱圖耗時費力,隨著神經網絡和小波變換等技術逐漸應用于棘波自動檢測,大大提高了異常波的檢出效率[2-4]。
Persyst軟件是一種基于單調多層神經網絡的腦電波自動分析軟件[5,6],它通過自身的腦電數據訓練集模仿人類標記棘波,對拓撲和形態相似的棘波分組,通過設定感知值實現棘波判讀的精確和簡化(感知值為0.1~1.0的10個值,如0.5的感知值表明,每100名專業的閱圖者中可能有50名會將其標記棘波)。
目前棘波的判定主要依賴熟練的閱圖者進行定性識別,尤其在國內,定量研究極少。棘波的數量與癲癇再發風險的關系存在爭議[7-9],其波形的特點對于抗癲癇用藥及病灶性質的指導意義尚處于研究階段,是未來棘波定量研究的其中一個重要方向。顳葉癲癇作為最常見的局灶性癲癇,目前尚無專門針對成人顳葉癲癇棘波自動檢測的相關研究。本文將重點將其自動檢測與人工閱圖在棘波數量的準確性和差異性進行分析比較,對今后自動檢測棘波特點定量分析的研究可行性進行初步探索。
1 資料與方法
1.1 研究對象
連續選定2019年1月1日—2019年12月31日蘇州大學附屬第一醫院癲癇單元腦電圖數據庫中符合納入和排除標準的患者腦電圖記錄。
1.1.1 納入標準
① 成年患者(≥18歲);② 診斷符合2014年國際抗癲癇聯盟的癲癇診斷[10];③ 根據臨床表現、發作期腦電圖以及影像學特征,且滿足:發作間期腦電圖可見一側或雙側顳區的癲癇樣放電,診斷為顳葉癲癇[11,12]的包括初次診斷和復查患者;④ 長程腦電圖監測時間≥24 h,包括一整晚的睡眠監測。
1.1.2 排除標準
存在以下任何一條:① 僅有假性癇性發作;② 全面性癲癇,或診斷為其他部位相關的癲癇綜合征,發作類型參考2017年國際抗癲癇聯盟的標準[13];③ 腦電圖監測質量差,影響腦電圖閱讀和棘波判定,例如電極脫落、儀器故障等。
腦電圖記錄采用國際標準10-20系統(19導聯)加T1/2導聯,采樣率1 000 Hz,帶通濾波為0.5~70 Hz,靈敏度為7或10 uV/mm,陷波濾波為50 Hz;另外附加單導心電圖和左右三角肌肌電監測(視頻腦電圖儀器為32導,Cadwell,美國)。腦電圖后處理分析軟件(Persyst公司,美國,Persyst11、13、14版本,分別于2011年9月、2019年3月和2020年4月發布,以下簡稱“P11、P13、P14”)。
1.2 研究方法
回顧性匯總患者基線病史資料,包括患者年齡、性別、病因、用藥、既往有無癲癇外科手術史、腦電圖記錄持續時間、報告的棘波總數。本研究獲得患者知情同意,并通過蘇州大學附屬第一醫院倫理委會審核批準。
1.2.1 棘波的判定方法
由兩名高年資、由中國抗癲癇協會認證腦電圖技術專家閱讀和標記長程腦電圖中的發作間期癲癇樣放電(發作期除外),統稱棘波(為了便于標記和報告,所有尖波、尖慢波、棘波和棘慢波均統一標記為棘波)。閱圖者結合實際及閱圖經驗進行棘波判定,讀圖無時間限制,讀圖過程中可以自由使用導聯設置、導聯組合或濾波設置,并可根據需要重新審核腦電圖或某個記錄的片段,判定方法符合但不僅限于以下標準[14]:① 突出于背景活動,上升支較下降支陡峭;② 負向波;③ 時限<200 ms。
1.2.2 棘波的判定標準
兩名腦電圖閱圖者均獨立在P11軟件系統內手動標記棘波,標注點位于棘波波峰前方200~500 ms以內,將兩位閱圖者標記時間差值<500 ms作為一致認定的棘波,并將其作為“金標準”,將其與自動分析的結果進行比對。閱圖者之間,P11和金標準比對時,時間相差200~500 ms以內的認定兩者標注一致;P13及P14和金標準比對時,二者標注時間完全相同一致的認定兩者一致。(由于軟件不同版本自身設置不同,P11的標注時間精確到0.01 ms,P13、P14精確度到s)。
1.3 統計與分析
以“金標準”為參考,設置Persyst軟件的三個版本11、13、14在不同感知值下計算自動分析的敏感性、假陽性率。不同版本之間的敏感性及假陽性差異使用單因素方差分析 (ANOVA)。SPSS 25.0、Excel 2019用于統計分析和繪圖。Python 3.9.1用于比對人工與自動分析數據。計算方法參考表1。

2 結果
2.1 人口學基本資料
根據標準,最終共納入7例顳葉癲癇患者,其中男5例、女2例,年齡37~76歲。癲癇病程1個月~20年,初次診斷顳葉癲癇患者4例,明確診斷后給予抗癲癇發作藥物治療,既往診斷顳葉癲癇患者常規復查1例,藥物難治性顳葉癲癇2例。
2.2 閱圖者一致性
患者腦電圖記錄時間為24~25 h,總記錄時間為169 h。發作間期癇樣放電位于左側顳區2例、右側顳區3例、雙側顳區2例。閱圖者A與B分別標記了11 782個及9 469個棘波,比較不同患者的長程腦電圖,A和B兩者共標記了6 399個一致的棘波,一致性由18.51%~68.14%不等,總體一致率為43.09%。總棘波數越少,閱圖者的一致性相對越低。詳見表2。

2.3 自動分析的優勢
以人工判定一致的棘波作為暫時的金標準,自動識別的棘波數量遠多于人工判定的棘波數。詳見圖1、2。

圖A中展示perception值設置為low時不同位置棘波自動分析結果,紅色圓框處為perception值設置處,有low、medium、high三個選項可選,相當于0.9、0.4、0.1,紅色方框展示了設置為medium及high時F8電極處的棘波數,分別為110,115個。圖B展示F8電極處自動分析后不同時間的棘波波形具體展示;圖C為該患者所有棘波出現的時間以及其對應的perception數值。其余2版本與之類似
Figure1. Presentation of Persyst version 13Figure A shows the automatic analysis results of spikes at different locations when the perception value is set to “low”. The red circle shows the location where the perception value is set. There are three options: low, medium, and high, which are equivalent to 0.9, 0.4, and 0.1. The red box shows the number of spikes at F8 electrodes when the perception value is set to “medium” and “high”, which are 110,115 respectively. Figure B shows the specific display of spike waveforms at different times after automatic analysis at F8 electrode; Figure C shows the time of all spikes in the patient and their corresponding perception values. Persyst Version 11 and 14 are similar to 13

a:版本11;b:版本13;c:版本14
Figure2. Comparison of three versions under different perception valuea: Version 11; b: Version 13; c: Version 14
2.3.1 敏感性
最高出現于感知值0.5時,分別為62.26%、77.0%、67.28%
2.3.2 假陽性率
最低出現于感知值為0.9時,分別為0.37個/min、0.85個/min、0.46個/min。隨著感知值升高,自動分析與人工判定的棘波數差異明顯減小,假陽性率和敏感性也隨之下降。不同版本之間的敏感性存在統計學差異,兩兩比較后P13的敏感性較P11高(P=0.012),P13、14之間無差異;假陽性在不同版本間無明顯統計學差異(P=0.237)。
2.3.3 工作量
根據版本的不同,可減少14.59%~37.05%的閱圖量。工作量減少的同時準確性提高,但敏感性下降,即漏檢率升高,錯檢率下降。
3 討論
本研究共169 h的腦電圖記錄中,兩位閱圖者總體一致率為43.09%。在既往比較自動檢測與閱圖者差異的相關研究中,閱圖者一致性在13.2%~84%不等[15-18],差異主要存在于三方面。一是閱圖者相關,如讀圖人數、讀圖者自身的讀圖能力。個體閱圖者在同一腦電圖記錄中標記為棘波或尖波的情況經常存在很大差異[5,19]。閱圖人數并沒有最佳之說,專家群體的意見一定比個人結果更準確,相關模型顯示閱圖者達到10~12名時判圖意見趨于平穩,高于此數量之后將一致性不會有明顯變化[20,21]。>1.5年的專業訓練、從事學術研究、擁有美國神經電生理資質證書的判圖者也會有更好的一致性[22]。二是選取的腦電圖記錄相關,如癲癇的類型、選取記錄長度及難度。顳區的間期放電更容易被發現[20]。閱圖者肉眼更容易識別陡峭、高波幅的棘波[1]。多數研究中涉及的讀圖時間較短,工作量較小,常不足1 h[23,24],最短的甚至只有數十秒,癲癇樣事件數目較少,判讀就會存在極大的不穩定性。本文盡管只采用2名讀圖者,但每份記錄持續時間比較長,約24 h,更符合臨床實際,具有指導意義。三是研究的性質。具有較高一致性的研究通常比較的是腦電圖定性結果(如是否有背景異常,是否有異常棘波),而不是病理性棘波具體個數的定量研究[1,18]。
棘波在有經驗的閱圖者之間尚且存在較大的差距,更凸顯出自動化檢測的需求,另一方面自動檢測其實并不需要超高的準確性,主要是幫助臨床醫生快速閱讀,從篩選出的波形中選取有價值的,方便作出臨床診斷。本文的自動檢測Persyst算法采用感知值(即Perception值)來模仿人類專家標記棘波的概率[5],在P13中最高可達77.9%,敏感性較高,但同時誤報率也隨之升高。感知值設定為0.5時自動分析的棘波數已遠大于人工閱圖,如感知值設置更低水平,敏感性可以更高,但數量過多并不利于提高讀圖效率。一項前瞻性評價認為在同時選擇性選取片段并且結合P13自動檢測不劣于人工閱圖[3]。在癲癇伴慢波睡眠期持續棘慢波中計算棘慢波指數時不劣于甚至優于人類[25,26]。不同版本間的差異可能是算法的改進以及訓練集增多強化的結果,但沒有通用的標準化腦電數據集可以比較用于準確評價性能。有研究將P11、P12、P13與3名閱圖專家進行兩兩比較,只有P13在人類專家范圍內具有較高的敏感性[16]。總體上,自動檢測可以幫助縮減一定工作量,在行腦電監測時可同步進行自動分析,閱讀自動分析結果所花費的時間,要比單純人工閱讀少得多,對初步的定性診斷有很大幫助。通過合理的調整Perception值可以既減少工作量又保證一定準確性。如要進一步對波形進行定量的描述,那么閱讀時間也會隨之延長。如一定要求準確性,可將Perception值放于0.9,如出于鑒別診斷的目的可將Perception值放低至0.5或更低。
總體上,借助Persyst自動檢測棘波,可以減少一定工作量,檢測結果敏感性較高,假陽性也較高,版本間存在區別,通過合理的調整Perception值可以既減少工作量又保證一定準確性。本研究存在一定局限性,主要在于兩方面:一是閱圖者存在讀圖誤差,以此作為金標準證據可能不充分;其次為一份腦電圖腦電波形過多,包括正常的生理波形及異常波,無法確定總個數,因此假陰性無法計算。
利益沖突聲明 所有作者無利益沖突。
長程腦電圖監測在癲癇領域的運用已相當廣泛。棘波作為最典型的癲癇樣波形,其密度、形態學特點對癲癇的診斷、評估及治療具有重要的作用[1]。但是,長程腦電圖數據量大,不同棘波存在差異,有時會與生理性波形如睡眠期頂尖波、心電偽差混淆,人工目測閱圖耗時費力,隨著神經網絡和小波變換等技術逐漸應用于棘波自動檢測,大大提高了異常波的檢出效率[2-4]。
Persyst軟件是一種基于單調多層神經網絡的腦電波自動分析軟件[5,6],它通過自身的腦電數據訓練集模仿人類標記棘波,對拓撲和形態相似的棘波分組,通過設定感知值實現棘波判讀的精確和簡化(感知值為0.1~1.0的10個值,如0.5的感知值表明,每100名專業的閱圖者中可能有50名會將其標記棘波)。
目前棘波的判定主要依賴熟練的閱圖者進行定性識別,尤其在國內,定量研究極少。棘波的數量與癲癇再發風險的關系存在爭議[7-9],其波形的特點對于抗癲癇用藥及病灶性質的指導意義尚處于研究階段,是未來棘波定量研究的其中一個重要方向。顳葉癲癇作為最常見的局灶性癲癇,目前尚無專門針對成人顳葉癲癇棘波自動檢測的相關研究。本文將重點將其自動檢測與人工閱圖在棘波數量的準確性和差異性進行分析比較,對今后自動檢測棘波特點定量分析的研究可行性進行初步探索。
1 資料與方法
1.1 研究對象
連續選定2019年1月1日—2019年12月31日蘇州大學附屬第一醫院癲癇單元腦電圖數據庫中符合納入和排除標準的患者腦電圖記錄。
1.1.1 納入標準
① 成年患者(≥18歲);② 診斷符合2014年國際抗癲癇聯盟的癲癇診斷[10];③ 根據臨床表現、發作期腦電圖以及影像學特征,且滿足:發作間期腦電圖可見一側或雙側顳區的癲癇樣放電,診斷為顳葉癲癇[11,12]的包括初次診斷和復查患者;④ 長程腦電圖監測時間≥24 h,包括一整晚的睡眠監測。
1.1.2 排除標準
存在以下任何一條:① 僅有假性癇性發作;② 全面性癲癇,或診斷為其他部位相關的癲癇綜合征,發作類型參考2017年國際抗癲癇聯盟的標準[13];③ 腦電圖監測質量差,影響腦電圖閱讀和棘波判定,例如電極脫落、儀器故障等。
腦電圖記錄采用國際標準10-20系統(19導聯)加T1/2導聯,采樣率1 000 Hz,帶通濾波為0.5~70 Hz,靈敏度為7或10 uV/mm,陷波濾波為50 Hz;另外附加單導心電圖和左右三角肌肌電監測(視頻腦電圖儀器為32導,Cadwell,美國)。腦電圖后處理分析軟件(Persyst公司,美國,Persyst11、13、14版本,分別于2011年9月、2019年3月和2020年4月發布,以下簡稱“P11、P13、P14”)。
1.2 研究方法
回顧性匯總患者基線病史資料,包括患者年齡、性別、病因、用藥、既往有無癲癇外科手術史、腦電圖記錄持續時間、報告的棘波總數。本研究獲得患者知情同意,并通過蘇州大學附屬第一醫院倫理委會審核批準。
1.2.1 棘波的判定方法
由兩名高年資、由中國抗癲癇協會認證腦電圖技術專家閱讀和標記長程腦電圖中的發作間期癲癇樣放電(發作期除外),統稱棘波(為了便于標記和報告,所有尖波、尖慢波、棘波和棘慢波均統一標記為棘波)。閱圖者結合實際及閱圖經驗進行棘波判定,讀圖無時間限制,讀圖過程中可以自由使用導聯設置、導聯組合或濾波設置,并可根據需要重新審核腦電圖或某個記錄的片段,判定方法符合但不僅限于以下標準[14]:① 突出于背景活動,上升支較下降支陡峭;② 負向波;③ 時限<200 ms。
1.2.2 棘波的判定標準
兩名腦電圖閱圖者均獨立在P11軟件系統內手動標記棘波,標注點位于棘波波峰前方200~500 ms以內,將兩位閱圖者標記時間差值<500 ms作為一致認定的棘波,并將其作為“金標準”,將其與自動分析的結果進行比對。閱圖者之間,P11和金標準比對時,時間相差200~500 ms以內的認定兩者標注一致;P13及P14和金標準比對時,二者標注時間完全相同一致的認定兩者一致。(由于軟件不同版本自身設置不同,P11的標注時間精確到0.01 ms,P13、P14精確度到s)。
1.3 統計與分析
以“金標準”為參考,設置Persyst軟件的三個版本11、13、14在不同感知值下計算自動分析的敏感性、假陽性率。不同版本之間的敏感性及假陽性差異使用單因素方差分析 (ANOVA)。SPSS 25.0、Excel 2019用于統計分析和繪圖。Python 3.9.1用于比對人工與自動分析數據。計算方法參考表1。

2 結果
2.1 人口學基本資料
根據標準,最終共納入7例顳葉癲癇患者,其中男5例、女2例,年齡37~76歲。癲癇病程1個月~20年,初次診斷顳葉癲癇患者4例,明確診斷后給予抗癲癇發作藥物治療,既往診斷顳葉癲癇患者常規復查1例,藥物難治性顳葉癲癇2例。
2.2 閱圖者一致性
患者腦電圖記錄時間為24~25 h,總記錄時間為169 h。發作間期癇樣放電位于左側顳區2例、右側顳區3例、雙側顳區2例。閱圖者A與B分別標記了11 782個及9 469個棘波,比較不同患者的長程腦電圖,A和B兩者共標記了6 399個一致的棘波,一致性由18.51%~68.14%不等,總體一致率為43.09%。總棘波數越少,閱圖者的一致性相對越低。詳見表2。

2.3 自動分析的優勢
以人工判定一致的棘波作為暫時的金標準,自動識別的棘波數量遠多于人工判定的棘波數。詳見圖1、2。

圖A中展示perception值設置為low時不同位置棘波自動分析結果,紅色圓框處為perception值設置處,有low、medium、high三個選項可選,相當于0.9、0.4、0.1,紅色方框展示了設置為medium及high時F8電極處的棘波數,分別為110,115個。圖B展示F8電極處自動分析后不同時間的棘波波形具體展示;圖C為該患者所有棘波出現的時間以及其對應的perception數值。其余2版本與之類似
Figure1. Presentation of Persyst version 13Figure A shows the automatic analysis results of spikes at different locations when the perception value is set to “low”. The red circle shows the location where the perception value is set. There are three options: low, medium, and high, which are equivalent to 0.9, 0.4, and 0.1. The red box shows the number of spikes at F8 electrodes when the perception value is set to “medium” and “high”, which are 110,115 respectively. Figure B shows the specific display of spike waveforms at different times after automatic analysis at F8 electrode; Figure C shows the time of all spikes in the patient and their corresponding perception values. Persyst Version 11 and 14 are similar to 13

a:版本11;b:版本13;c:版本14
Figure2. Comparison of three versions under different perception valuea: Version 11; b: Version 13; c: Version 14
2.3.1 敏感性
最高出現于感知值0.5時,分別為62.26%、77.0%、67.28%
2.3.2 假陽性率
最低出現于感知值為0.9時,分別為0.37個/min、0.85個/min、0.46個/min。隨著感知值升高,自動分析與人工判定的棘波數差異明顯減小,假陽性率和敏感性也隨之下降。不同版本之間的敏感性存在統計學差異,兩兩比較后P13的敏感性較P11高(P=0.012),P13、14之間無差異;假陽性在不同版本間無明顯統計學差異(P=0.237)。
2.3.3 工作量
根據版本的不同,可減少14.59%~37.05%的閱圖量。工作量減少的同時準確性提高,但敏感性下降,即漏檢率升高,錯檢率下降。
3 討論
本研究共169 h的腦電圖記錄中,兩位閱圖者總體一致率為43.09%。在既往比較自動檢測與閱圖者差異的相關研究中,閱圖者一致性在13.2%~84%不等[15-18],差異主要存在于三方面。一是閱圖者相關,如讀圖人數、讀圖者自身的讀圖能力。個體閱圖者在同一腦電圖記錄中標記為棘波或尖波的情況經常存在很大差異[5,19]。閱圖人數并沒有最佳之說,專家群體的意見一定比個人結果更準確,相關模型顯示閱圖者達到10~12名時判圖意見趨于平穩,高于此數量之后將一致性不會有明顯變化[20,21]。>1.5年的專業訓練、從事學術研究、擁有美國神經電生理資質證書的判圖者也會有更好的一致性[22]。二是選取的腦電圖記錄相關,如癲癇的類型、選取記錄長度及難度。顳區的間期放電更容易被發現[20]。閱圖者肉眼更容易識別陡峭、高波幅的棘波[1]。多數研究中涉及的讀圖時間較短,工作量較小,常不足1 h[23,24],最短的甚至只有數十秒,癲癇樣事件數目較少,判讀就會存在極大的不穩定性。本文盡管只采用2名讀圖者,但每份記錄持續時間比較長,約24 h,更符合臨床實際,具有指導意義。三是研究的性質。具有較高一致性的研究通常比較的是腦電圖定性結果(如是否有背景異常,是否有異常棘波),而不是病理性棘波具體個數的定量研究[1,18]。
棘波在有經驗的閱圖者之間尚且存在較大的差距,更凸顯出自動化檢測的需求,另一方面自動檢測其實并不需要超高的準確性,主要是幫助臨床醫生快速閱讀,從篩選出的波形中選取有價值的,方便作出臨床診斷。本文的自動檢測Persyst算法采用感知值(即Perception值)來模仿人類專家標記棘波的概率[5],在P13中最高可達77.9%,敏感性較高,但同時誤報率也隨之升高。感知值設定為0.5時自動分析的棘波數已遠大于人工閱圖,如感知值設置更低水平,敏感性可以更高,但數量過多并不利于提高讀圖效率。一項前瞻性評價認為在同時選擇性選取片段并且結合P13自動檢測不劣于人工閱圖[3]。在癲癇伴慢波睡眠期持續棘慢波中計算棘慢波指數時不劣于甚至優于人類[25,26]。不同版本間的差異可能是算法的改進以及訓練集增多強化的結果,但沒有通用的標準化腦電數據集可以比較用于準確評價性能。有研究將P11、P12、P13與3名閱圖專家進行兩兩比較,只有P13在人類專家范圍內具有較高的敏感性[16]。總體上,自動檢測可以幫助縮減一定工作量,在行腦電監測時可同步進行自動分析,閱讀自動分析結果所花費的時間,要比單純人工閱讀少得多,對初步的定性診斷有很大幫助。通過合理的調整Perception值可以既減少工作量又保證一定準確性。如要進一步對波形進行定量的描述,那么閱讀時間也會隨之延長。如一定要求準確性,可將Perception值放于0.9,如出于鑒別診斷的目的可將Perception值放低至0.5或更低。
總體上,借助Persyst自動檢測棘波,可以減少一定工作量,檢測結果敏感性較高,假陽性也較高,版本間存在區別,通過合理的調整Perception值可以既減少工作量又保證一定準確性。本研究存在一定局限性,主要在于兩方面:一是閱圖者存在讀圖誤差,以此作為金標準證據可能不充分;其次為一份腦電圖腦電波形過多,包括正常的生理波形及異常波,無法確定總個數,因此假陰性無法計算。
利益沖突聲明 所有作者無利益沖突。