癲癇作為一種神經系統常見疾病,具有發病率高、突發性和反復性的特點。及時預測癲癇發作并進行干預治療,可以顯著減少患者的意外傷害。當前,基于腦電信號的癲癇發作預測正成為癲癇研究的熱點,雖然相關研究取得很多進展,但距臨床應用仍有一定距離。本文就該領域的研究進行綜述,闡述了其發展歷程及關鍵技術,著重介紹和分析基于機器學習和深度學習進行癲癇發作預測的研究進展。傳統機器學習方法面臨特征選取和淺層模型泛化能力弱等制約,采用深度學習進行癲癇預測逐漸成為當前發展趨勢,需要開展更加深入的探索,以促進癲癇發作預測技術的臨床應用。
引用本文: 韓長明, 彭福來, 陳財, 李文超, 張昔坤, 王星維, 周衛東. 基于腦電信號的癲癇發作預測研究進展. 生物醫學工程學雜志, 2021, 38(6): 1193-1202. doi: 10.7507/1001-5515.202105052 復制
引言
癲癇(epilepsy)已成為神經科僅次于頭痛的第二大常見病,具有突發性、反復性和難治愈的特點[1]。據統計,全球約有7 000多萬癲癇患者,且數量每年都在遞增,雖然有些患者的病情可以通過藥物或者手術進行控制,但仍有約三分之一的頑固性癲癇患者得不到有效治療[2]。當大腦中部分神經元突發性異常放電時將導致短暫性功能障礙,患者會出現意識喪失、非自主性抽搐、精神異常等癥狀,若此時正處在相對危險的環境里如樓梯、泳池等,很可能造成二次傷害,嚴重威脅患者的生命健康,給患者的家庭乃至社會帶來沉重的負擔[3]。因此,如果能提前預測癲癇發作就可以及時對患者進行藥物干預或施加電刺激治療,使患者免受傷害[4]。
腦電圖(electroencephalogram,EEG)蘊含豐富的大腦活動信息,被廣泛地應用于腦疾病診斷和醫療康復等領域。腦電圖按照采集方式大致可以分為顱內腦電圖(intracranial electroencephalogram,iEEG)和頭皮腦電圖(scalp electroencephalogram,sEEG)[5-8]。顱內腦電圖又分為立體定向腦電圖(stereo-electroencephalography,SEEG)和皮層腦電圖(electrocorticography,ECoG),其中SEEG是將電極植入到腦深部組織記錄得到的腦電圖,ECoG是通過放置在大腦皮層上的電極記錄得到的腦電圖。顱內腦電具有噪聲干擾小、信噪比高的優點,但是需要手術植入采集電極。相比之下,頭皮腦電圖是通過放置在大腦頭皮表面的電極所記錄得到,信號會被顱骨衰減,較為微弱,易受眼電、肌電等偽跡信號干擾。但是,由于頭皮腦電具有無創傷、成本低和易獲得的優勢,更容易被患者所接受,因此被廣泛地應用于神經系統疾病的診斷和監測中[9]。
癲癇患者的腦電活動一般可以分為四個不同時期,分別是發作間期、發作前期、發作期和發作后期,如圖1[10]所示。癲癇發作開始前的一段時間稱為發作前期,一般持續幾分鐘到幾十分鐘;癲癇發作開始到發作結束所經歷的這段時間稱為發作期,一般持續數秒鐘至數分鐘;癲癇發作結束后患者恢復到正常狀態所經歷的這段時間稱為發作后期;發作后期到下一次發作前期所經歷的時間稱為發作間期,在這個時期患者表現的狀態和正常人一樣。研究表明癲癇患者從正常狀態到發作狀態并不是瞬間轉變的,而是經歷了一個過渡時期,即發作前期,準確和高效地對患者的發作前期進行識別將成為癲癇預測技術的關鍵要點[11]。

1 癲癇預測技術發展史
關于癲癇發作預測的早期工作可以追溯到1970年左右,研究人員嘗試多種方法從癲癇患者的腦電信號中提取發作前的相關信息進行癲癇發作的預測[12-13]。王蕾[14]利用基于小波變換的相位同步化分析算法,對癲癇患者的腦電信號進行分析,發現癲癇發作前的一段時間內相位同步化值出現明顯的下降趨勢,并且在癲癇發作期又顯著升高,甚至高于發作間期的水平。Sharma等[15-16]計算了大腦不同部位信號的平均方差和復雜性,結果顯示相關數值在發作間期和發作期之間的一段時間內明顯增大,他們進一步的研究結果也顯示在癲癇發作前的短時間內Beta波段的能量明顯增強。上述研究均表明癲癇發作前腦電特征信息會發生改變,這為預測癲癇發作提供了可能。
當前,基于腦電信號進行癲癇發作預測的方法大致可以分為兩種:第一種是基于閾值的方法,第二種是基于分類的方法[9]。基于閾值的方法側重于檢查癲癇發作前一段時間內某些特定指標的升高或降低趨勢,如Li等[17]發現癲癇發作前期和發作間期的棘波頻次不同,在臨近發作前的幾分鐘甚至一小時棘波頻次出現上升趨勢,基于此現象,他們采用形態學濾波器檢測腦電信號的棘波數目,然后計算出棘波頻次,最后把棘波頻次當作一種指標預測癲癇發作。Zandi等[18]通過分析癲癇患者腦電圖的當前時期與兩個參考時期之間的相似性來監測腦電信號的動態變化,他們分別計算出患者當前腦電圖狀態與該患者歷史發作間期和發作前期的參考狀態之間的差異程度,并設置特定的閾值預測癲癇發作。基于閾值法預測患者的癲癇發作可解釋性強,簡單直觀,但是泛化能力很弱,預測模型對不同患者所表現出的性能差別很大,易受閾值的波動導致誤報率較高。相對而言,基于分類方法進行癲癇預測的主要思路就是將患者的腦電圖人為切割成發作間期和發作前期,并提取特征信息,然后使用預測模型識別發作前期,從而實現對癲癇發作的預測。研究并設計高靈敏度、低誤報率的任務分類器區分識別發作間期和發作前期是構建預測模型的重點和難點[19]。隨著機器學習(machine learning,ML)和深度學習(deep learning,DL)算法理論的發展,基于分類法的癲癇發作預測技術成為當前研究的熱點,很多學者為推動該課題盡早實現臨床應用進行了大量研究。
2 癲癇預測技術環節
大量研究表明可以基于癲癇發作前期腦電信息的變化預測癲癇發作,其要解決的關鍵問題就是區分識別腦電圖的發作間期狀態和發作前期狀態[20-21]。因此,癲癇發作預測可以轉化為對患者的腦電信息進行發作間期和發作前期的二分類問題,主要包括以下三大步驟:預處理、模型構建(包含特征提取和分類)和后處理,流程如圖2所示。其中,預測模型構建方法大致可以分為兩大類,一種是基于ML的預測模型構建方法,另一種是基于DL的預測模型構建方法[22-23]。下面對上述關鍵步驟進行詳細介紹。

2.1 腦電信號預處理
由于環境中的電磁干擾以及采集設備自身存在熱噪聲等因素,采集的腦電信號難免會存在高頻以及50 Hz工頻干擾噪聲,這些噪聲大大降低了腦電信號的質量,對癲癇預測效果產生不利影響。所以對腦電信號的預處理首先就是消除這些噪聲[24-25]。針對工頻干擾噪聲,通常采用50 Hz的陷波濾波器進行消除[26-27]。針對高頻噪聲,由于腦電信號的主要能量集中在低頻范圍內,所以很多研究采用低通濾波器濾除高頻噪聲,如巴特沃斯濾波器、基于小波的濾波器、切比雪夫濾波器和FIR濾波器等[23,28-30]。
除了噪聲影響外,腦電采集過程中還容易受到眼電、肌電、運動等偽跡的影響,這些偽跡的頻率范圍往往與腦電信號具有重疊性,傳統濾波器無法有效濾除。針對這些偽跡干擾,通常采用獨立分量分析進行消除[26,28]。除此之外,還有其他方法用于偽跡去除,如Usman等[31]使用共同空間模式(common spatial pattern,CSP)濾波器和小波變換(wavelet transform,WT)對腦電信號進行處理,首先CSP濾波器被用于將多通道腦電信號轉換為單個替代通道腦電信號,增加發作間期和發作前期之間的差異程度,然后采用WT進行偽跡去除。Chen等[32]應用離散小波變換(discrete wavelet transform,DWT)去除偽跡的影響,并將腦電信號分解為幾個子頻帶信號,然后從這些子頻帶信號中提取更多特征信息,從而提高癲癇發作預測的準確性。另外還有多尺度主成分分析、經驗模態分解等方法也可用于腦電偽跡消除[33]。
去除噪聲和偽跡后的腦電信號還要進行加窗分段處理,窗口的長度和步長是兩個重要的參數,選擇合適的窗口長度會得到良好的預測效果[27]。Mahmoodian等[12]認為選擇較短的窗口長度對于捕獲腦電信號中的特定模式具有重要意義,因此他們采用5 s的滑動窗口,并將步長設置為5 s;Zhang等[23]在研究中把腦電數據段分為4 s,并將步長設置為2 s以擴充樣本數量。還有的學者在研究中用較長的窗口進行實驗,如Yuan等[30]采用10 s的滑動窗口處理腦電信號,步長設置為5 s;Truong等[34]采用30 s的窗口長度與15 s的步長處理腦電信號。從以往的研究中可以得到規律,窗口長度越大且步長越大,樣本的數量就會越少,可以大大降低預測模型的計算量,實時性能夠得到保證,但預測模型的性能可能會下降;反之窗口長度越小且步長越小,樣本數量增多,預測效果可以得到改善,但對計算設備的要求更高,數據處理非常耗時,如何權衡這兩者之間的關系以更好地提升預測模型的性能還有待更多的研究。
2.2 基于ML的預測方法
在利用ML方法預測癲癇發作的流程中,首先需要基于經驗提取能表征癲癇發作前期狀態的特征信息,常用的經典特征信息主要包括小波能量、功率譜密度、最大李雅普諾夫指數(largest Lyapunov exponent,LLE)、鎖相值、排列熵(permutation entropy,PE)、Hjorth參數、Hurst指數、分形維數值等[35-45]。Fei等[46]采用改進的LLE算法以更好地表征癲癇腦電的混沌動力學特征,研究結果表明,與傳統的LLE算法相比,新方法在識別發作前期狀態時具有更高的準確性。崔嵩[47]借鑒Bag-of-Word模型,對不同電極上局部波形之間的關系進行建模,進而提出基于Bag-of-Wave的特征提取方法。Raghu等[26]提出了一種連續分解指數(successive decomposition index,SDI)特征,他們的研究表明癲癇發作時SDI會顯著增大,在發作前期根據SDI的變化能夠預測癲癇發作。此外,也有研究利用主成分分析、CSP變換和自回歸模型等方法提取癲癇發作前期和發作間期的頻域或空域特征[48-51]。
由于人為提取特征信息具有較強的主觀性,難免造成特征信息的冗余,為了減少特征向量的冗余度,可以采用特征選擇技術篩選出最佳的特征子集,在保證預測精度的同時降低特征信息的維度[52-54]。Bandarabadi等[55]使用了一種基于幅度分布的特征選擇方法,通過計算癲癇腦電樣本特征的幅度分布直方圖(amplitude distribution histograms,ADHs),對各個特征進行排名,然后選擇具有最大ADHs差異的特征。Wang等[56]使用遞歸特征消除(recursive feature elimination,RFE)算法選取最優特征子集,他們把RFE和支持向量機(support vector machine,SVM)結合起來構建了RFE-SVM模型,利用這個模型對提取出來的所有原始特征進行多輪訓練,每輪訓練結束后消除若干權值系數對應的特征,再基于新的特征集進行下一輪訓練,直到遍歷所有特征,最后選出最優的特征集。遺傳算法是特征選擇的另一種廣泛使用的方法,也被用于癲癇腦電特征選擇中,以確定哪些特征組合更利于從發作間期狀態中識別出發作前期狀態[52-53]。
特征信息提取后,需要基于提取的特征信息建立ML分類模型,以實現癲癇發作的預測。常用的ML方法有極限學習機(extreme learning machine,ELM)、SVM、K近鄰算法、線性判別分析(linear discriminant analysis,LDA)、貝葉斯分類器、決策樹、隨機森林(random forest,RF)等[57-65]。其中,在目前癲癇發作預測技術中應用最多的分類器是SVM,因為所要解決的關鍵問題就是發作間期和發作前期的二分類問題,而SVM正是ML領域公認的處理二分類問題最優算法之一。為了提升癲癇預測的性能,許多研究對傳統ML進行改進。例如,最小二乘支持向量機(least squares support vector machine,LS-SVM)是SVM的擴展版本,它把傳統SVM中的不等式約束改為了等式約束,解決了SVM在約束優化編程方面存在較高計算負擔的問題,具有更快的處理速度[66-68]。Yuan等[30]把貝葉斯線性判別分析算法(Bayesian linear discriminant analysis,BLDA)用于癲癇發作的預測中,BLDA可以看作是Fisher線性判別分析(Fisher’s linear discriminant analysis,FLDA)的擴展,與傳統的FLDA相比,BLDA算法采用正則化方法避免過度擬合高維數據集,為參數優化提供了有效的解決方案而無需耗時的交叉驗證。
2.3 基于DL的預測方法
隨著DL技術的發展,許多學者基于DL對癲癇預測模型構建進行了研究。由于DL方法能夠針對不同數據自動提取特征信息,不需要根據經驗人為提取,避免了ML方法中手動提取特征的一些缺陷,被廣泛應用于各領域中[69-70]。當前,基于DL方法的癲癇發作預測模型構建技術大致可以分為三類:基于卷積神經網絡(convolutional neural network,CNN)的模型構建方法、基于循環神經網絡(recurrent neural network,RNN)的模型構建方法、基于CNN與RNN相融合的模型構建方法[50,65,71-74]。
CNN作為DL的一個重要分支,采用局部感受野、共享權值、降采樣等思想,獲取數據的多尺度特征信息,被廣泛應用于圖像處理領域。由于腦電信號一般為多通道采集,所以很多研究將多通道腦電信號映射為二維(two-dimensional,2D)/三維(three-dimensional,3D)圖像,以便于采用CNN進行模型構建。Xu等[10]設計了一個端到端的預測模型,把原始腦電信號輸入到CNN中,并結合Softmax函數從發作間期中識別發作前期;Zhang等[75]則首先提取了皮爾森相關系數,然后把發作間期和發作前期的相關矩陣輸入CNN進行分類識別。為了充分利用腦電數據的時域和空域相關性,Ozcan等[43]提出了3D CNN模型,把16個連續時間窗口獲得的圖像序列作為3D CNN模型的輸入,以捕捉大腦活動的時間演化,在CHB-MIT數據集上進行實驗,獲得了85.7%的靈敏度和每小時0.096次的誤報率。CNN也可以和生成式對抗網絡相結合,構建成深度卷積生成式對抗網絡(deep convolutional generative adversarial network,DCGAN)模型。作為一種無監督學習方法,DCGAN在特征提取過程中具有更大自主權和深度,可以從模型訓練過程中挖掘更高維度包含癲癇發作信息的特征[76-77]。另外,為了使腦電信號更適合輸入到CNN中,研究者們首先利用短時傅里葉變換(short-time Fourier transform,STFT)將原始腦電信號轉換為具有時間軸和頻率軸的二維矩陣,然后再依靠CNN強大的學習能力從癲癇發作間期中識別出發作前期[78-79]。
CNN能夠充分挖掘數據的空間信息,但是不能高效地提取時序信息,而多通道腦電信號不僅包含各通道之間的空間信息,還具備單通道內的時間屬性。RNN正是一類處理序列數據的網絡,其在自然語言處理、機器翻譯等領域獲得了廣泛應用。為了能夠充分利用腦電信號的時序信息,一些研究采用RNN來構建癲癇發作預測模型。然而由于傳統RNN模型訓練難度較大,存在梯度消失等問題,所以研究者們大多采用RNN的變體網絡構建預測模型,如長短期記憶(long short-term memory,LSTM)網絡和循環門控單元(gate recurrent unit,GRU)網絡等[35,79-80]。這些變體網絡不僅繼承了RNN能有效挖掘腦電信號中時序信息的優點,而且還解決了RNN的梯度消失問題。如單紹杰等[35]首先提取了癲癇患者腦電的小波能量特征,然后結合LSTM模型識別癲癇發作前期和發作間期狀態,從而實現癲癇發作的預測。他們的研究結果表明,與傳統的ML方法相比,基于LSTM模型的癲癇發作預測方法性能更優。GRU是LSTM的一種輕量化變體,與LSTM相比GRU的結構更簡單,能提高訓練效率,降低算法的計算復雜度。雙向LSTM(bidirectional LSTM,Bi-LSTM)是LSTM的另一種變體,相比于單向LSTM而言,Bi-LSTM能夠同時利用過去時刻和未來時刻的信息,能比單向LSTM獲得更準確的預測效果[81-82]。Abdelhameed等[73]提出的方法采用二維深度卷積自動編碼器從原始腦電信號中提取空域特征,然后采用Bi-LSTM模型對發作間期和發作前期狀態進行分類預測,在CHB-MIT數據集上獲得了平均94.6%的靈敏度和平均每小時0.04次的誤報率。
為了進一步提升模型的分類性能,很多研究者提出了CNN和RNN相結合的深度模型,以同時提取多通道腦電信號的空間和時序信息。如Shahbazi等[79]把CNN和LSTM結合起來,構建了CNN-LSTM模型,其中CNN充當特征提取器,為了充分發揮CNN自動提取特征的優勢,他們首先將STFT應用于腦電信號來構造多通道圖像,然后輸入CNN-LSTM模型中,以便捕獲癲癇發作前期和發作間期之間更具差異的時頻特征。他們所提出的方法在CHB-MIT癲癇數據集上實現了平均98.21%的靈敏度、平均每小時0.13次的誤報率和44.74 min的平均預測時間。Tang等[74]把CNN和GRU相結合構建了多視角卷積門控循環網絡(multi-view convolutional gated recurrent network,Mv-CGRN),并提出對多視角時空序列進行綜合分析,捕捉發作前期腦電信息的潛在變化,最終他們的模型在CHB-MIT數據集上獲得了平均94.50%的靈敏度和平均每小時0.118次的誤報率。Daoud等[82]把深度卷積神經網絡(deep convolutional neural network,DCNN)和深度卷積自動編碼器(deep convolutional auto encoder,DCAE)當作特征提取器,并分別與Bi-LSTM相結合構建預測模型,最后在CHB-MIT癲癇數據集上進行實驗獲得了最高99.6%的準確率。DL模型能更高效地處理海量腦電數據,并從數據中學習更深層次的空間和時序特征信息,在癲癇預測任務中獲得較好的效果。將DL方法應用于癲癇預測已成為發展趨勢,然而仍需注意的是,在構建和使用DL模型前,必須考慮數據預處理以及探索性數據分析等步驟,模型構建步驟必須在完成所有數據的預處理后才可以執行。
2.4 后處理方法
在預測癲癇發作的任務中,由于數據集的不平衡和預處理中對信號去噪不徹底等原因,導致了預測模型在識別癲癇發作間期狀態時會出現錯誤預警的情況,為了減小癲癇發作預測的誤報率,研究者們采用了一些后處理方法改善預測性能[28]。Wang等[13]提出對于每個測試樣本,分類模型將產生兩個概率值,一個是將輸入樣本識別為發作前期狀態的概率“p”,另一個是將輸入樣本識別為發作間期狀態的概率“1-p”,為了消除概率值波動導致的錯誤預警,他們采用滑動平均法平滑概率值曲線,一旦平滑后的概率“p”超過某個閾值就會發出警報,最后他們的實驗結果表明該后處理操作能有效地減小誤報率。Yuan等[30]認為分類器的輸出不僅等于類標簽,而且還等于連續決策變量,變量始終圍繞類標簽波動,于是他們采用卡爾曼濾波器和滑動平均濾波器平滑分類器的輸出,研究結果表明采用卡爾曼濾波器比滑動平均濾波器能更有效地平滑分類器的原始輸出,在不影響靈敏度的情況下降低誤報率。Parvez等[67]采用“k-of-n”模塊對分類器的輸出進行后處理,如圖3[67]所示,他們把癲癇發作間期狀態標記為0,把發作前期狀態標記為1,如果在n個連續的窗口中有多于或等于k個輸出樣本的標簽是1,就將此預測標記為發作前期狀態并預警,否則就將其標記為發作間期狀態不預警,他們分別試驗了“3-of-5”、“2-of-6”模塊,在發作之前5 min的預測范圍內成功降低了誤報率;Truong等[34]也采用了“k-of-n”模塊,并設置參數為k=5和n=10,即對于10個預測輸出,當至少有5個輸出被標記為發作前期時才發出警報,顯著減少了誤報次數。這些后處理方法都是為了得到更加穩定的預測模型,在保證高靈敏度的條件下,有效地降低誤報率。

3 預測模型性能評估與比較
3.1 性能評估的關鍵參數
為了評估癲癇發作預測算法的性能,研究者們定義了兩個重要的時間參數:癲癇預測區間(seizure prediction horizon,SPH)和癲癇發作區間(seizure occurrence period,SOP)。SOP是指預期出現癲癇發作的時期,SPH是指發出預測警報的時間點與SOP開始時間點之間的時期,另外SPH也稱為臨床干預時期,在此時間段內可以采取適當的措施應對癲癇發作[66,71]。SPH和SOP的定義如圖4[34]所示。

對于一次正確的癲癇預測,應該是在警報發出后的SPH范圍內,不出現癲癇發作,而在SOP范圍內出現癲癇發作,具體發作的時間點可以有所不同,除此之外的所有情況都是錯誤預測[66]。所以設置不同范圍的SPH和SOP對于評價癲癇發作預測模型的性能非常關鍵,如當SOP越小,對即將到來的癲癇發作時間點就預測得越精準,最理想的情況是SOP縮小成一個時間點,其含義是癲癇發作精確在此時間點產生,但設計這樣的預測模型難度特別大,至今還沒有一個完美的預測模型能精準預測出患者癲癇發作的某個時間點。因此,SOP并不是越小越好,隨著SOP范圍的減小,錯誤預測出現的次數也隨之增加。另外,研究者們認為雖然把SPH定義的范圍越大出現誤報的次數越少,但SPH范圍過大會增加患者的焦慮,給患者帶來沉重的心理負擔[28,34,41,83]。
如何定義合適的SPH和SOP范圍,研究者們進行了很多探索[84]。Nesaei等[58]認為理想的情況是SPH加SOP的范圍應大于10 min且小于90 min,這樣既能給癲癇患者足夠時間做好防護又能減少他們焦慮的心理壓力;Liu等[28]在研究中分別測試了不同長度的SPH對于預測模型的影響,結果表明當SPH從30 min減少到20 min時誤報率降低了;Zhang等[45]在研究中固定SPH為2 min,分別測試了SOP為30 min和50 min時對預測模型的影響,當SOP等于50 min時,在Freiburg癲癇腦電數據集中20例患者的數據上獲得了平均91.67%的靈敏度和每小時0.1次的誤報率,而當SOP等于30 min時,獲得了平均90.42%的靈敏度和每小時0.12次的誤報率,預測性能有所降低。很多研究者普遍采用了30 min的SOP范圍,但他們設置的SPH范圍卻各不相同,如Truong等[85]定義了5 min的SPH,在Freiburg癲癇腦電數據集上獲得了81.4%的靈敏度和每小時0.06次的誤報率,而Yuan等[11]設置了10 s的SPH,獲得了85.11%的靈敏度和每小時0.08次的誤報率,在誤報率稍微上升的情況下顯著提高了預測模型的靈敏度。至今SPH和SOP的范圍還沒有一個確定的標準,并沒有任何一個研究顯示某個固定的SPH和SOP范圍是最合適的,研究者們所普遍認可的觀點是針對各自不同的預測模型要定義適當的預測范圍。
3.2 不同預測方法的性能比較
表1[10-11,13,25,43,45,47,50,74-75,78,82,86-89]列舉了近年來部分代表性文獻中所提方法的結果對比,其中靈敏度和錯誤預測率(false prediction rate,FPR)是研究者們最感興趣的兩個關鍵評估指標。靈敏度代表預測模型能正確識別腦電圖中癲癇發作前期的能力,FPR代表模型每小時產生錯誤預報的次數,這兩個指標往往是互斥的,因此如何權衡這兩個指標以得到最優預測模型是研究者們需要不斷探索的問題[55]。

表1中所列數據集是本研究領域常用數據集,其中CHB-MIT癲癇數據集記錄了24個患者的頭皮腦電數據,Freiburg癲癇數據集記錄了21例患者的顱內腦電數據,Kaggle癲癇數據集是美國癲癇協會于2014年在Kaggle上發起的癲癇預測比賽中所用數據集,該數據集包含患有癲癇疾病的5只狗和2例人類患者的顱內腦電數據,表中所列被試數量指的是相應研究實驗中所用被試數量,關于數據集的詳細信息可查閱表中相應的參考文獻。另外還有其他數據集也被用于癲癇疾病的研究,如山東大學及其附屬第二醫院合作共建數據集(SH-SDU),給本領域的研究提供了更多選擇[90]。
從表1可以看出,總體而言,雖然基于傳統ML方法進行癲癇發作預測已獲得很多成果,但利用DL方法進行癲癇發作預測的效果優于傳統ML方法,這得益于DL技術能自動挖掘腦電信號中更深層次的特征信息,深度網絡的學習能力也比淺層ML模型強。傳統ML方法面臨特征選取和淺層模型泛化能力弱等制約,所以采用DL進行癲癇預測逐漸成為當前發展趨勢,需要開展更加深入的探索和研究,充分發揮DL技術的優勢,實現癲癇發作的高效預測。
4 總結與展望
本文綜述了癲癇預測的發展歷程及關鍵技術,詳細介紹了主流的分類預測法(主要包括預處理、預測模型構建和后處理等流程),并介紹了預測模型的性能評估指標,比較分析了最新研究方法的性能。目前,癲癇預測研究隨著ML和DL算法的不斷改進已經取得了極大進展,然而仍距臨床實際應用尚遠。鑒于現有癲癇預測技術皆基于龐大腦電數據進行,無法保證在線實時預測處理,且建模時需使用足量歷史腦電數據以完成模型訓練,而實際癲癇發作腦電數據采集較為困難,無法保證訓練所需充足數據量,加之不同患者間個體差異大,其發病誘因和病灶位置也不同,致使模型的普適性差、泛化能力弱。
針對上述研究現狀,未來亟待解決的關鍵問題有:如何優化選擇腦電通道以降低數據處理量,提升預測時效性;如何精簡優化癲癇發作預測模型,在確保精度的情況下減少模型參數與計算量;如何充分利用現有樣本數據,提升預測模型泛化能力,實現基于小樣本的癲癇發作準確預測。首先,由于不同癲癇患者之間存在較大個體差異,多通道腦電信號中并非每個導聯的數據都提供有效信息,可以嘗試采用遺傳算法等優化方法實現最優通道選擇。其次,DL模型往往復雜度較高,在一些場景和設備上的部署受限,可借助模型壓縮(如剪枝或量化)、優化加速、異構計算等方法突破瓶頸。最后,為解決小樣本學習容易出現過擬合或者泛化能力弱的問題,可以采用數據增廣和遷移學習等,改善預測模型的性能。相信隨著研究的不斷深入,上述問題能夠得以解決,癲癇發作預測技術最終將會進入臨床應用。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
癲癇(epilepsy)已成為神經科僅次于頭痛的第二大常見病,具有突發性、反復性和難治愈的特點[1]。據統計,全球約有7 000多萬癲癇患者,且數量每年都在遞增,雖然有些患者的病情可以通過藥物或者手術進行控制,但仍有約三分之一的頑固性癲癇患者得不到有效治療[2]。當大腦中部分神經元突發性異常放電時將導致短暫性功能障礙,患者會出現意識喪失、非自主性抽搐、精神異常等癥狀,若此時正處在相對危險的環境里如樓梯、泳池等,很可能造成二次傷害,嚴重威脅患者的生命健康,給患者的家庭乃至社會帶來沉重的負擔[3]。因此,如果能提前預測癲癇發作就可以及時對患者進行藥物干預或施加電刺激治療,使患者免受傷害[4]。
腦電圖(electroencephalogram,EEG)蘊含豐富的大腦活動信息,被廣泛地應用于腦疾病診斷和醫療康復等領域。腦電圖按照采集方式大致可以分為顱內腦電圖(intracranial electroencephalogram,iEEG)和頭皮腦電圖(scalp electroencephalogram,sEEG)[5-8]。顱內腦電圖又分為立體定向腦電圖(stereo-electroencephalography,SEEG)和皮層腦電圖(electrocorticography,ECoG),其中SEEG是將電極植入到腦深部組織記錄得到的腦電圖,ECoG是通過放置在大腦皮層上的電極記錄得到的腦電圖。顱內腦電具有噪聲干擾小、信噪比高的優點,但是需要手術植入采集電極。相比之下,頭皮腦電圖是通過放置在大腦頭皮表面的電極所記錄得到,信號會被顱骨衰減,較為微弱,易受眼電、肌電等偽跡信號干擾。但是,由于頭皮腦電具有無創傷、成本低和易獲得的優勢,更容易被患者所接受,因此被廣泛地應用于神經系統疾病的診斷和監測中[9]。
癲癇患者的腦電活動一般可以分為四個不同時期,分別是發作間期、發作前期、發作期和發作后期,如圖1[10]所示。癲癇發作開始前的一段時間稱為發作前期,一般持續幾分鐘到幾十分鐘;癲癇發作開始到發作結束所經歷的這段時間稱為發作期,一般持續數秒鐘至數分鐘;癲癇發作結束后患者恢復到正常狀態所經歷的這段時間稱為發作后期;發作后期到下一次發作前期所經歷的時間稱為發作間期,在這個時期患者表現的狀態和正常人一樣。研究表明癲癇患者從正常狀態到發作狀態并不是瞬間轉變的,而是經歷了一個過渡時期,即發作前期,準確和高效地對患者的發作前期進行識別將成為癲癇預測技術的關鍵要點[11]。

1 癲癇預測技術發展史
關于癲癇發作預測的早期工作可以追溯到1970年左右,研究人員嘗試多種方法從癲癇患者的腦電信號中提取發作前的相關信息進行癲癇發作的預測[12-13]。王蕾[14]利用基于小波變換的相位同步化分析算法,對癲癇患者的腦電信號進行分析,發現癲癇發作前的一段時間內相位同步化值出現明顯的下降趨勢,并且在癲癇發作期又顯著升高,甚至高于發作間期的水平。Sharma等[15-16]計算了大腦不同部位信號的平均方差和復雜性,結果顯示相關數值在發作間期和發作期之間的一段時間內明顯增大,他們進一步的研究結果也顯示在癲癇發作前的短時間內Beta波段的能量明顯增強。上述研究均表明癲癇發作前腦電特征信息會發生改變,這為預測癲癇發作提供了可能。
當前,基于腦電信號進行癲癇發作預測的方法大致可以分為兩種:第一種是基于閾值的方法,第二種是基于分類的方法[9]。基于閾值的方法側重于檢查癲癇發作前一段時間內某些特定指標的升高或降低趨勢,如Li等[17]發現癲癇發作前期和發作間期的棘波頻次不同,在臨近發作前的幾分鐘甚至一小時棘波頻次出現上升趨勢,基于此現象,他們采用形態學濾波器檢測腦電信號的棘波數目,然后計算出棘波頻次,最后把棘波頻次當作一種指標預測癲癇發作。Zandi等[18]通過分析癲癇患者腦電圖的當前時期與兩個參考時期之間的相似性來監測腦電信號的動態變化,他們分別計算出患者當前腦電圖狀態與該患者歷史發作間期和發作前期的參考狀態之間的差異程度,并設置特定的閾值預測癲癇發作。基于閾值法預測患者的癲癇發作可解釋性強,簡單直觀,但是泛化能力很弱,預測模型對不同患者所表現出的性能差別很大,易受閾值的波動導致誤報率較高。相對而言,基于分類方法進行癲癇預測的主要思路就是將患者的腦電圖人為切割成發作間期和發作前期,并提取特征信息,然后使用預測模型識別發作前期,從而實現對癲癇發作的預測。研究并設計高靈敏度、低誤報率的任務分類器區分識別發作間期和發作前期是構建預測模型的重點和難點[19]。隨著機器學習(machine learning,ML)和深度學習(deep learning,DL)算法理論的發展,基于分類法的癲癇發作預測技術成為當前研究的熱點,很多學者為推動該課題盡早實現臨床應用進行了大量研究。
2 癲癇預測技術環節
大量研究表明可以基于癲癇發作前期腦電信息的變化預測癲癇發作,其要解決的關鍵問題就是區分識別腦電圖的發作間期狀態和發作前期狀態[20-21]。因此,癲癇發作預測可以轉化為對患者的腦電信息進行發作間期和發作前期的二分類問題,主要包括以下三大步驟:預處理、模型構建(包含特征提取和分類)和后處理,流程如圖2所示。其中,預測模型構建方法大致可以分為兩大類,一種是基于ML的預測模型構建方法,另一種是基于DL的預測模型構建方法[22-23]。下面對上述關鍵步驟進行詳細介紹。

2.1 腦電信號預處理
由于環境中的電磁干擾以及采集設備自身存在熱噪聲等因素,采集的腦電信號難免會存在高頻以及50 Hz工頻干擾噪聲,這些噪聲大大降低了腦電信號的質量,對癲癇預測效果產生不利影響。所以對腦電信號的預處理首先就是消除這些噪聲[24-25]。針對工頻干擾噪聲,通常采用50 Hz的陷波濾波器進行消除[26-27]。針對高頻噪聲,由于腦電信號的主要能量集中在低頻范圍內,所以很多研究采用低通濾波器濾除高頻噪聲,如巴特沃斯濾波器、基于小波的濾波器、切比雪夫濾波器和FIR濾波器等[23,28-30]。
除了噪聲影響外,腦電采集過程中還容易受到眼電、肌電、運動等偽跡的影響,這些偽跡的頻率范圍往往與腦電信號具有重疊性,傳統濾波器無法有效濾除。針對這些偽跡干擾,通常采用獨立分量分析進行消除[26,28]。除此之外,還有其他方法用于偽跡去除,如Usman等[31]使用共同空間模式(common spatial pattern,CSP)濾波器和小波變換(wavelet transform,WT)對腦電信號進行處理,首先CSP濾波器被用于將多通道腦電信號轉換為單個替代通道腦電信號,增加發作間期和發作前期之間的差異程度,然后采用WT進行偽跡去除。Chen等[32]應用離散小波變換(discrete wavelet transform,DWT)去除偽跡的影響,并將腦電信號分解為幾個子頻帶信號,然后從這些子頻帶信號中提取更多特征信息,從而提高癲癇發作預測的準確性。另外還有多尺度主成分分析、經驗模態分解等方法也可用于腦電偽跡消除[33]。
去除噪聲和偽跡后的腦電信號還要進行加窗分段處理,窗口的長度和步長是兩個重要的參數,選擇合適的窗口長度會得到良好的預測效果[27]。Mahmoodian等[12]認為選擇較短的窗口長度對于捕獲腦電信號中的特定模式具有重要意義,因此他們采用5 s的滑動窗口,并將步長設置為5 s;Zhang等[23]在研究中把腦電數據段分為4 s,并將步長設置為2 s以擴充樣本數量。還有的學者在研究中用較長的窗口進行實驗,如Yuan等[30]采用10 s的滑動窗口處理腦電信號,步長設置為5 s;Truong等[34]采用30 s的窗口長度與15 s的步長處理腦電信號。從以往的研究中可以得到規律,窗口長度越大且步長越大,樣本的數量就會越少,可以大大降低預測模型的計算量,實時性能夠得到保證,但預測模型的性能可能會下降;反之窗口長度越小且步長越小,樣本數量增多,預測效果可以得到改善,但對計算設備的要求更高,數據處理非常耗時,如何權衡這兩者之間的關系以更好地提升預測模型的性能還有待更多的研究。
2.2 基于ML的預測方法
在利用ML方法預測癲癇發作的流程中,首先需要基于經驗提取能表征癲癇發作前期狀態的特征信息,常用的經典特征信息主要包括小波能量、功率譜密度、最大李雅普諾夫指數(largest Lyapunov exponent,LLE)、鎖相值、排列熵(permutation entropy,PE)、Hjorth參數、Hurst指數、分形維數值等[35-45]。Fei等[46]采用改進的LLE算法以更好地表征癲癇腦電的混沌動力學特征,研究結果表明,與傳統的LLE算法相比,新方法在識別發作前期狀態時具有更高的準確性。崔嵩[47]借鑒Bag-of-Word模型,對不同電極上局部波形之間的關系進行建模,進而提出基于Bag-of-Wave的特征提取方法。Raghu等[26]提出了一種連續分解指數(successive decomposition index,SDI)特征,他們的研究表明癲癇發作時SDI會顯著增大,在發作前期根據SDI的變化能夠預測癲癇發作。此外,也有研究利用主成分分析、CSP變換和自回歸模型等方法提取癲癇發作前期和發作間期的頻域或空域特征[48-51]。
由于人為提取特征信息具有較強的主觀性,難免造成特征信息的冗余,為了減少特征向量的冗余度,可以采用特征選擇技術篩選出最佳的特征子集,在保證預測精度的同時降低特征信息的維度[52-54]。Bandarabadi等[55]使用了一種基于幅度分布的特征選擇方法,通過計算癲癇腦電樣本特征的幅度分布直方圖(amplitude distribution histograms,ADHs),對各個特征進行排名,然后選擇具有最大ADHs差異的特征。Wang等[56]使用遞歸特征消除(recursive feature elimination,RFE)算法選取最優特征子集,他們把RFE和支持向量機(support vector machine,SVM)結合起來構建了RFE-SVM模型,利用這個模型對提取出來的所有原始特征進行多輪訓練,每輪訓練結束后消除若干權值系數對應的特征,再基于新的特征集進行下一輪訓練,直到遍歷所有特征,最后選出最優的特征集。遺傳算法是特征選擇的另一種廣泛使用的方法,也被用于癲癇腦電特征選擇中,以確定哪些特征組合更利于從發作間期狀態中識別出發作前期狀態[52-53]。
特征信息提取后,需要基于提取的特征信息建立ML分類模型,以實現癲癇發作的預測。常用的ML方法有極限學習機(extreme learning machine,ELM)、SVM、K近鄰算法、線性判別分析(linear discriminant analysis,LDA)、貝葉斯分類器、決策樹、隨機森林(random forest,RF)等[57-65]。其中,在目前癲癇發作預測技術中應用最多的分類器是SVM,因為所要解決的關鍵問題就是發作間期和發作前期的二分類問題,而SVM正是ML領域公認的處理二分類問題最優算法之一。為了提升癲癇預測的性能,許多研究對傳統ML進行改進。例如,最小二乘支持向量機(least squares support vector machine,LS-SVM)是SVM的擴展版本,它把傳統SVM中的不等式約束改為了等式約束,解決了SVM在約束優化編程方面存在較高計算負擔的問題,具有更快的處理速度[66-68]。Yuan等[30]把貝葉斯線性判別分析算法(Bayesian linear discriminant analysis,BLDA)用于癲癇發作的預測中,BLDA可以看作是Fisher線性判別分析(Fisher’s linear discriminant analysis,FLDA)的擴展,與傳統的FLDA相比,BLDA算法采用正則化方法避免過度擬合高維數據集,為參數優化提供了有效的解決方案而無需耗時的交叉驗證。
2.3 基于DL的預測方法
隨著DL技術的發展,許多學者基于DL對癲癇預測模型構建進行了研究。由于DL方法能夠針對不同數據自動提取特征信息,不需要根據經驗人為提取,避免了ML方法中手動提取特征的一些缺陷,被廣泛應用于各領域中[69-70]。當前,基于DL方法的癲癇發作預測模型構建技術大致可以分為三類:基于卷積神經網絡(convolutional neural network,CNN)的模型構建方法、基于循環神經網絡(recurrent neural network,RNN)的模型構建方法、基于CNN與RNN相融合的模型構建方法[50,65,71-74]。
CNN作為DL的一個重要分支,采用局部感受野、共享權值、降采樣等思想,獲取數據的多尺度特征信息,被廣泛應用于圖像處理領域。由于腦電信號一般為多通道采集,所以很多研究將多通道腦電信號映射為二維(two-dimensional,2D)/三維(three-dimensional,3D)圖像,以便于采用CNN進行模型構建。Xu等[10]設計了一個端到端的預測模型,把原始腦電信號輸入到CNN中,并結合Softmax函數從發作間期中識別發作前期;Zhang等[75]則首先提取了皮爾森相關系數,然后把發作間期和發作前期的相關矩陣輸入CNN進行分類識別。為了充分利用腦電數據的時域和空域相關性,Ozcan等[43]提出了3D CNN模型,把16個連續時間窗口獲得的圖像序列作為3D CNN模型的輸入,以捕捉大腦活動的時間演化,在CHB-MIT數據集上進行實驗,獲得了85.7%的靈敏度和每小時0.096次的誤報率。CNN也可以和生成式對抗網絡相結合,構建成深度卷積生成式對抗網絡(deep convolutional generative adversarial network,DCGAN)模型。作為一種無監督學習方法,DCGAN在特征提取過程中具有更大自主權和深度,可以從模型訓練過程中挖掘更高維度包含癲癇發作信息的特征[76-77]。另外,為了使腦電信號更適合輸入到CNN中,研究者們首先利用短時傅里葉變換(short-time Fourier transform,STFT)將原始腦電信號轉換為具有時間軸和頻率軸的二維矩陣,然后再依靠CNN強大的學習能力從癲癇發作間期中識別出發作前期[78-79]。
CNN能夠充分挖掘數據的空間信息,但是不能高效地提取時序信息,而多通道腦電信號不僅包含各通道之間的空間信息,還具備單通道內的時間屬性。RNN正是一類處理序列數據的網絡,其在自然語言處理、機器翻譯等領域獲得了廣泛應用。為了能夠充分利用腦電信號的時序信息,一些研究采用RNN來構建癲癇發作預測模型。然而由于傳統RNN模型訓練難度較大,存在梯度消失等問題,所以研究者們大多采用RNN的變體網絡構建預測模型,如長短期記憶(long short-term memory,LSTM)網絡和循環門控單元(gate recurrent unit,GRU)網絡等[35,79-80]。這些變體網絡不僅繼承了RNN能有效挖掘腦電信號中時序信息的優點,而且還解決了RNN的梯度消失問題。如單紹杰等[35]首先提取了癲癇患者腦電的小波能量特征,然后結合LSTM模型識別癲癇發作前期和發作間期狀態,從而實現癲癇發作的預測。他們的研究結果表明,與傳統的ML方法相比,基于LSTM模型的癲癇發作預測方法性能更優。GRU是LSTM的一種輕量化變體,與LSTM相比GRU的結構更簡單,能提高訓練效率,降低算法的計算復雜度。雙向LSTM(bidirectional LSTM,Bi-LSTM)是LSTM的另一種變體,相比于單向LSTM而言,Bi-LSTM能夠同時利用過去時刻和未來時刻的信息,能比單向LSTM獲得更準確的預測效果[81-82]。Abdelhameed等[73]提出的方法采用二維深度卷積自動編碼器從原始腦電信號中提取空域特征,然后采用Bi-LSTM模型對發作間期和發作前期狀態進行分類預測,在CHB-MIT數據集上獲得了平均94.6%的靈敏度和平均每小時0.04次的誤報率。
為了進一步提升模型的分類性能,很多研究者提出了CNN和RNN相結合的深度模型,以同時提取多通道腦電信號的空間和時序信息。如Shahbazi等[79]把CNN和LSTM結合起來,構建了CNN-LSTM模型,其中CNN充當特征提取器,為了充分發揮CNN自動提取特征的優勢,他們首先將STFT應用于腦電信號來構造多通道圖像,然后輸入CNN-LSTM模型中,以便捕獲癲癇發作前期和發作間期之間更具差異的時頻特征。他們所提出的方法在CHB-MIT癲癇數據集上實現了平均98.21%的靈敏度、平均每小時0.13次的誤報率和44.74 min的平均預測時間。Tang等[74]把CNN和GRU相結合構建了多視角卷積門控循環網絡(multi-view convolutional gated recurrent network,Mv-CGRN),并提出對多視角時空序列進行綜合分析,捕捉發作前期腦電信息的潛在變化,最終他們的模型在CHB-MIT數據集上獲得了平均94.50%的靈敏度和平均每小時0.118次的誤報率。Daoud等[82]把深度卷積神經網絡(deep convolutional neural network,DCNN)和深度卷積自動編碼器(deep convolutional auto encoder,DCAE)當作特征提取器,并分別與Bi-LSTM相結合構建預測模型,最后在CHB-MIT癲癇數據集上進行實驗獲得了最高99.6%的準確率。DL模型能更高效地處理海量腦電數據,并從數據中學習更深層次的空間和時序特征信息,在癲癇預測任務中獲得較好的效果。將DL方法應用于癲癇預測已成為發展趨勢,然而仍需注意的是,在構建和使用DL模型前,必須考慮數據預處理以及探索性數據分析等步驟,模型構建步驟必須在完成所有數據的預處理后才可以執行。
2.4 后處理方法
在預測癲癇發作的任務中,由于數據集的不平衡和預處理中對信號去噪不徹底等原因,導致了預測模型在識別癲癇發作間期狀態時會出現錯誤預警的情況,為了減小癲癇發作預測的誤報率,研究者們采用了一些后處理方法改善預測性能[28]。Wang等[13]提出對于每個測試樣本,分類模型將產生兩個概率值,一個是將輸入樣本識別為發作前期狀態的概率“p”,另一個是將輸入樣本識別為發作間期狀態的概率“1-p”,為了消除概率值波動導致的錯誤預警,他們采用滑動平均法平滑概率值曲線,一旦平滑后的概率“p”超過某個閾值就會發出警報,最后他們的實驗結果表明該后處理操作能有效地減小誤報率。Yuan等[30]認為分類器的輸出不僅等于類標簽,而且還等于連續決策變量,變量始終圍繞類標簽波動,于是他們采用卡爾曼濾波器和滑動平均濾波器平滑分類器的輸出,研究結果表明采用卡爾曼濾波器比滑動平均濾波器能更有效地平滑分類器的原始輸出,在不影響靈敏度的情況下降低誤報率。Parvez等[67]采用“k-of-n”模塊對分類器的輸出進行后處理,如圖3[67]所示,他們把癲癇發作間期狀態標記為0,把發作前期狀態標記為1,如果在n個連續的窗口中有多于或等于k個輸出樣本的標簽是1,就將此預測標記為發作前期狀態并預警,否則就將其標記為發作間期狀態不預警,他們分別試驗了“3-of-5”、“2-of-6”模塊,在發作之前5 min的預測范圍內成功降低了誤報率;Truong等[34]也采用了“k-of-n”模塊,并設置參數為k=5和n=10,即對于10個預測輸出,當至少有5個輸出被標記為發作前期時才發出警報,顯著減少了誤報次數。這些后處理方法都是為了得到更加穩定的預測模型,在保證高靈敏度的條件下,有效地降低誤報率。

3 預測模型性能評估與比較
3.1 性能評估的關鍵參數
為了評估癲癇發作預測算法的性能,研究者們定義了兩個重要的時間參數:癲癇預測區間(seizure prediction horizon,SPH)和癲癇發作區間(seizure occurrence period,SOP)。SOP是指預期出現癲癇發作的時期,SPH是指發出預測警報的時間點與SOP開始時間點之間的時期,另外SPH也稱為臨床干預時期,在此時間段內可以采取適當的措施應對癲癇發作[66,71]。SPH和SOP的定義如圖4[34]所示。

對于一次正確的癲癇預測,應該是在警報發出后的SPH范圍內,不出現癲癇發作,而在SOP范圍內出現癲癇發作,具體發作的時間點可以有所不同,除此之外的所有情況都是錯誤預測[66]。所以設置不同范圍的SPH和SOP對于評價癲癇發作預測模型的性能非常關鍵,如當SOP越小,對即將到來的癲癇發作時間點就預測得越精準,最理想的情況是SOP縮小成一個時間點,其含義是癲癇發作精確在此時間點產生,但設計這樣的預測模型難度特別大,至今還沒有一個完美的預測模型能精準預測出患者癲癇發作的某個時間點。因此,SOP并不是越小越好,隨著SOP范圍的減小,錯誤預測出現的次數也隨之增加。另外,研究者們認為雖然把SPH定義的范圍越大出現誤報的次數越少,但SPH范圍過大會增加患者的焦慮,給患者帶來沉重的心理負擔[28,34,41,83]。
如何定義合適的SPH和SOP范圍,研究者們進行了很多探索[84]。Nesaei等[58]認為理想的情況是SPH加SOP的范圍應大于10 min且小于90 min,這樣既能給癲癇患者足夠時間做好防護又能減少他們焦慮的心理壓力;Liu等[28]在研究中分別測試了不同長度的SPH對于預測模型的影響,結果表明當SPH從30 min減少到20 min時誤報率降低了;Zhang等[45]在研究中固定SPH為2 min,分別測試了SOP為30 min和50 min時對預測模型的影響,當SOP等于50 min時,在Freiburg癲癇腦電數據集中20例患者的數據上獲得了平均91.67%的靈敏度和每小時0.1次的誤報率,而當SOP等于30 min時,獲得了平均90.42%的靈敏度和每小時0.12次的誤報率,預測性能有所降低。很多研究者普遍采用了30 min的SOP范圍,但他們設置的SPH范圍卻各不相同,如Truong等[85]定義了5 min的SPH,在Freiburg癲癇腦電數據集上獲得了81.4%的靈敏度和每小時0.06次的誤報率,而Yuan等[11]設置了10 s的SPH,獲得了85.11%的靈敏度和每小時0.08次的誤報率,在誤報率稍微上升的情況下顯著提高了預測模型的靈敏度。至今SPH和SOP的范圍還沒有一個確定的標準,并沒有任何一個研究顯示某個固定的SPH和SOP范圍是最合適的,研究者們所普遍認可的觀點是針對各自不同的預測模型要定義適當的預測范圍。
3.2 不同預測方法的性能比較
表1[10-11,13,25,43,45,47,50,74-75,78,82,86-89]列舉了近年來部分代表性文獻中所提方法的結果對比,其中靈敏度和錯誤預測率(false prediction rate,FPR)是研究者們最感興趣的兩個關鍵評估指標。靈敏度代表預測模型能正確識別腦電圖中癲癇發作前期的能力,FPR代表模型每小時產生錯誤預報的次數,這兩個指標往往是互斥的,因此如何權衡這兩個指標以得到最優預測模型是研究者們需要不斷探索的問題[55]。

表1中所列數據集是本研究領域常用數據集,其中CHB-MIT癲癇數據集記錄了24個患者的頭皮腦電數據,Freiburg癲癇數據集記錄了21例患者的顱內腦電數據,Kaggle癲癇數據集是美國癲癇協會于2014年在Kaggle上發起的癲癇預測比賽中所用數據集,該數據集包含患有癲癇疾病的5只狗和2例人類患者的顱內腦電數據,表中所列被試數量指的是相應研究實驗中所用被試數量,關于數據集的詳細信息可查閱表中相應的參考文獻。另外還有其他數據集也被用于癲癇疾病的研究,如山東大學及其附屬第二醫院合作共建數據集(SH-SDU),給本領域的研究提供了更多選擇[90]。
從表1可以看出,總體而言,雖然基于傳統ML方法進行癲癇發作預測已獲得很多成果,但利用DL方法進行癲癇發作預測的效果優于傳統ML方法,這得益于DL技術能自動挖掘腦電信號中更深層次的特征信息,深度網絡的學習能力也比淺層ML模型強。傳統ML方法面臨特征選取和淺層模型泛化能力弱等制約,所以采用DL進行癲癇預測逐漸成為當前發展趨勢,需要開展更加深入的探索和研究,充分發揮DL技術的優勢,實現癲癇發作的高效預測。
4 總結與展望
本文綜述了癲癇預測的發展歷程及關鍵技術,詳細介紹了主流的分類預測法(主要包括預處理、預測模型構建和后處理等流程),并介紹了預測模型的性能評估指標,比較分析了最新研究方法的性能。目前,癲癇預測研究隨著ML和DL算法的不斷改進已經取得了極大進展,然而仍距臨床實際應用尚遠。鑒于現有癲癇預測技術皆基于龐大腦電數據進行,無法保證在線實時預測處理,且建模時需使用足量歷史腦電數據以完成模型訓練,而實際癲癇發作腦電數據采集較為困難,無法保證訓練所需充足數據量,加之不同患者間個體差異大,其發病誘因和病灶位置也不同,致使模型的普適性差、泛化能力弱。
針對上述研究現狀,未來亟待解決的關鍵問題有:如何優化選擇腦電通道以降低數據處理量,提升預測時效性;如何精簡優化癲癇發作預測模型,在確保精度的情況下減少模型參數與計算量;如何充分利用現有樣本數據,提升預測模型泛化能力,實現基于小樣本的癲癇發作準確預測。首先,由于不同癲癇患者之間存在較大個體差異,多通道腦電信號中并非每個導聯的數據都提供有效信息,可以嘗試采用遺傳算法等優化方法實現最優通道選擇。其次,DL模型往往復雜度較高,在一些場景和設備上的部署受限,可借助模型壓縮(如剪枝或量化)、優化加速、異構計算等方法突破瓶頸。最后,為解決小樣本學習容易出現過擬合或者泛化能力弱的問題,可以采用數據增廣和遷移學習等,改善預測模型的性能。相信隨著研究的不斷深入,上述問題能夠得以解決,癲癇發作預測技術最終將會進入臨床應用。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。