為了增強基于腦電圖信號的青少年抑郁癥計算機輔助診斷精度,本研究采集了 32 名女性青少年靜息狀態下閉眼 4 min 的腦電圖信號,其中抑郁癥患者 16 名(抑郁組)、健康受試者 16 名(對照組),年均(16.3 ± 1.3)歲。首先,根據信號之間的相位同步性,使用相位鎖定值(PLV)方法,分別在 θ 和 α 頻段下計算腦功能連接。然后基于圖論方法,再分別計算加權網絡的強度、平均特征路徑長度和平均聚類系數(P < 0.05)。接下來,利用多重閾值和網絡參數的關系,提取各個網絡參數的曲線下面積(AUC)作為新特征(P < 0.05)。最后,使用支持向量機(SVM),將兩組受試者的網絡參數和網絡參數的 AUC 作為特征進行分類。研究結果顯示,使用強度、平均特征路徑長度、平均聚類系數作為特征,在 θ 頻段,其分類精度分別由 69% 提高到 71%、66% 提高到 77%、50% 提高到 68%;在 α 頻段,其精度分別由 72% 提高到 79%、69% 提高到 82%、65% 提高到 75%;且整體來看,在 α 頻段使網絡參數的 AUC 作為特征,分類精度比網絡參數特征提升了 10% 左右,而在 θ 頻段,僅平均聚類系數 AUC 的分類精度提升了 18%。本研究結果證明,基于圖論量化腦功能網絡并對網絡參數特征優化,能夠對青少年抑郁癥的計算機輔助診斷提供一定的幫助和理論支撐。
引用本文: 沈瀟童, 王玥, 畢卉, 曹音, 王蘇弘, 鄒凌. 基于腦網絡參數優化的青少年抑郁癥患者與健康人群分類識別研究. 生物醫學工程學雜志, 2020, 37(6): 1037-1044, 1055. doi: 10.7507/1001-5515.201908003 復制
引言
根據世界衛生組織 2017 年的調查報告,全球已有 3.2 億抑郁癥患者,其中青少年抑郁癥患者占比 7%[1],并且呈現逐年增多的趨勢,因此針對青少年抑郁癥患者及時診斷的相關研究也受到了越來越多的重視。腦電圖(electroencephalogram,EEG)作為一種輔助診斷的工具,可以反映大腦的功能性變化[2]。通過對 EEG 信號構建腦網絡并進行圖論量化分析,能在臨床上輔助診斷抑郁癥[3],但是計算機輔助診斷青少年抑郁癥,目前仍存在理論測試的精度較高而實際測試時精度不穩的問題[4]。
如今,隨著社交網絡思維方法的引入,通過信號間關系構建腦網絡進行數據分析已經成為研究熱點。目前,已有多個研究發現了抑郁癥患者其腦功能連接受損的情況[5-6],如 Li 等[7]利用同步性指標研究抑郁癥患者的腦功能連接變化,發現額葉/前額相位延遲滯后指數的增加與大腦的認知補償機制有關。Lee 等[8]研究了吸毒且重度抑郁癥青少年在靜息態下的腦功能連接,研究結果發現,前肢環路異常可能是青春期抑郁癥的特征之一。隨著腦網絡構建和數據分析方法的興起,基于圖論的方法研究計算網絡參數已應用于各個研究領域。Guo 等[9]研究了核磁環境下抑郁癥患者的靜息態腦功能網絡,結果發現抑郁組和對照組均表現出典型的小世界特征。美國密蘇里大學的 Shim 等[10]研究了抑郁癥患者在靜息態下功能連接的改變,發現大腦功能網絡指數的紊亂可能反映了抑郁癥患者情緒處理的改變,而網絡參數則可作為有效的生物學指標。因此基于以上研究,本研究擬將網絡參數作為特征,通過對其進行對比分析,從而實現對青少年抑郁癥患者和健康者進行分類。
此前,機器學習已廣泛應用于與抑郁癥相關的分類研究中。如 Mumtaz 等[11]以 EEG 頻帶功率為特征,使用決策樹方法進行分類,準確率可達 80%。Alkaysi 等[12]利用極限學習機直接對抑郁癥患者與健康人的腦電信號進行分類,精度達到 92%。Mumtaz 等[13]采集了抑郁癥患者在靜息態下的腦電數據,分別使用小波變換、短時傅里葉變換和經驗模式分解提取特征,然后采用邏輯回歸模型進行分類并對比分析,結果發現,利用小波變換所提取的特征分類精度最高,達到 87.5%。因此基于以上相關研究,本研究擬采用機器學習對所提取的特征進行分類。
為了盡可能地提高分類精度,本研究提出了基于腦功能網絡參數的特征優化方法。首先,分別采集了 16 名女性青少年抑郁患者和 16 名女性青少年健康受試者在靜息態下 4 min 的 EEG 信號,經過預處理后,將信號分為 80 個試次。然后,通過相位鎖定指數(phase locking value,PLV)計算鄰接矩陣,進一步構建腦功能網絡,同時,利用比例閾值對全局網絡參數進行優化,即提取腦網絡參數的曲線下面積(area under curve,AUC)作為特征。最后,分別利用優化前后的網絡參數作為特征進行分類,并對比分析。結果表明,采用優化后的網絡參數作為特征,分類精度均有所提升,且利用 α 頻段下的平均特征路徑長度的 AUC 進行分類,精度最高,可達 82%。本研究通過優化網絡參數,不僅能夠有效地從全局角度分析腦功能網絡,而且對提升未來臨床診斷的準確率也具有重要意義。
1 相位鎖定指數和圖論分析
1.1 相位鎖定指數
PLV 是測量兩個信號段之間同步性的方法[7]。該方法適用于對重復刺激的響應,并在不同的試次中,尋找兩個信號之間相位差變化較小的延遲。假設給定兩個信號序列 x,y 和感興趣頻率 f,計算信號 x 和 y 的每個延遲在頻率 f 處的 PLV,其步驟如下:
(1)對信號進行帶通濾波。
(2)對濾波后的信號以頻率 f 為中心進行伽柏小波卷積,卷積算子如式(1)所示:
![]() |
其中, 為 7/f,t 為信號序列對應的時間。
(3)在 t 時刻,計算信號間的 PLV 值(以符號 PLV 表示),如式(2)所示:
![]() |
其中, 代表了兩個信號的相位差值
,而
是從所有時間 t 中所提取出的卷積相位,n 代表了試次數,
,本研究中將信號分為 80 個試次,因此 N 取值為 80。如果在某一試次中兩個信號的相位差值變化很小,那么 PLV 的值就越接近于 1,反之,其值越接近于 0。
1.2 網絡參數計算
本研究使用圖論量化腦網絡,其中,腦網絡由邊和節點組成。由于本研究使用 64 導腦電帽采集信號,將每個導聯看作 1 個節點,故共有 64 個節點,節點之間相連的支路即為邊。在加權網絡中,PLV 的值則代表網絡節點間的連接強度。在圖論中,通常采用強度、平均特征路徑長度、平均聚類系數等參數作為量化指標,因此本文使用如下三種網絡參數進行研究與分析。
1.2.1 強度
強度表示網絡節點間的相關程度。強度值越高,意味著整個大腦的連接越緊密。通常,連接強度值是根據網絡中所有節點間的連接權重之和來估計的,網絡強度 S 的計算方式如式(3)所示:
![]() |
其中, 為鄰接矩陣中第 i 行和第 j 列的元素。
1.2.2 平均特征路徑長度
平均特征路徑長度是所有網絡節點間最短路徑長度的平均值,常用其對宏觀網絡的特性進行研究與分析。平均特征路徑長度 Lw 的計算如式(4)所示:
![]() |
在加權網絡中,最短路徑長度通常為兩個節點間邊的權重的倒數。式中,J 為加權網絡中的節點, 為任意兩個節點 i 和 j 最短路徑的邊數。
1.2.3 平均聚類系數
平均聚類系數可用于表征網絡的集團化程度。在加權網絡中,如果節點 i 的度為 3,聚類系數則定義為這 3 個節點之間實際存在的邊數與可能存在的所有邊數之比,因此,節點 i 的聚類系數 的計算如式(5)所示:
![]() |
其中,、
、
為鄰接矩陣中的元素,代表連接權重。最終,根據節點總數對所得
求均值,可得到平均聚類系數
,如式(6)所示。
![]() |
的值越接近 1,則代表網絡的連接程度越緊密;其值越接近于 0,則表明連接程度越松散,甚至可能存在多個節點互不相連。
2 腦電數據采集和分析
2.1 受試者數據來源
所有受試者均在常州市第一人民醫院經過臨床診斷,被分為抑郁青少年和健康青少年。通過對數據進行篩選,參與本研究的數據選取受試者均為女性,有抑郁青少年 16 例,設為抑郁組;健康青少年 16 例,設為對照組;年均(16.3 ± 1.3)歲,抑郁組和對照組之間的年齡差異無統計學意義(P > 0.05)。在試驗前,受試者均使用漢密頓抑郁量表(Hamilton depression rating scales,HDRS)進行檢測[14],結果顯示抑郁組得分高于對照組。兩組青少年的試驗研究均已通過常州市第一人民醫院倫理委員會批準,所有受試者或其監護人都簽署了知情同意書,自愿參加本試驗。
2.2 數據采集及試驗過程
本次試驗采用 64 導聯 EEG 采集系統(GES300,Electrical Geodesics Inc,美國),腦電帽的電極位置分布如圖 1 所示。試驗中,采樣頻率設置為 500 Hz,電極阻抗設定在 50 kΩ 以下,利用采集軟件 Net Station 4.5(Electrical Geodesics Inc,美國)記錄數據,帶通濾波為 0.5~40 Hz,參考電極為 Cz。試驗采集了受試者們在靜息閉眼狀態下的 EEG 數據,時長約 4 min,整個采集過程保持安靜。

2.3 數據處理
2.3.1 數據預處理
本研究使用數據處理分析軟件 Matlab 2016a(Math Work Inc,美國)對所采集的數據進行預處理,具體步驟包括:帶通濾波(0.5~40 Hz)、偽跡檢測、壞導聯替換、參考點轉換,并使用獨立成分分析(independent component analysis,ICA)去除眼動偽跡以及其他噪聲。對預處理后的數據,每 3 s 進行一次分段,并將每段作為 1 個試次,因此構建了共計 80 個試次的三維矩陣(維度:64 × 500 × 80)。
2.3.2 頻段的選擇
通常,對 EEG 數據的研究集中在 0~70 Hz 之間,其中涵蓋了 δ、θ、α、β、γ 頻段。在先前的研究中,通過不同的同步性測量方法,發現腦功能連接在 θ 和 α 頻段處出現了斷裂[10]。該結果表明,在這兩個頻段中,很可能存在關于腦網絡的有效特征。因此,本次研究主要定位于 θ、α 頻段。
2.4 腦功能網絡
2.4.1 腦功能網絡構建
本研究利用 PLV 構建了大腦功能網絡,功能網絡的構建與社交網絡類似,是根據兩個信號之間的相位,計算其同步性,通過同步性直觀地反映網絡強度,為后續的分類研究打下理論基礎。
2.4.2 圖論分析
構建腦功能網絡后,需要對其進行量化。本研究通過圖論參數來表征網絡特性,分別在單一閾值下以及多重閾值下,計算了強度、平均聚類系數和平均特征路徑長度。
2.4.3 網絡參數優化
本研究使用了 PLV 計算鄰接矩陣并構建腦功能網絡,分別計算了 64 導聯 EEG 信號的 PLV 值。然而,對網絡的分析涉及閾值的選擇,目前較為常見的選擇方法有兩種:一種是根據所有受試者的整體情況逐漸增大閾值,從而進行選擇;另一種是將網絡中確定存在的邊數與理論存在的邊數之比作為閾值。本研究基于加權鄰接矩陣,對網絡中的所有連接強度值進行降序排列,按照一定比例選出較大的強度值。為了在增益和損耗條件下保證最佳的網絡連接性,本研究對每個受試者的腦功能網絡進行閾值分析并比較,以 0.01 為步長,在 0.01~0.80 范圍內確定最佳閾值。
比例閾值選取的核心是先對鄰接矩陣右上角的權值進行升序排列,并記錄下對應的矩陣位置,計算出此時需要的最高項系數。根據最高項系數調節比例閾值,確定所需要保留的 PLV 值[15]。
當比例閾值取 0.04 時,本研究計算發現 θ 和 α 頻段的網絡參數差異具有統計學意義(P < 0.05)。但是,單個比例閾值無法反映宏觀的網絡參數變化,當閾值不同時,網絡參數的值也存在差異。為了更好地優化網絡參數,本研究采用計算網絡參數的 AUC 作為優化方案。由于一個閾值就對應一個網絡參數值,因此共計算了 79 組網絡參數值,構建了多重閾值和網絡參數值之間的關系圖,并算出每個網絡參數的 AUC。
3 結果
3.1 功能連接性結果
為了構建腦功能網絡,先計算了抑郁組和對照組在 θ 和 α 頻段處的腦功能連接,其鄰接矩陣分別如圖 2、圖 3 所示。PLV 的取值介于 0~1,其值越接近 1,則說明信號之間的同步性就越強。由圖 2、圖 3 可知,α 頻段的連接強度明顯高于 θ 頻段,同時,抑郁組比對照組呈現更大的連接強度。


為了更好地反映大腦之間連接的緊密程度,根據鄰接矩陣進一步構建腦網絡。如圖 4 和圖 5 所示,在腦網絡拓撲圖中,每個節點能量的大小(標準化為 [0,1])代表該節點與其他節點連接的密集程度,而節點間的連接強度則使用線條的粗細和顏色的深淺來表示,線條越粗,顏色越深,代表著連接強度越大。圖 4 表明在 θ 頻段,抑郁組的大腦連接緊密度較為均衡,而對照組大腦右半球的連接緊密程度比左半球要高。而圖 5 的結果顯示,在 α 頻段,對照組在大腦右側的連接強度高于抑郁組,而抑郁組在左顳區的連接緊密度高于對照組。


3.2 特征提取
3.2.1 網絡參數結果
本研究分別計算了最佳比例閾值為 0.04 時,在 θ 頻段和 α 頻段處的強度、平均特征路徑長度和平均聚類系數,個體網絡參數共計 32 個(抑郁組 16 個,對照組 16 個),分別如圖 6、圖 7、圖 8 所示。



為了能夠更直觀地展現網絡的特征,本研究除了使用圖論進行量化,將強度、平均特征路徑長度和平均聚類系數作為評估網絡的指標,還分別計算了 32 個受試者的網絡參數的均值 ± 標準差,如表 1 所示。



從表 1 中可以看出,抑郁組 α 頻段的參數值均比 θ 頻段的高,而且抑郁組的參數值比對照組的高。經過 t 檢驗分析,發現兩組受試者在強度、平均特征路徑長度、平均聚類系數上的差異都具有統計學意義(P < 0.05)。
3.2.2 網絡參數優化結果
本研究以平均聚類系數為例,構建了多重閾值和網絡參數值之間的關系。如圖 9 所示,一個比例閾值對應了一個網絡參數,通過求得網絡參數的 AUC 作為優化后的分類特征。

最終,兩組受試者在不同頻段下網絡參數的 AUC 如表 2 所示。

通過多重閾值和網絡參數值之間的關系可以看出,提取網絡參數的 AUC 作為特征不僅能反映整體特征穩定的變化趨勢,還能減少個體差異性帶來的影響。但是這也可能忽略了特征最為明顯的部分,不利于從生物機制的角度進行分析。
3.3 分類結果和性能
為了對兩組受試者進行分類,分別提取整體的網絡參數和優化后的網絡參數作為特征,并構建了 6 個特征矩陣,利用支持向量機(support vector machine,SVM)算法進行分類,并采用留一交叉驗證法(高斯核函數)作比較。如表 3 所示,從整體來看,將優化后的參數作為分類特征,精度都有所提升,其中 α 頻段下的分類精度都高于 θ 頻段。從參數優化前后的分類效果來看,在 θ 頻段下,使用強度的 AUC 進行分類,精度只提升了 2%,使用平均特征路徑長度的 AUC 進行分類,精度提升了 11%,使用平均聚類系數的 AUC 進行分類,精度則提升了 18%;在 α 頻段下,使用強度的 AUC 作為特征,精度比優化前提升了 7%,使用平均特征路徑長度的 AUC 作為特征,精度提升了 13%,使用平均聚類系數的 AUC 作為特征,精度提升了 10%。

4 討論
本研究將功能連接網絡和網絡參數的優化應用于抑郁癥患者的分類研究中。通過使用 PLV 方法計算 64 導聯 EEG 信號的鄰接矩陣,并構建腦網絡,可以將非線性的 EEG 信號轉換為更加直觀的網絡參數,不僅有利于對信號的進一步研究,對臨床診斷抑郁癥也具有輔助作用。為了驗證網絡參數作為特征的有效性,對于選取的 32 個獨立樣本(抑郁組 16 個,對照組 16 個),分別在 θ、α 頻段下計算了腦功能網絡的強度、平均特征路徑長度和平均聚類系數,然后使用 SVM 分類器,同時采用留一交叉驗證法進行分類,但實際分類精度并不是很高。因此,為了改善分類效果,本研究使用比例閾值對網絡參數進行全局優化,將在多重閾值下網絡參數的 AUC 作為新特征并進行分類。結果顯示,對 θ、α 頻段處的三種網絡參數進行特征優化,分類精度均有明顯提高,這表明該方法不僅減少了單個閾值對網絡參數的擾動性,還增加了全局特征的穩定性。
本研究需要指出的是,計算網絡參數的 AUC 作為優化方法,雖然能夠有效地提升分類精度,但是無法用于研究極端條件下的特異性質。從另一個角度說,這是一種特征的處理和選擇過程,因此該方法更適用于提升人機交互下診斷疾病的準確率與測試的穩定性。另外,該方法作為計算機輔助診斷技術來說也是可行的,可若在實際使用時遇到無法解決的極端情況,需要進一步細化數據,即從全局到局部對腦網絡進行分析。
在研究中已發現抑郁組和對照組的連接密度和強度在額區、顳區、枕區有較大差異,為了進一步的深入分析,后續將會著重于對不同腦區的研究,并計算其網絡參數,從而細化不同腦區的參數特征,并研究比例閾值的變化對局部網絡參數值的影響,進而提升分類效果,提高臨床輔助診斷的質量。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
根據世界衛生組織 2017 年的調查報告,全球已有 3.2 億抑郁癥患者,其中青少年抑郁癥患者占比 7%[1],并且呈現逐年增多的趨勢,因此針對青少年抑郁癥患者及時診斷的相關研究也受到了越來越多的重視。腦電圖(electroencephalogram,EEG)作為一種輔助診斷的工具,可以反映大腦的功能性變化[2]。通過對 EEG 信號構建腦網絡并進行圖論量化分析,能在臨床上輔助診斷抑郁癥[3],但是計算機輔助診斷青少年抑郁癥,目前仍存在理論測試的精度較高而實際測試時精度不穩的問題[4]。
如今,隨著社交網絡思維方法的引入,通過信號間關系構建腦網絡進行數據分析已經成為研究熱點。目前,已有多個研究發現了抑郁癥患者其腦功能連接受損的情況[5-6],如 Li 等[7]利用同步性指標研究抑郁癥患者的腦功能連接變化,發現額葉/前額相位延遲滯后指數的增加與大腦的認知補償機制有關。Lee 等[8]研究了吸毒且重度抑郁癥青少年在靜息態下的腦功能連接,研究結果發現,前肢環路異常可能是青春期抑郁癥的特征之一。隨著腦網絡構建和數據分析方法的興起,基于圖論的方法研究計算網絡參數已應用于各個研究領域。Guo 等[9]研究了核磁環境下抑郁癥患者的靜息態腦功能網絡,結果發現抑郁組和對照組均表現出典型的小世界特征。美國密蘇里大學的 Shim 等[10]研究了抑郁癥患者在靜息態下功能連接的改變,發現大腦功能網絡指數的紊亂可能反映了抑郁癥患者情緒處理的改變,而網絡參數則可作為有效的生物學指標。因此基于以上研究,本研究擬將網絡參數作為特征,通過對其進行對比分析,從而實現對青少年抑郁癥患者和健康者進行分類。
此前,機器學習已廣泛應用于與抑郁癥相關的分類研究中。如 Mumtaz 等[11]以 EEG 頻帶功率為特征,使用決策樹方法進行分類,準確率可達 80%。Alkaysi 等[12]利用極限學習機直接對抑郁癥患者與健康人的腦電信號進行分類,精度達到 92%。Mumtaz 等[13]采集了抑郁癥患者在靜息態下的腦電數據,分別使用小波變換、短時傅里葉變換和經驗模式分解提取特征,然后采用邏輯回歸模型進行分類并對比分析,結果發現,利用小波變換所提取的特征分類精度最高,達到 87.5%。因此基于以上相關研究,本研究擬采用機器學習對所提取的特征進行分類。
為了盡可能地提高分類精度,本研究提出了基于腦功能網絡參數的特征優化方法。首先,分別采集了 16 名女性青少年抑郁患者和 16 名女性青少年健康受試者在靜息態下 4 min 的 EEG 信號,經過預處理后,將信號分為 80 個試次。然后,通過相位鎖定指數(phase locking value,PLV)計算鄰接矩陣,進一步構建腦功能網絡,同時,利用比例閾值對全局網絡參數進行優化,即提取腦網絡參數的曲線下面積(area under curve,AUC)作為特征。最后,分別利用優化前后的網絡參數作為特征進行分類,并對比分析。結果表明,采用優化后的網絡參數作為特征,分類精度均有所提升,且利用 α 頻段下的平均特征路徑長度的 AUC 進行分類,精度最高,可達 82%。本研究通過優化網絡參數,不僅能夠有效地從全局角度分析腦功能網絡,而且對提升未來臨床診斷的準確率也具有重要意義。
1 相位鎖定指數和圖論分析
1.1 相位鎖定指數
PLV 是測量兩個信號段之間同步性的方法[7]。該方法適用于對重復刺激的響應,并在不同的試次中,尋找兩個信號之間相位差變化較小的延遲。假設給定兩個信號序列 x,y 和感興趣頻率 f,計算信號 x 和 y 的每個延遲在頻率 f 處的 PLV,其步驟如下:
(1)對信號進行帶通濾波。
(2)對濾波后的信號以頻率 f 為中心進行伽柏小波卷積,卷積算子如式(1)所示:
![]() |
其中, 為 7/f,t 為信號序列對應的時間。
(3)在 t 時刻,計算信號間的 PLV 值(以符號 PLV 表示),如式(2)所示:
![]() |
其中, 代表了兩個信號的相位差值
,而
是從所有時間 t 中所提取出的卷積相位,n 代表了試次數,
,本研究中將信號分為 80 個試次,因此 N 取值為 80。如果在某一試次中兩個信號的相位差值變化很小,那么 PLV 的值就越接近于 1,反之,其值越接近于 0。
1.2 網絡參數計算
本研究使用圖論量化腦網絡,其中,腦網絡由邊和節點組成。由于本研究使用 64 導腦電帽采集信號,將每個導聯看作 1 個節點,故共有 64 個節點,節點之間相連的支路即為邊。在加權網絡中,PLV 的值則代表網絡節點間的連接強度。在圖論中,通常采用強度、平均特征路徑長度、平均聚類系數等參數作為量化指標,因此本文使用如下三種網絡參數進行研究與分析。
1.2.1 強度
強度表示網絡節點間的相關程度。強度值越高,意味著整個大腦的連接越緊密。通常,連接強度值是根據網絡中所有節點間的連接權重之和來估計的,網絡強度 S 的計算方式如式(3)所示:
![]() |
其中, 為鄰接矩陣中第 i 行和第 j 列的元素。
1.2.2 平均特征路徑長度
平均特征路徑長度是所有網絡節點間最短路徑長度的平均值,常用其對宏觀網絡的特性進行研究與分析。平均特征路徑長度 Lw 的計算如式(4)所示:
![]() |
在加權網絡中,最短路徑長度通常為兩個節點間邊的權重的倒數。式中,J 為加權網絡中的節點, 為任意兩個節點 i 和 j 最短路徑的邊數。
1.2.3 平均聚類系數
平均聚類系數可用于表征網絡的集團化程度。在加權網絡中,如果節點 i 的度為 3,聚類系數則定義為這 3 個節點之間實際存在的邊數與可能存在的所有邊數之比,因此,節點 i 的聚類系數 的計算如式(5)所示:
![]() |
其中,、
、
為鄰接矩陣中的元素,代表連接權重。最終,根據節點總數對所得
求均值,可得到平均聚類系數
,如式(6)所示。
![]() |
的值越接近 1,則代表網絡的連接程度越緊密;其值越接近于 0,則表明連接程度越松散,甚至可能存在多個節點互不相連。
2 腦電數據采集和分析
2.1 受試者數據來源
所有受試者均在常州市第一人民醫院經過臨床診斷,被分為抑郁青少年和健康青少年。通過對數據進行篩選,參與本研究的數據選取受試者均為女性,有抑郁青少年 16 例,設為抑郁組;健康青少年 16 例,設為對照組;年均(16.3 ± 1.3)歲,抑郁組和對照組之間的年齡差異無統計學意義(P > 0.05)。在試驗前,受試者均使用漢密頓抑郁量表(Hamilton depression rating scales,HDRS)進行檢測[14],結果顯示抑郁組得分高于對照組。兩組青少年的試驗研究均已通過常州市第一人民醫院倫理委員會批準,所有受試者或其監護人都簽署了知情同意書,自愿參加本試驗。
2.2 數據采集及試驗過程
本次試驗采用 64 導聯 EEG 采集系統(GES300,Electrical Geodesics Inc,美國),腦電帽的電極位置分布如圖 1 所示。試驗中,采樣頻率設置為 500 Hz,電極阻抗設定在 50 kΩ 以下,利用采集軟件 Net Station 4.5(Electrical Geodesics Inc,美國)記錄數據,帶通濾波為 0.5~40 Hz,參考電極為 Cz。試驗采集了受試者們在靜息閉眼狀態下的 EEG 數據,時長約 4 min,整個采集過程保持安靜。

2.3 數據處理
2.3.1 數據預處理
本研究使用數據處理分析軟件 Matlab 2016a(Math Work Inc,美國)對所采集的數據進行預處理,具體步驟包括:帶通濾波(0.5~40 Hz)、偽跡檢測、壞導聯替換、參考點轉換,并使用獨立成分分析(independent component analysis,ICA)去除眼動偽跡以及其他噪聲。對預處理后的數據,每 3 s 進行一次分段,并將每段作為 1 個試次,因此構建了共計 80 個試次的三維矩陣(維度:64 × 500 × 80)。
2.3.2 頻段的選擇
通常,對 EEG 數據的研究集中在 0~70 Hz 之間,其中涵蓋了 δ、θ、α、β、γ 頻段。在先前的研究中,通過不同的同步性測量方法,發現腦功能連接在 θ 和 α 頻段處出現了斷裂[10]。該結果表明,在這兩個頻段中,很可能存在關于腦網絡的有效特征。因此,本次研究主要定位于 θ、α 頻段。
2.4 腦功能網絡
2.4.1 腦功能網絡構建
本研究利用 PLV 構建了大腦功能網絡,功能網絡的構建與社交網絡類似,是根據兩個信號之間的相位,計算其同步性,通過同步性直觀地反映網絡強度,為后續的分類研究打下理論基礎。
2.4.2 圖論分析
構建腦功能網絡后,需要對其進行量化。本研究通過圖論參數來表征網絡特性,分別在單一閾值下以及多重閾值下,計算了強度、平均聚類系數和平均特征路徑長度。
2.4.3 網絡參數優化
本研究使用了 PLV 計算鄰接矩陣并構建腦功能網絡,分別計算了 64 導聯 EEG 信號的 PLV 值。然而,對網絡的分析涉及閾值的選擇,目前較為常見的選擇方法有兩種:一種是根據所有受試者的整體情況逐漸增大閾值,從而進行選擇;另一種是將網絡中確定存在的邊數與理論存在的邊數之比作為閾值。本研究基于加權鄰接矩陣,對網絡中的所有連接強度值進行降序排列,按照一定比例選出較大的強度值。為了在增益和損耗條件下保證最佳的網絡連接性,本研究對每個受試者的腦功能網絡進行閾值分析并比較,以 0.01 為步長,在 0.01~0.80 范圍內確定最佳閾值。
比例閾值選取的核心是先對鄰接矩陣右上角的權值進行升序排列,并記錄下對應的矩陣位置,計算出此時需要的最高項系數。根據最高項系數調節比例閾值,確定所需要保留的 PLV 值[15]。
當比例閾值取 0.04 時,本研究計算發現 θ 和 α 頻段的網絡參數差異具有統計學意義(P < 0.05)。但是,單個比例閾值無法反映宏觀的網絡參數變化,當閾值不同時,網絡參數的值也存在差異。為了更好地優化網絡參數,本研究采用計算網絡參數的 AUC 作為優化方案。由于一個閾值就對應一個網絡參數值,因此共計算了 79 組網絡參數值,構建了多重閾值和網絡參數值之間的關系圖,并算出每個網絡參數的 AUC。
3 結果
3.1 功能連接性結果
為了構建腦功能網絡,先計算了抑郁組和對照組在 θ 和 α 頻段處的腦功能連接,其鄰接矩陣分別如圖 2、圖 3 所示。PLV 的取值介于 0~1,其值越接近 1,則說明信號之間的同步性就越強。由圖 2、圖 3 可知,α 頻段的連接強度明顯高于 θ 頻段,同時,抑郁組比對照組呈現更大的連接強度。


為了更好地反映大腦之間連接的緊密程度,根據鄰接矩陣進一步構建腦網絡。如圖 4 和圖 5 所示,在腦網絡拓撲圖中,每個節點能量的大小(標準化為 [0,1])代表該節點與其他節點連接的密集程度,而節點間的連接強度則使用線條的粗細和顏色的深淺來表示,線條越粗,顏色越深,代表著連接強度越大。圖 4 表明在 θ 頻段,抑郁組的大腦連接緊密度較為均衡,而對照組大腦右半球的連接緊密程度比左半球要高。而圖 5 的結果顯示,在 α 頻段,對照組在大腦右側的連接強度高于抑郁組,而抑郁組在左顳區的連接緊密度高于對照組。


3.2 特征提取
3.2.1 網絡參數結果
本研究分別計算了最佳比例閾值為 0.04 時,在 θ 頻段和 α 頻段處的強度、平均特征路徑長度和平均聚類系數,個體網絡參數共計 32 個(抑郁組 16 個,對照組 16 個),分別如圖 6、圖 7、圖 8 所示。



為了能夠更直觀地展現網絡的特征,本研究除了使用圖論進行量化,將強度、平均特征路徑長度和平均聚類系數作為評估網絡的指標,還分別計算了 32 個受試者的網絡參數的均值 ± 標準差,如表 1 所示。



從表 1 中可以看出,抑郁組 α 頻段的參數值均比 θ 頻段的高,而且抑郁組的參數值比對照組的高。經過 t 檢驗分析,發現兩組受試者在強度、平均特征路徑長度、平均聚類系數上的差異都具有統計學意義(P < 0.05)。
3.2.2 網絡參數優化結果
本研究以平均聚類系數為例,構建了多重閾值和網絡參數值之間的關系。如圖 9 所示,一個比例閾值對應了一個網絡參數,通過求得網絡參數的 AUC 作為優化后的分類特征。

最終,兩組受試者在不同頻段下網絡參數的 AUC 如表 2 所示。

通過多重閾值和網絡參數值之間的關系可以看出,提取網絡參數的 AUC 作為特征不僅能反映整體特征穩定的變化趨勢,還能減少個體差異性帶來的影響。但是這也可能忽略了特征最為明顯的部分,不利于從生物機制的角度進行分析。
3.3 分類結果和性能
為了對兩組受試者進行分類,分別提取整體的網絡參數和優化后的網絡參數作為特征,并構建了 6 個特征矩陣,利用支持向量機(support vector machine,SVM)算法進行分類,并采用留一交叉驗證法(高斯核函數)作比較。如表 3 所示,從整體來看,將優化后的參數作為分類特征,精度都有所提升,其中 α 頻段下的分類精度都高于 θ 頻段。從參數優化前后的分類效果來看,在 θ 頻段下,使用強度的 AUC 進行分類,精度只提升了 2%,使用平均特征路徑長度的 AUC 進行分類,精度提升了 11%,使用平均聚類系數的 AUC 進行分類,精度則提升了 18%;在 α 頻段下,使用強度的 AUC 作為特征,精度比優化前提升了 7%,使用平均特征路徑長度的 AUC 作為特征,精度提升了 13%,使用平均聚類系數的 AUC 作為特征,精度提升了 10%。

4 討論
本研究將功能連接網絡和網絡參數的優化應用于抑郁癥患者的分類研究中。通過使用 PLV 方法計算 64 導聯 EEG 信號的鄰接矩陣,并構建腦網絡,可以將非線性的 EEG 信號轉換為更加直觀的網絡參數,不僅有利于對信號的進一步研究,對臨床診斷抑郁癥也具有輔助作用。為了驗證網絡參數作為特征的有效性,對于選取的 32 個獨立樣本(抑郁組 16 個,對照組 16 個),分別在 θ、α 頻段下計算了腦功能網絡的強度、平均特征路徑長度和平均聚類系數,然后使用 SVM 分類器,同時采用留一交叉驗證法進行分類,但實際分類精度并不是很高。因此,為了改善分類效果,本研究使用比例閾值對網絡參數進行全局優化,將在多重閾值下網絡參數的 AUC 作為新特征并進行分類。結果顯示,對 θ、α 頻段處的三種網絡參數進行特征優化,分類精度均有明顯提高,這表明該方法不僅減少了單個閾值對網絡參數的擾動性,還增加了全局特征的穩定性。
本研究需要指出的是,計算網絡參數的 AUC 作為優化方法,雖然能夠有效地提升分類精度,但是無法用于研究極端條件下的特異性質。從另一個角度說,這是一種特征的處理和選擇過程,因此該方法更適用于提升人機交互下診斷疾病的準確率與測試的穩定性。另外,該方法作為計算機輔助診斷技術來說也是可行的,可若在實際使用時遇到無法解決的極端情況,需要進一步細化數據,即從全局到局部對腦網絡進行分析。
在研究中已發現抑郁組和對照組的連接密度和強度在額區、顳區、枕區有較大差異,為了進一步的深入分析,后續將會著重于對不同腦區的研究,并計算其網絡參數,從而細化不同腦區的參數特征,并研究比例閾值的變化對局部網絡參數值的影響,進而提升分類效果,提高臨床輔助診斷的質量。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。