阿爾茨海默癥(AD)是一種不可逆轉的大腦神經退化性疾病,會損害患者記憶力和認知能力。因此,AD診斷具有重要意義。大腦感興趣區域(ROI)之間往往是多個區域以非線性的方式協同交互,充分利用此類非線性高階交互特征有助于提高AD診斷分類的準確性。為此,提出基于非線性高階特征提取和三維超圖神經網絡相結合的AD計算機輔助診斷框架。首先針對ROI數據使用基于徑向基函數核的支持向量機回歸模型訓練出基估計器,再通過基于基估計器的遞歸特征消除算法提取功能性磁共振成像(fMRI)數據中的非線性高階特征,進而將特征構造成超圖,最后基于fMRI數據的四維時空特性搭建超圖卷積神經網絡模型來進行分類。阿爾茨海默癥神經影像倡議(ADNI)數據庫上的實驗結果表明,所提框架在AD/正常對照(NC)分類任務上的效果相較于Hyper Graph Convolutional Network(HyperGCN)框架提高了8%,相較于傳統二維線性特征提取方法提高了12%。綜上,本文框架在AD分類效果上較主流深度學習方法有所提升,可為AD計算機輔助診斷提供有效依據。
0 引言
阿爾茨海默癥(Alzheimer’s Disease,AD)是一類不可逆的大腦神經退行性疾病[1]。如今全世界有5 500萬人患有AD,該疾病被認為是導致死亡的第七大原因[2]。由于AD的不可治愈性,文獻[3]指出應當轉變治療思路,重點關注AD的預防及診斷,因此AD診斷的準確性和高效性日益重要。
研究表明,AD病情與腦功能連接網絡和結構的拓撲變化有關[4-5],而在神經影像技術中,功能性磁共振成像(functional magnetic resonance imaging,fMRI)數據因為具備較高的時空分辨率,能較地好記錄腦功能連接網絡結構的變化信息,所以常被研究者用于構建大腦功能連接網絡。主要方法是利用fMRI表達出來的各體素上的血氧水平依賴(blood oxygenation level dependent,BOLD)信號時間序列計算出大腦區域兩兩之間的功能關聯性,以此構造出腦功能連接網絡。接著,采用機器學習或深度學習的方法,從中學習和篩選出對AD發展各階段更為敏感而有效的特征,以期幫助提高AD診斷的準確性和可靠性。例如,Ju等[6]基于fMRI數據構造腦功能連接網絡,利用自編碼器提取高級特征,并用Softmax分類器完成分類。Wee等[7]基于擴散張量成像技術和fMRI數據構建腦功能連接網絡,使用多核支持向量機(support vector machine,SVM)區分正常對照組(normal control,NC)和AD患者組。類似地,Li等[8]利用腦功能連接網絡訓練學習稀疏自編碼器(sparse auto encoder,SAE),再使用Softmax分類器進行分類。Eslami等[9]基于腦功能連接網絡,通過自編碼器獲取有效的特征,使用單層感知機來分類。上述方法在提取fMRI數據特征及構建腦功能連接網絡的研究上做出了重要貢獻,然而往往無法同時利用多個腦區之間的非線性交互特征及多個腦區協同作用時的多元高階特征,忽略了大腦作為非線性動態系統的本質[10]。
研究表明,大腦活動是由多個腦區協同非線性作用來完成的,大腦的非線性高階特征需要一種合適的數據結構來進行存儲,才能有效利用其特性提升AD診斷分類性能。大腦的腦功能連接網絡本質上是一種圖結構類型,而圖神經網絡(graph neural network,GNN)在眾多圖結構數據中展現了強大的特征提取和學習能力[11],因此現有研究工作主要利用GNN對基于fMRI影像的腦功能連接網絡進行分析。Wen等[12]提出了一種基于先驗腦結構學習的多視圖圖卷積網絡,通過不同閾值構建多個腦功能連接網絡,建立共享圖嵌入層來學習不同腦功能連接網絡的特征。該模型可以有效學習感興趣區域(region of interest,ROI)在不同閾值的特征,但無法利用多個腦區間的交互特征。Li等[13]基于fMRI影像特征提出一種腦圖神經網絡,為不同圖節點動態賦權重,并通過池化層對節點聚類。上述方法往往使用普通鄰接圖結構,將腦區抽象為圖節點,腦區間的特征抽象為帶權邊,然而普通圖結構只能存儲相鄰腦區之間的二元特征,無法存儲多個腦區之間的多元高階特征。
因此,為了存儲多個腦區之間的非線性多元高階相關關系,本文提出基于非線性高階特征和超圖卷積神經網絡的AD分類框架。首先對fMRI源數據進行預處理并提取出BOLD信號,再針對BOLD信號中的ROI數據,使用基于徑向基函數(radial basis function,RBF)核的支持向量回歸模型(support vector regression,SVR)訓練出基估計器,通過基于基估計器的遞歸特征消除算法(recursive feature elimination,RFE)提取fMRI數據中的非線性高階特征,進而構造超圖,最后基于fMRI數據的四維時空特性搭建超圖卷積神經網絡模型來完成分類任務。
1 實驗方法
1.1 整體流程
本文的目標是構造基于fMRI數據對AD進行輔助診斷分類的框架,如圖1所示。本框架主要分為數據處理、超圖構造、多模態數據構造和分類模型搭建四個部分。為了有效利用fMRI圖像中各個腦區之間的非線性高階相關關系,本框架首先對fMRI數據進行預處理并提取BOLD信號,隨后使用非線性高階特征提取算法挑選出多個關鍵腦區之間的非線性高階相關關系并構造成超圖,接著將超圖中節點和邊信息與BOLD信號構造成多模態數據,最后搭建針對性的三維超圖卷積神經網絡——fMRI HyperGraph Neural Network(FHyperGNN)模型來完成分類任務。

1.2 數據處理
源fMRI數據需要經過預處理、腦圖譜建模和BOLD信號提取才能轉換成可在深度神經網絡中進行訓練的數據。首先將源fMRI數據進行預處理。本文使用DPARSF[14](Data Processing Assistant for Resting-State fMRI)工具箱和spm12軟件包進行預處理,fMRI圖像預處理包含以下幾個步驟:圖像格式轉換、去除初始時間點、時間片校正、頭動校正、空間標準化、去線性漂移、協變量回歸、低頻濾波和空間平滑等。其中,時間片校正步驟中,fMRI圖像按照3 s的時間間隔分割成140個時間片段;去除初始時間點步驟中,刪除前10個時間片,取后續的130個時間片;低頻濾波步驟中,選擇濾波頻段為0.01~0.1 Hz頻段;其他步驟調用庫函數,選擇默認參數即可。
隨后對fMRI數據進行腦圖譜建模。Automated Anatomical Labeling(AAL)[15]圖譜是最廣泛應用的腦圖譜,提供了可靠的“功能”集群定位,具有良好的解剖學解釋性,可以識別大腦的功能變化。該圖譜共有116個腦區,前90個為大腦腦區,其余為小腦腦區,本文主要基于AAL圖譜的大腦區域對fMRI進行建模研究。
最后進行BOLD信號的提取。提取每個ROI的BOLD信號的平均值和標準差作為該ROI的特征 [16],所有的ROI特征構成ROI特征矩陣
。其中,
和
分別表示當前ROI的BOLD信號的平均值和標準差,其具體計算公式如公式(1)、(2)所示。
設某個ROI的BOLD信號為 ,n為該ROI內部的BOLD信號個數,則有:
![]() |
![]() |
1.3 構造超圖
在神經影像學領域,圖論廣泛應用于大腦連通性分析,簡單圖中,一條邊只連接兩個相關的節點,僅能表征腦區之間的成對關系。實際上,大腦活動往往包括多個腦區之間的協同作用,各個腦區之間存在高階關系,這種非線性高階相關關系無法用簡單圖表示。因此,本文使用超圖來表征節點之間的非線性高階相關關系,根據數據處理得到的結果,使用非線性高階方法來構造超圖。
一般來說,超圖是一種擴展圖,其一條邊(稱為超邊)可以連接多個節點[17]。而簡單圖是一種特殊的超圖,每個超邊只包含兩個節點。超圖樣例如圖2所示。

SVR是一種非參數回歸方法[18]。本文采用RBF核作為支持向量回歸模型的核函數(RBF-SVR),該核函數能夠在復雜的非線性模型中表現出極強的性能,具有顯著的優勢[19]。本文使用RBF-SVR模型來對fMRI數據進行擬合,實現對fMRI數據中各個腦區之間的非線性作用關系的提取。
RFE算法[20]是一種特征篩選算法,常被用于篩去弱相關關系。本文通過基于RBF-SVR模型的RFE算法來計算多個腦區之間的非線性高階相關關系,并以此構造超邊,多個超邊最終組成超圖。
具體來說,在構造超邊時,使用目標ROI的BOLD信號時間序列值作為標簽,其他ROI的BOLD信號時間序列值作為訓練數據來訓練RBF-SVR模型,訓練完成的RBF-SVR模型作為RFE算法的估計器,使RFE算法可以篩選出對目標ROI擬合效果最好的數個ROI,并依此構造一條基于該ROI的超邊。重復對N個ROI都執行此操作,即可得到N條超邊,這N條超邊則構成一幅關于當前fMRI樣本數據的超圖。
構造完成的超圖中,每一條超邊都表征一種非線性高階相關關系。例如,人的記憶行為往往涉及多個ROI協同非線性作用,此類高階非線性交互特征可能被某條超邊記錄下來,而AD患者關于此類記憶行為的特征可能偏弱,從而影響模型分類結果。此類超圖即可存儲基于RBF-SVR模型的RFE算法篩選出的,多個ROI之間的非線性高階相關關系。
超圖中,每個ROI會有一條與之唯一對應的超邊,該超邊上,與當前ROI有強相關關系的多個ROI會被置1,其余ROI位置則置0,該條超邊即可表征大腦中基于此ROI的多個ROI之間的強相關關系。因此,該超圖可反饋多個ROI之間復雜的非線性高階相關關系,超圖中的每一條超邊都表征該超邊對應的ROI與其他多個ROI的非線性高階交互特征。
1.4 構造多模態數據
在神經網絡訓練中,使用多種模態的數據可以有效提高模型的魯棒性[21]。本文將BOLD時間序列進行均勻隨機去噪,并將每個樣本的時間序列數據和超圖數據合并成一個多模態數據集作為模型輸入。
1.5 搭建FHyperGNN模型
主流超圖算法如DHGNN[22]和HyperGCN[23],其基本思想是將全部樣本構造成一張超圖,并基于樣本間相關性來進行分類。本文提出的FHyperGNN模型以單個fMRI樣本為單位構造超圖,其超邊集為樣本內各個腦區之間的非線性多元相關關系,通過這種樣本內部腦區之間的非線性多元相關關系來進行分類。同時,由于fMRI數據是一種四維數據,在一個時間段的連續采集過程中,患者可能輕微晃動頭部,導致數據噪點增多,從而干擾模型對正常腦區信號的讀取。為了減輕此類干擾,提高FHyperGNN模型泛化能力,引入了正則化方法去噪,從而提高fMRI分類任務的準確度。
FHyperGNN模型結構如圖3所示。多模態數據首先經過一系列FHyperGNN塊,進行非線性高階特征學習,隨后進行正則化并進入Dropout層丟棄部分特征,防止訓練過程中出現過擬合現象。最后進入Linear層并使用Softmax激活函數完成分類任務。

2 數據與實驗設置
2.1 數據集介紹
本文研究所采用的數據來自阿爾茨海默癥神經影像倡議(Alzheimer’s Disease Neuroimaging Initiative,ADNI)數據庫。ADNI數據庫公開提供一系列測試對象的fMRI、基因數據以及其他生物標記和相關診斷信息,成為研究AD的一套比較標準的研究數據[24]。
本文實驗數據采用了從ADNI數據庫下載的66個受試者(31名AD、35名NC)的226例fMRI影像,每個受試者可能有多例fMRI影像。該數據包括了被試的影像信息、性別、年齡、簡易智力狀態檢查量表和臨床失智評分量表等被試的基本信息,所有數據均由儀器Philips Medical Systems掃描獲取,掃描層為48層,層厚為3.3 mm,重復時間TR=3 s,回波時間TE = 30 ms,翻轉角度FA = 8°,共140個Volume,即140個時間點。具體信息如表1所示。

2.2 參數設置及評價指標
本文采用五折交叉驗證的方法,為了避免數據泄露,將數據集按照受試者水平隨機分為五個子集,來自同一受試者的fMRI影像只會出現在同一個子集內,訓練集、測試集和驗證集的比例分別為3∶1∶1。
訓練時,訓練批量大小設置為64,Epoch為200,使用Adam優化器[25]進行參數更新。實驗采用分類準確率(accuracy,ACC)、受試者操作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)、馬修斯相關系數(Matthews correlation coefficient,MCC)三種分類指標衡量模型性能。
![]() |
![]() |
公式(3)、(4)中的TP、TN、FP和FN分別代表真陽性數量、真陰性數量、假陽性數量和假陰性數量。
2.3 對比試驗
為了驗證本文方法的有效性,將提出的網絡模型與下列方法做對比。所有的比較實驗均在本文的數據集上進行,均采用五折交叉驗證方法,以減少因數據集劃分對實驗結果的影響。
(1)Pearson
傳統的構建腦功能連接網絡的方法是使用皮爾遜相關的方法計算 ROI 間的連接強度,即感興趣區域i和感興趣區域j的連接強度,連接強度計算方法如公式(5)所示:
![]() |
(2)ST-GCN[26]
ST-GCN方法在時空圖的背景下構造函數連通網絡,采用時空圖卷積神經網絡學習數據中的時空信息,學習圖中功能連接的重要性。
(3)MVS-GCN[12]
MVS-GCN方法以圖形神經網絡為基礎,通過不同的閾值構建多個腦功能連接網絡,建立一個共享的圖嵌入層來學習每個腦功能連接的特征。
(4)BrainGNN[13]
BrainGNN模型利用拓撲和功能信息來構造ROI圖卷積層,是一個基于圖神經網絡的端到端fMRI預測框架。
(5)二階線性超圖[17] + FHyperGNN。該方法將一個ROI的時間序列由其他的ROI稀疏表示,這些稀疏表示的ROI作為一條超邊加入到超圖中,并計算超圖的節點聚類系數。
(6)高階非線性超圖 + HyperGCN[23]
HyperGCN是一種基于屬性超圖的SSL圖卷積網絡框架。使用K-近鄰算法線性構造超圖,將數據集所有樣本構造成一張超圖,借此找出各樣本之間的相關性,通過此類相關性來進行輔助分類。
3 實驗結果分析
表2是基于fMRI圖像的AD/NC分類任務中,各類方法的分類性能。可以看到FHyperGNN模型的得分較高的同時,標準差相對較低,表明模型的穩定性較強,在fMRI數據上的分類魯棒性要優于其他方法模型。

本文使用的fMRI數據特征提取方法與傳統的皮爾遜相關系數方法相比,分類準確率提高了21%,與ST-GCN、BrainGNN和MVS-GCN等模型相比,分類準確率都有不同程度的提高,說明本文使用基于RBF-SVR的遞歸消除算法提取特征,并通過超圖存儲非線性高階腦功能連接網絡的方法是有效的。
本文框架與二階線性超圖方法相比,分類準確率提高了12%,二者對比結果直觀體現出非線性高階特征對于分類的重要性。相較于流行的超圖模型HyperGCN,本文模型的分類準確率提高了9%。在數據復雜度高、樣本個體龐大的fMRI數據集中,相較于學習不同樣本之間的相關性,關注樣本內部不同ROI之間的非線性高階相關關系往往是更優選擇。
本文模型表現出較好效果的同時,有效抑制了過擬合現象。模型訓練過程中的ACC值及LOSS值變化如圖4所示。

4 結論
為了提高fMRI數據下AD計算機輔助診斷的準確性,本文提出一種基于非線性高階特征和三維超圖卷積神經網絡的AD分類框架。該框架使用基于RBF核的SVR模型來輔助提取fMRI數據中各個腦區之間的非線性關系,并基于RFE算法來提取多個腦區之間的高階相關關系。隨后將提取出的非線性高階相關關系構造成超圖,并搭建了針對性的超圖神經網絡模型——FHyperGNN來完成分類任務。本文提出一個能高效利用fMRI影像中多個ROI之間非線性多元相關關系的AD分類框架。與如今主流的基于fMRI數據的AD分類方法對比,本框架在fMRI數據特征提取和基于fMRI數據的分類任務上效果有所提高,能夠更好地應用于AD計算機輔助診斷中。
然而,這項研究仍存在一定的局限性。例如在RFE算法構造超圖時,未能更好地利用fMRI數據中的時序信息;fMRI數據中關于各個腦區的空間分布信息也可能對分類任務有正向作用。此外,還可以開展可解釋性研究,從而尋找AD的生物標志物等。在今后的研究中,將針對上述局限性開展進一步的研究。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:羅百榮主要負責數據記錄與分析、算法程序與設計以及論文編寫;曾安、潘丹主要負責實驗流程、協調溝通、計劃安排、提供實驗指導以及論文審閱修訂,容華斌主要負責實驗指導,張小波、林靖、楊洋和劉軍主要負責論文審閱修訂。
0 引言
阿爾茨海默癥(Alzheimer’s Disease,AD)是一類不可逆的大腦神經退行性疾病[1]。如今全世界有5 500萬人患有AD,該疾病被認為是導致死亡的第七大原因[2]。由于AD的不可治愈性,文獻[3]指出應當轉變治療思路,重點關注AD的預防及診斷,因此AD診斷的準確性和高效性日益重要。
研究表明,AD病情與腦功能連接網絡和結構的拓撲變化有關[4-5],而在神經影像技術中,功能性磁共振成像(functional magnetic resonance imaging,fMRI)數據因為具備較高的時空分辨率,能較地好記錄腦功能連接網絡結構的變化信息,所以常被研究者用于構建大腦功能連接網絡。主要方法是利用fMRI表達出來的各體素上的血氧水平依賴(blood oxygenation level dependent,BOLD)信號時間序列計算出大腦區域兩兩之間的功能關聯性,以此構造出腦功能連接網絡。接著,采用機器學習或深度學習的方法,從中學習和篩選出對AD發展各階段更為敏感而有效的特征,以期幫助提高AD診斷的準確性和可靠性。例如,Ju等[6]基于fMRI數據構造腦功能連接網絡,利用自編碼器提取高級特征,并用Softmax分類器完成分類。Wee等[7]基于擴散張量成像技術和fMRI數據構建腦功能連接網絡,使用多核支持向量機(support vector machine,SVM)區分正常對照組(normal control,NC)和AD患者組。類似地,Li等[8]利用腦功能連接網絡訓練學習稀疏自編碼器(sparse auto encoder,SAE),再使用Softmax分類器進行分類。Eslami等[9]基于腦功能連接網絡,通過自編碼器獲取有效的特征,使用單層感知機來分類。上述方法在提取fMRI數據特征及構建腦功能連接網絡的研究上做出了重要貢獻,然而往往無法同時利用多個腦區之間的非線性交互特征及多個腦區協同作用時的多元高階特征,忽略了大腦作為非線性動態系統的本質[10]。
研究表明,大腦活動是由多個腦區協同非線性作用來完成的,大腦的非線性高階特征需要一種合適的數據結構來進行存儲,才能有效利用其特性提升AD診斷分類性能。大腦的腦功能連接網絡本質上是一種圖結構類型,而圖神經網絡(graph neural network,GNN)在眾多圖結構數據中展現了強大的特征提取和學習能力[11],因此現有研究工作主要利用GNN對基于fMRI影像的腦功能連接網絡進行分析。Wen等[12]提出了一種基于先驗腦結構學習的多視圖圖卷積網絡,通過不同閾值構建多個腦功能連接網絡,建立共享圖嵌入層來學習不同腦功能連接網絡的特征。該模型可以有效學習感興趣區域(region of interest,ROI)在不同閾值的特征,但無法利用多個腦區間的交互特征。Li等[13]基于fMRI影像特征提出一種腦圖神經網絡,為不同圖節點動態賦權重,并通過池化層對節點聚類。上述方法往往使用普通鄰接圖結構,將腦區抽象為圖節點,腦區間的特征抽象為帶權邊,然而普通圖結構只能存儲相鄰腦區之間的二元特征,無法存儲多個腦區之間的多元高階特征。
因此,為了存儲多個腦區之間的非線性多元高階相關關系,本文提出基于非線性高階特征和超圖卷積神經網絡的AD分類框架。首先對fMRI源數據進行預處理并提取出BOLD信號,再針對BOLD信號中的ROI數據,使用基于徑向基函數(radial basis function,RBF)核的支持向量回歸模型(support vector regression,SVR)訓練出基估計器,通過基于基估計器的遞歸特征消除算法(recursive feature elimination,RFE)提取fMRI數據中的非線性高階特征,進而構造超圖,最后基于fMRI數據的四維時空特性搭建超圖卷積神經網絡模型來完成分類任務。
1 實驗方法
1.1 整體流程
本文的目標是構造基于fMRI數據對AD進行輔助診斷分類的框架,如圖1所示。本框架主要分為數據處理、超圖構造、多模態數據構造和分類模型搭建四個部分。為了有效利用fMRI圖像中各個腦區之間的非線性高階相關關系,本框架首先對fMRI數據進行預處理并提取BOLD信號,隨后使用非線性高階特征提取算法挑選出多個關鍵腦區之間的非線性高階相關關系并構造成超圖,接著將超圖中節點和邊信息與BOLD信號構造成多模態數據,最后搭建針對性的三維超圖卷積神經網絡——fMRI HyperGraph Neural Network(FHyperGNN)模型來完成分類任務。

1.2 數據處理
源fMRI數據需要經過預處理、腦圖譜建模和BOLD信號提取才能轉換成可在深度神經網絡中進行訓練的數據。首先將源fMRI數據進行預處理。本文使用DPARSF[14](Data Processing Assistant for Resting-State fMRI)工具箱和spm12軟件包進行預處理,fMRI圖像預處理包含以下幾個步驟:圖像格式轉換、去除初始時間點、時間片校正、頭動校正、空間標準化、去線性漂移、協變量回歸、低頻濾波和空間平滑等。其中,時間片校正步驟中,fMRI圖像按照3 s的時間間隔分割成140個時間片段;去除初始時間點步驟中,刪除前10個時間片,取后續的130個時間片;低頻濾波步驟中,選擇濾波頻段為0.01~0.1 Hz頻段;其他步驟調用庫函數,選擇默認參數即可。
隨后對fMRI數據進行腦圖譜建模。Automated Anatomical Labeling(AAL)[15]圖譜是最廣泛應用的腦圖譜,提供了可靠的“功能”集群定位,具有良好的解剖學解釋性,可以識別大腦的功能變化。該圖譜共有116個腦區,前90個為大腦腦區,其余為小腦腦區,本文主要基于AAL圖譜的大腦區域對fMRI進行建模研究。
最后進行BOLD信號的提取。提取每個ROI的BOLD信號的平均值和標準差作為該ROI的特征 [16],所有的ROI特征構成ROI特征矩陣
。其中,
和
分別表示當前ROI的BOLD信號的平均值和標準差,其具體計算公式如公式(1)、(2)所示。
設某個ROI的BOLD信號為 ,n為該ROI內部的BOLD信號個數,則有:
![]() |
![]() |
1.3 構造超圖
在神經影像學領域,圖論廣泛應用于大腦連通性分析,簡單圖中,一條邊只連接兩個相關的節點,僅能表征腦區之間的成對關系。實際上,大腦活動往往包括多個腦區之間的協同作用,各個腦區之間存在高階關系,這種非線性高階相關關系無法用簡單圖表示。因此,本文使用超圖來表征節點之間的非線性高階相關關系,根據數據處理得到的結果,使用非線性高階方法來構造超圖。
一般來說,超圖是一種擴展圖,其一條邊(稱為超邊)可以連接多個節點[17]。而簡單圖是一種特殊的超圖,每個超邊只包含兩個節點。超圖樣例如圖2所示。

SVR是一種非參數回歸方法[18]。本文采用RBF核作為支持向量回歸模型的核函數(RBF-SVR),該核函數能夠在復雜的非線性模型中表現出極強的性能,具有顯著的優勢[19]。本文使用RBF-SVR模型來對fMRI數據進行擬合,實現對fMRI數據中各個腦區之間的非線性作用關系的提取。
RFE算法[20]是一種特征篩選算法,常被用于篩去弱相關關系。本文通過基于RBF-SVR模型的RFE算法來計算多個腦區之間的非線性高階相關關系,并以此構造超邊,多個超邊最終組成超圖。
具體來說,在構造超邊時,使用目標ROI的BOLD信號時間序列值作為標簽,其他ROI的BOLD信號時間序列值作為訓練數據來訓練RBF-SVR模型,訓練完成的RBF-SVR模型作為RFE算法的估計器,使RFE算法可以篩選出對目標ROI擬合效果最好的數個ROI,并依此構造一條基于該ROI的超邊。重復對N個ROI都執行此操作,即可得到N條超邊,這N條超邊則構成一幅關于當前fMRI樣本數據的超圖。
構造完成的超圖中,每一條超邊都表征一種非線性高階相關關系。例如,人的記憶行為往往涉及多個ROI協同非線性作用,此類高階非線性交互特征可能被某條超邊記錄下來,而AD患者關于此類記憶行為的特征可能偏弱,從而影響模型分類結果。此類超圖即可存儲基于RBF-SVR模型的RFE算法篩選出的,多個ROI之間的非線性高階相關關系。
超圖中,每個ROI會有一條與之唯一對應的超邊,該超邊上,與當前ROI有強相關關系的多個ROI會被置1,其余ROI位置則置0,該條超邊即可表征大腦中基于此ROI的多個ROI之間的強相關關系。因此,該超圖可反饋多個ROI之間復雜的非線性高階相關關系,超圖中的每一條超邊都表征該超邊對應的ROI與其他多個ROI的非線性高階交互特征。
1.4 構造多模態數據
在神經網絡訓練中,使用多種模態的數據可以有效提高模型的魯棒性[21]。本文將BOLD時間序列進行均勻隨機去噪,并將每個樣本的時間序列數據和超圖數據合并成一個多模態數據集作為模型輸入。
1.5 搭建FHyperGNN模型
主流超圖算法如DHGNN[22]和HyperGCN[23],其基本思想是將全部樣本構造成一張超圖,并基于樣本間相關性來進行分類。本文提出的FHyperGNN模型以單個fMRI樣本為單位構造超圖,其超邊集為樣本內各個腦區之間的非線性多元相關關系,通過這種樣本內部腦區之間的非線性多元相關關系來進行分類。同時,由于fMRI數據是一種四維數據,在一個時間段的連續采集過程中,患者可能輕微晃動頭部,導致數據噪點增多,從而干擾模型對正常腦區信號的讀取。為了減輕此類干擾,提高FHyperGNN模型泛化能力,引入了正則化方法去噪,從而提高fMRI分類任務的準確度。
FHyperGNN模型結構如圖3所示。多模態數據首先經過一系列FHyperGNN塊,進行非線性高階特征學習,隨后進行正則化并進入Dropout層丟棄部分特征,防止訓練過程中出現過擬合現象。最后進入Linear層并使用Softmax激活函數完成分類任務。

2 數據與實驗設置
2.1 數據集介紹
本文研究所采用的數據來自阿爾茨海默癥神經影像倡議(Alzheimer’s Disease Neuroimaging Initiative,ADNI)數據庫。ADNI數據庫公開提供一系列測試對象的fMRI、基因數據以及其他生物標記和相關診斷信息,成為研究AD的一套比較標準的研究數據[24]。
本文實驗數據采用了從ADNI數據庫下載的66個受試者(31名AD、35名NC)的226例fMRI影像,每個受試者可能有多例fMRI影像。該數據包括了被試的影像信息、性別、年齡、簡易智力狀態檢查量表和臨床失智評分量表等被試的基本信息,所有數據均由儀器Philips Medical Systems掃描獲取,掃描層為48層,層厚為3.3 mm,重復時間TR=3 s,回波時間TE = 30 ms,翻轉角度FA = 8°,共140個Volume,即140個時間點。具體信息如表1所示。

2.2 參數設置及評價指標
本文采用五折交叉驗證的方法,為了避免數據泄露,將數據集按照受試者水平隨機分為五個子集,來自同一受試者的fMRI影像只會出現在同一個子集內,訓練集、測試集和驗證集的比例分別為3∶1∶1。
訓練時,訓練批量大小設置為64,Epoch為200,使用Adam優化器[25]進行參數更新。實驗采用分類準確率(accuracy,ACC)、受試者操作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)、馬修斯相關系數(Matthews correlation coefficient,MCC)三種分類指標衡量模型性能。
![]() |
![]() |
公式(3)、(4)中的TP、TN、FP和FN分別代表真陽性數量、真陰性數量、假陽性數量和假陰性數量。
2.3 對比試驗
為了驗證本文方法的有效性,將提出的網絡模型與下列方法做對比。所有的比較實驗均在本文的數據集上進行,均采用五折交叉驗證方法,以減少因數據集劃分對實驗結果的影響。
(1)Pearson
傳統的構建腦功能連接網絡的方法是使用皮爾遜相關的方法計算 ROI 間的連接強度,即感興趣區域i和感興趣區域j的連接強度,連接強度計算方法如公式(5)所示:
![]() |
(2)ST-GCN[26]
ST-GCN方法在時空圖的背景下構造函數連通網絡,采用時空圖卷積神經網絡學習數據中的時空信息,學習圖中功能連接的重要性。
(3)MVS-GCN[12]
MVS-GCN方法以圖形神經網絡為基礎,通過不同的閾值構建多個腦功能連接網絡,建立一個共享的圖嵌入層來學習每個腦功能連接的特征。
(4)BrainGNN[13]
BrainGNN模型利用拓撲和功能信息來構造ROI圖卷積層,是一個基于圖神經網絡的端到端fMRI預測框架。
(5)二階線性超圖[17] + FHyperGNN。該方法將一個ROI的時間序列由其他的ROI稀疏表示,這些稀疏表示的ROI作為一條超邊加入到超圖中,并計算超圖的節點聚類系數。
(6)高階非線性超圖 + HyperGCN[23]
HyperGCN是一種基于屬性超圖的SSL圖卷積網絡框架。使用K-近鄰算法線性構造超圖,將數據集所有樣本構造成一張超圖,借此找出各樣本之間的相關性,通過此類相關性來進行輔助分類。
3 實驗結果分析
表2是基于fMRI圖像的AD/NC分類任務中,各類方法的分類性能。可以看到FHyperGNN模型的得分較高的同時,標準差相對較低,表明模型的穩定性較強,在fMRI數據上的分類魯棒性要優于其他方法模型。

本文使用的fMRI數據特征提取方法與傳統的皮爾遜相關系數方法相比,分類準確率提高了21%,與ST-GCN、BrainGNN和MVS-GCN等模型相比,分類準確率都有不同程度的提高,說明本文使用基于RBF-SVR的遞歸消除算法提取特征,并通過超圖存儲非線性高階腦功能連接網絡的方法是有效的。
本文框架與二階線性超圖方法相比,分類準確率提高了12%,二者對比結果直觀體現出非線性高階特征對于分類的重要性。相較于流行的超圖模型HyperGCN,本文模型的分類準確率提高了9%。在數據復雜度高、樣本個體龐大的fMRI數據集中,相較于學習不同樣本之間的相關性,關注樣本內部不同ROI之間的非線性高階相關關系往往是更優選擇。
本文模型表現出較好效果的同時,有效抑制了過擬合現象。模型訓練過程中的ACC值及LOSS值變化如圖4所示。

4 結論
為了提高fMRI數據下AD計算機輔助診斷的準確性,本文提出一種基于非線性高階特征和三維超圖卷積神經網絡的AD分類框架。該框架使用基于RBF核的SVR模型來輔助提取fMRI數據中各個腦區之間的非線性關系,并基于RFE算法來提取多個腦區之間的高階相關關系。隨后將提取出的非線性高階相關關系構造成超圖,并搭建了針對性的超圖神經網絡模型——FHyperGNN來完成分類任務。本文提出一個能高效利用fMRI影像中多個ROI之間非線性多元相關關系的AD分類框架。與如今主流的基于fMRI數據的AD分類方法對比,本框架在fMRI數據特征提取和基于fMRI數據的分類任務上效果有所提高,能夠更好地應用于AD計算機輔助診斷中。
然而,這項研究仍存在一定的局限性。例如在RFE算法構造超圖時,未能更好地利用fMRI數據中的時序信息;fMRI數據中關于各個腦區的空間分布信息也可能對分類任務有正向作用。此外,還可以開展可解釋性研究,從而尋找AD的生物標志物等。在今后的研究中,將針對上述局限性開展進一步的研究。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:羅百榮主要負責數據記錄與分析、算法程序與設計以及論文編寫;曾安、潘丹主要負責實驗流程、協調溝通、計劃安排、提供實驗指導以及論文審閱修訂,容華斌主要負責實驗指導,張小波、林靖、楊洋和劉軍主要負責論文審閱修訂。