神經影像技術目前已經應用于精神分裂癥的診斷。為了提升基于單模態神經影像的精神分裂癥計算機輔助診斷(CAD)的性能,本文提出一種基于特權信息學習(LUPI)分類器的集成學習算法。該算法首先對單模態數據采用極限學習機-自編碼器(ELM-AE)進行特征二次學習,然后通過隨機映射算法將高維特征隨機分成多個子空間,并進行兩兩組合形成源領域和目標領域數據對,用于訓練多個支持向量機+(SVM+)弱分類器,最終通過集成學習獲得一個強分類器,實現有效的模式分類。本算法在公開的精神分裂癥神經影像數據庫中進行了實驗,包括結構磁共振成像和功能磁共振成像數據。結果表明該算法取得了最優的診斷結果,其在基于結構磁共振成像診斷的分類精度、敏感性和特異性分別可以達到 72.12% ± 8.20%、73.50% ± 15.44% 和 70.93% ± 12.93%,而基于功能磁共振成像診斷的分類精度、敏感性和特異性分別為 72.33% ± 8.95%、68.50% ± 16.58%、75.73% ± 16.10%。本文算法的主要創新點在于克服了傳統的 LUPI 分類器需要額外的特權信息模態的不足,可以直接應用于單模態數據分類問題,而且還提升了分類性能,因此具有較為廣泛的應用前景。
引用本文: 沈璐, 王倩婷, 施俊. 基于特權信息集成學習的精神分裂癥單模態神經影像計算機輔助診斷. 生物醫學工程學雜志, 2020, 37(3): 405-411, 418. doi: 10.7507/1001-5515.201905029 復制
引言
精神分裂癥(schizophrenia)是一種復發率高、致殘率高的慢性遷延性精神障礙疾病[1]。精神分裂癥患者不僅存在著自身健康問題,而且肇事肇禍率高,給家庭和社會帶來沉重的負擔。因此,準確診斷精神分裂癥對于患者后續接受正確的治療和控制具有重要的作用。
隨著影像技術的不斷發展,以磁共振成像(magnetic resonance imaging,MRI)為代表的影像設備已經廣泛應用于精神分裂癥的診斷[2]。然而,影像診斷往往依賴于醫生的水平和經驗,由于醫生自身的醫療知識差異、診斷環境差異、生理疲勞等情況,會導致診斷結果差異較大、可重復性差等問題。計算機輔助診斷(computer-aided diagnosis,CAD)為醫生的診斷工作提供了可重復性和一致性好的輔助決策[3-4]。目前,基于神經影像的精神分裂癥的 CAD 研究已經逐步得到開展。
特征提取與表達是 CAD 系統中的一個重要環節[3]。深度學習(deep learning)能有效提升特征表達能力,近年來已在圖像和信號處理領域獲得了廣泛的應用,包括醫學影像處理領域。極限學習機-自編碼器(extreme learning machine based auto-encoder,ELM-AE)是一種新的深度學習算法[5]。該算法將極限學習機(extreme learning machine,ELM)嵌入到自編碼器(auto-encoder,AE)框架中,從而在訓練過程中無需反向調參與迭代,在提升特征表達能力的同時,有效提升學習效率[5]。ELM-AE 既可以對原始圖像數據直接進行特征學習,也可以對已提取的特征進行二次學習,以進一步提升其特征表達[5-7]。因此,ELM-AE 具有應用于神經影像數據特征學習的可行性。
另一方面,分類器直接影響著 CAD 的診斷性能,是 CAD 系統中另一個重要環節[4]。常用的分類器包括支持向量機(support vector machine,SVM)、神經網絡分類器、隨機森林和 AdaBoost 等。近年來,一種新型的基于特權信息學習(learning using privileged information,LUPI)的 SVM 分類器(命名為 SVM+),在遷移學習領域獲得了廣泛應用[8]。在訓練階段,存在一個額外的特權信息(源領域)模態,協助目標領域數據共同訓練 SVM+分類器模型;而在測試階段,SVM+只針對單模態的目標領域數據進行分類[8]。SVM+已經成功應用于基于醫學影像的 CAD 系統[9-11]。然而,此類分類器在實際應用時,需要利用目標領域模態和特權信息模態數據同時訓練模型。而由于醫療資源分布不均等問題,臨床中更為常規的診斷范式是基于單模態影像數據進行診斷,這就限制了基于 LUPI 的分類器在醫學領域的進一步應用。
針對上述問題,本文提出一種結合 ELM-AE 特征學習的集成 SVM+分類算法(EA-SVM+),應用于基于單模態神經影像的精神分裂癥輔助診斷。該算法首先對單模態數據采用 ELM-AE 進行特征二次學習,然后通過隨機映射(random projection)算法將高維特征隨機分成多個子空間,并進行兩兩組合形成源領域和目標領域數據對,用于訓練多個 SVM+分類器,最終通過集成學習實現有效的模式分類。本文所提出的算法不僅可以提升原始 SVM+的分類性能,而且還能突破傳統 LUPI 分類器同時需要不同的源領域和目標領域數據進行模型訓練的限制,只需對單模態的目標領域數據進行數據變換,從自身數據產生“源領域”數據進行 SVM+分類器的訓練,從而使得 SVM+具有更為廣泛的應用。
1 方法
圖 1 所示為本文所提出的 EA-SVM+集成學習算法的流程圖。其具體步驟如下:

(1)在訓練階段,對單模態的神經影像數據提取特征;
(2)對提取的特征采用 ELM-AE 進行二次特征學習,獲得表達性能提升的高維特征向量;
(3)對高維特征進行隨機映射形成 P 個隨機子空間,并進行兩兩組合形成 M 個源領域和目標領域的數據對,即每個數據對中,一個子空間特征作為源領域(特權信息)模態,而另外一個子空間特征作為目標領域模態。因此,特權信息由自身特征產生,無需額外的源領域診斷模態;
(4)將 M 個數據對送入到 M 個 SVM+分類器中進行訓練,獲得 M 個 SVM+分類器模型;
(5)采用集成學習方法對 M 個 SVM+分類器模型進行集成,獲得最終的強分類器模型;
(6)在測試階段,對單個診斷模態的數據進行步驟(1)和(2)的特征提取與表達學習處理,然后仍然劃為 P 個隨機子空間特征,再將這些特征分別送到 M 個對應的 SVM+分類器中,并進行集成學習,實現模式分類。需要注意的是,在測試階段,不需要額外的特權信息(源領域)數據。
1.1 ELM-AE 原理
ELM 算法采用隨機初始化輸入層和隱藏層的連接權重的策略,無需反向調參過程,具有學習速度快、泛化性能好的特點[12]。
給定訓練集 ,其中
為訓練樣本,
是訓練樣本對應的分類標簽,樣本數為 N。對于一個有 L 個隱層節點的 ELM 神經網絡可以表示為:
![]() |
其中,為激活函數,Wj 為輸入權重,βj 為輸出權重,bj 是第 j 個隱層單元的偏置。Wj·xi 表示 Wj 和 xi 的內積。單隱層神經網絡學習目的是尋求輸出誤差最小,因而可以表示為:
![]() |
其中 λ 是可給定的超參數,ξi 表示訓練誤差。
AE 模型假定輸入與輸出相同,即:Y = X,通過訓練調整網絡中每一層的參數,使得重構誤差最小。基于 ELM 的 AE 算法,可以選取正交的隱藏節點的隨機權重和偏置[5],因此,ELM-AE 算法具有計算復雜度小、運算速度快的優點。圖 2 所示的是 ELM-AE 的網絡結構。

在 ELM-AE 中,隨機生成的正交隱層結點將輸入數據映射到一個新的表達空間中,這樣根據 Johnson-Lindenstrauss 引理就可以得到:
![]() |
其中,是輸入數據,H =
是隱層節點的輸出,a =
是在輸入和隱層節點之間正交的隨機權值,b =
是正交的隨機閾值。在不相等的維度情況下,ELM-AE 的輸出權值 β 能將輸入數據映射到相應的特征子空間中。根據式(4)可以計算得到輸出權值 β:
![]() |
對于相同維度映射的情況,可以根據公式(5)計算得到輸出權值 β:
![]() |
對 ELM-AE 的特征輸出層即公式(4)進行奇異值分解(singular value decomposition,SVD),則最終特征表達公式為:
![]() |
其中,u 是矩陣 HHT 的特征向量,d 是 H 的奇異值。
有關 ELM-AE 更為詳細的原理請參考文獻[5]。
1.2 基于 SVM+的集成學習
1.2.1 SVM+原理
SVM+在原 SVM 模型上融合了特權信息,將特權信息作為影響分類結果的軟間隔加入模型,替換其中的松弛變量。
給定訓練集 ,其中 xi∈X 是診斷模態(即目標領域)樣本,
是特權信息(即源領域),yi 為標簽。SVM+通過特權信息來幫助訓練更優的分類器模型[8]。
SVM+的最小化目標函數如下:
![]() |
![]() |
![]() |
其中 C 是用于權衡誤差的正則化參數。由以上目標函數構建其拉格朗日函數:
![]() |
其中,拉格朗日乘子 α ≥ 0,β ≥ 0。則其分類決策函數可表示為:
![]() |
其糾錯函數由下式表示:
![]() |
分類函數中的 K 和糾錯函數中的 K*分別是 X 空間和 X*空間上的核。由此可得拉格朗日乘子 α 和 β 的解:
![]() |
最終的 SVM+的分類決策函數為:
![]() |
其中,w 為最優超平面的法向量,b 是系數。
有關 SVM+算法更為具體的原理請參考文獻[8]。
1.2.2 集成學習
對 M 個 SVM+分類器模型進一步進行集成學習,生成一個強分類器。在本文中,除了常用的投票表決法(voting)集成學習以外,我們還采用了邊緣分布優化算法(margin distribution optimization,MDO)和多核增強(multiple kernel boosting,MKB)算法進行集成學習[13-14]。
MDO 算法原理如下[13]:
針對二分類問題,由 M 個不同的分類器進行 MDO 集成,對于樣本 xi,不同分類器的輸出結果由 表示,判別函數為
,其中
是尺度權重向量,且
。那么樣本 xi 的邊界由下式表示:
![]() |
若 ,則樣本分類正確;若
,則樣本分類錯誤;當
時,樣本標簽無法確定。邊界結果表示了分類器融合分類的結果,學習尺度權重可以使得邊界結果更大,分類結果更好。邊界最大化可以轉化為損失最小化,訓練集 S 的整體平方損失表示為:
![]() |
我們利用約束 L1-正則化最小二乘優化方法最小化整體平方損失之后,就可以學習最優尺度權重向量 w,由此實現最終的增強分類器。
MKB 的具體原理如下[14]:
MKB 通過擴展多核學習框架,集成多個分類器中的核函數,形成一個強分類器。我們將多個核函數的組合定義為:
![]() |
其中,M 為基核 Km 的個數,dm 是核權重。
初始化弱分類器的權重分布 ,然后進行 T 次循環尋找強分類器。循環中執行三個步驟:
(1)訓練核函數空間上的最優線性弱分類器 ;
(2)計算分類器誤差 和
:
![]() |
(3)更新采樣權重:
![]() |
完成 T 次循環后獲得最終的強分類器為:
![]() |
有關 MDO 和 MKB 算法的具體細節請參考文獻[13]和[14]。
2 實驗和結果
2.1 實驗數據與處理
本文所提出的 EA-SVM+集成學習算法在公開的精神分裂癥競賽數據庫(https://www.kaggle.com/c/mlsp-2014-mri/data)中進行驗證。該數據庫提供了雙模態的 MRI 數據,即結構 MRI(structural MRI,sMRI)和功能 MRI(functional MRI,fMRI)。兩種模態的數據同時采集自 86 例志愿者,包括 40 例精神分裂癥患者和 46 例正常對照者。
對于 sMRI 圖像,采用基于表層的形態學分析(source-based morphometry,SBM)算法進行特征提取,獲得 32 維的特征[15];而對于 fMRI 圖像,采用功能網絡連接(functional network connectivity,FNC)結合組水平獨立成分分析(group independent component analysis,GICA)的方法,提取共計 378 維的特征[16-17]。有關 sMRI 和 fMRI 的特征提取具體細節,請參考文獻[18]和[19]。
對于原始提取的特征,進一步采用 ELM-AE 進行特征的二次學習,獲得性能提升的高維度特征表達。在本實驗中,對于原始 32 維的 sMRI 特征經過 ELM-AE 學習以后輸出的特征維度為 400,而 378 維的 fMRI 特征經過二次特征學習以后的特征維度為 1 500 維。
對于 400 維的 sMRI 特征和 1 500 維的 fMRI 特征,都分成 5 個子空間。為了簡單化,我們依次將第 i 個子空間作為第(i +1)個子空間的特權模態,第 5 個子空間作為第 1 個子空間的特權模態。因此,一共形成 5 個 SVM+分類器。
2.2 實驗設計
為了評估所提出的 EA-SVM+集成學習分類算法性能,本文對以下算法進行了對比實驗:
(1)EA-SVM:經過 ELM-AE 得到的特征直接采用 SVM 分類器分類。
(2)EA-SVM 集成分類:經過 ELM-AE 得到的特征進行隨機映射得到 5 個子空間,然后對每個子空間訓練 SVM 分類器,并進行集成學習。其中,集成學習采用的投票表決(EA-Voting-SVM)、MDO(EA-MDO-SVM)和 MKB(EA-MKB-SVM)。
(3)EA-SVM+集成分類:本文所提出的 EA-SVM+集成分類算法,其中,集成學習采用的投票表決(EA-Voting-SVM+)、MDO(EA-MDO-SVM+)和 MKB(EA-MKB-SVM+)。
以上算法分別對 sMRI 和 fMRI 數據集進行實驗。對所有算法進行 5 次 5 折交叉驗證(5-fold cross validation)。將分類精度、敏感度和特異性作為評價指標,同時對 MKB 集成的結果畫出受試者操作特性(receiver operating characteristic,ROC)曲線,計算曲線下面積(area under curve,AUC)。
2.3 實驗結果
表 1 所示為針對 sMRI 模態數據的各種算法分類結果。由表中數據可以發現,EA-SVM+集成分類算法的結果相比于 EA-SVM 集成算法和原始的 EA-SVM 算法結果均有提高,EA-MKB-SVM+的分類精度、敏感性和特異性分別可以達到 72.12% ± 8.20%、73.50% ± 15.44% 和 70.93% ± 12.93%,整體結果最優,而比 EA-SVM 在分類精度和敏感度這 2 個指標上分別提高了 2.71% 和 5.60%。三種 EA-SVM 集成分類算法均比 EA-SVM 分類結果好,這說明隨機子空間和集成技術在所提取的 ELM-AE 特征表達上的應用能提高分類性能。同時,EA-SVM+集成算法比 EA-SVM 集成取得了更好的分類結果,表明將單模態數據中的某一子空間作為特權信息輔助訓練分類模型,有效提升了分類器的性能。從圖 3 的 ROC 曲線結果可以發現,EA-SVM+算法使用 MKB 算法表現最優,其 ROC 曲線最接近左上角。而對比各種算法的 AUC 值,可以發現 EA-MKB-SVM+算法的 AUC 值可達到 0.767 7,優于其它結果。


表 2 是 fMRI 模態數據的分類結果,其結果趨勢跟表 1 接近。EA-SVM+集成分類算法的結果優于 EA-SVM 集成算法和 EA-SVM 算法的結果。EA-MKB-SVM+算法仍然獲得了整體最優的結果,其平均分類精度、敏感性和特異性分別為 72.33% ± 8.95%、68.50% ± 16.58%、75.73% ± 16.10%,相對于原始 EA-SVM 的結果,分類精度提高了 3.91%,敏感度提升了 1.00%,特異性提升了 6.53%。圖 4 是 fMRI 在不同算法下的 ROC 曲線圖。從 ROC 曲線圖中不容易區分算法 EA-MKB-SVM 和 EA-MKB-SVM+的性能,而表 2 給出了相應算法的 AUC 值,可以發現 EA-MKB-SVM+的結果更優,其 AUC 值為 0.735 7。


3 討論
本文面向單模態神經影像的精神分裂癥輔助診斷問題,提出了一種基于特權信息的單模態 SVM+集成分類算法。實驗結果表明,與對比算法相比,本文提出的 EA-SVM+集成學習方法取得了最優的分類效果,表明了其有效性。
傳統的 LUPI 分類器算法在訓練階段需要額外的特權信息模態,通過遷移知識來輔助訓練提升模型性能。但是,這實際上也限制了 SVM+更為廣泛的應用。而在臨床診斷中,由于醫療資源分布不均,大部分醫院(特別是基層醫院)難以配備全面的醫療設備,這就導致并不是每一位患者都能接受多模態醫學影像檢查。因此,基于單模態的影像檢查是目前臨床更為普遍的一種模式。為了拓展 SVM+算法的應用范圍,特別是針對單模態數據也能實現有效的模式分類,本文提出了一種 EA-SVM+集成學習方法。該算法將高維特征進行隨機分組,相互作為特權信息,這就無需額外的特權信息,實現自我生成特權信息,從而將 SVM+拓展應用于單模態數據的分類任務。此外,傳統的隨機子空間特征并沒有考慮相互之間的相關性,而本算法既保證每一個特征值都已經被用于分類任務,同時充分利用該特征值的信息,使其被遷移至其他分類器中輔助提升分類器性能;而多個分類器的集成學習,也進一步提高了最終的分類效果。
另一方面,由于手工設計提取的特征往往表達能力不強,我們提出采用 ELM-AE 實現特征表達的提升。該算法在具有良好特征表達能力的同時,由于不存在反饋調參過程,運算效率也很高。此外,基于 ELM-AE 的特征學習模態與基于 SVM+的集成學習模塊是兩個獨立的模塊,不存在全局反饋調參過程,也使得整個算法較為簡單易用。而在進一步的研究中,可以考慮采用如深度置信網絡(deep belief network)等其他深度學習方法來進一步提升特征表達能力,也可以研究結合 SVM+的整體網絡反饋調參方法,提升最終分類性能。
值得注意的是,本文實驗采用的是一個基于雙模態神經影像的精神分裂癥競賽數據庫[20],各種算法主要是結合雙模態數據實現精神分裂癥 CAD,而本文算法是針對單模態數據進行,因此不宜進行直接的對比。而在我們之前的一項研究中,采用遷移學習實現了基于單模態神經影像的精神分裂癥診斷[10]。在該研究中,將 fMRI 數據作為特權信息,sMRI 數據作為診斷模態,采用一個經典的領域自適應 SVM 分類器進行遷移學習分類時,獲得了 72.16% ± 2.06% 的分類精度、68.00% ± 1.12% 的敏感度和 75.78% ± 3.42% 的特異性;采用一個 SVM+分類器進行遷移學習分類時,其分類精度、敏感度和特異性分別為 72.55% ± 3.77%、67.50% ± 3.06% 和 76.89% ± 5.42%[10]。而本文并沒有采用額外的特權信息模態,直接將本文所提出的算法應用于單模態的 sMRI 數據,也獲得了同樣量級的分類結果,表明了本文算法的有效性。在今后的研究中,我們將分析更多的針對精神分裂癥 CAD 的算法,進一步進行更為全面的對比研究。
除此以外,本文所提出的算法,其性能還有進一步的提升空間,主要原因在于本文所采用的公開數據集的樣本量較小,這在一定程度上影響了所提出算法的模型訓練有效性,導致在各項指標上的結果并不突出。在今后的研究中,將采集更多的精神分裂癥臨床數據,從而在更大的數據集上進行更為深入和全面的算法研究。
4 結論
本文提出了一種 EA-SVM+集成學習算法,其主要創新點在于克服了傳統 SVM+算法需要額外的特權信息模態的不足,通過自我生成特權信息的方式,實現了針對單模態數據的分類任務。該算法應用于基于單模態神經影像的精神分裂癥診斷,實驗結果表明該算法性能優于對比算法。本文研究為拓展 LUPI 分類器的應用進行了探索,該算法也可應用于其他基于單模態影像的 CAD。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
精神分裂癥(schizophrenia)是一種復發率高、致殘率高的慢性遷延性精神障礙疾病[1]。精神分裂癥患者不僅存在著自身健康問題,而且肇事肇禍率高,給家庭和社會帶來沉重的負擔。因此,準確診斷精神分裂癥對于患者后續接受正確的治療和控制具有重要的作用。
隨著影像技術的不斷發展,以磁共振成像(magnetic resonance imaging,MRI)為代表的影像設備已經廣泛應用于精神分裂癥的診斷[2]。然而,影像診斷往往依賴于醫生的水平和經驗,由于醫生自身的醫療知識差異、診斷環境差異、生理疲勞等情況,會導致診斷結果差異較大、可重復性差等問題。計算機輔助診斷(computer-aided diagnosis,CAD)為醫生的診斷工作提供了可重復性和一致性好的輔助決策[3-4]。目前,基于神經影像的精神分裂癥的 CAD 研究已經逐步得到開展。
特征提取與表達是 CAD 系統中的一個重要環節[3]。深度學習(deep learning)能有效提升特征表達能力,近年來已在圖像和信號處理領域獲得了廣泛的應用,包括醫學影像處理領域。極限學習機-自編碼器(extreme learning machine based auto-encoder,ELM-AE)是一種新的深度學習算法[5]。該算法將極限學習機(extreme learning machine,ELM)嵌入到自編碼器(auto-encoder,AE)框架中,從而在訓練過程中無需反向調參與迭代,在提升特征表達能力的同時,有效提升學習效率[5]。ELM-AE 既可以對原始圖像數據直接進行特征學習,也可以對已提取的特征進行二次學習,以進一步提升其特征表達[5-7]。因此,ELM-AE 具有應用于神經影像數據特征學習的可行性。
另一方面,分類器直接影響著 CAD 的診斷性能,是 CAD 系統中另一個重要環節[4]。常用的分類器包括支持向量機(support vector machine,SVM)、神經網絡分類器、隨機森林和 AdaBoost 等。近年來,一種新型的基于特權信息學習(learning using privileged information,LUPI)的 SVM 分類器(命名為 SVM+),在遷移學習領域獲得了廣泛應用[8]。在訓練階段,存在一個額外的特權信息(源領域)模態,協助目標領域數據共同訓練 SVM+分類器模型;而在測試階段,SVM+只針對單模態的目標領域數據進行分類[8]。SVM+已經成功應用于基于醫學影像的 CAD 系統[9-11]。然而,此類分類器在實際應用時,需要利用目標領域模態和特權信息模態數據同時訓練模型。而由于醫療資源分布不均等問題,臨床中更為常規的診斷范式是基于單模態影像數據進行診斷,這就限制了基于 LUPI 的分類器在醫學領域的進一步應用。
針對上述問題,本文提出一種結合 ELM-AE 特征學習的集成 SVM+分類算法(EA-SVM+),應用于基于單模態神經影像的精神分裂癥輔助診斷。該算法首先對單模態數據采用 ELM-AE 進行特征二次學習,然后通過隨機映射(random projection)算法將高維特征隨機分成多個子空間,并進行兩兩組合形成源領域和目標領域數據對,用于訓練多個 SVM+分類器,最終通過集成學習實現有效的模式分類。本文所提出的算法不僅可以提升原始 SVM+的分類性能,而且還能突破傳統 LUPI 分類器同時需要不同的源領域和目標領域數據進行模型訓練的限制,只需對單模態的目標領域數據進行數據變換,從自身數據產生“源領域”數據進行 SVM+分類器的訓練,從而使得 SVM+具有更為廣泛的應用。
1 方法
圖 1 所示為本文所提出的 EA-SVM+集成學習算法的流程圖。其具體步驟如下:

(1)在訓練階段,對單模態的神經影像數據提取特征;
(2)對提取的特征采用 ELM-AE 進行二次特征學習,獲得表達性能提升的高維特征向量;
(3)對高維特征進行隨機映射形成 P 個隨機子空間,并進行兩兩組合形成 M 個源領域和目標領域的數據對,即每個數據對中,一個子空間特征作為源領域(特權信息)模態,而另外一個子空間特征作為目標領域模態。因此,特權信息由自身特征產生,無需額外的源領域診斷模態;
(4)將 M 個數據對送入到 M 個 SVM+分類器中進行訓練,獲得 M 個 SVM+分類器模型;
(5)采用集成學習方法對 M 個 SVM+分類器模型進行集成,獲得最終的強分類器模型;
(6)在測試階段,對單個診斷模態的數據進行步驟(1)和(2)的特征提取與表達學習處理,然后仍然劃為 P 個隨機子空間特征,再將這些特征分別送到 M 個對應的 SVM+分類器中,并進行集成學習,實現模式分類。需要注意的是,在測試階段,不需要額外的特權信息(源領域)數據。
1.1 ELM-AE 原理
ELM 算法采用隨機初始化輸入層和隱藏層的連接權重的策略,無需反向調參過程,具有學習速度快、泛化性能好的特點[12]。
給定訓練集 ,其中
為訓練樣本,
是訓練樣本對應的分類標簽,樣本數為 N。對于一個有 L 個隱層節點的 ELM 神經網絡可以表示為:
![]() |
其中,為激活函數,Wj 為輸入權重,βj 為輸出權重,bj 是第 j 個隱層單元的偏置。Wj·xi 表示 Wj 和 xi 的內積。單隱層神經網絡學習目的是尋求輸出誤差最小,因而可以表示為:
![]() |
其中 λ 是可給定的超參數,ξi 表示訓練誤差。
AE 模型假定輸入與輸出相同,即:Y = X,通過訓練調整網絡中每一層的參數,使得重構誤差最小。基于 ELM 的 AE 算法,可以選取正交的隱藏節點的隨機權重和偏置[5],因此,ELM-AE 算法具有計算復雜度小、運算速度快的優點。圖 2 所示的是 ELM-AE 的網絡結構。

在 ELM-AE 中,隨機生成的正交隱層結點將輸入數據映射到一個新的表達空間中,這樣根據 Johnson-Lindenstrauss 引理就可以得到:
![]() |
其中,是輸入數據,H =
是隱層節點的輸出,a =
是在輸入和隱層節點之間正交的隨機權值,b =
是正交的隨機閾值。在不相等的維度情況下,ELM-AE 的輸出權值 β 能將輸入數據映射到相應的特征子空間中。根據式(4)可以計算得到輸出權值 β:
![]() |
對于相同維度映射的情況,可以根據公式(5)計算得到輸出權值 β:
![]() |
對 ELM-AE 的特征輸出層即公式(4)進行奇異值分解(singular value decomposition,SVD),則最終特征表達公式為:
![]() |
其中,u 是矩陣 HHT 的特征向量,d 是 H 的奇異值。
有關 ELM-AE 更為詳細的原理請參考文獻[5]。
1.2 基于 SVM+的集成學習
1.2.1 SVM+原理
SVM+在原 SVM 模型上融合了特權信息,將特權信息作為影響分類結果的軟間隔加入模型,替換其中的松弛變量。
給定訓練集 ,其中 xi∈X 是診斷模態(即目標領域)樣本,
是特權信息(即源領域),yi 為標簽。SVM+通過特權信息來幫助訓練更優的分類器模型[8]。
SVM+的最小化目標函數如下:
![]() |
![]() |
![]() |
其中 C 是用于權衡誤差的正則化參數。由以上目標函數構建其拉格朗日函數:
![]() |
其中,拉格朗日乘子 α ≥ 0,β ≥ 0。則其分類決策函數可表示為:
![]() |
其糾錯函數由下式表示:
![]() |
分類函數中的 K 和糾錯函數中的 K*分別是 X 空間和 X*空間上的核。由此可得拉格朗日乘子 α 和 β 的解:
![]() |
最終的 SVM+的分類決策函數為:
![]() |
其中,w 為最優超平面的法向量,b 是系數。
有關 SVM+算法更為具體的原理請參考文獻[8]。
1.2.2 集成學習
對 M 個 SVM+分類器模型進一步進行集成學習,生成一個強分類器。在本文中,除了常用的投票表決法(voting)集成學習以外,我們還采用了邊緣分布優化算法(margin distribution optimization,MDO)和多核增強(multiple kernel boosting,MKB)算法進行集成學習[13-14]。
MDO 算法原理如下[13]:
針對二分類問題,由 M 個不同的分類器進行 MDO 集成,對于樣本 xi,不同分類器的輸出結果由 表示,判別函數為
,其中
是尺度權重向量,且
。那么樣本 xi 的邊界由下式表示:
![]() |
若 ,則樣本分類正確;若
,則樣本分類錯誤;當
時,樣本標簽無法確定。邊界結果表示了分類器融合分類的結果,學習尺度權重可以使得邊界結果更大,分類結果更好。邊界最大化可以轉化為損失最小化,訓練集 S 的整體平方損失表示為:
![]() |
我們利用約束 L1-正則化最小二乘優化方法最小化整體平方損失之后,就可以學習最優尺度權重向量 w,由此實現最終的增強分類器。
MKB 的具體原理如下[14]:
MKB 通過擴展多核學習框架,集成多個分類器中的核函數,形成一個強分類器。我們將多個核函數的組合定義為:
![]() |
其中,M 為基核 Km 的個數,dm 是核權重。
初始化弱分類器的權重分布 ,然后進行 T 次循環尋找強分類器。循環中執行三個步驟:
(1)訓練核函數空間上的最優線性弱分類器 ;
(2)計算分類器誤差 和
:
![]() |
(3)更新采樣權重:
![]() |
完成 T 次循環后獲得最終的強分類器為:
![]() |
有關 MDO 和 MKB 算法的具體細節請參考文獻[13]和[14]。
2 實驗和結果
2.1 實驗數據與處理
本文所提出的 EA-SVM+集成學習算法在公開的精神分裂癥競賽數據庫(https://www.kaggle.com/c/mlsp-2014-mri/data)中進行驗證。該數據庫提供了雙模態的 MRI 數據,即結構 MRI(structural MRI,sMRI)和功能 MRI(functional MRI,fMRI)。兩種模態的數據同時采集自 86 例志愿者,包括 40 例精神分裂癥患者和 46 例正常對照者。
對于 sMRI 圖像,采用基于表層的形態學分析(source-based morphometry,SBM)算法進行特征提取,獲得 32 維的特征[15];而對于 fMRI 圖像,采用功能網絡連接(functional network connectivity,FNC)結合組水平獨立成分分析(group independent component analysis,GICA)的方法,提取共計 378 維的特征[16-17]。有關 sMRI 和 fMRI 的特征提取具體細節,請參考文獻[18]和[19]。
對于原始提取的特征,進一步采用 ELM-AE 進行特征的二次學習,獲得性能提升的高維度特征表達。在本實驗中,對于原始 32 維的 sMRI 特征經過 ELM-AE 學習以后輸出的特征維度為 400,而 378 維的 fMRI 特征經過二次特征學習以后的特征維度為 1 500 維。
對于 400 維的 sMRI 特征和 1 500 維的 fMRI 特征,都分成 5 個子空間。為了簡單化,我們依次將第 i 個子空間作為第(i +1)個子空間的特權模態,第 5 個子空間作為第 1 個子空間的特權模態。因此,一共形成 5 個 SVM+分類器。
2.2 實驗設計
為了評估所提出的 EA-SVM+集成學習分類算法性能,本文對以下算法進行了對比實驗:
(1)EA-SVM:經過 ELM-AE 得到的特征直接采用 SVM 分類器分類。
(2)EA-SVM 集成分類:經過 ELM-AE 得到的特征進行隨機映射得到 5 個子空間,然后對每個子空間訓練 SVM 分類器,并進行集成學習。其中,集成學習采用的投票表決(EA-Voting-SVM)、MDO(EA-MDO-SVM)和 MKB(EA-MKB-SVM)。
(3)EA-SVM+集成分類:本文所提出的 EA-SVM+集成分類算法,其中,集成學習采用的投票表決(EA-Voting-SVM+)、MDO(EA-MDO-SVM+)和 MKB(EA-MKB-SVM+)。
以上算法分別對 sMRI 和 fMRI 數據集進行實驗。對所有算法進行 5 次 5 折交叉驗證(5-fold cross validation)。將分類精度、敏感度和特異性作為評價指標,同時對 MKB 集成的結果畫出受試者操作特性(receiver operating characteristic,ROC)曲線,計算曲線下面積(area under curve,AUC)。
2.3 實驗結果
表 1 所示為針對 sMRI 模態數據的各種算法分類結果。由表中數據可以發現,EA-SVM+集成分類算法的結果相比于 EA-SVM 集成算法和原始的 EA-SVM 算法結果均有提高,EA-MKB-SVM+的分類精度、敏感性和特異性分別可以達到 72.12% ± 8.20%、73.50% ± 15.44% 和 70.93% ± 12.93%,整體結果最優,而比 EA-SVM 在分類精度和敏感度這 2 個指標上分別提高了 2.71% 和 5.60%。三種 EA-SVM 集成分類算法均比 EA-SVM 分類結果好,這說明隨機子空間和集成技術在所提取的 ELM-AE 特征表達上的應用能提高分類性能。同時,EA-SVM+集成算法比 EA-SVM 集成取得了更好的分類結果,表明將單模態數據中的某一子空間作為特權信息輔助訓練分類模型,有效提升了分類器的性能。從圖 3 的 ROC 曲線結果可以發現,EA-SVM+算法使用 MKB 算法表現最優,其 ROC 曲線最接近左上角。而對比各種算法的 AUC 值,可以發現 EA-MKB-SVM+算法的 AUC 值可達到 0.767 7,優于其它結果。


表 2 是 fMRI 模態數據的分類結果,其結果趨勢跟表 1 接近。EA-SVM+集成分類算法的結果優于 EA-SVM 集成算法和 EA-SVM 算法的結果。EA-MKB-SVM+算法仍然獲得了整體最優的結果,其平均分類精度、敏感性和特異性分別為 72.33% ± 8.95%、68.50% ± 16.58%、75.73% ± 16.10%,相對于原始 EA-SVM 的結果,分類精度提高了 3.91%,敏感度提升了 1.00%,特異性提升了 6.53%。圖 4 是 fMRI 在不同算法下的 ROC 曲線圖。從 ROC 曲線圖中不容易區分算法 EA-MKB-SVM 和 EA-MKB-SVM+的性能,而表 2 給出了相應算法的 AUC 值,可以發現 EA-MKB-SVM+的結果更優,其 AUC 值為 0.735 7。


3 討論
本文面向單模態神經影像的精神分裂癥輔助診斷問題,提出了一種基于特權信息的單模態 SVM+集成分類算法。實驗結果表明,與對比算法相比,本文提出的 EA-SVM+集成學習方法取得了最優的分類效果,表明了其有效性。
傳統的 LUPI 分類器算法在訓練階段需要額外的特權信息模態,通過遷移知識來輔助訓練提升模型性能。但是,這實際上也限制了 SVM+更為廣泛的應用。而在臨床診斷中,由于醫療資源分布不均,大部分醫院(特別是基層醫院)難以配備全面的醫療設備,這就導致并不是每一位患者都能接受多模態醫學影像檢查。因此,基于單模態的影像檢查是目前臨床更為普遍的一種模式。為了拓展 SVM+算法的應用范圍,特別是針對單模態數據也能實現有效的模式分類,本文提出了一種 EA-SVM+集成學習方法。該算法將高維特征進行隨機分組,相互作為特權信息,這就無需額外的特權信息,實現自我生成特權信息,從而將 SVM+拓展應用于單模態數據的分類任務。此外,傳統的隨機子空間特征并沒有考慮相互之間的相關性,而本算法既保證每一個特征值都已經被用于分類任務,同時充分利用該特征值的信息,使其被遷移至其他分類器中輔助提升分類器性能;而多個分類器的集成學習,也進一步提高了最終的分類效果。
另一方面,由于手工設計提取的特征往往表達能力不強,我們提出采用 ELM-AE 實現特征表達的提升。該算法在具有良好特征表達能力的同時,由于不存在反饋調參過程,運算效率也很高。此外,基于 ELM-AE 的特征學習模態與基于 SVM+的集成學習模塊是兩個獨立的模塊,不存在全局反饋調參過程,也使得整個算法較為簡單易用。而在進一步的研究中,可以考慮采用如深度置信網絡(deep belief network)等其他深度學習方法來進一步提升特征表達能力,也可以研究結合 SVM+的整體網絡反饋調參方法,提升最終分類性能。
值得注意的是,本文實驗采用的是一個基于雙模態神經影像的精神分裂癥競賽數據庫[20],各種算法主要是結合雙模態數據實現精神分裂癥 CAD,而本文算法是針對單模態數據進行,因此不宜進行直接的對比。而在我們之前的一項研究中,采用遷移學習實現了基于單模態神經影像的精神分裂癥診斷[10]。在該研究中,將 fMRI 數據作為特權信息,sMRI 數據作為診斷模態,采用一個經典的領域自適應 SVM 分類器進行遷移學習分類時,獲得了 72.16% ± 2.06% 的分類精度、68.00% ± 1.12% 的敏感度和 75.78% ± 3.42% 的特異性;采用一個 SVM+分類器進行遷移學習分類時,其分類精度、敏感度和特異性分別為 72.55% ± 3.77%、67.50% ± 3.06% 和 76.89% ± 5.42%[10]。而本文并沒有采用額外的特權信息模態,直接將本文所提出的算法應用于單模態的 sMRI 數據,也獲得了同樣量級的分類結果,表明了本文算法的有效性。在今后的研究中,我們將分析更多的針對精神分裂癥 CAD 的算法,進一步進行更為全面的對比研究。
除此以外,本文所提出的算法,其性能還有進一步的提升空間,主要原因在于本文所采用的公開數據集的樣本量較小,這在一定程度上影響了所提出算法的模型訓練有效性,導致在各項指標上的結果并不突出。在今后的研究中,將采集更多的精神分裂癥臨床數據,從而在更大的數據集上進行更為深入和全面的算法研究。
4 結論
本文提出了一種 EA-SVM+集成學習算法,其主要創新點在于克服了傳統 SVM+算法需要額外的特權信息模態的不足,通過自我生成特權信息的方式,實現了針對單模態數據的分類任務。該算法應用于基于單模態神經影像的精神分裂癥診斷,實驗結果表明該算法性能優于對比算法。本文研究為拓展 LUPI 分類器的應用進行了探索,該算法也可應用于其他基于單模態影像的 CAD。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。