本文運用信息極大化獨立成分分析(ICA)分別提取結構磁共振成像(sMRI)和正電子發射斷層影像(PET)的單模態特征,然后使用權重結合策略生成雙模態影像特征,可提高阿爾茨海默病(AD)及輕度認知障礙(MCI)診斷準確度。AD患者與健康對照組(HC)的分類實驗結果:準確度為93.75%、敏感度為100%、特異度為87.64%。MCI和HC組的實驗結果:準確度為89.35%、敏感度為81.85%、特異度為99.36%。與單模態特征下的最好實驗結果相比,本文提出的雙模態分析方法對分類結果有顯著的提高。
引用本文: 管杰, 楊文璐. 基于獨立成分分析的雙模態影像分類研究. 生物醫學工程學雜志, 2014, 31(5): 1031-1036. doi: 10.7507/1001-5515.20140193 復制
引言
阿爾茨海默病(Alzheimer’s disease,AD)是一種以隱匿起病和進行性惡化或持續性智能衰退為特征的神經變性病[1],多起于老年期,病程緩慢且不可逆,是一種常見的導致老年癡呆的疾病。其中以大腦內的β淀粉樣蛋白聚集、神經纖維纏結及神經元丟失為主要的病理特征,記憶機能障礙及其認知功能衰退是其主要的臨床病征[2-3]。輕度認知障礙(mild cognitive impairment,MCI)是介于正常衰老和早期AD之間的一種過渡狀態,有可能會轉化為AD。因此,對MCI深入研究,有希望發現和篩選出AD高危人群,為AD的治療提供最佳時間窗,有利于預防或推遲AD的發生[4]。中國是世界上人口老化基數最大的國家,65歲以上老年人群中,嚴重老年癡呆患者為5%,85歲以上老人的患病率為50%左右[5]。中國有600~800萬AD患者,AD的高患病率已引起人們的高度重視,早期診斷是防治AD的關鍵。
隨著結構磁共振成像(structural magnetic resonance imaging,sMRI)和正電子發射斷層成像(positron emission tomography,PET)等神經影像技術的飛速發展,人類在大尺寸上實現了無創條件下對大腦結構描述和功能定位,為人類研究認知功能、認知障礙及其神經機制提供了必要的技術手段,也使得這類研究的多層次、跨學科結合成為可能[6]。近年來,大多數研究僅僅聚焦在單模態影像的研究,例如,能夠測量大腦灰質萎縮的sMRI和測量葡萄糖代謝率的PET[7-8]。盡管單模態影像能提供一些有利于AD診斷的信息,但難以滿足臨床確診的要求[9]。本文通過研究雙模態影像特征結合,將提供更多有利于AD診斷的信息。
1 材料和方法
研究流程圖如圖 1所示。首先用統計參數圖 (statistical parametric mapping,SPM)軟件分別對磁共振成像(magnetic resonance imaging,MRI)和PET源影像數據進行預處理[10],運用信息極大化獨立成分分析(infomax independent component analysis,Infomax ICA)分別提取MRI和PET影像特征[11-12],并運用權重結合的方法將兩種單模態特征進行信息結合,并利用主成分分析(principal component analysis,PCA) 方法將高維數據降維,最后利用權重結合的特征在支持向量機(support vector machine,SVM)分類器中對影像數據進行分類。

1.1 材料
試驗使用的所有MRI和PET影像均來自于美國ADNI (Alzheimer’s Disease Neuroimaging Initiative)中心的數據庫[13]。美國ADNI中心在2003年由多個研究機構共同合作成立,評測的目標在于尋找人腦中的AD病程發展的生物標識。該中心通過美國與加拿大的50多個機構,招募了800多名年齡在55~90歲之間的成年人進行MRI或PET影像的跟蹤采集。其中AD患者200余人、MCI患者400余人及健康人群(healthy controls,HC)200余人。本研究的數據都取自受試者首次被采集的MRI和對應PET影像,其樣本信息統計如表 1所示。

1.2 影像預處理
首先用SPM軟件包分別對所有的MRI和PET影像進行標準化,標目的是將影像中各腦組織的空間位置與模板中相應腦組織空間位置對齊。本研究分別將MRI和PET影像歸一化到標準的蒙特利爾神經學研究所(Montreal Neurological Institute,MNI)的MRI T1模板和PET模板上[14]。標準化后的所有影像的大小為M=78×95×68 體素,每個體素的大小為2 mm×2 mm×2 mm。再將每個影像一維向量化,維數大小為N=1×510 340。最后分別構建MRI和PET影像的三組數據矩陣:AD組、MCI組和HC組。
1.3 獨立成分分析
ICA是近年來發展起來的一種強力數據分析方法,廣泛應用于多個領域,在生物醫學信號處理中成為常用的數據處理方法[15-16]。ICA是一種用于揭示隨機變量、測量數據或信號中的隱含獨立成分的統計方法,它利用統計原理進行計算,通過線性變換可把觀測數據或信號描述為統計獨立的源信號的線性組合。 其原理如圖 2所示。假設觀測數據x(t)是混合系統A由獨立成分s(t)混合生成的,如果想通過解混矩陣B得到的y(t)盡可能接近s(t),則必須滿足矩陣B盡可能接近矩陣A的逆。

ICA也是一種多變量的數據驅動方法,它能夠探索與分析MRI和PET影像,并能挖掘隱藏在大腦影像中的相關體素信息。大腦各組織在AD的病變過程中一旦發生形態學變化(如海馬體積發生萎縮),ICA就能夠提取腦組織邊緣變化的特征信息。運用相關的ICA算法將觀測數據矩陣分解為一組統計上兩兩獨立的成分,其標準的數學模型形式為:
$X=A×S ,$ |
其中X為N×M的觀測數據矩陣,N代表受試者樣本的個數,M代表每幅影像的體素個數,每幅影像映射為X中的一行,其N個標本分別表示為X1,X2,…,XN;矩陣A為混合系數矩陣,維數為N×L,L代表分解后的獨立成分個數,矩陣A的每一行元素包含每個對象所有獨立成分的組合信息,而A每一列元素則包含單個獨立成分對所有對象的組合信息;矩陣S是L×M的源信號矩陣,Si(i=1,…,L)分別代表各個獨立成分,因為含有每幅圖像的體素信息,所以也稱為圖像基。通過源信號S與組合矩陣A可重構出源影像[17]。針對MRI和PET影像的ICA模型如圖 3所示。

對于具有線性輸出的神經網絡,Infomax ICA算法信息極大原理的出發點是極大化輸出熵或信息流。其原理為:假定X是某種神經網絡的輸入,則其輸出具有如下形式:
${{y}_{i}}={{\Phi }_{i}}({{b}_{i}}^{T}x)+n\text{ },$ |
式中Φi為某種非線性標量函數,bi神經元權值向量,n是加性高斯白噪聲。為了實現有效的信息傳送,極大化輸出的熵為
$H\left( y \right)=H({{\Phi }_{1}}({{b}_{1}}^{T}x),{{\Phi }_{2}}({{b}_{2}}^{T}x),\ldots ,{{\Phi }_{n}}({{b}_{n}}^{T}x))\text{ },$ |
在無噪聲的極限情況下,極大化輸入與輸出的互信息可以等價為上述的極大化輸出熵[18]。
Infomax ICA算法流程如下:
(1)對數據進行中心化使其均值為零;
(2)隨機生成分離矩陣B和初始化yi,設置學習率μ及收斂準則;
(3)計算y=Bz;
(4)如果非線性函數沒有事先確定:
yi=(1-μy)yi+μy[E(-tanh(yi)yi+(1-tanh(yi)2)];
如果yi>0,取gi(yi)=-2tanh(yi),否則gi(yi)=tanh(yi)-yi;
(5)更新分離矩陣B←B+Y[1+g(y)yT]B;
(6)如果尚未收斂,返回步驟(3)。
1.4 權重結合與主成分分析
與雙模態的特征直接串聯相比,本文采用權重結合的策略組合兩種模態的特征。假設[U1,U2,…,Un]代表sMRI的特征,[V1,V2 ,…,Vm]代表PET的特征,βsMRI,βPETI分別為sMRI和PET特征的權重系數,其融合方法為[βsMRI×U1,βsMRI×U2,…,βsMRI×Un,βPET×V1,βPET×V2,…,βPET×Vn],約束條件為:βsMRI+βPET=1,其中βsMRI,βPET的范圍在之間,以每步0.1增加或減少權重系數,測試權重組合的每一種可能情況。
PCA是將原始數據中具有相關性的成分重新組合成一組新的不相關綜合成分,是考察多個變量間相關性的一種多元統計方法。即從原始變量中導出少數幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關。PCA可用于將高維數據表示成低維數據并且盡可能保留原數據信息,從而達到數據降維的目的[19]。
1.5 支持向量機分類
SVM 的精髓在于基于結構風險最小化的思想,將函數集構造為一個函數子集序列,使各個子集按照VC維(Vapnik-Chervonenkis Dimension)的大小排列,在每個子集中尋找最小經驗風險并考慮子集間的折中經驗風險和置信范圍。本文研究的是兩類分類問題,即AD組和HC組分類、MCI組和HC組分類。針對兩類樣本線性可分的情況,可以得到分類平面如式(4),其中“·”表示向量的點積,首先需要對它進行歸一化,使得對線性可分的樣本集(xi,yi),i=1,2,…,n,x∈Rd,yi∈{+1,-1},其中,HC樣本的標簽為-1,而AD或MCI的標簽為+1。當滿足式(5)時,分類間隔為2/‖w‖,使間隔最大等‖w‖2價于使最小,而使1/2‖w‖2最小的平面就是需要的最佳分類面。
$X·W+b=0 ,$ |
${{y}_{i}}[(w\cdot {{x}_{i}})+b]-1\ge 0\text{ },$ |
在實際實驗中,樣本具有線性不可分特性,此時用上述線性可分的方法就不能達到分類間隔最大的要求。針對這種情況,可以通過非線性變換將非線性分類問題推廣到高維空間的線性分類問題,即通過核函數K(xi,xj)=〈Φ(xi)·Φ(xj)〉將非線性映射到高維特征空間中,然后在高維特征空間中即可進行線分類[20-23]。此時的目標函數為
$Q(\alpha )=\sum\limits_{i=1}^{n}{{{\alpha }_{i}}-\frac{1}{2}}\sum\limits_{i,j=1}^{n}{{{\alpha }_{i}}{{\alpha }_{j}}{{y}_{i}}{{y}_{j}}K({{x}_{i}},{{x}_{j}})}\text{ },$ |
而最優分類函數變為:
$f\left( x \right)=sgn(\sum\limits_{i=1}^{n}{{{\alpha }_{i}}^{*}}{{y}_{i}}K({{x}_{i}},x)+{{b}^{*}})$ |
最后根據實驗的實際情況選擇不同的核函數,并通過調節SVM中的各種性能參數,發現默認情況下的核函數將AD、MCI從HC中正確分開的效果最佳。
2 實驗結果
2.1 影像獨立成分提取
本文運用Infomax ICA 算法分別提取預處理后的sMRI和PET影像的特征并構建特征矩陣。通過每次增加5個獨立成分數的方式進行試驗,當獨立成分數取100時,單模態的分類效果最好。其中空間Infomax ICA分解情況如圖 4所示,ICi(i=1,…,L)代表第i個獨立的源影像,即影像獨立成分,或稱圖像基。

此處以PET影像中的一個MCI樣本為例,其中所有的源影像之間在統計上是盡可能獨立的,MCI影像是由L個獨立的源影像線性組合而成。
2.2 分類結果
首先,本文用Infomax ICA對sMRI和PET分別進行特征提取,然后利用SVM分別基于單個模態特征對樣本分類。其中隨機選取樣本的50%用于訓練分類模型,剩余的50%樣本用于測試,重復100次獲得分類結果并取其均值。然后利用權重結合的策略將兩種模態的特征進行融合,通過PCA方法來降低特征的維數,再重復上述分類過程。分類結果中的準確度、敏感度和特異度的計算方法為
$\begin{align} & 準確度=\left( TP+TN \right)/\left( TP+FP+TN+FN \right)~, \\ & 敏感度=TP/\left( TP+FP \right)~, \\ & 特異度=TN/\left( TN+FN \right)~, \\ \end{align}$ |
其中 TP表示正確分類得到的標簽為+1的正樣本個數,TN表示正確分類得到的標簽-1的負樣本個數,FP表示誤將標簽為-1的樣本統計為標簽+1的樣本個數,FN表示誤將標簽為+1的樣本統計為標簽-1的樣本個數。分類結果如圖 5所示,AD和HC的分類:當βsMRI=0.1,βPET=0.9時,選取的主成分數為105時的分類效果最好,其分類準確度為93.75%、敏感度為100%、特異度為87.64%。而MCI和HC的分類:當βsMRI=0.2,βPET=0.8時,選取的主成分數為192時分類效果最好,其準確度為89.35%、敏感度為81.85%、特異度為99.36%。

3 總結
本文從雙模態的角度出發研究AD、MCI與HC的分類。在AD與HC單模態影像的分類實驗中,取得的最高分類準確度為89.31%,而雙模態影像方法獲得的分類準確度為93.75%,僅從分類準確度而言,相比于單模態影像的分類實驗結果,雙模態方法的分類準確度提高了4.44%。在MCI與HC的單模態影像的分類實驗中,取得的最高分類準確度為78.5%,而雙模態影像方法的獲得的分類準確度為89.35%,比基于單模態特征的分類準確度提高了10.85%。
通過對比上述的單雙模態影像的分類結果可知,本文提出的雙模態影像分類結果明顯優于基于單模態特征的結果。同時與相關研究比較,Zhang等[24]感興趣區與多核函數結合的SVM分類方法獲得的雙模態影像AD與HC分類準確度為90.6%、敏感度為90.5%及特異度為90.7%,雙模態影像MCI與HC分類準確度為76.4%、敏感度為81.8%及特異度為66.0%。Hinrichs等[25]提出的多核學習方法分類雙模態影像(sMRI和PET影像)AD與HC分類準確度為81.00%、敏感度為78.52%及特異度為81.76%。與之相比,本文的雙模態影像AD、MCI與HC分類準確度分別為93.75%、89.35%,其分類準確度更高,效果更好。而造成上述結果差異的原因有多種:通常樣本數據越大實驗結果越好,受條件限制,實驗中并沒有采用較多數量的樣本,但小樣本量也可能對結果產生影響;其次,實驗方法的不同對實驗結果的影響很大。本文通過Infomax ICA分別提取sMRI和PET影像的特征,并采用權重結合的策略融合兩種影像的特征,最后利用SVM對雙模態特征進行分類,得到了比較滿意的結果,也為今后AD及MCI的診斷準確度提高奠定基礎。下階段將對MCI患者向AD患者轉變進行預測,從而提前預防AD的發生。
引言
阿爾茨海默病(Alzheimer’s disease,AD)是一種以隱匿起病和進行性惡化或持續性智能衰退為特征的神經變性病[1],多起于老年期,病程緩慢且不可逆,是一種常見的導致老年癡呆的疾病。其中以大腦內的β淀粉樣蛋白聚集、神經纖維纏結及神經元丟失為主要的病理特征,記憶機能障礙及其認知功能衰退是其主要的臨床病征[2-3]。輕度認知障礙(mild cognitive impairment,MCI)是介于正常衰老和早期AD之間的一種過渡狀態,有可能會轉化為AD。因此,對MCI深入研究,有希望發現和篩選出AD高危人群,為AD的治療提供最佳時間窗,有利于預防或推遲AD的發生[4]。中國是世界上人口老化基數最大的國家,65歲以上老年人群中,嚴重老年癡呆患者為5%,85歲以上老人的患病率為50%左右[5]。中國有600~800萬AD患者,AD的高患病率已引起人們的高度重視,早期診斷是防治AD的關鍵。
隨著結構磁共振成像(structural magnetic resonance imaging,sMRI)和正電子發射斷層成像(positron emission tomography,PET)等神經影像技術的飛速發展,人類在大尺寸上實現了無創條件下對大腦結構描述和功能定位,為人類研究認知功能、認知障礙及其神經機制提供了必要的技術手段,也使得這類研究的多層次、跨學科結合成為可能[6]。近年來,大多數研究僅僅聚焦在單模態影像的研究,例如,能夠測量大腦灰質萎縮的sMRI和測量葡萄糖代謝率的PET[7-8]。盡管單模態影像能提供一些有利于AD診斷的信息,但難以滿足臨床確診的要求[9]。本文通過研究雙模態影像特征結合,將提供更多有利于AD診斷的信息。
1 材料和方法
研究流程圖如圖 1所示。首先用統計參數圖 (statistical parametric mapping,SPM)軟件分別對磁共振成像(magnetic resonance imaging,MRI)和PET源影像數據進行預處理[10],運用信息極大化獨立成分分析(infomax independent component analysis,Infomax ICA)分別提取MRI和PET影像特征[11-12],并運用權重結合的方法將兩種單模態特征進行信息結合,并利用主成分分析(principal component analysis,PCA) 方法將高維數據降維,最后利用權重結合的特征在支持向量機(support vector machine,SVM)分類器中對影像數據進行分類。

1.1 材料
試驗使用的所有MRI和PET影像均來自于美國ADNI (Alzheimer’s Disease Neuroimaging Initiative)中心的數據庫[13]。美國ADNI中心在2003年由多個研究機構共同合作成立,評測的目標在于尋找人腦中的AD病程發展的生物標識。該中心通過美國與加拿大的50多個機構,招募了800多名年齡在55~90歲之間的成年人進行MRI或PET影像的跟蹤采集。其中AD患者200余人、MCI患者400余人及健康人群(healthy controls,HC)200余人。本研究的數據都取自受試者首次被采集的MRI和對應PET影像,其樣本信息統計如表 1所示。

1.2 影像預處理
首先用SPM軟件包分別對所有的MRI和PET影像進行標準化,標目的是將影像中各腦組織的空間位置與模板中相應腦組織空間位置對齊。本研究分別將MRI和PET影像歸一化到標準的蒙特利爾神經學研究所(Montreal Neurological Institute,MNI)的MRI T1模板和PET模板上[14]。標準化后的所有影像的大小為M=78×95×68 體素,每個體素的大小為2 mm×2 mm×2 mm。再將每個影像一維向量化,維數大小為N=1×510 340。最后分別構建MRI和PET影像的三組數據矩陣:AD組、MCI組和HC組。
1.3 獨立成分分析
ICA是近年來發展起來的一種強力數據分析方法,廣泛應用于多個領域,在生物醫學信號處理中成為常用的數據處理方法[15-16]。ICA是一種用于揭示隨機變量、測量數據或信號中的隱含獨立成分的統計方法,它利用統計原理進行計算,通過線性變換可把觀測數據或信號描述為統計獨立的源信號的線性組合。 其原理如圖 2所示。假設觀測數據x(t)是混合系統A由獨立成分s(t)混合生成的,如果想通過解混矩陣B得到的y(t)盡可能接近s(t),則必須滿足矩陣B盡可能接近矩陣A的逆。

ICA也是一種多變量的數據驅動方法,它能夠探索與分析MRI和PET影像,并能挖掘隱藏在大腦影像中的相關體素信息。大腦各組織在AD的病變過程中一旦發生形態學變化(如海馬體積發生萎縮),ICA就能夠提取腦組織邊緣變化的特征信息。運用相關的ICA算法將觀測數據矩陣分解為一組統計上兩兩獨立的成分,其標準的數學模型形式為:
$X=A×S ,$ |
其中X為N×M的觀測數據矩陣,N代表受試者樣本的個數,M代表每幅影像的體素個數,每幅影像映射為X中的一行,其N個標本分別表示為X1,X2,…,XN;矩陣A為混合系數矩陣,維數為N×L,L代表分解后的獨立成分個數,矩陣A的每一行元素包含每個對象所有獨立成分的組合信息,而A每一列元素則包含單個獨立成分對所有對象的組合信息;矩陣S是L×M的源信號矩陣,Si(i=1,…,L)分別代表各個獨立成分,因為含有每幅圖像的體素信息,所以也稱為圖像基。通過源信號S與組合矩陣A可重構出源影像[17]。針對MRI和PET影像的ICA模型如圖 3所示。

對于具有線性輸出的神經網絡,Infomax ICA算法信息極大原理的出發點是極大化輸出熵或信息流。其原理為:假定X是某種神經網絡的輸入,則其輸出具有如下形式:
${{y}_{i}}={{\Phi }_{i}}({{b}_{i}}^{T}x)+n\text{ },$ |
式中Φi為某種非線性標量函數,bi神經元權值向量,n是加性高斯白噪聲。為了實現有效的信息傳送,極大化輸出的熵為
$H\left( y \right)=H({{\Phi }_{1}}({{b}_{1}}^{T}x),{{\Phi }_{2}}({{b}_{2}}^{T}x),\ldots ,{{\Phi }_{n}}({{b}_{n}}^{T}x))\text{ },$ |
在無噪聲的極限情況下,極大化輸入與輸出的互信息可以等價為上述的極大化輸出熵[18]。
Infomax ICA算法流程如下:
(1)對數據進行中心化使其均值為零;
(2)隨機生成分離矩陣B和初始化yi,設置學習率μ及收斂準則;
(3)計算y=Bz;
(4)如果非線性函數沒有事先確定:
yi=(1-μy)yi+μy[E(-tanh(yi)yi+(1-tanh(yi)2)];
如果yi>0,取gi(yi)=-2tanh(yi),否則gi(yi)=tanh(yi)-yi;
(5)更新分離矩陣B←B+Y[1+g(y)yT]B;
(6)如果尚未收斂,返回步驟(3)。
1.4 權重結合與主成分分析
與雙模態的特征直接串聯相比,本文采用權重結合的策略組合兩種模態的特征。假設[U1,U2,…,Un]代表sMRI的特征,[V1,V2 ,…,Vm]代表PET的特征,βsMRI,βPETI分別為sMRI和PET特征的權重系數,其融合方法為[βsMRI×U1,βsMRI×U2,…,βsMRI×Un,βPET×V1,βPET×V2,…,βPET×Vn],約束條件為:βsMRI+βPET=1,其中βsMRI,βPET的范圍在之間,以每步0.1增加或減少權重系數,測試權重組合的每一種可能情況。
PCA是將原始數據中具有相關性的成分重新組合成一組新的不相關綜合成分,是考察多個變量間相關性的一種多元統計方法。即從原始變量中導出少數幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關。PCA可用于將高維數據表示成低維數據并且盡可能保留原數據信息,從而達到數據降維的目的[19]。
1.5 支持向量機分類
SVM 的精髓在于基于結構風險最小化的思想,將函數集構造為一個函數子集序列,使各個子集按照VC維(Vapnik-Chervonenkis Dimension)的大小排列,在每個子集中尋找最小經驗風險并考慮子集間的折中經驗風險和置信范圍。本文研究的是兩類分類問題,即AD組和HC組分類、MCI組和HC組分類。針對兩類樣本線性可分的情況,可以得到分類平面如式(4),其中“·”表示向量的點積,首先需要對它進行歸一化,使得對線性可分的樣本集(xi,yi),i=1,2,…,n,x∈Rd,yi∈{+1,-1},其中,HC樣本的標簽為-1,而AD或MCI的標簽為+1。當滿足式(5)時,分類間隔為2/‖w‖,使間隔最大等‖w‖2價于使最小,而使1/2‖w‖2最小的平面就是需要的最佳分類面。
$X·W+b=0 ,$ |
${{y}_{i}}[(w\cdot {{x}_{i}})+b]-1\ge 0\text{ },$ |
在實際實驗中,樣本具有線性不可分特性,此時用上述線性可分的方法就不能達到分類間隔最大的要求。針對這種情況,可以通過非線性變換將非線性分類問題推廣到高維空間的線性分類問題,即通過核函數K(xi,xj)=〈Φ(xi)·Φ(xj)〉將非線性映射到高維特征空間中,然后在高維特征空間中即可進行線分類[20-23]。此時的目標函數為
$Q(\alpha )=\sum\limits_{i=1}^{n}{{{\alpha }_{i}}-\frac{1}{2}}\sum\limits_{i,j=1}^{n}{{{\alpha }_{i}}{{\alpha }_{j}}{{y}_{i}}{{y}_{j}}K({{x}_{i}},{{x}_{j}})}\text{ },$ |
而最優分類函數變為:
$f\left( x \right)=sgn(\sum\limits_{i=1}^{n}{{{\alpha }_{i}}^{*}}{{y}_{i}}K({{x}_{i}},x)+{{b}^{*}})$ |
最后根據實驗的實際情況選擇不同的核函數,并通過調節SVM中的各種性能參數,發現默認情況下的核函數將AD、MCI從HC中正確分開的效果最佳。
2 實驗結果
2.1 影像獨立成分提取
本文運用Infomax ICA 算法分別提取預處理后的sMRI和PET影像的特征并構建特征矩陣。通過每次增加5個獨立成分數的方式進行試驗,當獨立成分數取100時,單模態的分類效果最好。其中空間Infomax ICA分解情況如圖 4所示,ICi(i=1,…,L)代表第i個獨立的源影像,即影像獨立成分,或稱圖像基。

此處以PET影像中的一個MCI樣本為例,其中所有的源影像之間在統計上是盡可能獨立的,MCI影像是由L個獨立的源影像線性組合而成。
2.2 分類結果
首先,本文用Infomax ICA對sMRI和PET分別進行特征提取,然后利用SVM分別基于單個模態特征對樣本分類。其中隨機選取樣本的50%用于訓練分類模型,剩余的50%樣本用于測試,重復100次獲得分類結果并取其均值。然后利用權重結合的策略將兩種模態的特征進行融合,通過PCA方法來降低特征的維數,再重復上述分類過程。分類結果中的準確度、敏感度和特異度的計算方法為
$\begin{align} & 準確度=\left( TP+TN \right)/\left( TP+FP+TN+FN \right)~, \\ & 敏感度=TP/\left( TP+FP \right)~, \\ & 特異度=TN/\left( TN+FN \right)~, \\ \end{align}$ |
其中 TP表示正確分類得到的標簽為+1的正樣本個數,TN表示正確分類得到的標簽-1的負樣本個數,FP表示誤將標簽為-1的樣本統計為標簽+1的樣本個數,FN表示誤將標簽為+1的樣本統計為標簽-1的樣本個數。分類結果如圖 5所示,AD和HC的分類:當βsMRI=0.1,βPET=0.9時,選取的主成分數為105時的分類效果最好,其分類準確度為93.75%、敏感度為100%、特異度為87.64%。而MCI和HC的分類:當βsMRI=0.2,βPET=0.8時,選取的主成分數為192時分類效果最好,其準確度為89.35%、敏感度為81.85%、特異度為99.36%。

3 總結
本文從雙模態的角度出發研究AD、MCI與HC的分類。在AD與HC單模態影像的分類實驗中,取得的最高分類準確度為89.31%,而雙模態影像方法獲得的分類準確度為93.75%,僅從分類準確度而言,相比于單模態影像的分類實驗結果,雙模態方法的分類準確度提高了4.44%。在MCI與HC的單模態影像的分類實驗中,取得的最高分類準確度為78.5%,而雙模態影像方法的獲得的分類準確度為89.35%,比基于單模態特征的分類準確度提高了10.85%。
通過對比上述的單雙模態影像的分類結果可知,本文提出的雙模態影像分類結果明顯優于基于單模態特征的結果。同時與相關研究比較,Zhang等[24]感興趣區與多核函數結合的SVM分類方法獲得的雙模態影像AD與HC分類準確度為90.6%、敏感度為90.5%及特異度為90.7%,雙模態影像MCI與HC分類準確度為76.4%、敏感度為81.8%及特異度為66.0%。Hinrichs等[25]提出的多核學習方法分類雙模態影像(sMRI和PET影像)AD與HC分類準確度為81.00%、敏感度為78.52%及特異度為81.76%。與之相比,本文的雙模態影像AD、MCI與HC分類準確度分別為93.75%、89.35%,其分類準確度更高,效果更好。而造成上述結果差異的原因有多種:通常樣本數據越大實驗結果越好,受條件限制,實驗中并沒有采用較多數量的樣本,但小樣本量也可能對結果產生影響;其次,實驗方法的不同對實驗結果的影響很大。本文通過Infomax ICA分別提取sMRI和PET影像的特征,并采用權重結合的策略融合兩種影像的特征,最后利用SVM對雙模態特征進行分類,得到了比較滿意的結果,也為今后AD及MCI的診斷準確度提高奠定基礎。下階段將對MCI患者向AD患者轉變進行預測,從而提前預防AD的發生。