針對阿爾茨海默病(AD)早期階段分類這一研究難題,傳統的線性特征提取算法很難從其高維特征中挖掘出鑒別能力較強的信息來有效地表示樣本特征。因此,本文采用監督局部線性嵌入(SLLE)特征提取算法,對 412 例受試者的大腦皮質厚度(CTH)和腦感興趣區域體積(VOI)特征進行提取,減少其冗余特征以提高識別精度。受試者來源于阿爾茨海默病神經影像學(ADNI)數據集,包含 93 例穩定型輕度認知障礙(sMCI)、96 例遺忘型輕度認知障礙(aMCI)、86 例 AD 患者和 137 例認知正常對照老年人(CN)樣本。本文采用的 SLLE 算法是通過添加距離修正項來計算每個樣本點的近鄰點,并用近鄰點線性表示樣本,得到局部重建權值矩陣,進而求出高維數據的低維映射。為驗證該算法在分類識別中的有效性,本文將主成分分析(PCA)、近鄰最小最大投影(NMMP)、局部線性映射(LLE)及 SLLE 等特征提取算法分別與支持向量機(SVM)分類器組合,對 CN 與 sMCI、CN 與 aMCI、CN 與 AD、sMCI 與 aMCI、sMCI 與 AD 和 aMCI 與 AD 六組實驗數據進行分類識別。結果顯示,以 VOI 為特征,利用 SLLE 和 SVM 的復合算法對 sMCI 和 aMCI 的分類準確度、靈敏度、特異性分別為 65.16%、63.33%、67.62%,基于 LLE 和 SVM 的復合算法分類結果分別為 64.08%、66.14%、62.77%,而基于傳統 SVM 則分別為 57.25%、56.28%、58.08%。經比較,發現 SLLE 和 SVM 組合算法的識別精度較 LLE 和 SVM 的組合算法提高了 1.08%,較 SVM 提高了 7.91%。因此,利用 SLLE 和 SVM 這一復合算法進行分類識別更有利于 AD 的早期診斷。
引用本文: 趙海峰, 葛園園, 王政. 基于監督局部線性嵌入方法的阿爾茨海默病磁共振成像分類研究. 生物醫學工程學雜志, 2018, 35(4): 613-620. doi: 10.7507/1001-5515.201703002 復制
引言
阿爾茨海默病(Alzheimer’s disease,AD)是老年人常見的慢性神經變性病,主要表現為記憶力及其他認知功能減退[1]。介于 AD 與正常老化(cognitive normal,CN)之間的一種臨床狀態稱之為輕度認知障礙(mild cognitive impairment,MCI)。MCI 分為兩種,一種是后期極有可能惡化成 AD 的稱之為遺忘型輕度認知障礙(amnestic mild cognitive impairment,aMCI),另一種是后期不會繼續惡化成 AD 的稱之為穩定型輕度認知障礙(stable mild cognitive impairment,sMCI)。目前,MCI 并無有效的治療方法,只能通過采取干預措施來延緩 MCI 向 AD 的轉變。由于個體差異,MCI 個體轉換為 AD 的具體機制尚未明了,而且在醫學圖像識別領域中,sMCI 和 aMCI 二者具有較高的相似性,傳統的圖像分類算法難以較好地進行區分。因此,從 MCI 中識別出最易進展為 AD 的 aMCI 患者成為臨床上采取干預措施延緩病情的關鍵點。
目前,在 AD 計算機輔助診斷研究方面,研究者通常以 AD 的神經影像學標準數據集(Alzheimer’s Disease Neuroimaging Initiative database,ADNI)[2]作為實驗數據。該數據集不僅包含磁共振成像(magnetic resonance imaging,MRI)和正電子放射技術(positron emission technology,PET)等多種常見的醫學影像模態數據,還包含非成像的腦脊液(cerebrospinal fluid,CSF)生物標記物以及簡易精神狀態量表(Mini-Mental State Examination,MMSE)等數據。其中,結構核磁共振(structural MRI,sMRI)具有圖像清晰精細、對軟組織分辨率高、解剖組織關系明確及對人體沒有損害的特點,被廣泛應用于 AD 早期診斷的影像研究中[3]。醫學研究表明,腦部組織結構中大腦皮質厚度(cortical thickness,CTH)變薄和腦感興趣區域體積(volume of interest,VOI)的萎縮,可以作為識別輕度阿爾茨海默病性癡呆的可靠標記[4]。然而,提取的 CTH 和 VOI 特征數據維數都很高,這些高維數據并非都與疾病相關,存在大量的冗余信息。MCI 的異質性也使 aMCI 患者與 sMCI 患者的腦部結構改變極為相似,直接使用這些高維且相似的特征對其進行分類研究,效果并不是很好。因此,目前對 AD 計算機輔助診斷的研究重點集中在特征提取上,即從這些高維且相似的特征中提取出更有鑒別能力的信息,以改善 AD 早期階段的分類效果。
針對一般數據的特征提取方法,最為典型的有主成分分析(principal component analysis,PCA)[5]和獨立成分分析(independent component analysis,ICA)[6]等線性的特征提取方法。這些算法都是將原始的高維特征投影至具有較好分類性能的低維矢量空間,提取鑒別性強的信息,并可達到降低維數以減少計算量的效果。然而,這些算法忽略了 AD 特征間不一定符合簡單的線性變換這一特性,導致其在 AD 早期分類方面的改善不是很顯著。于是,研究者開始關注非線性特征提取方法。目前最具代表性的有等距映射(isometric mapping,ISOMAP)和局部線性映射(locally linear embedding,LLE)[7]等方法。Liu 等[8]和 Luo 等[9]提出,將 LLE 算法應用于 AD 特征提取的研究中,并結合線性支持向量機(support vector machine,SVM)[10]進行分類驗證。盡管,基于 LLE 和 SVM 的復合算法對 AD 早期階段的分類精度有明顯提高,但由于該算法沒有利用樣本的標簽信息,使其在 AD 早期階段分類方面很難取得最優效果。
因此,本文采用一種有監督的局部線性嵌入(supervised locally linear embedding,SLLE)[11]和 SVM 的組合算法來對 AD 不同階段進行分類。SLLE 算法不僅可以減少特征中存在的冗余信息,保持原數據的潛在流形結構,還可以利用標簽信息不斷地優化損失函數,從而能夠得到最優的轉換矩陣,以達到類間離散的降維效果。為了進一步驗證 SLLE 方法的有效性,本文提出將近鄰最小最大投影(Neighborhood MinMax Projections,NMMP)[12]算法作為對比方法。NMMP 算法可以處理比高斯分布復雜的數據,同時避免了傳統特征提取方法[13-14]從整體線性分布來分析數據這一缺點,也有著“類內聚集,類間離散”的優點。
1 SLLE 算法
SLLE 算法源于 LLE 無監督降維方法,其基本思想是:在數據整體呈非線性分布而局部意義上呈線性結構時,通過添加距離修正項來增大異類鄰近樣本點的歐式距離,并用求得的局部近鄰點線性表示樣本,以保證數據內在低維結構所蘊含的整體幾何規律不變。已知 n 個輸入向量組成的輸入矩陣
,其中 n 是樣本個數,d 是特征維數,同時給定近鄰點個數 k,降至低維空間的維數 m 和修正參數 α。SLLE 算法可以歸結為如下幾步:① 添加距離修正項得到樣本修正后的距離矩陣,并從中找出 k 個近鄰點;② 根據這 k 個近鄰點線性組合來表示高維空間樣本點,即可得到局部線性權值矩陣 W;③ 用得到的 W 計算出映射到 m 維空間的
,其中
。具體算法步驟如下。

(1)訓練樣本距離矩陣
首先,計算高維空間中訓練樣本點的歐氏距離,通過給定的 k 值,可以找出樣本點 xi 的 k 個近鄰點,xij 表示 xi 的第 j 個近鄰點。如圖 1 所示,其近鄰點并不一定為同類樣本,為使近鄰點為同類樣本,SLLE 算法根據樣本標簽信息對異類近鄰點進行距離修正,其距離修正公式如式(1)所示:
![]() |
其中,D 為修正前樣本間的歐氏距離矩陣。
為修正矩陣,用于區分樣本點之間的異同性,若 xi 和 xij 為異類,則
,如果是同類,則
。α 取值范圍為[0,1],用來調節修正距離的程度。當 α = 0,此時 SLLE 等同于 LLE 算法;當 α = 1時,同類樣本間距離不變,而異類樣本距離明顯擴大,可能會使數據的拓撲結構發生改變;因此,一般情況下
,即通過對 D 添加適當程度的修正量,來分離不同類別的數據,以保證在同類中尋找近鄰點,盡量地保留數據的潛在流形結構。 D’ 是修正后的距離矩陣。
(2)局部重建權值矩陣
根據修正后的距離矩陣 D’ 找到每個樣本點的 k 近鄰點,數據分布在局部呈線性結構,故對每個樣本點可用其 k 個近鄰點局部線性表示,即可求出局部重建權值矩陣 W。其代價函數如式(2)所示:
![]() |
其中,wij 表示 xi 與 xij 兩樣本點間的權值關系,當 xi 和 xij 不是近鄰點時,wij = 0;W 是由 wij 構成的權值矩陣,表示近鄰點對重構樣本點做出的貢獻,且滿足歸一化約束
。對式(2),我們可通過拉格朗日乘數法來求解式中的局部重建權值矩陣 W。
(3)低維映射 Y
求出局部重建權值矩陣 W 后,在低維空間中保持每個鄰域中的權值不變,從而保證數據保留原有的拓撲結構。其損失函數如式(3)所示:
![]() |
對式(3)求最優解,則需要滿足平移不變這一性質,同時要避免平凡最優解的產生,其約束條件具體如下式所示:
![]() |
![]() |
其中,
是單位矩陣。因此,求解 Y 的式(3)就可以簡化成式(6):
![]() |
式中,
。對式(6)求最優解 Y,本質上就是求解特征值和特征向量的問題。而所需要求解的低維映射 Y 實際是 M 中第 2 個到 m + 1 個最小特征值對應的特征向量,此時除去了 M 的第一個零特征值。
2 SLLE 算法應用于 ADNI 數據
2.1 SLLE 算法的實驗流程
采集 DICOM 格式的 sMRI 數據,并用 FreeSurfer 軟件對原始 MRI 圖像進行預處理,得到具有醫學意義的 CTH 和 VOI 兩組特征。由于提取的原始特征維度較高且含有冗余信息,為了去除冗余信息和減少噪聲,需要對這些特征進行特征提取來提高分類精度。而傳統的基于線性的特征提取方法都忽略了 AD 早期階段數據呈非線性分布的特點。對此,有研究者提出將 LLE 這一非線性局部線性映射方法應用于 AD 早期階段的分類研究中,并取得了較好的效果。但該方法沒有利用數據標簽信息,使得其在 AD 早期階段分類精度達不到最優。因此,本文將 SLLE 算法應用于 AD 不同階段的二分類研究中,并與傳統線性特征提取算法、NMMP 算法及 LLE 算法進行對比,同時結合線性 SVM 分類器進行分類實驗及驗證。實驗的詳細流程如圖 2 所示。

2.2 實驗數據的獲取
本文實驗所用數據源于 ADNI 標準數據集(www.loni.ucla.edu/ADNI),所選用的 MRI 檢查方法是采用標準化西門子 1.5 T 的磁共振,所用序列是 T1 加權 MRI 成像系統三維磁化準備快速梯度回波成像(Magnetization Prepared Rapid Gradient Echo Imaging,MP-RAGE)序列(TE = 3.92 ms,TR = 8.99 ms,反轉角 = 8°,標稱分辨 = 0.94 mm × 0.94 mm × 1.2 mm)。本文采用 412 個受試者的 sMRI 數據進行實驗和分析,包括 137 例連續 3 年跟蹤測試認知正常的老人(CN 組)、93 例連續 3 年跟蹤測試的 sMCI 患者、96 例 aMCI 患者,以及 86 例連續 2 年跟蹤測試的 AD 患者。被試者具體統計學特征描述如表 1 所示。



2.3 圖像的預處理
在 ADNI 數據集上獲取 412 例個體的 sMRI 圖像,對圖像進行預處理提取具有研究意義的特征。首先,將 MP-RAGE 數據放入 Linux 操作系統中版本 4.4 的 FreeSurfer[15]軟件(http://surfer.nmr.mgh.harvard.edu/),進行圖像校正、顱骨剝離和腦組織分割,以去除非腦結構,得到灰質、白質、腦脊液等,同時為增強統計分析的能力,本文進行了表面平滑及圖像重建等步驟,并基于網格表面對大腦皮層進行厚度測量[16]。每個被試者經過 FreeSurfer 軟件處理分析后,得到 68 個相關腦區的平均皮層厚度和 94 個自動標記感興趣區域的灰質體積值,將其作為特征向量來進行模式識別分析。
3 實驗結果和分析
3.1 可視化分析
為了驗證 SLLE 有“類間離散”的降維效果,本文將 SLLE 算法與 LLE 算法進行可視化對比分析。圖 3 給出了以皮層厚度和感興趣區域體積結合作為原始特征,對 sMCI 和 aMCI 兩類樣本進行降維的可視化分析圖。其中,圖 3a 給出了基于 LLE 算法(k = 18)對 sMCI 和 aMCI 兩類樣本進行維數約簡的二維可視化結果,圖 3b 給出了基于 SLLE(k = 25,α = 0.1)算法的實驗結果,兩組間比較,SLLE 的離散效果優于前者。其中,以 sMCI 中的 023_S_0376 個體和 aMCI 中的 052_S_0952 個體為例,與 LLE 這一非線性特征提取方法相比,SLLE 所提取的特征的類間距離更大、分類效果更為顯著。

a. LLE 算法;b. SLLE 算法
Figure3. Visualization of sMCI and aMCI samples reduced to two dimensionsa. LLE algorithm; b. SLLE algorithm
3.2 不同特征提取方法的分類結果比較
為了充分驗證 SLLE 方法的有效性,本文實驗中分別將感興趣體積、皮層厚度及兩者的結合作為特征向量,并用不同的特征提取方法與線性 SVM 結合,進行兩兩分類的結果比較。本文實驗結果是取多次實驗的平均值,其計算結果包含了準確率(被正確分類的個體占總數的比例)、靈敏度(被正確分類的正例占所有正例的比例)和特異性(被正確分類的負例占所有負例的比例)[17]。本文對 AD 不同階段進行分類的結果如表 2 和表 3 所示。


如表 3 所示,基于感興趣區域體積特征對 sMCI 和 aMCI 進行二分類時,利用 SLLE 和 SVM 的復合算法所得結果的準確度為 65.16%、靈敏度為 63.33%、特異性為 67.62%,基于 LLE 和 SVM 的復合算法的實驗結果分別為 64.08%、66.14%、62.77%,而基于傳統 SVM 則分別為 57.25%、56.28%、58.08%。比較發現,SLLE 算法的識別精度較 LLE 提高了 1.08%,較 SVM 提高了 7.91%,其中 SLLE 算法所涉及的參數具體為 k = 15,m = 9,α = 0.8。從表中可以看出,基于 sMRI 單模態數據對 sMCI 和 aMCI 進行二分類時,采用 PCA 這一傳統線性變換特征提取方法,不能很好地表示數據的高維特征間的關系,與基于原始特征對 AD 不同階段進行線性 SVM 分類比較,其分類精度并沒有明顯提升。此外,雖然 NMMP 具有“類內聚集,類間離散”的優點,但由于其近鄰選擇不準確且對噪聲敏感,使得該方法應用在 AD 不同階段的分類時,效果較 PCA 并沒有什么改善。而基于無監督的局部線性嵌入 LLE 這一非線性特征提取方法,能保留原始數據的潛在拓撲結構,而且滿足 AD 不同階段特征的整體非線性、局部線性分布的特點,使得其分類性能明顯優于基于線性特征提取的 PCA 和 NMMP 算法。但由于 LLE 沒有充分利用標簽屬性,使其對 AD 不同階段的二分類效果達不到最優。而基于 SLLE 算法對 AD 不同階段的分類研究,不僅保留了 LLE 算法提取數據潛在的拓撲結構的優點,還彌補了 LLE 未利用標簽信息的缺點,盡可能地做到了“類間離散”。
為了更直觀地分析實驗結果來驗證 SLLE 算法的有效性,本文將表 2、表 3 中基于兩特征結合得到的部分結果進行 ROC 曲線分析,如圖 4 所示。ROC 曲線是用構圖法揭示敏感性和特異性的相互關系,以靈敏度為縱軸,1-特異性為橫軸,曲線下面積越大,診斷準確性越高。如圖 4b 所示,SLLE 方法對 sMCI 和 aMCI 進行分類得到的 ROC 曲線更靠近左上角,其曲線下面積為 0.65。與傳統線性的特征提取算法與 SVM 結合的復合算法以及 LLE 算法與 SVM 結合的復合算法相比,基于 SLLE 和 SVM 的組合算法對 sMCI 和 aMCI 進行二分類的準確性更高。而臨床上進行疾病不同階段的診斷是一個多分類問題,對此,我們可以將一個多分類問題轉換成多個二分類問題,即可以用二分類算法先判斷該個體是否患病,若患病再進一步判斷是 AD 還是 MCI,若是 MCI 的可能性較大,再判斷是 sMCI 還是 aMCI。

a. CN
a. CN
4 總結
針對 AD 早期階段分類的研究難點,本文提出應用 SLLE 這一非線性降維算法進行特征提取,通過實驗發現該算法可以有效地提高 AD 早期階段分類的精度。與傳統的線性降維不同,當高維數據整體分布呈非線性時,SLLE 可以很好地保留數據的潛在流形結構;與非線性降維 LLE 算法也有所不同,SLLE 利用數據的標簽信息來修正距離矩陣,可擴大不同類鄰近點的距離。本文從單模態的角度出發研究 AD 早期階段的分類,以感興趣區域體積為特征,對 sMCI 和 aMCI 進行特征提取和分類時,我們方法的準確率比 LLE 算法提高了 1.08%,達到了 65.16%。與相關研究進行比較,發現就 MRI 單模態進行的 sMCI 和 aMCI 分類中,本文算法的分類效果是較好的。2013 年 Suk 等[18]將原始特征與基于堆棧式自編碼器學習得到的特征相結合,在基于 MRI 單模態進行分類時,其分類精度達到 55.0%。Xu 等[19]在 2015 年基于稀疏表示分類方法對 MRI 單模態稀疏表示分類的研究中,AD 早期階段分類精度達到 50.6%。而造成上述結果差異的原因有:樣本數據量不同,樣本數據的分布也有所不同;而且,不同的實驗方法對實驗結果也有很大影響。因此,下階段我們將考慮結合其他模態數據及特征選擇等方法,提高分類精度,以更好地輔助醫生進行臨床診斷。盡管本文驗證了 SLLE 與 SVM 組合算法在基于 sMRI 單模態數據對 sMCI 和 aMCI 進行二分類的有效性,但在臨床上,識別診斷出 aMCI 階段的患者將是一個多分類問題,日后我們還可以考慮將 SLLE 算法與多分類器進行結合。本文通過交叉驗證實驗來得到 SLLE 算法中的相關參數,增加了實驗的計算量和計算時間。因此,在未來的研究中,我們還將進一步對 SLLE 方法中的參數尋優進行改進,找到一種針對 AD 不同階段的自適應且復雜度較低的尋取最優參數的方法。
引言
阿爾茨海默病(Alzheimer’s disease,AD)是老年人常見的慢性神經變性病,主要表現為記憶力及其他認知功能減退[1]。介于 AD 與正常老化(cognitive normal,CN)之間的一種臨床狀態稱之為輕度認知障礙(mild cognitive impairment,MCI)。MCI 分為兩種,一種是后期極有可能惡化成 AD 的稱之為遺忘型輕度認知障礙(amnestic mild cognitive impairment,aMCI),另一種是后期不會繼續惡化成 AD 的稱之為穩定型輕度認知障礙(stable mild cognitive impairment,sMCI)。目前,MCI 并無有效的治療方法,只能通過采取干預措施來延緩 MCI 向 AD 的轉變。由于個體差異,MCI 個體轉換為 AD 的具體機制尚未明了,而且在醫學圖像識別領域中,sMCI 和 aMCI 二者具有較高的相似性,傳統的圖像分類算法難以較好地進行區分。因此,從 MCI 中識別出最易進展為 AD 的 aMCI 患者成為臨床上采取干預措施延緩病情的關鍵點。
目前,在 AD 計算機輔助診斷研究方面,研究者通常以 AD 的神經影像學標準數據集(Alzheimer’s Disease Neuroimaging Initiative database,ADNI)[2]作為實驗數據。該數據集不僅包含磁共振成像(magnetic resonance imaging,MRI)和正電子放射技術(positron emission technology,PET)等多種常見的醫學影像模態數據,還包含非成像的腦脊液(cerebrospinal fluid,CSF)生物標記物以及簡易精神狀態量表(Mini-Mental State Examination,MMSE)等數據。其中,結構核磁共振(structural MRI,sMRI)具有圖像清晰精細、對軟組織分辨率高、解剖組織關系明確及對人體沒有損害的特點,被廣泛應用于 AD 早期診斷的影像研究中[3]。醫學研究表明,腦部組織結構中大腦皮質厚度(cortical thickness,CTH)變薄和腦感興趣區域體積(volume of interest,VOI)的萎縮,可以作為識別輕度阿爾茨海默病性癡呆的可靠標記[4]。然而,提取的 CTH 和 VOI 特征數據維數都很高,這些高維數據并非都與疾病相關,存在大量的冗余信息。MCI 的異質性也使 aMCI 患者與 sMCI 患者的腦部結構改變極為相似,直接使用這些高維且相似的特征對其進行分類研究,效果并不是很好。因此,目前對 AD 計算機輔助診斷的研究重點集中在特征提取上,即從這些高維且相似的特征中提取出更有鑒別能力的信息,以改善 AD 早期階段的分類效果。
針對一般數據的特征提取方法,最為典型的有主成分分析(principal component analysis,PCA)[5]和獨立成分分析(independent component analysis,ICA)[6]等線性的特征提取方法。這些算法都是將原始的高維特征投影至具有較好分類性能的低維矢量空間,提取鑒別性強的信息,并可達到降低維數以減少計算量的效果。然而,這些算法忽略了 AD 特征間不一定符合簡單的線性變換這一特性,導致其在 AD 早期分類方面的改善不是很顯著。于是,研究者開始關注非線性特征提取方法。目前最具代表性的有等距映射(isometric mapping,ISOMAP)和局部線性映射(locally linear embedding,LLE)[7]等方法。Liu 等[8]和 Luo 等[9]提出,將 LLE 算法應用于 AD 特征提取的研究中,并結合線性支持向量機(support vector machine,SVM)[10]進行分類驗證。盡管,基于 LLE 和 SVM 的復合算法對 AD 早期階段的分類精度有明顯提高,但由于該算法沒有利用樣本的標簽信息,使其在 AD 早期階段分類方面很難取得最優效果。
因此,本文采用一種有監督的局部線性嵌入(supervised locally linear embedding,SLLE)[11]和 SVM 的組合算法來對 AD 不同階段進行分類。SLLE 算法不僅可以減少特征中存在的冗余信息,保持原數據的潛在流形結構,還可以利用標簽信息不斷地優化損失函數,從而能夠得到最優的轉換矩陣,以達到類間離散的降維效果。為了進一步驗證 SLLE 方法的有效性,本文提出將近鄰最小最大投影(Neighborhood MinMax Projections,NMMP)[12]算法作為對比方法。NMMP 算法可以處理比高斯分布復雜的數據,同時避免了傳統特征提取方法[13-14]從整體線性分布來分析數據這一缺點,也有著“類內聚集,類間離散”的優點。
1 SLLE 算法
SLLE 算法源于 LLE 無監督降維方法,其基本思想是:在數據整體呈非線性分布而局部意義上呈線性結構時,通過添加距離修正項來增大異類鄰近樣本點的歐式距離,并用求得的局部近鄰點線性表示樣本,以保證數據內在低維結構所蘊含的整體幾何規律不變。已知 n 個輸入向量組成的輸入矩陣
,其中 n 是樣本個數,d 是特征維數,同時給定近鄰點個數 k,降至低維空間的維數 m 和修正參數 α。SLLE 算法可以歸結為如下幾步:① 添加距離修正項得到樣本修正后的距離矩陣,并從中找出 k 個近鄰點;② 根據這 k 個近鄰點線性組合來表示高維空間樣本點,即可得到局部線性權值矩陣 W;③ 用得到的 W 計算出映射到 m 維空間的
,其中
。具體算法步驟如下。

(1)訓練樣本距離矩陣
首先,計算高維空間中訓練樣本點的歐氏距離,通過給定的 k 值,可以找出樣本點 xi 的 k 個近鄰點,xij 表示 xi 的第 j 個近鄰點。如圖 1 所示,其近鄰點并不一定為同類樣本,為使近鄰點為同類樣本,SLLE 算法根據樣本標簽信息對異類近鄰點進行距離修正,其距離修正公式如式(1)所示:
![]() |
其中,D 為修正前樣本間的歐氏距離矩陣。
為修正矩陣,用于區分樣本點之間的異同性,若 xi 和 xij 為異類,則
,如果是同類,則
。α 取值范圍為[0,1],用來調節修正距離的程度。當 α = 0,此時 SLLE 等同于 LLE 算法;當 α = 1時,同類樣本間距離不變,而異類樣本距離明顯擴大,可能會使數據的拓撲結構發生改變;因此,一般情況下
,即通過對 D 添加適當程度的修正量,來分離不同類別的數據,以保證在同類中尋找近鄰點,盡量地保留數據的潛在流形結構。 D’ 是修正后的距離矩陣。
(2)局部重建權值矩陣
根據修正后的距離矩陣 D’ 找到每個樣本點的 k 近鄰點,數據分布在局部呈線性結構,故對每個樣本點可用其 k 個近鄰點局部線性表示,即可求出局部重建權值矩陣 W。其代價函數如式(2)所示:
![]() |
其中,wij 表示 xi 與 xij 兩樣本點間的權值關系,當 xi 和 xij 不是近鄰點時,wij = 0;W 是由 wij 構成的權值矩陣,表示近鄰點對重構樣本點做出的貢獻,且滿足歸一化約束
。對式(2),我們可通過拉格朗日乘數法來求解式中的局部重建權值矩陣 W。
(3)低維映射 Y
求出局部重建權值矩陣 W 后,在低維空間中保持每個鄰域中的權值不變,從而保證數據保留原有的拓撲結構。其損失函數如式(3)所示:
![]() |
對式(3)求最優解,則需要滿足平移不變這一性質,同時要避免平凡最優解的產生,其約束條件具體如下式所示:
![]() |
![]() |
其中,
是單位矩陣。因此,求解 Y 的式(3)就可以簡化成式(6):
![]() |
式中,
。對式(6)求最優解 Y,本質上就是求解特征值和特征向量的問題。而所需要求解的低維映射 Y 實際是 M 中第 2 個到 m + 1 個最小特征值對應的特征向量,此時除去了 M 的第一個零特征值。
2 SLLE 算法應用于 ADNI 數據
2.1 SLLE 算法的實驗流程
采集 DICOM 格式的 sMRI 數據,并用 FreeSurfer 軟件對原始 MRI 圖像進行預處理,得到具有醫學意義的 CTH 和 VOI 兩組特征。由于提取的原始特征維度較高且含有冗余信息,為了去除冗余信息和減少噪聲,需要對這些特征進行特征提取來提高分類精度。而傳統的基于線性的特征提取方法都忽略了 AD 早期階段數據呈非線性分布的特點。對此,有研究者提出將 LLE 這一非線性局部線性映射方法應用于 AD 早期階段的分類研究中,并取得了較好的效果。但該方法沒有利用數據標簽信息,使得其在 AD 早期階段分類精度達不到最優。因此,本文將 SLLE 算法應用于 AD 不同階段的二分類研究中,并與傳統線性特征提取算法、NMMP 算法及 LLE 算法進行對比,同時結合線性 SVM 分類器進行分類實驗及驗證。實驗的詳細流程如圖 2 所示。

2.2 實驗數據的獲取
本文實驗所用數據源于 ADNI 標準數據集(www.loni.ucla.edu/ADNI),所選用的 MRI 檢查方法是采用標準化西門子 1.5 T 的磁共振,所用序列是 T1 加權 MRI 成像系統三維磁化準備快速梯度回波成像(Magnetization Prepared Rapid Gradient Echo Imaging,MP-RAGE)序列(TE = 3.92 ms,TR = 8.99 ms,反轉角 = 8°,標稱分辨 = 0.94 mm × 0.94 mm × 1.2 mm)。本文采用 412 個受試者的 sMRI 數據進行實驗和分析,包括 137 例連續 3 年跟蹤測試認知正常的老人(CN 組)、93 例連續 3 年跟蹤測試的 sMCI 患者、96 例 aMCI 患者,以及 86 例連續 2 年跟蹤測試的 AD 患者。被試者具體統計學特征描述如表 1 所示。



2.3 圖像的預處理
在 ADNI 數據集上獲取 412 例個體的 sMRI 圖像,對圖像進行預處理提取具有研究意義的特征。首先,將 MP-RAGE 數據放入 Linux 操作系統中版本 4.4 的 FreeSurfer[15]軟件(http://surfer.nmr.mgh.harvard.edu/),進行圖像校正、顱骨剝離和腦組織分割,以去除非腦結構,得到灰質、白質、腦脊液等,同時為增強統計分析的能力,本文進行了表面平滑及圖像重建等步驟,并基于網格表面對大腦皮層進行厚度測量[16]。每個被試者經過 FreeSurfer 軟件處理分析后,得到 68 個相關腦區的平均皮層厚度和 94 個自動標記感興趣區域的灰質體積值,將其作為特征向量來進行模式識別分析。
3 實驗結果和分析
3.1 可視化分析
為了驗證 SLLE 有“類間離散”的降維效果,本文將 SLLE 算法與 LLE 算法進行可視化對比分析。圖 3 給出了以皮層厚度和感興趣區域體積結合作為原始特征,對 sMCI 和 aMCI 兩類樣本進行降維的可視化分析圖。其中,圖 3a 給出了基于 LLE 算法(k = 18)對 sMCI 和 aMCI 兩類樣本進行維數約簡的二維可視化結果,圖 3b 給出了基于 SLLE(k = 25,α = 0.1)算法的實驗結果,兩組間比較,SLLE 的離散效果優于前者。其中,以 sMCI 中的 023_S_0376 個體和 aMCI 中的 052_S_0952 個體為例,與 LLE 這一非線性特征提取方法相比,SLLE 所提取的特征的類間距離更大、分類效果更為顯著。

a. LLE 算法;b. SLLE 算法
Figure3. Visualization of sMCI and aMCI samples reduced to two dimensionsa. LLE algorithm; b. SLLE algorithm
3.2 不同特征提取方法的分類結果比較
為了充分驗證 SLLE 方法的有效性,本文實驗中分別將感興趣體積、皮層厚度及兩者的結合作為特征向量,并用不同的特征提取方法與線性 SVM 結合,進行兩兩分類的結果比較。本文實驗結果是取多次實驗的平均值,其計算結果包含了準確率(被正確分類的個體占總數的比例)、靈敏度(被正確分類的正例占所有正例的比例)和特異性(被正確分類的負例占所有負例的比例)[17]。本文對 AD 不同階段進行分類的結果如表 2 和表 3 所示。


如表 3 所示,基于感興趣區域體積特征對 sMCI 和 aMCI 進行二分類時,利用 SLLE 和 SVM 的復合算法所得結果的準確度為 65.16%、靈敏度為 63.33%、特異性為 67.62%,基于 LLE 和 SVM 的復合算法的實驗結果分別為 64.08%、66.14%、62.77%,而基于傳統 SVM 則分別為 57.25%、56.28%、58.08%。比較發現,SLLE 算法的識別精度較 LLE 提高了 1.08%,較 SVM 提高了 7.91%,其中 SLLE 算法所涉及的參數具體為 k = 15,m = 9,α = 0.8。從表中可以看出,基于 sMRI 單模態數據對 sMCI 和 aMCI 進行二分類時,采用 PCA 這一傳統線性變換特征提取方法,不能很好地表示數據的高維特征間的關系,與基于原始特征對 AD 不同階段進行線性 SVM 分類比較,其分類精度并沒有明顯提升。此外,雖然 NMMP 具有“類內聚集,類間離散”的優點,但由于其近鄰選擇不準確且對噪聲敏感,使得該方法應用在 AD 不同階段的分類時,效果較 PCA 并沒有什么改善。而基于無監督的局部線性嵌入 LLE 這一非線性特征提取方法,能保留原始數據的潛在拓撲結構,而且滿足 AD 不同階段特征的整體非線性、局部線性分布的特點,使得其分類性能明顯優于基于線性特征提取的 PCA 和 NMMP 算法。但由于 LLE 沒有充分利用標簽屬性,使其對 AD 不同階段的二分類效果達不到最優。而基于 SLLE 算法對 AD 不同階段的分類研究,不僅保留了 LLE 算法提取數據潛在的拓撲結構的優點,還彌補了 LLE 未利用標簽信息的缺點,盡可能地做到了“類間離散”。
為了更直觀地分析實驗結果來驗證 SLLE 算法的有效性,本文將表 2、表 3 中基于兩特征結合得到的部分結果進行 ROC 曲線分析,如圖 4 所示。ROC 曲線是用構圖法揭示敏感性和特異性的相互關系,以靈敏度為縱軸,1-特異性為橫軸,曲線下面積越大,診斷準確性越高。如圖 4b 所示,SLLE 方法對 sMCI 和 aMCI 進行分類得到的 ROC 曲線更靠近左上角,其曲線下面積為 0.65。與傳統線性的特征提取算法與 SVM 結合的復合算法以及 LLE 算法與 SVM 結合的復合算法相比,基于 SLLE 和 SVM 的組合算法對 sMCI 和 aMCI 進行二分類的準確性更高。而臨床上進行疾病不同階段的診斷是一個多分類問題,對此,我們可以將一個多分類問題轉換成多個二分類問題,即可以用二分類算法先判斷該個體是否患病,若患病再進一步判斷是 AD 還是 MCI,若是 MCI 的可能性較大,再判斷是 sMCI 還是 aMCI。

a. CN
a. CN
4 總結
針對 AD 早期階段分類的研究難點,本文提出應用 SLLE 這一非線性降維算法進行特征提取,通過實驗發現該算法可以有效地提高 AD 早期階段分類的精度。與傳統的線性降維不同,當高維數據整體分布呈非線性時,SLLE 可以很好地保留數據的潛在流形結構;與非線性降維 LLE 算法也有所不同,SLLE 利用數據的標簽信息來修正距離矩陣,可擴大不同類鄰近點的距離。本文從單模態的角度出發研究 AD 早期階段的分類,以感興趣區域體積為特征,對 sMCI 和 aMCI 進行特征提取和分類時,我們方法的準確率比 LLE 算法提高了 1.08%,達到了 65.16%。與相關研究進行比較,發現就 MRI 單模態進行的 sMCI 和 aMCI 分類中,本文算法的分類效果是較好的。2013 年 Suk 等[18]將原始特征與基于堆棧式自編碼器學習得到的特征相結合,在基于 MRI 單模態進行分類時,其分類精度達到 55.0%。Xu 等[19]在 2015 年基于稀疏表示分類方法對 MRI 單模態稀疏表示分類的研究中,AD 早期階段分類精度達到 50.6%。而造成上述結果差異的原因有:樣本數據量不同,樣本數據的分布也有所不同;而且,不同的實驗方法對實驗結果也有很大影響。因此,下階段我們將考慮結合其他模態數據及特征選擇等方法,提高分類精度,以更好地輔助醫生進行臨床診斷。盡管本文驗證了 SLLE 與 SVM 組合算法在基于 sMRI 單模態數據對 sMCI 和 aMCI 進行二分類的有效性,但在臨床上,識別診斷出 aMCI 階段的患者將是一個多分類問題,日后我們還可以考慮將 SLLE 算法與多分類器進行結合。本文通過交叉驗證實驗來得到 SLLE 算法中的相關參數,增加了實驗的計算量和計算時間。因此,在未來的研究中,我們還將進一步對 SLLE 方法中的參數尋優進行改進,找到一種針對 AD 不同階段的自適應且復雜度較低的尋取最優參數的方法。