為了得到均值漂移的自適應帶寬并更精確地分割出腦部磁共振成像(MRI)的腫瘤,本文提出了一種改進的均值漂移方法。首先利用腦部圖像的空間特征去除MRI圖像中的頭骨,消除頭骨對分割的影響;然后根據腦部不同組織(包括腫瘤)在空間上集聚的特征,利用邊界點得到優化的初始均值以及相應的自適應帶寬,從而提高腫瘤分割的精度。實驗結果表明,與固定帶寬均值漂移算法相比,本文方法分割腫瘤更為精確。
引用本文: 侯曉文, 劉奇. 自適應帶寬均值漂移腦部磁共振成像腫瘤分割. 生物醫學工程學雜志, 2014, 31(5): 1001-1004,1010. doi: 10.7507/1001-5515.20140188 復制
引言
醫學圖像分割對于疾病診斷、手術規劃以及術后評估等至關重要,而腦部腫瘤分割對于腦部腫瘤的診斷和治療更是影響巨大[1]。目前的成像技術中磁共振成像(magnetic resonance imaging,MRI)比計算機斷層掃描(computed tomography,CT)成像能夠獲得更高對比度的腦部圖像[2]。因此國內外許多研究者對腦部MRI腫瘤分割算法進行了深入研究,并取得了很多成果[3-11]。然而由于MRI圖像自身的特征所限,MRI腫瘤的分割仍然面臨著許多問題[12]。目前使用最廣泛的腦部MRI腫瘤分割方法是聚類分割算法,常用的有模糊C均值聚類算法[13-14]和均值漂移聚類分割算法(均值漂移算法)[15]。前者需要預先設定聚類的類數,具有局限性[16],而后者則無須預先設定聚類類數,從而具有更好的適應性,但是它需預先設定固定帶寬,而腦部不同組織成像的灰度跨度不盡相同,若全部設定為同一全局帶寬,必然出現過分割或欠分割。此外,聚類算法還存在一個共同的局限,即分割過程一般只根據灰度特征進行聚類,而不考慮圖像的空間特性。為了解決上述兩個問題,本文提出了一種基于腦部MRI的空間特征確定均值漂移局部自適應帶寬的方法,將空間特性和帶寬自適應性加入經典均值漂移算法中,以期取得更為精確的腦部腫瘤分割結果。
1 理論與方法
1.1 濾波
眾所周知,原始MRI圖像中必然存在一定量的噪點[17]。為了降低噪聲對分割的影響,得到更好的分割結果,首先要對圖像進行濾波。普通濾波算法容易導致圖像邊界的模糊,影響后續對圖像進行分割的精確度[18]。因此,可采用雙邊濾波算法進行濾波,雙邊濾波在一定程度上凈化了圖像,同時圖像的邊界得到了較好的保留[19]。原始圖像與濾波后的圖像分別如圖 1所示。

1.2 去除頭骨
頭骨、正常腦組織以及腦部腫瘤三者成像,在灰度上可能會有部分重疊[20]。均值漂移算法作為一種聚類方法,灰度特征是其主要的分割依據,灰度重疊會對分割效果產生較大地影響,因此盡可能降低灰度重疊的可能性將得到更好的分割效果。正常腦部組織結構復雜,在圖像處理技術上難以分割,而頭骨相對簡單,且在圖像上始終處于最外圍,因此先將濾波后的腦部MRI圖像去除頭骨之后再進行分割[21]。方法如下:
首先將腦部MRI二值化,得到圖 2。二值化后的圖像、頭骨以及正常腦組織像素值為1,其余的點的像素值為0。頭骨在外圍形成一個有一定厚度的1像素環。該環的外圍像素值全為0,其內側一定寬度像素范圍內的點像素值也是0。這一特征為標記頭骨提供了條件,如圖 2所示。

其次,標記頭骨。根據上述觀察到的特征,對二值化后的腦部圖像進行逐行掃描,每行像素掃描兩次。第一次,從左到右。掃描開始時遇到的點像素值應為0,隨著掃描點的右移,最終會到達頭骨的左邊界點,此時像素值變為1。掃描點繼續右移,由于頭骨有一定寬度,因此在一定移動范圍內像素值保持為1不變。直到掃描點移到頭骨內側與腦組織之間的空隙處,像素值又變為0。從像素值變為1的像素點開始標記,到像素值變為0時停止標記,同時停止從左到右的掃描,完成腦組織左側一行頭骨的標記。第二次,從右到左。掃描開始時遇到的點像素值也是0,隨著掃描點左移,最終會到達頭骨的右邊界點,此時像素值為1。繼續左移,直到像素值又變為0。整個過程和從左到右掃描相同,標記方法也大致相同,從第一個變為1的像素點開始標記到再次變為0的像素點結束標記,完成腦組織右側同一像素行頭骨的標記。但有時左右側頭骨間并無腦組織而是相互連接的(圖 2最上部的頭骨部分),此時右側掃描的結束條件應該改為:遇到已經標記過的像素點。綜上,通過對一行像素的兩次掃描,即可標記該行像素中包含的所有頭骨像素點。逐行進行掃描標記,即可完成對全部頭骨的標記。由于是對每行像素分別掃描,還可通過并行程序提高處理速度。

最后,去除頭骨。將濾波后的腦部MRI圖像與標記了像素點的像素值記為0,從而完成頭骨的去除。去除頭骨后的圖像如圖 3所示。
1.3 自適應帶寬均值漂移分割
去除頭骨之后,圖像的結構變得更加簡單,灰度重疊的可能性得到降低[22],為實現更好的分割結果奠定了基礎。根據去除頭骨之后的圖像空間特性可進一步進行自適應帶寬的均值漂移分割。
1.3.1 均值漂移的原理
均值漂移是一種基于模式搜尋的聚類方法,對于給定的N個數據(本文圖像分割問題即為所有的像素值)x1,x2,x3,…,xn,計算帕爾森密度估計值,即
$P(x)=1NΣNi=1k(x-xi),$ |
式中k(x)為核函數,常用的有高斯核函數、均值核函數等。隨機選取一個像素點作為初始均值點yi(0),利用帕爾森密度估計值的梯度▽P[yi(t)]最大值迭代更新均值,直到相鄰的兩次均值的距離小于某一閾值,得到最終的均值聚類中心。與該中心的距離(灰度距離)小于給定帶寬的像素點歸于該類。對未聚類的像素點持續進行上述過程,直到所有像素點都歸于某一類即可完成對圖像的分割。
均值漂移算法能夠自適應地確定聚類的數目,方便圖像的分割[23]。但是為了將非均值中心點歸于某一類,需要給定帶寬。傳統方法是給定一個全局帶寬,嚴重影響了均值漂移的自適應[24]。為此本文提出了基于空間特性的自適應帶寬確定方法。
1.3.2 確定自適應帶寬
已知組成某一組織的所有細胞在空間上是相連的,這一特點反映到圖像上即構成某一組織圖像的各個像素點在空間上是集聚的。圖像上任意一個像素點,要么屬于背景,要么屬于某一組織(包括腦腫瘤)。從均值漂移圖像分割的意義上來講,不同的組織屬于不同的聚類。所以每個聚類的組成像素點是集聚的,背景也屬于一個特定的聚類。因此在進行均值漂移分割時,當通過隨機選取得到一個初始均值中心點時,該點必然屬于某一聚類。組成聚類的像素點是集聚的,所以在所選取點附近范圍內的像素點都將屬于該聚類。同一聚類像素之間的距離(灰度距離)一定小于不同聚類間像素的距離,在邊界處更加明顯[25]。一般而言,在空間上距離均值中心點越遠的點與均值中心之間的灰度差值越大。對于一個特定的聚類,其最優均值中心點應該位于該聚類在圖像上形成的平面圖形的幾何中心上。與幾何中心距離最遠,又屬于該聚類的是靠近邊界的點。因此選取幾何中心與靠近邊界的像素點灰度差值作為相應聚類的帶寬。
1.3.3 具體算法
① 隨機選擇一個點作為初始均值中心點,如圖 4中Y0點。該點必屬于某一聚類。為方便說明,假定該點屬于圖 4中黑色曲線所包圍的部分。 ② 以Y0點為中心,沿上下左右4個方向分別計算該方向上相鄰兩點間的灰度差的絕對值。當某一方向上某一像素點與其后像素點灰度差的絕對值超過該像素點與其前一像素點的灰度差絕對值的k倍(k為一確定實數)時,則認為該點為該方向上的邊界點。4個方向可以得到4個邊界點(E1、E2、E3、E4)。 ③ 計算4個邊界點的坐標均值,即可得到該聚類(或者說組織)的近似幾何中心點(YC點),如圖 4所示。④ 計算③ 中近似幾何中心點與4個邊界點之間灰度差的絕對值。 ⑤ 以③ 中的近似幾何中心點作為初始均值中心點y(0),以④ 中計算得到的灰度差絕對值中的最大者作為相應帶寬d,代入式(1)計算密度及相應梯度,得到下一個均值中心。均值漂移的核函數采用均值核函數。迭代n次,直到前后計算得到的兩個相鄰均值中心的距離小于給定的閾值,此時的均值中心為y(n)。⑥ 計算圖像中所有像素點與y(n)之間的距離,其中距離小于帶寬d的歸為該聚類,其像素值置為y(n),標記該像素點已經分類。 ⑦ 在未被標記的像素點中隨機選擇一個點作為新的初始均值點。 ⑧ 重復② ~⑦ 直到所有的像素點都被標記,分割完成。

2 實驗與結果
根據前文所述方法,在MATLAB 2010環境下編程實現,并對腦部腫瘤患者的MRI圖像進行分割。對10幅腦部MRI圖像分別進行固定帶寬(帶寬為30)的均值漂移分割和自適應帶寬的分割。其中固定帶寬的分割結果如圖 5所示,自適應帶寬的分割結果如圖 6所示。對比分割效果,圖 5中腫瘤與腦組織交界處有較大面積的灰色區域,對比圖 1,可以看出該區域應是腫瘤,即固定帶寬的均值漂移存在欠分割的現象。圖 6對應的灰色區域都變為黑色,欠分割現象得到了明顯改善。


綜上,本文提出的方法能夠利用腦部MRI圖像的空間特征,在隨機選取的初始均值中心點的基礎上,計算出更為合適的初始中心點,并能有效地計算出不同的聚類所對應的自適應帶寬。該方法將空間因素引入聚類分割,提高了均值漂移聚類分割的自適應性和精確度。
3 討論
本文方法實現了均值漂移帶寬的自適應選取,提高了均值漂移分割的精確度。但是分割結果并不完美,還有需要改進的地方。一是利用4個邊界點確定近似幾何中心的方法。如果隨機選擇的初始均值點靠近邊界,或者組織本身形狀比較復雜,有很多的曲折,此時根據該點確定的上下左右4個邊界點的中心點有可能會是靠近邊界而不是幾何中心的點,以此點為近似幾何中心是有失偏頗的。此時計算得到的自適應帶寬與實際的幾何中心點與邊界值之間的灰度差值相差較大。這種情況下得到的自適應帶寬是無效的,分割結果也會出現錯誤。二是本文方法只是在迭代開始時利用空間特征選擇區別與全局固定帶寬的自適應帶寬,而在迭代過程中帶寬不會改變,存在一定的不合理性。本文曾考慮在迭代過程中,根據中心的改變對帶寬也進行相應的改變,但是目前均值漂移算法的收斂性的證明較少[26],帶寬的迭代變化能不能保證均值漂移算法的收斂沒有得到證明。為此下一步將對均值漂移帶寬的自適應選取做深入研究,一方面保證所確定的初始帶寬盡可能靠近最優帶寬,另一方面研究帶寬迭代變化時,均值漂移算法收斂的可能性,以期得到具有更好自適應性的帶寬選取。
引言
醫學圖像分割對于疾病診斷、手術規劃以及術后評估等至關重要,而腦部腫瘤分割對于腦部腫瘤的診斷和治療更是影響巨大[1]。目前的成像技術中磁共振成像(magnetic resonance imaging,MRI)比計算機斷層掃描(computed tomography,CT)成像能夠獲得更高對比度的腦部圖像[2]。因此國內外許多研究者對腦部MRI腫瘤分割算法進行了深入研究,并取得了很多成果[3-11]。然而由于MRI圖像自身的特征所限,MRI腫瘤的分割仍然面臨著許多問題[12]。目前使用最廣泛的腦部MRI腫瘤分割方法是聚類分割算法,常用的有模糊C均值聚類算法[13-14]和均值漂移聚類分割算法(均值漂移算法)[15]。前者需要預先設定聚類的類數,具有局限性[16],而后者則無須預先設定聚類類數,從而具有更好的適應性,但是它需預先設定固定帶寬,而腦部不同組織成像的灰度跨度不盡相同,若全部設定為同一全局帶寬,必然出現過分割或欠分割。此外,聚類算法還存在一個共同的局限,即分割過程一般只根據灰度特征進行聚類,而不考慮圖像的空間特性。為了解決上述兩個問題,本文提出了一種基于腦部MRI的空間特征確定均值漂移局部自適應帶寬的方法,將空間特性和帶寬自適應性加入經典均值漂移算法中,以期取得更為精確的腦部腫瘤分割結果。
1 理論與方法
1.1 濾波
眾所周知,原始MRI圖像中必然存在一定量的噪點[17]。為了降低噪聲對分割的影響,得到更好的分割結果,首先要對圖像進行濾波。普通濾波算法容易導致圖像邊界的模糊,影響后續對圖像進行分割的精確度[18]。因此,可采用雙邊濾波算法進行濾波,雙邊濾波在一定程度上凈化了圖像,同時圖像的邊界得到了較好的保留[19]。原始圖像與濾波后的圖像分別如圖 1所示。

1.2 去除頭骨
頭骨、正常腦組織以及腦部腫瘤三者成像,在灰度上可能會有部分重疊[20]。均值漂移算法作為一種聚類方法,灰度特征是其主要的分割依據,灰度重疊會對分割效果產生較大地影響,因此盡可能降低灰度重疊的可能性將得到更好的分割效果。正常腦部組織結構復雜,在圖像處理技術上難以分割,而頭骨相對簡單,且在圖像上始終處于最外圍,因此先將濾波后的腦部MRI圖像去除頭骨之后再進行分割[21]。方法如下:
首先將腦部MRI二值化,得到圖 2。二值化后的圖像、頭骨以及正常腦組織像素值為1,其余的點的像素值為0。頭骨在外圍形成一個有一定厚度的1像素環。該環的外圍像素值全為0,其內側一定寬度像素范圍內的點像素值也是0。這一特征為標記頭骨提供了條件,如圖 2所示。

其次,標記頭骨。根據上述觀察到的特征,對二值化后的腦部圖像進行逐行掃描,每行像素掃描兩次。第一次,從左到右。掃描開始時遇到的點像素值應為0,隨著掃描點的右移,最終會到達頭骨的左邊界點,此時像素值變為1。掃描點繼續右移,由于頭骨有一定寬度,因此在一定移動范圍內像素值保持為1不變。直到掃描點移到頭骨內側與腦組織之間的空隙處,像素值又變為0。從像素值變為1的像素點開始標記,到像素值變為0時停止標記,同時停止從左到右的掃描,完成腦組織左側一行頭骨的標記。第二次,從右到左。掃描開始時遇到的點像素值也是0,隨著掃描點左移,最終會到達頭骨的右邊界點,此時像素值為1。繼續左移,直到像素值又變為0。整個過程和從左到右掃描相同,標記方法也大致相同,從第一個變為1的像素點開始標記到再次變為0的像素點結束標記,完成腦組織右側同一像素行頭骨的標記。但有時左右側頭骨間并無腦組織而是相互連接的(圖 2最上部的頭骨部分),此時右側掃描的結束條件應該改為:遇到已經標記過的像素點。綜上,通過對一行像素的兩次掃描,即可標記該行像素中包含的所有頭骨像素點。逐行進行掃描標記,即可完成對全部頭骨的標記。由于是對每行像素分別掃描,還可通過并行程序提高處理速度。

最后,去除頭骨。將濾波后的腦部MRI圖像與標記了像素點的像素值記為0,從而完成頭骨的去除。去除頭骨后的圖像如圖 3所示。
1.3 自適應帶寬均值漂移分割
去除頭骨之后,圖像的結構變得更加簡單,灰度重疊的可能性得到降低[22],為實現更好的分割結果奠定了基礎。根據去除頭骨之后的圖像空間特性可進一步進行自適應帶寬的均值漂移分割。
1.3.1 均值漂移的原理
均值漂移是一種基于模式搜尋的聚類方法,對于給定的N個數據(本文圖像分割問題即為所有的像素值)x1,x2,x3,…,xn,計算帕爾森密度估計值,即
$P(x)=1NΣNi=1k(x-xi),$ |
式中k(x)為核函數,常用的有高斯核函數、均值核函數等。隨機選取一個像素點作為初始均值點yi(0),利用帕爾森密度估計值的梯度▽P[yi(t)]最大值迭代更新均值,直到相鄰的兩次均值的距離小于某一閾值,得到最終的均值聚類中心。與該中心的距離(灰度距離)小于給定帶寬的像素點歸于該類。對未聚類的像素點持續進行上述過程,直到所有像素點都歸于某一類即可完成對圖像的分割。
均值漂移算法能夠自適應地確定聚類的數目,方便圖像的分割[23]。但是為了將非均值中心點歸于某一類,需要給定帶寬。傳統方法是給定一個全局帶寬,嚴重影響了均值漂移的自適應[24]。為此本文提出了基于空間特性的自適應帶寬確定方法。
1.3.2 確定自適應帶寬
已知組成某一組織的所有細胞在空間上是相連的,這一特點反映到圖像上即構成某一組織圖像的各個像素點在空間上是集聚的。圖像上任意一個像素點,要么屬于背景,要么屬于某一組織(包括腦腫瘤)。從均值漂移圖像分割的意義上來講,不同的組織屬于不同的聚類。所以每個聚類的組成像素點是集聚的,背景也屬于一個特定的聚類。因此在進行均值漂移分割時,當通過隨機選取得到一個初始均值中心點時,該點必然屬于某一聚類。組成聚類的像素點是集聚的,所以在所選取點附近范圍內的像素點都將屬于該聚類。同一聚類像素之間的距離(灰度距離)一定小于不同聚類間像素的距離,在邊界處更加明顯[25]。一般而言,在空間上距離均值中心點越遠的點與均值中心之間的灰度差值越大。對于一個特定的聚類,其最優均值中心點應該位于該聚類在圖像上形成的平面圖形的幾何中心上。與幾何中心距離最遠,又屬于該聚類的是靠近邊界的點。因此選取幾何中心與靠近邊界的像素點灰度差值作為相應聚類的帶寬。
1.3.3 具體算法
① 隨機選擇一個點作為初始均值中心點,如圖 4中Y0點。該點必屬于某一聚類。為方便說明,假定該點屬于圖 4中黑色曲線所包圍的部分。 ② 以Y0點為中心,沿上下左右4個方向分別計算該方向上相鄰兩點間的灰度差的絕對值。當某一方向上某一像素點與其后像素點灰度差的絕對值超過該像素點與其前一像素點的灰度差絕對值的k倍(k為一確定實數)時,則認為該點為該方向上的邊界點。4個方向可以得到4個邊界點(E1、E2、E3、E4)。 ③ 計算4個邊界點的坐標均值,即可得到該聚類(或者說組織)的近似幾何中心點(YC點),如圖 4所示。④ 計算③ 中近似幾何中心點與4個邊界點之間灰度差的絕對值。 ⑤ 以③ 中的近似幾何中心點作為初始均值中心點y(0),以④ 中計算得到的灰度差絕對值中的最大者作為相應帶寬d,代入式(1)計算密度及相應梯度,得到下一個均值中心。均值漂移的核函數采用均值核函數。迭代n次,直到前后計算得到的兩個相鄰均值中心的距離小于給定的閾值,此時的均值中心為y(n)。⑥ 計算圖像中所有像素點與y(n)之間的距離,其中距離小于帶寬d的歸為該聚類,其像素值置為y(n),標記該像素點已經分類。 ⑦ 在未被標記的像素點中隨機選擇一個點作為新的初始均值點。 ⑧ 重復② ~⑦ 直到所有的像素點都被標記,分割完成。

2 實驗與結果
根據前文所述方法,在MATLAB 2010環境下編程實現,并對腦部腫瘤患者的MRI圖像進行分割。對10幅腦部MRI圖像分別進行固定帶寬(帶寬為30)的均值漂移分割和自適應帶寬的分割。其中固定帶寬的分割結果如圖 5所示,自適應帶寬的分割結果如圖 6所示。對比分割效果,圖 5中腫瘤與腦組織交界處有較大面積的灰色區域,對比圖 1,可以看出該區域應是腫瘤,即固定帶寬的均值漂移存在欠分割的現象。圖 6對應的灰色區域都變為黑色,欠分割現象得到了明顯改善。


綜上,本文提出的方法能夠利用腦部MRI圖像的空間特征,在隨機選取的初始均值中心點的基礎上,計算出更為合適的初始中心點,并能有效地計算出不同的聚類所對應的自適應帶寬。該方法將空間因素引入聚類分割,提高了均值漂移聚類分割的自適應性和精確度。
3 討論
本文方法實現了均值漂移帶寬的自適應選取,提高了均值漂移分割的精確度。但是分割結果并不完美,還有需要改進的地方。一是利用4個邊界點確定近似幾何中心的方法。如果隨機選擇的初始均值點靠近邊界,或者組織本身形狀比較復雜,有很多的曲折,此時根據該點確定的上下左右4個邊界點的中心點有可能會是靠近邊界而不是幾何中心的點,以此點為近似幾何中心是有失偏頗的。此時計算得到的自適應帶寬與實際的幾何中心點與邊界值之間的灰度差值相差較大。這種情況下得到的自適應帶寬是無效的,分割結果也會出現錯誤。二是本文方法只是在迭代開始時利用空間特征選擇區別與全局固定帶寬的自適應帶寬,而在迭代過程中帶寬不會改變,存在一定的不合理性。本文曾考慮在迭代過程中,根據中心的改變對帶寬也進行相應的改變,但是目前均值漂移算法的收斂性的證明較少[26],帶寬的迭代變化能不能保證均值漂移算法的收斂沒有得到證明。為此下一步將對均值漂移帶寬的自適應選取做深入研究,一方面保證所確定的初始帶寬盡可能靠近最優帶寬,另一方面研究帶寬迭代變化時,均值漂移算法收斂的可能性,以期得到具有更好自適應性的帶寬選取。