準確分割肺結節是醫生判定肺癌的重要前提。針對肺結節分割方法的誤分割問題,尤其是難以分離的與胸壁或血管相連的粘連型肺結節的問題,本文提出了一種基于改進的隨機游走算法來準確分割困難肺結節的方法。本文的創新點在于將圖像中節點和種子點的坐標值與空間距離相結合,加入測地線距離來重新定義權值,然后使用改進的隨機游走算法實現了對肺結節的準確分割。本文選取了 17 名不同類型肺結節患者的計算機斷層掃描(CT)圖像進行分割實驗,將實驗結果與傳統隨機游走方法以及幾種文獻方法進行了對比。實驗表明,本文方法在肺結節分割方面具有較好的精度,準確率超過 88%,單張肺結節 CT 圖像分割時間不超過 4 s。結果提示本文方法可用于對肺結節良惡性的輔助診斷,從而提高醫生的工作效率。
引用本文: 劉策, 張花齊, 王洪瑞, 李艷, 王光磊. 基于模糊 C 均值聚類和改進的隨機游走算法的肺結節分割. 生物醫學工程學雜志, 2019, 36(6): 978-985. doi: 10.7507/1001-5515.201811056 復制
引言
肺癌已成為中國男性和女性發病率和死亡率最高的癌癥[1]。肺癌的病理學特征復雜難辨,惡性程度高,早期癥狀不易被發現,大多數肺癌病例是在癌癥已經轉移的情況下被診斷出來的[2]。而肺結節是肺癌的前期表現,在臨床早期醫生可通過肺結節的大小、形狀、紋理等信息來診斷患者的病情,從而及時采取治療手段[3]。早期肺結節常表現為孤立性肺結節(solitary pulmonary nodule,SPN)、與胸壁相連的粘連性肺結節(juxta-pleural nodule,JPN)和毛玻璃型肺結節(ground glass opacity,GGO)。在實際診斷當中,由于肺結節種類的多樣性以及不同患者病情的差異性,使得肺結節的數量、種類、形狀、大小、密度、位置等特征存在較大差異,而醫生受專業經驗的局限、分心或疲勞等不穩定因素影響,可能導致對病情的錯誤診斷。如果能在肺癌早期從計算機斷層掃描(computed tomography,CT)圖像中準確分割出肺結節區域,然后采取正確的治療方案和預后方案,及時進行手術,存活率可以提高 20%[4]。由此可見,早期準確地發現肺結節對肺癌的診斷和治療至關重要。
目前針對 CT 圖像中肺結節的分割研究,學者們提出了多種解決方案。有研究者提出將分水嶺算法(watershed algorithm)和模糊 C 均值(fuzzy c-means,FCM)算法相結合的分割方法,通過 FCM 獲取預分割區域的中心點坐標映射到 CT 圖像中的對應位置,以得到的映射點為種子點利用分水嶺算法完成肺結節的分割[5-6];有研究者使用一種滾球算法(rolling ball algorithm)對 JPN 進行分割,該算法先對肺部 CT 圖像預處理,再用滾球法對肺部掩模進行修復,最后將圖像疊加完成對 JPN 的分割[7-9];有研究者提出了改進的基于局部的和全局隸屬的活動輪廓模型(localized graph-cuts based multiphase active contour model,LGMACM)和改進的基于模糊速度的活動輪廓模型(fuzzy velocity function based on active contour model,FVFACM)來分別分割 GGO 和 JPN 型肺結節[10-12];還有研究者應用基于深度學習的肺結節檢測算法,使用改進的卷積神經網絡來訓練數據集,提取肺結節尺寸、形態、紋理等特征,建立網絡模型從而完成肺結節的檢測和提取[13-14]。
但是,上述這些方法只針對特定類型肺結節的分割。由于肺部區域包含大量血管以及 JPN 型肺結節,并且胸膜與結節和血管具有近似相同的灰度,因此分水嶺方法會誤將血管和胸廓作為肺結節區域,從而產生過分割和誤分割;肺結節大小和形態的多樣性,使得滾球法在處理血管或結節造成的粗分割過程中,很難找到一致尺寸的結構元,降低了分割的準確性;而基于活動輪廓模型的分割方法由于對初始輪廓敏感、分割精度低以及過分依賴梯度信息等,不能對 GGO 型肺結節取得較好的分割效果;基于深度學習的肺結節檢測和分割,雖然能取得較為不錯的結果,但是該算法前提是需要訓練大量帶有注釋的數據集,同時采集特征、算法收斂等都需要耗費大量時間,并且算法復雜,計算量太大。
最近較為流行的隨機游走(random walk,RW)算法在醫學圖像處理方面取得了不錯的成績,基于圖論的隨機游走算法可在盡量減少漏邊界風險的情況下較好地識別弱邊界,且計算簡便、分割速度快,但傳統隨機游走算法需人工設置大量種子點,應用局限性較大[15]。鑒于以上問題,本文提出了一種基于 FCM 聚類和改進的隨機游走算法分割肺結節,擬通過如下途徑改進對肺結節的分割效果:(1)對 FCM 算法進行改進,加入血管特征系數,重新定義 FCM 模糊隸屬度,使與肺結節粘連的血管區域以及肺結節邊緣區域的灰度值得到抑制,增強肺結節的對比度,為后續的準確分割奠定基礎;(2)加入測地線距離來重新定義隨機游走算法的權函數,將點對之間的最短加權距離作為分割目標區域的衡量指標之一,從而避免因圖像強度信息而導致的誤分割。
1 肺結節分割算法
本文提出的肺結節分割算法流程如圖 1 所示。對初始肺結節 CT 圖像使用改進的 FCM 聚類進行預分割,增強灰度值較高的肺結節區域的對比度,降低血管等干擾區域的灰度,同時獲取圖像像素的坐標;然后結合非線性各向異性擴散濾波和形態學方法對圖像濾波去噪,在保證良好輪廓的前提下,去掉肺部區域中的噪聲點及細小血管等無關區域;最后選取隨機游走算法所需的種子點,將圖像中像素點和種子點的空間測地線距離加入到隨機游走算法之中,根據坐標信息計算肺結節區域像素點和種子點的空間最短測地線距離,并將此距離作為隨機游走算法分割的衡量依據,使用隨機游走算法來對像素進行歸類,實現對肺結節的準確分割。

1.1 FCM 聚類算法
本文利用改進的 FCM 聚類算法先對原始圖像進行預分割,通過加入血管特征系數,對模糊隸屬度進行改進,增強肺結節區域的對比度,去除干擾區域的同時最大程度上排除血管的干擾,也更有利于獲取像素坐標來計算測地線距離,提高分割的準確度。
模糊聚類能量函數為:
![]() |
其中 為灰度值
屬于第
類區域的隸屬度,
為隸屬度的加權指數
血管特征系數[16]定義為:
![]() |
規定 ,其中
為血管特征評價,血管特征系數
的引入使血管區域明亮度降低,減小與背景區域的對比度而增強與肺結節的對比度,從而更好地區分肺結節與血管區域。
改進后的模糊隸屬度和聚類中心表達式為:
![]() |
![]() |
FCM 聚類算法的改進如圖 2 所示,圖 2a 中 A-D 為血管區域,E-M 為肺結節區域。當血管區域與肺結節區域灰度值接近時,在分割的時候很容易產生過分割;當加入血管特征系數之后,降低血管區域與背景的對比度,如圖 2b 中的 A-D,當一個像素越接近血管區域,模糊隸屬度 也就越小,當像素屬于血管區域時取得最小值,而非血管區域的模糊隸屬度則幾乎保持不變,最后準確分割出肺結節區域,如圖 2b 中的 E-M。本文使用 FCM 聚類對圖像預分割時設置
能夠取得較好的處理結果,有利于對圖像進一步處理。

a. 傳統 FCM 聚類;b. 加入血管特征系數
Figure2. Improved FCM clustering algorithma. traditional FCM clustering;b. adding vascular characteristic coefficient
1.2 各向異性擴散濾波
Penora 和 Malik 在 1990 年首次將各向異性擴散模型(P-M 模型)作為圖像處理工具應用于圖像分割、圖像增強和圖像去噪等領域[17]。在肺部 CT 圖像中,由于胸壁區域與兩側具有較高的灰度差異,因此使用 P-M 模型對肺 CT 圖像進行濾波去噪的過程當中,能夠在肺區域內部進行平滑去噪,而在有邊緣的地方抑制平滑,相較于高斯濾波、均值濾波等方法,在保證圖像重要特征信息的前提下,能夠更有效地去除噪聲、保留圖像邊緣。非線性各向異性擴散方程:
![]() |
其中 表示待處理圖像,
是散度,
是梯度算子,
表示擴散系數,控制著擴散速率,通常選取圖像梯度函數,這樣在擴散時可以保護到圖像邊緣信息。
表示初始條件。
P-M 邊緣停止函數:
![]() |
![]() |
其中,常數 用來控制對邊緣的靈敏度,通過迭代來對圖像進行平滑去噪,經 50 組實驗測試可知,迭代次數越高,效果越好,但是時間也會相應增加。本文中常數
取 0.15(最大值 0.25),迭代次數為 150。
1.3 形態學方法
本文將形態學[18]開運算與閉運算相結合來使用,根據目標和噪聲的特點,去除噪聲和其他孤立的微小區域的干擾。
1.4 改進隨機游走算法
本文對隨機游走算法進行改進,將測地線距離作為肺結節分割的衡量依據,更準確地判斷出像素點從屬于某一類種子點的概率。在肺結節 CT 數據圖像中存在著較多灰度值與肺結節相似的縱橫交錯的血管區域以及肺結節邊緣毛刺區域,甚至肺結節與胸壁相粘連,這些情況使得基于灰度或者基于歐幾里得距離的隨機游走算法無法取得較好的分割效果,但是圖上的測地線距離則不受此限制[19]。
1.4.1 權值的定義
在肺結節 CT 圖像中,胸壁 JPN 的灰度值與胸壁幾乎是一樣的,如果只根據灰度值信息很難準確地將兩者分開。因此,本文在像素灰度信息的基礎上,將圖像中各像素點的坐標位置信息以及與種子點之間的測地線距離信息加入到權函數中,定義圖像上像素點與種子點之間的測地距,結合坐標信息計算測地距,然后根據圖像灰度和空間最短測地線距離更精確地分割出肺結節[20-22]。
我們定義圖中像素點 與種子點
之間的測地線距離為:
![]() |
其中,,表示路徑
經過像素點
和種子點
連線時,
=1,否則
,且
。
表示連接像素點
和種子點
的所有路徑集,
是一條通過疊加一系列相鄰像素點之間的邊而形成的路徑,即測地線距離是圖中連接空間兩點的最短路徑,在全局性基礎上測地線距離比歐氏距離更好地保持了數據的內部幾何特征。
圖像中像素點 與種子點
的空間測地距相似性定義為:
![]() |
因此,改進后的權函數定義如下:
![]() |
式中 表示像素點
的灰度值,
表示像素點的空間坐標,
表示灰度特征參數,
表示像素幾何距離特征系數,
表示空間測地距的權重。
圖 3 展示了隨機游走算法改進前后分割結果的不同,其中紅點為目標種子點,綠點為背景種子點。在加入測地距之前,只根據圖像的灰度信息來分割肺結節,由于胸壁粘連處灰度值相近,不能得到較好的分割結果,如圖 3 左側所示;在加入測地距之后,在胸壁粘連處,通過判斷圖像像素點與種子點的測地線距離,肺結節區域像素點與目標種子點的連線路徑都在肺結節內部,而背景種子點及之外的像素點與目標種子點的距離要大得多,因此不會產生過分割,如圖 3 右側所示。

1.4.2 求解 Dirichlet
我們將求解隨機游走的概率問題轉化為求解聯合 Dirichlet 問題,圖 的拉普拉斯矩陣
定義為:
![]() |
求解離散狄利克雷問題即求解:
![]() |
1.4.3 隨機游走種子點
本文針對不同類型肺結節的分割難題,將圖像中點對之間的空間信息加入到隨機游走權函數當中,結合像素的灰度信息,利用圖像中像素點與種子點之間的的空間距離來完成分割。在分割難度較大的 JPN(見圖 4a)過程當中,在與胸壁粘連的肺結節之內標記目標種子點,如圖 4b 紅點所示,同時在粘連的胸壁位置以及肺實質低灰度區域設置背景種子點,如圖 4b 綠點所示,充分利用圖像像素點與種子點之間的空間關系。因此,本文在選擇種子點的時候,先對預處理后的圖像進行適當尺寸的形態學膨脹,這時候肺實質邊緣輪廓大于其真實輪廓,如圖 4c 中綠線① 所示,選取邊緣像素點作為背景種子點,并記錄所需像素點及種子點的坐標值;然后進行適當尺寸的形態學腐蝕,此時肺實質邊緣仍大于其真實輪廓,如圖 4c 中紅線② 所示,選取邊緣像素點作為目標種子點可保證肺結節區域存在目標種子點,記錄所需坐標值;最后進行較大尺寸的形態學腐蝕,此時肺實質邊緣輪廓小于其真實輪廓,如圖 4c 黑線③ 所示,選取邊緣像素點作為背景種子點,種子點肯定在 JPN 外部并且在肺實質內部。得到種子點后,利用改進的隨機游走算法,計算分割需要的像素點與種子點的測地線距離,完成對肺結節的準確分割,分割結果如圖 4d 所示。

a. 原始圖像;b. 種子點標記規則;c. 種子點選取;d. 分割結果
Figure4. Seed selection for random walka. original image;b. rules for seed point marking;c. selecting seed point;d. result of segmentation
經試驗反復測試,在選取種子點過程中,本文使用尺度為 4 的結構圓盤對目標區域進行形態學膨脹,形態學腐蝕則選擇尺度為 2 的結構圓盤和尺度為 7 的結構圓盤,以上參數是直接在測試數據集上不斷調整,直至取得最佳分割效果后的結果。
2 實驗結果與性能分析
本文使用的實驗數據圖像一部分由河北大學附屬醫院放射科提供,從 12 名已確診患者的 919 幅肺結節 CT 圖像中,選取包含 74 個不同類型肺結節的圖像進行實驗;另一部分來自公共數據庫——LIDC-IDRI[23-24],從 5 名患者的 1 438 幅肺結節 CT 圖像中,選取包含 112 個不同類型肺結節的圖像進行實驗。本實驗所使用的硬件環境為 Intel(R)Core(TM)i5-7 400HQ CPU,主頻 2.50 GHz,內存 4 GB;軟件環境為 Window 10 操作系統和 Matlab 2014a 開發平臺。
2.1 實驗結果
為評定本文提出的算法的性能,從實驗的 17 名患者中,列舉出 5 位患者的部分肺結節分割結果,并將醫生手動分割金標準、傳統隨機游走算法分割結果與本文算法分割結果進行了對比,下面列出來自河北大學附屬醫院放射科提供的 3 名患者不同類型肺結節 CT 圖像以及 LIDC-IDRI 數據庫中 ID 為 GSM714044 和 GSM714052 的 2 名患者肺結節 CT 圖像的分割結果。5 名患者臨床信息如表 1 所示。

由表 1 可看出,本文所選樣本包含了幾種臨床上常見的病理類型和分期,從而使本文結果更好地與臨床工作相結合。分割結果如圖 5 所示。

由圖 5 中可看以看出,本文算法在不同類型的肺結節上都有明顯優于傳統隨機游走算法的分割結果,更加準確地分割出了肺結節,尤其是 JPN 型肺結節和 GGO 型肺結節。因為傳統隨機游走僅僅考慮像素間的灰度信息,因此對于灰度差別較小的困難型肺結節,不能取得較好的分割結果。本文算法重新定義隨機游走權函數,將像素點與種子點的空間測地距加入到分割過程的衡量中,能夠完成不同類型肺結節的準確分割,使得分割結果更加接近于目標真實區域。
2.2 性能分析
為了對本文提出方法的精度進行評定,本文針對 17 名患者的 186 個肺結節,首先使用杰卡德相似系數對比了不同算法的分割結果,然后對比了不同算法的分割時間和誤分割率[25]。杰卡德系數越接近于 1,表示分割面積重合率越大,分割精度越高。杰卡德相似系數定義為:
![]() |
其中 A 為不同算法的分割結果,B 為醫生手動分割的結果(金標準)。結果如表 2 所示。



從表 2 中可看出,傳統 FCM 聚類算法分割 SPN 的杰卡德系數為 0.649,JPN 為 0.643,GGO 為 0.655,這是由于傳統 FCM 聚類受肺部圖像復雜的背景影響,往往會產生過分割現象。而加入血管特征系數之后的 FCM 算法,能增強肺結節區域相較于背景的對比度,抑制邊緣無關區域的灰度值,能較好地處理因血管、毛刺等因素造成的過分割現象,對 SPN、JPN 和 GGO 的杰卡德系數分別為 0.666、0.675、0.674,證明了本文算法中改進策略的有效性。結果還顯示,本文方法分割 SPN、JPN 和 GGO 的杰卡德系數分別為 0.887、0.877、0.882,相比于傳統隨機游走算法,本文算法的杰卡德相似系數明顯更高,即具有更高的分割精度。為了進一步證明本文方法的實際準確性,表 3 列出了本文算法與文獻[5]、[13]、[18]、[19]在分割精度與分割效率上的對比。



從表 3 可以看出,傳統隨機游走算法受圖像灰度信息的影響,杰卡德系數只有 0.745,同時設置大量的種子點,也在一定程度上增加了分割時間;文獻[5]中的分水嶺算法,由于沒有加入任何針對 JPN 的改進,并且容易受到微小血管的干擾,因此會出現過分割情況,杰卡德系數為 0.715;文獻[13]為最近流行的深度學習算法,通過建立神經網絡,訓練數據集來收集肺結節特征,能夠更加準確地分割出肺結節真實區域,杰卡德系數為 0.924,但是因其訓練數據需要復雜且龐大的計算量,因此分割時間較長;文獻[18]當中的自動隨機游走算法雖然是全自動的,但是只根據圖像像素灰度以及像素點坐標不能完成不同類型肺結節的分割,甚至對于邊緣毛刺較多、周圍有微小血管的肺結節也不能取得較好的分割效果,杰卡德系數為 0.762;文獻[19]基于區域生長算法和形態學,通過手動標記肺結節直徑來分割目標區域,能對 SPN 型肺結節及部分 GGO 型肺結節產生較好的效果,但是仍舊不能對 JPN 型肺結節進行準確分割,杰卡德系數為 0.797;本文算法在分割過程中,針對難以準確分割的 JPN 型肺結節,加入血管特征系數和測地線距離,更好地解決了血管粘連型和胸壁粘連型肺結節,因此可以完成對不同類型肺結節的準確分割,杰卡德系數為 0.882,具有良好分割結果的同時,也具有較好的分割性能,單張肺結節 CT 圖像分割時間不超過 4 s。
為了更好地體現本文算法分割的準確率,將本文算法分別與文獻[5]、[13]、[18]、[19]算法的分割結果進行對比,結果以誤分割率的形式給出[26]。誤分割率定義為:
![]() |
其中,FN(false nodule)表示誤分割的肺結節個數,若肺結節的分割結果出現過分割或者欠分割,都將其歸類于誤分割;TN(true nodule)表示正確分割的肺結節個數,分割結果沒有過分割或者欠分割現象。誤分割率反映了算法模型對肺結節分割精度的優劣。統計結果如表 4 所示。

文獻[13]是基于深度學習的多重卷積神經網絡分割算法,從表 4 中可以看出,它誤分割率較低。但是,該方法分割效率比較差。而本文算法在分割過程中,針對難以準確分割的 JPN 型肺結節,加入血管特征系數和測地線距離,更好地解決了血管粘連型和胸壁粘連型肺結節,因此實現了對不同類型肺結節的準確分割,誤分割率為 10.2%,分割精度大大高于其他分割算法,改進效果明顯。
3 總結
本文提出了一種基于改進的隨機游走算法的不同類型肺結節 CT 圖像的分割方法,通過對隨機游走算法進行改進,充分利用圖像像素與種子點的空間距離關系,加入測地線距離來更加準確地對像素點進行分類,彌補了傳統肺結節分割方法僅僅依據灰度信息或者歐式距離而造成的錯誤分割,保證了準確分割出 CT 圖像上不同類型的肺結節區域。通過將本文算法的分割結果與幾種傳統分割算法以及基于深度學習的神經網絡算法的分割結果進行對比,證明了本文方法不僅提高了分割精度,同時具有較好的分割性能。本文提出的方法能夠為醫生提供不同類型的肺結節真實區域,分割精度較高,可進一步提高醫生對患者病情診斷的準確率。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
肺癌已成為中國男性和女性發病率和死亡率最高的癌癥[1]。肺癌的病理學特征復雜難辨,惡性程度高,早期癥狀不易被發現,大多數肺癌病例是在癌癥已經轉移的情況下被診斷出來的[2]。而肺結節是肺癌的前期表現,在臨床早期醫生可通過肺結節的大小、形狀、紋理等信息來診斷患者的病情,從而及時采取治療手段[3]。早期肺結節常表現為孤立性肺結節(solitary pulmonary nodule,SPN)、與胸壁相連的粘連性肺結節(juxta-pleural nodule,JPN)和毛玻璃型肺結節(ground glass opacity,GGO)。在實際診斷當中,由于肺結節種類的多樣性以及不同患者病情的差異性,使得肺結節的數量、種類、形狀、大小、密度、位置等特征存在較大差異,而醫生受專業經驗的局限、分心或疲勞等不穩定因素影響,可能導致對病情的錯誤診斷。如果能在肺癌早期從計算機斷層掃描(computed tomography,CT)圖像中準確分割出肺結節區域,然后采取正確的治療方案和預后方案,及時進行手術,存活率可以提高 20%[4]。由此可見,早期準確地發現肺結節對肺癌的診斷和治療至關重要。
目前針對 CT 圖像中肺結節的分割研究,學者們提出了多種解決方案。有研究者提出將分水嶺算法(watershed algorithm)和模糊 C 均值(fuzzy c-means,FCM)算法相結合的分割方法,通過 FCM 獲取預分割區域的中心點坐標映射到 CT 圖像中的對應位置,以得到的映射點為種子點利用分水嶺算法完成肺結節的分割[5-6];有研究者使用一種滾球算法(rolling ball algorithm)對 JPN 進行分割,該算法先對肺部 CT 圖像預處理,再用滾球法對肺部掩模進行修復,最后將圖像疊加完成對 JPN 的分割[7-9];有研究者提出了改進的基于局部的和全局隸屬的活動輪廓模型(localized graph-cuts based multiphase active contour model,LGMACM)和改進的基于模糊速度的活動輪廓模型(fuzzy velocity function based on active contour model,FVFACM)來分別分割 GGO 和 JPN 型肺結節[10-12];還有研究者應用基于深度學習的肺結節檢測算法,使用改進的卷積神經網絡來訓練數據集,提取肺結節尺寸、形態、紋理等特征,建立網絡模型從而完成肺結節的檢測和提取[13-14]。
但是,上述這些方法只針對特定類型肺結節的分割。由于肺部區域包含大量血管以及 JPN 型肺結節,并且胸膜與結節和血管具有近似相同的灰度,因此分水嶺方法會誤將血管和胸廓作為肺結節區域,從而產生過分割和誤分割;肺結節大小和形態的多樣性,使得滾球法在處理血管或結節造成的粗分割過程中,很難找到一致尺寸的結構元,降低了分割的準確性;而基于活動輪廓模型的分割方法由于對初始輪廓敏感、分割精度低以及過分依賴梯度信息等,不能對 GGO 型肺結節取得較好的分割效果;基于深度學習的肺結節檢測和分割,雖然能取得較為不錯的結果,但是該算法前提是需要訓練大量帶有注釋的數據集,同時采集特征、算法收斂等都需要耗費大量時間,并且算法復雜,計算量太大。
最近較為流行的隨機游走(random walk,RW)算法在醫學圖像處理方面取得了不錯的成績,基于圖論的隨機游走算法可在盡量減少漏邊界風險的情況下較好地識別弱邊界,且計算簡便、分割速度快,但傳統隨機游走算法需人工設置大量種子點,應用局限性較大[15]。鑒于以上問題,本文提出了一種基于 FCM 聚類和改進的隨機游走算法分割肺結節,擬通過如下途徑改進對肺結節的分割效果:(1)對 FCM 算法進行改進,加入血管特征系數,重新定義 FCM 模糊隸屬度,使與肺結節粘連的血管區域以及肺結節邊緣區域的灰度值得到抑制,增強肺結節的對比度,為后續的準確分割奠定基礎;(2)加入測地線距離來重新定義隨機游走算法的權函數,將點對之間的最短加權距離作為分割目標區域的衡量指標之一,從而避免因圖像強度信息而導致的誤分割。
1 肺結節分割算法
本文提出的肺結節分割算法流程如圖 1 所示。對初始肺結節 CT 圖像使用改進的 FCM 聚類進行預分割,增強灰度值較高的肺結節區域的對比度,降低血管等干擾區域的灰度,同時獲取圖像像素的坐標;然后結合非線性各向異性擴散濾波和形態學方法對圖像濾波去噪,在保證良好輪廓的前提下,去掉肺部區域中的噪聲點及細小血管等無關區域;最后選取隨機游走算法所需的種子點,將圖像中像素點和種子點的空間測地線距離加入到隨機游走算法之中,根據坐標信息計算肺結節區域像素點和種子點的空間最短測地線距離,并將此距離作為隨機游走算法分割的衡量依據,使用隨機游走算法來對像素進行歸類,實現對肺結節的準確分割。

1.1 FCM 聚類算法
本文利用改進的 FCM 聚類算法先對原始圖像進行預分割,通過加入血管特征系數,對模糊隸屬度進行改進,增強肺結節區域的對比度,去除干擾區域的同時最大程度上排除血管的干擾,也更有利于獲取像素坐標來計算測地線距離,提高分割的準確度。
模糊聚類能量函數為:
![]() |
其中 為灰度值
屬于第
類區域的隸屬度,
為隸屬度的加權指數
血管特征系數[16]定義為:
![]() |
規定 ,其中
為血管特征評價,血管特征系數
的引入使血管區域明亮度降低,減小與背景區域的對比度而增強與肺結節的對比度,從而更好地區分肺結節與血管區域。
改進后的模糊隸屬度和聚類中心表達式為:
![]() |
![]() |
FCM 聚類算法的改進如圖 2 所示,圖 2a 中 A-D 為血管區域,E-M 為肺結節區域。當血管區域與肺結節區域灰度值接近時,在分割的時候很容易產生過分割;當加入血管特征系數之后,降低血管區域與背景的對比度,如圖 2b 中的 A-D,當一個像素越接近血管區域,模糊隸屬度 也就越小,當像素屬于血管區域時取得最小值,而非血管區域的模糊隸屬度則幾乎保持不變,最后準確分割出肺結節區域,如圖 2b 中的 E-M。本文使用 FCM 聚類對圖像預分割時設置
能夠取得較好的處理結果,有利于對圖像進一步處理。

a. 傳統 FCM 聚類;b. 加入血管特征系數
Figure2. Improved FCM clustering algorithma. traditional FCM clustering;b. adding vascular characteristic coefficient
1.2 各向異性擴散濾波
Penora 和 Malik 在 1990 年首次將各向異性擴散模型(P-M 模型)作為圖像處理工具應用于圖像分割、圖像增強和圖像去噪等領域[17]。在肺部 CT 圖像中,由于胸壁區域與兩側具有較高的灰度差異,因此使用 P-M 模型對肺 CT 圖像進行濾波去噪的過程當中,能夠在肺區域內部進行平滑去噪,而在有邊緣的地方抑制平滑,相較于高斯濾波、均值濾波等方法,在保證圖像重要特征信息的前提下,能夠更有效地去除噪聲、保留圖像邊緣。非線性各向異性擴散方程:
![]() |
其中 表示待處理圖像,
是散度,
是梯度算子,
表示擴散系數,控制著擴散速率,通常選取圖像梯度函數,這樣在擴散時可以保護到圖像邊緣信息。
表示初始條件。
P-M 邊緣停止函數:
![]() |
![]() |
其中,常數 用來控制對邊緣的靈敏度,通過迭代來對圖像進行平滑去噪,經 50 組實驗測試可知,迭代次數越高,效果越好,但是時間也會相應增加。本文中常數
取 0.15(最大值 0.25),迭代次數為 150。
1.3 形態學方法
本文將形態學[18]開運算與閉運算相結合來使用,根據目標和噪聲的特點,去除噪聲和其他孤立的微小區域的干擾。
1.4 改進隨機游走算法
本文對隨機游走算法進行改進,將測地線距離作為肺結節分割的衡量依據,更準確地判斷出像素點從屬于某一類種子點的概率。在肺結節 CT 數據圖像中存在著較多灰度值與肺結節相似的縱橫交錯的血管區域以及肺結節邊緣毛刺區域,甚至肺結節與胸壁相粘連,這些情況使得基于灰度或者基于歐幾里得距離的隨機游走算法無法取得較好的分割效果,但是圖上的測地線距離則不受此限制[19]。
1.4.1 權值的定義
在肺結節 CT 圖像中,胸壁 JPN 的灰度值與胸壁幾乎是一樣的,如果只根據灰度值信息很難準確地將兩者分開。因此,本文在像素灰度信息的基礎上,將圖像中各像素點的坐標位置信息以及與種子點之間的測地線距離信息加入到權函數中,定義圖像上像素點與種子點之間的測地距,結合坐標信息計算測地距,然后根據圖像灰度和空間最短測地線距離更精確地分割出肺結節[20-22]。
我們定義圖中像素點 與種子點
之間的測地線距離為:
![]() |
其中,,表示路徑
經過像素點
和種子點
連線時,
=1,否則
,且
。
表示連接像素點
和種子點
的所有路徑集,
是一條通過疊加一系列相鄰像素點之間的邊而形成的路徑,即測地線距離是圖中連接空間兩點的最短路徑,在全局性基礎上測地線距離比歐氏距離更好地保持了數據的內部幾何特征。
圖像中像素點 與種子點
的空間測地距相似性定義為:
![]() |
因此,改進后的權函數定義如下:
![]() |
式中 表示像素點
的灰度值,
表示像素點的空間坐標,
表示灰度特征參數,
表示像素幾何距離特征系數,
表示空間測地距的權重。
圖 3 展示了隨機游走算法改進前后分割結果的不同,其中紅點為目標種子點,綠點為背景種子點。在加入測地距之前,只根據圖像的灰度信息來分割肺結節,由于胸壁粘連處灰度值相近,不能得到較好的分割結果,如圖 3 左側所示;在加入測地距之后,在胸壁粘連處,通過判斷圖像像素點與種子點的測地線距離,肺結節區域像素點與目標種子點的連線路徑都在肺結節內部,而背景種子點及之外的像素點與目標種子點的距離要大得多,因此不會產生過分割,如圖 3 右側所示。

1.4.2 求解 Dirichlet
我們將求解隨機游走的概率問題轉化為求解聯合 Dirichlet 問題,圖 的拉普拉斯矩陣
定義為:
![]() |
求解離散狄利克雷問題即求解:
![]() |
1.4.3 隨機游走種子點
本文針對不同類型肺結節的分割難題,將圖像中點對之間的空間信息加入到隨機游走權函數當中,結合像素的灰度信息,利用圖像中像素點與種子點之間的的空間距離來完成分割。在分割難度較大的 JPN(見圖 4a)過程當中,在與胸壁粘連的肺結節之內標記目標種子點,如圖 4b 紅點所示,同時在粘連的胸壁位置以及肺實質低灰度區域設置背景種子點,如圖 4b 綠點所示,充分利用圖像像素點與種子點之間的空間關系。因此,本文在選擇種子點的時候,先對預處理后的圖像進行適當尺寸的形態學膨脹,這時候肺實質邊緣輪廓大于其真實輪廓,如圖 4c 中綠線① 所示,選取邊緣像素點作為背景種子點,并記錄所需像素點及種子點的坐標值;然后進行適當尺寸的形態學腐蝕,此時肺實質邊緣仍大于其真實輪廓,如圖 4c 中紅線② 所示,選取邊緣像素點作為目標種子點可保證肺結節區域存在目標種子點,記錄所需坐標值;最后進行較大尺寸的形態學腐蝕,此時肺實質邊緣輪廓小于其真實輪廓,如圖 4c 黑線③ 所示,選取邊緣像素點作為背景種子點,種子點肯定在 JPN 外部并且在肺實質內部。得到種子點后,利用改進的隨機游走算法,計算分割需要的像素點與種子點的測地線距離,完成對肺結節的準確分割,分割結果如圖 4d 所示。

a. 原始圖像;b. 種子點標記規則;c. 種子點選取;d. 分割結果
Figure4. Seed selection for random walka. original image;b. rules for seed point marking;c. selecting seed point;d. result of segmentation
經試驗反復測試,在選取種子點過程中,本文使用尺度為 4 的結構圓盤對目標區域進行形態學膨脹,形態學腐蝕則選擇尺度為 2 的結構圓盤和尺度為 7 的結構圓盤,以上參數是直接在測試數據集上不斷調整,直至取得最佳分割效果后的結果。
2 實驗結果與性能分析
本文使用的實驗數據圖像一部分由河北大學附屬醫院放射科提供,從 12 名已確診患者的 919 幅肺結節 CT 圖像中,選取包含 74 個不同類型肺結節的圖像進行實驗;另一部分來自公共數據庫——LIDC-IDRI[23-24],從 5 名患者的 1 438 幅肺結節 CT 圖像中,選取包含 112 個不同類型肺結節的圖像進行實驗。本實驗所使用的硬件環境為 Intel(R)Core(TM)i5-7 400HQ CPU,主頻 2.50 GHz,內存 4 GB;軟件環境為 Window 10 操作系統和 Matlab 2014a 開發平臺。
2.1 實驗結果
為評定本文提出的算法的性能,從實驗的 17 名患者中,列舉出 5 位患者的部分肺結節分割結果,并將醫生手動分割金標準、傳統隨機游走算法分割結果與本文算法分割結果進行了對比,下面列出來自河北大學附屬醫院放射科提供的 3 名患者不同類型肺結節 CT 圖像以及 LIDC-IDRI 數據庫中 ID 為 GSM714044 和 GSM714052 的 2 名患者肺結節 CT 圖像的分割結果。5 名患者臨床信息如表 1 所示。

由表 1 可看出,本文所選樣本包含了幾種臨床上常見的病理類型和分期,從而使本文結果更好地與臨床工作相結合。分割結果如圖 5 所示。

由圖 5 中可看以看出,本文算法在不同類型的肺結節上都有明顯優于傳統隨機游走算法的分割結果,更加準確地分割出了肺結節,尤其是 JPN 型肺結節和 GGO 型肺結節。因為傳統隨機游走僅僅考慮像素間的灰度信息,因此對于灰度差別較小的困難型肺結節,不能取得較好的分割結果。本文算法重新定義隨機游走權函數,將像素點與種子點的空間測地距加入到分割過程的衡量中,能夠完成不同類型肺結節的準確分割,使得分割結果更加接近于目標真實區域。
2.2 性能分析
為了對本文提出方法的精度進行評定,本文針對 17 名患者的 186 個肺結節,首先使用杰卡德相似系數對比了不同算法的分割結果,然后對比了不同算法的分割時間和誤分割率[25]。杰卡德系數越接近于 1,表示分割面積重合率越大,分割精度越高。杰卡德相似系數定義為:
![]() |
其中 A 為不同算法的分割結果,B 為醫生手動分割的結果(金標準)。結果如表 2 所示。



從表 2 中可看出,傳統 FCM 聚類算法分割 SPN 的杰卡德系數為 0.649,JPN 為 0.643,GGO 為 0.655,這是由于傳統 FCM 聚類受肺部圖像復雜的背景影響,往往會產生過分割現象。而加入血管特征系數之后的 FCM 算法,能增強肺結節區域相較于背景的對比度,抑制邊緣無關區域的灰度值,能較好地處理因血管、毛刺等因素造成的過分割現象,對 SPN、JPN 和 GGO 的杰卡德系數分別為 0.666、0.675、0.674,證明了本文算法中改進策略的有效性。結果還顯示,本文方法分割 SPN、JPN 和 GGO 的杰卡德系數分別為 0.887、0.877、0.882,相比于傳統隨機游走算法,本文算法的杰卡德相似系數明顯更高,即具有更高的分割精度。為了進一步證明本文方法的實際準確性,表 3 列出了本文算法與文獻[5]、[13]、[18]、[19]在分割精度與分割效率上的對比。



從表 3 可以看出,傳統隨機游走算法受圖像灰度信息的影響,杰卡德系數只有 0.745,同時設置大量的種子點,也在一定程度上增加了分割時間;文獻[5]中的分水嶺算法,由于沒有加入任何針對 JPN 的改進,并且容易受到微小血管的干擾,因此會出現過分割情況,杰卡德系數為 0.715;文獻[13]為最近流行的深度學習算法,通過建立神經網絡,訓練數據集來收集肺結節特征,能夠更加準確地分割出肺結節真實區域,杰卡德系數為 0.924,但是因其訓練數據需要復雜且龐大的計算量,因此分割時間較長;文獻[18]當中的自動隨機游走算法雖然是全自動的,但是只根據圖像像素灰度以及像素點坐標不能完成不同類型肺結節的分割,甚至對于邊緣毛刺較多、周圍有微小血管的肺結節也不能取得較好的分割效果,杰卡德系數為 0.762;文獻[19]基于區域生長算法和形態學,通過手動標記肺結節直徑來分割目標區域,能對 SPN 型肺結節及部分 GGO 型肺結節產生較好的效果,但是仍舊不能對 JPN 型肺結節進行準確分割,杰卡德系數為 0.797;本文算法在分割過程中,針對難以準確分割的 JPN 型肺結節,加入血管特征系數和測地線距離,更好地解決了血管粘連型和胸壁粘連型肺結節,因此可以完成對不同類型肺結節的準確分割,杰卡德系數為 0.882,具有良好分割結果的同時,也具有較好的分割性能,單張肺結節 CT 圖像分割時間不超過 4 s。
為了更好地體現本文算法分割的準確率,將本文算法分別與文獻[5]、[13]、[18]、[19]算法的分割結果進行對比,結果以誤分割率的形式給出[26]。誤分割率定義為:
![]() |
其中,FN(false nodule)表示誤分割的肺結節個數,若肺結節的分割結果出現過分割或者欠分割,都將其歸類于誤分割;TN(true nodule)表示正確分割的肺結節個數,分割結果沒有過分割或者欠分割現象。誤分割率反映了算法模型對肺結節分割精度的優劣。統計結果如表 4 所示。

文獻[13]是基于深度學習的多重卷積神經網絡分割算法,從表 4 中可以看出,它誤分割率較低。但是,該方法分割效率比較差。而本文算法在分割過程中,針對難以準確分割的 JPN 型肺結節,加入血管特征系數和測地線距離,更好地解決了血管粘連型和胸壁粘連型肺結節,因此實現了對不同類型肺結節的準確分割,誤分割率為 10.2%,分割精度大大高于其他分割算法,改進效果明顯。
3 總結
本文提出了一種基于改進的隨機游走算法的不同類型肺結節 CT 圖像的分割方法,通過對隨機游走算法進行改進,充分利用圖像像素與種子點的空間距離關系,加入測地線距離來更加準確地對像素點進行分類,彌補了傳統肺結節分割方法僅僅依據灰度信息或者歐式距離而造成的錯誤分割,保證了準確分割出 CT 圖像上不同類型的肺結節區域。通過將本文算法的分割結果與幾種傳統分割算法以及基于深度學習的神經網絡算法的分割結果進行對比,證明了本文方法不僅提高了分割精度,同時具有較好的分割性能。本文提出的方法能夠為醫生提供不同類型的肺結節真實區域,分割精度較高,可進一步提高醫生對患者病情診斷的準確率。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。