肝癌是一種常見的消化系統惡性腫瘤。目前電子計算機斷層掃描成像(CT)技術已在肝癌診療方面發揮著重要作用,而基于 CT 圖像的肝癌病灶分割也在臨床診療中扮演著重要角色。由于人工分割可能存在效率低、主觀性強等缺點,因此利用電子計算機來實現對 CT 圖像中肝癌病灶的準確、自動分割是當前的研究熱點。本文就基于 CT 圖像的肝癌病灶自動分割的進展予以綜述,通過對比分析實驗結果,評估各種分割方法,以便相關領域的科研工作者更好地了解目前肝癌 CT 分割方法的研究進展。
引用本文: 樂美琰, 魏千越, 鄧煒, 汪天富, 鄧云, 黃炳升. 基于電子計算機斷層掃描圖像的肝癌病灶自動分割方法研究進展. 生物醫學工程學雜志, 2018, 35(3): 481-487. doi: 10.7507/1001-5515.201708009 復制
引言
肝癌是發生于肝臟的一種惡性腫瘤,包含原發性肝癌和轉移性肝癌。根據病發部位,原發性肝癌可以細分為肝細胞癌和膽管細胞癌。肝癌被認為是異質性最強、死亡率最高的難治性腫瘤之一。在我國,肝癌發病率在惡性腫瘤中居第二位,每年約有 38.3 萬人死于肝癌,約占全球肝癌致死病例數的 51% [1]。目前肝癌治療中較為有效、徹底的方法是肝切除術和肝移植術[2]。
基于影像的病灶分割是指依照一定的準則將病灶相關的影像部分劃分為不相交的區域,同一區域內部具有相似的特征,而相鄰區域之間具有不同的特征且可被邊界分開。醫學影像分割是了解人體組織結構、對病變區進行體積測量、引導手術規劃的基礎和必要前提[3]。由于肝臟電子計算機斷層掃描成像(computed tomography,CT)技術具有較高的分辨率,基于 CT 圖像可以把肝癌從周圍組織中分割出來,可為臨床治療和研究提供可靠依據,成為肝癌診療的重要前提。
目前基于 CT 圖像的肝癌病灶分割主要依靠醫生的肉眼觀察和臨床經驗手動完成。這種人工分割的結果很大程度上取決于操作者的經驗,費時費力、效率低下。并且,不同人對同一圖像進行分割的結果不太可能完全一樣;即便是同一人,在不同的時間,分割的結果也不可能完全相同,不能保證分割結果的一致性和可重復性[4]。因此,隨著計算機技術的發展,基于計算機圖像處理技術的自動分割可在保證準確率的同時,保證分割結果的一致性和可重復性。
近年來,基于 CT 圖像的肝癌病灶自動分割技術發展迅速,可以有效提高肝癌診斷水平,幫助醫生更快更準確地作出診斷。肝癌病灶的 CT 圖像往往存在邊緣模糊、與周圍組織的對比度較低、腫瘤內部密度不均一、形狀多樣等特點,因此對肝癌病灶進行精確分割具有一定的難度,如圖 1 所示[圖片來自本文課題組合作單位——中山大學附屬第一醫院,采集設備為 64 排螺旋 CT(Aquilion 64,東芝/日本),分別進行平掃和增強掃描,已獲得患者的知情同意以及該單位的授權]。為解決上述肝癌 CT 圖像分割中的難題,研究人員基于不同原理設計開發了多種算法。這些算法可以分為非機器學習方法和機器學習方法。基于非機器學習的醫學圖像分割主要包括基于區域的和基于邊緣的分割算法,一般是對圖像特征進行提取并通過相關規則進行處理,這樣可以有效地結合操作者的知識和計算機數據處理能力,從而實現交互式地醫學圖像分割。基于機器學習的圖像分割方法主要是對圖像特征進行訓練,得出相關模型用以測試,該方法包括監督學習和無監督學習。這兩類方法均可以有針對性地解決上述挑戰,得到較好的分割結果。

1 基于非機器學習方法的肝癌病灶分割
文獻中基于非機器學習的分割方法已經多有報道,主要可分為兩大類[4]:基于區域的分割方法和基于邊緣的分割方法。目前,應用于肝癌 CT 圖像的病灶自動分割方法主要包括基于區域的閾值法和區域生長法,以及基于邊緣的分水嶺和水平集算法。本文進一步總結了基于這些方法的分割表現。
1.1 基于區域的分割算法
圖像分割一般都會用到分割對象的兩大特性,即不同對象特征間的不連續性和同一對象內部的特征相似性。基于區域的分割算法大多是利用同一區域內部的特征相似性進行圖像處理。根據分割算法對圖像處理方式的不同,一般可以將基于區域的圖像分割算法分為以下 3 類:① 閾值法;② 區域生長法;③ 區域分裂合并法。
本文主要介紹一下閾值法和區域生長法,而區域分裂合并法是先將圖像分裂成若干個區域,再按照某種判斷準則迭代進行合并,應用較少,因此不對其進行詳細總結。
1.1.1 閾值法
閾值法是一種較為經典的圖像分割算法,是利用像素灰度或其他屬性的閾值將圖像分割成區域的過程,由于較為直觀、簡潔,廣泛地應用于圖像分割領域。
Sethi 等[5]通過創建相位圖劃定癌變區域,然后選擇一個合適的閾值(不同圖像可能需要不同的閾值)將相位圖轉化成邊界圖,再從邊界圖中提取特征圖,并將特征圖和原始圖像結合起來,最后再利用水平集技術得到最終的分割結果,其體積重疊率誤差(volume overlap error,VOE)約為 27%,平均表面距離約為 4 mm。與基于區域的經二值化和高斯濾波正則化后的水平集方法和基于邊緣距離正則化的水平集演化方法比較,該方法所得結果更準確。在該方法中,由于 CT 圖像中肝癌的灰度級和周圍組織很相似,若直接利用閾值法對原圖進行處理,將無法從正常組織中區分出病灶。因此,Sethi 等[5]先將原圖轉化為相位圖,再利用相位圖中腫瘤組織和正常組織灰度的差異,采用閾值法將相位圖轉化為邊界圖,經后續處理便可完成肝癌的分割。上述方法中,在選擇閾值時需要用戶先做多次嘗試性分割后,根據經驗判斷再確定最終的閾值。為彌補這方面的不足,后來又發展出了一些自適應的閾值選取方法。
Patil 等[6]通過兩級操作實現了肝癌 CT 圖像的分割:第一級是先后利用全局閾值和自適應閾值,同時結合形態學知識分割出肝臟;第二級是依次利用自適應閾值、模糊 C 均值聚類、區域生長等方法,從肝臟中分割出腫瘤。該方法利用 CT 圖像上肝臟灰度較為均勻這一特點,并結合先驗知識(肝臟的位置、大小以及灰度級),用閾值法從腹部 CT 中分割出肝臟,再利用 CT 圖像中腫瘤組織和正常組織的灰度差異,用閾值法從肝臟中分割肝癌組織。研究結果顯示,該方法的肝癌分割效率為 92.3%。其中,執行第二級操作時,自適應閾值法的肝癌分割效率為 37.69%,模糊 C 均值聚類算法的肝癌分割效率為 22.42%,區域生長法的肝癌分割效率為 32.00%。
事實上,閾值法的主要局限是只考慮了像素本身,而并不考慮圖像的空間差異。因此單獨使用閾值法對肝癌進行分割往往難以達到預期效果。故而上述文獻中都是用閾值法結合其他的分割方法來完成最終的病灶分割。
1.1.2 區域生長法
區域生長法是按照預先定義的標準進行生長,從而提取出圖像中相連區域的方法。區域生長法彌補了閾值分割法沒有或很少考慮到的空間關系不足的情況,但這種方法的主要缺陷是每一個需要分割的區域都必須人工給出種子點。
Baazaoui 等[7]提出一種基于熵的模糊區域生長方法來分割單個或多個肝癌病灶。首先在各腫瘤組織內分別選取種子點,利用這些種子點分別進行基于熵的區域生長,最后使用基于距離的操作以防止不同腫瘤區域間有重疊。該研究在 3 個數據庫中分別測試,均得到較好的分割結果,同時也證實了該方法具有較強的抗噪能力。在該方法中,局部熵值表示局部區域的多樣性,對肝癌和正常組織的過渡區敏感;而模糊區域生長是利用一個模糊的隸屬函數進行的,它可以通過某點周圍的信息來推遲對該點的決斷。利用 CT 圖像上腫瘤內部熵值的相似性進行模糊區域生長,這種做法不僅可以減少噪聲的影響,還解決了 CT 圖像上腫瘤邊緣模糊這一問題。
Abd-Elaziz 等[8]則通過強度分析去除掉肝臟周圍的其他結構以提高分割速度,然后結合全自動種子點選取技術利用區域生長算法分割出肝臟,在此基礎上,進一步自動選取種子點進行區域生長,分割出肝癌。經測試,得到的肝癌分割敏感度和特異性分別為 96.5% ± 0.62% 和 99.2% ± 0.6%。該方法先利用 CT 圖像中肝臟位置和大小的先驗知識,自動確定出肝臟內一點,作為第一次區域生長的種子點。此后再利用 CT 圖像中肝癌灰度值比正常肝組織低這一特點,可以自動確定出肝癌內一點,作為第二次區域生長的種子點。該方法結合 CT 圖像中的先驗知識實現了種子點的自動選取,有利于分割的全自動化。
綜上所述,采用區域生長法不僅可以分割出單個肝癌病灶區,還可以同時分割出多個肝癌病灶區,并且分割效果較好。但是為了使得分割更加快速準確,還需結合運用其他圖像處理方法,例如:除去肝臟周圍結構、利用基于距離的操作防止區域重疊等。除此之外,為了實現分割的自動化,還應結合 CT 圖像上肝臟組織和腫瘤組織的基本特征,如肝臟的位置、形態以及肝臟組織和腫瘤組織的灰度值差異等實現最終的分割。
1.2 基于邊緣的分割算法
邊緣檢測是醫學圖像分割中常用的分割方法之一。所謂邊緣,就是圖像區域中明顯變化的像素集合,也是圖像分割的重要依據。邊緣檢測具有可以大幅減少計算量,快速剔除不需要的信息等優點[1]。
1.2.1 分水嶺
分水嶺算法是常用的基于邊緣的分割方法,該方法通過基于圖像的梯度特征展開分割,因而該算法對圖像噪聲會比較敏感,單獨使用分水嶺算法進行圖像分割,易導致過度分割。為了解決該問題,人們往往會將分水嶺算法與其他的圖像處理方法結合,用其他的圖像處理方法對圖像進行預處理或分割后對圖像進行細化。
Yan 等[9]在病灶區域內人工選擇種子點,自動確定雙閾值,并利用雙閾值確定分水嶺內外部的標記,最終實現了與金標準(以放射科醫師手動分割的結果為準)82.3% 的中位體積重合率。這一研究結果表明,采用基于標記的分水嶺算法是一種有效的肝癌分割方法。該方法利用 CT 圖像三維空間的連續性,解決了分支問題,即判斷若干小連通域是否屬于腫瘤區域。同時,該方法對于位于肝臟邊緣或者邊緣不清晰的腫瘤的處理有一定優勢,但是終末層的腫瘤和周圍組織相似,導致邊緣極不清晰,甚至是無邊緣,容易導致錯分。
Xing 等[10]利用圖像增強和分水嶺變換對圖像進行預處理,再通過支持向量機(support vector machine,SVM)(一種機器學習算法)進行訓練,最后經過一系列后處理,得到了肝癌病灶的分割結果,通過測試,得到的 VOE 為 31.14%。在該方法中,用分水嶺變換將肝臟分割為多個小區域,與處理體素相比,該方法顯得更為高效。
可見,適當地結合運用分水嶺算法和其他圖像處理方法,可以得到較好的分割準確率,同時還可以提高分割效率。
1.2.2 水平集
水平集算法的基本思想是將低維的曲線嵌入到比其高一維的水平集函數中。基于水平集的圖像分割的優點主要表現在:不需要復雜的數據結構即可較好地分割出感興趣區,同時水平集也可以描述在分割過程中拓撲結構的變化。
Li 等[11]提出一種基于水平集的肝癌 CT 分割方法,該水平集模型結合了圖像梯度、區域競爭和先驗知識,改善了用傳統的基于邊緣的水平集分割肝癌 CT 時邊緣較弱等現象。Li 等[11]在 25 張二維的 CT 圖像和 4 個三維的 CT 圖像集上進行測試,在二維和三維的數據集上得到的重疊誤差分別為 12.75% ± 5.76% 和 26.31% ± 5.79%,相對差異分別為 –4.28% ± 9.58% 和 –10.64% ± 7.55%。由于肝癌的 CT 圖像存在與周圍組織對比度低、邊緣模糊、內部不均勻等問題,而傳統的水平集方法不可能同時解決這些問題,因此在該方法中,水平集模型結合了圖像梯度、區域競爭和先驗知識,與基于邊緣的水平集模型相比,能更好地分割邊緣弱的腫瘤;與基于區域的水平集模型相比,能更好地分割對比度低的腫瘤。Amarajothi 等[12]利用水平集模型,同時結合形狀和強度先驗知識,實現了更為準確的肝癌分割。經測試,傳統閾值法的肝癌分割準確率為 93.2%,而該方法取得的分割準確率為 98.7%,確實實現了更為精確的分割。上述方法中,僅使用單水平集法容易導致過分割 CT 圖像中腫瘤周圍的組織,而將梯度方向運用到水平集模型中,使得水平集與形狀強度的先驗知識結合,解決了上述問題。Cui 等[13]提出一種基于形態學梯度修正的水平集分割方法,首先對腹部 CT 圖像進行梯度變換,再對梯度圖像進行形態學修正,最后對梯度修正后的圖像進行水平集分割,即得到最終的分割結果。實驗表明,該方法的分割相似度可以達到 95% 以上。由于肝癌 CT 圖像中存在邊緣模糊的問題,該方法根據梯度的大小,選取不同大小的結構元素進行局部梯度修正,這樣能有效地提高模糊邊緣的清晰度,防止水平集演進時邊緣漏出導致錯分。
綜上所述,合理利用其他圖像處理方法來優化水平集模型,可以克服水平集模型分割時邊緣較弱等缺點,因而便可能得到更好的肝癌 CT 分割結果。
總的來說,傳統的圖像分割方法能夠取得較好的分割結果。但分割過程往往離不開操作者的先驗知識,如閾值法中選取閾值、區域生長中選取種子點等,這導致分割結果會受到主觀因素的影響。因而,對于相關經驗不足的操作者而言,可能無法取得上述的分割準確率。
2 基于機器學習的肝癌病灶分割
機器學習的算法可以大體上分為兩類[14]:監督學習和無監督學習。應用到醫學圖像分割上的機器學習方法主要包括無監督學習中的聚類、監督學習中的支持向量機、神經網絡、隨機森林等。本文總結了基于這些機器學習方法的分割結果。
2.1 監督學習
監督學習是指從給定的訓練集中學習出一個函數,當輸入新的數據時,可以根據這個學習出的函數預測結果的機器學習方法。它根據一系列配對的輸入輸出訓練樣本來獲得輸入輸出關系,其中輸出作為輸入數據的標簽,而輸入數據則作為輸出數據的被監督者。監督學習的訓練集要包括特征和目標,其中目標由人為標記。常見的監督學習算法包括支持向量機、神經網絡、隨機森林等。
2.1.1 支持向量機
支持向量機是一種解決多維函數預測的通用工具,其工作機制為:對于給定的訓練集,系統會隨機產生一個超平面并移動它,直到訓練集中屬于不同類的點恰好分布于平面的不同側,并使訓練集中的點距離該平面盡可能的遠,即尋找一個超平面,使其兩側的空白區域盡可能大。和其他同類方法相比,支持向量機具有較強的適應性和較高的效率。
Zhou 等[15]提出一種改進的支持向量機框架,先通過一類支持向量機分類器對肝臟腫瘤區域作初始化分割,再使用一種輔助工具自動生成無腫瘤的樣本,最后用腫瘤和非腫瘤區域的樣本訓練出一個二類的支持向量機分類器。該研究首先通過設置不同的窗寬窗位可以得到兩個圖像數據集,選用這兩個圖像上各點的強度作為訓練特征。隨后用該分類器在 16 組腹部 CT 圖像上進行測試,得到的分割結果較好,VOE為 27.0% ± 6.7%;而通過一類支持向量機和二類支持向量機得到的 VOE 分別為 39.4% ± 9.4% 和 32.1% ± 6.4%。因為一類支持向量機只關注用戶選取的正樣本的特征,沒有關注負樣本的特征,所以對于邊緣模糊的異質性腫瘤而言,僅用一類支持向量機得到的分割結果不盡如人意。該方法將一類支持向量機得到的結果作為正樣本,在其外部抽取負樣本點,再利用二類支持向量機分類,這樣有利于改善一類支持向量機的分割結果。Xing 等[10]利用圖像增強和分水嶺變換對圖像進行預處理,以得到的各連通域的灰度最小值、最大值、平均值、標準差為特征集,再通過支持向量機訓練,最后進行一系列圖像后處理,得到了肝癌 CT 的分割結果。該研究在 10 個腫瘤數據集上進行了測試,得到的平均重疊誤差為 31.14%,分割一位患者的肝癌 CT 圖像大約需要 30 s。這種利用分水嶺變換做預處理的方法可以減少訓練數據集,從而大大減少分割的時間,并且對小區域進行處理可以減少 CT 圖像中噪聲對分割的影響。同時,這種方法結合了操作者的先驗知識來選取訓練集,有利于分割的魯棒性。
上述結果顯示,支持向量機確實是一種行之有效的方法,但是直接、單獨使用時準確率和效率并不會太高,若想得到較理想的分割結果,還需結合其他方法提取特征或改進分類算法。
2.1.2 神經網絡
神經網絡是一種以有向圖為拓撲結構的動態系統,它是通過對連續或斷續的輸入作為狀態響應,進而進行信息處理的。神經網絡不僅具有一般非線性系統的共性,它還具有一些特性,例如系統的高維性、神經元間的廣泛互連性和自適應性等。
Li 等[16]通過對圖像預處理、特征提取,再用卷積神經網絡(convolutional neural network,CNN)進行訓練分類并對圖像進行后處理即得到了分割的結果。經測試,與其他機器學習方法(如 AdaBoost、隨機森林、支持向量機等)相比,CNN 在腹部 CT 圖像的肝癌分割上表現更加出眾,其 Dice 系數(一種度量集合相似度的指標)為 80.06% ± 1.63%,精確率為 82.67% ± 1.43%,召回率為 84.34% ± 1.61%。雖然,對于密度不均或邊界較弱腫瘤的分割,這些方法都存在一定的局限性,容易導致正常組織的錯分或腫瘤組織的漏分,但當獲得更多腫瘤邊緣信息后,CNN 在肝癌分割上會表現最佳。Hoogi 等[17]提出一種基于自適應評估主動模型參數的水平集分割方法,首先用 CNN 來評估定位病變區的水平集輪廓,然后用 CNN 輸出的概率來自適應計算主動輪廓的參數,最后用可迭代的方法來確定病變區的大小和空間結構。在 164 個磁共振成像(magnetic resonance imaging,MRI)圖像和 112 個 CT 圖像上進行測試,得到的平均中值 Dice 系數為 84% ± 3%。該方法利用 CNN 自適應地計算參數,避免了大量的人機交互,提高了分割的準確率,同時對于 CT 圖像中肝癌具有高度多樣性這一分割難點,CNN 計算的自適應參數使得該方法具有較強的處理能力。Christ 等[18]應用級聯的全卷積神經網絡(fully convolutional neural network,FCN)和稠密三維條件隨機場(conditional random fields,CRFs)來自動分割腹部 CT 圖像中的肝臟和病變區,他們首先訓練出一個 FCN 來分割肝臟,再訓練出一個 FCN,從第一步分割出來的肝臟中進一步分割出病變區,最后用 CRFs 來細化分割結果,這將有助于改善其外觀和空間相干性。經 2 折交叉驗證,得到分割結果的 Dice 系數超過了 94%,并且每份 CT 集的計算時間低于 100 s,這表明該方法在獲得較高的分割準確率的同時也保證了較快的計算速度。
綜上所述,在機器學習方法中,對于基于 CT 圖像的肝癌分割而言,神經網絡是一種較為有效的方法,并且神經網絡通常可以實現肝癌的自動分割,加上對分割結果的優化、細化,便可能達到較高的分割準確率。
2.1.3 隨機森林
隨機森林是一種統計學習方法,其工作機制為:先用重抽樣技術——自助法(bootstrap)從原始樣本中抽取出多個樣本,并對其中每個樣本進行決策樹建模,然后結合多顆決策樹的預測,通過投票得出最終的預測結果。該方法具有預測準確率較高、對噪聲具有較好的容忍度、不易出現過擬合現象等優點。
Conze 等[19]利用基于多相聚類特征的隨機森林,設計出一種在動態增強 CT 圖像中實現半自動肝癌分割的方法,測試得到的壞死組織分割的 Dice 系數為 71.9% ± 19.5%,實質組織分割的 Dice 系數為 93.3% ± 3.08%,均強于基于單相體素、基于單相超像素以及基于多相體素方法得到的結果。該方法中利用超像素增加了分割結果的空間一致性,利用多相特征可以減少錯分的影響。后來,Conze 等[20]又提出一種新的結合超像素和隨機森林的分割方法,與之前的方法相比,通過分層多尺度樹將特征聯系起來以描述超像素,解決了一個較大的超像素中可能存在多種類型的組織這一問題。實驗表明,用基于超像素的多尺度隨機森林與基于超像素的單尺度隨機森林的相比,分割準確率有所提高:壞死組織分割的 Dice 系數由 85.3% ± 12.5% 提高到 86.9% ± 10.5%,實質組織分割的 Dice 系數由 94.3% ± 4.12% 提高到 95.5% ± 3.56%,腫瘤分割的 Dice 系數由 88.9% ± 8.51% 提高到 91.0% ± 6.99%。
綜上所述,隨機森林結合超像素來使用,分割準確率可得到明顯提升,同時如果其結合合適的圖像處理方法,對于改善分割結果也有很大的幫助。
2.2 無監督學習
無監督學習是一種對原始數據進行分類,以便了解數據內部結構的機器學習方法。與監督學習不同的是,無監督學習網絡在學習過程中并不知道其分類結果的正誤。無監督學習的目標就是要在數據集上找到某種感興趣的內在結構,也就是要找出或估計一種可能產生該數據集的概率密度。當學習完畢并經測試以后,可以將習得的網絡用到新的數據集上。
用于肝癌 CT 圖像分割的無監督學習方法主要是聚類算法。聚類是一種將數據集劃分為若干簇的無監督學習方法,它使得同類對象間相似度較高,而異類對象間相似度較低[21]。
Sajith 等[22]先用空間模糊 C 均值聚類(fuzzy c-means clustering,FCM)算法,再結合參數可變形模型,先分割出包含腫瘤的肝臟組織,進一步分割出腫瘤組織。其中模糊 C 均值聚類算法利用體素間的相似性將圖像分為多個簇,參數可變形模型則根據約束條件演進出一條曲線來趨近感興趣區的邊緣,模糊 C 均值聚類算法結合參數可變形模型可更好地檢測邊緣,從而優化分割結果。Obayya 等[23]通過兩步來分割出腹部 CT 圖像中的肝癌,第一步是對圖像進行預處理,通過形態濾波、連通分量、邊界提取等算法分割出肝臟;第二步是利用 CT 圖像上肝癌組織和正常組織灰度級上的不同,用模糊 C 均值聚類算法將像素分為 3 個不同的簇,分別為背景、肝臟和肝癌可疑區。該方法的平均成功率達到 93.3%,平均用時為 21.32 s,均強于基于區域的算法。
Ben-Cohen 等[24]在定期復查患者的 CT 圖像中,診斷并分割出肝臟轉移性病變區。他們通過結合之前的 CT 圖像,用二維的基線分割掩膜、非剛性配準及模板匹配來定位肝臟病變區和周圍組織,以縮小病變區的搜索范圍。再用自適應的區域生長和均值漂移聚類來實現肝臟病變區的分割。檢出率達 90%,分割的平均 Dice 系數為 84% ± 7%。雖然診斷和分割的效果還不錯,但是由于要用到之前的 CT 圖像來縮小處理范圍,該方法在某些情況下(如患者中途有做外科手術或病變區的大小變化過大導致肝臟變形等)存在局限性。
綜上所述,聚類算法經常用來實現基于 CT 圖像的肝癌自動分割。同時研究發現,運用聚類算法分割腫瘤時,通常會先分割出肝臟或者是定位出肝臟病變區和周圍組織,以縮小病變區的搜索范圍,在此基礎上再去分割腫瘤組織,這有助于得到較好的肝癌分割結果。
總的來說,機器學習方法也可以得到不錯的分割效果。不難發現,圖像預處理后,選取合適的特征對機器學習尤為關鍵,這樣將有助于提高分割的準確率。同時可以觀察到機器學習的分割結果受操作者主觀因素的影響相對較小。雖然部分機器學習方法存在耗時較長的缺點,但是經過算法的不斷優化后,這方面的問題在逐漸改善。
3 總結與展望
不難發現,近年來,基于 CT 圖像的肝癌病灶自動分割算法已有長足的發展。其中,非機器學習方法通常是通過給計算機一連串的指令,讓它遵照這些指令一步步執行下去,有因有果,非常明確,而機器學習則是通過訓練數據,以實現對輸入圖像的自動分割,其核心在于相關而非因果。面對一個問題時,人們更希望程序可以對以往的經驗進行存取以應用于將來的任務,機器學習恰好可以做到這一點。但是機器學習方法在某些情況下分割準確率并不高,因而許多學者希望通過將非機器學習算法與機器學習算法結合,在實現肝癌 CT 自動分割的前提下,優化分割結果,提高分割的準確率。同時,目前多數方法都傾向于自動分割,一方面,全自動的分割方法可以使沒有臨床經驗的操作者也可以獲得良好的分割結果。另一方面,交互式半自動分割方法雖然需要操作者設置一系列的參數,但是與全自動的分割方法相比,一般具有更好的分割結果[25]。這就進一步說明了各種方法都具有一定的優點和局限性。同時使用多種方法,可實現各算法間的優勢互補,從而提高分割準確率。
目前肝癌 CT 圖像分割的準確率還不夠高,肝癌分割過程中還存在一些難點,包括:① 腹部 CT 圖像具有噪聲;② 肝癌具有異質性;③ 肝癌的形狀復雜且多變等[26]。對于這些難題,可以著重在算法優化方面進行改進,例如:可以通過基于熵的模糊區域生長、用分水嶺做預處理、使用隨機森林做決策等方法來減少噪聲的影響;用 CNN 初始化水平集參數,能夠更好地處理復雜多變的腫瘤;還可用分水嶺和超像素來提高算法的效率。然而,沒有一種方法可以解決所有難題,因此適當綜合多種方法是必要的。例如研究者們可以試圖用機器學習方法初始化非機器學習方法的參數,再用非機器學習方法來分割肝癌,以便處理復雜多變的腫瘤;也可以用非機器學習方法結合先驗知識實現自動化,并用于機器學習方法的預處理或進行結果細化,從而優化分割結果。這些方法如能順利推廣到臨床應用中,或許能夠提高臨床醫師的工作效率以及保證分割的準確性,則最終將使醫生和患者都從中受益。
引言
肝癌是發生于肝臟的一種惡性腫瘤,包含原發性肝癌和轉移性肝癌。根據病發部位,原發性肝癌可以細分為肝細胞癌和膽管細胞癌。肝癌被認為是異質性最強、死亡率最高的難治性腫瘤之一。在我國,肝癌發病率在惡性腫瘤中居第二位,每年約有 38.3 萬人死于肝癌,約占全球肝癌致死病例數的 51% [1]。目前肝癌治療中較為有效、徹底的方法是肝切除術和肝移植術[2]。
基于影像的病灶分割是指依照一定的準則將病灶相關的影像部分劃分為不相交的區域,同一區域內部具有相似的特征,而相鄰區域之間具有不同的特征且可被邊界分開。醫學影像分割是了解人體組織結構、對病變區進行體積測量、引導手術規劃的基礎和必要前提[3]。由于肝臟電子計算機斷層掃描成像(computed tomography,CT)技術具有較高的分辨率,基于 CT 圖像可以把肝癌從周圍組織中分割出來,可為臨床治療和研究提供可靠依據,成為肝癌診療的重要前提。
目前基于 CT 圖像的肝癌病灶分割主要依靠醫生的肉眼觀察和臨床經驗手動完成。這種人工分割的結果很大程度上取決于操作者的經驗,費時費力、效率低下。并且,不同人對同一圖像進行分割的結果不太可能完全一樣;即便是同一人,在不同的時間,分割的結果也不可能完全相同,不能保證分割結果的一致性和可重復性[4]。因此,隨著計算機技術的發展,基于計算機圖像處理技術的自動分割可在保證準確率的同時,保證分割結果的一致性和可重復性。
近年來,基于 CT 圖像的肝癌病灶自動分割技術發展迅速,可以有效提高肝癌診斷水平,幫助醫生更快更準確地作出診斷。肝癌病灶的 CT 圖像往往存在邊緣模糊、與周圍組織的對比度較低、腫瘤內部密度不均一、形狀多樣等特點,因此對肝癌病灶進行精確分割具有一定的難度,如圖 1 所示[圖片來自本文課題組合作單位——中山大學附屬第一醫院,采集設備為 64 排螺旋 CT(Aquilion 64,東芝/日本),分別進行平掃和增強掃描,已獲得患者的知情同意以及該單位的授權]。為解決上述肝癌 CT 圖像分割中的難題,研究人員基于不同原理設計開發了多種算法。這些算法可以分為非機器學習方法和機器學習方法。基于非機器學習的醫學圖像分割主要包括基于區域的和基于邊緣的分割算法,一般是對圖像特征進行提取并通過相關規則進行處理,這樣可以有效地結合操作者的知識和計算機數據處理能力,從而實現交互式地醫學圖像分割。基于機器學習的圖像分割方法主要是對圖像特征進行訓練,得出相關模型用以測試,該方法包括監督學習和無監督學習。這兩類方法均可以有針對性地解決上述挑戰,得到較好的分割結果。

1 基于非機器學習方法的肝癌病灶分割
文獻中基于非機器學習的分割方法已經多有報道,主要可分為兩大類[4]:基于區域的分割方法和基于邊緣的分割方法。目前,應用于肝癌 CT 圖像的病灶自動分割方法主要包括基于區域的閾值法和區域生長法,以及基于邊緣的分水嶺和水平集算法。本文進一步總結了基于這些方法的分割表現。
1.1 基于區域的分割算法
圖像分割一般都會用到分割對象的兩大特性,即不同對象特征間的不連續性和同一對象內部的特征相似性。基于區域的分割算法大多是利用同一區域內部的特征相似性進行圖像處理。根據分割算法對圖像處理方式的不同,一般可以將基于區域的圖像分割算法分為以下 3 類:① 閾值法;② 區域生長法;③ 區域分裂合并法。
本文主要介紹一下閾值法和區域生長法,而區域分裂合并法是先將圖像分裂成若干個區域,再按照某種判斷準則迭代進行合并,應用較少,因此不對其進行詳細總結。
1.1.1 閾值法
閾值法是一種較為經典的圖像分割算法,是利用像素灰度或其他屬性的閾值將圖像分割成區域的過程,由于較為直觀、簡潔,廣泛地應用于圖像分割領域。
Sethi 等[5]通過創建相位圖劃定癌變區域,然后選擇一個合適的閾值(不同圖像可能需要不同的閾值)將相位圖轉化成邊界圖,再從邊界圖中提取特征圖,并將特征圖和原始圖像結合起來,最后再利用水平集技術得到最終的分割結果,其體積重疊率誤差(volume overlap error,VOE)約為 27%,平均表面距離約為 4 mm。與基于區域的經二值化和高斯濾波正則化后的水平集方法和基于邊緣距離正則化的水平集演化方法比較,該方法所得結果更準確。在該方法中,由于 CT 圖像中肝癌的灰度級和周圍組織很相似,若直接利用閾值法對原圖進行處理,將無法從正常組織中區分出病灶。因此,Sethi 等[5]先將原圖轉化為相位圖,再利用相位圖中腫瘤組織和正常組織灰度的差異,采用閾值法將相位圖轉化為邊界圖,經后續處理便可完成肝癌的分割。上述方法中,在選擇閾值時需要用戶先做多次嘗試性分割后,根據經驗判斷再確定最終的閾值。為彌補這方面的不足,后來又發展出了一些自適應的閾值選取方法。
Patil 等[6]通過兩級操作實現了肝癌 CT 圖像的分割:第一級是先后利用全局閾值和自適應閾值,同時結合形態學知識分割出肝臟;第二級是依次利用自適應閾值、模糊 C 均值聚類、區域生長等方法,從肝臟中分割出腫瘤。該方法利用 CT 圖像上肝臟灰度較為均勻這一特點,并結合先驗知識(肝臟的位置、大小以及灰度級),用閾值法從腹部 CT 中分割出肝臟,再利用 CT 圖像中腫瘤組織和正常組織的灰度差異,用閾值法從肝臟中分割肝癌組織。研究結果顯示,該方法的肝癌分割效率為 92.3%。其中,執行第二級操作時,自適應閾值法的肝癌分割效率為 37.69%,模糊 C 均值聚類算法的肝癌分割效率為 22.42%,區域生長法的肝癌分割效率為 32.00%。
事實上,閾值法的主要局限是只考慮了像素本身,而并不考慮圖像的空間差異。因此單獨使用閾值法對肝癌進行分割往往難以達到預期效果。故而上述文獻中都是用閾值法結合其他的分割方法來完成最終的病灶分割。
1.1.2 區域生長法
區域生長法是按照預先定義的標準進行生長,從而提取出圖像中相連區域的方法。區域生長法彌補了閾值分割法沒有或很少考慮到的空間關系不足的情況,但這種方法的主要缺陷是每一個需要分割的區域都必須人工給出種子點。
Baazaoui 等[7]提出一種基于熵的模糊區域生長方法來分割單個或多個肝癌病灶。首先在各腫瘤組織內分別選取種子點,利用這些種子點分別進行基于熵的區域生長,最后使用基于距離的操作以防止不同腫瘤區域間有重疊。該研究在 3 個數據庫中分別測試,均得到較好的分割結果,同時也證實了該方法具有較強的抗噪能力。在該方法中,局部熵值表示局部區域的多樣性,對肝癌和正常組織的過渡區敏感;而模糊區域生長是利用一個模糊的隸屬函數進行的,它可以通過某點周圍的信息來推遲對該點的決斷。利用 CT 圖像上腫瘤內部熵值的相似性進行模糊區域生長,這種做法不僅可以減少噪聲的影響,還解決了 CT 圖像上腫瘤邊緣模糊這一問題。
Abd-Elaziz 等[8]則通過強度分析去除掉肝臟周圍的其他結構以提高分割速度,然后結合全自動種子點選取技術利用區域生長算法分割出肝臟,在此基礎上,進一步自動選取種子點進行區域生長,分割出肝癌。經測試,得到的肝癌分割敏感度和特異性分別為 96.5% ± 0.62% 和 99.2% ± 0.6%。該方法先利用 CT 圖像中肝臟位置和大小的先驗知識,自動確定出肝臟內一點,作為第一次區域生長的種子點。此后再利用 CT 圖像中肝癌灰度值比正常肝組織低這一特點,可以自動確定出肝癌內一點,作為第二次區域生長的種子點。該方法結合 CT 圖像中的先驗知識實現了種子點的自動選取,有利于分割的全自動化。
綜上所述,采用區域生長法不僅可以分割出單個肝癌病灶區,還可以同時分割出多個肝癌病灶區,并且分割效果較好。但是為了使得分割更加快速準確,還需結合運用其他圖像處理方法,例如:除去肝臟周圍結構、利用基于距離的操作防止區域重疊等。除此之外,為了實現分割的自動化,還應結合 CT 圖像上肝臟組織和腫瘤組織的基本特征,如肝臟的位置、形態以及肝臟組織和腫瘤組織的灰度值差異等實現最終的分割。
1.2 基于邊緣的分割算法
邊緣檢測是醫學圖像分割中常用的分割方法之一。所謂邊緣,就是圖像區域中明顯變化的像素集合,也是圖像分割的重要依據。邊緣檢測具有可以大幅減少計算量,快速剔除不需要的信息等優點[1]。
1.2.1 分水嶺
分水嶺算法是常用的基于邊緣的分割方法,該方法通過基于圖像的梯度特征展開分割,因而該算法對圖像噪聲會比較敏感,單獨使用分水嶺算法進行圖像分割,易導致過度分割。為了解決該問題,人們往往會將分水嶺算法與其他的圖像處理方法結合,用其他的圖像處理方法對圖像進行預處理或分割后對圖像進行細化。
Yan 等[9]在病灶區域內人工選擇種子點,自動確定雙閾值,并利用雙閾值確定分水嶺內外部的標記,最終實現了與金標準(以放射科醫師手動分割的結果為準)82.3% 的中位體積重合率。這一研究結果表明,采用基于標記的分水嶺算法是一種有效的肝癌分割方法。該方法利用 CT 圖像三維空間的連續性,解決了分支問題,即判斷若干小連通域是否屬于腫瘤區域。同時,該方法對于位于肝臟邊緣或者邊緣不清晰的腫瘤的處理有一定優勢,但是終末層的腫瘤和周圍組織相似,導致邊緣極不清晰,甚至是無邊緣,容易導致錯分。
Xing 等[10]利用圖像增強和分水嶺變換對圖像進行預處理,再通過支持向量機(support vector machine,SVM)(一種機器學習算法)進行訓練,最后經過一系列后處理,得到了肝癌病灶的分割結果,通過測試,得到的 VOE 為 31.14%。在該方法中,用分水嶺變換將肝臟分割為多個小區域,與處理體素相比,該方法顯得更為高效。
可見,適當地結合運用分水嶺算法和其他圖像處理方法,可以得到較好的分割準確率,同時還可以提高分割效率。
1.2.2 水平集
水平集算法的基本思想是將低維的曲線嵌入到比其高一維的水平集函數中。基于水平集的圖像分割的優點主要表現在:不需要復雜的數據結構即可較好地分割出感興趣區,同時水平集也可以描述在分割過程中拓撲結構的變化。
Li 等[11]提出一種基于水平集的肝癌 CT 分割方法,該水平集模型結合了圖像梯度、區域競爭和先驗知識,改善了用傳統的基于邊緣的水平集分割肝癌 CT 時邊緣較弱等現象。Li 等[11]在 25 張二維的 CT 圖像和 4 個三維的 CT 圖像集上進行測試,在二維和三維的數據集上得到的重疊誤差分別為 12.75% ± 5.76% 和 26.31% ± 5.79%,相對差異分別為 –4.28% ± 9.58% 和 –10.64% ± 7.55%。由于肝癌的 CT 圖像存在與周圍組織對比度低、邊緣模糊、內部不均勻等問題,而傳統的水平集方法不可能同時解決這些問題,因此在該方法中,水平集模型結合了圖像梯度、區域競爭和先驗知識,與基于邊緣的水平集模型相比,能更好地分割邊緣弱的腫瘤;與基于區域的水平集模型相比,能更好地分割對比度低的腫瘤。Amarajothi 等[12]利用水平集模型,同時結合形狀和強度先驗知識,實現了更為準確的肝癌分割。經測試,傳統閾值法的肝癌分割準確率為 93.2%,而該方法取得的分割準確率為 98.7%,確實實現了更為精確的分割。上述方法中,僅使用單水平集法容易導致過分割 CT 圖像中腫瘤周圍的組織,而將梯度方向運用到水平集模型中,使得水平集與形狀強度的先驗知識結合,解決了上述問題。Cui 等[13]提出一種基于形態學梯度修正的水平集分割方法,首先對腹部 CT 圖像進行梯度變換,再對梯度圖像進行形態學修正,最后對梯度修正后的圖像進行水平集分割,即得到最終的分割結果。實驗表明,該方法的分割相似度可以達到 95% 以上。由于肝癌 CT 圖像中存在邊緣模糊的問題,該方法根據梯度的大小,選取不同大小的結構元素進行局部梯度修正,這樣能有效地提高模糊邊緣的清晰度,防止水平集演進時邊緣漏出導致錯分。
綜上所述,合理利用其他圖像處理方法來優化水平集模型,可以克服水平集模型分割時邊緣較弱等缺點,因而便可能得到更好的肝癌 CT 分割結果。
總的來說,傳統的圖像分割方法能夠取得較好的分割結果。但分割過程往往離不開操作者的先驗知識,如閾值法中選取閾值、區域生長中選取種子點等,這導致分割結果會受到主觀因素的影響。因而,對于相關經驗不足的操作者而言,可能無法取得上述的分割準確率。
2 基于機器學習的肝癌病灶分割
機器學習的算法可以大體上分為兩類[14]:監督學習和無監督學習。應用到醫學圖像分割上的機器學習方法主要包括無監督學習中的聚類、監督學習中的支持向量機、神經網絡、隨機森林等。本文總結了基于這些機器學習方法的分割結果。
2.1 監督學習
監督學習是指從給定的訓練集中學習出一個函數,當輸入新的數據時,可以根據這個學習出的函數預測結果的機器學習方法。它根據一系列配對的輸入輸出訓練樣本來獲得輸入輸出關系,其中輸出作為輸入數據的標簽,而輸入數據則作為輸出數據的被監督者。監督學習的訓練集要包括特征和目標,其中目標由人為標記。常見的監督學習算法包括支持向量機、神經網絡、隨機森林等。
2.1.1 支持向量機
支持向量機是一種解決多維函數預測的通用工具,其工作機制為:對于給定的訓練集,系統會隨機產生一個超平面并移動它,直到訓練集中屬于不同類的點恰好分布于平面的不同側,并使訓練集中的點距離該平面盡可能的遠,即尋找一個超平面,使其兩側的空白區域盡可能大。和其他同類方法相比,支持向量機具有較強的適應性和較高的效率。
Zhou 等[15]提出一種改進的支持向量機框架,先通過一類支持向量機分類器對肝臟腫瘤區域作初始化分割,再使用一種輔助工具自動生成無腫瘤的樣本,最后用腫瘤和非腫瘤區域的樣本訓練出一個二類的支持向量機分類器。該研究首先通過設置不同的窗寬窗位可以得到兩個圖像數據集,選用這兩個圖像上各點的強度作為訓練特征。隨后用該分類器在 16 組腹部 CT 圖像上進行測試,得到的分割結果較好,VOE為 27.0% ± 6.7%;而通過一類支持向量機和二類支持向量機得到的 VOE 分別為 39.4% ± 9.4% 和 32.1% ± 6.4%。因為一類支持向量機只關注用戶選取的正樣本的特征,沒有關注負樣本的特征,所以對于邊緣模糊的異質性腫瘤而言,僅用一類支持向量機得到的分割結果不盡如人意。該方法將一類支持向量機得到的結果作為正樣本,在其外部抽取負樣本點,再利用二類支持向量機分類,這樣有利于改善一類支持向量機的分割結果。Xing 等[10]利用圖像增強和分水嶺變換對圖像進行預處理,以得到的各連通域的灰度最小值、最大值、平均值、標準差為特征集,再通過支持向量機訓練,最后進行一系列圖像后處理,得到了肝癌 CT 的分割結果。該研究在 10 個腫瘤數據集上進行了測試,得到的平均重疊誤差為 31.14%,分割一位患者的肝癌 CT 圖像大約需要 30 s。這種利用分水嶺變換做預處理的方法可以減少訓練數據集,從而大大減少分割的時間,并且對小區域進行處理可以減少 CT 圖像中噪聲對分割的影響。同時,這種方法結合了操作者的先驗知識來選取訓練集,有利于分割的魯棒性。
上述結果顯示,支持向量機確實是一種行之有效的方法,但是直接、單獨使用時準確率和效率并不會太高,若想得到較理想的分割結果,還需結合其他方法提取特征或改進分類算法。
2.1.2 神經網絡
神經網絡是一種以有向圖為拓撲結構的動態系統,它是通過對連續或斷續的輸入作為狀態響應,進而進行信息處理的。神經網絡不僅具有一般非線性系統的共性,它還具有一些特性,例如系統的高維性、神經元間的廣泛互連性和自適應性等。
Li 等[16]通過對圖像預處理、特征提取,再用卷積神經網絡(convolutional neural network,CNN)進行訓練分類并對圖像進行后處理即得到了分割的結果。經測試,與其他機器學習方法(如 AdaBoost、隨機森林、支持向量機等)相比,CNN 在腹部 CT 圖像的肝癌分割上表現更加出眾,其 Dice 系數(一種度量集合相似度的指標)為 80.06% ± 1.63%,精確率為 82.67% ± 1.43%,召回率為 84.34% ± 1.61%。雖然,對于密度不均或邊界較弱腫瘤的分割,這些方法都存在一定的局限性,容易導致正常組織的錯分或腫瘤組織的漏分,但當獲得更多腫瘤邊緣信息后,CNN 在肝癌分割上會表現最佳。Hoogi 等[17]提出一種基于自適應評估主動模型參數的水平集分割方法,首先用 CNN 來評估定位病變區的水平集輪廓,然后用 CNN 輸出的概率來自適應計算主動輪廓的參數,最后用可迭代的方法來確定病變區的大小和空間結構。在 164 個磁共振成像(magnetic resonance imaging,MRI)圖像和 112 個 CT 圖像上進行測試,得到的平均中值 Dice 系數為 84% ± 3%。該方法利用 CNN 自適應地計算參數,避免了大量的人機交互,提高了分割的準確率,同時對于 CT 圖像中肝癌具有高度多樣性這一分割難點,CNN 計算的自適應參數使得該方法具有較強的處理能力。Christ 等[18]應用級聯的全卷積神經網絡(fully convolutional neural network,FCN)和稠密三維條件隨機場(conditional random fields,CRFs)來自動分割腹部 CT 圖像中的肝臟和病變區,他們首先訓練出一個 FCN 來分割肝臟,再訓練出一個 FCN,從第一步分割出來的肝臟中進一步分割出病變區,最后用 CRFs 來細化分割結果,這將有助于改善其外觀和空間相干性。經 2 折交叉驗證,得到分割結果的 Dice 系數超過了 94%,并且每份 CT 集的計算時間低于 100 s,這表明該方法在獲得較高的分割準確率的同時也保證了較快的計算速度。
綜上所述,在機器學習方法中,對于基于 CT 圖像的肝癌分割而言,神經網絡是一種較為有效的方法,并且神經網絡通常可以實現肝癌的自動分割,加上對分割結果的優化、細化,便可能達到較高的分割準確率。
2.1.3 隨機森林
隨機森林是一種統計學習方法,其工作機制為:先用重抽樣技術——自助法(bootstrap)從原始樣本中抽取出多個樣本,并對其中每個樣本進行決策樹建模,然后結合多顆決策樹的預測,通過投票得出最終的預測結果。該方法具有預測準確率較高、對噪聲具有較好的容忍度、不易出現過擬合現象等優點。
Conze 等[19]利用基于多相聚類特征的隨機森林,設計出一種在動態增強 CT 圖像中實現半自動肝癌分割的方法,測試得到的壞死組織分割的 Dice 系數為 71.9% ± 19.5%,實質組織分割的 Dice 系數為 93.3% ± 3.08%,均強于基于單相體素、基于單相超像素以及基于多相體素方法得到的結果。該方法中利用超像素增加了分割結果的空間一致性,利用多相特征可以減少錯分的影響。后來,Conze 等[20]又提出一種新的結合超像素和隨機森林的分割方法,與之前的方法相比,通過分層多尺度樹將特征聯系起來以描述超像素,解決了一個較大的超像素中可能存在多種類型的組織這一問題。實驗表明,用基于超像素的多尺度隨機森林與基于超像素的單尺度隨機森林的相比,分割準確率有所提高:壞死組織分割的 Dice 系數由 85.3% ± 12.5% 提高到 86.9% ± 10.5%,實質組織分割的 Dice 系數由 94.3% ± 4.12% 提高到 95.5% ± 3.56%,腫瘤分割的 Dice 系數由 88.9% ± 8.51% 提高到 91.0% ± 6.99%。
綜上所述,隨機森林結合超像素來使用,分割準確率可得到明顯提升,同時如果其結合合適的圖像處理方法,對于改善分割結果也有很大的幫助。
2.2 無監督學習
無監督學習是一種對原始數據進行分類,以便了解數據內部結構的機器學習方法。與監督學習不同的是,無監督學習網絡在學習過程中并不知道其分類結果的正誤。無監督學習的目標就是要在數據集上找到某種感興趣的內在結構,也就是要找出或估計一種可能產生該數據集的概率密度。當學習完畢并經測試以后,可以將習得的網絡用到新的數據集上。
用于肝癌 CT 圖像分割的無監督學習方法主要是聚類算法。聚類是一種將數據集劃分為若干簇的無監督學習方法,它使得同類對象間相似度較高,而異類對象間相似度較低[21]。
Sajith 等[22]先用空間模糊 C 均值聚類(fuzzy c-means clustering,FCM)算法,再結合參數可變形模型,先分割出包含腫瘤的肝臟組織,進一步分割出腫瘤組織。其中模糊 C 均值聚類算法利用體素間的相似性將圖像分為多個簇,參數可變形模型則根據約束條件演進出一條曲線來趨近感興趣區的邊緣,模糊 C 均值聚類算法結合參數可變形模型可更好地檢測邊緣,從而優化分割結果。Obayya 等[23]通過兩步來分割出腹部 CT 圖像中的肝癌,第一步是對圖像進行預處理,通過形態濾波、連通分量、邊界提取等算法分割出肝臟;第二步是利用 CT 圖像上肝癌組織和正常組織灰度級上的不同,用模糊 C 均值聚類算法將像素分為 3 個不同的簇,分別為背景、肝臟和肝癌可疑區。該方法的平均成功率達到 93.3%,平均用時為 21.32 s,均強于基于區域的算法。
Ben-Cohen 等[24]在定期復查患者的 CT 圖像中,診斷并分割出肝臟轉移性病變區。他們通過結合之前的 CT 圖像,用二維的基線分割掩膜、非剛性配準及模板匹配來定位肝臟病變區和周圍組織,以縮小病變區的搜索范圍。再用自適應的區域生長和均值漂移聚類來實現肝臟病變區的分割。檢出率達 90%,分割的平均 Dice 系數為 84% ± 7%。雖然診斷和分割的效果還不錯,但是由于要用到之前的 CT 圖像來縮小處理范圍,該方法在某些情況下(如患者中途有做外科手術或病變區的大小變化過大導致肝臟變形等)存在局限性。
綜上所述,聚類算法經常用來實現基于 CT 圖像的肝癌自動分割。同時研究發現,運用聚類算法分割腫瘤時,通常會先分割出肝臟或者是定位出肝臟病變區和周圍組織,以縮小病變區的搜索范圍,在此基礎上再去分割腫瘤組織,這有助于得到較好的肝癌分割結果。
總的來說,機器學習方法也可以得到不錯的分割效果。不難發現,圖像預處理后,選取合適的特征對機器學習尤為關鍵,這樣將有助于提高分割的準確率。同時可以觀察到機器學習的分割結果受操作者主觀因素的影響相對較小。雖然部分機器學習方法存在耗時較長的缺點,但是經過算法的不斷優化后,這方面的問題在逐漸改善。
3 總結與展望
不難發現,近年來,基于 CT 圖像的肝癌病灶自動分割算法已有長足的發展。其中,非機器學習方法通常是通過給計算機一連串的指令,讓它遵照這些指令一步步執行下去,有因有果,非常明確,而機器學習則是通過訓練數據,以實現對輸入圖像的自動分割,其核心在于相關而非因果。面對一個問題時,人們更希望程序可以對以往的經驗進行存取以應用于將來的任務,機器學習恰好可以做到這一點。但是機器學習方法在某些情況下分割準確率并不高,因而許多學者希望通過將非機器學習算法與機器學習算法結合,在實現肝癌 CT 自動分割的前提下,優化分割結果,提高分割的準確率。同時,目前多數方法都傾向于自動分割,一方面,全自動的分割方法可以使沒有臨床經驗的操作者也可以獲得良好的分割結果。另一方面,交互式半自動分割方法雖然需要操作者設置一系列的參數,但是與全自動的分割方法相比,一般具有更好的分割結果[25]。這就進一步說明了各種方法都具有一定的優點和局限性。同時使用多種方法,可實現各算法間的優勢互補,從而提高分割準確率。
目前肝癌 CT 圖像分割的準確率還不夠高,肝癌分割過程中還存在一些難點,包括:① 腹部 CT 圖像具有噪聲;② 肝癌具有異質性;③ 肝癌的形狀復雜且多變等[26]。對于這些難題,可以著重在算法優化方面進行改進,例如:可以通過基于熵的模糊區域生長、用分水嶺做預處理、使用隨機森林做決策等方法來減少噪聲的影響;用 CNN 初始化水平集參數,能夠更好地處理復雜多變的腫瘤;還可用分水嶺和超像素來提高算法的效率。然而,沒有一種方法可以解決所有難題,因此適當綜合多種方法是必要的。例如研究者們可以試圖用機器學習方法初始化非機器學習方法的參數,再用非機器學習方法來分割肝癌,以便處理復雜多變的腫瘤;也可以用非機器學習方法結合先驗知識實現自動化,并用于機器學習方法的預處理或進行結果細化,從而優化分割結果。這些方法如能順利推廣到臨床應用中,或許能夠提高臨床醫師的工作效率以及保證分割的準確性,則最終將使醫生和患者都從中受益。