肺結節計算機輔助檢測(CAD)技術能有效輔助放射科醫生提高肺結節的檢測效率和正確率,從而為肺癌的早期診斷奠定基礎。為了給CAD研究領域的學者提供借鑒與參考,推動CAD技術的發展,本文對近年來國內外基于CT 圖像的肺結節計算機輔助檢測技術的研究文獻進行綜述,介紹了肺結節CAD相關算法、流程及技術,分析了目前研究所存在的問題和不足,并提出了彌補這些不足的思路。近年來的研究表明,肺結節計算機輔助檢測技術仍有很大發展空間,針對CAD的每一個環節進行算法和流程的優化設計,對進一步提高CAD的檢測性能仍然具有重要科學價值。
引用本文: 趙愉, 魯雯, 王遠軍, 聶生東. 肺結節計算機輔助檢測技術研究概述. 生物醫學工程學雜志, 2014, 31(5): 1172-1177. doi: 10.7507/1001-5515.20140222 復制
引言
肺癌是一種常見的惡性腫瘤,其死亡率位居所有癌癥之首。醫學資料表明,80%以上的肺癌患者在發現時已是晚期,失去了最佳治療時機[1]。晚期肺癌患者五年生存率不到15%,而早期肺癌患者的五年生存率則為40%~70%,可見肺癌的生存率與治療時機密切相關[2-3]。
目前醫學上肺癌的早期診斷多從檢測肺結節入手。文獻表明肺結節不一定就是肺癌,但肺癌經常表現為肺結節,通過對早期肺結節的準確檢測,配合手術切除或藥物治療,可大大提高肺癌患者的生存率;而另一方面,由于結節并非全是肺癌,若對早期肺結節良惡性判斷失誤,將良性結節誤診為肺癌,也會給患者帶來不必要的心理和生理負擔,所以針對肺結節檢測的研究意義重大。
目前常用的肺結節檢測方法有計算機斷層掃描(computed tomography,CT)檢查與細胞學診斷。細胞學診斷是惡性腫瘤診斷的“金標準”之一,然而耗時較長,成本過高,還需要直接從患者體內提取樣本,CT技術的誕生一定程度上減輕了患者的生理痛苦。現代CT技術已能很好地顯現肺部細微結構,因此被廣泛地應用在肺結節檢測領域。但是,隨著該技術的更新換代與CT普檢的規模化,在擴大結節檢測范圍的同時,也大大增加了醫生人工檢測的難度與工作量,常規肉眼診斷不可避免會產生錯誤與遺漏[4]。因此,以計算機輔助檢測(computer-aided detection,CAD)技術為基礎的輔助診斷系統應運而生。CAD系統可以自動或半自動檢測肺結節,向放射科醫生提供“第二意見”[5]。大量文獻表明CAD系統能夠減少醫生工作量,提高醫務工作效率,增加診斷準確度[1, 6]。
肺結節CAD系統經歷了以下革新:① 技術層面:從早期醫院自行開發的有簡單篩選功能的肺結節檢測技術,發展為結構復雜、規模龐大且功能多樣化的大型專家系統[6];② 認識層面:已走出CAD系統全自動診斷的誤區,明確了CAD輔助診斷的地位[1];③ 功能層面:CAD系統主要功能從過去提高真陽性、尋找肺結節為主,擴展到如今以風險評估、可能性預測、病理分析為主的更深層次功能[2]。
然而,CAD技術經歷了近20年的發展仍然存在不少問題,我國與國外相關研究仍存在較大差距。即使是國外的最新研究,檢測結果中仍然假陽性偏高,檢測針對性較窄(只適用于實質性結節),試驗結果重復性較差[1]。
造成上述問題的主要原因有:① CAD處理對象的局限性。由于結節形態大小不一,可供研究的結節病例較少,多數研究者又都忽略了亞實質性結節,僅把實驗對象局限于實質性結節[6]。② CAD系統研究的單一性。由于工作量大,大多數文獻僅僅對CAD系統中的一小部分進行了專題研究,忽略了對整個CAD流程的兼容與匹配;③ CAD試驗結果的不可驗證性。由于各文獻報道的試驗采用結節數據集不盡相同,因此難以對報道方法的優劣進行評判。
針對上述問題,本文對以CT 圖像為基礎的肺結節CAD技術進行綜述和討論。在介紹目前國內外相關研究的基礎上,分析了目前CAD研究所存在的不足和問題,并提出了彌補這些不足的思路。
1 基于CT圖像肺結節CAD系統的搭建
1.1 CAD系統流程圖
文獻[1]闡述了CAD系統的目標,即通過建立合適的肺結節模型,開發假陽性低且敏感性高的檢測流程,用來正確檢測肺結節。文獻[2]把CAD系統分為五個步驟:“圖像獲取(acquisition)”、“預處理(pre-processing)”、“肺實質分割(the lung segmentation)” 、“結節檢測(nodule detection)” 以及“假陽性降低 (false positives reduction)”,構成最傳統的CAD系統。文獻[6]敘述了按照傳統CAD流程所實現的各步驟具體算法。目前大多數文獻仍采用耗時較短、容易理解與認可的傳統CAD系統。
1.2 圖像讀取
圖像讀取的本質,就是使用計算機系統,直接或間接讀取實驗圖像。直接讀取是指結合CT儀器等硬件設備,直接從設備獲取圖像。間接讀取則是通過存入電腦的私人或集體的數據集來獲取圖像。由于大型醫療采集設備匱乏,難以直接導入圖像,因此肺結節研究往往采用間接讀取的方式。現有肺部CT圖像數據庫中較為常用的是肺影像數據庫聯盟[7](Lung Imaging Database Consortium,LIDC),總共包含68個病例,約10 000張全肺CT掃描圖像,每個病例對應一個注釋文件(XML格式)。注釋文件中,4名放射學專家對每張CT片出現的結節感興趣區輪廓曲線與結節進行定義,并對結節主要CT特征進行量化。文獻[8]具體闡述了CT放射劑量與CT成像之間的聯系,結合現有肺圖像數據庫,能夠充分還原數據,使間接獲取的圖像具有與直接獲取圖像相同的影像學效果。
1.3 預處理
預處理主要應用在圖像分割與特征提取之前,主要內容包括圖像增強與格式轉換。圖像增強的目的是在保留原始數據的同時,盡可能地去除偽影和噪聲,增強圖像對比度和細節分辨率,使感興趣區域灰度范圍拉開,從而改善圖像視覺效果。
常用的CT圖像增強方法有兩種形式:
(1) 直接圖像增強。常用的方法有直方圖均衡化(histogram equalization)、中值濾波(ISODATA聚類)、小波濾波(wavelet filtering)和混合濾波(hybrid filter)[9]。此類增強方法在改善圖像質量的同時,有可能改變原有的CT數據,從而對后續特征提取和肺結節檢測等環節造成干擾。
(2)視覺效果增強。這種方式在顯示時,是對一個特定的灰度范圍進行拉伸,以達到增強特定目標視覺效果的目的。由于各種組織結構或病變部位具有不同的CT值,通過選擇合適的窗寬、窗位,可以將位于選定“窗口”中的灰度值映射到整個顯示動態范圍,以增強感興趣區域內容的視覺效果。該增強形式可以有效地為后續樣本的采集和邊界劃分提供幫助。
由于直接圖像增強可能對CT圖像產生負面影響,目前CAD常用的增強形式仍是基于視覺效果的圖像增強方式,抑或是直接忽略圖像增強這一步驟,因為與分割與檢測相比,該步驟在CAD系統里的重要性相對較小。
1.4 肺實質與肺結節分割
肺實質分割即明確肺葉區域并排除冗余部分(redundancy),良好的肺實質分割能夠提高檢測準確性,并減少檢測時間。文獻[10]論述了肺實質分割的病理依據與理論基礎。而肺結節分割則是確立結節感興趣區,為后期結節特征提取打好基礎。肺實質與肺結節分割的方法較多,常用的有全自動分割、半自動分割與交互式分割。半自動分割依賴于閾值與種子點的選取。關于肺實質分割,文獻[10]提出了一種基于自動閾值分割的方法,減少了肺實質分割中的閾值輸入操作;文獻[11]在肺分割環節分別引入了圖像增強變換與邊界跟蹤,使肺實質自動分割更加精確。關于肺結節分割,文獻[12]結合形態學研究,能夠較好地將不容易通過閾值分割的早期結節分割出來;文獻[13]與文獻[14]分別提出了一種基于整體三維形態與統計意義的結節自動分割方法,起到了不錯的分割效果。總體來說,與半自動分割相比,全自動肺實質分割有著速度快、適用性廣等特點;與交互式分割相比,全自動分割也有著結構簡單、人為操作少等特點。因此,全自動分割更適合用于肺結節CAD系統。
1.5 肺結節檢測
按照文獻[2]與文獻[15]中關于肺結節檢測的描述,肺結節檢測定義為:通過形態學或紋理學,判斷肺腔中結節是否存在,確定肺結節位置和真假陽性,其實質是以肺CT圖像集為輸入、肺結節空間標識為輸出的一套自動搜索系統。目前有兩大類肺結節檢測方法,即基于三維的模板匹配與基于統計與灰度值的二維檢測方法[16]。
對于二維檢測來說,檢測方法遵循以下步驟:① 種子點檢測;② 種子點生長;③ 感興趣區域提取;④ 確定可疑結節[16]。種子點通常根據統計學中結節的灰度值范圍來進行選擇,通過計算生長后區域面積、局部對比度和圓形度等數據,判斷可疑結節。可以看出,二維檢測方法的結果很不精確,無法對不同種類結節選擇合理的種子點,而且對空間位置要求較高,一般只適于肺腔內與肺膜不相連的結節,若結節本身與肺膜有粘連,該結節很可能被遺漏。同時,這種方法很容易受到肺部類似組織(支氣管、血管)的干擾。
三維模板匹配是在三維空間上建立一個相對大小的肺結節模板,通過計算模板與圖像的相關系數作為閾值進行匹配,這種方法與二維檢測相比可有效減少相關組織干擾。具體過程為:① 模板建立;② 模板在圖像中遍歷并計算相關性;③ 閾值化相關圖,定位結節。閾值越小,檢出結節越多,敏感性增加,但假陽性也會增加。文獻[17]針對普通模板匹配假陽性高、面向范圍窄等特點(往往一種模板只能對應一種類型的結節),提出了結合模板匹配與Hessian矩陣的方法,該方法在檢測環節能很好地降低假陽性率。文獻[18]則結合了模板匹配與遺傳算法(genetic algorithm,GA),解決了針對不同類型結節的模板匹配問題。
上述兩種檢測方法各有優缺點,總的來說,兩種算法準確率都較高,也存在一定假陽性率。不同之處是二維算法速度很快、檢測方便,但假陽率較高,只適合少部分類型的結節;三維方法的假陽率略低,但速度較慢,多種模板又會增加檢測算法的復雜性。
1.6 肺結節假陽性率降低策略
大量文獻表明,在CAD系統肺結節檢測環節中得到的可疑肺結節假陽性程度較高[1, 2, 19],而且結節屬性未知(良性抑或惡性),因此在檢測后,數據需要進行假陽性抑制。抑制肺結節假陽性率的方法有兩種:第一種是在結節檢測環節中進行降低假陽性率的處理,這種方法會使初檢范圍縮小,導致大量結節漏檢,檢測敏感性大大降低,同時也會大幅度延長整個CAD流程,故已被淘汰。第二種方法是在肺結節檢測環節后進行降低假陽性率的處理。早期文獻中引入BP(back propogation)神經網絡分類器,采集少量結節特征代入分類器,通過優化分類器的方法來起到降低假陽性率的效果。顯然這樣的降低是以強學習(reinforcement learning)為基礎的,初期可能有一定的假陽性降低效果,這很大程度上是因為早期結節數據量較少,而且文獻中提出的方法僅僅考慮了其中一種類型結節的緣故。
目前常用的肺結節分類器有貝葉斯分類器(Bayesian classifier)、支持向量機(support vector machine,SVM)[20-21]、學習向量量化(learning vector quantization,LVQ)神經網絡、自組織特征映射 (self organizing maps,SOM) 分類器,以及綜合其它分類器的多態分類器(polymorphic classifier)[19]。文獻[22]使用不太常用的模糊k均值分類,起到了很好的效果。各種分類器研究均是在BP神經網絡的基礎上發展起來的,或多或少都存在強化學習問題,同樣也受到訓練數據集大小與采集樣本本身的局限。
所有分類器中SVM分類器的準確度比較好,但SVM算法由于投票系統的存在,有耗時過長的不足,故適合結節檢測的分類器是BP神經網絡與貝葉斯分類器。而且,對于肺結節檢測研究來說,過分準確的分類器無法進一步提高檢測準確度,只會增加后續研究諸如特征選取與特征優化的難度。
后期的文獻意識到分類器的局限與不精確,諸多文獻把目光投向特征提取上,誕生了許多描述不同特征的文獻。此類文獻有三大類特征:
(1)形態學特征(morphological characteristics)[23],包括:邊緣特征(edge features,包括邊界平均清晰度、邊界方差清晰度等)[24]、周長面積特征(perimeter area feature,包括結節周長、結節面積和結節面積周長比等)、直徑特征(diameter characteristics,包括最大直徑、最小直徑和直徑范圍)、毛刺點特征(burr point features,關鍵點個數百分比、毛刺平均角度、毛刺方差角度、最小凸角、最大凹角、凸角率、凹角率和平角率等)[24]、灰度特征(gray features,如平均灰度、方差和灰度值等)[25]、中心距離(features of center distance,包括距離范圍、距離方差和平均距離等),以及三維空間位置(features of 3D spatial location)[26]和徑向偏移度(radial offset features)等。
(2)紋理特征(texture features)[27],包括:灰度共生矩陣Glcm(contrast,correlation,energy,homogeneity)[28]和Tamura紋理特征(粗糙度、對比度、方向度、線性度、規則度和粗略度)。
(3)特殊定義生物特征(special definition features),包括:小波分析特征(wavelet features,不同次數迭代可對應不同特征)、garbor紋理特征(對應不同角度有不同特征值)和分形特征(fractal features)。
一般而言,特征無絕對意義上的有效與無效,但有對分類貢獻大小之分,貢獻大,即分類質量好。對于評估單一特征的分類質量,貝葉斯決策算法最為直觀。通過兩類擁有某個相同特征的物體建立對應的偽貝葉斯分布曲線,積分求出兩曲線的重合度(即重疊面積所占整體的百分比)。重合度高說明對于這兩類特征分類效果不顯著,反之則分類效果顯著。
實驗發現,基于不同種類結節分類的特征重合度都偏高,可見目前仍然沒有一種完美的特征可輕松分辨結節類型。在結節特征提取問題上,還有待后續研究。
相對而言,依據紋理學角度建立的偽貝葉斯曲線重合度小于基于形態學的曲線重合度,平均受試者工作特征曲線(receiver operating characteristic curve,ROC)最大面積也大于后者,即基于紋理學角度的特征對肺結節假陽性降低的意義要大于普通形態學特征。
隨著特征數增多,檢測時間會大幅度延長。實驗表明,上述特征存在優劣權重,每個特征對于分類效果影響往往不同,因此特征優化必不可少。文獻[29]對特征選擇進行實驗分析,綜合敘述了特征評價方法,引入ROC曲線來反映特征分類好壞,并引入交叉驗證(cross-validation)方法來驗證泛化能力。后來研究者們通過貝葉斯決策(Bayesian decision)、主成分分析(principal component analysis,PCA)、線性判別分析(linear discriminant analysis,LDA)[21]以及遺傳算法來優化特征集,均取得不錯的優化效果。
PCA、LDA降維能大大縮短標準貝葉斯決策分類與標準BP神經網絡分類所用的時間,準確率相比標準貝葉斯分類有所提高,但略遜于BP神經網絡分類,可能是由于在降維過程中進行信息壓縮導致信息的丟失。一般而言LDA是特征降維的較好方法。
一個降低假陽性率的模塊,就能獨立形成一個CAD系統[3],輸入為可疑結節,經過特征提取、特征優化、分類器構建、ROC曲線檢驗等四個步驟,最終判定可疑部位是否為結節;進一步分析該結節是良性還是惡性,實質性還是非實質性;甚至可對整個病灶部位進行更深層次的預測和風險評估。
實驗表明,新型的假陽性降低系統可以經歷兩次分類循環,第一次通過空間形態特征確定結節類型[3],第二次根據可疑結節的類型,選擇適當特征進行真假陽性判定,該方法與單獨一次分類相比,結果更精確。一個合理的假陽性降低CAD系統能夠改善前期檢測中假陽性高的問題,并大大縮短CAD流程時間,提高精確度。
2 問題與展望
肺結節檢測技術自CT設備問世以來在學界引起了廣泛關注,如今已有許多相關實驗研究,但該技術在整體運行時間、檢測假陽性率、準確率與敏感性方面始終有所欠缺。根據前述研究結果顯示,CAD系統在完善地投入商業領域之前,仍需要解決以下問題:① 圖像增強環節中,缺乏有關圖像增強對結節特征提取質量影響的實驗研究;② 肺結節與肺實質環節中,相關研究缺乏肺實質與肺結節的金標準;③ 特征提取環節之前,選擇提取特征的平面技術(把一個三維結節全部信息投影到二維平面的方法)尚未成熟;④ 特征提取環節,已有的肺結節特征都不甚理想,可能存在更好的肺結節分類特征;⑤ 特征提取環節之后,缺乏有效的評估方法,無法判斷不同數據集下算法的優劣,現有的評估方法只針對商業軟件且尚在起步階段[30];⑥ 對整個CAD系統結構來說,尚未開展關于多種結節分類的兩次分類法的研究;⑦ 對CAD系統最終結果而言,目前所有檢測結果均以真陽性結節準確率為目標,更進一步的病例分析與風險評估研究較少。
綜上所述,肺結節CAD技術仍有很大發展空間,建立和改善CAD的每一個環節,具有很大的研究價值。通過建立一整套成熟的CAD系統,能更好地輔助醫生對肺結節的檢出與判斷,有助于提高患者生存率,改善其生活質量,具有廣闊的應用前景。
引言
肺癌是一種常見的惡性腫瘤,其死亡率位居所有癌癥之首。醫學資料表明,80%以上的肺癌患者在發現時已是晚期,失去了最佳治療時機[1]。晚期肺癌患者五年生存率不到15%,而早期肺癌患者的五年生存率則為40%~70%,可見肺癌的生存率與治療時機密切相關[2-3]。
目前醫學上肺癌的早期診斷多從檢測肺結節入手。文獻表明肺結節不一定就是肺癌,但肺癌經常表現為肺結節,通過對早期肺結節的準確檢測,配合手術切除或藥物治療,可大大提高肺癌患者的生存率;而另一方面,由于結節并非全是肺癌,若對早期肺結節良惡性判斷失誤,將良性結節誤診為肺癌,也會給患者帶來不必要的心理和生理負擔,所以針對肺結節檢測的研究意義重大。
目前常用的肺結節檢測方法有計算機斷層掃描(computed tomography,CT)檢查與細胞學診斷。細胞學診斷是惡性腫瘤診斷的“金標準”之一,然而耗時較長,成本過高,還需要直接從患者體內提取樣本,CT技術的誕生一定程度上減輕了患者的生理痛苦。現代CT技術已能很好地顯現肺部細微結構,因此被廣泛地應用在肺結節檢測領域。但是,隨著該技術的更新換代與CT普檢的規模化,在擴大結節檢測范圍的同時,也大大增加了醫生人工檢測的難度與工作量,常規肉眼診斷不可避免會產生錯誤與遺漏[4]。因此,以計算機輔助檢測(computer-aided detection,CAD)技術為基礎的輔助診斷系統應運而生。CAD系統可以自動或半自動檢測肺結節,向放射科醫生提供“第二意見”[5]。大量文獻表明CAD系統能夠減少醫生工作量,提高醫務工作效率,增加診斷準確度[1, 6]。
肺結節CAD系統經歷了以下革新:① 技術層面:從早期醫院自行開發的有簡單篩選功能的肺結節檢測技術,發展為結構復雜、規模龐大且功能多樣化的大型專家系統[6];② 認識層面:已走出CAD系統全自動診斷的誤區,明確了CAD輔助診斷的地位[1];③ 功能層面:CAD系統主要功能從過去提高真陽性、尋找肺結節為主,擴展到如今以風險評估、可能性預測、病理分析為主的更深層次功能[2]。
然而,CAD技術經歷了近20年的發展仍然存在不少問題,我國與國外相關研究仍存在較大差距。即使是國外的最新研究,檢測結果中仍然假陽性偏高,檢測針對性較窄(只適用于實質性結節),試驗結果重復性較差[1]。
造成上述問題的主要原因有:① CAD處理對象的局限性。由于結節形態大小不一,可供研究的結節病例較少,多數研究者又都忽略了亞實質性結節,僅把實驗對象局限于實質性結節[6]。② CAD系統研究的單一性。由于工作量大,大多數文獻僅僅對CAD系統中的一小部分進行了專題研究,忽略了對整個CAD流程的兼容與匹配;③ CAD試驗結果的不可驗證性。由于各文獻報道的試驗采用結節數據集不盡相同,因此難以對報道方法的優劣進行評判。
針對上述問題,本文對以CT 圖像為基礎的肺結節CAD技術進行綜述和討論。在介紹目前國內外相關研究的基礎上,分析了目前CAD研究所存在的不足和問題,并提出了彌補這些不足的思路。
1 基于CT圖像肺結節CAD系統的搭建
1.1 CAD系統流程圖
文獻[1]闡述了CAD系統的目標,即通過建立合適的肺結節模型,開發假陽性低且敏感性高的檢測流程,用來正確檢測肺結節。文獻[2]把CAD系統分為五個步驟:“圖像獲取(acquisition)”、“預處理(pre-processing)”、“肺實質分割(the lung segmentation)” 、“結節檢測(nodule detection)” 以及“假陽性降低 (false positives reduction)”,構成最傳統的CAD系統。文獻[6]敘述了按照傳統CAD流程所實現的各步驟具體算法。目前大多數文獻仍采用耗時較短、容易理解與認可的傳統CAD系統。
1.2 圖像讀取
圖像讀取的本質,就是使用計算機系統,直接或間接讀取實驗圖像。直接讀取是指結合CT儀器等硬件設備,直接從設備獲取圖像。間接讀取則是通過存入電腦的私人或集體的數據集來獲取圖像。由于大型醫療采集設備匱乏,難以直接導入圖像,因此肺結節研究往往采用間接讀取的方式。現有肺部CT圖像數據庫中較為常用的是肺影像數據庫聯盟[7](Lung Imaging Database Consortium,LIDC),總共包含68個病例,約10 000張全肺CT掃描圖像,每個病例對應一個注釋文件(XML格式)。注釋文件中,4名放射學專家對每張CT片出現的結節感興趣區輪廓曲線與結節進行定義,并對結節主要CT特征進行量化。文獻[8]具體闡述了CT放射劑量與CT成像之間的聯系,結合現有肺圖像數據庫,能夠充分還原數據,使間接獲取的圖像具有與直接獲取圖像相同的影像學效果。
1.3 預處理
預處理主要應用在圖像分割與特征提取之前,主要內容包括圖像增強與格式轉換。圖像增強的目的是在保留原始數據的同時,盡可能地去除偽影和噪聲,增強圖像對比度和細節分辨率,使感興趣區域灰度范圍拉開,從而改善圖像視覺效果。
常用的CT圖像增強方法有兩種形式:
(1) 直接圖像增強。常用的方法有直方圖均衡化(histogram equalization)、中值濾波(ISODATA聚類)、小波濾波(wavelet filtering)和混合濾波(hybrid filter)[9]。此類增強方法在改善圖像質量的同時,有可能改變原有的CT數據,從而對后續特征提取和肺結節檢測等環節造成干擾。
(2)視覺效果增強。這種方式在顯示時,是對一個特定的灰度范圍進行拉伸,以達到增強特定目標視覺效果的目的。由于各種組織結構或病變部位具有不同的CT值,通過選擇合適的窗寬、窗位,可以將位于選定“窗口”中的灰度值映射到整個顯示動態范圍,以增強感興趣區域內容的視覺效果。該增強形式可以有效地為后續樣本的采集和邊界劃分提供幫助。
由于直接圖像增強可能對CT圖像產生負面影響,目前CAD常用的增強形式仍是基于視覺效果的圖像增強方式,抑或是直接忽略圖像增強這一步驟,因為與分割與檢測相比,該步驟在CAD系統里的重要性相對較小。
1.4 肺實質與肺結節分割
肺實質分割即明確肺葉區域并排除冗余部分(redundancy),良好的肺實質分割能夠提高檢測準確性,并減少檢測時間。文獻[10]論述了肺實質分割的病理依據與理論基礎。而肺結節分割則是確立結節感興趣區,為后期結節特征提取打好基礎。肺實質與肺結節分割的方法較多,常用的有全自動分割、半自動分割與交互式分割。半自動分割依賴于閾值與種子點的選取。關于肺實質分割,文獻[10]提出了一種基于自動閾值分割的方法,減少了肺實質分割中的閾值輸入操作;文獻[11]在肺分割環節分別引入了圖像增強變換與邊界跟蹤,使肺實質自動分割更加精確。關于肺結節分割,文獻[12]結合形態學研究,能夠較好地將不容易通過閾值分割的早期結節分割出來;文獻[13]與文獻[14]分別提出了一種基于整體三維形態與統計意義的結節自動分割方法,起到了不錯的分割效果。總體來說,與半自動分割相比,全自動肺實質分割有著速度快、適用性廣等特點;與交互式分割相比,全自動分割也有著結構簡單、人為操作少等特點。因此,全自動分割更適合用于肺結節CAD系統。
1.5 肺結節檢測
按照文獻[2]與文獻[15]中關于肺結節檢測的描述,肺結節檢測定義為:通過形態學或紋理學,判斷肺腔中結節是否存在,確定肺結節位置和真假陽性,其實質是以肺CT圖像集為輸入、肺結節空間標識為輸出的一套自動搜索系統。目前有兩大類肺結節檢測方法,即基于三維的模板匹配與基于統計與灰度值的二維檢測方法[16]。
對于二維檢測來說,檢測方法遵循以下步驟:① 種子點檢測;② 種子點生長;③ 感興趣區域提取;④ 確定可疑結節[16]。種子點通常根據統計學中結節的灰度值范圍來進行選擇,通過計算生長后區域面積、局部對比度和圓形度等數據,判斷可疑結節。可以看出,二維檢測方法的結果很不精確,無法對不同種類結節選擇合理的種子點,而且對空間位置要求較高,一般只適于肺腔內與肺膜不相連的結節,若結節本身與肺膜有粘連,該結節很可能被遺漏。同時,這種方法很容易受到肺部類似組織(支氣管、血管)的干擾。
三維模板匹配是在三維空間上建立一個相對大小的肺結節模板,通過計算模板與圖像的相關系數作為閾值進行匹配,這種方法與二維檢測相比可有效減少相關組織干擾。具體過程為:① 模板建立;② 模板在圖像中遍歷并計算相關性;③ 閾值化相關圖,定位結節。閾值越小,檢出結節越多,敏感性增加,但假陽性也會增加。文獻[17]針對普通模板匹配假陽性高、面向范圍窄等特點(往往一種模板只能對應一種類型的結節),提出了結合模板匹配與Hessian矩陣的方法,該方法在檢測環節能很好地降低假陽性率。文獻[18]則結合了模板匹配與遺傳算法(genetic algorithm,GA),解決了針對不同類型結節的模板匹配問題。
上述兩種檢測方法各有優缺點,總的來說,兩種算法準確率都較高,也存在一定假陽性率。不同之處是二維算法速度很快、檢測方便,但假陽率較高,只適合少部分類型的結節;三維方法的假陽率略低,但速度較慢,多種模板又會增加檢測算法的復雜性。
1.6 肺結節假陽性率降低策略
大量文獻表明,在CAD系統肺結節檢測環節中得到的可疑肺結節假陽性程度較高[1, 2, 19],而且結節屬性未知(良性抑或惡性),因此在檢測后,數據需要進行假陽性抑制。抑制肺結節假陽性率的方法有兩種:第一種是在結節檢測環節中進行降低假陽性率的處理,這種方法會使初檢范圍縮小,導致大量結節漏檢,檢測敏感性大大降低,同時也會大幅度延長整個CAD流程,故已被淘汰。第二種方法是在肺結節檢測環節后進行降低假陽性率的處理。早期文獻中引入BP(back propogation)神經網絡分類器,采集少量結節特征代入分類器,通過優化分類器的方法來起到降低假陽性率的效果。顯然這樣的降低是以強學習(reinforcement learning)為基礎的,初期可能有一定的假陽性降低效果,這很大程度上是因為早期結節數據量較少,而且文獻中提出的方法僅僅考慮了其中一種類型結節的緣故。
目前常用的肺結節分類器有貝葉斯分類器(Bayesian classifier)、支持向量機(support vector machine,SVM)[20-21]、學習向量量化(learning vector quantization,LVQ)神經網絡、自組織特征映射 (self organizing maps,SOM) 分類器,以及綜合其它分類器的多態分類器(polymorphic classifier)[19]。文獻[22]使用不太常用的模糊k均值分類,起到了很好的效果。各種分類器研究均是在BP神經網絡的基礎上發展起來的,或多或少都存在強化學習問題,同樣也受到訓練數據集大小與采集樣本本身的局限。
所有分類器中SVM分類器的準確度比較好,但SVM算法由于投票系統的存在,有耗時過長的不足,故適合結節檢測的分類器是BP神經網絡與貝葉斯分類器。而且,對于肺結節檢測研究來說,過分準確的分類器無法進一步提高檢測準確度,只會增加后續研究諸如特征選取與特征優化的難度。
后期的文獻意識到分類器的局限與不精確,諸多文獻把目光投向特征提取上,誕生了許多描述不同特征的文獻。此類文獻有三大類特征:
(1)形態學特征(morphological characteristics)[23],包括:邊緣特征(edge features,包括邊界平均清晰度、邊界方差清晰度等)[24]、周長面積特征(perimeter area feature,包括結節周長、結節面積和結節面積周長比等)、直徑特征(diameter characteristics,包括最大直徑、最小直徑和直徑范圍)、毛刺點特征(burr point features,關鍵點個數百分比、毛刺平均角度、毛刺方差角度、最小凸角、最大凹角、凸角率、凹角率和平角率等)[24]、灰度特征(gray features,如平均灰度、方差和灰度值等)[25]、中心距離(features of center distance,包括距離范圍、距離方差和平均距離等),以及三維空間位置(features of 3D spatial location)[26]和徑向偏移度(radial offset features)等。
(2)紋理特征(texture features)[27],包括:灰度共生矩陣Glcm(contrast,correlation,energy,homogeneity)[28]和Tamura紋理特征(粗糙度、對比度、方向度、線性度、規則度和粗略度)。
(3)特殊定義生物特征(special definition features),包括:小波分析特征(wavelet features,不同次數迭代可對應不同特征)、garbor紋理特征(對應不同角度有不同特征值)和分形特征(fractal features)。
一般而言,特征無絕對意義上的有效與無效,但有對分類貢獻大小之分,貢獻大,即分類質量好。對于評估單一特征的分類質量,貝葉斯決策算法最為直觀。通過兩類擁有某個相同特征的物體建立對應的偽貝葉斯分布曲線,積分求出兩曲線的重合度(即重疊面積所占整體的百分比)。重合度高說明對于這兩類特征分類效果不顯著,反之則分類效果顯著。
實驗發現,基于不同種類結節分類的特征重合度都偏高,可見目前仍然沒有一種完美的特征可輕松分辨結節類型。在結節特征提取問題上,還有待后續研究。
相對而言,依據紋理學角度建立的偽貝葉斯曲線重合度小于基于形態學的曲線重合度,平均受試者工作特征曲線(receiver operating characteristic curve,ROC)最大面積也大于后者,即基于紋理學角度的特征對肺結節假陽性降低的意義要大于普通形態學特征。
隨著特征數增多,檢測時間會大幅度延長。實驗表明,上述特征存在優劣權重,每個特征對于分類效果影響往往不同,因此特征優化必不可少。文獻[29]對特征選擇進行實驗分析,綜合敘述了特征評價方法,引入ROC曲線來反映特征分類好壞,并引入交叉驗證(cross-validation)方法來驗證泛化能力。后來研究者們通過貝葉斯決策(Bayesian decision)、主成分分析(principal component analysis,PCA)、線性判別分析(linear discriminant analysis,LDA)[21]以及遺傳算法來優化特征集,均取得不錯的優化效果。
PCA、LDA降維能大大縮短標準貝葉斯決策分類與標準BP神經網絡分類所用的時間,準確率相比標準貝葉斯分類有所提高,但略遜于BP神經網絡分類,可能是由于在降維過程中進行信息壓縮導致信息的丟失。一般而言LDA是特征降維的較好方法。
一個降低假陽性率的模塊,就能獨立形成一個CAD系統[3],輸入為可疑結節,經過特征提取、特征優化、分類器構建、ROC曲線檢驗等四個步驟,最終判定可疑部位是否為結節;進一步分析該結節是良性還是惡性,實質性還是非實質性;甚至可對整個病灶部位進行更深層次的預測和風險評估。
實驗表明,新型的假陽性降低系統可以經歷兩次分類循環,第一次通過空間形態特征確定結節類型[3],第二次根據可疑結節的類型,選擇適當特征進行真假陽性判定,該方法與單獨一次分類相比,結果更精確。一個合理的假陽性降低CAD系統能夠改善前期檢測中假陽性高的問題,并大大縮短CAD流程時間,提高精確度。
2 問題與展望
肺結節檢測技術自CT設備問世以來在學界引起了廣泛關注,如今已有許多相關實驗研究,但該技術在整體運行時間、檢測假陽性率、準確率與敏感性方面始終有所欠缺。根據前述研究結果顯示,CAD系統在完善地投入商業領域之前,仍需要解決以下問題:① 圖像增強環節中,缺乏有關圖像增強對結節特征提取質量影響的實驗研究;② 肺結節與肺實質環節中,相關研究缺乏肺實質與肺結節的金標準;③ 特征提取環節之前,選擇提取特征的平面技術(把一個三維結節全部信息投影到二維平面的方法)尚未成熟;④ 特征提取環節,已有的肺結節特征都不甚理想,可能存在更好的肺結節分類特征;⑤ 特征提取環節之后,缺乏有效的評估方法,無法判斷不同數據集下算法的優劣,現有的評估方法只針對商業軟件且尚在起步階段[30];⑥ 對整個CAD系統結構來說,尚未開展關于多種結節分類的兩次分類法的研究;⑦ 對CAD系統最終結果而言,目前所有檢測結果均以真陽性結節準確率為目標,更進一步的病例分析與風險評估研究較少。
綜上所述,肺結節CAD技術仍有很大發展空間,建立和改善CAD的每一個環節,具有很大的研究價值。通過建立一整套成熟的CAD系統,能更好地輔助醫生對肺結節的檢出與判斷,有助于提高患者生存率,改善其生活質量,具有廣闊的應用前景。