基于多尺度注意力機制的三維卷積神經網絡肺結節檢測算法_《生物醫學工程學雜志》

作者：

趙宇督 , 彭振偉 , 馬駿 , 夏浩 ,  萬洪林

山東師范大學物理與電子科學學院山東省醫學物理圖像處理技術重點實驗室（濟南 250358）;

關鍵詞：

肺結節檢測多尺度特征提取注意力機制三維卷積神經網絡

DOI：

10.7507/1001-5515.202011058

視頻：

導出 下載 收藏 掃碼 引用

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

基于電子計算機斷層掃描（CT）的肺結節檢測的早期篩查是降低肺癌死亡率的重要手段，而近年來三維卷積神經網絡（3D CNN）已經在肺結節檢測領域取得了成功并不斷深入發展。本文提出了一種基于多尺度注意力機制的3D CNN肺結節檢測算法。針對肺結節大小和形狀各異的特點，設計了一個多尺度的特征提取模塊，提取不同尺度的相應特征。通過注意力模塊，從空間和通道兩個角度挖掘特征間的關聯信息，對特征加強。提取出的特征進入類似金字塔的融合機制，使得特征中同時包含深層的語義信息與淺層的位置信息，更利于目標定位與邊界框回歸。在具有代表性的LUNA16數據集上，相對于目前先進的其他方法，本文方法能夠明顯地提高檢測靈敏度，可為臨床醫學提供理論參考。

引用本文： 趙宇督, 彭振偉, 馬駿, 夏浩, 萬洪林. 基于多尺度注意力機制的三維卷積神經網絡肺結節檢測算法. 生物醫學工程學雜志, 2022, 39(2): 320-328. doi: 10.7507/1001-5515.202011058 復制

引言

目前肺癌的死亡率是所有癌癥中最高的^[1]。導致肺癌的原因有吸煙、衰老、基因和空氣中有毒顆粒等，遺憾的是，人們還沒有找到有效降低癌癥發病率的方法。因此，早期篩查對于降低肺癌死亡率至關重要。由于大部分早期肺癌患者沒有明顯的臨床癥狀，也沒有特異的生物標記物，因此目前早期篩查的主要方法是采用放射影像如電子計算機斷層掃描（computed tomography，CT）來檢查肺部是否存在可疑病灶。早期肺癌大多表現為肺部結節，它們尺寸小、對比度低、形狀異質化高^[2]。如果由醫生進行人工篩查，會產生兩個問題：一是人工篩查過分依賴醫生臨床經驗，這不僅需要極高的專業度，還容易受到醫生主觀判斷的影響，準確度無法保證；二是人工讀片工作量巨大，容易造成醫生疲勞，增加誤判和漏判概率。顯然，僅僅依靠醫生人工篩查CT圖像中的肺結節是有困難的。

隨著深度學習的迅速發展，很多研究人員將卷積神經網絡（convolutional neural network，CNN）應用到CT圖像肺結節的檢測中。相比傳統機器視覺方法，深度學習可以自動提取數據的高級抽象特征，輸出特征可以直接用于識別、分類和檢測，自動化程度高，能夠更有效地區分真實結節和非結節，在提高檢測率、降低假陽性率方面獲得了較好的效果。近年來二維卷積神經網絡（two dimensional CNN，2D CNN）已經在肺結節檢測領域取得了巨大的成功。Setio等^[3]提出基于多視角的2D CNN，通過提取不同方向平面上的信息和多種不同的融合方法，在降低假陽性率方面取得了良好的效果。Li等^[4]提出了一種集成網絡，構建了三個不同輸入大小、不同深度的子網絡分別進行結節檢測，最后融合上述三個子網絡的結果。這一網絡可以直接檢測肺小結節，提高了檢測效率和精度。Zhao等^[5]提出了一種新的假陽性減少框架，與單視圖二維神經網絡集成，用于肺結節檢測。這一網絡采用基于分類的肺結節訓練方案，擴展了對代表性肺結節的學習能力。Zhang等^[6]提出了通道和空間注意力融合機制（channel and spatial mixed attention CNN，CSANet）。這一方法是在殘差網絡（residual network，ResNet）網絡中的每個階段，分別嵌入通道注意力模塊和空間注意力模塊，從而能夠更準確地定位有用的通道特征和區域特征，提高了圖像目標檢測精度。

但是采用2D CNN檢測肺結節會忽略肺結節的空間特征，影響檢測的準確率。而三維卷積神經網絡（three dimensional CNN，3D CNN）能提取到肺結節的三維特征，可以更好地結合圖像的空間信息。Ding等^[7]提出了基于深度卷積神經網絡（deep convolution neural network，DCNN）的肺結節檢測方法，并將反卷積引入到快速區域卷積神經網絡中，用于軸向切片的候選檢測，然后使用3D CNN來降低假陽性，進一步提高檢測速度和精度。Zhu等^[8]設計了一個全自動化的肺部CT癌癥診斷系統Deep Lung，設計了一種基于三維雙路徑和編碼器-解碼器結構相結合的快速卷積神經網絡，并設計了與三維雙路徑網絡相結合的梯度增強分類器（gradient boosting machine，GBM），來實現結節的分類。Lin等^[9]提出了單階段3D CNN肺結節檢測方法。首先，通過IoU自歸一化方法對分類標簽進行設置，賦予了更多的邊界盒回歸。其次，在分類器中加入maxout單元來處理肺結節類內較大的變化。此外，還引入了焦損失，有效地解決了樣本的難易不平衡問題。Ozdemir等^[10]利用檢測和診斷組件之間的耦合，提出了一種基于3D CNN的端到端的CAD系統，使用3D CNN級聯，并通過Monte Carlo dropout和deep ensembles對模型的不確定性進行了表征，在LUNA16和Kaggle數據集上有效實現了肺結節檢測和腫瘤分類任務。

為了進一步提高檢測精度，本文提出了一種基于多尺度注意力機制的3D CNN肺結節檢測網絡（multi scale 3D CNN with channel and spatial attention，MS-CSANet）。在該方法中設計了一個三維多尺度的特征提取模塊，以提取不同尺度的相應特征。通過注意力模塊，從空間和通道的角度挖掘特征間的關聯信息，對特征進行加強。提取出的特征進入類似于金字塔的融合機制，使得特征中同時包含深層的語義信息與淺層的位置信息，更利于目標定位與邊界框回歸。

1 算法設計

1.1 網絡框架

MS-CSANet以3D ResNet-18作為基礎網絡^[11]。ResNet是目標檢測領域中常用的骨干網絡，擴展為3D之后也得到了廣泛的應用。本文算法提出的網絡總共有6個stage，每個stage包含多個卷積層。受限于GPU顯存，整張CT圖像無法直接輸入到網絡，因此需要對CT圖像進行分割。首先將預處理后的CT圖像隨機地分割成96 × 96 × 96的立方體^[12]，然后將其輸入到網絡中，依次經過每個stage提取出特征圖，然后通過每個stage進行下采樣，對應著stage1～5的輸出。MS-CSANet網絡的總體框架結構如圖1所示，預處理流程示意圖如圖2所示，閾值分割大致分割出肺部區域，通過清除邊緣操作來去掉不屬于肺部區域的部分，找出所有連通區域并給它們分配標簽，通過腐蝕操作侵蝕掉前景區域的邊界，之后填補肺內的微小孔洞，最后將得到的掩模與原始圖像進行疊加操作后輸出^[13]。

圖1 MS-CSANet 總體結構 Figure1. Overall block diagram of MS-CSANet

圖選項

方法	System	0.125	0.25	0.5	1	2	4	8	CPM
Lin等^[9]	R-CNN	0.692	0.771	0.809	0.863	0.895	0.914	0.923	0.838
Dou等^[25]	3D CNN	0.659	0.745	0.819	0.865	0.906	0.933	0.946	0.839
Liao等^[26]	Deep leaky	0.662	0.746	0.815	0.864	0.902	0.918	0.932	0.834
Bray等^[27]	Deep Lung	0.692	0.769	0.824	0.865	0.893	0.917	0.933	0.842
Krizhevsky等^[28]	Deep CNN	0.672	0.694	0.714	0.739	0.766	0.787	0.822	0.742
Shi等^[29]	LIF-Net	0.702	0.746	0.797	0.842	0.861	0.915	0.936	0.828
Xie等^[30]	Deep CNN	0.734	0.744	0.763	0.796	0.824	0.832	0.834	0.790
Hu等^[31]	SE	0.655	0.745	0.807	0.849	0.880	0.907	0.925	0.824
Pezeshk等^[32]	CNN	0.637	0.723	0.804	0.865	0.907	0.938	0.952	0.832
Eun等^[33]	2D CNN	0.688	0.726	0.813	0.865	0.899	0.930	0.947	0.838
MS-CSANet（本文算法）	CSA-Net	0.697	0.759	0.826	0.871	0.902	0.919	0.935	0.844
注：表中加粗數字代表同一假陽性率下，靈敏度最高的數值

序號	平均處理時間/s
1	72.85
2	77.14
3	82.18
4	88.21
5	79.46
6	77.65
7	89.57
8	70.48
9	76.39
10	75.48
10折平均	78.94

1.	Ferlay J, Jacques I, Dikshit R, et al. Cancer incidence and mortality worldwide: sources methods and major patterns in GLOBOCAN 2012. Int J Cancer, 2015, 136(5): 359-386.
2.	Aberle D R, Adams A, MBerg C D, et al. Reduced lung-cancer mortality with low-dose computed tomographic screening. New Engl J Med, 2011, 365(5): 395-409.
3.	Setio A, Ciompi F, Litjens G, et al. Pulmonary nodule detection in CT images: false positive reduction using multi-view convolutional networks. IEEE Trans Med Imaging, 2016, 35(5): 1160-1169.
4.	Li C, Zhu G, Wu X, et al. False-positive reduction on lung nodules detection in chest radiographs by ensemble of convolutional neural networks. IEEE Access, 2018, 6: 16060-16067.
5.	Zhao J, Zhang C, Li D, et al. Combining multi-scale feature fusion with multi-attribute grading, a CNN model for benign and malignant classification of pulmonary nodules. J Digit Imaging, 2020, 33(4): 869-878.
6.	Zhang Y, Yi P, Zhou D, et al. CSANet: channel and spatial mixed attention CNN for pedestrian detection. IEEE Access, 2020, 8: 76243-76252.
7.	Ding J, Li A, Hu Z, et al. Accurate pulmonary nodule detection in computed tomography images using deep convolutional neural networks// 2017 Proceedings of the 20th Medical Image Computing and Computer Assisted Intervention. Quebec City: MICCAI, 2017: 559-567.
8.	Zhu W, Liu C, Fan W. Deep lung: 3D deep convolutional nets for automated pulmonary nodule detection and classification// 2018 Proceedings of the 2018 IEEE Winter Conference on Applications of Computer Vision. Lake Tahoe: IEEE, 2018: 673-681.
9.	Lin T Y, Dollar P, Girshick R, et al. Feature pyramid networks for object detection. IEEE Access, 2018, 13(7): 1525-1528.
10.	Ozdemir O, Russell R L, Berlin A. A 3D probabilistic deep learning system for detection and diagnosis of lung cancer using low-dose CT scans. IEEE Trans Med Imaging, 2020, 39(5): 1419-1429.
11.	Tajbakhsh N, Shin J Y, Gurudu S R. Convolutional neural networks for medical image analysis: full training or fine tuning. IEEE Trans Med Imaging, 2016, 35(5): 1299-1312.
12.	Knight S B, Crosbie P A, Balata H. Progress and prospects of early detection in lung cancer. Open Biol, 2017, 67(6): 1256-1272.
13.	Zheng S, Guo J, Cui X. Automatic pulmonary nodule detection in CT scans using convolutional neural networks based on maximum intensity projection. IEEE Trans Neur Net Lear, 2019, 39(3): 797-805.
14.	Girshick R, Donahue J, Darrell T. Rich feature hierarchies for accurate object detection and semantic segmentation// 2014 Proceedings of the 27th IEEE Conference on Computer Vision and Pattern Recognition. Columbus: IEEE, 2014: 580-587.
15.	Cao H, Liu L, Song E. A two-stage convolutional neural networks for lung nodule detection. IEEE Trans Med Imaging, 2020, 24(7): 2006-2015.
16.	Xu Q, Xiao Y, Wang D. CSA-MSO3DCNN: multiscale octave 3D CNN with channel and spatial attention for hyperspectral image classification. Remote Sensing, 2020, 12(1): 188-196.
17.	Woo S, Park J, Lee J. CBAM: convolutional block attention module// 2018 Proceedings of the 15th European Conference on Computer Vision. Munich: IEEE, 2018: 3-19.
18.	Fu J, Liu J, Tian H. Dual attention network for scene segmentation// 2019 Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach: IEEE, 2019: 1-18.
19.	Tang H, Kim D, Xie X, et al. Automated pulmonary nodule detection in CT images using deep convolutional neural networks// 2018 Proceedings of the 15th International Symposium on Biomedical Imaging. Washington: IEEE, 2018: 123-134.
20.	Prasoon A, Petersen K, Igel C. Deep feature learning for knee cartilage segmentation using a triplanar convolutional neural network// 2013 Proceedings of the 16th Medical Image Computing and Computer-Assisted Intervention. Berlin: MICCAI, 2013: 246-253.
21.	Torre L A, Bray F, Siegel R L. Global cancer statistics, 2012. CA Cancer J Clin, 2015, 65(2): 87-108.
22.	Zuo W, Zhou F, Li Z. Multi-resolution CNN and knowledge transfer for candidate classification in lung nodule detection. IEEE Access, 2019: 32510-32521.
23.	Tan M, Wu F, Yang B. Pulmonary nodule detection using hybrid two-stage 3D CNNs. Med Phys, 2020, 47(8): 3376-3388.
24.	Hara K, Kataoka H, Satoh Y. Can spatiotemporal 3D CNNs retrace the history of 2D CNNs and imagenet? // 2018 Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Lake Tahoe: IEEE, 2018: 18-22.
25.	Dou Q, Chen H, Yu L. Multilevel contextual 3D CNNs for false positive reduction in pulmonary nodule detection. IEEE Trans Bio Med Eng, 2017, 64(7): 1558-1567.
26.	Liao F, Liang M, Li Z. Evaluate the malignancy of pulmonary nodules using the 3D deep leaky noisy-or network. IEEE Trans Neur Net Lear, 2019, 30(11): 3484-3495.
27.	Bray F, Ferlay J, Soerjomataram I. Global cancer statistics 2018: global estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin, 2018, 68(6): 394-424.
28.	Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks// 2012 Proceedings of the 25th International Conference on Neural Information Processing Systems. Lake Tahoe: IEEE, 2012: 1097-1105.
29.	Shi Y, Li H, Zhang H, et al. Accurate and efficient LIF-Nets for 3D detection and recognition. IEEE Access, 2020, 8: 98562-98571.
30.	Xie H, Yang D, Sun N, et al. Automated pulmonary nodule detection in CT images using deep convolutional neural networks. Pat Rec, 2018, 85(8): 109-119.
31.	Hu J, Shen L, Albanie S. Squeeze-and-excitation networks. IEEE Trans Med Imaging, 2020, 42(8): 2011-2023.
32.	Pezeshk A, Hamidian S, Petrick N. 3D convolutional neural networks for automatic detection of pulmonary nodules in chest CT. IEEE J Biomed Health, 2019, 23(5): 2080-2090.
33.	Eun H, Kim D, Jung C. Single-view 2D CNNs with fully automatic non-nodule categorization for false positive reduction in pulmonary nodule detection. Comput Meth Prog Bio, 2018, 165(14): 215-224.
34.	Fang F, Li L, Zhu H. Combining faster R-CNN and model-driven clustering for elongated object detection. IEEE Trans Med Imaging, 2019, 16(4): 2052-2065.

方法	0.125	0.25	0.5	1	2	4	8	CPM
Res18 3D	0.662	0.746	0.815	0.864	0.902	0.918	0.932	0.834
Res18 + MSB	0.672	0.764	0.807	0.870	0.887	0.920	0.925	0.835
Res18 + CBAM	0.689	0.750	0.819	0.876	0.907	0.918	0.930	0.841
Res18 + CBAM + MSB	0.689	0.772	0.804	0.867	0.896	0.908	0.923	0.837
Res18 + MSB + CBAM	0.697	0.759	0.826	0.871	0.902	0.919	0.935	0.844
注：表中加粗數字代表同一假陽性率下，靈敏度最高的數值

方法	0.125	0.25	0.5	1	2	4	8	CPM
Res18 3D	0.662	0.746	0.815	0.864	0.902	0.918	0.932	0.834
Res18 + MSB	0.672	0.764	0.807	0.870	0.887	0.920	0.925	0.835
Res18 + CBAM	0.689	0.750	0.819	0.876	0.907	0.918	0.930	0.841
Res18 + CBAM + MSB	0.689	0.772	0.804	0.867	0.896	0.908	0.923	0.837
Res18 + MSB + CBAM	0.697	0.759	0.826	0.871	0.902	0.919	0.935	0.844
注：表中加粗數字代表同一假陽性率下，靈敏度最高的數值

方法	0.125	0.25	0.5	1	2	4	8	CPM
Res18 3D	0.662	0.746	0.815	0.864	0.902	0.918	0.932	0.834
Res18 + MSB	0.672	0.764	0.807	0.870	0.887	0.920	0.925	0.835
Res18 + CBAM	0.689	0.750	0.819	0.876	0.907	0.918	0.930	0.841
Res18 + CBAM + MSB	0.689	0.772	0.804	0.867	0.896	0.908	0.923	0.837
Res18 + MSB + CBAM	0.697	0.759	0.826	0.871	0.902	0.919	0.935	0.844
注：表中加粗數字代表同一假陽性率下，靈敏度最高的數值

《生物醫學工程學雜志》

基于多尺度注意力機制的三維卷積神經網絡肺結節檢測算法

摘要 全文 圖表 視頻 參考文獻 施引文獻 補充材料

引言

1 算法設計

1.1 網絡框架

1.2 多尺度特征提取模塊

1.3 注意力模塊

1.4 損失函數

2 算法實驗

2.1 數據集

2.2 預處理

2.3 參數設置

2.4 評估指標

2.5 實驗結果及分析

2.6 消融實驗

3 結論

引言

1 算法設計

1.1 網絡框架

1.2 多尺度特征提取模塊

1.3 注意力模塊

1.4 損失函數

2 算法實驗

2.1 數據集

2.2 預處理

2.3 參數設置

2.4 評估指標

2.5 實驗結果及分析

2.6 消融實驗

3 結論

上一篇

下一篇

Format

Content

摘要全文圖表視頻參考文獻施引文獻補充材料