深度學習在細胞核分割中具有重要作用,但在病理診斷中仍面臨著細胞核圖像的細微特征難以提取、核邊緣模糊等問題。針對上述問題,本文提出了一種結合注意力機制的細胞核分割網絡。該網絡使用U型網絡(UNet)作為基本結構,以深度可分離殘差卷積(DSRC)模塊作為特征編碼,避免丟失細胞核邊界信息;特征解碼引入坐標注意力(CA)加強特征空間上遠程距離,突出細胞核位置的關鍵信息;最后,設計語義信息融合(SIF)模塊整合深淺層特征,改善分割效果。在2018數據科學碗(DSB2018)和三陰乳腺癌(TNBC)數據集上分別進行實驗,所提方法的精確率在兩個數據集上分別為92.01%、89.21%,靈敏度為90.09%、91.10%,平均交并比為89.01%、89.12%。實驗結果表明,本文所提方法能有效分割細胞核細微區域,提升分割準確度,為臨床診斷提供可靠依據。
引用本文: 支佩佩, 鄧健志, 鐘震霄. 基于卷積和注意力機制的醫學細胞核圖像分割網絡. 生物醫學工程學雜志, 2022, 39(4): 730-739. doi: 10.7507/1001-5515.202112013 復制
引言
醫學細胞核圖像的分割結果是病理診斷的重要依據,能為醫生提供更多關于病情的判斷,并能輔助醫生制定相應的手術治療計劃等。但即便是有經驗的專家,在視覺疲勞的情況下,要從病理圖像中辨別出病變部位,仍存在漏診和誤診的可能,影響判斷[1]。同時在細胞核分割時可能出現核邊界模糊、形態微小、細胞黏附或重疊等現象,導致在確定細胞核位置和形狀時存在較大困難,影響細胞核分割的準確性。所以,利用計算機輔助技術實現準確的細胞核分割在病理診斷中具有重要的現實意義。
目前對細胞核分割所采用方法分為傳統分割方法和基于深度學習分割方法。其中傳統分割方法有基于閾值分割[2]、分水嶺分割[3]、形態學處理[4]等。基于閾值分割方法根據設定閾值或參數劃分圖像像素信息分割細胞核,該方法操作簡單、容易計算,但是忽略了像素空間信息的重要性,造成細胞核的部分信息損失。分水嶺分割方法利用細胞核圖像內的灰度分布與背景顏色差異來切分細胞核,對邊界不清楚的細胞核有一定優勢,但也會發生過分割的問題。而形態學處理分割方法也易受到背景因素的影響,導致分割結果模糊。例如,Eka等[5]提出了基于全局自適應閾值分割方法的醫學血細胞圖像分割模型,但部分特征仍有丟失。Gu等[6]提出了用于細胞核聚類分割的標記控制分水嶺算法,分割效果并不明顯。因此傳統分割方法仍局限于通過先驗知識分割細胞核,在分割背景復雜的細胞核圖像時難以得到準確的結果。
近年來,基于深度學習分割方法開始應用于醫學細胞核圖像分割中,總體性能優于傳統分割方法。具有強自主學習能力的卷積神經網絡(convolutional neural network,CNN)[7]在不同網絡層中利用滑窗機制進行像素級分割,自動學習圖像中的有效特征,但效率較低。全卷積網絡(fully convolutional network,FCN)[8]將網絡全連接層替換為全卷積層,為細胞核分割帶來更多可能性。U型網絡(UNet)[9]在醫學圖像處理中應用廣泛,通過跳躍連接融合解碼端和編碼端的特征信息,強化細胞核分割的效果。殘差UNet(residual UNet,ResUNet)[10]則通過殘差學習的設計簡化網絡訓練,促進特征信息間的交流,進一步提高圖像分割精度。汪豪等[11]通過改進UNet從而提高計算機斷層掃描(computed tomography,CT)圖像中直腸癌的分割精度。Yao等[12]在CNN上借助稀疏形狀模型和局部形變模型實現醫學細胞核分割的任務。Zhang等[13]設計了自下而上的逆UNet,提取高層次信息,實現對染色圖像細胞核邊緣特征的細化。Graham等[14]嵌套了多深度的UNet和混合注意力模塊,用于探索信息間的關聯,增強細胞核邊界的特征表示。He等[15]在空間及通道維度上進行兩個注意力機制模塊的相互融合,增強語義分割的便利性,實現對病理圖像細胞核的有效分割。
上述方法通過融合不同深度的特征信息,在細胞核圖像分割研究上有很大的進展,但由于只利用了淺層特征預測,導致深層語義特征沒有得到充分的利用,影響了網絡對目標的準確定位。并且在實際處理過程中細胞核位置是非均勻分布的,細胞核較小以及背景對比度較低,便難以提取完整的細胞核特征,使得分割效果并不理想。針對上述存在的問題,本文基于深度可分離和坐標注意力(coordinate attention,CA)機制構建了一個適用于細胞核圖像分割的深度CA-ResUNet(depthwise CA-ResUNet,DCA-ResUNet)網絡,通過引入殘差學習解決網絡退化問題,主要工作如下:
(1)在編碼特征提取階段,設計了深度可分離殘差卷積(depthwise separable residual convolutional,DSRC)模塊,降低網絡參數量,利用殘差學習增大網絡的感受野,提取更豐富的特征信息。
(2)在解碼特征融合階段,設計了一個關注特征空間上遠程距離信息的CA殘差(CA residual,CAR)模塊特征進行篩選特征,緩解信息損失以優化小目標細胞核的細節,并在跳躍連接上利用語義信息融合(semantic information fusion,SIF)模塊聚集不同維度上的特征,避免端到端之間的語義間隙問題。
(3)在網絡訓練過程中,混合了兩種不同的損失函數緩解不平衡性,增強訓練效果。
1 DCA-ResUNet網絡構建
1.1 網絡整體結構概述
UNet是一種上采樣與下采樣呈U型對稱的結構,利用跳躍連接可有效融合深層全局特征和淺層細節信息,從而解決醫學圖像的分割預測[16]。因此本文采用UNet作為分割網絡的基礎結構,設計了具有對稱結構的DCA-ResUNet,如圖1所示,在網絡中輸入分辨率大小為256 × 256的圖像數據集進行訓練與測試。在編碼特征提取階段,初始卷積層使用了3 × 3卷積核,初始特征通道為16;為捕捉不同層次的語義信息,同時降低模型參數量,利用DSRC模塊替代傳統卷積,并逐級進行4次最大池化2 × 2的下采樣特征提取操作,最終得到尺寸縮小1/8、通道深度擴大16倍的特征圖。同時在跳躍連接上利用SIF模塊,融合前面不同尺度特征,并補償每層特征圖的信息,提高訓練精度。為了促進局部細節與全局特征的相關依賴性,提升特征表示能力,解碼特征融合階段引入改進的CA機制,設計了CAR模塊。隨后利用雙線性插值和反卷積的結合逐級進行4次上采樣操作,以平衡該階段的計算量,還原圖像尺寸,最后經過一個2 × 2反卷積,輸出最終的圖像特征,這期間也與原圖像進行代價損失的計算,直至損失值趨于最低平衡,使細胞核分割精度不斷提升。

1.2 編碼特征提取階段
原始UNet中使用了大量的3 × 3卷積(Conv 3 × 3),會不斷增加網絡的參數量。為了在提高網絡模型運算速度的同時進一步壓縮網絡參數量,本文DCA-ResUNet網絡中選擇文獻[17]提出的深度可分離實現模型壓縮。深度可分離將傳統卷積拆分為深度方向卷積(depthwise convolution,DWConv)和逐點方向卷積(pointwise convolution,PWConv)兩部分。假設輸入H × W × M的特征圖,其中H為高,W為寬,M為輸入通道大小,經過卷積核大小為K × K的卷積操作后,輸出H × W × N的特征圖,其中N為輸出通道大小。則傳統卷積的參數計算量為H × W × M × K × K × N。而深度可分離的參數計算量為H × W × M × K × K + H × W × M × N。因此可得出深度可分離與傳統卷積對應的參數計算量之比 如式(1)所示:
![]() |
由式(1)可知,與傳統卷積相比,使用深度可分離實現了區域與通道間的一個分離,使網絡極大地降低參數計算量并壓縮特征圖。但隨著編碼網絡中層數越深,即便卷積層能提取到更多的細胞核區域特征,分割精度也會隨之趨于飽和。此時添加殘差學習能更好擬合通道間的相關性,同時緩解梯度消失或爆炸的問題[18]。因此本文結合殘差學習設計一個DSRC模塊,通過該模塊可增強網絡對輸入圖像的表征能力,以提高細胞核位置復雜性的適合度。原始的深度可分離通過線性整流單元(rectified linear unit,ReLU)激活函數后易輸出零信息,不利于提取特征,所以本文在經過DWConv和PWConv后利用批歸一化層(batch normalization,BN)和帶泄露的ReLU(Leaky ReLU)激活函數輸出特征,防止損失信息。
DSRC模塊結構如圖2所示。輸入特征X經過一個2 × 2卷積(Conv2 × 2)提取初始特征,該運算過程如式(2)所示:

![]() |
其中,b表示偏置,*表示卷積操作,W0為該層卷積核的權重,F1則代表卷積操作后的輸出特征。然后經過一個深度方向上的3 × 3卷積(DWConv3 × 3)和一個點方向上的1 × 1卷積(PWConv1 × 1)操作,該運算過程如式(3)所示:
![]() |
其中,W1為DWConv3 × 3的權重,W2為PWConv1 × 1的權重,σ為Leaky ReLU激活函數。F(X)則表示上一個特征F1經過深度可分離后的輸出特征,最后結合殘差學習映射原始輸入特征X,得到最終在圖像上提取到的特征H(X),表達式如式(4)所示:
![]() |
1.3 解碼特征融合階段
圖像中易存在少量被忽略的高頻信息,以及數據樣本不足的問題均會導致模型的精度有所下降。即使編碼網絡關注到細胞核的大量細節特征,但捕捉全局位置信息時較不全面,會產生特征描述的差異,因此可利用注意力機制提高網絡對感興趣特征的關注度。擠壓激勵(squeeze and excitation,SE)[19]注意力機制、卷積塊注意力模塊(convolution block attention module,CBAM)[20]機制往往會忽略空間上的信息特征,失去了對遠距離關系的選擇。而CA機制能在捕獲通道信息的同時,保留了在選擇注意力時產生的重要方向信息,增強遠距離依賴程度,提高網絡對位置的敏感性,有助于網絡制定出良好的識別決策。因此本文在解碼特征融合階段,引入CA機制,構造CAR模塊,與編碼網絡中將BN和Leaky ReLU激活函數置于卷積層之前不同,可防止網絡前向反饋中過度收斂。CAR模塊結構如圖3所示。首先輸入特征Xn ? 1會先經過一個1 × 1卷積層(Conv1 × 1),目的是實現降維,該階段輸出特征用Y表示。隨后經過一個DWConv3 × 3和PWConv1 × 1的卷積操作提取更多信息,得到新的輸出特征H1,具體過程如式(5)所示:

![]() |
其中,W1和W2仍然表示DWConv3 × 3和PWConv1 × 1的權重,σ為Leaky ReLU激活函數。接下來分離該輸出特征為兩個分支,第一個分支仍為原輸出特征H1,第二個分支經過CA機制輸出的特征H2。對兩個分支的輸出相乘進行特征融合,該過程如式(6)所示:
![]() |
其中,W3表示經過CA機制操作,H則為融合兩個分支模塊后的輸出特征。同時在殘差學習的映射下與最初特征相加,再通過Conv1 × 1還原維度,具體過程如式(7)所示:
![]() |
其中,W4為Conv1 × 1操作,Xn ? 1為CAR模塊的最初輸入特征,Xn作為CAR模塊最終輸出特征。
1.3.1 改進的CA機制
文獻[21]提出的CA機制結構中,經過拼接(Concat)和卷積運算(Conv2d)后融合了兩個方向上的特征圖,然后經BN層輸出新的特征,并進行特征拆分。但BN層在一定程度上會過度曝光圖像,影響原本圖像的對比度變化,所以本文所提方法去除了BN層,改進后的CA機制結構如圖4所示。

CA機制主要分為坐標信息嵌入和注意力生成兩個步驟,通過在不同方向上分解通道注意力,生成一對方向感知和位置敏感的注意力圖,最后在通道上以加權的方式進行空間通道上的融合,再次表示輸入特征。假設輸入通道大小為C的特征圖E,采用大小為(H,1)的池化核在水平方向上做X軸平均池化操作(X Avg Pool),采用大小為(1, W)的池化核在豎直方向上做Y軸平均池化操作(Y Avg Pool)。將特征圖從水平與豎直方向上進行通道編碼,以保持空間位置上的坐標信息。其具體過程如式(8)、式(9)所示:
![]() |
![]() |
其中,W、H分別為輸入特征圖的寬、高。E(h, j)為輸入特征E在高為h、寬為j的像素位置信息,E(i, w)為輸入特征E在高為i、寬為w的像素位置信息。輸出的Zh與Zw分別為水平與豎直方向上生成的具有全局感受野的坐標感知注意力特征。為重新調整通道區域的特征權重,將單向的特征圖Zh與Zw進行拼接,通過卷積運算操作、非線性激活函數的變換,其運算過程 如式(10)所示:
![]() |
其中,δ表示非線性激活函數,F表示卷積運算操作,[ , ]為維度的拼接操作,則f為空間信息基于水平、豎直方向上的中間特征圖。隨后將f沿著水平與垂直方向拆分(Split)為兩個單獨的特征圖張量,分別是大小為C × H × 1的 f h,以及C × 1 × W的 f w,利用卷積操作、S型生長曲線(Sigmoid)激活函數調整兩個特征圖張量,具體計算過程如式(11)、式(12)所示:
![]() |
![]() |
其中,Fh、Fw分別表示對單獨張量、
在各自方向上的卷積操作,ω表示Sigmoid激活函數。輸出的g h和gw分別為水平和豎直方向上的注意力權重,并將其作用于輸入特征E。最后,輸入特征E在通道上高為i寬為j的特征E(i, j),經過注意力模塊作用的最終輸出Z如式(13)所示:
![]() |
將注意力權重與原始特征進行像素點相乘(Multiply)后能夠增強對空間細節位置的信息上的關注度,突出分割目標的關鍵特征,讓網絡對細節位置的信息有較強的敏感度。
1.4 跳躍連接階段SIF模塊
在特征解碼中將上采樣映射的信息充分與編碼中同一尺度特征進行不同深淺層的融合,可指導網絡在深層提取更多有用的分割信息[22]。而原始UNet網絡中編解碼間使用跳躍連接將特征表示相連起來,易存在語義間隙的麻煩,對結果造成影響[23]。因此本文設計了一個兼容編碼網絡原始特征、解碼網絡抽象信息的SIF模塊,其結構如圖5所示。該模塊由兩個Conv3 × 3和一個Conv1 × 1連接后相互堆疊而成,利用Conv3 × 3補償語義特征,Conv1 × 1防止邊緣信息丟失,同時提取高層特征。解碼網絡在通過語義補償得到邊緣信息特征后,通過ReLU和BN疊加以映射到下一層,進行卷積運算。

1.5 算法損失函數的改進
細胞核的分割可以看作是像素分類問題,即背景和核的分割,通常利用二元交叉熵(binary cross entropy,BCE)作為BCE損失函數(BCE_loss),從而區分像素級別的目標特征,其定義如式(14)所示:
![]() |
其中,M為訓練批次,c取值范圍為1~M。Tc表示標簽圖像的真實分割結果,Pc表示網絡預測的分割結果。戴斯(Dice)損失函數(Dice_loss)也是醫學圖像分割中常用到的損失函數之一,其定義如式(15)所示:
![]() |
其中,使用Dice_loss能較好處理像素類別不平衡的問題,但不利于提取小目標的特征。因此本文在構建的DCA-ResUNet算法中結合兩者,緩解不平衡性,使訓練過程更加高效穩定。最終總損失函數(Loss)如式(16)所示,設置權重系數α為0.3。
![]() |
2 實驗結果與分析
2.1 數據集及預處理
本文使用了兩個公開的細胞核病理數據集來評估本文算法性能:① 2018年數據科學碗(2018 data science bowl,DSB2018)(網址為:https://www.kaggle.com/c/data-science-bowl-2018/data)挑戰賽上提供的細胞核圖像集,共有670張原始圖像以及對應的標簽圖像,估計有29 500個不同的細胞核[24]。② 三陰性乳腺癌(triple negative breast cacer,TNBC)患者的病理組織圖像集(網址為:https://zenodo.org/record/1175282),共計50張原始圖像和標簽圖像[25]。
本文按照7:3比例將數據集劃分為訓練集和測試集。為保留原始圖像的細節信息,并提高計算效率,本文將兩個數據集中圖像分辨率均調整為256 × 256。為避免數據量少導致的過擬合情況,使用不同的數據增強策略實現數據集擴充,如隨機旋轉與翻轉、隨機裁剪以及放大縮小等,1張圖像可擴充出另外7張圖像。除此之外,在兩個數據集中的原始圖像大小與亮度均有不同,以及有黑白圖像或是染過熒光色的細胞核圖像,易存在色彩分布較不平衡的問題,因此為避免圖像受自身色彩、光照等不利的影響,本文利用直方圖均衡化、伽馬變換等增強對比度的方式,將細胞核位置與背景相互突顯,同時采用歸一化方式調節灰度圖片,使網絡模型可準確預測細胞核位置。
2.2 實驗細節
本實驗選用的平臺為:深度學習框架Pytorch(Facebook,美國),編程語言Python 3.6(Python Software Foundation,荷蘭),圖形處理器(graphics processing unit,GPU)硬件NVIDIA GTX 2080Ti(NVIDIA,美國)。通過多次實驗進行微調后,實驗初始學習率設置為0.000 1,動量參數設置為0.9。在訓練50個迭代周期(epoch)后改變學習率,每批次訓練大小設置為5,總共迭代100次。同時采用自適應矩估計(adaptive moment estimation,Adam)優化算法對模型進行訓練。當網絡損失不再下降或者達到預設迭代周期的時候,停止訓練網絡,保存這期間訓練集中準確率最高時的權重參數與結果。
2.3 評價標準
為實現網絡對細胞核分割結果的定量分析,本文采用豪斯多夫距離(Hausdorff distance,HD)、精確率(precision,PRE)、戴斯相似性系數(Dice similarity coefficient,DSC)、靈敏度(sensitivity,SEN)、平均交并比(mean intersection over union,MIOU)這五個性能指標作為評價標準。
(1)HD,對邊界區域較為敏感,衡量了網絡分割結果和標簽圖像的最大不匹配度[26]。計算方法如式(17)所示。其中,max{dXY, dYX}表示了集合X中像素點x到集合Y中像素點y的最小距離的最大值。HD值越小,就代表了分割結果與金標準更接近,分割效果越好。
![]() |
(2)PRE,是正確分割細胞核的部分與預測分割出細胞核部分的一個比例,比例越高,效果越好。定義如式(18)所示,其中真陽性(true pssitive,TP)代表實際為細胞核,分割結果預測也為細胞核部分。假陽性(false pssitive,FP)代表實際為背景部分,分割結果預測為細胞核。
![]() |
(3)DSC,用于衡量分割結果和標簽圖像之間的重疊,值介于0~1之間,其值越大,表示分割效果越好[27]。定義如式(19)所示,其中A為預測結果,B表示標簽圖像的結果。A與B的交集代表正確分割的細胞核區域,A與B的并集代表所有分割結果。
![]() |
(4)SEN,表示網絡正確分割細胞核的部分占原始圖像中所有細胞核部分的比例。定義如式(20)所示,其中假陰性(false negative, FN)代表錯誤識別為背景的部分。
![]() |
(5)MIOU,用于計算網絡預測結果和真實結果的交集與并集之比,然后求出平均值,計算方法如式(21)所示。
![]() |
2.4 實驗結果及分析
為驗證本文網絡的分割性能,本文分別在DSB2018、TNBC數據集上進行測試,并與FCN、UNet、深度研究實驗室網絡(Deeplabv3)[28]、ResUNet、CBAM-ResUNet網絡保持同樣的實驗設置進行對比。不同網絡在DSB2018和TNBC數據集上的分割定量結果如表1所示,采用加粗字體表示較優指標。

由表1可知,在DSB2018數據集上,本文DCA-ResUNet網絡的所有評價指標均優于其他對比網絡。在TNBC數據集上,本文DCA-ResUNet網絡的評價指標HD、PRE、DSC、SEN和MIOU也有較為優異的表現。這表明了本文提出的DCA-ResUNet網絡較其他對比網絡模型能有效提升網絡分割性能,在面對細胞核與背景對比度較低時,本文算法也能較好地對兩者進行分類,進一步提高分割的準確度。
為進一步感受不同分割網絡結果在視覺上的差異,從兩個數據集中選取部分圖片的分割結果進行定性分析。如圖6所示,展示了不同方法下的分割結果可視化。其中,圖6紅色圓圈處可觀察到不同方法分割結果的局部變化情況;圖6第一行至第四行為DSB2018數據集中部分細胞核圖像的分割結果,第五、六行為TNBC數據集中部分細胞核圖像的分割結果;第一列和第二列分別是原始圖像和標簽圖像,第三列至第六列分別是FCN、UNet、Deeplabv3、ResUNet、CBAM-ResUNet、DCA-ResUNet的分割結果。如圖7所示,是不同方法下任意一個分割結果圖的局部放大效果,在對比之下可以看出分割的效果越來越好,對細胞邊緣的分割也更加平滑。


綜合表1和圖6、圖7 可知,在兩個數據集上傳統UNet的分割結果均優于FCN,這是因為FCN在上采樣過程中缺少淺層信息,只關注了深層特征,出現漏檢情況。UNet與Deeplabv3分割效果相對于FCN更好一些,UNet因為融合深淺層特征,提高了分割精度,但由于過分強調細節信息,導致分割效果較為粗糙。Deeplabv3使用金字塔策略緩解了損失細節信息的問題,但仍有分割不完全的現象。相比之下,ResUNet和CBAM-ResUNet在保留不同特征的基礎上分別使用殘差學習和注意力機制進行特征加強,進一步改善分割效果,但都沒有突出全局細節信息在細胞核分割中的優勢。ResUNet在跳躍連接中融合上下文語義信息后能更深地提取特征,而大量下采樣會導致圖像丟失一些有用特征,使得精確率較低。而CBAM-ResUNet因為引入注意力機制,使得網絡加大對重要特征的判斷,但在面臨細胞核邊緣模糊時,效果并不好。本文提出的DCA-ResUNet網絡,一方面通過DSRC模塊增大感受野;另一方面利用CA機制加強空間方向上特征的遠程依賴,獲取跨通道信息,充分利用全局細節信息進行分割,在努力分割細小細胞核的同時,避免細胞黏附以及欠分割的現象,得到接近標簽圖像的效果,并在分割性能上有了一定的提升。
為了驗證網絡模型參數性能,將本文DCA-ResUNet網絡與其他分割網絡進行性能對比,實驗結果如表2所示,加粗字體表示較優指標。從表2可知,本文所提方法相比于其他網絡的參數量有一定降低,運行速度和ResUNet相接近,但本文算法的精確率均優于其他網絡。

如圖8所示,不同網絡在DSB2018數據集訓練中迭代損失函數的曲線變化情況均有不同;而在TNBC數據集上的曲線變化基本一致,故不予展示。由圖8可知,本文所提算法的起始損失函數值最低,在前20次迭代周期中損失迅速下降,之后逐漸趨于平穩,在迭代100次后損失函數的曲線沒有其他變化,損失函數值也得到了最低,此時曲線收斂速度也優于其他幾種網絡。其中網絡模型收斂越快,代表網絡學習能力更強,細胞核分割的準確度越高。

本文在DSB2018數據集上通過消融實驗證明了網絡中各個模塊的有效性,實驗結果如表3所示。從表3可知,只添加DSRC模塊的網絡在分割性能評價指標上均有提升,說明有效的編碼網絡能得到更具體的特征信息。只添加CAR模塊的基礎網絡,分割性能并未減弱,說明全局細節信息對分割結果同樣重要。而同時引入DSRC模塊和CAR模塊的網絡相較于前面的模塊在分割性能上都有了一定的提升,相比ResUNet在PRE、SEN上提升明顯。在這個網絡基礎上,引入SIF模塊后可融合深淺層的信息,其PRE、DSC和SEN均有提升,從而驗證了所提出的模塊對于提升細胞核分割性能具有一定的優勢。

3 結束語
細胞核圖像的有效分割是輔助醫生進行診斷和治療的重要前提,因此本文針對細胞核圖像的特點,提出了基于卷積和注意力機制的DCA-ResUNet分割網絡。該網絡以UNet作為基本結構,通過構造DSRC模塊有效提取細胞核特征,并降低網絡訓練參數。本文采取對CA機制改進并設計CAR模塊,提高網絡的特征學習能力,篩選出在圖像上更多有用信息。在跳躍連接階段采用SIF模塊來聚合深淺特征信息,使網絡聚焦于分割細胞核,改善分割效果。最后,使用兩個公開細胞核圖像數據集對DCA-ResUNet網絡進行實驗訓練與測試。實驗結果表明,本文所提方法的分割性能評價指標均有提高,在DSB2018數據集上的PRE、SEN和MIOU分別為92.01%、90.09%和89.01%,在TNBC數據集上的PRE、SEN和MIOU分別為89.21%、91.10%和89.12%。并且在主觀視覺上分割效果也有較優表現。因此本文所提網絡能為細胞核分割研究提供一定參考價值,在后續工作中將著重研究如何更優地讀取圖像特征,泛化分割能力。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:支佩佩主要負責數據集整理、算法程序設計、數據記錄與分析以及論文編寫;鄧健志主要負責提供實驗指導,數據分析以及論文審閱修訂。鐘震霄主要負責實驗流程、算法程序設計、協調溝通以及計劃安排。
引言
醫學細胞核圖像的分割結果是病理診斷的重要依據,能為醫生提供更多關于病情的判斷,并能輔助醫生制定相應的手術治療計劃等。但即便是有經驗的專家,在視覺疲勞的情況下,要從病理圖像中辨別出病變部位,仍存在漏診和誤診的可能,影響判斷[1]。同時在細胞核分割時可能出現核邊界模糊、形態微小、細胞黏附或重疊等現象,導致在確定細胞核位置和形狀時存在較大困難,影響細胞核分割的準確性。所以,利用計算機輔助技術實現準確的細胞核分割在病理診斷中具有重要的現實意義。
目前對細胞核分割所采用方法分為傳統分割方法和基于深度學習分割方法。其中傳統分割方法有基于閾值分割[2]、分水嶺分割[3]、形態學處理[4]等。基于閾值分割方法根據設定閾值或參數劃分圖像像素信息分割細胞核,該方法操作簡單、容易計算,但是忽略了像素空間信息的重要性,造成細胞核的部分信息損失。分水嶺分割方法利用細胞核圖像內的灰度分布與背景顏色差異來切分細胞核,對邊界不清楚的細胞核有一定優勢,但也會發生過分割的問題。而形態學處理分割方法也易受到背景因素的影響,導致分割結果模糊。例如,Eka等[5]提出了基于全局自適應閾值分割方法的醫學血細胞圖像分割模型,但部分特征仍有丟失。Gu等[6]提出了用于細胞核聚類分割的標記控制分水嶺算法,分割效果并不明顯。因此傳統分割方法仍局限于通過先驗知識分割細胞核,在分割背景復雜的細胞核圖像時難以得到準確的結果。
近年來,基于深度學習分割方法開始應用于醫學細胞核圖像分割中,總體性能優于傳統分割方法。具有強自主學習能力的卷積神經網絡(convolutional neural network,CNN)[7]在不同網絡層中利用滑窗機制進行像素級分割,自動學習圖像中的有效特征,但效率較低。全卷積網絡(fully convolutional network,FCN)[8]將網絡全連接層替換為全卷積層,為細胞核分割帶來更多可能性。U型網絡(UNet)[9]在醫學圖像處理中應用廣泛,通過跳躍連接融合解碼端和編碼端的特征信息,強化細胞核分割的效果。殘差UNet(residual UNet,ResUNet)[10]則通過殘差學習的設計簡化網絡訓練,促進特征信息間的交流,進一步提高圖像分割精度。汪豪等[11]通過改進UNet從而提高計算機斷層掃描(computed tomography,CT)圖像中直腸癌的分割精度。Yao等[12]在CNN上借助稀疏形狀模型和局部形變模型實現醫學細胞核分割的任務。Zhang等[13]設計了自下而上的逆UNet,提取高層次信息,實現對染色圖像細胞核邊緣特征的細化。Graham等[14]嵌套了多深度的UNet和混合注意力模塊,用于探索信息間的關聯,增強細胞核邊界的特征表示。He等[15]在空間及通道維度上進行兩個注意力機制模塊的相互融合,增強語義分割的便利性,實現對病理圖像細胞核的有效分割。
上述方法通過融合不同深度的特征信息,在細胞核圖像分割研究上有很大的進展,但由于只利用了淺層特征預測,導致深層語義特征沒有得到充分的利用,影響了網絡對目標的準確定位。并且在實際處理過程中細胞核位置是非均勻分布的,細胞核較小以及背景對比度較低,便難以提取完整的細胞核特征,使得分割效果并不理想。針對上述存在的問題,本文基于深度可分離和坐標注意力(coordinate attention,CA)機制構建了一個適用于細胞核圖像分割的深度CA-ResUNet(depthwise CA-ResUNet,DCA-ResUNet)網絡,通過引入殘差學習解決網絡退化問題,主要工作如下:
(1)在編碼特征提取階段,設計了深度可分離殘差卷積(depthwise separable residual convolutional,DSRC)模塊,降低網絡參數量,利用殘差學習增大網絡的感受野,提取更豐富的特征信息。
(2)在解碼特征融合階段,設計了一個關注特征空間上遠程距離信息的CA殘差(CA residual,CAR)模塊特征進行篩選特征,緩解信息損失以優化小目標細胞核的細節,并在跳躍連接上利用語義信息融合(semantic information fusion,SIF)模塊聚集不同維度上的特征,避免端到端之間的語義間隙問題。
(3)在網絡訓練過程中,混合了兩種不同的損失函數緩解不平衡性,增強訓練效果。
1 DCA-ResUNet網絡構建
1.1 網絡整體結構概述
UNet是一種上采樣與下采樣呈U型對稱的結構,利用跳躍連接可有效融合深層全局特征和淺層細節信息,從而解決醫學圖像的分割預測[16]。因此本文采用UNet作為分割網絡的基礎結構,設計了具有對稱結構的DCA-ResUNet,如圖1所示,在網絡中輸入分辨率大小為256 × 256的圖像數據集進行訓練與測試。在編碼特征提取階段,初始卷積層使用了3 × 3卷積核,初始特征通道為16;為捕捉不同層次的語義信息,同時降低模型參數量,利用DSRC模塊替代傳統卷積,并逐級進行4次最大池化2 × 2的下采樣特征提取操作,最終得到尺寸縮小1/8、通道深度擴大16倍的特征圖。同時在跳躍連接上利用SIF模塊,融合前面不同尺度特征,并補償每層特征圖的信息,提高訓練精度。為了促進局部細節與全局特征的相關依賴性,提升特征表示能力,解碼特征融合階段引入改進的CA機制,設計了CAR模塊。隨后利用雙線性插值和反卷積的結合逐級進行4次上采樣操作,以平衡該階段的計算量,還原圖像尺寸,最后經過一個2 × 2反卷積,輸出最終的圖像特征,這期間也與原圖像進行代價損失的計算,直至損失值趨于最低平衡,使細胞核分割精度不斷提升。

1.2 編碼特征提取階段
原始UNet中使用了大量的3 × 3卷積(Conv 3 × 3),會不斷增加網絡的參數量。為了在提高網絡模型運算速度的同時進一步壓縮網絡參數量,本文DCA-ResUNet網絡中選擇文獻[17]提出的深度可分離實現模型壓縮。深度可分離將傳統卷積拆分為深度方向卷積(depthwise convolution,DWConv)和逐點方向卷積(pointwise convolution,PWConv)兩部分。假設輸入H × W × M的特征圖,其中H為高,W為寬,M為輸入通道大小,經過卷積核大小為K × K的卷積操作后,輸出H × W × N的特征圖,其中N為輸出通道大小。則傳統卷積的參數計算量為H × W × M × K × K × N。而深度可分離的參數計算量為H × W × M × K × K + H × W × M × N。因此可得出深度可分離與傳統卷積對應的參數計算量之比 如式(1)所示:
![]() |
由式(1)可知,與傳統卷積相比,使用深度可分離實現了區域與通道間的一個分離,使網絡極大地降低參數計算量并壓縮特征圖。但隨著編碼網絡中層數越深,即便卷積層能提取到更多的細胞核區域特征,分割精度也會隨之趨于飽和。此時添加殘差學習能更好擬合通道間的相關性,同時緩解梯度消失或爆炸的問題[18]。因此本文結合殘差學習設計一個DSRC模塊,通過該模塊可增強網絡對輸入圖像的表征能力,以提高細胞核位置復雜性的適合度。原始的深度可分離通過線性整流單元(rectified linear unit,ReLU)激活函數后易輸出零信息,不利于提取特征,所以本文在經過DWConv和PWConv后利用批歸一化層(batch normalization,BN)和帶泄露的ReLU(Leaky ReLU)激活函數輸出特征,防止損失信息。
DSRC模塊結構如圖2所示。輸入特征X經過一個2 × 2卷積(Conv2 × 2)提取初始特征,該運算過程如式(2)所示:

![]() |
其中,b表示偏置,*表示卷積操作,W0為該層卷積核的權重,F1則代表卷積操作后的輸出特征。然后經過一個深度方向上的3 × 3卷積(DWConv3 × 3)和一個點方向上的1 × 1卷積(PWConv1 × 1)操作,該運算過程如式(3)所示:
![]() |
其中,W1為DWConv3 × 3的權重,W2為PWConv1 × 1的權重,σ為Leaky ReLU激活函數。F(X)則表示上一個特征F1經過深度可分離后的輸出特征,最后結合殘差學習映射原始輸入特征X,得到最終在圖像上提取到的特征H(X),表達式如式(4)所示:
![]() |
1.3 解碼特征融合階段
圖像中易存在少量被忽略的高頻信息,以及數據樣本不足的問題均會導致模型的精度有所下降。即使編碼網絡關注到細胞核的大量細節特征,但捕捉全局位置信息時較不全面,會產生特征描述的差異,因此可利用注意力機制提高網絡對感興趣特征的關注度。擠壓激勵(squeeze and excitation,SE)[19]注意力機制、卷積塊注意力模塊(convolution block attention module,CBAM)[20]機制往往會忽略空間上的信息特征,失去了對遠距離關系的選擇。而CA機制能在捕獲通道信息的同時,保留了在選擇注意力時產生的重要方向信息,增強遠距離依賴程度,提高網絡對位置的敏感性,有助于網絡制定出良好的識別決策。因此本文在解碼特征融合階段,引入CA機制,構造CAR模塊,與編碼網絡中將BN和Leaky ReLU激活函數置于卷積層之前不同,可防止網絡前向反饋中過度收斂。CAR模塊結構如圖3所示。首先輸入特征Xn ? 1會先經過一個1 × 1卷積層(Conv1 × 1),目的是實現降維,該階段輸出特征用Y表示。隨后經過一個DWConv3 × 3和PWConv1 × 1的卷積操作提取更多信息,得到新的輸出特征H1,具體過程如式(5)所示:

![]() |
其中,W1和W2仍然表示DWConv3 × 3和PWConv1 × 1的權重,σ為Leaky ReLU激活函數。接下來分離該輸出特征為兩個分支,第一個分支仍為原輸出特征H1,第二個分支經過CA機制輸出的特征H2。對兩個分支的輸出相乘進行特征融合,該過程如式(6)所示:
![]() |
其中,W3表示經過CA機制操作,H則為融合兩個分支模塊后的輸出特征。同時在殘差學習的映射下與最初特征相加,再通過Conv1 × 1還原維度,具體過程如式(7)所示:
![]() |
其中,W4為Conv1 × 1操作,Xn ? 1為CAR模塊的最初輸入特征,Xn作為CAR模塊最終輸出特征。
1.3.1 改進的CA機制
文獻[21]提出的CA機制結構中,經過拼接(Concat)和卷積運算(Conv2d)后融合了兩個方向上的特征圖,然后經BN層輸出新的特征,并進行特征拆分。但BN層在一定程度上會過度曝光圖像,影響原本圖像的對比度變化,所以本文所提方法去除了BN層,改進后的CA機制結構如圖4所示。

CA機制主要分為坐標信息嵌入和注意力生成兩個步驟,通過在不同方向上分解通道注意力,生成一對方向感知和位置敏感的注意力圖,最后在通道上以加權的方式進行空間通道上的融合,再次表示輸入特征。假設輸入通道大小為C的特征圖E,采用大小為(H,1)的池化核在水平方向上做X軸平均池化操作(X Avg Pool),采用大小為(1, W)的池化核在豎直方向上做Y軸平均池化操作(Y Avg Pool)。將特征圖從水平與豎直方向上進行通道編碼,以保持空間位置上的坐標信息。其具體過程如式(8)、式(9)所示:
![]() |
![]() |
其中,W、H分別為輸入特征圖的寬、高。E(h, j)為輸入特征E在高為h、寬為j的像素位置信息,E(i, w)為輸入特征E在高為i、寬為w的像素位置信息。輸出的Zh與Zw分別為水平與豎直方向上生成的具有全局感受野的坐標感知注意力特征。為重新調整通道區域的特征權重,將單向的特征圖Zh與Zw進行拼接,通過卷積運算操作、非線性激活函數的變換,其運算過程 如式(10)所示:
![]() |
其中,δ表示非線性激活函數,F表示卷積運算操作,[ , ]為維度的拼接操作,則f為空間信息基于水平、豎直方向上的中間特征圖。隨后將f沿著水平與垂直方向拆分(Split)為兩個單獨的特征圖張量,分別是大小為C × H × 1的 f h,以及C × 1 × W的 f w,利用卷積操作、S型生長曲線(Sigmoid)激活函數調整兩個特征圖張量,具體計算過程如式(11)、式(12)所示:
![]() |
![]() |
其中,Fh、Fw分別表示對單獨張量、
在各自方向上的卷積操作,ω表示Sigmoid激活函數。輸出的g h和gw分別為水平和豎直方向上的注意力權重,并將其作用于輸入特征E。最后,輸入特征E在通道上高為i寬為j的特征E(i, j),經過注意力模塊作用的最終輸出Z如式(13)所示:
![]() |
將注意力權重與原始特征進行像素點相乘(Multiply)后能夠增強對空間細節位置的信息上的關注度,突出分割目標的關鍵特征,讓網絡對細節位置的信息有較強的敏感度。
1.4 跳躍連接階段SIF模塊
在特征解碼中將上采樣映射的信息充分與編碼中同一尺度特征進行不同深淺層的融合,可指導網絡在深層提取更多有用的分割信息[22]。而原始UNet網絡中編解碼間使用跳躍連接將特征表示相連起來,易存在語義間隙的麻煩,對結果造成影響[23]。因此本文設計了一個兼容編碼網絡原始特征、解碼網絡抽象信息的SIF模塊,其結構如圖5所示。該模塊由兩個Conv3 × 3和一個Conv1 × 1連接后相互堆疊而成,利用Conv3 × 3補償語義特征,Conv1 × 1防止邊緣信息丟失,同時提取高層特征。解碼網絡在通過語義補償得到邊緣信息特征后,通過ReLU和BN疊加以映射到下一層,進行卷積運算。

1.5 算法損失函數的改進
細胞核的分割可以看作是像素分類問題,即背景和核的分割,通常利用二元交叉熵(binary cross entropy,BCE)作為BCE損失函數(BCE_loss),從而區分像素級別的目標特征,其定義如式(14)所示:
![]() |
其中,M為訓練批次,c取值范圍為1~M。Tc表示標簽圖像的真實分割結果,Pc表示網絡預測的分割結果。戴斯(Dice)損失函數(Dice_loss)也是醫學圖像分割中常用到的損失函數之一,其定義如式(15)所示:
![]() |
其中,使用Dice_loss能較好處理像素類別不平衡的問題,但不利于提取小目標的特征。因此本文在構建的DCA-ResUNet算法中結合兩者,緩解不平衡性,使訓練過程更加高效穩定。最終總損失函數(Loss)如式(16)所示,設置權重系數α為0.3。
![]() |
2 實驗結果與分析
2.1 數據集及預處理
本文使用了兩個公開的細胞核病理數據集來評估本文算法性能:① 2018年數據科學碗(2018 data science bowl,DSB2018)(網址為:https://www.kaggle.com/c/data-science-bowl-2018/data)挑戰賽上提供的細胞核圖像集,共有670張原始圖像以及對應的標簽圖像,估計有29 500個不同的細胞核[24]。② 三陰性乳腺癌(triple negative breast cacer,TNBC)患者的病理組織圖像集(網址為:https://zenodo.org/record/1175282),共計50張原始圖像和標簽圖像[25]。
本文按照7:3比例將數據集劃分為訓練集和測試集。為保留原始圖像的細節信息,并提高計算效率,本文將兩個數據集中圖像分辨率均調整為256 × 256。為避免數據量少導致的過擬合情況,使用不同的數據增強策略實現數據集擴充,如隨機旋轉與翻轉、隨機裁剪以及放大縮小等,1張圖像可擴充出另外7張圖像。除此之外,在兩個數據集中的原始圖像大小與亮度均有不同,以及有黑白圖像或是染過熒光色的細胞核圖像,易存在色彩分布較不平衡的問題,因此為避免圖像受自身色彩、光照等不利的影響,本文利用直方圖均衡化、伽馬變換等增強對比度的方式,將細胞核位置與背景相互突顯,同時采用歸一化方式調節灰度圖片,使網絡模型可準確預測細胞核位置。
2.2 實驗細節
本實驗選用的平臺為:深度學習框架Pytorch(Facebook,美國),編程語言Python 3.6(Python Software Foundation,荷蘭),圖形處理器(graphics processing unit,GPU)硬件NVIDIA GTX 2080Ti(NVIDIA,美國)。通過多次實驗進行微調后,實驗初始學習率設置為0.000 1,動量參數設置為0.9。在訓練50個迭代周期(epoch)后改變學習率,每批次訓練大小設置為5,總共迭代100次。同時采用自適應矩估計(adaptive moment estimation,Adam)優化算法對模型進行訓練。當網絡損失不再下降或者達到預設迭代周期的時候,停止訓練網絡,保存這期間訓練集中準確率最高時的權重參數與結果。
2.3 評價標準
為實現網絡對細胞核分割結果的定量分析,本文采用豪斯多夫距離(Hausdorff distance,HD)、精確率(precision,PRE)、戴斯相似性系數(Dice similarity coefficient,DSC)、靈敏度(sensitivity,SEN)、平均交并比(mean intersection over union,MIOU)這五個性能指標作為評價標準。
(1)HD,對邊界區域較為敏感,衡量了網絡分割結果和標簽圖像的最大不匹配度[26]。計算方法如式(17)所示。其中,max{dXY, dYX}表示了集合X中像素點x到集合Y中像素點y的最小距離的最大值。HD值越小,就代表了分割結果與金標準更接近,分割效果越好。
![]() |
(2)PRE,是正確分割細胞核的部分與預測分割出細胞核部分的一個比例,比例越高,效果越好。定義如式(18)所示,其中真陽性(true pssitive,TP)代表實際為細胞核,分割結果預測也為細胞核部分。假陽性(false pssitive,FP)代表實際為背景部分,分割結果預測為細胞核。
![]() |
(3)DSC,用于衡量分割結果和標簽圖像之間的重疊,值介于0~1之間,其值越大,表示分割效果越好[27]。定義如式(19)所示,其中A為預測結果,B表示標簽圖像的結果。A與B的交集代表正確分割的細胞核區域,A與B的并集代表所有分割結果。
![]() |
(4)SEN,表示網絡正確分割細胞核的部分占原始圖像中所有細胞核部分的比例。定義如式(20)所示,其中假陰性(false negative, FN)代表錯誤識別為背景的部分。
![]() |
(5)MIOU,用于計算網絡預測結果和真實結果的交集與并集之比,然后求出平均值,計算方法如式(21)所示。
![]() |
2.4 實驗結果及分析
為驗證本文網絡的分割性能,本文分別在DSB2018、TNBC數據集上進行測試,并與FCN、UNet、深度研究實驗室網絡(Deeplabv3)[28]、ResUNet、CBAM-ResUNet網絡保持同樣的實驗設置進行對比。不同網絡在DSB2018和TNBC數據集上的分割定量結果如表1所示,采用加粗字體表示較優指標。

由表1可知,在DSB2018數據集上,本文DCA-ResUNet網絡的所有評價指標均優于其他對比網絡。在TNBC數據集上,本文DCA-ResUNet網絡的評價指標HD、PRE、DSC、SEN和MIOU也有較為優異的表現。這表明了本文提出的DCA-ResUNet網絡較其他對比網絡模型能有效提升網絡分割性能,在面對細胞核與背景對比度較低時,本文算法也能較好地對兩者進行分類,進一步提高分割的準確度。
為進一步感受不同分割網絡結果在視覺上的差異,從兩個數據集中選取部分圖片的分割結果進行定性分析。如圖6所示,展示了不同方法下的分割結果可視化。其中,圖6紅色圓圈處可觀察到不同方法分割結果的局部變化情況;圖6第一行至第四行為DSB2018數據集中部分細胞核圖像的分割結果,第五、六行為TNBC數據集中部分細胞核圖像的分割結果;第一列和第二列分別是原始圖像和標簽圖像,第三列至第六列分別是FCN、UNet、Deeplabv3、ResUNet、CBAM-ResUNet、DCA-ResUNet的分割結果。如圖7所示,是不同方法下任意一個分割結果圖的局部放大效果,在對比之下可以看出分割的效果越來越好,對細胞邊緣的分割也更加平滑。


綜合表1和圖6、圖7 可知,在兩個數據集上傳統UNet的分割結果均優于FCN,這是因為FCN在上采樣過程中缺少淺層信息,只關注了深層特征,出現漏檢情況。UNet與Deeplabv3分割效果相對于FCN更好一些,UNet因為融合深淺層特征,提高了分割精度,但由于過分強調細節信息,導致分割效果較為粗糙。Deeplabv3使用金字塔策略緩解了損失細節信息的問題,但仍有分割不完全的現象。相比之下,ResUNet和CBAM-ResUNet在保留不同特征的基礎上分別使用殘差學習和注意力機制進行特征加強,進一步改善分割效果,但都沒有突出全局細節信息在細胞核分割中的優勢。ResUNet在跳躍連接中融合上下文語義信息后能更深地提取特征,而大量下采樣會導致圖像丟失一些有用特征,使得精確率較低。而CBAM-ResUNet因為引入注意力機制,使得網絡加大對重要特征的判斷,但在面臨細胞核邊緣模糊時,效果并不好。本文提出的DCA-ResUNet網絡,一方面通過DSRC模塊增大感受野;另一方面利用CA機制加強空間方向上特征的遠程依賴,獲取跨通道信息,充分利用全局細節信息進行分割,在努力分割細小細胞核的同時,避免細胞黏附以及欠分割的現象,得到接近標簽圖像的效果,并在分割性能上有了一定的提升。
為了驗證網絡模型參數性能,將本文DCA-ResUNet網絡與其他分割網絡進行性能對比,實驗結果如表2所示,加粗字體表示較優指標。從表2可知,本文所提方法相比于其他網絡的參數量有一定降低,運行速度和ResUNet相接近,但本文算法的精確率均優于其他網絡。

如圖8所示,不同網絡在DSB2018數據集訓練中迭代損失函數的曲線變化情況均有不同;而在TNBC數據集上的曲線變化基本一致,故不予展示。由圖8可知,本文所提算法的起始損失函數值最低,在前20次迭代周期中損失迅速下降,之后逐漸趨于平穩,在迭代100次后損失函數的曲線沒有其他變化,損失函數值也得到了最低,此時曲線收斂速度也優于其他幾種網絡。其中網絡模型收斂越快,代表網絡學習能力更強,細胞核分割的準確度越高。

本文在DSB2018數據集上通過消融實驗證明了網絡中各個模塊的有效性,實驗結果如表3所示。從表3可知,只添加DSRC模塊的網絡在分割性能評價指標上均有提升,說明有效的編碼網絡能得到更具體的特征信息。只添加CAR模塊的基礎網絡,分割性能并未減弱,說明全局細節信息對分割結果同樣重要。而同時引入DSRC模塊和CAR模塊的網絡相較于前面的模塊在分割性能上都有了一定的提升,相比ResUNet在PRE、SEN上提升明顯。在這個網絡基礎上,引入SIF模塊后可融合深淺層的信息,其PRE、DSC和SEN均有提升,從而驗證了所提出的模塊對于提升細胞核分割性能具有一定的優勢。

3 結束語
細胞核圖像的有效分割是輔助醫生進行診斷和治療的重要前提,因此本文針對細胞核圖像的特點,提出了基于卷積和注意力機制的DCA-ResUNet分割網絡。該網絡以UNet作為基本結構,通過構造DSRC模塊有效提取細胞核特征,并降低網絡訓練參數。本文采取對CA機制改進并設計CAR模塊,提高網絡的特征學習能力,篩選出在圖像上更多有用信息。在跳躍連接階段采用SIF模塊來聚合深淺特征信息,使網絡聚焦于分割細胞核,改善分割效果。最后,使用兩個公開細胞核圖像數據集對DCA-ResUNet網絡進行實驗訓練與測試。實驗結果表明,本文所提方法的分割性能評價指標均有提高,在DSB2018數據集上的PRE、SEN和MIOU分別為92.01%、90.09%和89.01%,在TNBC數據集上的PRE、SEN和MIOU分別為89.21%、91.10%和89.12%。并且在主觀視覺上分割效果也有較優表現。因此本文所提網絡能為細胞核分割研究提供一定參考價值,在后續工作中將著重研究如何更優地讀取圖像特征,泛化分割能力。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:支佩佩主要負責數據集整理、算法程序設計、數據記錄與分析以及論文編寫;鄧健志主要負責提供實驗指導,數據分析以及論文審閱修訂。鐘震霄主要負責實驗流程、算法程序設計、協調溝通以及計劃安排。