引用本文: 杜林, 張洪, 羅翔鳳, 呂軍, 孫大強. 810例周邊型肺陰影的人工智能輔助胸部CT診斷與術后病理診斷對比分析. 中國胸心血管外科臨床雜志, 2022, 29(7): 854-858. doi: 10.7507/1007-4848.202201018 復制
肺癌是世界范圍內常見的惡性腫瘤,也是癌癥導致死亡的主要原因。根據世界衛生組織國際癌癥研究機構(International Agency for Research on Cancer,IARC)發布的 2020 年全球最新癌癥負擔數據[1]可知,肺癌在全球癌癥發病占比(11.4%)位居第二,全球癌癥死亡占比(18%)位居第一,嚴重威脅世界人民健康和生命。2020年,中國新發肺癌病例815 563例,死亡714 699例。男性肺癌發病率和死亡率均位居第一;女性發病率位居第二,死亡率位居第一。肺癌的早診、早治是改善預后的最重要方法。近年來,隨著胸部電子計算機斷層掃描(computed tomography,CT)檢查的普及,肺部小結節人群明顯增加。如何準確診斷肺小結節的病變性質,使早期肺癌患者得到及時治療,同時又避免對肺良性病灶進行過度診斷和治療,成為胸部影像學診斷的新挑戰[2-3]。人工智能(artificial intelligence,AI)輔助診斷技術在低劑量CT肺癌篩查中的應用不僅可以降低漏診率,還可以提高工作效率[4-5]。基于深度學習,它在肺結節的診斷方面取得了快速進展。據報道[6],肺癌預測卷積神經網絡(convolutional neural networks,CNN)評分可以準確而特異性地識別肺結節,曲線下面積(area under the curve,AUC)為0.896,假陰性率為0.4%。AI輔助胸部影像診斷是AI在醫療領域應用比較成功的范例。本項研究使用的AI輔助診斷系統就是一個基于計算機輔助設計(computer aided design,CAD)的3D-CNN網絡,識別模式采用了目標檢測的經典算法Faster-RCNN。2018年7月—2021年11月,在天津市胸科醫院已經輔助診斷了238 119例胸部CT影像資料。相關臨床科室的醫生將AI診斷不準確的地方進行人工修正后及時反饋給AI輔助診斷系統,從而促進了AI診斷準確率的不斷提高。本研究通過比較該系統術前診斷與術后病理結果,旨在評估AI輔助診斷系統在肺結節術前診斷中的價值。
1 資料與方法
1.1 臨床資料
回顧性納入2018年1月—2019年7月,在我院行胸外科手術的患者。納入標準:(1)保留我院術前電子影像學資料;(2)于我院行手術治療;(3)病理結果不存在爭議;(4)影像學資料提示為周圍型肺疾病,即病變位于段支氣管開口以外的病變;(5)病變為肺內病變;(6)主要收集球型或以球型為主的病變患者。排除標準:(1)周圍型病變術前明確病理;(2)周圍型病變嚴重考慮為炎性或影像學形態極為不規則;(3)中央型或與縱隔胸壁邊界模糊不清的病變;(4)細支氣管內病變。最終納入810例患者,其中男339例、女471例,中位年齡63歲。全組患者臨床資料見表1。根據不同影像學密度,將病理診斷為肺癌的患者分為純磨玻璃結節組(77例)、實性成分<50% 組(97例)、實性成分≥50% 組(219例)和實性病變組(234例);根據病灶大小,將病理診斷為肺癌的患者分為<1 cm 組(88例)、1~2 cm 組(157例)、>2~3 cm 組(270例)和>3 cm 組(112例);見表2~3。



1.2 方法
本組患者術前胸部CT檢查均采用薄層圖像(≤1.5 mm)、16排螺旋CT掃描。掃描范圍從胸腔入口到肺底。全肺掃描,一次呼吸后屏氣。掃描條件:管電壓120 kV、電子管電流200~340 mA、螺距1.375∶1、層厚5 mm、矩陣512×512、視野360 mm。采用標準算法重建切片厚度為1.5 mm的軸向圖像。
本組病例的AI輔助診斷系統采用LinkDoc 2020年2月迭代的肺部腫瘤計算機輔助診斷軟件(版本號v3.0.2.0)。AI輔助診斷過程可以分為四個階段:識別肺部區域、發現病灶、分析病灶信息、評估病灶的惡性概率。首先利用神經網絡技術識別CT影像中的肺部區域,然后在識別的肺部區域進行全盤檢測,查找疑似肺部病灶。在AI檢測階段,找到病灶區域后,首先提取病灶的所有特征,分析病灶信息,包括病灶位置、三維輪廓、最大直徑、體積、密度(磨玻璃、混雜密度、實性)、實性占比等特征。在惡性概率評估階段,將檢測出來的每一個病灶的原始CT圖像和AI提取的特征共同輸入良惡性模型中,最終得出肺病灶的惡性概率,其分布區間為0.1%~99.9%。
1.3 統計學分析
采用SPSS 25.0軟件進行統計分析。分類變量采用例數和構成比(%)描述,組間比較采用χ2檢驗;連續變量采用中位數和上下四分位數[M(P25,P75)]描述。以P≤0.05為差異有統計學意義。采用受試者工作特征(receiver operating characteristic,ROC)曲線確定AI系統診斷的截斷值。
1.4 倫理審查
本研究已通過天津市胸科醫院倫理委員會審批,批準號:2021KY-012。
2 結果
全組810例患者術后病理診斷分為三組:肺癌組627例(77.4%),AI診斷中位惡性概率為86.0%(30.0%,99.0%);癌前病變組30例(3.7%),AI診斷中位惡性概率為90.0%(67.0%,91.0%);良性病變組153例(18.9%),AI診斷中位惡性概率為37.0%(3.0%,87.0%)。對810例患者進行AI惡性概率與術后病理診斷關系的ROC曲線分析,結果顯示,AUC為0.882(P<0.05)。當惡性概率為75.0%時,敏感度與特異性之和最高,敏感度為0.856,特異性為0.814;見圖1。

AI:人工智能
對全組810例患者中AI惡性概率≥75.0%的病例(571例)進行分析,術后病理診斷肺癌537例(94.0%)、癌前病變25例(4.4%)、良性病變9例(1.6%)。將AI惡性概率≥75.0%作為診斷肺癌的標準有較高的陽性預測值(94.0%)。
根據不同影像學密度,將全組627例肺癌病例分為純磨玻璃、實性成分<50.0%、實性成分≥50.0%和實性病變4組;見表2。以AI惡性概率≥75.0%為標準進行比較,結果顯示,各組絕大多數患者惡性概率≥75.0%(P<0.001),但組間差異無統計學意義(P>0.05);見圖2。

AI 惡性概率≥75.0%患者多于 AI 惡性概率<75.0%患者,差異有統計學意義(
按照病灶大小,將627例肺癌患者分為腫瘤大小<1 cm,1~2 cm,>2~3 cm和>3 cm 4組;見表3。以AI惡性概率≥75.0%為標準進行比較,結果顯示,各組患者絕大多數惡性概率≥75.0%(P<0.001),但組間差異無統計學意義(P>0.05);見圖3。

AI 惡性概率≥75.0%患者多于 AI 惡性概率<75.0%患者,差異有統計學意義(
3 討論
本研究結果表明,LinkDoc AI助胸部CT診斷系統對周圍型肺陰影的良惡性診斷具有較高的準確率。以惡性概率≥75.0%為標準,診斷肺癌的陽性預測值可以達到94.0%。本研究顯示,對惡性肺磨玻璃結節和混雜密度結節,AI輔助診斷的惡性概率≥75.0%的比例很高。對于<1 cm和1~2 cm的肺癌結節AI診斷的惡性概率≥75.0%的比例也很高,這種小的磨玻璃狀或混雜密度的肺結節,正是臨床診斷的難點。AI正是在這方面具有獨特的優勢,可以為臨床醫生提供非常有價值的診斷依據。
與傳統的CT檢查相比,AI具有檢出率高、速度快等優點。這些優勢基于對大樣本的深度學習和臨床醫生的反饋。一些研究[7]表明,CT的漏診率可能為0.6%~7.4%。幸運的是,在這項研究中,我們的AI診斷和治療系統沒有遺漏診斷。有研究[8]發現,與CT圖像本身相比,基于CT圖像的計算機算法在檢測外周肺結節方面有很大的改進。有趣的是,我們還發現了大量的假陽性結節,這些結節的直徑通常<5 mm,其中大多數是磨玻璃結節,而這些結節的惡性發生率更高(≥75.0%)。這些假陽性結節的原因包括:氣管相關和血管相關原因,包括增厚、曲折和交叉的血管,增厚的肺門血管等;正常或異常的肺結構,如小葉核心結構、增厚的小葉間隔和小葉內隔;感染性病變,如臍帶、疤痕在不同階段的不透明度等[9]。當然誤報的原因也可能與AI設置的檢測結節大小的極低閾值有關。這些結節的臨床意義尚不清楚,一般不給予過多的臨床干預。這些結節是否能成為早期肺癌,值得進一步研究和分析。
雖然AI系統比CT有一些優勢,但它也有一定的局限性和一定的適用范圍。與中樞結節相比,AI在檢測外周病變方面具有很大的優勢。首先,中樞病變需要更多的條件和參數進行處理,例如增強CT、建立血管、氣管和其它參數。其次,AI系統的第一步是檢測醫學圖像中病變的位置。大多數先前的研究使用了來自肺癌篩查試驗[如國家肺部篩查試驗(National Lung Screening Trial,NLST)]的CT數據,其結節大小在3~30 mm之間,其中大多數是外周結節[10-11]。本研究僅研究了周圍型肺陰影。一些研究[12]表明,隨著腫瘤T分期的增加,AI在評估病變中的準確性會降低。據文獻分析,AI驅動算法可以檢測和分析肺部T1病變(檢出率為90.4%),T2腫瘤檢測良好(檢出率為70.8%)。由于該算法是為<3 cm的肺結節設計的,因此可能不適用于直徑>5 cm的腫瘤。考慮到CT序列作為算法輸入的切片厚度為3 mm,這是在自由呼吸條件下獲得的,并且其中大多數是非增強技術,這更正確。在晚期腫瘤(T3/T4)中,檢測更具挑戰性,檢出率較低。雖然CNN系統比CAD更先進,但直徑≤3 cm的周圍型肺結節在臨床上的比例明顯較高,因此算法存在一定的偏差。本研究發現,隨著肺癌實性成分或腫瘤直徑的增加,AI診斷的準確性呈現下降趨勢。這項研究對癌前病變的惡性腫瘤預測概率很高,類似于肺癌,這是一個意想不到的結果。在AI輔助診斷中,如何保證CT圖像及報告的高質量成為了臨床醫生重要的研究課題,為此臨床醫生探索了不同的方法[13]。然而,即使提倡使用結構化報告,仍然存在漏診的可能性[14-15]。AI基于前期的訓練集及CT圖像,結合大量數據進行深度計算,可成為醫生的得力助手[16]。
綜上所述,利用AI輔助診斷周圍型肺陰影系統對肺癌惡性概率的評估,對肺癌術前診斷效率高且具有重要意義。與CT診斷相比,AI診斷對肺癌診斷的重合率更高。
利益沖突:無。
作者貢獻:杜林負責規劃設計文章思路、文章撰寫、數據收集、數據分析、查閱文獻;張洪參與術前CT的診斷及審核,提供影像學數據;羅翔鳳為AI軟件總負責人,負責設計AI及語法環境的維護,提供AI數據;呂軍負責術前影像診斷及影像學角度反饋AI語法環境;孫大強負責文章設計、審核影像學及AI數據。
肺癌是世界范圍內常見的惡性腫瘤,也是癌癥導致死亡的主要原因。根據世界衛生組織國際癌癥研究機構(International Agency for Research on Cancer,IARC)發布的 2020 年全球最新癌癥負擔數據[1]可知,肺癌在全球癌癥發病占比(11.4%)位居第二,全球癌癥死亡占比(18%)位居第一,嚴重威脅世界人民健康和生命。2020年,中國新發肺癌病例815 563例,死亡714 699例。男性肺癌發病率和死亡率均位居第一;女性發病率位居第二,死亡率位居第一。肺癌的早診、早治是改善預后的最重要方法。近年來,隨著胸部電子計算機斷層掃描(computed tomography,CT)檢查的普及,肺部小結節人群明顯增加。如何準確診斷肺小結節的病變性質,使早期肺癌患者得到及時治療,同時又避免對肺良性病灶進行過度診斷和治療,成為胸部影像學診斷的新挑戰[2-3]。人工智能(artificial intelligence,AI)輔助診斷技術在低劑量CT肺癌篩查中的應用不僅可以降低漏診率,還可以提高工作效率[4-5]。基于深度學習,它在肺結節的診斷方面取得了快速進展。據報道[6],肺癌預測卷積神經網絡(convolutional neural networks,CNN)評分可以準確而特異性地識別肺結節,曲線下面積(area under the curve,AUC)為0.896,假陰性率為0.4%。AI輔助胸部影像診斷是AI在醫療領域應用比較成功的范例。本項研究使用的AI輔助診斷系統就是一個基于計算機輔助設計(computer aided design,CAD)的3D-CNN網絡,識別模式采用了目標檢測的經典算法Faster-RCNN。2018年7月—2021年11月,在天津市胸科醫院已經輔助診斷了238 119例胸部CT影像資料。相關臨床科室的醫生將AI診斷不準確的地方進行人工修正后及時反饋給AI輔助診斷系統,從而促進了AI診斷準確率的不斷提高。本研究通過比較該系統術前診斷與術后病理結果,旨在評估AI輔助診斷系統在肺結節術前診斷中的價值。
1 資料與方法
1.1 臨床資料
回顧性納入2018年1月—2019年7月,在我院行胸外科手術的患者。納入標準:(1)保留我院術前電子影像學資料;(2)于我院行手術治療;(3)病理結果不存在爭議;(4)影像學資料提示為周圍型肺疾病,即病變位于段支氣管開口以外的病變;(5)病變為肺內病變;(6)主要收集球型或以球型為主的病變患者。排除標準:(1)周圍型病變術前明確病理;(2)周圍型病變嚴重考慮為炎性或影像學形態極為不規則;(3)中央型或與縱隔胸壁邊界模糊不清的病變;(4)細支氣管內病變。最終納入810例患者,其中男339例、女471例,中位年齡63歲。全組患者臨床資料見表1。根據不同影像學密度,將病理診斷為肺癌的患者分為純磨玻璃結節組(77例)、實性成分<50% 組(97例)、實性成分≥50% 組(219例)和實性病變組(234例);根據病灶大小,將病理診斷為肺癌的患者分為<1 cm 組(88例)、1~2 cm 組(157例)、>2~3 cm 組(270例)和>3 cm 組(112例);見表2~3。



1.2 方法
本組患者術前胸部CT檢查均采用薄層圖像(≤1.5 mm)、16排螺旋CT掃描。掃描范圍從胸腔入口到肺底。全肺掃描,一次呼吸后屏氣。掃描條件:管電壓120 kV、電子管電流200~340 mA、螺距1.375∶1、層厚5 mm、矩陣512×512、視野360 mm。采用標準算法重建切片厚度為1.5 mm的軸向圖像。
本組病例的AI輔助診斷系統采用LinkDoc 2020年2月迭代的肺部腫瘤計算機輔助診斷軟件(版本號v3.0.2.0)。AI輔助診斷過程可以分為四個階段:識別肺部區域、發現病灶、分析病灶信息、評估病灶的惡性概率。首先利用神經網絡技術識別CT影像中的肺部區域,然后在識別的肺部區域進行全盤檢測,查找疑似肺部病灶。在AI檢測階段,找到病灶區域后,首先提取病灶的所有特征,分析病灶信息,包括病灶位置、三維輪廓、最大直徑、體積、密度(磨玻璃、混雜密度、實性)、實性占比等特征。在惡性概率評估階段,將檢測出來的每一個病灶的原始CT圖像和AI提取的特征共同輸入良惡性模型中,最終得出肺病灶的惡性概率,其分布區間為0.1%~99.9%。
1.3 統計學分析
采用SPSS 25.0軟件進行統計分析。分類變量采用例數和構成比(%)描述,組間比較采用χ2檢驗;連續變量采用中位數和上下四分位數[M(P25,P75)]描述。以P≤0.05為差異有統計學意義。采用受試者工作特征(receiver operating characteristic,ROC)曲線確定AI系統診斷的截斷值。
1.4 倫理審查
本研究已通過天津市胸科醫院倫理委員會審批,批準號:2021KY-012。
2 結果
全組810例患者術后病理診斷分為三組:肺癌組627例(77.4%),AI診斷中位惡性概率為86.0%(30.0%,99.0%);癌前病變組30例(3.7%),AI診斷中位惡性概率為90.0%(67.0%,91.0%);良性病變組153例(18.9%),AI診斷中位惡性概率為37.0%(3.0%,87.0%)。對810例患者進行AI惡性概率與術后病理診斷關系的ROC曲線分析,結果顯示,AUC為0.882(P<0.05)。當惡性概率為75.0%時,敏感度與特異性之和最高,敏感度為0.856,特異性為0.814;見圖1。

AI:人工智能
對全組810例患者中AI惡性概率≥75.0%的病例(571例)進行分析,術后病理診斷肺癌537例(94.0%)、癌前病變25例(4.4%)、良性病變9例(1.6%)。將AI惡性概率≥75.0%作為診斷肺癌的標準有較高的陽性預測值(94.0%)。
根據不同影像學密度,將全組627例肺癌病例分為純磨玻璃、實性成分<50.0%、實性成分≥50.0%和實性病變4組;見表2。以AI惡性概率≥75.0%為標準進行比較,結果顯示,各組絕大多數患者惡性概率≥75.0%(P<0.001),但組間差異無統計學意義(P>0.05);見圖2。

AI 惡性概率≥75.0%患者多于 AI 惡性概率<75.0%患者,差異有統計學意義(
按照病灶大小,將627例肺癌患者分為腫瘤大小<1 cm,1~2 cm,>2~3 cm和>3 cm 4組;見表3。以AI惡性概率≥75.0%為標準進行比較,結果顯示,各組患者絕大多數惡性概率≥75.0%(P<0.001),但組間差異無統計學意義(P>0.05);見圖3。

AI 惡性概率≥75.0%患者多于 AI 惡性概率<75.0%患者,差異有統計學意義(
3 討論
本研究結果表明,LinkDoc AI助胸部CT診斷系統對周圍型肺陰影的良惡性診斷具有較高的準確率。以惡性概率≥75.0%為標準,診斷肺癌的陽性預測值可以達到94.0%。本研究顯示,對惡性肺磨玻璃結節和混雜密度結節,AI輔助診斷的惡性概率≥75.0%的比例很高。對于<1 cm和1~2 cm的肺癌結節AI診斷的惡性概率≥75.0%的比例也很高,這種小的磨玻璃狀或混雜密度的肺結節,正是臨床診斷的難點。AI正是在這方面具有獨特的優勢,可以為臨床醫生提供非常有價值的診斷依據。
與傳統的CT檢查相比,AI具有檢出率高、速度快等優點。這些優勢基于對大樣本的深度學習和臨床醫生的反饋。一些研究[7]表明,CT的漏診率可能為0.6%~7.4%。幸運的是,在這項研究中,我們的AI診斷和治療系統沒有遺漏診斷。有研究[8]發現,與CT圖像本身相比,基于CT圖像的計算機算法在檢測外周肺結節方面有很大的改進。有趣的是,我們還發現了大量的假陽性結節,這些結節的直徑通常<5 mm,其中大多數是磨玻璃結節,而這些結節的惡性發生率更高(≥75.0%)。這些假陽性結節的原因包括:氣管相關和血管相關原因,包括增厚、曲折和交叉的血管,增厚的肺門血管等;正常或異常的肺結構,如小葉核心結構、增厚的小葉間隔和小葉內隔;感染性病變,如臍帶、疤痕在不同階段的不透明度等[9]。當然誤報的原因也可能與AI設置的檢測結節大小的極低閾值有關。這些結節的臨床意義尚不清楚,一般不給予過多的臨床干預。這些結節是否能成為早期肺癌,值得進一步研究和分析。
雖然AI系統比CT有一些優勢,但它也有一定的局限性和一定的適用范圍。與中樞結節相比,AI在檢測外周病變方面具有很大的優勢。首先,中樞病變需要更多的條件和參數進行處理,例如增強CT、建立血管、氣管和其它參數。其次,AI系統的第一步是檢測醫學圖像中病變的位置。大多數先前的研究使用了來自肺癌篩查試驗[如國家肺部篩查試驗(National Lung Screening Trial,NLST)]的CT數據,其結節大小在3~30 mm之間,其中大多數是外周結節[10-11]。本研究僅研究了周圍型肺陰影。一些研究[12]表明,隨著腫瘤T分期的增加,AI在評估病變中的準確性會降低。據文獻分析,AI驅動算法可以檢測和分析肺部T1病變(檢出率為90.4%),T2腫瘤檢測良好(檢出率為70.8%)。由于該算法是為<3 cm的肺結節設計的,因此可能不適用于直徑>5 cm的腫瘤。考慮到CT序列作為算法輸入的切片厚度為3 mm,這是在自由呼吸條件下獲得的,并且其中大多數是非增強技術,這更正確。在晚期腫瘤(T3/T4)中,檢測更具挑戰性,檢出率較低。雖然CNN系統比CAD更先進,但直徑≤3 cm的周圍型肺結節在臨床上的比例明顯較高,因此算法存在一定的偏差。本研究發現,隨著肺癌實性成分或腫瘤直徑的增加,AI診斷的準確性呈現下降趨勢。這項研究對癌前病變的惡性腫瘤預測概率很高,類似于肺癌,這是一個意想不到的結果。在AI輔助診斷中,如何保證CT圖像及報告的高質量成為了臨床醫生重要的研究課題,為此臨床醫生探索了不同的方法[13]。然而,即使提倡使用結構化報告,仍然存在漏診的可能性[14-15]。AI基于前期的訓練集及CT圖像,結合大量數據進行深度計算,可成為醫生的得力助手[16]。
綜上所述,利用AI輔助診斷周圍型肺陰影系統對肺癌惡性概率的評估,對肺癌術前診斷效率高且具有重要意義。與CT診斷相比,AI診斷對肺癌診斷的重合率更高。
利益沖突:無。
作者貢獻:杜林負責規劃設計文章思路、文章撰寫、數據收集、數據分析、查閱文獻;張洪參與術前CT的診斷及審核,提供影像學數據;羅翔鳳為AI軟件總負責人,負責設計AI及語法環境的維護,提供AI數據;呂軍負責術前影像診斷及影像學角度反饋AI語法環境;孫大強負責文章設計、審核影像學及AI數據。