引用本文: 陳瑤, 呂青. 人工智能在乳腺癌篩查與診斷中的研究現狀. 中國普外基礎與臨床雜志, 2019, 26(5): 625-630. doi: 10.7507/1007-9424.201901069 復制
乳腺癌嚴重威脅全球女性的生命健康。在中國,乳腺癌位居女性惡性腫瘤發病率的首位,女性惡性腫瘤死亡率的第 5 位。乳腺癌流行病學數據缺失,發病機制復雜,高危因素控制難,一級病因預防難以實現,故乳腺惡性腫瘤防控仍以“三早”的二級預防為主。腫瘤篩查是早發現、早診斷的重要手段,但是面臨著篩查覆蓋人群有限,篩查成本高,早診技術水平低,投入大、收效小的問題,而致我國早期乳腺癌占比低。因此如何提高腫瘤有效篩查率及診斷準確性是研究者的共同目標。隨著人工智能(artificial Intelligence,AI)的發展和醫療數據的積累,AI 與臨床醫療深度結合,革新了醫學影像的表達方式,二者聯合研究具有較高的應用前景。筆者現就 AI 與乳腺癌影像檢查及病理檢查的聯合研究進行綜述。
1 乳腺癌的流行病學、篩查及診斷方法
統計數據顯示,估計 2018 年全球約新增 1 810 萬癌癥患者,癌癥致死人數約 910 萬(均不包括非黑素瘤皮膚癌的發病及死亡人數)[1]。同時分析 2017 年中國腫瘤登記中心收集的 2014 年各腫瘤登記地區的乳腺癌數據發現,全國 2014 年女性乳腺癌新發病例約 27.89 萬例,占女性惡性腫瘤發病人數的 16.51%,位居女性惡性腫瘤發病的首位[2]。全國 2014 年女性乳腺癌死亡病例約 6.60 萬例,占女性惡性腫瘤死亡的 7.82%,位居女性惡性腫瘤死亡率的第 5 位[2]。乳腺惡性腫瘤的防控以二級預防為主,但面臨著篩查覆蓋人群有限、篩查成本高等問題。女性乳腺癌篩查是通過有效、簡便及經濟的檢查措施,對無癥狀婦女開展篩查,以期望早期發現、早期診斷及早期治療,其目的是降低人群乳腺癌的死亡率。用于乳腺癌篩查的措施有:乳腺 X 線檢查、乳腺臨床體檢、乳腺自我檢查、乳腺超聲檢查及乳腺 MRI 檢查[3]。乳腺組織病理檢查或免疫組織化學檢查為乳腺疾病診斷的金標準。
2 AI 及醫學 AI
AI 是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工神經網絡(artificial neural network,ANN)是一種模仿生物神經網絡的結構和功能的數學模型或計算模型,用于對函數進行估計或近似[4],現代神經網絡是一種非線性統計數據建模工具。ANN 是 AI 的一個分支。ANN 經歷了幾十年的自身發展,先后有著名的 LeNet[5]、AlexNet[6]、ResNet[7]等不同類型神經網絡。AI 的核心是數據、算力和算法。高級的 AI,從技術層面不僅依賴云計算處理大數據的能力,同樣依賴于算法,深度學習便是對整個神經網絡做優化訓練。
卷積神經網絡(convolutional neural network,CNN)不同于其他類型的神經網絡,其在解決諸如視覺識別、語音識別、自然語言處理等很多問題方面均表現出較高的性能優勢。在圖像識別領域,2009 年,李飛飛研發了 ImageNet,并舉辦了大規模的視覺識別挑戰賽[8]。ImageNet 擁有目前世界上最大的公開圖像識別數據庫,助推了全球 AI 圖像識別在各行各業的飛速發展。2012 年 Google X Lab 使用 1 000 臺電腦、16 000 顆處理器,創造了 10 億個連接的神經網絡,在 1 000 萬條 Youtube 視頻略縮圖中,識別出了貓[9]。
隨著 AI 的發展和醫療數據的積累,AI 與臨床醫療深度結合。基于神經網絡聯合醫學影像研究的薈萃分析[10]及 AI 在影像學的發展和現狀的研究[11-12]均指出:目前神經網絡與醫學影像領域的聯合研究較多,其中人體不同器官系統的 MRI、MICROSCOPY、CT、X 線及超聲的圖像均被用于聯合研究。
醫學影像作為工具,在癌癥篩查與診斷中占據重要的醫療地位,深度學習算法革新了醫學影像的表達方式,二者深度結合具有較高的應用前景,尤其在以下方面。① 疾病檢出:可以提高早診率,減少漏診率,如 CT 肺結節、視網膜病變等;② 多維定量:可自動多維度測量病變,實現病變特征提取、病灶自動分割等;③ 精準診斷:進行良惡性判別,提高分期和分級準確率;④ 治療評估:包括術前設計、療效評估和預后估測。2018 年北美放射協會年會(Radiological Society of North America,RSNA)展示的部分研究已實現產品轉化并落地應用。
3 AI 在乳腺癌篩查和診斷領域中的研究現狀
乳腺腫瘤篩查是指通過有效、簡便及經濟的檢查措施,對無癥狀婦女開展篩查,以期望早期發現、早期診斷及早期治療。其目的是降低人群乳腺癌的死亡率。用于乳腺癌篩查的措施有:乳腺 X 線檢查、乳腺臨床體檢、乳腺自我檢查、乳腺超聲檢查及乳腺 MRI 檢查,而病理學檢查是各類檢查發現的異常病灶的診斷金標準。
3.1 AI 在乳腺 X 線中的研究
乳腺 X 線檢查系指 X 線球管發出的 X 射線照射乳腺組織,形成圖像,是西方國家篩查乳腺癌的首選。在醫學影像領域,收集百萬級別的大樣本的數據樣本非常困難[13]。乳腺智能 X 線擁有目前乳腺智能領域唯一公開的數據集類型,約 2 000 多例 X 線圖片,其中包括乳腺 X 光數字乳腺圖像數據庫 DDSM[14]、全視野數字乳腺 X 線攝影數據集 FFDM[15]及乳腺 X 線圖像分析協會數據集 MIAS[16]。經過統一標注的公開數據庫,使得國內外智能 X 線擁有決勝力的數據優勢,較乳腺超聲和乳腺磁共振,乳腺 X 線在乳腺智能領域發展最為迅速。
2017 年,Samala 等[17]利用 ImageNet 預訓練深度學習模型,基于 DDSM 數據庫,實現了高精度的乳腺 X 線攝影圖像的乳腺癌診斷。隨著乳腺 X 線攝影數字斷層影像的出現,Samala 等[18]研究用乳腺 X 線攝影平片訓練獲得的深度 CNN 用于乳腺斷層影像可疑性病變的檢測。同樣基于 DDSM 數據庫,Lévy 等[19]利用預訓練的 AlexNet 和 Szegedy 等[20]利用 GoogLeNet 深度學習網絡對乳腺 X 線攝影上的良惡性腫瘤加以區分,取得了當前的最優診斷結果。
乳腺腺體密度作為乳腺癌發病的獨立因素,成為眾多學者的研究對象。2018 年,Lehman 等[21]利用 CNN 對乳腺 X 線平片中的腺體密度進行了分類測量。該研究為多中心研究,共納入 2009 年至 2011 年期間的 39 272 例女性患者的共 58 894 張圖片,由 12 名放射科醫生進行標注,以約等于 5∶1 的比例進行訓練集和驗證集分配并建立模型,之后以 2018 年行乳腺 X 線檢查的 10 763 例患者的圖片進行測試,并與 5 名放射醫生進行診斷準確率對比,由原 12 名標注醫生評判結果。結果發現,神經網絡測試的診斷準確性結果低于放射醫生,但是可以作為乳腺癌篩查的輔助診斷工具,診斷結論可供放射醫生參考。
2018 年 RSNA 部分研究機構發布了研究結論及其產品。AI-X 線目前可完成病灶的檢出、分割、良惡性分類并出具結構化報告,報告內容包括腺體分型、腺體結構扭曲、腺體分布是否對稱、可疑病灶、病灶征象(如腫塊、鈣化)及病灶的乳腺影像報告和數據系統(breast imaging reporting and data system,BI-RADS)分級[22],AI-X 線距離成為放射醫生的診斷助手又進了一步。
3.2 AI 在乳腺 MRI 中的研究
MRI 檢查是利用線圈向目標發射特定射頻信號,人體內被激活的氫質子所釋放的信號會被線圈接收,結合編碼,可重建出待掃描目標的三維影像。磁共振成像無輻射,可對不同組織進行多參數、任意切面成像,對比度和分辨率非常高,幾乎可適用于人體系統各種疾病[23]。在乳腺惡性腫瘤篩查方面,MRI 有著較高的敏感性。2018 年,Xu 等[24]利用 CNN 動態對比增強磁共振成像實現了乳腺分割。
乳腺腺體非彌漫性增強在乳腺磁共振中較常見,但在診斷上具有挑戰性。2018 年,Gallego-Ortiz 等[25]提出了一種改進的深度嵌入方法,用于計算機輔助診斷非腫塊型乳腺 MRI 病變的基于圖像的病灶特征。該方法的優點在于最大化計算機輔助診斷系統病灶分類器的診斷準確性,區分良惡性病變。該團隊同時研究測評了其診斷性能,并與傳統分類器在原始特征空間中的診斷性能進行了比較,結果顯示,受試者工作特征曲線(ROC)曲線下面積(AUC)有統計學意義的增加,泛化 AUC 從 0.67±0.08 增加到 0.81±0.10,增加了 21%。
2010 年,Perez 等[26]收集了 194 例乳腺癌患者的磁共振影像資料,應用神經網絡預測乳腺癌患者同側腋下淋巴結是否轉移,結果顯示,診斷精確度達到了適度的 AUC。2018 年,Luo 等[27]采用彌散加權磁共振成像數據庫對 172 例患者進行前哨淋巴結(sentinel lymph node,SLN)轉移與否預測,提出了一種深度學習與特征袋模型相結合的提取磁共振深層特征的方法;結果表明,該方法預測測試集 SLN 轉移與否的 AUC 高達 0.852 [95% 置信區間(CI)為(0.716,0.988)]。
3.3 AI 在乳腺超聲中的研究
超聲波檢查是用弱超聲波照射到目標身體上,將組織的反射波進行圖像化處理。傳統超聲為醫師手持探頭檢查,近年來,全自動乳腺容積掃描超聲(automated breast volume scanner,ABVS)開始應用于臨床。
AI 在乳腺超聲中的研究多集中在病灶的良惡性二分類診斷。Kuo 等[28]利用虛擬器官計算機輔助分析成像程序繪制乳腺病灶周圍輪廓,獲得腫瘤血管化直方圖指標,利用多層感知機構建分類器,實現了分類器分類惡性腫瘤,靈敏度為 90.3%,特異度為 79.4%,陽性預測值(PPV)為 80%,陰性預測值(NPV)為 90%。
Han 等[29]利用 GoogLeNet 網絡,手動選擇可疑病灶熱點區域(region of interest,ROI),以識別乳腺超聲中可疑病灶的良惡性。這是目前可查詢的神經網絡在乳腺超聲領域中的較大數據集的研究,包括 5 151 例患者共 7 408 張乳腺超聲圖像,其中 4 254 張良性圖像,3 154 張惡性圖像。通過構建模型對數據集進行訓練、驗證和測試,并識別乳腺超聲中可疑病灶的良惡性。其結果顯示,AUC 大于 0.9,準確性為 90%,靈敏度為 86%,特異度為 96%。
神經網絡及影像設備均在科技發展中更新換代。普通神經網絡會忽略重要的空間信息,而 3D 卷積神經網絡(3D convolutional neural networks,3D CNN)可以動態提取更豐富的空間信息,獲得具有更大的可用于區分的數據。手持探頭二維超聲檢查為不連續掃描,依賴操作者的經驗,檢測結果的可重復性稍弱,而 ABVS 可優化檢查流程,提高檢查結果的可重復性,并減少超聲人力資源。2018 年,Chiang 等[30]聯合 3D CNN 與 ABVS 以診斷乳腺可疑病灶的良惡性。該模型可以從空間和時間的維度提取特征,然后進行 3D 卷積,以捕捉從多個連續幀得到的運動信息。該研究納入了 187 例患者,共計 230 副乳腺超聲圖像。該模型具有較高的靈敏度,但是在較高靈敏度的同時特異性稍弱。相對于普通 2D CNN 和靜止的圖片,3D CNN 與 ABVS 的聯合是基于視頻的新型研究方法,作為新技術的聯合研究,給未來的研究者提供了新思路。
在 AI 與超聲聯合研究中,三星麥迪遜公司率先實現 AI 乳腺二維超聲研究的產品轉化,其推出的一系列超聲儀器中均嫁接了乳腺智能識別系統 S-DetectTM[31]。在超聲科醫生為患者檢查的過程中,醫生手動選擇 ROI 后,儀器自動識別 ROI,測量 ROI 的各項數據,報告病灶形態、縱橫比例、邊界、內部回聲、后方回聲衰減情況、鈣化等信息,縮短了超聲醫生對乳腺超聲圖像的診斷及出具報告的時間,也推動了乳腺超聲診斷報告的標準統一化進程。
3.4 AI 在乳腺病理中的研究
病理形態檢查是將標本制成病理切片,觀察細胞和組織的形態結構變化,以確定病變性質,作出病理診斷。現代病理檢查還包括組織化學、免疫組織化學、分子生物學、癌基因檢查等。近年來隨著個性化醫療的出現,病理學家面臨著癌癥組織病理學診斷工作量和復雜性顯著增加的困境。
2016 年,Litjens 等[32]引入深度學習提高了組織病理學幻燈片分析的客觀性和效率,他發現,所有含有前列腺癌和乳腺癌微轉移和宏觀轉移的載玻片均可自動識別,其中 30%~40% 的含有良性和正常組織的載玻片可以被排除,而無需使用任何額外的免疫組織化學標志物或人為干預。
2017 年,Ehteshami Bejnordi 等在 JAMA 上報道了 1 例 AI 算法公開賽[19],探討了深度學習算法應用于整個幻燈片病理圖像是否可以提高診斷的準確性和效率[33-34]。數據來自荷蘭 2 個中心的病理全幻燈片圖,標本經免疫組織化學染色驗證且經 11 位病理學家認定。訓練集包括 270 張玻片(110 張轉移,160 張無轉移),將該數據集提供給所有參賽單位,供他們訓練建模。最后在 129 個全幻燈片圖像(49 張轉移,80 張無轉移)的獨立測試集中評估算法性能。來自荷蘭的 11 位具有時間限制的病理學家小組也對相同的載玻片測試集進行了評估,以確定每個載玻片在 2 h 的靈活的時間段中診斷淋巴結轉移的可能性,以模擬常規病理工作流程,并通過 1 名沒有時間限制的病理學家進行最終驗證。在整個幻燈片圖像分類任務中,最佳模型算法 [AUC=0.994,95% CI 為(0.983,0.999)] 在診斷模擬中的表現明顯優于病理學家。算法公開賽的結論是,在挑戰競賽的背景下,一些深度學習算法比參與模擬常規病理工作流程的 11 名病理學家小組獲得了更好的診斷性能。
2018 年,Couture 等[35]使用一組 571 例乳腺腫瘤的訓練集,創建基于圖像的腫瘤分級、分期、分型、淋巴結狀態、腫瘤大小、ER/PR 狀態及比例、Ki67 比例、HER-2 狀態(IHC 法)、PAM50 固有亞型和復發風險的評分分類器,將最終的分類器應用于獨立的測試集(n=288),并列表統計分析模型對每個被測試因素的準確性、敏感性和特異性。最終發現,關于患者或腫瘤特征,訓練集和測試集之間沒有明顯差異。
4 小結與展望
乳腺的影像篩查是乳腺癌二級預防的重要環節,篩查出的疑似病變最終待病理確診。隨著個性化醫療的深入,醫療各端口的工作量增加,而各類檢查診斷報告均存在不同程度的主觀性和不穩定性,且目前中心城市及偏遠地區醫療資源配比不均,導致診斷的準確性差異大。隨著神經網絡的發展以及醫學影像數據的積累,影像與 AI 結合是順應時勢的產物。CNN 在圖像識別領域表現出較高性能,在現有各項研究中均可看到神經網絡模型可作為輔助工具提高醫生的診斷時效,弱化了醫生診斷的主觀性和不穩定性。
目前,國內外運用神經網絡對乳腺疾病影像篩查及診斷的研究以乳腺 X 線攝影開展得最多。神經網絡在乳腺 X 線及乳腺彩超領域的研究方面均可做到病灶分割、測量、特征分析、良惡性判斷及出具結構化報告。三星麥迪遜集團率先將研究成果嫁接在其超聲儀器中。隨著儀器自身的更新換代,神經網絡結構及算法的更新,新的聯合研究也在出現。放射組學概念的提出,拓寬了神經網絡在疾病研究的領域,且因乳腺 MRI 具有較多高通量信息,率先成為 AI 與影像組學[36]聯合研究的切入點。此外,病理圖像存在大量可測量數據,且個性化醫療的出現,使病理學家面臨著癌癥組織病理學診斷的工作量和復雜性的顯著增加,而 AI 可以提高病理醫生的診斷時效。隨著醫學影像組學及神經網絡彼此的發展,AI 在醫學領域應用可擴展到手術方式設計、療效評估、預后分析等。
雖然 AI 在圖像識別領域表現出較高性能,可以作為醫生的輔助工具用以提高診斷時效,但是臨床診斷不是僅依賴圖片,患者病史、查體和多檢查協助同樣重要,且智能模型的穩定性、泛化能力等均在進一步探索中,各類人機對比測試也在持續進行,智能檢查大范圍應用于臨床還有一段探索的路要走。
筆者認為,乳腺 AI 未來的研究趨勢集中在以下方面。從醫療層面:① 運用乳腺超聲、X 線、MRI及病理多模態聯合診斷,進一步提高診斷性能,擴展應用領域;② 在乳腺影組學領域深入研究,讓研究結論參與治療流程。技術層面:① 單中心數據局限,使得單體研究模型應用于其他地區人群時模型準確率降低,應積極建設公開數據庫,擴充多中心數以提高神經網絡泛化能力;② 神經網絡結構及算法研究;③ 在大數據的基礎上進行小數據集特征優化(精細標注),提高模型診斷的準確性,加快學習進度。
乳腺癌嚴重威脅全球女性的生命健康。在中國,乳腺癌位居女性惡性腫瘤發病率的首位,女性惡性腫瘤死亡率的第 5 位。乳腺癌流行病學數據缺失,發病機制復雜,高危因素控制難,一級病因預防難以實現,故乳腺惡性腫瘤防控仍以“三早”的二級預防為主。腫瘤篩查是早發現、早診斷的重要手段,但是面臨著篩查覆蓋人群有限,篩查成本高,早診技術水平低,投入大、收效小的問題,而致我國早期乳腺癌占比低。因此如何提高腫瘤有效篩查率及診斷準確性是研究者的共同目標。隨著人工智能(artificial Intelligence,AI)的發展和醫療數據的積累,AI 與臨床醫療深度結合,革新了醫學影像的表達方式,二者聯合研究具有較高的應用前景。筆者現就 AI 與乳腺癌影像檢查及病理檢查的聯合研究進行綜述。
1 乳腺癌的流行病學、篩查及診斷方法
統計數據顯示,估計 2018 年全球約新增 1 810 萬癌癥患者,癌癥致死人數約 910 萬(均不包括非黑素瘤皮膚癌的發病及死亡人數)[1]。同時分析 2017 年中國腫瘤登記中心收集的 2014 年各腫瘤登記地區的乳腺癌數據發現,全國 2014 年女性乳腺癌新發病例約 27.89 萬例,占女性惡性腫瘤發病人數的 16.51%,位居女性惡性腫瘤發病的首位[2]。全國 2014 年女性乳腺癌死亡病例約 6.60 萬例,占女性惡性腫瘤死亡的 7.82%,位居女性惡性腫瘤死亡率的第 5 位[2]。乳腺惡性腫瘤的防控以二級預防為主,但面臨著篩查覆蓋人群有限、篩查成本高等問題。女性乳腺癌篩查是通過有效、簡便及經濟的檢查措施,對無癥狀婦女開展篩查,以期望早期發現、早期診斷及早期治療,其目的是降低人群乳腺癌的死亡率。用于乳腺癌篩查的措施有:乳腺 X 線檢查、乳腺臨床體檢、乳腺自我檢查、乳腺超聲檢查及乳腺 MRI 檢查[3]。乳腺組織病理檢查或免疫組織化學檢查為乳腺疾病診斷的金標準。
2 AI 及醫學 AI
AI 是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工神經網絡(artificial neural network,ANN)是一種模仿生物神經網絡的結構和功能的數學模型或計算模型,用于對函數進行估計或近似[4],現代神經網絡是一種非線性統計數據建模工具。ANN 是 AI 的一個分支。ANN 經歷了幾十年的自身發展,先后有著名的 LeNet[5]、AlexNet[6]、ResNet[7]等不同類型神經網絡。AI 的核心是數據、算力和算法。高級的 AI,從技術層面不僅依賴云計算處理大數據的能力,同樣依賴于算法,深度學習便是對整個神經網絡做優化訓練。
卷積神經網絡(convolutional neural network,CNN)不同于其他類型的神經網絡,其在解決諸如視覺識別、語音識別、自然語言處理等很多問題方面均表現出較高的性能優勢。在圖像識別領域,2009 年,李飛飛研發了 ImageNet,并舉辦了大規模的視覺識別挑戰賽[8]。ImageNet 擁有目前世界上最大的公開圖像識別數據庫,助推了全球 AI 圖像識別在各行各業的飛速發展。2012 年 Google X Lab 使用 1 000 臺電腦、16 000 顆處理器,創造了 10 億個連接的神經網絡,在 1 000 萬條 Youtube 視頻略縮圖中,識別出了貓[9]。
隨著 AI 的發展和醫療數據的積累,AI 與臨床醫療深度結合。基于神經網絡聯合醫學影像研究的薈萃分析[10]及 AI 在影像學的發展和現狀的研究[11-12]均指出:目前神經網絡與醫學影像領域的聯合研究較多,其中人體不同器官系統的 MRI、MICROSCOPY、CT、X 線及超聲的圖像均被用于聯合研究。
醫學影像作為工具,在癌癥篩查與診斷中占據重要的醫療地位,深度學習算法革新了醫學影像的表達方式,二者深度結合具有較高的應用前景,尤其在以下方面。① 疾病檢出:可以提高早診率,減少漏診率,如 CT 肺結節、視網膜病變等;② 多維定量:可自動多維度測量病變,實現病變特征提取、病灶自動分割等;③ 精準診斷:進行良惡性判別,提高分期和分級準確率;④ 治療評估:包括術前設計、療效評估和預后估測。2018 年北美放射協會年會(Radiological Society of North America,RSNA)展示的部分研究已實現產品轉化并落地應用。
3 AI 在乳腺癌篩查和診斷領域中的研究現狀
乳腺腫瘤篩查是指通過有效、簡便及經濟的檢查措施,對無癥狀婦女開展篩查,以期望早期發現、早期診斷及早期治療。其目的是降低人群乳腺癌的死亡率。用于乳腺癌篩查的措施有:乳腺 X 線檢查、乳腺臨床體檢、乳腺自我檢查、乳腺超聲檢查及乳腺 MRI 檢查,而病理學檢查是各類檢查發現的異常病灶的診斷金標準。
3.1 AI 在乳腺 X 線中的研究
乳腺 X 線檢查系指 X 線球管發出的 X 射線照射乳腺組織,形成圖像,是西方國家篩查乳腺癌的首選。在醫學影像領域,收集百萬級別的大樣本的數據樣本非常困難[13]。乳腺智能 X 線擁有目前乳腺智能領域唯一公開的數據集類型,約 2 000 多例 X 線圖片,其中包括乳腺 X 光數字乳腺圖像數據庫 DDSM[14]、全視野數字乳腺 X 線攝影數據集 FFDM[15]及乳腺 X 線圖像分析協會數據集 MIAS[16]。經過統一標注的公開數據庫,使得國內外智能 X 線擁有決勝力的數據優勢,較乳腺超聲和乳腺磁共振,乳腺 X 線在乳腺智能領域發展最為迅速。
2017 年,Samala 等[17]利用 ImageNet 預訓練深度學習模型,基于 DDSM 數據庫,實現了高精度的乳腺 X 線攝影圖像的乳腺癌診斷。隨著乳腺 X 線攝影數字斷層影像的出現,Samala 等[18]研究用乳腺 X 線攝影平片訓練獲得的深度 CNN 用于乳腺斷層影像可疑性病變的檢測。同樣基于 DDSM 數據庫,Lévy 等[19]利用預訓練的 AlexNet 和 Szegedy 等[20]利用 GoogLeNet 深度學習網絡對乳腺 X 線攝影上的良惡性腫瘤加以區分,取得了當前的最優診斷結果。
乳腺腺體密度作為乳腺癌發病的獨立因素,成為眾多學者的研究對象。2018 年,Lehman 等[21]利用 CNN 對乳腺 X 線平片中的腺體密度進行了分類測量。該研究為多中心研究,共納入 2009 年至 2011 年期間的 39 272 例女性患者的共 58 894 張圖片,由 12 名放射科醫生進行標注,以約等于 5∶1 的比例進行訓練集和驗證集分配并建立模型,之后以 2018 年行乳腺 X 線檢查的 10 763 例患者的圖片進行測試,并與 5 名放射醫生進行診斷準確率對比,由原 12 名標注醫生評判結果。結果發現,神經網絡測試的診斷準確性結果低于放射醫生,但是可以作為乳腺癌篩查的輔助診斷工具,診斷結論可供放射醫生參考。
2018 年 RSNA 部分研究機構發布了研究結論及其產品。AI-X 線目前可完成病灶的檢出、分割、良惡性分類并出具結構化報告,報告內容包括腺體分型、腺體結構扭曲、腺體分布是否對稱、可疑病灶、病灶征象(如腫塊、鈣化)及病灶的乳腺影像報告和數據系統(breast imaging reporting and data system,BI-RADS)分級[22],AI-X 線距離成為放射醫生的診斷助手又進了一步。
3.2 AI 在乳腺 MRI 中的研究
MRI 檢查是利用線圈向目標發射特定射頻信號,人體內被激活的氫質子所釋放的信號會被線圈接收,結合編碼,可重建出待掃描目標的三維影像。磁共振成像無輻射,可對不同組織進行多參數、任意切面成像,對比度和分辨率非常高,幾乎可適用于人體系統各種疾病[23]。在乳腺惡性腫瘤篩查方面,MRI 有著較高的敏感性。2018 年,Xu 等[24]利用 CNN 動態對比增強磁共振成像實現了乳腺分割。
乳腺腺體非彌漫性增強在乳腺磁共振中較常見,但在診斷上具有挑戰性。2018 年,Gallego-Ortiz 等[25]提出了一種改進的深度嵌入方法,用于計算機輔助診斷非腫塊型乳腺 MRI 病變的基于圖像的病灶特征。該方法的優點在于最大化計算機輔助診斷系統病灶分類器的診斷準確性,區分良惡性病變。該團隊同時研究測評了其診斷性能,并與傳統分類器在原始特征空間中的診斷性能進行了比較,結果顯示,受試者工作特征曲線(ROC)曲線下面積(AUC)有統計學意義的增加,泛化 AUC 從 0.67±0.08 增加到 0.81±0.10,增加了 21%。
2010 年,Perez 等[26]收集了 194 例乳腺癌患者的磁共振影像資料,應用神經網絡預測乳腺癌患者同側腋下淋巴結是否轉移,結果顯示,診斷精確度達到了適度的 AUC。2018 年,Luo 等[27]采用彌散加權磁共振成像數據庫對 172 例患者進行前哨淋巴結(sentinel lymph node,SLN)轉移與否預測,提出了一種深度學習與特征袋模型相結合的提取磁共振深層特征的方法;結果表明,該方法預測測試集 SLN 轉移與否的 AUC 高達 0.852 [95% 置信區間(CI)為(0.716,0.988)]。
3.3 AI 在乳腺超聲中的研究
超聲波檢查是用弱超聲波照射到目標身體上,將組織的反射波進行圖像化處理。傳統超聲為醫師手持探頭檢查,近年來,全自動乳腺容積掃描超聲(automated breast volume scanner,ABVS)開始應用于臨床。
AI 在乳腺超聲中的研究多集中在病灶的良惡性二分類診斷。Kuo 等[28]利用虛擬器官計算機輔助分析成像程序繪制乳腺病灶周圍輪廓,獲得腫瘤血管化直方圖指標,利用多層感知機構建分類器,實現了分類器分類惡性腫瘤,靈敏度為 90.3%,特異度為 79.4%,陽性預測值(PPV)為 80%,陰性預測值(NPV)為 90%。
Han 等[29]利用 GoogLeNet 網絡,手動選擇可疑病灶熱點區域(region of interest,ROI),以識別乳腺超聲中可疑病灶的良惡性。這是目前可查詢的神經網絡在乳腺超聲領域中的較大數據集的研究,包括 5 151 例患者共 7 408 張乳腺超聲圖像,其中 4 254 張良性圖像,3 154 張惡性圖像。通過構建模型對數據集進行訓練、驗證和測試,并識別乳腺超聲中可疑病灶的良惡性。其結果顯示,AUC 大于 0.9,準確性為 90%,靈敏度為 86%,特異度為 96%。
神經網絡及影像設備均在科技發展中更新換代。普通神經網絡會忽略重要的空間信息,而 3D 卷積神經網絡(3D convolutional neural networks,3D CNN)可以動態提取更豐富的空間信息,獲得具有更大的可用于區分的數據。手持探頭二維超聲檢查為不連續掃描,依賴操作者的經驗,檢測結果的可重復性稍弱,而 ABVS 可優化檢查流程,提高檢查結果的可重復性,并減少超聲人力資源。2018 年,Chiang 等[30]聯合 3D CNN 與 ABVS 以診斷乳腺可疑病灶的良惡性。該模型可以從空間和時間的維度提取特征,然后進行 3D 卷積,以捕捉從多個連續幀得到的運動信息。該研究納入了 187 例患者,共計 230 副乳腺超聲圖像。該模型具有較高的靈敏度,但是在較高靈敏度的同時特異性稍弱。相對于普通 2D CNN 和靜止的圖片,3D CNN 與 ABVS 的聯合是基于視頻的新型研究方法,作為新技術的聯合研究,給未來的研究者提供了新思路。
在 AI 與超聲聯合研究中,三星麥迪遜公司率先實現 AI 乳腺二維超聲研究的產品轉化,其推出的一系列超聲儀器中均嫁接了乳腺智能識別系統 S-DetectTM[31]。在超聲科醫生為患者檢查的過程中,醫生手動選擇 ROI 后,儀器自動識別 ROI,測量 ROI 的各項數據,報告病灶形態、縱橫比例、邊界、內部回聲、后方回聲衰減情況、鈣化等信息,縮短了超聲醫生對乳腺超聲圖像的診斷及出具報告的時間,也推動了乳腺超聲診斷報告的標準統一化進程。
3.4 AI 在乳腺病理中的研究
病理形態檢查是將標本制成病理切片,觀察細胞和組織的形態結構變化,以確定病變性質,作出病理診斷。現代病理檢查還包括組織化學、免疫組織化學、分子生物學、癌基因檢查等。近年來隨著個性化醫療的出現,病理學家面臨著癌癥組織病理學診斷工作量和復雜性顯著增加的困境。
2016 年,Litjens 等[32]引入深度學習提高了組織病理學幻燈片分析的客觀性和效率,他發現,所有含有前列腺癌和乳腺癌微轉移和宏觀轉移的載玻片均可自動識別,其中 30%~40% 的含有良性和正常組織的載玻片可以被排除,而無需使用任何額外的免疫組織化學標志物或人為干預。
2017 年,Ehteshami Bejnordi 等在 JAMA 上報道了 1 例 AI 算法公開賽[19],探討了深度學習算法應用于整個幻燈片病理圖像是否可以提高診斷的準確性和效率[33-34]。數據來自荷蘭 2 個中心的病理全幻燈片圖,標本經免疫組織化學染色驗證且經 11 位病理學家認定。訓練集包括 270 張玻片(110 張轉移,160 張無轉移),將該數據集提供給所有參賽單位,供他們訓練建模。最后在 129 個全幻燈片圖像(49 張轉移,80 張無轉移)的獨立測試集中評估算法性能。來自荷蘭的 11 位具有時間限制的病理學家小組也對相同的載玻片測試集進行了評估,以確定每個載玻片在 2 h 的靈活的時間段中診斷淋巴結轉移的可能性,以模擬常規病理工作流程,并通過 1 名沒有時間限制的病理學家進行最終驗證。在整個幻燈片圖像分類任務中,最佳模型算法 [AUC=0.994,95% CI 為(0.983,0.999)] 在診斷模擬中的表現明顯優于病理學家。算法公開賽的結論是,在挑戰競賽的背景下,一些深度學習算法比參與模擬常規病理工作流程的 11 名病理學家小組獲得了更好的診斷性能。
2018 年,Couture 等[35]使用一組 571 例乳腺腫瘤的訓練集,創建基于圖像的腫瘤分級、分期、分型、淋巴結狀態、腫瘤大小、ER/PR 狀態及比例、Ki67 比例、HER-2 狀態(IHC 法)、PAM50 固有亞型和復發風險的評分分類器,將最終的分類器應用于獨立的測試集(n=288),并列表統計分析模型對每個被測試因素的準確性、敏感性和特異性。最終發現,關于患者或腫瘤特征,訓練集和測試集之間沒有明顯差異。
4 小結與展望
乳腺的影像篩查是乳腺癌二級預防的重要環節,篩查出的疑似病變最終待病理確診。隨著個性化醫療的深入,醫療各端口的工作量增加,而各類檢查診斷報告均存在不同程度的主觀性和不穩定性,且目前中心城市及偏遠地區醫療資源配比不均,導致診斷的準確性差異大。隨著神經網絡的發展以及醫學影像數據的積累,影像與 AI 結合是順應時勢的產物。CNN 在圖像識別領域表現出較高性能,在現有各項研究中均可看到神經網絡模型可作為輔助工具提高醫生的診斷時效,弱化了醫生診斷的主觀性和不穩定性。
目前,國內外運用神經網絡對乳腺疾病影像篩查及診斷的研究以乳腺 X 線攝影開展得最多。神經網絡在乳腺 X 線及乳腺彩超領域的研究方面均可做到病灶分割、測量、特征分析、良惡性判斷及出具結構化報告。三星麥迪遜集團率先將研究成果嫁接在其超聲儀器中。隨著儀器自身的更新換代,神經網絡結構及算法的更新,新的聯合研究也在出現。放射組學概念的提出,拓寬了神經網絡在疾病研究的領域,且因乳腺 MRI 具有較多高通量信息,率先成為 AI 與影像組學[36]聯合研究的切入點。此外,病理圖像存在大量可測量數據,且個性化醫療的出現,使病理學家面臨著癌癥組織病理學診斷的工作量和復雜性的顯著增加,而 AI 可以提高病理醫生的診斷時效。隨著醫學影像組學及神經網絡彼此的發展,AI 在醫學領域應用可擴展到手術方式設計、療效評估、預后分析等。
雖然 AI 在圖像識別領域表現出較高性能,可以作為醫生的輔助工具用以提高診斷時效,但是臨床診斷不是僅依賴圖片,患者病史、查體和多檢查協助同樣重要,且智能模型的穩定性、泛化能力等均在進一步探索中,各類人機對比測試也在持續進行,智能檢查大范圍應用于臨床還有一段探索的路要走。
筆者認為,乳腺 AI 未來的研究趨勢集中在以下方面。從醫療層面:① 運用乳腺超聲、X 線、MRI及病理多模態聯合診斷,進一步提高診斷性能,擴展應用領域;② 在乳腺影組學領域深入研究,讓研究結論參與治療流程。技術層面:① 單中心數據局限,使得單體研究模型應用于其他地區人群時模型準確率降低,應積極建設公開數據庫,擴充多中心數以提高神經網絡泛化能力;② 神經網絡結構及算法研究;③ 在大數據的基礎上進行小數據集特征優化(精細標注),提高模型診斷的準確性,加快學習進度。