引用本文: 陳瑤, 呂青, 戚曉峰. 開發基于乳腺超聲人工智能的移動終端應用軟件:DeepBC. 中國普外基礎與臨床雜志, 2022, 29(1): 46-50. doi: 10.7507/1007-9424.202104100 復制
乳腺癌是全球女性最常見的惡性腫瘤,同時是女性惡性腫瘤相關死亡的主要原因,中國女性乳腺癌發病總人數已超過肺癌而成為第1位的惡性腫瘤,2020 年大約新發 230 萬,在發展中國家推廣惡性腫瘤預防措施并提供惡性腫瘤診療而建立可持續基礎設施的努力對于全球惡性腫瘤至關重要[1]。乳腺 X 射線篩查被證實能有效降低乳腺癌病死率[2]。世界各國都有自己的篩查方案,多以乳腺 X 射線檢查作為首要篩查方式[3]。目前我國已開展多項探索乳腺癌篩查方案的臨床研究及衛生經濟學評價[3-5]。超聲檢查不受時空限制,操作方便、快捷、靈敏度高,在中國的廣大基層醫院使用范圍更廣,是我國婦女“兩癌篩查”中乳腺癌的首選檢查[6-7]。近年來人工智能技術在醫療中的應用越來越廣泛,生物醫學大數據正嘗試完整刻畫生命系統。將人工智能醫療融合發展落到實處,旨在通過人工智能與醫療產業的深度融合,進一步提升醫療服務效率,普惠廣大患者。目前人工智能與乳腺影像學的融合發展集中在乳腺 X 射線檢查,主要原因是該領域擁有公開的乳腺 X 射線數據集可供所有研究者使用,而乳腺超聲沒有公開數據集。互聯網時代的到來,尤其是 5G 通訊技術的普及,智能手機有望成為“我的醫生”。“我的醫生”可能是一位醫生或一群醫生或者是人工智能醫生來協助人們管理健康,實現健康中國的愿景[8]。本研究開發的“乳腺超聲人工智能終端應用軟件 DeepBC”,旨在為了服務于大眾,讓更多的乳腺癌患者能夠不受時間及空間地接受早期診斷。
1 資料與方法
1.1 數據資料收集
在四川大學華西醫院(簡稱“我院”)醫院信息系統(HIS )收集乳腺外科 2018 年 1 月至 2019 年 4 月期間行乳腺癌手術患者的超聲電子圖像。從超聲報告中獲取患者年齡、就診醫院、超聲儀器及型號信息。根據患者的住院號在我院病理系統中查詢完整的病理記錄報告,包括:浸潤性癌、導管原位癌、其他類型乳腺癌、纖維腺瘤、導管內乳頭狀瘤、葉狀腫瘤、其他類型良性腫瘤等多種病理類型。將病理報告中的浸潤性癌和導管原位癌、其他類型乳腺癌定義為惡性,其余定義為非惡性。
1.2 DeepBC 模型建立及預測效果分析
DeepBC 模型的研究是使用神經網絡深度學習算法對乳腺超聲電子圖像進行訓練及測試,以探索人工智能根據乳腺超聲電子圖像識別占位病變的惡性與非惡性。將所有的乳腺超聲電子圖像以 4∶1 的比例和等距隨機抽樣原則將收集的數據劃分為訓練集和測試集。具體方法為:每間隔 4 幅圖抽取 1 幅圖作為測試集圖片,其余圖片均作為訓練集。訓練集用于訓練以建立 DeepBC 模型,測試集用于測試該模型的性能。
1.3 移動終端應用軟件 DeepBC 的開發
經過前期試驗得到 DeepBC 模型,將此模型在移動終端上轉化為可視化應用,在構建該可視化應用時主要涉及 3 個模塊,以適應多種條件下的超聲電子圖像的識別。
1.3.1 前端模塊
此模塊負責用戶超聲報告的上傳界面及診斷結果反饋界面的呈現。
1.3.2 Web 后端模塊
此模塊運用先進的圖像分割處理技術來自動識別及裁剪每張彩超報告中的多個超聲圖像,同時進行圖像預處理以及診斷結果的結構化整合與返回。
1.3.3 診斷模塊
此模塊為系統的核心模塊。首先,負責對用戶上傳的超聲圖像進行識別,將每一個具體的超聲圖像從超聲圖文報告中分割出來,對分割出來的每一張圖片進行診斷,先判斷其是否為乳腺部位的彩超圖像,若是則判斷是否含有惡性病變;若截取的圖像非乳腺圖像但如超聲報告中同時含有乳腺、腋窩、腹部、婦科等檢查圖像時則不會對此圖像進行診斷,該模塊只診斷僅含有乳腺組織的圖像。然后,運用下列 3 個模塊進一步提升模型性能:① 圖像重構模塊。使用先進的神經網絡技術對手機拍照上傳的圖像進行降噪、色彩平衡、彈性形變復原等處理,以降低拍照過程帶來的影響并提高圖片質量。此模塊接收拍照圖像作為輸入,采用特征編碼、調碼、解碼三級結構,先對圖像的本質特征進行提取,過濾掉光照、陰影等無用信息,只保留用于診斷的信息;然后使用多組殘差網絡模塊對提取出的特征進行微調,進一步調整其細節;最后,有別于常用的轉置卷積網絡,我們采用上采樣算法配合小數步長卷積來重構高清圖像,可以有效解決轉置卷積網絡生成圖像的棋盤效應并還原更多的細節。② 圖像分類模塊。使用深度卷積神經網絡配合創新的區域增強機制和多模型融合機制對乳腺彩超圖像進行診斷,可以識別出彩超圖像中的惡性病變與實性占位(準確率高達 95%)。此模塊接收圖像重構模塊重構后的圖像作為輸入,采用多尺度的卷積核提取不同維度的特征并結合殘差模塊構建一個 137 層的深度卷積神經網絡進行分類。在 DeepBC 模型的最后采用均值池化和卷積核為 1 的卷積層進行降維,然后輸出分類結果。③ 防漏診模塊。基于生成對抗網絡架構,使用神經網絡技術捕獲數據分布與 DeepBC 模型分布中的異常信息,對分類模塊的結果進一步校驗,以減少圖像分類模塊的工作失誤,從而有效降低假陰性率。防漏診模塊使用圖像分類模塊提取出的特征進行訓練,分別對真陰性、真陽性、假陰性、假陽性4類數據的分布進行模擬并訓練網絡對這4類數據進行識別,旨在對分類模塊運行時的異常進行檢測來識別出誤分類樣本,進一步降低假陰性率。
1.4 統計學方法
采用 SPSS 25.0 統計分析軟件繪制受試者操作特征(ROC)曲線并計算其曲線下面積(area under the ROC curve,AUC),從而評估 DeepBC 模型的預測效能。當 AUC 為 0.85~1.00 時則表示預測效果很好,當 AUC 為 0.70~0.85 時則表示預測效果一般,當 AUC 為 0.50~0.70 時則表示預測效果較低,當 AUC 為 0.50時認為模型沒有預測價值。以病理診斷結果為金標準,將 DeepBC 模型的預測值及實際病理診斷結果記錄在混淆矩陣中。分類資料采用“例數”的形式描述,計算 DeepBC 模型鑒別占位病變惡性與非惡性的準確度、靈敏度、特異度、假陽性率和假陰性率。檢驗水準 α=0.05。
2 結果
2.1 DeepBC 模型建立及預測效果
本研究共收集到超聲電子圖像 4 128 幅,其中訓練集 3 302 幅,測試集 826 幅。在測試集中,DeepBC模型對超聲圖像進行惡性與非惡性的預測結果與其對應的病理診斷結果見表 1。DeepBC 模型識別乳腺超聲圖像中占位病變為惡性與非惡性的準確度、靈敏度、特異度、假陽性率和假陰性率分別為 93.70%(774/826)、93.10%(297/319)、94.08%(477/507)、5.92%(30/507)、6.90%(22/319),同時繪制 ROC 曲線圖(圖 1)得出其最佳臨界值為 92.31%,其 AUC 為 0.987。


2.2 乳腺超聲人工智能移動終端 DeepBC
本研究團隊將研究成果以“DeepBC”這個名稱在微信端申請公眾號,這是我國首個基于移動互聯網的、使用手機微信平臺進行乳腺癌超聲圖像智能輔助診斷的系統,上線試運行以來,已有 1 萬人次參與使用,3 萬幅乳腺超聲圖像上傳診斷。見 DeepBC 可以對患者上傳的乳腺彩超圖像的特征進行有效提取并提高計算效率。手機端各模塊獨立運行,層層遞進,最終做到手機端強大功能的同時擁有簡潔界面,見圖 2。乳腺超聲人工智能移動終端 DeepBC 的首頁界面(圖 2a)中患者可將手機中電子超聲圖像進行上傳,該界面有明確提示說明;對所有僅含有乳腺部位的超聲圖像實時診斷并反饋,提示單張超聲圖像傾向惡性與非惡性的風險值并對惡性高風險圖像標紅提醒(圖 2b);對上傳的超聲圖像診斷后將反饋一張結論報告,以便患方查閱、保存(圖 2c)。

3 討論
3.1 軟件應用場景需求
隨著科技發展、醫療信息逐步電子化及網絡化,患者咨詢病情可以不需要移步至醫院各科室即可先期獲取報告,然后再通過多渠道問診。醫院可將電子報告實時發送到患方手機端,方便存儲,減少人力及財力的支出,縮短就診時間,改善就醫環境及體驗。在可接受的容錯范圍內,行超聲檢查的醫院可將“超聲智能輔助診斷系統”開放給患者,患者在基層醫院行乳腺超聲檢查后在未獲得上級醫院就診前,患者主動通過“超聲智能輔助診斷系統”獲取診斷咨詢,改變了患者獲得高質量乳腺超聲診斷信息的模式和體驗,讓在基層醫院接受診療的患者也能獲得同于乳腺專科醫生的診斷意見,為高風險人群提供警示,減少延遲就診。在國民越來越關注自身健康的背景下,“超聲智能輔助診斷系統”幫助人群建立乳腺健康主動管理意識,促進了國民更加主動、持續地進行健康管理,實現“以治病為中心”到以“健康為中心”的思維轉變,實現個體自我健康管理的需要,有助于實現群體乳腺癌早診率的提升。患者行乳腺超聲檢查后,亟需進行后續就診咨詢,為了滿足患者能夠不受時間、空間限制地實時上傳報告診斷。本研究基于前期工作,開發了手機移動終端應用軟件。
3.2 本研究的優勢與創新
3.2.1 國內較早開展人工智能與乳腺超聲的融合研究
國內因為高質量醫療數據的難以企及,開展人工智能與醫學的融合研究尚在起步階段。人工智能在乳腺 X 射線領域的研究較早,主要原因是該領域擁有公開數據庫,其中包括乳腺光數字乳腺圖像數據庫 DDSM[9]、全視野數字乳腺 X 射線攝影數據集 FFDM[10]及乳腺 X 射線圖像分析協會數據集 MIAS[11]。探索人工智能在乳腺超聲領域的研究相對較少。Han 等[12]利用 GoogLeNet[13]網絡,基于醫院 5 151 例患者共 7 408 幅超聲乳腺圖像建立模型,包括 4 254 幅良性圖像,3 154 幅惡性圖像,HAN 模型擁有人工智能在超聲圖像領域可查詢到的最大樣本量,模型在自身數據中進行圖像良、惡性二分類傾向性診斷任務的性能較高,其準確度為 90%,靈敏度為 86%,特異度為 96%。目前人工智能在超聲圖像上已實現病灶形態、縱橫比例、邊界、內部回聲、后方回聲衰減情況、鈣化等特征信息報告[14]。目前國內外尚無多中心、標準一致、標注信息統一的公共數據庫,超聲圖像主觀且不可復制的圖像特點[15]限制了人工智能在乳腺超聲領域的發展。現有人工智能在超聲圖像領域的研究多基于單中心、小樣本的圖像集。只有具備大量、優質的數據原料,人工智能才有實現診斷價值的可行性。DeepBC 是以中國女性為基礎的研究且單體數據量大,每一份超聲圖像均參照對應的病理結果進行了精準的標注,優質的建模數據為 DeepBC 的高準確度和可應用性提供了基礎。
3.2.2 將乳腺超聲人工智能模型轉化為手機終端應用的研究
三星麥迪遜公司在超聲設備上嫁接了具有高穩定性、高準確度的乳腺智能識別系統S-DetectTM[14],用以減少超聲醫生的測量及診斷工作,提高超聲醫生的診斷同質化水平。但目前國際和國內均無針對患者應用的軟件及程序。DeepBC 將乳腺超聲人工智能模型轉化為移動終端應用的研究,已在微信端上線試運行 3 萬余次。DeepBC 診斷系統普適性佳、泛化能力強、界面簡潔,操作時間短(5~6 s 完成)且無需人工標注興趣點,可全自動完成超聲圖像識別。隨著互聯網的加持,智能輔助診斷系統充分適應從醫生到患者、從手機到超聲設備、從中心城市到偏遠地區、從醫院到社區醫療等各種應用場景。超聲醫學與大數據及人工智能持續地融合發展,讓醫院、醫生和需檢個體三方均可從人工智能超聲輔助診斷系統中獲益,提升醫療、健康服務和管理的質量與效率,顛覆傳統醫學教育模式,應用場景不受時間和空間的限制。
3.3 本研究的局限性分析
3.3.1 倫理
目前人工智能正在從實驗室研究走向轉化應用,已廣泛應用于疾病篩查、輔助診療、醫學影像、醫療機器人等領域,但其在帶來高效、精準、便捷服務的同時也引發了一些倫理問題,如數據泄露、醫療安全、責任界定、公平受益、醫務人員的未來定位、患者信任[16]。在分析以上這些問題的同時嘗試著提出應對建議:包括遵循倫理原則,細化倫理規范;制定法律法規,厘清責任權屬;嚴格技術標準,確保醫療安全;加強數據管理,保護患者隱私;堅持醫為主體,注重人文關懷;加強宣傳教育,提升患者信任等,以促進醫療人工智能健康發展。
3.3.2 數據與外驗證
醫學成像是個復雜的過程。成像過程中,不可避免的噪聲、偽影以及待成像目標的不自主運動會降低成像的質量。在人工智能輔助診斷系統構建中,規范成像質量有助于提升診斷系統的整體效能,但是這可能會限制診斷系統的泛化能力,因為在現實情況下,不同設備、不同的醫院和研究機構以及不同疾病和患者個體都會存在一定的差異性,這也是研究領域呼吁多中心、跨數據庫進行算法驗證的原因[17]。超聲檢查很大程度依賴于檢查醫生的水平,與圖像的辨認有關,本研究只針對已采集的超聲圖像進行識別,所以無論是醫生還是患者,在使用時均需知曉人工智能目前只能承擔輔助判斷的作用,最終診斷及決策還是由醫生掌握,且目前研究還不能實現對超聲檢測的動態過程進行識別,不過隨著后續數據的累積,計算機對數據處理的速度增快,是有望實現對超聲檢測動態過程進行識別的。
總之,本研究基于乳腺超聲人工智能識別乳腺超聲圖像模型開發了手機移動終端應用軟件,寄希望通過服務大眾,讓更多的乳腺癌患者能夠不受時間和空間限制地接受早期診斷。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:陳瑤主要負責數據提取、統計分析、文章主體撰寫以及投稿工作;戚曉峰主要負責模型構建以及相應部分論文的撰寫工作;呂青主要負責提出文章思路及文章修改。
倫理聲明:本研究通過了四川大學華西醫院生物醫學倫理審查委員會審批[批文編號:2019 年審(1018)號]。
乳腺癌是全球女性最常見的惡性腫瘤,同時是女性惡性腫瘤相關死亡的主要原因,中國女性乳腺癌發病總人數已超過肺癌而成為第1位的惡性腫瘤,2020 年大約新發 230 萬,在發展中國家推廣惡性腫瘤預防措施并提供惡性腫瘤診療而建立可持續基礎設施的努力對于全球惡性腫瘤至關重要[1]。乳腺 X 射線篩查被證實能有效降低乳腺癌病死率[2]。世界各國都有自己的篩查方案,多以乳腺 X 射線檢查作為首要篩查方式[3]。目前我國已開展多項探索乳腺癌篩查方案的臨床研究及衛生經濟學評價[3-5]。超聲檢查不受時空限制,操作方便、快捷、靈敏度高,在中國的廣大基層醫院使用范圍更廣,是我國婦女“兩癌篩查”中乳腺癌的首選檢查[6-7]。近年來人工智能技術在醫療中的應用越來越廣泛,生物醫學大數據正嘗試完整刻畫生命系統。將人工智能醫療融合發展落到實處,旨在通過人工智能與醫療產業的深度融合,進一步提升醫療服務效率,普惠廣大患者。目前人工智能與乳腺影像學的融合發展集中在乳腺 X 射線檢查,主要原因是該領域擁有公開的乳腺 X 射線數據集可供所有研究者使用,而乳腺超聲沒有公開數據集。互聯網時代的到來,尤其是 5G 通訊技術的普及,智能手機有望成為“我的醫生”。“我的醫生”可能是一位醫生或一群醫生或者是人工智能醫生來協助人們管理健康,實現健康中國的愿景[8]。本研究開發的“乳腺超聲人工智能終端應用軟件 DeepBC”,旨在為了服務于大眾,讓更多的乳腺癌患者能夠不受時間及空間地接受早期診斷。
1 資料與方法
1.1 數據資料收集
在四川大學華西醫院(簡稱“我院”)醫院信息系統(HIS )收集乳腺外科 2018 年 1 月至 2019 年 4 月期間行乳腺癌手術患者的超聲電子圖像。從超聲報告中獲取患者年齡、就診醫院、超聲儀器及型號信息。根據患者的住院號在我院病理系統中查詢完整的病理記錄報告,包括:浸潤性癌、導管原位癌、其他類型乳腺癌、纖維腺瘤、導管內乳頭狀瘤、葉狀腫瘤、其他類型良性腫瘤等多種病理類型。將病理報告中的浸潤性癌和導管原位癌、其他類型乳腺癌定義為惡性,其余定義為非惡性。
1.2 DeepBC 模型建立及預測效果分析
DeepBC 模型的研究是使用神經網絡深度學習算法對乳腺超聲電子圖像進行訓練及測試,以探索人工智能根據乳腺超聲電子圖像識別占位病變的惡性與非惡性。將所有的乳腺超聲電子圖像以 4∶1 的比例和等距隨機抽樣原則將收集的數據劃分為訓練集和測試集。具體方法為:每間隔 4 幅圖抽取 1 幅圖作為測試集圖片,其余圖片均作為訓練集。訓練集用于訓練以建立 DeepBC 模型,測試集用于測試該模型的性能。
1.3 移動終端應用軟件 DeepBC 的開發
經過前期試驗得到 DeepBC 模型,將此模型在移動終端上轉化為可視化應用,在構建該可視化應用時主要涉及 3 個模塊,以適應多種條件下的超聲電子圖像的識別。
1.3.1 前端模塊
此模塊負責用戶超聲報告的上傳界面及診斷結果反饋界面的呈現。
1.3.2 Web 后端模塊
此模塊運用先進的圖像分割處理技術來自動識別及裁剪每張彩超報告中的多個超聲圖像,同時進行圖像預處理以及診斷結果的結構化整合與返回。
1.3.3 診斷模塊
此模塊為系統的核心模塊。首先,負責對用戶上傳的超聲圖像進行識別,將每一個具體的超聲圖像從超聲圖文報告中分割出來,對分割出來的每一張圖片進行診斷,先判斷其是否為乳腺部位的彩超圖像,若是則判斷是否含有惡性病變;若截取的圖像非乳腺圖像但如超聲報告中同時含有乳腺、腋窩、腹部、婦科等檢查圖像時則不會對此圖像進行診斷,該模塊只診斷僅含有乳腺組織的圖像。然后,運用下列 3 個模塊進一步提升模型性能:① 圖像重構模塊。使用先進的神經網絡技術對手機拍照上傳的圖像進行降噪、色彩平衡、彈性形變復原等處理,以降低拍照過程帶來的影響并提高圖片質量。此模塊接收拍照圖像作為輸入,采用特征編碼、調碼、解碼三級結構,先對圖像的本質特征進行提取,過濾掉光照、陰影等無用信息,只保留用于診斷的信息;然后使用多組殘差網絡模塊對提取出的特征進行微調,進一步調整其細節;最后,有別于常用的轉置卷積網絡,我們采用上采樣算法配合小數步長卷積來重構高清圖像,可以有效解決轉置卷積網絡生成圖像的棋盤效應并還原更多的細節。② 圖像分類模塊。使用深度卷積神經網絡配合創新的區域增強機制和多模型融合機制對乳腺彩超圖像進行診斷,可以識別出彩超圖像中的惡性病變與實性占位(準確率高達 95%)。此模塊接收圖像重構模塊重構后的圖像作為輸入,采用多尺度的卷積核提取不同維度的特征并結合殘差模塊構建一個 137 層的深度卷積神經網絡進行分類。在 DeepBC 模型的最后采用均值池化和卷積核為 1 的卷積層進行降維,然后輸出分類結果。③ 防漏診模塊。基于生成對抗網絡架構,使用神經網絡技術捕獲數據分布與 DeepBC 模型分布中的異常信息,對分類模塊的結果進一步校驗,以減少圖像分類模塊的工作失誤,從而有效降低假陰性率。防漏診模塊使用圖像分類模塊提取出的特征進行訓練,分別對真陰性、真陽性、假陰性、假陽性4類數據的分布進行模擬并訓練網絡對這4類數據進行識別,旨在對分類模塊運行時的異常進行檢測來識別出誤分類樣本,進一步降低假陰性率。
1.4 統計學方法
采用 SPSS 25.0 統計分析軟件繪制受試者操作特征(ROC)曲線并計算其曲線下面積(area under the ROC curve,AUC),從而評估 DeepBC 模型的預測效能。當 AUC 為 0.85~1.00 時則表示預測效果很好,當 AUC 為 0.70~0.85 時則表示預測效果一般,當 AUC 為 0.50~0.70 時則表示預測效果較低,當 AUC 為 0.50時認為模型沒有預測價值。以病理診斷結果為金標準,將 DeepBC 模型的預測值及實際病理診斷結果記錄在混淆矩陣中。分類資料采用“例數”的形式描述,計算 DeepBC 模型鑒別占位病變惡性與非惡性的準確度、靈敏度、特異度、假陽性率和假陰性率。檢驗水準 α=0.05。
2 結果
2.1 DeepBC 模型建立及預測效果
本研究共收集到超聲電子圖像 4 128 幅,其中訓練集 3 302 幅,測試集 826 幅。在測試集中,DeepBC模型對超聲圖像進行惡性與非惡性的預測結果與其對應的病理診斷結果見表 1。DeepBC 模型識別乳腺超聲圖像中占位病變為惡性與非惡性的準確度、靈敏度、特異度、假陽性率和假陰性率分別為 93.70%(774/826)、93.10%(297/319)、94.08%(477/507)、5.92%(30/507)、6.90%(22/319),同時繪制 ROC 曲線圖(圖 1)得出其最佳臨界值為 92.31%,其 AUC 為 0.987。


2.2 乳腺超聲人工智能移動終端 DeepBC
本研究團隊將研究成果以“DeepBC”這個名稱在微信端申請公眾號,這是我國首個基于移動互聯網的、使用手機微信平臺進行乳腺癌超聲圖像智能輔助診斷的系統,上線試運行以來,已有 1 萬人次參與使用,3 萬幅乳腺超聲圖像上傳診斷。見 DeepBC 可以對患者上傳的乳腺彩超圖像的特征進行有效提取并提高計算效率。手機端各模塊獨立運行,層層遞進,最終做到手機端強大功能的同時擁有簡潔界面,見圖 2。乳腺超聲人工智能移動終端 DeepBC 的首頁界面(圖 2a)中患者可將手機中電子超聲圖像進行上傳,該界面有明確提示說明;對所有僅含有乳腺部位的超聲圖像實時診斷并反饋,提示單張超聲圖像傾向惡性與非惡性的風險值并對惡性高風險圖像標紅提醒(圖 2b);對上傳的超聲圖像診斷后將反饋一張結論報告,以便患方查閱、保存(圖 2c)。

3 討論
3.1 軟件應用場景需求
隨著科技發展、醫療信息逐步電子化及網絡化,患者咨詢病情可以不需要移步至醫院各科室即可先期獲取報告,然后再通過多渠道問診。醫院可將電子報告實時發送到患方手機端,方便存儲,減少人力及財力的支出,縮短就診時間,改善就醫環境及體驗。在可接受的容錯范圍內,行超聲檢查的醫院可將“超聲智能輔助診斷系統”開放給患者,患者在基層醫院行乳腺超聲檢查后在未獲得上級醫院就診前,患者主動通過“超聲智能輔助診斷系統”獲取診斷咨詢,改變了患者獲得高質量乳腺超聲診斷信息的模式和體驗,讓在基層醫院接受診療的患者也能獲得同于乳腺專科醫生的診斷意見,為高風險人群提供警示,減少延遲就診。在國民越來越關注自身健康的背景下,“超聲智能輔助診斷系統”幫助人群建立乳腺健康主動管理意識,促進了國民更加主動、持續地進行健康管理,實現“以治病為中心”到以“健康為中心”的思維轉變,實現個體自我健康管理的需要,有助于實現群體乳腺癌早診率的提升。患者行乳腺超聲檢查后,亟需進行后續就診咨詢,為了滿足患者能夠不受時間、空間限制地實時上傳報告診斷。本研究基于前期工作,開發了手機移動終端應用軟件。
3.2 本研究的優勢與創新
3.2.1 國內較早開展人工智能與乳腺超聲的融合研究
國內因為高質量醫療數據的難以企及,開展人工智能與醫學的融合研究尚在起步階段。人工智能在乳腺 X 射線領域的研究較早,主要原因是該領域擁有公開數據庫,其中包括乳腺光數字乳腺圖像數據庫 DDSM[9]、全視野數字乳腺 X 射線攝影數據集 FFDM[10]及乳腺 X 射線圖像分析協會數據集 MIAS[11]。探索人工智能在乳腺超聲領域的研究相對較少。Han 等[12]利用 GoogLeNet[13]網絡,基于醫院 5 151 例患者共 7 408 幅超聲乳腺圖像建立模型,包括 4 254 幅良性圖像,3 154 幅惡性圖像,HAN 模型擁有人工智能在超聲圖像領域可查詢到的最大樣本量,模型在自身數據中進行圖像良、惡性二分類傾向性診斷任務的性能較高,其準確度為 90%,靈敏度為 86%,特異度為 96%。目前人工智能在超聲圖像上已實現病灶形態、縱橫比例、邊界、內部回聲、后方回聲衰減情況、鈣化等特征信息報告[14]。目前國內外尚無多中心、標準一致、標注信息統一的公共數據庫,超聲圖像主觀且不可復制的圖像特點[15]限制了人工智能在乳腺超聲領域的發展。現有人工智能在超聲圖像領域的研究多基于單中心、小樣本的圖像集。只有具備大量、優質的數據原料,人工智能才有實現診斷價值的可行性。DeepBC 是以中國女性為基礎的研究且單體數據量大,每一份超聲圖像均參照對應的病理結果進行了精準的標注,優質的建模數據為 DeepBC 的高準確度和可應用性提供了基礎。
3.2.2 將乳腺超聲人工智能模型轉化為手機終端應用的研究
三星麥迪遜公司在超聲設備上嫁接了具有高穩定性、高準確度的乳腺智能識別系統S-DetectTM[14],用以減少超聲醫生的測量及診斷工作,提高超聲醫生的診斷同質化水平。但目前國際和國內均無針對患者應用的軟件及程序。DeepBC 將乳腺超聲人工智能模型轉化為移動終端應用的研究,已在微信端上線試運行 3 萬余次。DeepBC 診斷系統普適性佳、泛化能力強、界面簡潔,操作時間短(5~6 s 完成)且無需人工標注興趣點,可全自動完成超聲圖像識別。隨著互聯網的加持,智能輔助診斷系統充分適應從醫生到患者、從手機到超聲設備、從中心城市到偏遠地區、從醫院到社區醫療等各種應用場景。超聲醫學與大數據及人工智能持續地融合發展,讓醫院、醫生和需檢個體三方均可從人工智能超聲輔助診斷系統中獲益,提升醫療、健康服務和管理的質量與效率,顛覆傳統醫學教育模式,應用場景不受時間和空間的限制。
3.3 本研究的局限性分析
3.3.1 倫理
目前人工智能正在從實驗室研究走向轉化應用,已廣泛應用于疾病篩查、輔助診療、醫學影像、醫療機器人等領域,但其在帶來高效、精準、便捷服務的同時也引發了一些倫理問題,如數據泄露、醫療安全、責任界定、公平受益、醫務人員的未來定位、患者信任[16]。在分析以上這些問題的同時嘗試著提出應對建議:包括遵循倫理原則,細化倫理規范;制定法律法規,厘清責任權屬;嚴格技術標準,確保醫療安全;加強數據管理,保護患者隱私;堅持醫為主體,注重人文關懷;加強宣傳教育,提升患者信任等,以促進醫療人工智能健康發展。
3.3.2 數據與外驗證
醫學成像是個復雜的過程。成像過程中,不可避免的噪聲、偽影以及待成像目標的不自主運動會降低成像的質量。在人工智能輔助診斷系統構建中,規范成像質量有助于提升診斷系統的整體效能,但是這可能會限制診斷系統的泛化能力,因為在現實情況下,不同設備、不同的醫院和研究機構以及不同疾病和患者個體都會存在一定的差異性,這也是研究領域呼吁多中心、跨數據庫進行算法驗證的原因[17]。超聲檢查很大程度依賴于檢查醫生的水平,與圖像的辨認有關,本研究只針對已采集的超聲圖像進行識別,所以無論是醫生還是患者,在使用時均需知曉人工智能目前只能承擔輔助判斷的作用,最終診斷及決策還是由醫生掌握,且目前研究還不能實現對超聲檢測的動態過程進行識別,不過隨著后續數據的累積,計算機對數據處理的速度增快,是有望實現對超聲檢測動態過程進行識別的。
總之,本研究基于乳腺超聲人工智能識別乳腺超聲圖像模型開發了手機移動終端應用軟件,寄希望通過服務大眾,讓更多的乳腺癌患者能夠不受時間和空間限制地接受早期診斷。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:陳瑤主要負責數據提取、統計分析、文章主體撰寫以及投稿工作;戚曉峰主要負責模型構建以及相應部分論文的撰寫工作;呂青主要負責提出文章思路及文章修改。
倫理聲明:本研究通過了四川大學華西醫院生物醫學倫理審查委員會審批[批文編號:2019 年審(1018)號]。