臨床主要通過非對比計算機斷層掃描(NCCT)快速診斷腦卒中的類型和區域,并借助阿爾伯塔卒中項目早期計算機斷層掃描評分(ASPECTS)指導下一步的治療。然而,在急性缺血性腦卒中(AIS)早期,NCCT 上的輕度腦梗肉眼難以分辨,參與 ASPECTS 評分的腦區之間無明顯邊界,導致臨床評分存在一定困難。基于機器學習和深度學習的方法能夠快速、準確地從現有影像中識別腦梗區域,并對參與評分的腦區進行分割,輔助醫生進行 ASPECTS 定量評分,這對于改善臨床評分存在不一致性的問題具有重要意義。本文首先對 AIS 評分領域現階段面臨的挑戰進行了闡述,之后從傳統機器學習和深度學習兩個方面概述了計算機輔助技術在 ASPECTS 評分中的研究現狀。最后,對該領域的研究方向進行了總結和展望,并提出基于多模態影像數據的計算機輔助系統對提高 AIS 評估的全面性和準確性具有很高的價值,以期為 AIS 輔助評估領域探索新的研究方向。
引用本文: 劉乃嘉, 胡穎, 楊一風, 李躍華, 聶生東. 基于不同模態影像的急性缺血性腦卒中計算機輔助阿爾伯塔卒中項目早期計算機斷層掃描評分研究進展. 生物醫學工程學雜志, 2021, 38(4): 790-796, 804. doi: 10.7507/1001-5515.202012037 復制
引言
急性缺血性腦卒中(acute ischemic stroke,AIS)是由于腦動脈閉塞導致的腦組織梗死,是現代社會中致死和致殘最主要的中樞神經系統血管疾病。AIS 發生后,及時對患者進行有效的評估,并根據評估結果進行缺血半暗帶的迅速重建有助于改善腦卒中患者受損的神經功能,減輕患者的殘疾程度,提高其生活質量。
阿爾伯塔卒中項目早期計算機斷層掃描評分(Alberta stroke program early computer tomography score,ASPECTS)是 AIS 的影像評價指標之一[1-4]。得益于醫學影像技術的快速發展,計算機斷層掃描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等技術在 AIS 患者的 ASPECTS 評分中起到了不可或缺的作用[5-6],對指導臨床溶栓治療、療效評估及預后具有重要意義。例如,頭顱擴散加權成像(diffusion-weighted imaging,DWI)是目前臨床中敏感性、特異性最高的早期腦梗死檢測手段;非對比計算機斷層掃描(non-contrastive computed tomography,NCCT)能準確地檢測出急性顱內出血[1],快速區分缺血性和出血性腦卒中。目前,臨床中主要由經驗豐富的放射科醫生借助 CT 影像進行 AIS 的早期診斷及 ASPECTS 評估,而 CT 影像層面上的早期缺血性表征不明顯,受主觀因素等影響,評分準確率不高。此外,不同評分者使用 ASPECTS 評估患者血管重建的可行性時存在不一致[7]。因此,如何提高 ASPECTS 評分的準確率及評分結果的一致性對患者的治療及預后具有重要意義。
近年來,機器學習和深度學習方法在醫學圖像處理中的應用十分廣泛,涉及醫學圖像分割、圖像配準、圖像融合、圖像壓縮、圖像重建等多個領域,且善于從原始輸入數據中挖掘抽象的特征表示,具有良好的泛化能力[8],可以從現有的影像數據中提取特征信息,輔助醫生進行更精準的 AIS 評估。其中以深度學習為代表的計算機輔助技術已在醫學影像處理任務中取得突破性進展[9]。人工智能方法的發展為 ASPECTS 自動評分帶來了新的機遇,它可以從 AIS 患者的影像中提取特征信息,從中挖掘有價值的影像特征。目前,AIS 的計算機輔助 ASPECTS 評分主要包括基于傳統機器學習和基于深度學習的方法。前者通過特征提取和篩選,訓練得到能夠識別缺血性病灶的模型,后者基于大量影像數據訓練一個深度神經網絡,能夠實現端到端的 ASPECTS 自動評分。本文從當前臨床 ASPECTS 評分面臨的問題出發,闡述了傳統機器學習方法和深度學習方法在 ASPECTS 評分中的研究現狀和進展,討論了目前已經得到臨床應用的計算機輔助軟件的可靠性,分析了當前基于計算機輔助技術在 ASPECTS 評分中存在的不足,并對未來的研究方向進行了展望,以期為構建精度高、魯棒性好、泛化能力強的 ASPECTS 評估模型提供有益參考。
1 臨床 ASPECTS 評分面臨的挑戰
目前,AIS 的治療主要是使用靜脈溶栓藥物對缺血腦組織進行再灌注。然而,僅僅依靠 CT 或 MRI 單一模態,有時無法對缺血組織做出準確評估[10-11],需要其他模態(例如 DWI)進行輔助決策[12-13],這可能導致 AIS 患者錯過治療窗口期,給臨床溶栓工作帶來極大的挑戰,也給患者本人和家庭帶來沉重的負擔。AIS 的靜脈溶栓治療每提前 15 min 就可極大地降低住院死亡率、癥狀性顱內出血的發生率,提高出院時獨立行走的可能性。為了把握 AIS 治療的窗口期,臨床主要采用掃描成本低、掃描速度快的 CT 進行 ASPECTS 評分。如圖 1 所示,為 AIS 患者影像診斷流程示意圖。

由于早期缺血性腦卒中在 CT 影像層面上的低密度表征不明顯,ASPECTS 評分結果受圖像掃描質量和患者自身情況的影響存在一定的誤判隱患。此外,有研究表明臨床評分具有高度主觀可變性,不同醫生之間 ASPECTS 評分結果一致性較差。例如,Farzin 等[14]招募了 15 名評分者對 30 名接受局部血栓切除手術的 AIS 患者的 CT 影像進行了 ASPECTS 評分,并對評分結果進行了一致性評估。研究結果顯示,15 位評分者中至少有 5 位在 15% 的患者中沒有給出相同的 ASPECTS 評分,不同臨床醫生之間的 ASPECTS 評分無法達成一致性意見作為治療決策的可靠標準。如何利用現有的影像掃描手段,提高 ASPECTS 評分的效率并減少不同醫生之間評分的差異是目前臨床評分中的一大難點。
2 計算機輔助方法在 AIS 評估中的應用
近年來,隨著人工智能技術的發展,多種模型已經被應用到 AIS 的臨床 ASPECTS 評估過程中,并出現了相應的計算機輔助診斷(computer-aided diagnosis,CAD)系統。目前,主流的計算機輔助方法主要分為兩種,分別是基于傳統的機器學習方法以及基于深度學習的方法。
深度學習與傳統的機器學習的區別主要分為六方面:① 數據量:深度學習算法需要大量的數據來進行參數訓練。當數據很少時,深度學習模型會出現過擬合。在這種情況下,傳統的機器學習算法使用制定的規則,性能會優于深度學習;② 特征工程:深度學習可以利用卷積操作直接從數據中獲取高階特征。但在機器學習中,大多數特征需要人為設計,其性能與特征準確度密切相關;③ 解決方案:深度學習提倡端到端的解決方案,而傳統機器學習通常將問題分解為多個子問題,逐個解決后得到最終結果;④ 可解釋性:深度學習算法在一些問題的表現上可以接近人類的水平,但無法解釋神經網絡是如何得到這一結果的。而像決策樹這類機器學習算法給出了明確的規則,可以依此對模型進行解釋;⑤ 運行時間:訓練一個深度學習模型需要花費大量時間,而機器學習的訓練消耗的時間相對較少;⑥ 硬件依賴:深度學習算法需要進行大量的矩陣運算,與傳統機器學習算法相比,深度學習更加依賴圖形處理器(graphics processing unit,GPU)的算力。
2.1 基于傳統機器學習的方法
傳統機器學習的流程主要包括特征提取、特征選擇以及模型的訓練和評估。借助統計學原理和龐大的計算,機器學習可以從大量影像數據中挖掘 AIS 特征信息,為 AIS 病灶的劃分提供客觀的影像依據,建立具有鑒別高風險缺血腦組織能力的決策模型,從而實現 ASPECTS 自動評分。
AIS 在不同模態的影像中具有不同的表征。例如,由于含水量的顯著改變,AIS 在 CT 影像上主要表現為低密度灶,且這一過程與發病時間呈正相關趨勢;DWI 對水分子擴散運動較為敏感,缺血性腦組織在圖像上表現為高亮[15];灌注加權成像(perfusion weighted imaging,PWI)可以顯示大腦中動脈缺血半暗區;液體衰減反轉恢復序列(fluidattenuated inversion recovery,FLAIR)在低信號腦脊液背景上能夠高亮顯示動脈閉塞。基于體素的形態學分析(voxel based morphometry,VBM)通過對 CT 或 MRI 影像進行體素水平的處理,可以在圖像的宏觀層面識別腦實質在密度、體積上的變化,檢測缺血性變化明顯的區域,實現腦梗病灶的準確定位。Asadi 等[16]使用經典統計學、人工神經網絡和支持向量算法設計了一個基于 VBM 方法的有監督機器學習模型。該模型能夠將腦卒中區域分為正常腦組織和低密度病灶組織,并通過隨機劃分數據集對算法進行了訓練、驗證和測試,結果顯示神經網絡的混淆矩陣在目標類和輸出類之間表現出 80% 的整體一致性,具有良好的接收操作特性,支持向量機的均方根誤差為 2.064。該研究在少量的實驗數據上通過有監督學習獲得了良好的 ASPECTS 評分結果,但由于實驗數據來源單一,模型的泛化能力有待提升。未來在使用多中心數據集的基礎上可能會進一步改善評分的準確率,提高模型的魯棒性。Anbumozhi[17]利用灰度共生矩陣(gray-level co-occurrence matrix,GLCM)表征 AIS 病灶的二階紋理特征。首先,計算 0°、45°、90° 以及 135° 的 GLCM 矩陣,之后從 GLCM 矩陣中提取特征對比度、能量、熵和相關性等特征,用于區分正常人和 AIS 患者的影像,并隨機選取缺血性腦卒中病灶分割挑戰賽(ischemic stroke lesion segmentation challenge,ISLESC)(http://www.isles-challenge.org)中的 50 例數據作為測試集。最終,AIS 的識別準確率達到 96.15%。該研究通過提取大量體素級別的組學特征實現了 AIS 的精準識別,但局限于機器學習的流程,無法實現端到端的自動評估。基于感興趣區域(region of interest,ROI)的特征提取需提前勾畫 ROI 區域,之后對 ROI 區域內的腦組織進行影像學分析。Mokin 等[18]提取了參與 ASPECTS 評分的十個腦區 ROI,利用亨氏單位(Hounsfield unit,HU)識別大腦中動脈早期缺血性改變,并與溶栓治療后的隨訪影像數據中的最終梗死區域進行一致性評估,發現 HU 值差異在 1.5~2.0 范圍時,與 AIS 表現出極高的相關性(相關系數r=0.71, P<0.05),這一結果表明通過測量患病側 ROI 和其對側腦半球 ROI 之間的 HU 值可以進行快速的腦卒中檢測,輔助臨床醫師進行 ASPECTS 評分。基于 ROI 的方法將影像數據按照處理需求劃分為不同的特征提取區域,能夠減少影像中的干擾信息,但也可能會丟失部分與疾病相關的影像信息。因此,實際應用時需要根據影像特點設計不同的特征提取方法。
基于 VBM 和基于 ROI 的機器學習方法均能利用單一模態的 CT 或 MRI 腦部成像提取與缺血組織有關的影像組學特征。但在急性腦卒中的情況下,通常會遇到不同模態圖像之間的不匹配問題。Scheldeman 等[19]對經 PWI 檢查的 AIS 患者分別進行了 DWI 和 FLAIR 掃描,發現其中 13% 出現了 DWI-PWI 和 DWI-FLAIR 均不匹配的情況,35% 出現了 DWI-FLAIR 不匹配,13% 出現了 PWI-DWI 不匹配。因此,針對臨床遇到的不匹配問題,有學者提出了聯合多模態影像進行 AIS 評估的方法。Simonsen 等[20]對 565 例 AIS 患者進行了 DWI 掃描,其中 518 例 DWI 存在高信號,DWI 診斷 AIS 的敏感度為 92%。隨后對 47 例無 DWI 高信號的患者進行了 PWI 掃描,其中 33 例患者顯示出 AIS 癥狀,結果表明 DWI 聯合 PWI 診斷 AIS 的敏感性高達 97.5%。Brugnara 等[21]利用機器學習算法對多模態成像和血管造影成像進行綜合評估建模,通過多模態影像數據的融合可以利用溶栓治療前 CT 灌注的血流動力學信息評估最終梗死體積,并實現 AIS 患者血管內介入治療后臨床結果評估。Scheldeman 等[19]和 Brugnara 等[21]的研究對臨床 AIS 評估過程中遇到的不匹配問題進行了很好的驗證,同時也啟發本文通過多模態數據進行 AIS 的評估能夠更好地反映腦組織體素特征及結構特征上的改變,表現要優于僅使用某一種模態的數據。
綜上所述,機器學習技術在不同模態影像上表現出其獨特的特點及優勢,為 AIS 的早期評估提供了具有臨床價值的參考信息。但它們也存在一定的局限性。例如,基于 VBM 的方法能夠很好地反映腦部體素層面上的特征信息,但缺少腦部結構信息,對于復雜的 AIS 病例存在評估不全面的問題。基于 ROI 的方法雖然能夠反映一定區域內的結構信息,但無法同時對上下層之間的腦梗病灶進行評估。因此,面對復雜多變的 AIS,需要從多維度進行綜合分析,獲取更高維度的特征信息,進一步提升 AIS-ASPECTS 評估的準確性。如何從現有影像數據中提取高維的特征信息,是改進傳統機器學習方法的關鍵。
2.2 深度學習在 ASPECTS 評分中的應用
近年來,依托于龐大的醫學影像數據集和強大的 GPU 計算能力,深度學習成為預測、診斷和評估神經系統疾病的并發癥及預后的新興輔助手段。從估算發病時間[22-23]、病灶分割[24]到患者預后[25-26],深度學習技術已用于協助 AIS 的診斷、評估和個體化治療等多個方面。基于深度學習的 ASPECTS 評分方法主要分為 3 個步驟:① 圖像預處理,包括去噪聲、去顱骨、配準等;② 訓練深度學習模型;③ 構建測試集,進行評分。相比于傳統的機器學習方法,深度學習端到端的學習模式無需手動提取特征,大大提高了工作效率。此外,借助深度學習的深層卷積網絡可以獲取圖像高維的抽象結構,模型具有良好的泛化能力。
機器學習利用 HU 值進行腦卒中區域的診斷進而實現 ASPECTS 評分是最為常見的方法。但在腦卒中發生的早期,NCCT 層面上的缺血低密度灶難以辨別,導致難以獲取差異具有統計學意義的特征。深度學習算法可以通過學習圖像高維結構信息,整合臨床和神經影像學信息來預測 AIS 患者的病情發展情況[27]。Barman 等[28]受暹羅網絡[29]的啟發提出了一種用于從 CT 血管造影(CT angiography,CTA)中自動檢測缺血性腦卒中病灶區域的方法。該網絡對血管和腦組織結構的對稱性變化敏感,可以從 CTA 圖像中通過有效學習無病灶的對側大腦半球,實現 AIS 的病灶檢測。借助對側對比分析,醫生可以快速辨別出缺血病灶,進而實現 ASPECTS 評分。該方法的創新之處在于,基于腦卒中一般發生在身體一側的特性,提出了對側對比分析策略,避免了掃描參數、掃描儀器等造成的干擾,使模型的決策更具個性化,提高了系統的泛化能力和魯棒性。同樣借鑒對側對比分析思想,Sheth 等[30]基于最大似然法設計了一個深度對稱敏感卷積神經網絡(deep symmetry-sensitive convolutional neural network,DeepSymNet)用于評估患者大血管閉塞及缺血性腦組織的體積。該方法的優勢在于無需任何先驗知識,大大減輕了前期數據預處理的工作量。Chen 等[24]通過反卷積神經網絡和多尺度卷積標簽評價網絡兩種卷積神經網絡相結合組成的網絡框架在 DWI 圖像上實現了腦梗病灶的分割,為 ASPECTS 評分和可挽救半暗帶組織的識別提供了客觀的臨床決策依據。Chen 等[24]的研究針對病灶的分割提出了兩個模塊,一個用于提取病灶的特征信息,另一個用于關注小尺度病變,旨在降低假陽性。該方法的不足之處在于網絡的訓練數據較少且無法實現端到端的自動分割。
此外,深度學習和傳統機器學習方法相結合一直是學術界積極探索的方向,比如把支持向量機(support vector machine,SVM)中的間隔(margin)思想引入到神經網絡的訓練中,例如,Tang[31]將深度學習網絡的全連接層以及損失函數替換成 SVM 進行訓練。傳統機器學習方法(例如 SVM)中,原樣本空間的 margin 是模型泛化能力的保證,直接影響到模型的性能,但在神經網絡中使用的損失函數,例如交叉熵損失,并沒有顯式地引入 margin。這一做法僅僅保證了神經網絡隱含層,即特征空間的 margin,而不是從根本上在原樣本空間中引入 margin,其本質還是深度學習方法,可以理解為利用傳統方法改進了損失函數的深度學習方法。Ho 等[23]開發了一種基于自動編碼器結構的深度學習算法,可以提取 PWI 影像數據中的高維影像學特征,并借助機器學習分類器進行腦卒中區域的定位。首先,基于編碼器提出了一個深層自動編碼網絡用于從 PWI 影像中學習深層特征,之后分別使用逐步多元回歸(stepwise multiple regression,SMR)、SVM、隨機森林(random forest,RF)和梯度提升決策樹(gradient boosting decision trees,GBDT)進行特征分析,并與傳統機器學習提取得到的特征再分類進行性能對比。使用深度學習提取特征后,SMR、SVM、RF 和 GBRT 的接收者操作特征曲線下面積(area under curve,AUC)比傳統機器學習方法提高了 10%。其中,SMR 為最佳模型,對應的 AUC 為 0.57。Ho 等[23]將深度學習的特征提取與機器學習的特征分類進行結合的思路能夠在一定程度上減少對數據量的要求,充分利用了深度學習對高維特征信息的高敏感性以及機器學習在分類器上的性能優勢,達到了比傳統機器學習方法更佳的 AIS 識別效果。
目前,基于深度學習的 ASPECTS 評分模型已經在少量數據集上顯示出巨大的潛力,彌補了傳統機器學習算法處理步驟繁瑣的不足。但當前深度學習的大規模發展受到數據集規模的限制,模型存在過擬合問題,難以發揮深度學習模型的最優性能。
2.3 計算機輔助 ASPECTS 評分的可靠性
目前,電子 ASPECTS 臨床應用軟件 e-ASPECTS(Brainomix Inc.,英國)和腦影像分析軟件 RAPID ASPECTS(iSchemaView Inc.,美國)兩款用于 AIS 檢測及 ASPECTS 評分的產品已經獲得相關專業認證并可用于臨床常規使用。e-ASPECTS(Brainomix Inc.,英國)利用人工智能技術能夠對 NCCT 層面的 10 個腦區進行快速和標準化的缺血腦組織自動分析并完成 ASPECTS 評分,輔助醫生進行臨床決策,避免了臨床醫生由于主觀原因造成的評分差異,使中風診斷更加標準化。Nagel 等[32]將電子 ASPECTS 臨床應用軟件 e-ASPECTS 6.0(Brainomix Inc.,英國)軟件的評分與腦卒中醫師及未接受任何訓練的對照評分者的 ASPECTS 評分進行了一致性分析,并利用 NCCT 數據驗證了 e-ASPECTS 評分對 AIS 靜脈溶栓患者的臨床價值。結果顯示 e-ASPECTS 的性能明顯優于對照組,總體性能優于腦卒中專家,可以用于臨床 AIS 患者的療效評估和預后。Nagel 等[32]的研究在驗證 e-ASPECTS 性能的基礎上進一步證明了 e-ASPECTS 在掃描層厚小于 1 mm 時性能最優。值得注意的是,這一特點可能成為 e-ASPECTS 在基層醫院廣泛應用的限制因素。AIS 在 DWI 影像上表現為高亮區域,在此基礎上可以得到較為可靠的 ASPECTS 基準評分。Herweh 等[33]選取兩位專家在達成共識的基礎上的 DWI-ASPECTS 評分作為參考分數,將計算機輔助評分與不同專業水平的腦卒中醫生進行了比較。結果顯示,計算機輔助軟件的 ASPECTS 評分敏感性為 46.46%,特異性為 94.15%,性能優于臨床醫生。上述兩個實驗利用不同的基準 ASPECTS 評分驗證了計算機輔助軟件在評分中具有良好的一致性,是可靠的臨床評分輔助手段。
RAPID ASPECTS 能夠將掃描圖像處理成三維數據作為輸入,之后利用機器學習算法把大腦中動脈自動劃分為 10 個評分腦區,并在視覺上突出顯示腦卒中區域,進而實現對早期缺血腦組織的定量評估。該軟件借助于三維的數據輸入能夠有效學習到大腦皮層間的空間結構特征,保證評分結果的準確,缺點是會增加計算機處理的負擔。Albers 等[34]利用腦影像分析軟件 RAPID ASPECTS 4.7(iSchemaView Inc., 美國)與 4 位經驗豐富的神經內科醫生進行了 ASPECTS 評分的一致性研究。研究采用在相鄰時間內的 DWI-ASPECTS 評分結果作為參考標準。臨床醫生的評分結果中位數為 5,而軟件評分結果和 DWI 對照組評分的中位數均為 3,自動評分軟件與臨床醫生相比具有更優的一致性。在鑒別早期 AIS 時,人工智能算法的敏感性約為 68%,特異性約為 81%,優于單一臨床醫生的評分結果。該對比試驗測試了在臨床應用廣泛的 RAPID ASPECTS 評分軟件的評分效果,其創新之處在于通過實驗分析發現了計算機輔助軟件對于 ASPECTS 小于 6 的患者評分準確率和一致性最高。此外,Maegerlein 等[35]和 Prakkamakul 等[1]通過實驗發現腦卒中癥狀出現 1 h 后,計算機輔助 ASPECTS 評分與基準分數高度一致(k=0.78),而此時臨床醫生與基準分數的一致性較差(k=0.27~0.36)。這兩項研究從腦卒中發生時間的角度研究了計算機輔助軟件在評分結果上具有良好的一致性,進一步說明了計算機輔助在 ASPECTS 評分的可靠性。
一系列研究表明,計算機輔助技術在 AIS 評估中具有一定優勢[23-24, 28, 36-39]。需要注意的是,深度學習更擅長挖掘圖像高維抽象信息,而機器學習能夠真實地反映病灶的形態學特征。從這一角度來看,機器學習更適合臨床解釋,而深度學習在解釋性上缺乏說服力。此外,成功的深度學習策略大都依賴于龐大的數據集,或者使用一種在有限數據集上能夠實現更好的數據預處理的方案以便提高網絡的性能。因此,深度學習需要建立統一的數據預處理標準以及病灶勾畫標準,提高模型的魯棒性和泛化能力。目前,訓練數據缺乏的問題可以通過呼吁建立公共數據集以及機構間數據共享等方式來實現。通過建立腦卒中大數據中心,可以使 AIS 的預防與治療工作得到更大的發展,但由于財力、物力等客觀因素的限制,在短時間內實現這樣的數據共享機制還十分困難。
3 總結與展望
本文回顧和總結了近年來計算機輔助技術在 ASPECTS 評分領域的研究。目前,計算機輔助手段從一定程度上緩解了臨床 ASPECTS 評分準確率低和不同醫生之間評分一致性不高的問題,可以在 AIS 發生的早期甚至超早期實現 ASPECTS 評分,幫助醫生及時制定合理的溶栓方案,為患者爭取寶貴的治療時間。傳統機器學習方法通過對腦部影像數據進行形態學特征提取,實現了腦卒中病灶的檢測及評估。深度學習借助深層卷積網絡對高維抽象特征的敏感性,能夠提供更具泛化能力的評估模型。其中,利用深度學習進行特征提取、機器學習訓練決策模型的組合能夠充分發揮機器學習與深度學習的優勢,進一步提升 AIS 評估的準確性。面對復雜的 AIS 影像數據,計算機輔助手段在普遍應用于臨床之前,還需要進一步驗證模型的可靠性。未來的研究中還應關注以下幾個方面:
(1)計算機輔助 ASPECTS 評分借助人工智能算法對醫學圖像的解釋能夠作為醫生的第二意見進行輔助判斷,不僅能夠增強醫生對于診斷結果的信心,也可以幫助醫生發現臨床評估過程中的錯誤判斷,但診斷和最終的結果還需由醫生做出。Philpotts 等[40]的研究結果表明,當醫生在有計算機輔助系統的幫助下進行臨床決策時往往會有所松懈。因此,隨著深度學習技術在 ASPECTS 評分領域中的不斷應用,研究人工智能技術對醫生的決策影響是非常必要的。未來,可以通過比較不同環境下有無計算機軟件輔助時臨床醫生做出決策的差異,來明確此類輔助工具對醫生臨床判斷的影響。
(2)傳統及現代的計算機輔助系統大都是基于監督學習算法實現的,通常一個龐大且具有良好標記的數據集可以訓練得到一個魯棒性更好的模型。然而,具有良好標記的數據集獲取成本較高。弱監督學習和無監督學習算法的發展將會大大緩解數據集匱乏所造成的局限性,進一步提升現有算法的性能。
(3)現有的人工智能算法已經在 AIS 患者的影像數據上得到了可靠的訓練結果,但訓練數據來源單一,模型的泛化能力和魯棒性有待提升。今后,增加數據樣本的復雜性,建立多中心、多模態的數據集,利用多模態影像數據(CTA、NCCT、DWI 等)融合,借助深度學習方法增強不同模態影像之間的匹配性,對實現全面的 AIS 評估具有重要意義。
(4)生成式對抗網絡(generative adversarial networks, GAN)借助博弈論的納什均衡思想能夠生成新的數據 [41],這為醫學圖像處理帶來了新思路。例如,Jin 等[42]借助配對和非配對圖像實現了由 CT 影像生成 MRI 影像,解決了心臟支架患者無法進行 MRI 掃描的問題。未來,借鑒 GAN 網絡的思想可以在短時間內生成不同模態的影像作為訓練數據,進一步提升模型的魯棒性。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
急性缺血性腦卒中(acute ischemic stroke,AIS)是由于腦動脈閉塞導致的腦組織梗死,是現代社會中致死和致殘最主要的中樞神經系統血管疾病。AIS 發生后,及時對患者進行有效的評估,并根據評估結果進行缺血半暗帶的迅速重建有助于改善腦卒中患者受損的神經功能,減輕患者的殘疾程度,提高其生活質量。
阿爾伯塔卒中項目早期計算機斷層掃描評分(Alberta stroke program early computer tomography score,ASPECTS)是 AIS 的影像評價指標之一[1-4]。得益于醫學影像技術的快速發展,計算機斷層掃描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等技術在 AIS 患者的 ASPECTS 評分中起到了不可或缺的作用[5-6],對指導臨床溶栓治療、療效評估及預后具有重要意義。例如,頭顱擴散加權成像(diffusion-weighted imaging,DWI)是目前臨床中敏感性、特異性最高的早期腦梗死檢測手段;非對比計算機斷層掃描(non-contrastive computed tomography,NCCT)能準確地檢測出急性顱內出血[1],快速區分缺血性和出血性腦卒中。目前,臨床中主要由經驗豐富的放射科醫生借助 CT 影像進行 AIS 的早期診斷及 ASPECTS 評估,而 CT 影像層面上的早期缺血性表征不明顯,受主觀因素等影響,評分準確率不高。此外,不同評分者使用 ASPECTS 評估患者血管重建的可行性時存在不一致[7]。因此,如何提高 ASPECTS 評分的準確率及評分結果的一致性對患者的治療及預后具有重要意義。
近年來,機器學習和深度學習方法在醫學圖像處理中的應用十分廣泛,涉及醫學圖像分割、圖像配準、圖像融合、圖像壓縮、圖像重建等多個領域,且善于從原始輸入數據中挖掘抽象的特征表示,具有良好的泛化能力[8],可以從現有的影像數據中提取特征信息,輔助醫生進行更精準的 AIS 評估。其中以深度學習為代表的計算機輔助技術已在醫學影像處理任務中取得突破性進展[9]。人工智能方法的發展為 ASPECTS 自動評分帶來了新的機遇,它可以從 AIS 患者的影像中提取特征信息,從中挖掘有價值的影像特征。目前,AIS 的計算機輔助 ASPECTS 評分主要包括基于傳統機器學習和基于深度學習的方法。前者通過特征提取和篩選,訓練得到能夠識別缺血性病灶的模型,后者基于大量影像數據訓練一個深度神經網絡,能夠實現端到端的 ASPECTS 自動評分。本文從當前臨床 ASPECTS 評分面臨的問題出發,闡述了傳統機器學習方法和深度學習方法在 ASPECTS 評分中的研究現狀和進展,討論了目前已經得到臨床應用的計算機輔助軟件的可靠性,分析了當前基于計算機輔助技術在 ASPECTS 評分中存在的不足,并對未來的研究方向進行了展望,以期為構建精度高、魯棒性好、泛化能力強的 ASPECTS 評估模型提供有益參考。
1 臨床 ASPECTS 評分面臨的挑戰
目前,AIS 的治療主要是使用靜脈溶栓藥物對缺血腦組織進行再灌注。然而,僅僅依靠 CT 或 MRI 單一模態,有時無法對缺血組織做出準確評估[10-11],需要其他模態(例如 DWI)進行輔助決策[12-13],這可能導致 AIS 患者錯過治療窗口期,給臨床溶栓工作帶來極大的挑戰,也給患者本人和家庭帶來沉重的負擔。AIS 的靜脈溶栓治療每提前 15 min 就可極大地降低住院死亡率、癥狀性顱內出血的發生率,提高出院時獨立行走的可能性。為了把握 AIS 治療的窗口期,臨床主要采用掃描成本低、掃描速度快的 CT 進行 ASPECTS 評分。如圖 1 所示,為 AIS 患者影像診斷流程示意圖。

由于早期缺血性腦卒中在 CT 影像層面上的低密度表征不明顯,ASPECTS 評分結果受圖像掃描質量和患者自身情況的影響存在一定的誤判隱患。此外,有研究表明臨床評分具有高度主觀可變性,不同醫生之間 ASPECTS 評分結果一致性較差。例如,Farzin 等[14]招募了 15 名評分者對 30 名接受局部血栓切除手術的 AIS 患者的 CT 影像進行了 ASPECTS 評分,并對評分結果進行了一致性評估。研究結果顯示,15 位評分者中至少有 5 位在 15% 的患者中沒有給出相同的 ASPECTS 評分,不同臨床醫生之間的 ASPECTS 評分無法達成一致性意見作為治療決策的可靠標準。如何利用現有的影像掃描手段,提高 ASPECTS 評分的效率并減少不同醫生之間評分的差異是目前臨床評分中的一大難點。
2 計算機輔助方法在 AIS 評估中的應用
近年來,隨著人工智能技術的發展,多種模型已經被應用到 AIS 的臨床 ASPECTS 評估過程中,并出現了相應的計算機輔助診斷(computer-aided diagnosis,CAD)系統。目前,主流的計算機輔助方法主要分為兩種,分別是基于傳統的機器學習方法以及基于深度學習的方法。
深度學習與傳統的機器學習的區別主要分為六方面:① 數據量:深度學習算法需要大量的數據來進行參數訓練。當數據很少時,深度學習模型會出現過擬合。在這種情況下,傳統的機器學習算法使用制定的規則,性能會優于深度學習;② 特征工程:深度學習可以利用卷積操作直接從數據中獲取高階特征。但在機器學習中,大多數特征需要人為設計,其性能與特征準確度密切相關;③ 解決方案:深度學習提倡端到端的解決方案,而傳統機器學習通常將問題分解為多個子問題,逐個解決后得到最終結果;④ 可解釋性:深度學習算法在一些問題的表現上可以接近人類的水平,但無法解釋神經網絡是如何得到這一結果的。而像決策樹這類機器學習算法給出了明確的規則,可以依此對模型進行解釋;⑤ 運行時間:訓練一個深度學習模型需要花費大量時間,而機器學習的訓練消耗的時間相對較少;⑥ 硬件依賴:深度學習算法需要進行大量的矩陣運算,與傳統機器學習算法相比,深度學習更加依賴圖形處理器(graphics processing unit,GPU)的算力。
2.1 基于傳統機器學習的方法
傳統機器學習的流程主要包括特征提取、特征選擇以及模型的訓練和評估。借助統計學原理和龐大的計算,機器學習可以從大量影像數據中挖掘 AIS 特征信息,為 AIS 病灶的劃分提供客觀的影像依據,建立具有鑒別高風險缺血腦組織能力的決策模型,從而實現 ASPECTS 自動評分。
AIS 在不同模態的影像中具有不同的表征。例如,由于含水量的顯著改變,AIS 在 CT 影像上主要表現為低密度灶,且這一過程與發病時間呈正相關趨勢;DWI 對水分子擴散運動較為敏感,缺血性腦組織在圖像上表現為高亮[15];灌注加權成像(perfusion weighted imaging,PWI)可以顯示大腦中動脈缺血半暗區;液體衰減反轉恢復序列(fluidattenuated inversion recovery,FLAIR)在低信號腦脊液背景上能夠高亮顯示動脈閉塞。基于體素的形態學分析(voxel based morphometry,VBM)通過對 CT 或 MRI 影像進行體素水平的處理,可以在圖像的宏觀層面識別腦實質在密度、體積上的變化,檢測缺血性變化明顯的區域,實現腦梗病灶的準確定位。Asadi 等[16]使用經典統計學、人工神經網絡和支持向量算法設計了一個基于 VBM 方法的有監督機器學習模型。該模型能夠將腦卒中區域分為正常腦組織和低密度病灶組織,并通過隨機劃分數據集對算法進行了訓練、驗證和測試,結果顯示神經網絡的混淆矩陣在目標類和輸出類之間表現出 80% 的整體一致性,具有良好的接收操作特性,支持向量機的均方根誤差為 2.064。該研究在少量的實驗數據上通過有監督學習獲得了良好的 ASPECTS 評分結果,但由于實驗數據來源單一,模型的泛化能力有待提升。未來在使用多中心數據集的基礎上可能會進一步改善評分的準確率,提高模型的魯棒性。Anbumozhi[17]利用灰度共生矩陣(gray-level co-occurrence matrix,GLCM)表征 AIS 病灶的二階紋理特征。首先,計算 0°、45°、90° 以及 135° 的 GLCM 矩陣,之后從 GLCM 矩陣中提取特征對比度、能量、熵和相關性等特征,用于區分正常人和 AIS 患者的影像,并隨機選取缺血性腦卒中病灶分割挑戰賽(ischemic stroke lesion segmentation challenge,ISLESC)(http://www.isles-challenge.org)中的 50 例數據作為測試集。最終,AIS 的識別準確率達到 96.15%。該研究通過提取大量體素級別的組學特征實現了 AIS 的精準識別,但局限于機器學習的流程,無法實現端到端的自動評估。基于感興趣區域(region of interest,ROI)的特征提取需提前勾畫 ROI 區域,之后對 ROI 區域內的腦組織進行影像學分析。Mokin 等[18]提取了參與 ASPECTS 評分的十個腦區 ROI,利用亨氏單位(Hounsfield unit,HU)識別大腦中動脈早期缺血性改變,并與溶栓治療后的隨訪影像數據中的最終梗死區域進行一致性評估,發現 HU 值差異在 1.5~2.0 范圍時,與 AIS 表現出極高的相關性(相關系數r=0.71, P<0.05),這一結果表明通過測量患病側 ROI 和其對側腦半球 ROI 之間的 HU 值可以進行快速的腦卒中檢測,輔助臨床醫師進行 ASPECTS 評分。基于 ROI 的方法將影像數據按照處理需求劃分為不同的特征提取區域,能夠減少影像中的干擾信息,但也可能會丟失部分與疾病相關的影像信息。因此,實際應用時需要根據影像特點設計不同的特征提取方法。
基于 VBM 和基于 ROI 的機器學習方法均能利用單一模態的 CT 或 MRI 腦部成像提取與缺血組織有關的影像組學特征。但在急性腦卒中的情況下,通常會遇到不同模態圖像之間的不匹配問題。Scheldeman 等[19]對經 PWI 檢查的 AIS 患者分別進行了 DWI 和 FLAIR 掃描,發現其中 13% 出現了 DWI-PWI 和 DWI-FLAIR 均不匹配的情況,35% 出現了 DWI-FLAIR 不匹配,13% 出現了 PWI-DWI 不匹配。因此,針對臨床遇到的不匹配問題,有學者提出了聯合多模態影像進行 AIS 評估的方法。Simonsen 等[20]對 565 例 AIS 患者進行了 DWI 掃描,其中 518 例 DWI 存在高信號,DWI 診斷 AIS 的敏感度為 92%。隨后對 47 例無 DWI 高信號的患者進行了 PWI 掃描,其中 33 例患者顯示出 AIS 癥狀,結果表明 DWI 聯合 PWI 診斷 AIS 的敏感性高達 97.5%。Brugnara 等[21]利用機器學習算法對多模態成像和血管造影成像進行綜合評估建模,通過多模態影像數據的融合可以利用溶栓治療前 CT 灌注的血流動力學信息評估最終梗死體積,并實現 AIS 患者血管內介入治療后臨床結果評估。Scheldeman 等[19]和 Brugnara 等[21]的研究對臨床 AIS 評估過程中遇到的不匹配問題進行了很好的驗證,同時也啟發本文通過多模態數據進行 AIS 的評估能夠更好地反映腦組織體素特征及結構特征上的改變,表現要優于僅使用某一種模態的數據。
綜上所述,機器學習技術在不同模態影像上表現出其獨特的特點及優勢,為 AIS 的早期評估提供了具有臨床價值的參考信息。但它們也存在一定的局限性。例如,基于 VBM 的方法能夠很好地反映腦部體素層面上的特征信息,但缺少腦部結構信息,對于復雜的 AIS 病例存在評估不全面的問題。基于 ROI 的方法雖然能夠反映一定區域內的結構信息,但無法同時對上下層之間的腦梗病灶進行評估。因此,面對復雜多變的 AIS,需要從多維度進行綜合分析,獲取更高維度的特征信息,進一步提升 AIS-ASPECTS 評估的準確性。如何從現有影像數據中提取高維的特征信息,是改進傳統機器學習方法的關鍵。
2.2 深度學習在 ASPECTS 評分中的應用
近年來,依托于龐大的醫學影像數據集和強大的 GPU 計算能力,深度學習成為預測、診斷和評估神經系統疾病的并發癥及預后的新興輔助手段。從估算發病時間[22-23]、病灶分割[24]到患者預后[25-26],深度學習技術已用于協助 AIS 的診斷、評估和個體化治療等多個方面。基于深度學習的 ASPECTS 評分方法主要分為 3 個步驟:① 圖像預處理,包括去噪聲、去顱骨、配準等;② 訓練深度學習模型;③ 構建測試集,進行評分。相比于傳統的機器學習方法,深度學習端到端的學習模式無需手動提取特征,大大提高了工作效率。此外,借助深度學習的深層卷積網絡可以獲取圖像高維的抽象結構,模型具有良好的泛化能力。
機器學習利用 HU 值進行腦卒中區域的診斷進而實現 ASPECTS 評分是最為常見的方法。但在腦卒中發生的早期,NCCT 層面上的缺血低密度灶難以辨別,導致難以獲取差異具有統計學意義的特征。深度學習算法可以通過學習圖像高維結構信息,整合臨床和神經影像學信息來預測 AIS 患者的病情發展情況[27]。Barman 等[28]受暹羅網絡[29]的啟發提出了一種用于從 CT 血管造影(CT angiography,CTA)中自動檢測缺血性腦卒中病灶區域的方法。該網絡對血管和腦組織結構的對稱性變化敏感,可以從 CTA 圖像中通過有效學習無病灶的對側大腦半球,實現 AIS 的病灶檢測。借助對側對比分析,醫生可以快速辨別出缺血病灶,進而實現 ASPECTS 評分。該方法的創新之處在于,基于腦卒中一般發生在身體一側的特性,提出了對側對比分析策略,避免了掃描參數、掃描儀器等造成的干擾,使模型的決策更具個性化,提高了系統的泛化能力和魯棒性。同樣借鑒對側對比分析思想,Sheth 等[30]基于最大似然法設計了一個深度對稱敏感卷積神經網絡(deep symmetry-sensitive convolutional neural network,DeepSymNet)用于評估患者大血管閉塞及缺血性腦組織的體積。該方法的優勢在于無需任何先驗知識,大大減輕了前期數據預處理的工作量。Chen 等[24]通過反卷積神經網絡和多尺度卷積標簽評價網絡兩種卷積神經網絡相結合組成的網絡框架在 DWI 圖像上實現了腦梗病灶的分割,為 ASPECTS 評分和可挽救半暗帶組織的識別提供了客觀的臨床決策依據。Chen 等[24]的研究針對病灶的分割提出了兩個模塊,一個用于提取病灶的特征信息,另一個用于關注小尺度病變,旨在降低假陽性。該方法的不足之處在于網絡的訓練數據較少且無法實現端到端的自動分割。
此外,深度學習和傳統機器學習方法相結合一直是學術界積極探索的方向,比如把支持向量機(support vector machine,SVM)中的間隔(margin)思想引入到神經網絡的訓練中,例如,Tang[31]將深度學習網絡的全連接層以及損失函數替換成 SVM 進行訓練。傳統機器學習方法(例如 SVM)中,原樣本空間的 margin 是模型泛化能力的保證,直接影響到模型的性能,但在神經網絡中使用的損失函數,例如交叉熵損失,并沒有顯式地引入 margin。這一做法僅僅保證了神經網絡隱含層,即特征空間的 margin,而不是從根本上在原樣本空間中引入 margin,其本質還是深度學習方法,可以理解為利用傳統方法改進了損失函數的深度學習方法。Ho 等[23]開發了一種基于自動編碼器結構的深度學習算法,可以提取 PWI 影像數據中的高維影像學特征,并借助機器學習分類器進行腦卒中區域的定位。首先,基于編碼器提出了一個深層自動編碼網絡用于從 PWI 影像中學習深層特征,之后分別使用逐步多元回歸(stepwise multiple regression,SMR)、SVM、隨機森林(random forest,RF)和梯度提升決策樹(gradient boosting decision trees,GBDT)進行特征分析,并與傳統機器學習提取得到的特征再分類進行性能對比。使用深度學習提取特征后,SMR、SVM、RF 和 GBRT 的接收者操作特征曲線下面積(area under curve,AUC)比傳統機器學習方法提高了 10%。其中,SMR 為最佳模型,對應的 AUC 為 0.57。Ho 等[23]將深度學習的特征提取與機器學習的特征分類進行結合的思路能夠在一定程度上減少對數據量的要求,充分利用了深度學習對高維特征信息的高敏感性以及機器學習在分類器上的性能優勢,達到了比傳統機器學習方法更佳的 AIS 識別效果。
目前,基于深度學習的 ASPECTS 評分模型已經在少量數據集上顯示出巨大的潛力,彌補了傳統機器學習算法處理步驟繁瑣的不足。但當前深度學習的大規模發展受到數據集規模的限制,模型存在過擬合問題,難以發揮深度學習模型的最優性能。
2.3 計算機輔助 ASPECTS 評分的可靠性
目前,電子 ASPECTS 臨床應用軟件 e-ASPECTS(Brainomix Inc.,英國)和腦影像分析軟件 RAPID ASPECTS(iSchemaView Inc.,美國)兩款用于 AIS 檢測及 ASPECTS 評分的產品已經獲得相關專業認證并可用于臨床常規使用。e-ASPECTS(Brainomix Inc.,英國)利用人工智能技術能夠對 NCCT 層面的 10 個腦區進行快速和標準化的缺血腦組織自動分析并完成 ASPECTS 評分,輔助醫生進行臨床決策,避免了臨床醫生由于主觀原因造成的評分差異,使中風診斷更加標準化。Nagel 等[32]將電子 ASPECTS 臨床應用軟件 e-ASPECTS 6.0(Brainomix Inc.,英國)軟件的評分與腦卒中醫師及未接受任何訓練的對照評分者的 ASPECTS 評分進行了一致性分析,并利用 NCCT 數據驗證了 e-ASPECTS 評分對 AIS 靜脈溶栓患者的臨床價值。結果顯示 e-ASPECTS 的性能明顯優于對照組,總體性能優于腦卒中專家,可以用于臨床 AIS 患者的療效評估和預后。Nagel 等[32]的研究在驗證 e-ASPECTS 性能的基礎上進一步證明了 e-ASPECTS 在掃描層厚小于 1 mm 時性能最優。值得注意的是,這一特點可能成為 e-ASPECTS 在基層醫院廣泛應用的限制因素。AIS 在 DWI 影像上表現為高亮區域,在此基礎上可以得到較為可靠的 ASPECTS 基準評分。Herweh 等[33]選取兩位專家在達成共識的基礎上的 DWI-ASPECTS 評分作為參考分數,將計算機輔助評分與不同專業水平的腦卒中醫生進行了比較。結果顯示,計算機輔助軟件的 ASPECTS 評分敏感性為 46.46%,特異性為 94.15%,性能優于臨床醫生。上述兩個實驗利用不同的基準 ASPECTS 評分驗證了計算機輔助軟件在評分中具有良好的一致性,是可靠的臨床評分輔助手段。
RAPID ASPECTS 能夠將掃描圖像處理成三維數據作為輸入,之后利用機器學習算法把大腦中動脈自動劃分為 10 個評分腦區,并在視覺上突出顯示腦卒中區域,進而實現對早期缺血腦組織的定量評估。該軟件借助于三維的數據輸入能夠有效學習到大腦皮層間的空間結構特征,保證評分結果的準確,缺點是會增加計算機處理的負擔。Albers 等[34]利用腦影像分析軟件 RAPID ASPECTS 4.7(iSchemaView Inc., 美國)與 4 位經驗豐富的神經內科醫生進行了 ASPECTS 評分的一致性研究。研究采用在相鄰時間內的 DWI-ASPECTS 評分結果作為參考標準。臨床醫生的評分結果中位數為 5,而軟件評分結果和 DWI 對照組評分的中位數均為 3,自動評分軟件與臨床醫生相比具有更優的一致性。在鑒別早期 AIS 時,人工智能算法的敏感性約為 68%,特異性約為 81%,優于單一臨床醫生的評分結果。該對比試驗測試了在臨床應用廣泛的 RAPID ASPECTS 評分軟件的評分效果,其創新之處在于通過實驗分析發現了計算機輔助軟件對于 ASPECTS 小于 6 的患者評分準確率和一致性最高。此外,Maegerlein 等[35]和 Prakkamakul 等[1]通過實驗發現腦卒中癥狀出現 1 h 后,計算機輔助 ASPECTS 評分與基準分數高度一致(k=0.78),而此時臨床醫生與基準分數的一致性較差(k=0.27~0.36)。這兩項研究從腦卒中發生時間的角度研究了計算機輔助軟件在評分結果上具有良好的一致性,進一步說明了計算機輔助在 ASPECTS 評分的可靠性。
一系列研究表明,計算機輔助技術在 AIS 評估中具有一定優勢[23-24, 28, 36-39]。需要注意的是,深度學習更擅長挖掘圖像高維抽象信息,而機器學習能夠真實地反映病灶的形態學特征。從這一角度來看,機器學習更適合臨床解釋,而深度學習在解釋性上缺乏說服力。此外,成功的深度學習策略大都依賴于龐大的數據集,或者使用一種在有限數據集上能夠實現更好的數據預處理的方案以便提高網絡的性能。因此,深度學習需要建立統一的數據預處理標準以及病灶勾畫標準,提高模型的魯棒性和泛化能力。目前,訓練數據缺乏的問題可以通過呼吁建立公共數據集以及機構間數據共享等方式來實現。通過建立腦卒中大數據中心,可以使 AIS 的預防與治療工作得到更大的發展,但由于財力、物力等客觀因素的限制,在短時間內實現這樣的數據共享機制還十分困難。
3 總結與展望
本文回顧和總結了近年來計算機輔助技術在 ASPECTS 評分領域的研究。目前,計算機輔助手段從一定程度上緩解了臨床 ASPECTS 評分準確率低和不同醫生之間評分一致性不高的問題,可以在 AIS 發生的早期甚至超早期實現 ASPECTS 評分,幫助醫生及時制定合理的溶栓方案,為患者爭取寶貴的治療時間。傳統機器學習方法通過對腦部影像數據進行形態學特征提取,實現了腦卒中病灶的檢測及評估。深度學習借助深層卷積網絡對高維抽象特征的敏感性,能夠提供更具泛化能力的評估模型。其中,利用深度學習進行特征提取、機器學習訓練決策模型的組合能夠充分發揮機器學習與深度學習的優勢,進一步提升 AIS 評估的準確性。面對復雜的 AIS 影像數據,計算機輔助手段在普遍應用于臨床之前,還需要進一步驗證模型的可靠性。未來的研究中還應關注以下幾個方面:
(1)計算機輔助 ASPECTS 評分借助人工智能算法對醫學圖像的解釋能夠作為醫生的第二意見進行輔助判斷,不僅能夠增強醫生對于診斷結果的信心,也可以幫助醫生發現臨床評估過程中的錯誤判斷,但診斷和最終的結果還需由醫生做出。Philpotts 等[40]的研究結果表明,當醫生在有計算機輔助系統的幫助下進行臨床決策時往往會有所松懈。因此,隨著深度學習技術在 ASPECTS 評分領域中的不斷應用,研究人工智能技術對醫生的決策影響是非常必要的。未來,可以通過比較不同環境下有無計算機軟件輔助時臨床醫生做出決策的差異,來明確此類輔助工具對醫生臨床判斷的影響。
(2)傳統及現代的計算機輔助系統大都是基于監督學習算法實現的,通常一個龐大且具有良好標記的數據集可以訓練得到一個魯棒性更好的模型。然而,具有良好標記的數據集獲取成本較高。弱監督學習和無監督學習算法的發展將會大大緩解數據集匱乏所造成的局限性,進一步提升現有算法的性能。
(3)現有的人工智能算法已經在 AIS 患者的影像數據上得到了可靠的訓練結果,但訓練數據來源單一,模型的泛化能力和魯棒性有待提升。今后,增加數據樣本的復雜性,建立多中心、多模態的數據集,利用多模態影像數據(CTA、NCCT、DWI 等)融合,借助深度學習方法增強不同模態影像之間的匹配性,對實現全面的 AIS 評估具有重要意義。
(4)生成式對抗網絡(generative adversarial networks, GAN)借助博弈論的納什均衡思想能夠生成新的數據 [41],這為醫學圖像處理帶來了新思路。例如,Jin 等[42]借助配對和非配對圖像實現了由 CT 影像生成 MRI 影像,解決了心臟支架患者無法進行 MRI 掃描的問題。未來,借鑒 GAN 網絡的思想可以在短時間內生成不同模態的影像作為訓練數據,進一步提升模型的魯棒性。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。