放射治療(簡稱:放療)作為腫瘤的主要治療方式之一,在整個流程中對于治療的技術精度和設備穩定性具有越來越高的要求。機器學習方法能夠使放療決策更加簡化、個體化和精確化,提高了放療計劃設計和質量控制環節的自動化程度,推動了個體化的精準治療。本文以放療流程為線索,對機器學習方法尤其是深度學習法,在正常組織和腫瘤靶區的勾畫、放療計劃設計、放療實施、質量控制和放療療效預測等幾個方面的應用、研究情況予以綜述,并對發展前景做出展望。
引用本文: 張珺倩, 張遠, 尹勇, 朱健, 李寶生. 機器學習在腫瘤放射治療領域應用進展. 生物醫學工程學雜志, 2019, 36(5): 879-884. doi: 10.7507/1001-5515.201810051 復制
引言
放射治療(簡稱:放療)與手術、化療并稱為腫瘤治療的三大手段。放療技術發展迅速,已從傳統的二維(two dimensional,2D)常規放療發展到今天的三維(three dimensional,3D)數字化精確放療[1]。放療大體流程包括體位固定狀態下的圖像獲取、放療計劃設計和放療執行三個階段。在治療前、中、后各時期,借助電子計算機斷層掃描成像(computed tomography,CT)、核磁共振影像(magnetic resonance imaging,MRI)、正電子發射斷層影像(positron emission tomography,PET)、錐形束 CT(cone beam CT,CBCT)等多模態影像技術,可以對放療患者病情的發展及并發癥的風險進行預測,及時調整放療計劃。放療物理師則提供可靠的質量控制,對放療設備的運行狀況做持續監控和誤差分析,保證設備準確、穩定運行。每一例放療患者的療程持續 1~2 個月,在此過程中,大量醫學影像、輻射劑量、文本日志等數據被保存下來。若能充分利用機器學習技術對上述海量高維度多模態數據進行分析挖掘,則可以對腫瘤的放射治療提供更為個體化的治療決策和精確、穩定的治療技術。
機器學習作為人工智能領域的主要方法,分為有監督的學習、無監督的學習和強化學習,具體到放療領域,主要使用有監督的學習輔助放療[2]。神經網絡是機器學習的一種方式,受大腦工作方式的啟發,引用了神經元的連接結構。當神經網絡的隱含層較多時,就定義為深度神經網絡。深度學習方法即是使用深度神經網絡解決各種分類和預測問題,深度學習方法與傳統機器學習方法相比,優勢在于能夠自動學習數據中的特征,避免了人工的特征選擇。深度學習受到關注起始于 2012 年基于圖像數據集(ImageNet)的挑戰賽,其中唯一使用了深度學習的團隊,能夠將上屆比賽的錯誤分類率減半[3]。基本的深度學習方法也分為有監督學習和無監督學習,有監督學習的網絡主要包括卷積神經網絡(convolutional neural network,CNN)、循環神經網絡(recurrent neural network,RNN)、多層感知器(multi-layer perceptron,MLP)等,無監督學習的網絡包括自編碼器網絡(autoencoder,AE)、玻爾茲曼機網絡(Boltzmann machine,BM)、深度信念網絡(deep believe network,DBN)、受限玻爾茲曼機網絡(restricted Boltzmann machine,RBM)、生成式對抗網絡(generative adversarial networks,GAN)等。大量的數據積累以及硬件計算能力的提高,使深度學習方法越來越多地應用在醫療領域之中,并且表現出優于傳統機器學習方法的性能。
放療在整個流程中對于精準性具有越來越高的要求。現已證明機器學習方法在放射腫瘤學和放射學的診斷、治療規劃和結果預測方面具有一定的應用價值。同時,圖像引導放療中產生的大量數據,能夠支持各種機器學習方法訓練出高精確度的決策模型。深度學習方法的應用更有助于提高放療的執行效率、治療精確性和安全性。
1 機器學習方法輔助放療
以放療流程為線索,將深度學習作為重點,本文分以下 6 個部分介紹機器學習方法在放療中的應用。當前的研究主要集中于對正常組織和可見腫瘤靶區的自動勾畫,故本文將作重點介紹。
1.1 正常組織自動勾畫
放療計劃設計時,首先在 CT 或 MRI 圖像進行正常組織和腫瘤靶區的勾畫,對于靶區周圍的正常組織器官,不同器官有不同的耐受劑量,在一定程度上決定了放療處方劑量水平。精確迅速地分割正常組織,是實現放療計劃自動設計的第一步,分割結果直接影響放療計劃設計、評估的準確性。如表 1 所示,列出了近幾年深度學習方法在正常組織自動勾畫中的應用,并對分割方法和結果進行了比較。

有標簽數據的積累需要數名經驗豐富的醫師在圖像上做標記,但標簽數據不足時很難進行有監督的訓練,此時可采用無監督的方法實現有效分割。Dolz 等[4]使用手工提取特征,結合無監督的堆疊去噪自編碼器用于腦干分割,分類速度比基于支持向量機(support vector machine,SVM)方法快了約 70 倍,減少了分割時間。
有監督的深度學習網絡,特別是用于圖像處理的 CNN,已成為醫學影像分析的常用方法[5]。CNN 能夠處理多維多通道數據,捕獲輸入和輸出之間復雜的非線性映射[6],具有圖像處理和分類的優勢。Lu 等[6]使用 3D CNN 自動分割肝臟,結合圖割算法(graph cut)細化分割,優點在于不需要人工初始化,可由非專業人員執行分割過程。同樣使用 3D CNN 進行肝臟分割,Hu 等[7]將深度學習與全局和局部的形狀先驗信息結合,在相同數據集進行評價,各項誤差指標均有顯著下降。Hu 等[8]在后續研究中將目標擴展至腹部多器官分割,使用 3D CNN 執行像素到像素的密集預測,精度較高,分割用時較短。Ibragimov 等[9]進行了頭頸部多器官的自動勾畫,使用不同類別的像素塊對 CNN 進行訓練,發現在脊髓、下頜骨、喉部、咽、眼球和視神經的分割上表現較好,而腮腺、頜下腺和視神經交叉的分割上表現較差。
1.2 腫瘤靶區自動勾畫
與正常組織勾畫相同的是,機器學習方法輔助腫瘤靶區勾畫有助于提高執行效率,但不同之處更需要引起關注:腫瘤邊界通常不具有顯著的影像學特征,需要借助注射顯像強化造影劑、圖像后處理、多模態圖像融合等技術來輔助識別,并選擇腦腫瘤、早期周圍型肺癌、乳腺癌等邊界相對容易確定的腫瘤類型開展研究。對于如局部晚期肺癌、鼻咽癌、宮頸癌等需要勾畫淋巴結預防區域的腫瘤靶區,由于其勾畫過程需要結合臨床特征(如病理分期)進行個體化調整,故此類基于機器學習的自動勾畫技術尚未見報道。深度學習在腫瘤靶區勾畫的應用如表 2 所示。

Guo 等[10]使用無監督的堆疊稀疏自編碼器,針對前列腺癌的病例,基于圖譜(atlas)進行 MRI 圖像的前列腺分割,DSC 為 87.8%。該研究考慮了形狀先驗信息以提高分割精度,在網絡訓練階段多次迭代進行微調,防止過擬合。由于 MRI 成像的軟組織對比度較高,沒有電離輻射,因此廣泛應用于腦部腫瘤成像。Pereira 等[11]使用 CNN 對腦部腫瘤 MRI 圖像進行自動分割,提高了網絡精度,在 2013 年的多模態腦腫瘤分割挑戰(Multimodal Brain Tumor Image Segmentation Challenge,BraTS)中排名第一。Kamnitsas 等[12]提出了雙通道 3D CNN 網絡,用于腦損傷(包括:創傷性腦損傷、腦腫瘤、缺血性中風)的分割,首次在醫學數據上使用全連接的條件隨機場用于后處理。以上兩項研究都使用了小卷積核的神經網絡,使網絡結構更加深入,而不增加計算成本。
另外,基于 CT 的靶區分割更貼近絕大多數放療機構的臨床應用。Men 等[13]采用深度擴張卷積神經網絡(deep dilated convolutional neural networks,DDCNN)進行正常組織和直腸癌臨床靶區(clinical target volume,CTV)的勾畫,實現了像素級分割,平均 DSC 比 U 形網絡(U-Net)高 3.8%。Men 等[14]使用大數據訓練深度擴張殘差網絡(deep dilated residual network,DD-ResNet)進行乳腺腫瘤的分割,結果優于 DDCNN 和分布式神經網絡(distributed deep neural networks,DDNN),DSC 為 91%,高于專家手工描繪的結果(DSC 值 < 90%)[15]。Li 等[16]基于非小細胞肺癌患者的四維計算機斷層掃描(four dimensional CT,4DCT)數據,采用遷移學習方法自動描繪腫瘤區域,提高了準確性,縮短了網絡的再訓練時間,當呼吸幅度在 5~10 mm 時,匹配指數(matching index,MI)超過綜合彈性形變配準技術,平均提高 36.1%。
1.3 放療計劃設計
放療計劃設計是根據腫瘤靶區的目標劑量和正常組織的限值劑量,以患者的模擬定位影像為依據,設置射線的入射參數,包括射野角度、照射范圍和強度,是一個逐步調整、優化的過程,以保證腫瘤靶區達到處方劑量強度的同時盡量降低正常組織受照射劑量。機器學習輔助計劃設計主要是利用醫學影像所反映的解剖結構,在大量先驗知識的基礎上,實現照射角度、入射強度和劑量分布的自動優化。
在實際的調強放療(intensity modulated radiation therapy,IMRT)計劃設計中,照射野角度一般憑借物理師的經驗和試錯的方式尋找最佳分布。Dias 等[17]使用遺傳算法自動計算射野角度,將神經網絡作為代理模型計算遺傳算法中的個體適應度,與平均角度方法相比,靶區劑量有所提高而正常組織劑量較低。對于劑量計算,Shiraishi 等[18]指出,逆向放療計劃不能保證每個患者都有最佳的治療方案,計劃設計者主觀依賴性較強,計劃質量和標準程度得不到保障。此研究提出了一個基于知識的 3D 劑量預測方法,利用人工神經網絡(artificial neural network,ANN)對劑量分布做逐像素估計。Han[19]基于 MRI 圖像,使用深度卷積神經網絡(deep convolution neural network,DCNN)生成合成 CT(synthetic CT,sCT),用于劑量計算和放療定位,合成用時 9 s,而基于 atlas 的方法需 10 min,且前者的平均絕對誤差(mean absolute deviation,MAE)小于后者。Maspero 等[20]基于 MRI 圖像使用條件生成對抗網絡(conditional generative adversarial network,cGAN)合成 sCT,減少了用時,MAE 小于上述 DCNN 方法,劑量誤差約 0.1%~0.3%。此類方法對于目前國際上先進的 MRI 圖像模擬定位放療或者 MRI 圖像與加速器同機的放療,是一種高效、準確的解決方案。
基于知識的放療計劃(knowledge-based planning,KBP)是近幾年來放療計劃中的熱點工具,能夠利用已有的計劃和物理師的豐富經驗,估計獲得新病例的最優劑量體積直方圖。對于基于回歸的 KBP 模型,在不同的環境中,不同的回歸方法效果各異。Zhang 等[21]結合已有 4 種回歸模型的優點,提出了一種集成學習的方法,對小訓練集、錯誤標記的情況和低劑量的計劃具有更強的魯棒性。此方法的預測效果優于或類似于性能最佳的單個模型,無需手動篩選模型的類型,更加適用于臨床。Faught 等[22]將 KBP 模型首次應用于肺部的 4DCT 功能引導放療中,解決了此類放療中由于缺乏經驗和肺功能分布差異而產生的計劃困難,為肺部功能引導放療計劃提供了具體的劑量目標,保證了計劃質量的穩定性。
1.4 放療執行
放療執行中,由于呼吸和心跳等運動,會引起胸部和腹部的腫瘤位置周期性變化,導致放療精度降低。在放療過程中有必要掌握腫瘤運動規律、準確預測腫瘤位置,能夠為及時調整放療計劃提供重要依據。Schwaab 等[23]將基于超聲的運動跟蹤集成到重離子放療中,利用 ANN,對目標運動與位置數據之間約 200 ms 的延遲做了 2D 數據的補償,證明了超聲實時跟蹤腫瘤位置引導放療執行的思路是可行的。Bukovsky 等[24]比較了三種機器學習方法,在不同的訓練方法下開展對肺部腫瘤運動預測效果的研究,其中最佳算法是用改進的列文伯格—馬夸爾特法訓練的二次神經單元模型,在 1 s 預測水平下的 MAE 為 1 mm。
調強放療開始之前,需要對調強放療計劃進行在線驗證,篩除劑量通過率不符合臨床要求的計劃,稱為放療計劃的質量保證。多葉準直器(multi-leaf collimator,MLC)的計劃和實際運動之間的差異是放療劑量分布誤差的重要來源,Carlson 等[25]使用機器學習模型預測這些差異,結果表明對 MLC 的準確預測能夠提高伽馬通過率,預測的劑量分布更接近實際情況。為了自動預測放療計劃的伽馬通過率,在牛津大學視覺幾何小組(visual geometry group,VGG)發明的 16 層卷積神經網絡在 ImageNet 預訓練的模型基礎上,Interian 等[26]構建了深度神經網絡的預測模型,MAE 為 0.70,誤差小于領域內的專家模型。
1.5 放射物理質量控制
由于放療流程復雜,涉及到的部門和工作人員較多,患者的治療周期長[27]。在放療設備的維護、射線束校準、治療計劃和劑量計算、治療擺位和治療實施上若出現誤差,容易導致意外照射。因此必須加強放射物理質量控制,對放療設備進行嚴格監控。放療設備監控過程中大量數據的積累,也為機器學習的應用提供了資源。
Wu 等[28]為了改善放療中 2D/3D 圖像配準的魯棒性,開發了一種基于神經網絡的配準質量評估器,在識別患者定位的 2D/3D 圖像配準是否成功時表現良好。此外,日常質量保證中密切監控醫用直線加速器的性能,對于提高患者安全性和放療質量至關重要。Li 等[29]將 ANN 與自回歸滑動平均模型(autoregressive moving average,ARMA)的時間序列預測技術作對比,以共計 5 年的加速器日常質量控制(quality assurance,QA)數據作為檢測,結果表明,基于 ANN 的模型在劑量學對稱性曲線的時間序列預測方面具有更大優勢,均方誤差下降了 0.3 以上。加速器 QA 數據作為重要的日常記錄數據,其潛在信息的挖掘能夠及時預測運行誤差,有助于加速器的規范使用。
1.6 放療療效預測
放療執行完畢后,患者的生理變化、生存時間、放療并發癥等治療效果,往往在一段時間之后體現出來。其療效以及并發癥的預測,又會為放療過程的調整提供參考依據,進而提升療效。
Yahya 等[30]關注前列腺癌外照射放療引起尿路并發癥的預測技術,比較了邏輯回歸、彈性網絡、支持向量機、隨機森林、神經網絡和多元自適應回歸樣條(multivariate adaptive regression splines,MARS)幾種機器學習方法的預測效果,得到邏輯回歸和 MARS 是預測尿路癥狀的最佳方法。Zhen 等[31]為了預測宮頸癌放療引起的直腸并發癥,建立基于 CNN 的遷移學習模型,敏感性和特異性分別為 75% 和 83.3%,受試者工作特征(receiver operating characteristic,ROC)曲線下面積為 0.89,均優于邏輯回歸方法,這是將 CNN 的遷移學習應用于劑量分布分析的第一次嘗試。為了預測立體定向體放射治療中非小細胞肺癌患者的治療預后和生存率,Li 等[32]提出了一種無監督的機器學習方法,基于成像數據對患者分層并提取元特征,此方法魯棒性較高,在區分不同預后的患者和提取元特征方面具有很好的效果。
2 總結與展望
機器學習方法在放療領域的研究已經全面鋪開且取得了階段性成果,其中在正常組織和腫瘤靶區自動勾畫方向上的研究較多,而在執行、預后和 QA 階段的研究不足,且研究成果大多停留在理論階段,距投入臨床應用尚缺少大數據訓練模型和多中心數據的檢驗。
現有的深度學習模型大多基于自然圖像建立,缺少醫學的特別是放射腫瘤學相關影像專用的深度學習模型。醫學影像與自然圖像的不同之處在于,醫學影像是灰度圖像,而且一般具有連續性,在圖像分割中不僅要考慮一幅圖像中的區域結構,還需考慮 3D 數據的空間結構如何進行分割。另外,尚需考慮局部和全局先驗信息,才能夠進一步有助于正常器官和靶區的分割。
對于數據不足的情況,例如放療的執行階段,大多采用淺層神經網絡等傳統機器學習方法輔助放療,效果要優于常規臨床方法。在數據量較少的情況下,如果使用淺層學習方法能夠避免過擬合的發生。深度學習數據量需求較高,若使用遷移學習技術,在較大數據集進行預訓練,再使用醫學影像數據對模型做再訓練,同樣能夠避免過擬合,提高模型精度;或者采用一系列數據增強的方式,擴大數據集,也是數據量不足的解決方法之一。
未來,依托專病大數據平臺,將多模態放療數據,影像、基因等多組學數據,以及高年資放療醫師、物理師、技師的經驗數據進行集成,有望在療效、并發癥風險預測結果的引導下,提供個體化治療決策,使放療的全流程體現出一種對患者“量體裁衣”式的個體化定制,實現放療流程更高的自動化、智能化水平。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
放射治療(簡稱:放療)與手術、化療并稱為腫瘤治療的三大手段。放療技術發展迅速,已從傳統的二維(two dimensional,2D)常規放療發展到今天的三維(three dimensional,3D)數字化精確放療[1]。放療大體流程包括體位固定狀態下的圖像獲取、放療計劃設計和放療執行三個階段。在治療前、中、后各時期,借助電子計算機斷層掃描成像(computed tomography,CT)、核磁共振影像(magnetic resonance imaging,MRI)、正電子發射斷層影像(positron emission tomography,PET)、錐形束 CT(cone beam CT,CBCT)等多模態影像技術,可以對放療患者病情的發展及并發癥的風險進行預測,及時調整放療計劃。放療物理師則提供可靠的質量控制,對放療設備的運行狀況做持續監控和誤差分析,保證設備準確、穩定運行。每一例放療患者的療程持續 1~2 個月,在此過程中,大量醫學影像、輻射劑量、文本日志等數據被保存下來。若能充分利用機器學習技術對上述海量高維度多模態數據進行分析挖掘,則可以對腫瘤的放射治療提供更為個體化的治療決策和精確、穩定的治療技術。
機器學習作為人工智能領域的主要方法,分為有監督的學習、無監督的學習和強化學習,具體到放療領域,主要使用有監督的學習輔助放療[2]。神經網絡是機器學習的一種方式,受大腦工作方式的啟發,引用了神經元的連接結構。當神經網絡的隱含層較多時,就定義為深度神經網絡。深度學習方法即是使用深度神經網絡解決各種分類和預測問題,深度學習方法與傳統機器學習方法相比,優勢在于能夠自動學習數據中的特征,避免了人工的特征選擇。深度學習受到關注起始于 2012 年基于圖像數據集(ImageNet)的挑戰賽,其中唯一使用了深度學習的團隊,能夠將上屆比賽的錯誤分類率減半[3]。基本的深度學習方法也分為有監督學習和無監督學習,有監督學習的網絡主要包括卷積神經網絡(convolutional neural network,CNN)、循環神經網絡(recurrent neural network,RNN)、多層感知器(multi-layer perceptron,MLP)等,無監督學習的網絡包括自編碼器網絡(autoencoder,AE)、玻爾茲曼機網絡(Boltzmann machine,BM)、深度信念網絡(deep believe network,DBN)、受限玻爾茲曼機網絡(restricted Boltzmann machine,RBM)、生成式對抗網絡(generative adversarial networks,GAN)等。大量的數據積累以及硬件計算能力的提高,使深度學習方法越來越多地應用在醫療領域之中,并且表現出優于傳統機器學習方法的性能。
放療在整個流程中對于精準性具有越來越高的要求。現已證明機器學習方法在放射腫瘤學和放射學的診斷、治療規劃和結果預測方面具有一定的應用價值。同時,圖像引導放療中產生的大量數據,能夠支持各種機器學習方法訓練出高精確度的決策模型。深度學習方法的應用更有助于提高放療的執行效率、治療精確性和安全性。
1 機器學習方法輔助放療
以放療流程為線索,將深度學習作為重點,本文分以下 6 個部分介紹機器學習方法在放療中的應用。當前的研究主要集中于對正常組織和可見腫瘤靶區的自動勾畫,故本文將作重點介紹。
1.1 正常組織自動勾畫
放療計劃設計時,首先在 CT 或 MRI 圖像進行正常組織和腫瘤靶區的勾畫,對于靶區周圍的正常組織器官,不同器官有不同的耐受劑量,在一定程度上決定了放療處方劑量水平。精確迅速地分割正常組織,是實現放療計劃自動設計的第一步,分割結果直接影響放療計劃設計、評估的準確性。如表 1 所示,列出了近幾年深度學習方法在正常組織自動勾畫中的應用,并對分割方法和結果進行了比較。

有標簽數據的積累需要數名經驗豐富的醫師在圖像上做標記,但標簽數據不足時很難進行有監督的訓練,此時可采用無監督的方法實現有效分割。Dolz 等[4]使用手工提取特征,結合無監督的堆疊去噪自編碼器用于腦干分割,分類速度比基于支持向量機(support vector machine,SVM)方法快了約 70 倍,減少了分割時間。
有監督的深度學習網絡,特別是用于圖像處理的 CNN,已成為醫學影像分析的常用方法[5]。CNN 能夠處理多維多通道數據,捕獲輸入和輸出之間復雜的非線性映射[6],具有圖像處理和分類的優勢。Lu 等[6]使用 3D CNN 自動分割肝臟,結合圖割算法(graph cut)細化分割,優點在于不需要人工初始化,可由非專業人員執行分割過程。同樣使用 3D CNN 進行肝臟分割,Hu 等[7]將深度學習與全局和局部的形狀先驗信息結合,在相同數據集進行評價,各項誤差指標均有顯著下降。Hu 等[8]在后續研究中將目標擴展至腹部多器官分割,使用 3D CNN 執行像素到像素的密集預測,精度較高,分割用時較短。Ibragimov 等[9]進行了頭頸部多器官的自動勾畫,使用不同類別的像素塊對 CNN 進行訓練,發現在脊髓、下頜骨、喉部、咽、眼球和視神經的分割上表現較好,而腮腺、頜下腺和視神經交叉的分割上表現較差。
1.2 腫瘤靶區自動勾畫
與正常組織勾畫相同的是,機器學習方法輔助腫瘤靶區勾畫有助于提高執行效率,但不同之處更需要引起關注:腫瘤邊界通常不具有顯著的影像學特征,需要借助注射顯像強化造影劑、圖像后處理、多模態圖像融合等技術來輔助識別,并選擇腦腫瘤、早期周圍型肺癌、乳腺癌等邊界相對容易確定的腫瘤類型開展研究。對于如局部晚期肺癌、鼻咽癌、宮頸癌等需要勾畫淋巴結預防區域的腫瘤靶區,由于其勾畫過程需要結合臨床特征(如病理分期)進行個體化調整,故此類基于機器學習的自動勾畫技術尚未見報道。深度學習在腫瘤靶區勾畫的應用如表 2 所示。

Guo 等[10]使用無監督的堆疊稀疏自編碼器,針對前列腺癌的病例,基于圖譜(atlas)進行 MRI 圖像的前列腺分割,DSC 為 87.8%。該研究考慮了形狀先驗信息以提高分割精度,在網絡訓練階段多次迭代進行微調,防止過擬合。由于 MRI 成像的軟組織對比度較高,沒有電離輻射,因此廣泛應用于腦部腫瘤成像。Pereira 等[11]使用 CNN 對腦部腫瘤 MRI 圖像進行自動分割,提高了網絡精度,在 2013 年的多模態腦腫瘤分割挑戰(Multimodal Brain Tumor Image Segmentation Challenge,BraTS)中排名第一。Kamnitsas 等[12]提出了雙通道 3D CNN 網絡,用于腦損傷(包括:創傷性腦損傷、腦腫瘤、缺血性中風)的分割,首次在醫學數據上使用全連接的條件隨機場用于后處理。以上兩項研究都使用了小卷積核的神經網絡,使網絡結構更加深入,而不增加計算成本。
另外,基于 CT 的靶區分割更貼近絕大多數放療機構的臨床應用。Men 等[13]采用深度擴張卷積神經網絡(deep dilated convolutional neural networks,DDCNN)進行正常組織和直腸癌臨床靶區(clinical target volume,CTV)的勾畫,實現了像素級分割,平均 DSC 比 U 形網絡(U-Net)高 3.8%。Men 等[14]使用大數據訓練深度擴張殘差網絡(deep dilated residual network,DD-ResNet)進行乳腺腫瘤的分割,結果優于 DDCNN 和分布式神經網絡(distributed deep neural networks,DDNN),DSC 為 91%,高于專家手工描繪的結果(DSC 值 < 90%)[15]。Li 等[16]基于非小細胞肺癌患者的四維計算機斷層掃描(four dimensional CT,4DCT)數據,采用遷移學習方法自動描繪腫瘤區域,提高了準確性,縮短了網絡的再訓練時間,當呼吸幅度在 5~10 mm 時,匹配指數(matching index,MI)超過綜合彈性形變配準技術,平均提高 36.1%。
1.3 放療計劃設計
放療計劃設計是根據腫瘤靶區的目標劑量和正常組織的限值劑量,以患者的模擬定位影像為依據,設置射線的入射參數,包括射野角度、照射范圍和強度,是一個逐步調整、優化的過程,以保證腫瘤靶區達到處方劑量強度的同時盡量降低正常組織受照射劑量。機器學習輔助計劃設計主要是利用醫學影像所反映的解剖結構,在大量先驗知識的基礎上,實現照射角度、入射強度和劑量分布的自動優化。
在實際的調強放療(intensity modulated radiation therapy,IMRT)計劃設計中,照射野角度一般憑借物理師的經驗和試錯的方式尋找最佳分布。Dias 等[17]使用遺傳算法自動計算射野角度,將神經網絡作為代理模型計算遺傳算法中的個體適應度,與平均角度方法相比,靶區劑量有所提高而正常組織劑量較低。對于劑量計算,Shiraishi 等[18]指出,逆向放療計劃不能保證每個患者都有最佳的治療方案,計劃設計者主觀依賴性較強,計劃質量和標準程度得不到保障。此研究提出了一個基于知識的 3D 劑量預測方法,利用人工神經網絡(artificial neural network,ANN)對劑量分布做逐像素估計。Han[19]基于 MRI 圖像,使用深度卷積神經網絡(deep convolution neural network,DCNN)生成合成 CT(synthetic CT,sCT),用于劑量計算和放療定位,合成用時 9 s,而基于 atlas 的方法需 10 min,且前者的平均絕對誤差(mean absolute deviation,MAE)小于后者。Maspero 等[20]基于 MRI 圖像使用條件生成對抗網絡(conditional generative adversarial network,cGAN)合成 sCT,減少了用時,MAE 小于上述 DCNN 方法,劑量誤差約 0.1%~0.3%。此類方法對于目前國際上先進的 MRI 圖像模擬定位放療或者 MRI 圖像與加速器同機的放療,是一種高效、準確的解決方案。
基于知識的放療計劃(knowledge-based planning,KBP)是近幾年來放療計劃中的熱點工具,能夠利用已有的計劃和物理師的豐富經驗,估計獲得新病例的最優劑量體積直方圖。對于基于回歸的 KBP 模型,在不同的環境中,不同的回歸方法效果各異。Zhang 等[21]結合已有 4 種回歸模型的優點,提出了一種集成學習的方法,對小訓練集、錯誤標記的情況和低劑量的計劃具有更強的魯棒性。此方法的預測效果優于或類似于性能最佳的單個模型,無需手動篩選模型的類型,更加適用于臨床。Faught 等[22]將 KBP 模型首次應用于肺部的 4DCT 功能引導放療中,解決了此類放療中由于缺乏經驗和肺功能分布差異而產生的計劃困難,為肺部功能引導放療計劃提供了具體的劑量目標,保證了計劃質量的穩定性。
1.4 放療執行
放療執行中,由于呼吸和心跳等運動,會引起胸部和腹部的腫瘤位置周期性變化,導致放療精度降低。在放療過程中有必要掌握腫瘤運動規律、準確預測腫瘤位置,能夠為及時調整放療計劃提供重要依據。Schwaab 等[23]將基于超聲的運動跟蹤集成到重離子放療中,利用 ANN,對目標運動與位置數據之間約 200 ms 的延遲做了 2D 數據的補償,證明了超聲實時跟蹤腫瘤位置引導放療執行的思路是可行的。Bukovsky 等[24]比較了三種機器學習方法,在不同的訓練方法下開展對肺部腫瘤運動預測效果的研究,其中最佳算法是用改進的列文伯格—馬夸爾特法訓練的二次神經單元模型,在 1 s 預測水平下的 MAE 為 1 mm。
調強放療開始之前,需要對調強放療計劃進行在線驗證,篩除劑量通過率不符合臨床要求的計劃,稱為放療計劃的質量保證。多葉準直器(multi-leaf collimator,MLC)的計劃和實際運動之間的差異是放療劑量分布誤差的重要來源,Carlson 等[25]使用機器學習模型預測這些差異,結果表明對 MLC 的準確預測能夠提高伽馬通過率,預測的劑量分布更接近實際情況。為了自動預測放療計劃的伽馬通過率,在牛津大學視覺幾何小組(visual geometry group,VGG)發明的 16 層卷積神經網絡在 ImageNet 預訓練的模型基礎上,Interian 等[26]構建了深度神經網絡的預測模型,MAE 為 0.70,誤差小于領域內的專家模型。
1.5 放射物理質量控制
由于放療流程復雜,涉及到的部門和工作人員較多,患者的治療周期長[27]。在放療設備的維護、射線束校準、治療計劃和劑量計算、治療擺位和治療實施上若出現誤差,容易導致意外照射。因此必須加強放射物理質量控制,對放療設備進行嚴格監控。放療設備監控過程中大量數據的積累,也為機器學習的應用提供了資源。
Wu 等[28]為了改善放療中 2D/3D 圖像配準的魯棒性,開發了一種基于神經網絡的配準質量評估器,在識別患者定位的 2D/3D 圖像配準是否成功時表現良好。此外,日常質量保證中密切監控醫用直線加速器的性能,對于提高患者安全性和放療質量至關重要。Li 等[29]將 ANN 與自回歸滑動平均模型(autoregressive moving average,ARMA)的時間序列預測技術作對比,以共計 5 年的加速器日常質量控制(quality assurance,QA)數據作為檢測,結果表明,基于 ANN 的模型在劑量學對稱性曲線的時間序列預測方面具有更大優勢,均方誤差下降了 0.3 以上。加速器 QA 數據作為重要的日常記錄數據,其潛在信息的挖掘能夠及時預測運行誤差,有助于加速器的規范使用。
1.6 放療療效預測
放療執行完畢后,患者的生理變化、生存時間、放療并發癥等治療效果,往往在一段時間之后體現出來。其療效以及并發癥的預測,又會為放療過程的調整提供參考依據,進而提升療效。
Yahya 等[30]關注前列腺癌外照射放療引起尿路并發癥的預測技術,比較了邏輯回歸、彈性網絡、支持向量機、隨機森林、神經網絡和多元自適應回歸樣條(multivariate adaptive regression splines,MARS)幾種機器學習方法的預測效果,得到邏輯回歸和 MARS 是預測尿路癥狀的最佳方法。Zhen 等[31]為了預測宮頸癌放療引起的直腸并發癥,建立基于 CNN 的遷移學習模型,敏感性和特異性分別為 75% 和 83.3%,受試者工作特征(receiver operating characteristic,ROC)曲線下面積為 0.89,均優于邏輯回歸方法,這是將 CNN 的遷移學習應用于劑量分布分析的第一次嘗試。為了預測立體定向體放射治療中非小細胞肺癌患者的治療預后和生存率,Li 等[32]提出了一種無監督的機器學習方法,基于成像數據對患者分層并提取元特征,此方法魯棒性較高,在區分不同預后的患者和提取元特征方面具有很好的效果。
2 總結與展望
機器學習方法在放療領域的研究已經全面鋪開且取得了階段性成果,其中在正常組織和腫瘤靶區自動勾畫方向上的研究較多,而在執行、預后和 QA 階段的研究不足,且研究成果大多停留在理論階段,距投入臨床應用尚缺少大數據訓練模型和多中心數據的檢驗。
現有的深度學習模型大多基于自然圖像建立,缺少醫學的特別是放射腫瘤學相關影像專用的深度學習模型。醫學影像與自然圖像的不同之處在于,醫學影像是灰度圖像,而且一般具有連續性,在圖像分割中不僅要考慮一幅圖像中的區域結構,還需考慮 3D 數據的空間結構如何進行分割。另外,尚需考慮局部和全局先驗信息,才能夠進一步有助于正常器官和靶區的分割。
對于數據不足的情況,例如放療的執行階段,大多采用淺層神經網絡等傳統機器學習方法輔助放療,效果要優于常規臨床方法。在數據量較少的情況下,如果使用淺層學習方法能夠避免過擬合的發生。深度學習數據量需求較高,若使用遷移學習技術,在較大數據集進行預訓練,再使用醫學影像數據對模型做再訓練,同樣能夠避免過擬合,提高模型精度;或者采用一系列數據增強的方式,擴大數據集,也是數據量不足的解決方法之一。
未來,依托專病大數據平臺,將多模態放療數據,影像、基因等多組學數據,以及高年資放療醫師、物理師、技師的經驗數據進行集成,有望在療效、并發癥風險預測結果的引導下,提供個體化治療決策,使放療的全流程體現出一種對患者“量體裁衣”式的個體化定制,實現放療流程更高的自動化、智能化水平。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。