人工智能技術目前發展迅速,近年來研究人員將其應用在泌尿系統各類腫瘤診斷中,并獲得了很多有價值的研究成果。本文從論文數量、圖像數據、臨床任務三個方面對近年人工智能技術在腎臟腫瘤、膀胱腫瘤、前列腺腫瘤等領域的研究狀況進行了整理,旨在總結和分析研究現狀,發現有價值的研究思路。結果顯示,基于數字影像、病理圖像等醫學數據建立的人工智能模型,完成泌尿系統腫瘤的基本診斷、腫瘤浸潤區域或特定器官的影像分割、基因突變預測和預后效果預測等醫學應用的效果良好,但大多數模型在臨床應用的要求方面仍有改進空間。一方面,需要進一步提高核心算法的檢測、分類、分割等效能;另一方面,需要整合更多標準化的醫學數據庫,才能有效提高人工智能模型的診斷精度,使之發揮更大的臨床價值。
引用本文: 劉琨, 張明洋, 李浩然, 王向輝, 李冬明, 劉爽, 楊昆, 孫振鐸, 薛林雁, 崔振宇. 人工智能技術在泌尿系統腫瘤診斷中的研究現狀及展望. 生物醫學工程學雜志, 2021, 38(6): 1219-1228. doi: 10.7507/1001-5515.202103010 復制
引言
泌尿系統腫瘤指發生于泌尿系統任意部位的腫瘤,是影響人們健康的惡性疾病之一。常見的泌尿系統腫瘤類型包括腎細胞癌、腎盂癌、膀胱癌、前列腺癌、輸尿管癌等。2020年全球癌癥報告顯示,各類泌尿系統腫瘤在2020年的發病人數和占癌癥總人數的比例分別為:腎細胞癌和腎盂癌431 288人,2.2%;膀胱癌573 278人,3.0%;前列腺癌1 414 259人,7.3%。泌尿系統腫瘤在全球范圍內的總發病人數約占癌癥總人數的13%,且發病人數還在逐年上升[1-2],所以對泌尿系統腫瘤開展相關診療技術研究具有重要的臨床價值。
腫瘤信息的精準診斷對患者的生命健康具有重要意義,目前泌尿系統腫瘤診斷手段以病理檢查、影像學檢查和內窺鏡檢查為主。病理檢查能夠觀察到細胞和組織的形態結構變化,是診斷腫瘤良惡性、分型、分級、侵襲范圍等的“金標準”,其缺點主要是操作時間長、病理切片制作復雜、腫瘤內部存在異質性等。泌尿系統腫瘤的影像學檢查手段包括電子計算機斷層掃描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)、超聲成像、靜脈尿路造影等,是無創和快速檢查泌尿系統腫瘤的重要途徑,其缺點是較難明確病變性質,診斷結果也會受到腫瘤成像質量及醫師臨床經驗的影響。內窺鏡檢查能夠確定腫瘤部位,直接觀察到腫瘤形態,但該方法可能對患者臟器造成損害。可見,主流的泌尿系統腫瘤的診斷準確性受限于腫瘤內部的異質性、腫瘤成像效果和醫師的主觀經驗等因素,容易出現看不清、診不準、醫生工作壓力繁重等問題,嚴重消耗了社會醫療資源。
綜上,目前泌尿系統腫瘤的診斷主要依賴于醫學影像、病理切片和內窺鏡圖像等數據,而人工智能技術能夠從腫瘤圖像中挖掘多種肉眼難以識別的特征以輔助醫療診斷,有助于解決由于腫瘤成像質量差和醫生經驗不足帶來的診斷不準確的問題,能夠為醫生提供準確的病理信息。國內外眾多研究人員已將該技術廣泛應用于泌尿系腫瘤的診斷研究[3],因此,本文對主流的人工智能技術進行分類闡述,并對人工智能技術在腎臟腫瘤、膀胱腫瘤和前列腺腫瘤的研究進展情況進行了整理、總結和分析,最后探討了后續工作中可能采取的研究思路。
1 人工智能技術概述
人工智能是建立在計算機科學基礎上的一門技術學科,主要是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統等領域[4],包括機器學習、計算機視覺、自然語言處理、語音識別、專家系統、推薦系統、進化計算等細分領域,如圖1所示。

機器學習是人工智能領域的技術分支,機器學習技術能夠通過某些算法指導計算機利用已知數據得出適當的模型,并利用此模型對新的情況做出判斷。機器學習通常分為無監督學習、有監督學習和半監督學習。無監督學習是在未標記數據中查找模式[5],而有監督學習使用標簽來推斷分類或歸納,半監督學習通常用少量標記的數據和大量未標記的數據進行分類或歸納[6]。具有代表性的機器學習算法包括:支持向量機(support vector machine,SVM)、邏輯回歸、隨機森林、決策樹等[7],如圖1所示。
深度學習是Hinton在2006年提出的在非監督數據特征上建立多層神經網絡的方法,是機器學習技術中發展出的一個技術分支[8]。它能夠自動學習數據中的各類特征,避免了人工特征選擇[9],主要包括用于數據增強的生成對抗網絡(generative adversarial network,GAN)、用于文本分析及自然語言處理的循環神經網絡(recurrent neural network,RNN)、遞歸神經網絡(recursive neural network,R-NN)和用于圖像處理的卷積神經網絡(convolutional neural network,CNN)等。CNN中主流的圖像分類網絡有Alexnet、Resnet等,目標檢測網絡有YOLO、Faster R-CNN等,U-net、Mask R-CNN等則是具有代表性的語義分割網絡,如圖1所示。
臨床中,醫生需要通過醫學圖像來完成的許多任務,理論上都可以由人工智能來完成,諸如病灶檢測、疾病分類、診斷和分期、定量化、治療計劃(靶區和有風險器官的勾畫、劑量優化)、治療的反應和預后的評估[10]。這些任務對應于人工智能技術在醫學圖像領域的任務就包括了圖像分類、目標檢測和語義分割等[11]。圖像分類任務的目的是判斷圖像中腫瘤的良惡性、分型、分級、分期等,目標檢測任務的目的是定位圖像上腫瘤的類別信息和所在位置,語義分割任務則是在圖像上勾畫出腫瘤或器官的輪廓。在醫學圖像方面,傳統的機器學習流程和深度學習流程如圖2所示。

人工智能技術在醫學圖像應用的評價指標主要包括:準確性、特異性、敏感性、Dice系數、Jaccard系數、受試者工作特征曲線(receiver operating characteristic curve,ROC)、受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)等[12-13]。敏感性表示在陽性人群中,檢測出陽性的概率;特異性表示在陰性人群中,檢測出陰性的概率;Dice系數和Jaccard系數通常用于計算兩個樣本的相似度,它們的取值范圍是0~1之間,越接近1說明模型效果越好;ROC曲線越靠近左上角,越有診斷價值,ROC曲線下面積越大,越有應用價值;AUC是判斷分類模型優劣的標準,表示預測結果中正例排在負例前面的概率,0.5 < AUC < 1時,表明該模型有預測價值,且AUC越接近于1,模型性能越好。人工智能技術有望使各項任務在更短的時間內以更高的準確性和更低的錯誤率得以完成,也就是使上述評價指標更優。
2 人工智能在泌尿系統腫瘤診斷中的應用研究
2.1 在腎臟腫瘤中的應用研究
人工智能技術在腎臟腫瘤診斷方面的應用研究主要集中在腫瘤良惡性鑒別、組織病理分型、組織病理分級和腫瘤影像分割四個方面。
臨床上腎臟腫瘤的良惡性是影響患者生存和治療最重要的預后因素。一些研究工作基于人工智能技術,通過CT、MRI等數據無創地進行腎臟腫瘤良惡性鑒別[14-17]。Cui等[14]通過從171例透明細胞腎細胞癌(clear cell renal cell carcinoma,ccRCC)、乳頭狀腎細胞癌(papillary renal cell carcinoma,pRCC)、嫌色腎細胞癌(chromophobe renal cell carcinoma,chRCC)以及乏脂肪血管平滑肌脂肪瘤(angiomyolipoma without visible fat,AMLwvf)患者的CT圖像中提取腫瘤紋理特征,采用基于五倍交叉驗證的遞歸式特征消除方法建立了多個SVM模型,這些模型在平掃CT數據集上鑒別AMLwvf和腎細胞癌的準確率均在85%以上,AUC在0.88以上,高于在皮髓質期和實質期CT數據集上的準確性。Yang等[15]基于平掃CT建立的“SVM + t_score”分類器鑒別AMLwvf和腎細胞癌實現了82%的準確率和0.9的AUC,同樣優于皮髓質期80%、實質期81%和排泄期77%的準確性。以上兩個研究團隊均采用SVM技術構建分類模型,鑒別良性的AMLwvf和惡性的腎細胞癌,在平掃CT上的準確率和AUC均高于增強CT。Zhou等[16]利用深度學習技術中的遷移學習方法,先以ImageNet數據集預訓練得到Inception V3模型,后在CT圖像上進行遷移學習,實現腎腫瘤良惡性鑒別。在感興趣區域數據集上的準確度為97%,優于矩形框數據集和全切片數據集上的測試效果。Xi等[17]利用超過1 000例患者的臨床數據、T1對比增強和T2加權MRI,通過引導聚合(bootstrap aggregation,bagging)算法建立了由一個邏輯回歸模型和兩個Resnet模型組成的集成模型,達到了70%的準確性和0.92的敏感性。由目前的研究可知,人工智能技術與CT影像結合鑒別腎臟腫瘤良惡性的效果要優于其與MRI結合,利用平掃CT鑒別的效果要優于增強CT,深度學習技術與CT結合的鑒別效果要優于SVM技術與CT結合。
腎細胞癌的病理類型包括ccRCC、pRCC、chRCC、集合管癌和未分化癌,不同腎細胞癌亞型的預后不同,相應治療方法也不同[18],目前研究工作大多基于CT數據,通過人工智能技術進行無創腎臟腫瘤病理分型[19-21]。Kocak等[19]采用ccRCC、pRCC、chRCC患者的CT影像數據建立機器學習模型,其中帶有自適應增強算法的多層感知器(multi layer perceptron,MLP)在皮髓質期CT數據集上鑒別ccRCC和非ccRCC的準確性、特異性分別為84.6%和100%,帶有bagging算法的SVM模型在皮髓質期CT數據集上鑒別ccRCC、pRCC、chRCC的準確性和特異性分別為69.2%和100%,均優于在平掃期CT數據集上的鑒別效果。Zhang等[20]通過從皮髓質期CT中提取特征構建SVM模型,鑒別是否為ccRCC的準確性為88%,優于平掃期80%的準確性和實質期87%的準確性,鑒別pRCC和chRCC的準確性為78%,優于平掃期59%的準確性和實質期70%的準確性。Li等[21]基于隨機森林算法從患者的三維(three-dimensional,3D)增強CT提取腫瘤特征構建模型,在CT皮髓質期圖像上鑒別ccRCC同樣取得了比實質期圖像更好的效果。上述研究顯示,皮髓質期的CT腫瘤特征更有助于腎細胞癌分型,并且人工智能技術鑒別ccRCC的準確性較高,而鑒別pRCC和chRCC的準確率相對較低。
ccRCC分級主要就是指ccRCC的組織病理學分級,常用的有Fuhrman分級和ISUP分級,ccRCC分級與患者預后密切相關,級別越高,腫瘤惡性程度越高,預后越差[22],因此,術前對ccRCC進行分級是制定腫瘤治療策略或手術方案的關鍵。目前,基于CT影像的人工智能技術在ccRCC分級研究中已有較多的文獻報道[23-26]。Ding等[23]基于邏輯回歸分析建立模型,發現基于增強CT皮髓質期和實質期圖像的紋理分析可以較好地鑒別不同Fuhrman分級的ccRCC,AUC為0.78,而非紋理特征的鑒別效果略差。Bektas等[24]基于10倍內外嵌套式交叉循環驗證方法進行特征選擇和模型優化,評估了不同機器學習模型通過增強CT紋理分析識別ccRCC分級的性能,最優模型SVM實現了85.1%的準確率和91.3%的靈敏度。以上兩個團隊均基于增強CT進行ccRCC的分級研究。Kocak等[25]基于平掃CT紋理特征開發了MLP模型,在預測ccRCC的Fuhrman分級上實現81.5%的準確率和0.714的AUC。除了這些傳統的機器學習技術,近年來深度學習技術在預測ccRCC分級上的潛力也初見端倪。Lin等[26]首次利用深度學習技術建立殘差網絡預測ccRCC的ISUP分級,發現遷移學習的使用、無注意力水平的設置、包含更少背景信息的圖像以及更簡單模型Resnet18的開發都有助于提高分級預測的準確性,最佳模型的準確率為77.9%,AUC為0.81。上述研究顯示,基于人工智能技術開發的預測模型均能實現較好的分級結果,并且增強CT紋理特征對不同ccRCC分級的鑒別價值要優于平掃CT。
在CT圖像上精確地分割出腫瘤邊界對腎部分切除術具有重要的指導價值,且有研究指出,腫瘤邊緣分割出現細微誤差也會對基于機器學習的CT紋理分析實驗結果產生影響[27],因此,研發一種可靠的、高精度的腎臟腫瘤影像自動分割算法尤為重要。Linguraru等[28]先通過區域生長算法進行腫瘤影像的初步分割,然后采用測地線動態輪廓對分割結果進行細化,與專家手工分割相比,取得了重復性為0.8和相關性為0.98的結果。但Linguraru的研究是通過提取一些低水平視覺特征分割腫瘤影像,無法保證在腫瘤的形狀和質地接近周圍組織時的分割性能。為了進一步提升網絡性能,Yu等[29]構建了一種新型卷積神經網絡Crossbar-Net,從水平和垂直兩個方向獲取腫瘤外觀信息,以實現腫瘤影像分割,在3 500張CT集上Dice系數達到了0.913,并且在心臟和乳腺腫塊的分割實驗中證實了Crossbar-Net模型穩定的分割能力。He等[30]提出了一個新的元學習框架,通過灰度興趣搜索和元灰度自適應學習分割3D腎結構,平均Dice系數高達0.879,這是首次在CT血管造影圖像上同時分割出了腎、腎腫瘤、動脈和靜脈的研究,有助于開發更加精準的3D綜合腎結構視覺模型。以上研究顯示,與區域生長分割算法相比,基于深度學習技術的分割算法在CT影像上表現得更加出色。
另外,有關研究表明人工智能技術可根據腫瘤CT影像學特征預測ccRCC患者的PBRM1和BAP1基因突變[31-32],這兩種基因的突變狀態與患者預后有關,這些研究在一定程度上揭示了影像學特征的分子基礎,未來可以利用人工智能技術進一步探討影像學和基因組學的相關性,比如腫瘤影像特征與其他腎細胞癌有關基因的關系,從而開創基因檢測的新途徑,降低患者基因檢測費用。
2.2 在膀胱腫瘤中的應用研究
人工智能技術在膀胱腫瘤診斷方面的應用研究主要集中在膀胱癌檢測、組織病理分期、患者預后和識別腫瘤分子亞型四個方面。
檢測膀胱腫瘤通常采用膀胱鏡檢查,一些研究工作者在膀胱鏡圖像上利用人工智能技術檢測膀胱腫瘤[33-35]。Eminaga等[33]基于18 681張正常和癌變的膀胱鏡圖片開發了五種不同的CNN模型,所有模型都可以很好地識別膀胱鏡中的膀胱癌,準確度都在99%以上。Lorencin等[34]提出了一種基于MLP和拉普拉斯邊緣檢測器結合的膀胱癌診斷方法,膀胱鏡圖片先經拉普拉斯邊緣檢測器預處理,然后在MLP上訓練并測試,AUC值達到0.99,且MLP算法比CNN算法更加輕量化。文獻[34-35]基于靜態膀胱鏡圖像的研究均實現了較好的檢測效果。Shkolyar等[35]的工作集中在人工智能技術輔助膀胱鏡的臨床應用,利用141個膀胱鏡視頻開發了一個基于CNN的膀胱腫瘤自動實時檢測平臺CystoNet,每幀敏感度為90.9%,每個腫瘤的敏感性為95.5%。該研究使集成人工智能技術于膀胱鏡中實時檢測膀胱腫瘤成為可能,有望提高檢測準確性和腫瘤切除的徹底性。另外,Sokolov等[36]提出的使用原子力顯微鏡對尿液中的細胞進行成像,然后使用機器學習技術對圖像進行分析的方法,檢測膀胱癌的準確率達到了94%,AUC為0.92。以上研究顯示,基于膀胱鏡和原子力顯微鏡成像的人工智能技術能夠檢測膀胱腫瘤,其中基于膀胱鏡視頻的實時檢測技術的臨床實用性強,與之相比,基于原子力顯微鏡成像的檢測技術能夠避免膀胱鏡檢查帶來的疼痛感。
膀胱癌分期是最有價值的預后因素,準確的膀胱癌分期對患者治療方案的選擇至關重要,目前在CT和MRI上利用人工智能技術預測膀胱癌分期的研究已經取得一些成果[37-38]。Garapati等[37]通過機器學習算法提取76例膀胱癌患者的三維腫瘤CT尿路造影圖像的形態和紋理特征,開發了線性判別分析、神經網絡、隨機森林和SVM四種不同的膀胱癌T1-T4分期預測模型,四種模型的AUC均在0.88以上。膀胱腫瘤與膀胱壁組織的鑒別是判斷膀胱腫瘤浸潤深度和腫瘤T分期的關鍵,Xu等[38]基于遞歸式特征消除的方法構建了SVM分類器,鑒別膀胱癌與膀胱壁組織的準確率為88.7%,還發現基于MRI的3D紋理分析在鑒別任務中要顯著優于2D紋理分析。以上研究顯示,基于三維CT或MRI的人工智能模型能較好地預測膀胱癌T分期,并且與傳統的組織病理學診斷膀胱癌分期相比,人工智能技術診斷具有無創、安全、舒適等優點。
TNM分期系統對制定治療方案和評價預后有指導作用。一些研究表明在預測膀胱癌患者預后方面,人工智能技術比TNM分期系統更有優勢[39-40]。Chen等[39]通過收集406張膀胱癌病理圖像和臨床病理數據,基于機器學習算法構建了一種綜合列線圖來評估患者生存周期,模型對膀胱癌患者1年、3年和5年的生存預測的AUC值分別為77.7%、83.8%和81.3%,顯示出比TNM系統更高的預測準確率。Brieu等[40]發現肌肉浸潤性膀胱癌出芽與生存評估之間存在很強的相關性,其通過開發決策樹模型對免疫熒光標記的病理圖像中的腫瘤芽進行量化分析,發現這種方法能提供比TNM分期系統更好的預后價值。上述研究顯示,基于病理圖像建立的人工智能模型可以為膀胱癌患者的預后提供可靠的依據。
肌肉浸潤性膀胱癌的綜合分子圖譜已經確定了不同的分子亞型,有研究表明不同亞型的患者的預后不同[41],對不同化療方案的反應率也不同。Woerl等[42]改進了Resnet算法,利用蘇木精伊紅染色的病理圖像開發了一個mibCNN模型,來預測肌肉浸潤性膀胱癌不同的分子亞型,AUC接近0.9,并且通過類激活映射觀察模型對圖像的關注區域,識別出了與幾種亞型最相關的病理圖像特征。該研究還有助于更好地理解和分析神經網絡的工作原理及決策過程,可以為肌肉浸潤性膀胱癌患者提供針對性的治療方案,對患者后期生存意義重大。
2.3 在前列腺腫瘤的應用研究
人工智能技術在前列腺腫瘤診斷方面的應用研究主要集中在前列腺癌檢測、Gleason分級、前列腺影像分割三個方面。
MRI檢查是檢出前列腺癌的主要手段,目前研究工作多基于人工智能技術,通過多參數、雙參數和T2加權MRI等影像數據檢測前列腺癌[43-45]。Takeuchi等[43]使用多參數MRI數據集評估兩種機器學習模型對前列腺癌的檢出率,發現多層人工神經網絡模型能夠更好地檢測出前列腺癌,比邏輯回歸模型高出5%~10%的準確率。Vente等[44]采用包括T2加權像和彌散加權成像的雙參數MRI建立了多任務U-net模型,可同時檢測和分級前列腺癌,診斷效果優異。Ishioka等[45]僅利用患者的T2加權MRI數據開發了一個前列腺癌全自動檢測系統,該系統結合U-net和Resnet50算法,取得了0.793的AUC。以上研究表明,人工智能技術可以很好地應用于多參數MRI、雙參數MRI、T2加權MRI上以檢測前列腺癌,減少因MRI不清晰導致的漏診問題。
Gleason分級一直是前列腺癌患者最有力的預后預測指標。有關研究工作已經證明人工智能技術能夠與病理切片結合以預測前列腺癌Gleason分級[46-49]。Kott等[46]利用深度學習技術從85張前列腺癌活檢病理圖像中提取腫瘤特征建立Resnet模型,以區分良性和Gleason 3、4、5分級的腫瘤,取得了準確度85.4%、敏感性0.83和特異性0.94的結果,誤分率在病理學家觀察者間的差異范圍15%~30%內[47]。Nir等[48]通過比較幾種交叉驗證方法來評估基于CNN的前列腺癌自動分級模型的性能,發現基于切片小塊的20倍交叉驗證法在區分Gleason 3級和Gleason 4、5級時性能最優,平均準確性為92.2%,敏感性為93.8%,特異性為90.8%,模型與病理醫生在評分方面的總體一致性為0.6。Bulten等[49]利用患者活檢病理圖像建立的U-net深度學習系統,預測不同Gleason 分級的準確性達到了90%以上,超過了15位病理學家中的10位。以上結果表明,在預測前列腺癌Gleason分級方面,人工智能技術具有和病理學家相當的診斷能力。
臨床上,前列腺組織保留手術要求精確區分前列腺邊界,以限制對鄰近器官組織的損害,而人工智能技術能夠完成圖像中信息的邊界分割。一些研究者基于MRI、CT、經直腸超聲(transrectal of ultrasound,TRUS)等影像數據,利用深度學習技術對前列腺影像進行精準邊界分割[50-52]。Yan等[50]構建了一種可以通過合并多層次特征的最優組合來分割前列腺MRI的傳播深度神經網絡模型。該模型Dice系數達到了0.84,比基于隨機森林等其他傳統機器學習的分割算法的Dice系數平均提高了3.19%。Liu等[51]改進U-net網絡模型,將每個上采樣層的特征添加到相同數量的卷積層的特征中,形成合并層,在140張前列腺癌CT測試集上生成的輪廓與醫生勾勒的輪廓具有很高的一致性,Dice系數達到了0.88。但以上兩種算法的研究都是基于前列腺MRI、CT圖像的靜態分割。van Sloun等[52]開發的帶有監督自適應算法的U-net網絡模型能夠以98%的精度自動實時分割前列腺TRUS圖像,Jaccard系數達到0.93,每張圖片的分割時間為0.012 9 s,并且該模型在分割不同掃描儀下的前列腺TRUS圖像時,仍能保持高性能,穩定性強。以上研究表明,利用人工智能技術開發的神經網絡模型能夠在前列腺CT、MRI、TRUS圖像上準確地分割出前列腺,其中基于前列腺TRUS圖像的自動實時分割技術效果最好,可促進實時TRUS成像的活檢針引導,提高臨床分割效率和精度,減少對周圍組織的損傷。
3 結果與分析
通過回顧整理近年來人工智能技術在泌尿系統腫瘤診斷方面的已有研究成果,我們從論文數量、圖像數據、臨床任務三個方面對這些研究成果進行了分析和總結。
圖3是研究者報道采用人工智能技術處理各類醫學圖像數據來研究泌尿系統三種腫瘤的文獻數量(截止2021年6月30日)。由圖3可知,人工智能技術在泌尿系統腫瘤中的研究主要在腎臟腫瘤、膀胱腫瘤、前列腺腫瘤三個方面,其中研究腎臟腫瘤的有17篇,研究膀胱腫瘤和前列腺腫瘤的各9篇。此外,還存在數量較少的對輸尿管口檢測定位的研究文獻[53-54],而對輸尿管腫瘤、尿道腫瘤等其他泌尿系腫瘤的研究尚不存在,可見研究人員的關注度是與泌尿系統腫瘤在全球的發病率基本一致的[1]。

在圖像數據方面,針對泌尿系腫瘤的研究主要依賴于CT、MRI、TRUS、病理圖像、內窺鏡圖像以及原子力顯微成像等六種數據類型。腎臟腫瘤的人工智能領域交叉研究以CT影像數據為主,較少的研究采用了MRI數據,除此之外未見其他幾類醫學圖像數據納入相關研究。膀胱腫瘤與前列腺腫瘤的研究數據來源較為豐富,但也具有各自的傾向性:膀胱腫瘤主要基于病理圖像和內窺鏡圖像;前列腺腫瘤主要基于MRI和病理圖像數據。還有研究指出,基于不同參數的MRI對前列腺癌檢測效果不同[55],因此利用人工智能技術討論T2加權、雙參數、多參數MRI對前列腺癌檢測效果的關系或具有一定價值。此外,基于原子力顯微鏡輕敲模式成像的方法目前較少見于報道,其優點是圖像分辨率高,不會對細胞造成損傷[56],因此該方法有待研究者在泌尿系腫瘤診斷中大膽嘗試。
在臨床任務方面,人工智能模型主要用于腫瘤自動精準診斷[14-17,19-21,23-26,33-38,43-49]、腫瘤浸潤區域或特定器官的影像分割[27-30,50-52]、基因突變預測[31-32]和預后效果預測[39-40]等具體醫學應用。
腫瘤自動診斷在圖像處理的技術層面包括檢測問題和分類問題,分類可以實現腫瘤良惡性鑒別、腫瘤分型、腫瘤分級和腫瘤分期。全部文獻中,各網絡模型在相應分類任務中的準確率對比結果如圖4所示。

傳統機器學習模型平均分類準確率為(82.71 ± 5.78)%,總的來看,傳統機器學習模型性能較為穩定。這些模型中以SVM技術建模為主,SVM模型的平均分類準確率為(83.38 ± 6.72)%,整體而言,SVM模型性能在機器學習模型中處于優異水平,且采用遞歸式特征消除和交叉驗證建立SVM模型的方法,相比于其他方法分類準確率更高。傳統機器學習的主要分類任務分別以組織病理分型為主,44%的機器學習分類模型用來做分型任務,分型任務模型的平均準確率為(79.95 ± 7.17)%,全部文獻中,腎細胞癌分型的研究方案以ccRCC、pRCC、chRCC三種類型為主[19-21],其他腎細胞癌亞型的研究文獻較少。
深度學習模型平均分類準確率為(84.06 ± 9.38)%,可見,深度學習模型在分類任務上的平均性能優于傳統機器學習模型,但不同深度學習模型間的分類準確性差異較大。其中基于遷移學習技術預訓練得到Inception V3模型在腫瘤的良惡性鑒別中的準確率達97.0%[16],Resnet模型鑒別腫瘤良惡性和分級的準確率相對較低[17,26,46],可能是數據量較少導致的過擬合。深度學習的主要分類任務以分級為主,60%的深度學習分類模型用來做分級任務,分級任務模型的平均準確率為(84.43 ± 4.99)%。文獻[23-25]建立了ccRCC分級模型,均采用了Fuhrman分級系統,實際上臨床醫生已經廣泛采用新提出的ISUP分級系統,其分級結果更利于指導臨床治療方案。
腫瘤浸潤區域或特定器官的影像分割在圖像處理的技術層面屬于語義分割任務,全部文獻中,各網絡模型完成分割任務的Dice系數如圖5所示。由圖5可知,Crossbar-Net模型[29]分割腎臟腫瘤影像的Dice系數最高,達0.913。另一個具備較高分割性能與穩定性的網絡模型是帶有監督自適應算法的U-net模型[52],達到了0.93的Jaccard系數,分割時間快,可自動實時分割不同掃描儀下的前列腺TRUS圖像,未來可嘗試將這兩種網絡模型及相關技術應用于其他疾病腫瘤的影像分割任務。就本文整理的文獻而言,傳統機器學習模型Dice系數的均值為0.815±0.019,深度學習模型Dice系數的均值為0.878±0.026,可見,利用深度學習技術分割腫瘤或器官影像取得的精度普遍高于傳統的機器學習技術取得的精度。

在基因分子層面,文獻[31-32,42]中利用人工智能技術預測腎細胞癌基因突變狀態以及膀胱癌分子類型的可行性已得到證實。有研究表明VHL基因突變會導致ccRCC的發生[32],E2F3基因數量越多,膀胱癌患者預后越差[57]。研究者今后可進行更多基因分子層面的研究,如針對VHL基因、E2F3基因的研究,從而實現基因的無創檢測。
4 結論與展望
通過整理該領域文獻可知人工智能技術在泌尿外科得到了廣泛關注并發揮著重要作用。人工智能模型能夠用于腫瘤自動精準診斷、腫瘤浸潤區域或特定器官的影像分割、基因突變預測和預后效果預測等具體醫學應用,人工智能技術可以提高相關疾病的診斷效率,為患者提供個性化的精準治療方案。但在總體上,人工智能模型的診斷精度還存在比較大的優化空間,且人工智能模型的建立依賴大量經過專業人員標注的醫學數據,這些醫學數據資源不足是人工智能技術在泌尿系腫瘤診斷應用中的最主要障礙。為此,研究者一方面應不斷開發諸如元學習算法、注意力機制模塊等新的核心算法,進一步提高人工智能模型的診斷精度。另一方面,需要加強機構間的數據整合,建設更多標準化的醫學數據庫,以解決數據相對不足問題。隨著技術的進步和研究的深入,人工智能技術將對于泌尿外科相關疾病的診療過程發揮更大的作用。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
泌尿系統腫瘤指發生于泌尿系統任意部位的腫瘤,是影響人們健康的惡性疾病之一。常見的泌尿系統腫瘤類型包括腎細胞癌、腎盂癌、膀胱癌、前列腺癌、輸尿管癌等。2020年全球癌癥報告顯示,各類泌尿系統腫瘤在2020年的發病人數和占癌癥總人數的比例分別為:腎細胞癌和腎盂癌431 288人,2.2%;膀胱癌573 278人,3.0%;前列腺癌1 414 259人,7.3%。泌尿系統腫瘤在全球范圍內的總發病人數約占癌癥總人數的13%,且發病人數還在逐年上升[1-2],所以對泌尿系統腫瘤開展相關診療技術研究具有重要的臨床價值。
腫瘤信息的精準診斷對患者的生命健康具有重要意義,目前泌尿系統腫瘤診斷手段以病理檢查、影像學檢查和內窺鏡檢查為主。病理檢查能夠觀察到細胞和組織的形態結構變化,是診斷腫瘤良惡性、分型、分級、侵襲范圍等的“金標準”,其缺點主要是操作時間長、病理切片制作復雜、腫瘤內部存在異質性等。泌尿系統腫瘤的影像學檢查手段包括電子計算機斷層掃描(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)、超聲成像、靜脈尿路造影等,是無創和快速檢查泌尿系統腫瘤的重要途徑,其缺點是較難明確病變性質,診斷結果也會受到腫瘤成像質量及醫師臨床經驗的影響。內窺鏡檢查能夠確定腫瘤部位,直接觀察到腫瘤形態,但該方法可能對患者臟器造成損害。可見,主流的泌尿系統腫瘤的診斷準確性受限于腫瘤內部的異質性、腫瘤成像效果和醫師的主觀經驗等因素,容易出現看不清、診不準、醫生工作壓力繁重等問題,嚴重消耗了社會醫療資源。
綜上,目前泌尿系統腫瘤的診斷主要依賴于醫學影像、病理切片和內窺鏡圖像等數據,而人工智能技術能夠從腫瘤圖像中挖掘多種肉眼難以識別的特征以輔助醫療診斷,有助于解決由于腫瘤成像質量差和醫生經驗不足帶來的診斷不準確的問題,能夠為醫生提供準確的病理信息。國內外眾多研究人員已將該技術廣泛應用于泌尿系腫瘤的診斷研究[3],因此,本文對主流的人工智能技術進行分類闡述,并對人工智能技術在腎臟腫瘤、膀胱腫瘤和前列腺腫瘤的研究進展情況進行了整理、總結和分析,最后探討了后續工作中可能采取的研究思路。
1 人工智能技術概述
人工智能是建立在計算機科學基礎上的一門技術學科,主要是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統等領域[4],包括機器學習、計算機視覺、自然語言處理、語音識別、專家系統、推薦系統、進化計算等細分領域,如圖1所示。

機器學習是人工智能領域的技術分支,機器學習技術能夠通過某些算法指導計算機利用已知數據得出適當的模型,并利用此模型對新的情況做出判斷。機器學習通常分為無監督學習、有監督學習和半監督學習。無監督學習是在未標記數據中查找模式[5],而有監督學習使用標簽來推斷分類或歸納,半監督學習通常用少量標記的數據和大量未標記的數據進行分類或歸納[6]。具有代表性的機器學習算法包括:支持向量機(support vector machine,SVM)、邏輯回歸、隨機森林、決策樹等[7],如圖1所示。
深度學習是Hinton在2006年提出的在非監督數據特征上建立多層神經網絡的方法,是機器學習技術中發展出的一個技術分支[8]。它能夠自動學習數據中的各類特征,避免了人工特征選擇[9],主要包括用于數據增強的生成對抗網絡(generative adversarial network,GAN)、用于文本分析及自然語言處理的循環神經網絡(recurrent neural network,RNN)、遞歸神經網絡(recursive neural network,R-NN)和用于圖像處理的卷積神經網絡(convolutional neural network,CNN)等。CNN中主流的圖像分類網絡有Alexnet、Resnet等,目標檢測網絡有YOLO、Faster R-CNN等,U-net、Mask R-CNN等則是具有代表性的語義分割網絡,如圖1所示。
臨床中,醫生需要通過醫學圖像來完成的許多任務,理論上都可以由人工智能來完成,諸如病灶檢測、疾病分類、診斷和分期、定量化、治療計劃(靶區和有風險器官的勾畫、劑量優化)、治療的反應和預后的評估[10]。這些任務對應于人工智能技術在醫學圖像領域的任務就包括了圖像分類、目標檢測和語義分割等[11]。圖像分類任務的目的是判斷圖像中腫瘤的良惡性、分型、分級、分期等,目標檢測任務的目的是定位圖像上腫瘤的類別信息和所在位置,語義分割任務則是在圖像上勾畫出腫瘤或器官的輪廓。在醫學圖像方面,傳統的機器學習流程和深度學習流程如圖2所示。

人工智能技術在醫學圖像應用的評價指標主要包括:準確性、特異性、敏感性、Dice系數、Jaccard系數、受試者工作特征曲線(receiver operating characteristic curve,ROC)、受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)等[12-13]。敏感性表示在陽性人群中,檢測出陽性的概率;特異性表示在陰性人群中,檢測出陰性的概率;Dice系數和Jaccard系數通常用于計算兩個樣本的相似度,它們的取值范圍是0~1之間,越接近1說明模型效果越好;ROC曲線越靠近左上角,越有診斷價值,ROC曲線下面積越大,越有應用價值;AUC是判斷分類模型優劣的標準,表示預測結果中正例排在負例前面的概率,0.5 < AUC < 1時,表明該模型有預測價值,且AUC越接近于1,模型性能越好。人工智能技術有望使各項任務在更短的時間內以更高的準確性和更低的錯誤率得以完成,也就是使上述評價指標更優。
2 人工智能在泌尿系統腫瘤診斷中的應用研究
2.1 在腎臟腫瘤中的應用研究
人工智能技術在腎臟腫瘤診斷方面的應用研究主要集中在腫瘤良惡性鑒別、組織病理分型、組織病理分級和腫瘤影像分割四個方面。
臨床上腎臟腫瘤的良惡性是影響患者生存和治療最重要的預后因素。一些研究工作基于人工智能技術,通過CT、MRI等數據無創地進行腎臟腫瘤良惡性鑒別[14-17]。Cui等[14]通過從171例透明細胞腎細胞癌(clear cell renal cell carcinoma,ccRCC)、乳頭狀腎細胞癌(papillary renal cell carcinoma,pRCC)、嫌色腎細胞癌(chromophobe renal cell carcinoma,chRCC)以及乏脂肪血管平滑肌脂肪瘤(angiomyolipoma without visible fat,AMLwvf)患者的CT圖像中提取腫瘤紋理特征,采用基于五倍交叉驗證的遞歸式特征消除方法建立了多個SVM模型,這些模型在平掃CT數據集上鑒別AMLwvf和腎細胞癌的準確率均在85%以上,AUC在0.88以上,高于在皮髓質期和實質期CT數據集上的準確性。Yang等[15]基于平掃CT建立的“SVM + t_score”分類器鑒別AMLwvf和腎細胞癌實現了82%的準確率和0.9的AUC,同樣優于皮髓質期80%、實質期81%和排泄期77%的準確性。以上兩個研究團隊均采用SVM技術構建分類模型,鑒別良性的AMLwvf和惡性的腎細胞癌,在平掃CT上的準確率和AUC均高于增強CT。Zhou等[16]利用深度學習技術中的遷移學習方法,先以ImageNet數據集預訓練得到Inception V3模型,后在CT圖像上進行遷移學習,實現腎腫瘤良惡性鑒別。在感興趣區域數據集上的準確度為97%,優于矩形框數據集和全切片數據集上的測試效果。Xi等[17]利用超過1 000例患者的臨床數據、T1對比增強和T2加權MRI,通過引導聚合(bootstrap aggregation,bagging)算法建立了由一個邏輯回歸模型和兩個Resnet模型組成的集成模型,達到了70%的準確性和0.92的敏感性。由目前的研究可知,人工智能技術與CT影像結合鑒別腎臟腫瘤良惡性的效果要優于其與MRI結合,利用平掃CT鑒別的效果要優于增強CT,深度學習技術與CT結合的鑒別效果要優于SVM技術與CT結合。
腎細胞癌的病理類型包括ccRCC、pRCC、chRCC、集合管癌和未分化癌,不同腎細胞癌亞型的預后不同,相應治療方法也不同[18],目前研究工作大多基于CT數據,通過人工智能技術進行無創腎臟腫瘤病理分型[19-21]。Kocak等[19]采用ccRCC、pRCC、chRCC患者的CT影像數據建立機器學習模型,其中帶有自適應增強算法的多層感知器(multi layer perceptron,MLP)在皮髓質期CT數據集上鑒別ccRCC和非ccRCC的準確性、特異性分別為84.6%和100%,帶有bagging算法的SVM模型在皮髓質期CT數據集上鑒別ccRCC、pRCC、chRCC的準確性和特異性分別為69.2%和100%,均優于在平掃期CT數據集上的鑒別效果。Zhang等[20]通過從皮髓質期CT中提取特征構建SVM模型,鑒別是否為ccRCC的準確性為88%,優于平掃期80%的準確性和實質期87%的準確性,鑒別pRCC和chRCC的準確性為78%,優于平掃期59%的準確性和實質期70%的準確性。Li等[21]基于隨機森林算法從患者的三維(three-dimensional,3D)增強CT提取腫瘤特征構建模型,在CT皮髓質期圖像上鑒別ccRCC同樣取得了比實質期圖像更好的效果。上述研究顯示,皮髓質期的CT腫瘤特征更有助于腎細胞癌分型,并且人工智能技術鑒別ccRCC的準確性較高,而鑒別pRCC和chRCC的準確率相對較低。
ccRCC分級主要就是指ccRCC的組織病理學分級,常用的有Fuhrman分級和ISUP分級,ccRCC分級與患者預后密切相關,級別越高,腫瘤惡性程度越高,預后越差[22],因此,術前對ccRCC進行分級是制定腫瘤治療策略或手術方案的關鍵。目前,基于CT影像的人工智能技術在ccRCC分級研究中已有較多的文獻報道[23-26]。Ding等[23]基于邏輯回歸分析建立模型,發現基于增強CT皮髓質期和實質期圖像的紋理分析可以較好地鑒別不同Fuhrman分級的ccRCC,AUC為0.78,而非紋理特征的鑒別效果略差。Bektas等[24]基于10倍內外嵌套式交叉循環驗證方法進行特征選擇和模型優化,評估了不同機器學習模型通過增強CT紋理分析識別ccRCC分級的性能,最優模型SVM實現了85.1%的準確率和91.3%的靈敏度。以上兩個團隊均基于增強CT進行ccRCC的分級研究。Kocak等[25]基于平掃CT紋理特征開發了MLP模型,在預測ccRCC的Fuhrman分級上實現81.5%的準確率和0.714的AUC。除了這些傳統的機器學習技術,近年來深度學習技術在預測ccRCC分級上的潛力也初見端倪。Lin等[26]首次利用深度學習技術建立殘差網絡預測ccRCC的ISUP分級,發現遷移學習的使用、無注意力水平的設置、包含更少背景信息的圖像以及更簡單模型Resnet18的開發都有助于提高分級預測的準確性,最佳模型的準確率為77.9%,AUC為0.81。上述研究顯示,基于人工智能技術開發的預測模型均能實現較好的分級結果,并且增強CT紋理特征對不同ccRCC分級的鑒別價值要優于平掃CT。
在CT圖像上精確地分割出腫瘤邊界對腎部分切除術具有重要的指導價值,且有研究指出,腫瘤邊緣分割出現細微誤差也會對基于機器學習的CT紋理分析實驗結果產生影響[27],因此,研發一種可靠的、高精度的腎臟腫瘤影像自動分割算法尤為重要。Linguraru等[28]先通過區域生長算法進行腫瘤影像的初步分割,然后采用測地線動態輪廓對分割結果進行細化,與專家手工分割相比,取得了重復性為0.8和相關性為0.98的結果。但Linguraru的研究是通過提取一些低水平視覺特征分割腫瘤影像,無法保證在腫瘤的形狀和質地接近周圍組織時的分割性能。為了進一步提升網絡性能,Yu等[29]構建了一種新型卷積神經網絡Crossbar-Net,從水平和垂直兩個方向獲取腫瘤外觀信息,以實現腫瘤影像分割,在3 500張CT集上Dice系數達到了0.913,并且在心臟和乳腺腫塊的分割實驗中證實了Crossbar-Net模型穩定的分割能力。He等[30]提出了一個新的元學習框架,通過灰度興趣搜索和元灰度自適應學習分割3D腎結構,平均Dice系數高達0.879,這是首次在CT血管造影圖像上同時分割出了腎、腎腫瘤、動脈和靜脈的研究,有助于開發更加精準的3D綜合腎結構視覺模型。以上研究顯示,與區域生長分割算法相比,基于深度學習技術的分割算法在CT影像上表現得更加出色。
另外,有關研究表明人工智能技術可根據腫瘤CT影像學特征預測ccRCC患者的PBRM1和BAP1基因突變[31-32],這兩種基因的突變狀態與患者預后有關,這些研究在一定程度上揭示了影像學特征的分子基礎,未來可以利用人工智能技術進一步探討影像學和基因組學的相關性,比如腫瘤影像特征與其他腎細胞癌有關基因的關系,從而開創基因檢測的新途徑,降低患者基因檢測費用。
2.2 在膀胱腫瘤中的應用研究
人工智能技術在膀胱腫瘤診斷方面的應用研究主要集中在膀胱癌檢測、組織病理分期、患者預后和識別腫瘤分子亞型四個方面。
檢測膀胱腫瘤通常采用膀胱鏡檢查,一些研究工作者在膀胱鏡圖像上利用人工智能技術檢測膀胱腫瘤[33-35]。Eminaga等[33]基于18 681張正常和癌變的膀胱鏡圖片開發了五種不同的CNN模型,所有模型都可以很好地識別膀胱鏡中的膀胱癌,準確度都在99%以上。Lorencin等[34]提出了一種基于MLP和拉普拉斯邊緣檢測器結合的膀胱癌診斷方法,膀胱鏡圖片先經拉普拉斯邊緣檢測器預處理,然后在MLP上訓練并測試,AUC值達到0.99,且MLP算法比CNN算法更加輕量化。文獻[34-35]基于靜態膀胱鏡圖像的研究均實現了較好的檢測效果。Shkolyar等[35]的工作集中在人工智能技術輔助膀胱鏡的臨床應用,利用141個膀胱鏡視頻開發了一個基于CNN的膀胱腫瘤自動實時檢測平臺CystoNet,每幀敏感度為90.9%,每個腫瘤的敏感性為95.5%。該研究使集成人工智能技術于膀胱鏡中實時檢測膀胱腫瘤成為可能,有望提高檢測準確性和腫瘤切除的徹底性。另外,Sokolov等[36]提出的使用原子力顯微鏡對尿液中的細胞進行成像,然后使用機器學習技術對圖像進行分析的方法,檢測膀胱癌的準確率達到了94%,AUC為0.92。以上研究顯示,基于膀胱鏡和原子力顯微鏡成像的人工智能技術能夠檢測膀胱腫瘤,其中基于膀胱鏡視頻的實時檢測技術的臨床實用性強,與之相比,基于原子力顯微鏡成像的檢測技術能夠避免膀胱鏡檢查帶來的疼痛感。
膀胱癌分期是最有價值的預后因素,準確的膀胱癌分期對患者治療方案的選擇至關重要,目前在CT和MRI上利用人工智能技術預測膀胱癌分期的研究已經取得一些成果[37-38]。Garapati等[37]通過機器學習算法提取76例膀胱癌患者的三維腫瘤CT尿路造影圖像的形態和紋理特征,開發了線性判別分析、神經網絡、隨機森林和SVM四種不同的膀胱癌T1-T4分期預測模型,四種模型的AUC均在0.88以上。膀胱腫瘤與膀胱壁組織的鑒別是判斷膀胱腫瘤浸潤深度和腫瘤T分期的關鍵,Xu等[38]基于遞歸式特征消除的方法構建了SVM分類器,鑒別膀胱癌與膀胱壁組織的準確率為88.7%,還發現基于MRI的3D紋理分析在鑒別任務中要顯著優于2D紋理分析。以上研究顯示,基于三維CT或MRI的人工智能模型能較好地預測膀胱癌T分期,并且與傳統的組織病理學診斷膀胱癌分期相比,人工智能技術診斷具有無創、安全、舒適等優點。
TNM分期系統對制定治療方案和評價預后有指導作用。一些研究表明在預測膀胱癌患者預后方面,人工智能技術比TNM分期系統更有優勢[39-40]。Chen等[39]通過收集406張膀胱癌病理圖像和臨床病理數據,基于機器學習算法構建了一種綜合列線圖來評估患者生存周期,模型對膀胱癌患者1年、3年和5年的生存預測的AUC值分別為77.7%、83.8%和81.3%,顯示出比TNM系統更高的預測準確率。Brieu等[40]發現肌肉浸潤性膀胱癌出芽與生存評估之間存在很強的相關性,其通過開發決策樹模型對免疫熒光標記的病理圖像中的腫瘤芽進行量化分析,發現這種方法能提供比TNM分期系統更好的預后價值。上述研究顯示,基于病理圖像建立的人工智能模型可以為膀胱癌患者的預后提供可靠的依據。
肌肉浸潤性膀胱癌的綜合分子圖譜已經確定了不同的分子亞型,有研究表明不同亞型的患者的預后不同[41],對不同化療方案的反應率也不同。Woerl等[42]改進了Resnet算法,利用蘇木精伊紅染色的病理圖像開發了一個mibCNN模型,來預測肌肉浸潤性膀胱癌不同的分子亞型,AUC接近0.9,并且通過類激活映射觀察模型對圖像的關注區域,識別出了與幾種亞型最相關的病理圖像特征。該研究還有助于更好地理解和分析神經網絡的工作原理及決策過程,可以為肌肉浸潤性膀胱癌患者提供針對性的治療方案,對患者后期生存意義重大。
2.3 在前列腺腫瘤的應用研究
人工智能技術在前列腺腫瘤診斷方面的應用研究主要集中在前列腺癌檢測、Gleason分級、前列腺影像分割三個方面。
MRI檢查是檢出前列腺癌的主要手段,目前研究工作多基于人工智能技術,通過多參數、雙參數和T2加權MRI等影像數據檢測前列腺癌[43-45]。Takeuchi等[43]使用多參數MRI數據集評估兩種機器學習模型對前列腺癌的檢出率,發現多層人工神經網絡模型能夠更好地檢測出前列腺癌,比邏輯回歸模型高出5%~10%的準確率。Vente等[44]采用包括T2加權像和彌散加權成像的雙參數MRI建立了多任務U-net模型,可同時檢測和分級前列腺癌,診斷效果優異。Ishioka等[45]僅利用患者的T2加權MRI數據開發了一個前列腺癌全自動檢測系統,該系統結合U-net和Resnet50算法,取得了0.793的AUC。以上研究表明,人工智能技術可以很好地應用于多參數MRI、雙參數MRI、T2加權MRI上以檢測前列腺癌,減少因MRI不清晰導致的漏診問題。
Gleason分級一直是前列腺癌患者最有力的預后預測指標。有關研究工作已經證明人工智能技術能夠與病理切片結合以預測前列腺癌Gleason分級[46-49]。Kott等[46]利用深度學習技術從85張前列腺癌活檢病理圖像中提取腫瘤特征建立Resnet模型,以區分良性和Gleason 3、4、5分級的腫瘤,取得了準確度85.4%、敏感性0.83和特異性0.94的結果,誤分率在病理學家觀察者間的差異范圍15%~30%內[47]。Nir等[48]通過比較幾種交叉驗證方法來評估基于CNN的前列腺癌自動分級模型的性能,發現基于切片小塊的20倍交叉驗證法在區分Gleason 3級和Gleason 4、5級時性能最優,平均準確性為92.2%,敏感性為93.8%,特異性為90.8%,模型與病理醫生在評分方面的總體一致性為0.6。Bulten等[49]利用患者活檢病理圖像建立的U-net深度學習系統,預測不同Gleason 分級的準確性達到了90%以上,超過了15位病理學家中的10位。以上結果表明,在預測前列腺癌Gleason分級方面,人工智能技術具有和病理學家相當的診斷能力。
臨床上,前列腺組織保留手術要求精確區分前列腺邊界,以限制對鄰近器官組織的損害,而人工智能技術能夠完成圖像中信息的邊界分割。一些研究者基于MRI、CT、經直腸超聲(transrectal of ultrasound,TRUS)等影像數據,利用深度學習技術對前列腺影像進行精準邊界分割[50-52]。Yan等[50]構建了一種可以通過合并多層次特征的最優組合來分割前列腺MRI的傳播深度神經網絡模型。該模型Dice系數達到了0.84,比基于隨機森林等其他傳統機器學習的分割算法的Dice系數平均提高了3.19%。Liu等[51]改進U-net網絡模型,將每個上采樣層的特征添加到相同數量的卷積層的特征中,形成合并層,在140張前列腺癌CT測試集上生成的輪廓與醫生勾勒的輪廓具有很高的一致性,Dice系數達到了0.88。但以上兩種算法的研究都是基于前列腺MRI、CT圖像的靜態分割。van Sloun等[52]開發的帶有監督自適應算法的U-net網絡模型能夠以98%的精度自動實時分割前列腺TRUS圖像,Jaccard系數達到0.93,每張圖片的分割時間為0.012 9 s,并且該模型在分割不同掃描儀下的前列腺TRUS圖像時,仍能保持高性能,穩定性強。以上研究表明,利用人工智能技術開發的神經網絡模型能夠在前列腺CT、MRI、TRUS圖像上準確地分割出前列腺,其中基于前列腺TRUS圖像的自動實時分割技術效果最好,可促進實時TRUS成像的活檢針引導,提高臨床分割效率和精度,減少對周圍組織的損傷。
3 結果與分析
通過回顧整理近年來人工智能技術在泌尿系統腫瘤診斷方面的已有研究成果,我們從論文數量、圖像數據、臨床任務三個方面對這些研究成果進行了分析和總結。
圖3是研究者報道采用人工智能技術處理各類醫學圖像數據來研究泌尿系統三種腫瘤的文獻數量(截止2021年6月30日)。由圖3可知,人工智能技術在泌尿系統腫瘤中的研究主要在腎臟腫瘤、膀胱腫瘤、前列腺腫瘤三個方面,其中研究腎臟腫瘤的有17篇,研究膀胱腫瘤和前列腺腫瘤的各9篇。此外,還存在數量較少的對輸尿管口檢測定位的研究文獻[53-54],而對輸尿管腫瘤、尿道腫瘤等其他泌尿系腫瘤的研究尚不存在,可見研究人員的關注度是與泌尿系統腫瘤在全球的發病率基本一致的[1]。

在圖像數據方面,針對泌尿系腫瘤的研究主要依賴于CT、MRI、TRUS、病理圖像、內窺鏡圖像以及原子力顯微成像等六種數據類型。腎臟腫瘤的人工智能領域交叉研究以CT影像數據為主,較少的研究采用了MRI數據,除此之外未見其他幾類醫學圖像數據納入相關研究。膀胱腫瘤與前列腺腫瘤的研究數據來源較為豐富,但也具有各自的傾向性:膀胱腫瘤主要基于病理圖像和內窺鏡圖像;前列腺腫瘤主要基于MRI和病理圖像數據。還有研究指出,基于不同參數的MRI對前列腺癌檢測效果不同[55],因此利用人工智能技術討論T2加權、雙參數、多參數MRI對前列腺癌檢測效果的關系或具有一定價值。此外,基于原子力顯微鏡輕敲模式成像的方法目前較少見于報道,其優點是圖像分辨率高,不會對細胞造成損傷[56],因此該方法有待研究者在泌尿系腫瘤診斷中大膽嘗試。
在臨床任務方面,人工智能模型主要用于腫瘤自動精準診斷[14-17,19-21,23-26,33-38,43-49]、腫瘤浸潤區域或特定器官的影像分割[27-30,50-52]、基因突變預測[31-32]和預后效果預測[39-40]等具體醫學應用。
腫瘤自動診斷在圖像處理的技術層面包括檢測問題和分類問題,分類可以實現腫瘤良惡性鑒別、腫瘤分型、腫瘤分級和腫瘤分期。全部文獻中,各網絡模型在相應分類任務中的準確率對比結果如圖4所示。

傳統機器學習模型平均分類準確率為(82.71 ± 5.78)%,總的來看,傳統機器學習模型性能較為穩定。這些模型中以SVM技術建模為主,SVM模型的平均分類準確率為(83.38 ± 6.72)%,整體而言,SVM模型性能在機器學習模型中處于優異水平,且采用遞歸式特征消除和交叉驗證建立SVM模型的方法,相比于其他方法分類準確率更高。傳統機器學習的主要分類任務分別以組織病理分型為主,44%的機器學習分類模型用來做分型任務,分型任務模型的平均準確率為(79.95 ± 7.17)%,全部文獻中,腎細胞癌分型的研究方案以ccRCC、pRCC、chRCC三種類型為主[19-21],其他腎細胞癌亞型的研究文獻較少。
深度學習模型平均分類準確率為(84.06 ± 9.38)%,可見,深度學習模型在分類任務上的平均性能優于傳統機器學習模型,但不同深度學習模型間的分類準確性差異較大。其中基于遷移學習技術預訓練得到Inception V3模型在腫瘤的良惡性鑒別中的準確率達97.0%[16],Resnet模型鑒別腫瘤良惡性和分級的準確率相對較低[17,26,46],可能是數據量較少導致的過擬合。深度學習的主要分類任務以分級為主,60%的深度學習分類模型用來做分級任務,分級任務模型的平均準確率為(84.43 ± 4.99)%。文獻[23-25]建立了ccRCC分級模型,均采用了Fuhrman分級系統,實際上臨床醫生已經廣泛采用新提出的ISUP分級系統,其分級結果更利于指導臨床治療方案。
腫瘤浸潤區域或特定器官的影像分割在圖像處理的技術層面屬于語義分割任務,全部文獻中,各網絡模型完成分割任務的Dice系數如圖5所示。由圖5可知,Crossbar-Net模型[29]分割腎臟腫瘤影像的Dice系數最高,達0.913。另一個具備較高分割性能與穩定性的網絡模型是帶有監督自適應算法的U-net模型[52],達到了0.93的Jaccard系數,分割時間快,可自動實時分割不同掃描儀下的前列腺TRUS圖像,未來可嘗試將這兩種網絡模型及相關技術應用于其他疾病腫瘤的影像分割任務。就本文整理的文獻而言,傳統機器學習模型Dice系數的均值為0.815±0.019,深度學習模型Dice系數的均值為0.878±0.026,可見,利用深度學習技術分割腫瘤或器官影像取得的精度普遍高于傳統的機器學習技術取得的精度。

在基因分子層面,文獻[31-32,42]中利用人工智能技術預測腎細胞癌基因突變狀態以及膀胱癌分子類型的可行性已得到證實。有研究表明VHL基因突變會導致ccRCC的發生[32],E2F3基因數量越多,膀胱癌患者預后越差[57]。研究者今后可進行更多基因分子層面的研究,如針對VHL基因、E2F3基因的研究,從而實現基因的無創檢測。
4 結論與展望
通過整理該領域文獻可知人工智能技術在泌尿外科得到了廣泛關注并發揮著重要作用。人工智能模型能夠用于腫瘤自動精準診斷、腫瘤浸潤區域或特定器官的影像分割、基因突變預測和預后效果預測等具體醫學應用,人工智能技術可以提高相關疾病的診斷效率,為患者提供個性化的精準治療方案。但在總體上,人工智能模型的診斷精度還存在比較大的優化空間,且人工智能模型的建立依賴大量經過專業人員標注的醫學數據,這些醫學數據資源不足是人工智能技術在泌尿系腫瘤診斷應用中的最主要障礙。為此,研究者一方面應不斷開發諸如元學習算法、注意力機制模塊等新的核心算法,進一步提高人工智能模型的診斷精度。另一方面,需要加強機構間的數據整合,建設更多標準化的醫學數據庫,以解決數據相對不足問題。隨著技術的進步和研究的深入,人工智能技術將對于泌尿外科相關疾病的診療過程發揮更大的作用。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。