引用本文: 陳可涵, 趙華彬, 陸慧敏. 人工智能在胰腺癌風險評估和診斷中的應用. 中國普外基礎與臨床雜志, 2023, 30(8): 995-1000. doi: 10.7507/1007-9424.202306043 復制
胰腺癌(pancreatic cancer,PC)是消化系統中最致命和最具侵襲性的腫瘤之一[1],被稱為“癌癥之王”[2]。世界衛生組織估計,早期癌癥檢測將使大多數癌癥類型的治愈率提高 30%[3]。PC在疾病發展到晚期之前是無癥狀的,診斷時只有約20%的病例符合手術切除條件[4-5];大約 90% 的外分泌 PC是胰腺導管腺癌(pancreatic ductal adenocarcinoma,PDAC),而80%的PDAC患者在首次診斷時處于疾病晚期[6-7]。早期診斷PC的一個挑戰是胰腺腫瘤患者缺乏特定臨床癥狀,大多數患者是無癥狀的[8]。如果患者在早期被診斷出來,胰腺腫瘤可以完全切除,則存活率能顯著提高到50%;晚期狀態PC的5年生存率低于10%,且出現胰瘺、腦卒中、心臟驟停、傷口裂開、感染、出血、腎功能衰竭等術后并發癥的風險增加[6, 9]。因此,通過早期診斷和實施PC篩查計劃來預測PC變得至關重要。近年來,人工智能(artificial intelligence,AI)的出現改變了PC的診斷格局,預測準確性有了顯著提高,在PC的二級預防中發揮了重要作用。筆者將深入探討AI在胰腺癌風險評估和診斷中的作用,以期推動AI在PC早期診斷中的應用。
1 醫學中的AI概述
近幾十年來,計算機技術的進步以及有效的圖像處理策略的發展,開創了“數字醫學”的新時代。因此,臨床人員可以避免手動費力進行的醫學圖像分析,從而節省時間并克服由于專業知識和臨床經驗的差異而引起的診斷錯誤[10]。21世紀 AI被廣泛使用,它使用計算機程序來執行與人類智能相關的任務,例如學習和解決問題。“人工智能”一詞最初由約翰·麥卡錫(John McCarthy)在1950年代中期提出,此后從 “if-then”命令演變為在某些方面模仿人腦的更復雜的算法[11]。AI工具的應用引發了一個新的臨床診斷領域的出現,即精準腫瘤學,它使用了來自基因組學、蛋白質組學和代謝組學的大量數據[12]。
基于AI的癌癥診斷主要由機器學習(machine learning,ML)方法和深度學習(deep learning,DL)技術驅動。ML使用計算方法來分析大量數據并確定預測模式[13]。ML在使用以前測量的數據來識別模式或趨勢以進行預測時,可以對其進行監督。因此,對于PC的診斷,電子計算機斷層掃描(CT)或PET掃描、超聲檢查和磁共振成像(MRI)的數據可用于訓練系統識別PC。如果使用大量數據集進行訓練,則預測準確性會更高。在訓練期間,可以迭代使用不同的數學模型和算法來確定最有效的模型,其準確性可以使用測試數據集進行驗證。這種監督式 ML 模型的優勢在于,它們可以提取有意義的特征,并識別由于人類疏忽或疲憊而可能錯過的細微變化。因此,ML對癌癥診斷的預測準確性更高。ML 也可以是無監督的,從未分類的數據中識別模式和趨勢。然而,與監督模型相比,預測的準確性略有下降[14]。ML模型還實現了圖像的3D重建,具有優異的診斷準確性[15]。
DL是ML的一個分支,它使用大數據集和模仿人腦的復雜算法來實現預測和決策[16-17]。大多數DL都是有監督的,并使用數據進行決策過程的訓練。另一種尚未應用于癌癥診斷的ML是強化學習(reinforcement learning,RL),它使數據理解和響應環境,主要通過試錯的過程,除了預測之外,還可以促進決策[18]。DL和RL都是高級概念,需要較長的訓練和測試時間,但RL是一個動態過程,依賴于試錯法。
2 AI在PC風險評估中的應用
雖然與PC發病相關的具體因素尚不清楚,但目前已識別出一些可改變和不可改變的危險因素。不可改變的危險因素包括年齡、性別、種族、血型、糖尿病、微生物群、家族和遺傳學史、遺傳易感性等[19-23]。可改變的危險因素包括乙醇、吸煙、胰腺炎病史、飲食特征、肥胖等[19-22, 24]。從以患者自身為中心的監測方案的角度來看,對這些危險因素的清晰了解可以對患者進行正確的分層,找出PC高風險患者。Muhammad等[25]根據800 114位研究對象的健康特征(年齡、糖尿病、吸煙、運動狀態、飲酒和PC家族史),設計了一種人工神經網絡(artificial neural network,ANN)模型來預測PC,數據集中包括898例PC,結果表明,可以使用ANN根據個人健康特征來預測和分層PC的風險,其靈敏度為80.7%,特異度為80.7%。Lee等[26]使用臺灣健康數據庫開發了PC的卷積神經網絡(convolutional neural network,CNN)預測模型,數據覆蓋了該地區99.98%的人口,其中有2 952名受試者具有與PC相關的危險因素,包括胰腺炎、糖尿病、消化性潰瘍、肝炎、膽管炎等,該模型的曲線下面積(area under roc curve,AUC)為0.76,高于以往研究的0.71。
3 AI在PC診斷中的應用
3.1 使用醫學影像圖像診斷PC的 AI 算法
3.1.1 超聲內鏡(endoscopic ultrasound,EUS)
研究[27]顯示,使用基于支持向量機(support vector machines,SVM)和ANN的方法對 EUS 圖像進行數字圖像分析具有很高的準確性,在EUS上使用ANN診斷PC的總體準確率在89%~94%之間。通過研究EUS成像圖像的擴展神經網絡,使用AI進行EUS成像圖像的分析獲得了更好的結果,在區分惡性和良性胰腺病變方面的準確率為89.7%[28]。術前采用AI 對胰腺導管內乳頭狀黏液性腫瘤(intraductal papillary mucinous neoplasm,IPMN)的EUS圖像進行分類時,它在預測惡性方面比醫生的準確率更高(分別為 94% 和 56%)[29]。Kuwahara等[30]對50例手術診斷為IPMN的患者進行了回顧性研究,使用CNN算法研究了EUS的3 970張圖像,使用數據增強技術,生成了508 160張圖像。該研究[30]比較了AI算法與醫生判斷預測早期病變的能力,結果顯示,AI在預測惡性腫瘤方面的準確率為94.0%,而醫生的準確率為56.0%。但這項研究有許多局限性:是回顧性的、病例樣本量很小,只進行了內部驗證,并且只使用了1個中心的數據。
3.1.2 MRI
MRI在診斷PC方面具有重要價值,因為它能夠識別多種類型的PC、有較好的軟組織對比度。Chen等[31]使用20例正常人和20例胰腺腫瘤患者的MRI圖像進行分類,從中獲得了77張良性MRI圖像和38張惡性MRI圖像,通過數據增強技術,最終分析了442張良性MRI圖像和421張惡性MRI圖像,在樣本量小且圖像數據可用性有限的情況下生成數據,對良性和惡性腫瘤進行分類,結果達到了91%的準確率。Hussein等[32]使用來自171例受試者的MRI數據來識別IPMN,其中包括38名正常人和133例確診IPMN的受試者,二維軸向切片用于生成感興趣的區域,監督和無監督學習用于計算機輔助診斷(computed assisted diagnosis,CAD)。在監督學習中,使用CNN進行自動圖像診斷的準確性高達84.22%,靈敏度為97.2%;在無監督學習中,使用聚類算法來獲取初始標簽,通過SVM逐步優化標簽,其準確性為58.04%,靈敏度為58.61%[32]。
3.1.3 CT
CT 是診斷和分期 PC 的主要影像學檢查方式,為了探索使用AI作為早期PDAC診斷的預測模型的效果,Qureshi等[6]將108例患者的72次CT掃描分為外部和內部兩個數據集,開發了一個模型,通過自動識別CT掃描圖像對PDAC高風險個體進行分層,該系統在外部數據集上實現了 86% 的平均分類準確率,該研究得出的結論是,CT 圖像提供了足夠的信息使 AI能夠早期預測和診斷PDAC,但需要進一步的研究來解決由于數據集有限而導致的潛在過度擬合。Chakraborty等[33]使用SVM和隨機森林方法研究了103例確診為IPMN的患者的CT圖像,結果顯示,隨機森林算法在提取IPMN病灶特征方面的效果較好。Alves等[34]對119例PDAC患者和123名正常人進行了對比增強CT掃描的研究,使用醫學圖像分割的nnU-Net(no-new U-net)模型預測PDAC,結果表明,該模型可以診斷早期PDAC病變。有研究者[15]使用 Faster R-CNN 模型開發了一種用于自動診斷 PC 的系統,它能在 3 s內生成診斷,低于圖像專家要求的 8 min,但該研究是一項單中心的回顧性研究且沒有外部驗證。
3.2 使用腫瘤標志物診斷 PC 的 AI 算法
液體活檢領域的發展使許多的生物標志物(如外泌體、蛋白質組、蛋白質、無細胞DNA和循環microRNA)數據可以使用AI方法進行分析,以早期診斷PC[35]。Ko等[36]利用外泌體作為生物標志物來診斷胰腺癌,使用開發的ML算法鑒定癌癥的miRNA特征,在小鼠模型和胰腺癌患者中均進行了驗證,具有良好的預測準確性。使用神經網絡分析用于PC診斷的腫瘤標志物的研究表明,單個腫瘤標志物的診斷性能低于腫瘤標志物AI模型的診斷性能[37]。Serrao等[37]在小鼠模型中,使用磁共振波譜成像和超極化 [1-13C]丙酮酸來檢測和監測PC前體病變的進展,結果表明僅檢測CA19-9、CEA和CA125中的一種值比使用AI模型進行PC診斷的靈敏度低。然而,人類的胰腺比小鼠大,而且胰腺病變通常很小,因此在將這種方法用于人類患者之前需要更多的研究。Qiao等[38]訓練了用于胰腺癌診斷的2D-3D CNN模型,結果顯示,CT聯合腫瘤標志物(CA-87、CA-63、CA-94)的診斷性能(準確率57.93%,靈敏度25.84%,特異度57.90%)優于單獨使用CT或血清腫瘤標志物,提示未來的研究可以訓練AI采用多種方式聯合診斷。
3.3 使用組織病理切片圖像診斷 PC 的 AI 算法
隨著ML的發展,數字醫學成像可以在基于組織病理學圖像的輔助診斷方面發揮作用。今天,可以使用全玻片成像對載玻片進行數字化,使用專門的掃描儀從載玻片中獲得組織的高分辨率數字圖像,然后通過AI方法分析圖像。然而,目前只有少數研究探索了AI在PC病理標本上的使用。有研究[27]使用ANN算法區分惡性或良性胰腺腫瘤標本的總體準確率高達77%。Naito等[39]訓練了一種DL模型來評估內鏡超聲引導下細針活檢標本,從而病理學診斷PDAC,其AUC為0.984,準確率為0.942,靈敏度為0.930,特異度為0.971。Si等[40]提出了一種完全端到端的深度學習(fully end-to-end deep-learning-based,FEE-DL)算法,用于診斷不同類型的PC,FEEDL由3個連接子網組成:ResNet18用于識別包含胰腺的圖像,U-Net-32用于對每個圖像進行胰腺分割預測,ResNet34用于診斷胰腺腫瘤,該模型對所有腫瘤類型的平均準確率為82.7%,識別IPMN的準確率為100%,識別PDAC的準確率為87.6%[40]。目前,可以掃描、分析和存儲來自整個組織樣本數據的尖端數字病理學工具仍在繼續研發[41]。
4 AI的局限性和建議
4.1 可能存在偏倚
盡管AI模型在PC診斷中的應用取得了進展,但在臨床實踐應用中仍然存在許多問題:大量的回顧性研究、混淆、偏差、診斷中的假陽性和假陰性,另外缺乏診斷準確性檢測的規范標準也是一個非常大的障礙[42]。此外,由于各項研究的不同發明人都設計了CAD系統,導致發明人偏倚的風險很高。因此,研究必須經過精心設計、前瞻性研究、實時測試,并依賴于從不同機構和地理位置獲得的大數據集,以解決上述缺陷。另外,用于訓練算法的圖像可能是被選擇的,大多數研究都排除了低分辨率、模糊的照片,可能存在選擇偏倚[43]。因此,為了增強這些模型的輸出效果,提供各種形式的數據至關重要,如高質量和低質量的照片、視頻,甚至是影像的實時透視訓練。
4.2 訓練樣本量較小
目前的研究中,AI模型通常是在小數據集上訓練的,每個醫療中心的算法方法各不相同。小數據集導致測量誤差和過度擬合(測試時性能良好,但驗證時結果不確定)[44]。因此,為了最大限度地減少過擬合并優化AI系統在各個領域的性能,未來的研究應包括來自不同國家、不同地域、不同中心的大數據集,以減少誤差和提高準確性。
4.3 倫理和法律問題
盡管AI在PC的風險評估和診斷方面有許多優勢,但由于AI工具需要大型數據集進行訓練和驗證,目前,用于數據共享的集中式模型,將所有數據都保存在單一的中央服務器上,這很容易受到對抗性攻擊[45]。因此,人們對數據隱私和安全性提出了擔憂。此外,將臨床醫生的專家判斷與AI算法的診斷頻繁比較時,由于過度依賴基于AI的診斷,未來可能導致臨床醫生培訓不足或技能下降。最后,當AI出現診斷錯誤時,如何問責存在爭議[46],因此,AI的立法、監管和臨床實踐都將面臨挑戰。
4.4 缺乏足夠的證據
AI的復雜性不利于“解釋”其決策或預測的原理,這種對AI內部工作原理、算法以及其為什么能做出特定決策的有限知識被稱為“黑匣子”[47]。臨床醫生要在常規臨床工作中采用和信任AI模型,則它們必須是可靠的、可解釋的、有依據的,而不僅僅是一種表現良好的方法。此外,由于AI的實施需要硬件和軟件,因此研究的結果和設計可能會因研究的指揮者而有所不同[48],這也會影響模型的質量。因此,建議在臨床應用之前,由該領域的多學科專家團隊進行質量評價,可使用失效模型、效果分析等方法進行風險分析[49],以確保AI模型安全、可靠,以及有臨床意義地使用。
5 未來展望
PC需要一種具有成本效益的早期病變篩查方法,AI對PC的風險評估和診斷有潛力產生重大的影響。AI對患者的數據進行了標準化的解釋,減少了人為的偏倚或錯誤,但其需要不同來源的廣泛數據,這些數據集在AI訓練中起著核心作用,因此,全社會合作和信息資源的共享至關重要。此外,AI模型也可與手機、智能手表關聯,實時數據傳輸可能有助于跨地域的醫務人員相互聯系和溝通,從而為患者找到最佳的臨床決策。通過整合復雜的數據,可以發揮AI在評估和信息交流中的潛力,為給患者更好地量身定制鋪平道路,協助監測和診斷疾病,實現精準醫學[50]和個性化護理[51]。不過,在疾病的篩查、預測和診斷中,AI的使用還需要進一步的發展,因為有相當多的障礙需要克服,如普適性、可解釋性、患者安全、倫理、立法、行政許可、成本效益等。未來AI將有更為廣泛的應用,但需要推進技術發展才能最終成為臨床實踐的主流[52]。
6 小結
PC的惡性程度高,生存率低,早期診斷對改變疾病進程至關重要。近年來,AI在PC領域的應用取得了重大進展。盡管AI在PC風險評估、醫學影像、病理檢查、生物標志物診斷中的作用得到了公認,但其仍可能存在偏倚、缺乏可解釋性、倫理、法律等問題,且將其整合到臨床實踐中所面臨的挑戰也迫切需要解決。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:陳可涵撰寫論文,陸慧敏、趙華彬對論文進行指導并修改。
胰腺癌(pancreatic cancer,PC)是消化系統中最致命和最具侵襲性的腫瘤之一[1],被稱為“癌癥之王”[2]。世界衛生組織估計,早期癌癥檢測將使大多數癌癥類型的治愈率提高 30%[3]。PC在疾病發展到晚期之前是無癥狀的,診斷時只有約20%的病例符合手術切除條件[4-5];大約 90% 的外分泌 PC是胰腺導管腺癌(pancreatic ductal adenocarcinoma,PDAC),而80%的PDAC患者在首次診斷時處于疾病晚期[6-7]。早期診斷PC的一個挑戰是胰腺腫瘤患者缺乏特定臨床癥狀,大多數患者是無癥狀的[8]。如果患者在早期被診斷出來,胰腺腫瘤可以完全切除,則存活率能顯著提高到50%;晚期狀態PC的5年生存率低于10%,且出現胰瘺、腦卒中、心臟驟停、傷口裂開、感染、出血、腎功能衰竭等術后并發癥的風險增加[6, 9]。因此,通過早期診斷和實施PC篩查計劃來預測PC變得至關重要。近年來,人工智能(artificial intelligence,AI)的出現改變了PC的診斷格局,預測準確性有了顯著提高,在PC的二級預防中發揮了重要作用。筆者將深入探討AI在胰腺癌風險評估和診斷中的作用,以期推動AI在PC早期診斷中的應用。
1 醫學中的AI概述
近幾十年來,計算機技術的進步以及有效的圖像處理策略的發展,開創了“數字醫學”的新時代。因此,臨床人員可以避免手動費力進行的醫學圖像分析,從而節省時間并克服由于專業知識和臨床經驗的差異而引起的診斷錯誤[10]。21世紀 AI被廣泛使用,它使用計算機程序來執行與人類智能相關的任務,例如學習和解決問題。“人工智能”一詞最初由約翰·麥卡錫(John McCarthy)在1950年代中期提出,此后從 “if-then”命令演變為在某些方面模仿人腦的更復雜的算法[11]。AI工具的應用引發了一個新的臨床診斷領域的出現,即精準腫瘤學,它使用了來自基因組學、蛋白質組學和代謝組學的大量數據[12]。
基于AI的癌癥診斷主要由機器學習(machine learning,ML)方法和深度學習(deep learning,DL)技術驅動。ML使用計算方法來分析大量數據并確定預測模式[13]。ML在使用以前測量的數據來識別模式或趨勢以進行預測時,可以對其進行監督。因此,對于PC的診斷,電子計算機斷層掃描(CT)或PET掃描、超聲檢查和磁共振成像(MRI)的數據可用于訓練系統識別PC。如果使用大量數據集進行訓練,則預測準確性會更高。在訓練期間,可以迭代使用不同的數學模型和算法來確定最有效的模型,其準確性可以使用測試數據集進行驗證。這種監督式 ML 模型的優勢在于,它們可以提取有意義的特征,并識別由于人類疏忽或疲憊而可能錯過的細微變化。因此,ML對癌癥診斷的預測準確性更高。ML 也可以是無監督的,從未分類的數據中識別模式和趨勢。然而,與監督模型相比,預測的準確性略有下降[14]。ML模型還實現了圖像的3D重建,具有優異的診斷準確性[15]。
DL是ML的一個分支,它使用大數據集和模仿人腦的復雜算法來實現預測和決策[16-17]。大多數DL都是有監督的,并使用數據進行決策過程的訓練。另一種尚未應用于癌癥診斷的ML是強化學習(reinforcement learning,RL),它使數據理解和響應環境,主要通過試錯的過程,除了預測之外,還可以促進決策[18]。DL和RL都是高級概念,需要較長的訓練和測試時間,但RL是一個動態過程,依賴于試錯法。
2 AI在PC風險評估中的應用
雖然與PC發病相關的具體因素尚不清楚,但目前已識別出一些可改變和不可改變的危險因素。不可改變的危險因素包括年齡、性別、種族、血型、糖尿病、微生物群、家族和遺傳學史、遺傳易感性等[19-23]。可改變的危險因素包括乙醇、吸煙、胰腺炎病史、飲食特征、肥胖等[19-22, 24]。從以患者自身為中心的監測方案的角度來看,對這些危險因素的清晰了解可以對患者進行正確的分層,找出PC高風險患者。Muhammad等[25]根據800 114位研究對象的健康特征(年齡、糖尿病、吸煙、運動狀態、飲酒和PC家族史),設計了一種人工神經網絡(artificial neural network,ANN)模型來預測PC,數據集中包括898例PC,結果表明,可以使用ANN根據個人健康特征來預測和分層PC的風險,其靈敏度為80.7%,特異度為80.7%。Lee等[26]使用臺灣健康數據庫開發了PC的卷積神經網絡(convolutional neural network,CNN)預測模型,數據覆蓋了該地區99.98%的人口,其中有2 952名受試者具有與PC相關的危險因素,包括胰腺炎、糖尿病、消化性潰瘍、肝炎、膽管炎等,該模型的曲線下面積(area under roc curve,AUC)為0.76,高于以往研究的0.71。
3 AI在PC診斷中的應用
3.1 使用醫學影像圖像診斷PC的 AI 算法
3.1.1 超聲內鏡(endoscopic ultrasound,EUS)
研究[27]顯示,使用基于支持向量機(support vector machines,SVM)和ANN的方法對 EUS 圖像進行數字圖像分析具有很高的準確性,在EUS上使用ANN診斷PC的總體準確率在89%~94%之間。通過研究EUS成像圖像的擴展神經網絡,使用AI進行EUS成像圖像的分析獲得了更好的結果,在區分惡性和良性胰腺病變方面的準確率為89.7%[28]。術前采用AI 對胰腺導管內乳頭狀黏液性腫瘤(intraductal papillary mucinous neoplasm,IPMN)的EUS圖像進行分類時,它在預測惡性方面比醫生的準確率更高(分別為 94% 和 56%)[29]。Kuwahara等[30]對50例手術診斷為IPMN的患者進行了回顧性研究,使用CNN算法研究了EUS的3 970張圖像,使用數據增強技術,生成了508 160張圖像。該研究[30]比較了AI算法與醫生判斷預測早期病變的能力,結果顯示,AI在預測惡性腫瘤方面的準確率為94.0%,而醫生的準確率為56.0%。但這項研究有許多局限性:是回顧性的、病例樣本量很小,只進行了內部驗證,并且只使用了1個中心的數據。
3.1.2 MRI
MRI在診斷PC方面具有重要價值,因為它能夠識別多種類型的PC、有較好的軟組織對比度。Chen等[31]使用20例正常人和20例胰腺腫瘤患者的MRI圖像進行分類,從中獲得了77張良性MRI圖像和38張惡性MRI圖像,通過數據增強技術,最終分析了442張良性MRI圖像和421張惡性MRI圖像,在樣本量小且圖像數據可用性有限的情況下生成數據,對良性和惡性腫瘤進行分類,結果達到了91%的準確率。Hussein等[32]使用來自171例受試者的MRI數據來識別IPMN,其中包括38名正常人和133例確診IPMN的受試者,二維軸向切片用于生成感興趣的區域,監督和無監督學習用于計算機輔助診斷(computed assisted diagnosis,CAD)。在監督學習中,使用CNN進行自動圖像診斷的準確性高達84.22%,靈敏度為97.2%;在無監督學習中,使用聚類算法來獲取初始標簽,通過SVM逐步優化標簽,其準確性為58.04%,靈敏度為58.61%[32]。
3.1.3 CT
CT 是診斷和分期 PC 的主要影像學檢查方式,為了探索使用AI作為早期PDAC診斷的預測模型的效果,Qureshi等[6]將108例患者的72次CT掃描分為外部和內部兩個數據集,開發了一個模型,通過自動識別CT掃描圖像對PDAC高風險個體進行分層,該系統在外部數據集上實現了 86% 的平均分類準確率,該研究得出的結論是,CT 圖像提供了足夠的信息使 AI能夠早期預測和診斷PDAC,但需要進一步的研究來解決由于數據集有限而導致的潛在過度擬合。Chakraborty等[33]使用SVM和隨機森林方法研究了103例確診為IPMN的患者的CT圖像,結果顯示,隨機森林算法在提取IPMN病灶特征方面的效果較好。Alves等[34]對119例PDAC患者和123名正常人進行了對比增強CT掃描的研究,使用醫學圖像分割的nnU-Net(no-new U-net)模型預測PDAC,結果表明,該模型可以診斷早期PDAC病變。有研究者[15]使用 Faster R-CNN 模型開發了一種用于自動診斷 PC 的系統,它能在 3 s內生成診斷,低于圖像專家要求的 8 min,但該研究是一項單中心的回顧性研究且沒有外部驗證。
3.2 使用腫瘤標志物診斷 PC 的 AI 算法
液體活檢領域的發展使許多的生物標志物(如外泌體、蛋白質組、蛋白質、無細胞DNA和循環microRNA)數據可以使用AI方法進行分析,以早期診斷PC[35]。Ko等[36]利用外泌體作為生物標志物來診斷胰腺癌,使用開發的ML算法鑒定癌癥的miRNA特征,在小鼠模型和胰腺癌患者中均進行了驗證,具有良好的預測準確性。使用神經網絡分析用于PC診斷的腫瘤標志物的研究表明,單個腫瘤標志物的診斷性能低于腫瘤標志物AI模型的診斷性能[37]。Serrao等[37]在小鼠模型中,使用磁共振波譜成像和超極化 [1-13C]丙酮酸來檢測和監測PC前體病變的進展,結果表明僅檢測CA19-9、CEA和CA125中的一種值比使用AI模型進行PC診斷的靈敏度低。然而,人類的胰腺比小鼠大,而且胰腺病變通常很小,因此在將這種方法用于人類患者之前需要更多的研究。Qiao等[38]訓練了用于胰腺癌診斷的2D-3D CNN模型,結果顯示,CT聯合腫瘤標志物(CA-87、CA-63、CA-94)的診斷性能(準確率57.93%,靈敏度25.84%,特異度57.90%)優于單獨使用CT或血清腫瘤標志物,提示未來的研究可以訓練AI采用多種方式聯合診斷。
3.3 使用組織病理切片圖像診斷 PC 的 AI 算法
隨著ML的發展,數字醫學成像可以在基于組織病理學圖像的輔助診斷方面發揮作用。今天,可以使用全玻片成像對載玻片進行數字化,使用專門的掃描儀從載玻片中獲得組織的高分辨率數字圖像,然后通過AI方法分析圖像。然而,目前只有少數研究探索了AI在PC病理標本上的使用。有研究[27]使用ANN算法區分惡性或良性胰腺腫瘤標本的總體準確率高達77%。Naito等[39]訓練了一種DL模型來評估內鏡超聲引導下細針活檢標本,從而病理學診斷PDAC,其AUC為0.984,準確率為0.942,靈敏度為0.930,特異度為0.971。Si等[40]提出了一種完全端到端的深度學習(fully end-to-end deep-learning-based,FEE-DL)算法,用于診斷不同類型的PC,FEEDL由3個連接子網組成:ResNet18用于識別包含胰腺的圖像,U-Net-32用于對每個圖像進行胰腺分割預測,ResNet34用于診斷胰腺腫瘤,該模型對所有腫瘤類型的平均準確率為82.7%,識別IPMN的準確率為100%,識別PDAC的準確率為87.6%[40]。目前,可以掃描、分析和存儲來自整個組織樣本數據的尖端數字病理學工具仍在繼續研發[41]。
4 AI的局限性和建議
4.1 可能存在偏倚
盡管AI模型在PC診斷中的應用取得了進展,但在臨床實踐應用中仍然存在許多問題:大量的回顧性研究、混淆、偏差、診斷中的假陽性和假陰性,另外缺乏診斷準確性檢測的規范標準也是一個非常大的障礙[42]。此外,由于各項研究的不同發明人都設計了CAD系統,導致發明人偏倚的風險很高。因此,研究必須經過精心設計、前瞻性研究、實時測試,并依賴于從不同機構和地理位置獲得的大數據集,以解決上述缺陷。另外,用于訓練算法的圖像可能是被選擇的,大多數研究都排除了低分辨率、模糊的照片,可能存在選擇偏倚[43]。因此,為了增強這些模型的輸出效果,提供各種形式的數據至關重要,如高質量和低質量的照片、視頻,甚至是影像的實時透視訓練。
4.2 訓練樣本量較小
目前的研究中,AI模型通常是在小數據集上訓練的,每個醫療中心的算法方法各不相同。小數據集導致測量誤差和過度擬合(測試時性能良好,但驗證時結果不確定)[44]。因此,為了最大限度地減少過擬合并優化AI系統在各個領域的性能,未來的研究應包括來自不同國家、不同地域、不同中心的大數據集,以減少誤差和提高準確性。
4.3 倫理和法律問題
盡管AI在PC的風險評估和診斷方面有許多優勢,但由于AI工具需要大型數據集進行訓練和驗證,目前,用于數據共享的集中式模型,將所有數據都保存在單一的中央服務器上,這很容易受到對抗性攻擊[45]。因此,人們對數據隱私和安全性提出了擔憂。此外,將臨床醫生的專家判斷與AI算法的診斷頻繁比較時,由于過度依賴基于AI的診斷,未來可能導致臨床醫生培訓不足或技能下降。最后,當AI出現診斷錯誤時,如何問責存在爭議[46],因此,AI的立法、監管和臨床實踐都將面臨挑戰。
4.4 缺乏足夠的證據
AI的復雜性不利于“解釋”其決策或預測的原理,這種對AI內部工作原理、算法以及其為什么能做出特定決策的有限知識被稱為“黑匣子”[47]。臨床醫生要在常規臨床工作中采用和信任AI模型,則它們必須是可靠的、可解釋的、有依據的,而不僅僅是一種表現良好的方法。此外,由于AI的實施需要硬件和軟件,因此研究的結果和設計可能會因研究的指揮者而有所不同[48],這也會影響模型的質量。因此,建議在臨床應用之前,由該領域的多學科專家團隊進行質量評價,可使用失效模型、效果分析等方法進行風險分析[49],以確保AI模型安全、可靠,以及有臨床意義地使用。
5 未來展望
PC需要一種具有成本效益的早期病變篩查方法,AI對PC的風險評估和診斷有潛力產生重大的影響。AI對患者的數據進行了標準化的解釋,減少了人為的偏倚或錯誤,但其需要不同來源的廣泛數據,這些數據集在AI訓練中起著核心作用,因此,全社會合作和信息資源的共享至關重要。此外,AI模型也可與手機、智能手表關聯,實時數據傳輸可能有助于跨地域的醫務人員相互聯系和溝通,從而為患者找到最佳的臨床決策。通過整合復雜的數據,可以發揮AI在評估和信息交流中的潛力,為給患者更好地量身定制鋪平道路,協助監測和診斷疾病,實現精準醫學[50]和個性化護理[51]。不過,在疾病的篩查、預測和診斷中,AI的使用還需要進一步的發展,因為有相當多的障礙需要克服,如普適性、可解釋性、患者安全、倫理、立法、行政許可、成本效益等。未來AI將有更為廣泛的應用,但需要推進技術發展才能最終成為臨床實踐的主流[52]。
6 小結
PC的惡性程度高,生存率低,早期診斷對改變疾病進程至關重要。近年來,AI在PC領域的應用取得了重大進展。盡管AI在PC風險評估、醫學影像、病理檢查、生物標志物診斷中的作用得到了公認,但其仍可能存在偏倚、缺乏可解釋性、倫理、法律等問題,且將其整合到臨床實踐中所面臨的挑戰也迫切需要解決。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們無相互競爭的利益。
作者貢獻聲明:陳可涵撰寫論文,陸慧敏、趙華彬對論文進行指導并修改。