我國是世界上食管癌的高發國家之一。食管癌的早期發現與準確診療對提高患者的預后與生存具有重要意義。隨著醫學影像的積累和人工智能技術的進步,機器學習技術在癌癥中被廣泛應用。本文歸納了目前機器學習技術在食管癌基礎研究和臨床診斷中所用到的學習模型、圖像類型、數據類型與應用效率;探討了目前食管癌醫學圖像機器學習的主要困境和解決方法;討論了未來機器學習在食管癌診療中可能的方向,特別是建立醫學圖像與分子機制間聯系的可能。在此基礎上,對機器學習在醫學領域應用的一般規律進行了總結與展望。通過借鑒機器學習在其它癌癥中的先進成果,注重多學科交叉合作,將有效促進食管癌研究的發展。
引用本文: 吳越峰, 王琪, 吳明. 機器學習技術在食管癌研究領域中應用的現狀與展望. 中國胸心血管外科臨床雜志, 2022, 29(6): 770-776. doi: 10.7507/1007-4848.202203015 復制
癌癥的早期診斷與篩查是提高癌癥治愈率、延長患者生存時間、減輕患者經濟和精神負擔的重要方法。通過各種方法提高早期診斷與篩查的準確性是醫學影像學的重要研究內容。目前常見的用于各種癌癥診斷的醫學影像學手段主要有胸部 X線片、電子計算機斷層成像(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等[1]。影像學手段多用于判斷癌癥的存在與否和發病位置。然而,在病灶較小時難以進行準確判斷。除影像學檢查之外,穿刺取樣后進行病理學檢查具有重要的地位。病理學檢查被認為是癌癥診斷的“金標準”。常見的組織學方法有蘇木精-伊紅染色和針對特定癌癥標志物的免疫組織化學染色。病理學手段可在影像學診斷的基礎上明確癌癥的性質,進行評級分類。傳統的病理學研究主要集中在通過提升醫師職業技能和制定診斷標準來提高疾病診斷的準確性上[2]。準確度上,前述方法受制于醫師個人經驗;效率上,認讀圖片需要耗費執業醫師較長時間和較多精力。與此同時,人類大腦難以完整處理影像檢查或病理切片產生的海量數據,更難以通過觀察醫學影像,總結出普適規律。這對于過去積累的海量醫學數據是一種巨大浪費。隨著計算機技術的發展,利用計算機技術處理和分析醫學數據已經成為了一種必然。利用人工智能參與治療輔助的系統可大致分為兩類,即完全由人類設計的系統和計算機使用提取特征向量的示例數據進行訓練的系統[3]。圖像特征向量提取與運用可以由醫師完成,也可以由深度學習算法完成。卷積神經網絡(convolutional neural networks,CNN)就是一個目前被廣泛應用的深度學習算法。如今,深度學習已經被廣泛運用在病變分類、病變組織檢測、器官與組織分割、器官配準和其它任務中[4]。
1 機器學習在癌癥研究領域的應用
在過去10年中,人工智能技術已經廣泛被使用在癌癥的早期篩查、臨床輔助診斷和機理研究等方面。楊文靜等[5]通過文獻可視化計量等方式發現,過去10年發表的文獻集中在對于乳腺癌和肺癌的研究中。通過對高頻詞統計,其發現研究核心關注點在于對癌癥的分類和生存的預測。利用材料主要是X射線、CT、MRI和病理切片圖像等。在過去10年發表的成果中機器學習模型U-Net和支持向量機(support vector machines, SVM)被廣泛使用。基于這些模型,針對醫學圖像特征而改造的網絡模型也不斷涌現。然而,目前利用人工智能揭示分子和細胞生物學機理的研究成果較少。主要原因在于,深度學習模型難以進行合理解釋,常常被認為是“黑箱模型”。因此,構建可解釋的深度學習模型非常關鍵[6]。
影像學方面,目前已經實現對肺部結節的切分與良性惡性的分類[7],亦可以檢測肺癌與肺癌的分期[8]。相似的許多工作都建立了圖像與癌癥分期的模型。引人關注的是,基于CT圖像,表皮生長因子受體(epidermal growth factor receptor,EGFR)基因的突變和細胞程式死亡-配體1(programmed cell death-ligand 1,PD-L1)的表達情況亦可被預測。這是建立圖像與分子關系的重要工作[9],但不排除是此類關鍵基因突變造成了器官重大組織形態變化的可能。這些工作并不意味著深度學習模型可被用來預測所有基因的表達。
病理學方面,目前已經實現基于蘇木精-伊紅染色組織切片的突變分類[10]。根據基因組或轉錄組測序數據構建組織形態與基因表達關系的工作是當前研究的熱點。然而,目前大部分工作停留在對已有表型和基因之間的回顧性驗證,沒有發現新的機制。對所發現驗證機制也均停留在公開數據集層面,沒有收集新的數據,更罕有生物化學層面的驗證。這些模型存在缺乏普適性和應用前景的缺點。
2 食管癌診療的現狀和困境
食管癌是指來源于食管黏膜上皮細胞的惡性腫瘤。組織學上,食管癌大致可分為鱗狀細胞癌和腺癌兩種。我國食管癌患者大多表現為鱗狀細胞癌。隨著癌癥的發生與發展,深度上,食管癌從早期的局限于黏膜層的食管浸潤性癌逐步向黏膜下層甚至更深肌層轉移;廣度上,從局限于食管,向胃部轉移擴散[11]。通過組織切片可直觀觀察到癌變細胞的侵犯區域和癌癥的進展狀態。
食管癌在中國的發病率和死亡率居高不下。食管癌在中國惡性腫瘤發病率中位列第六,死亡率位列第四[12]。每年新增食管癌患者占全世界食管癌新增患者人數總和的50%左右[13]。其分布在中國存在明顯的地域特征和城鄉差異。食管癌發病率與地域飲食差異、生活習性、地方習俗和環境因素等存在密切聯系。目前已經證明飲酒、吸煙、喜燙食、好辣食與食管癌發病存在密切聯系[14]。
確診食管癌之后,手術是主要的治療手段。早期患者可采用內鏡下的微創治療(endoscopic mucosal resection,EMR),中晚期可切除患者可采用以手術為主的治療方式。對于不可切除的患者,采用以放射治療為主的綜合治療。早期食管癌手術治療效果佳[15],但是中晚期食管癌手術治療效果差強人意[16]。因此,食管癌的早期篩查和對應生物標記物的尋找對提升食管癌治療效果具有重要作用。
對高危人群和有吞咽異物感患者,往往采用影像學方式做初步的食管癌篩查。X射線氣鋇雙重對比造影、CT、MRI、超聲檢查、正電子發射計算機斷層顯像(positron emission computed tomography,PET-CT)檢查等影像學方法被列入國家衛生健康委員會制定的《食管癌診療規范》。 X射線與CT是兩種較為常用、經濟的影像學診斷方式。食管癌患者X射線影像可見食管壁僵硬及黏膜破壞。但是,X射線圖像對食管外侵診斷正確率較低,也不能對縱隔淋巴結轉移作出診斷。CT圖像可見食管壁增厚、軟組織腫塊等,可為探明周圍組織器官浸潤情況、淋巴結轉移情況以及后續治療方式提供參考。但是,CT圖像組織分辨率還不夠高,評估不夠準確,對癌癥的原發灶-淋巴結-遠處轉移(tumor-node-metastasis,TNM)分期無法進行精準判斷。而癌癥的準確分期恰是癌癥精準治療的重要環節[17]。
目前的局限在于,大多數腫瘤發生發展的分子機制研究和生物標記物的確定均集中在轉錄組測序技術(RNA-sequencing,RNA-seq)、全基因組測序(whole genome sequencing,WGS)和免疫組織化學(immunohistochemistry,IHC)層面。醫學影像學與腫瘤分子機制間存在的關系及規律尚未闡明。
3 當前機器學習在食管癌診療中的應用
為了全面總結當前機器學習在食管癌診療中的應用,本文系統梳理了近20年來被CNKI與PubMed檢索的關鍵詞為“食管癌” AND “機器學習”或“esophageal cancer”AND “machine learning”的非綜述類文獻。近年來,以CNN為代表的機器學習模式—深度學習被廣泛運用于食管癌診療中。傳統機器學習模型建立在大量的 “如果-就”(If-Then)規則之上,本質是概率論和事件處理方式。神經網絡(neural network)建立在對大腦神經元的模擬之上,本質是通過卷積層(convolution)從海量不同點中提取出信息,利用池化層(pooling)獲取有預測能力的特征,激活層可以建立輸入與輸出之間的聯系,通過不斷調整迭代(iteration)增加預測精度。
3.1 機器學習用于食管癌患者的早期診斷
早期診斷是改善食管癌預后的重要途徑。由于早期食管癌的隱蔽性,普通白光內鏡(white light endoscopy,WLI)、窄帶成像(narrow-band imaging,NBI)、激光共聚焦顯微內鏡(confocal laser microendoscopy,CLE)的結果存在較大的主觀性和不準確性[18]。隨著計算機視覺和圖像模式識別技術的發展,基于深度學習模型的各種圖像分類系統已經達到了令人驚嘆的準確度。四川大學華西醫院胡兵教授團隊開發了一個基于深度學習模型的食管癌診斷系統,利用6 473張經過專業醫師標記了癌前病變和食管鱗狀細胞癌NBI圖像,通過CNN模型(SegNet)提取圖像特征,構建了敏感性和特異性均超過90%的早期篩查模型 [19]。
Gehrung等[20]利用經典CNN模型VGG-16,基于來自2 331例食管癌患者的4 662個cytosponge-TFF3檢測樣本,構建優先級分類模型。這一模型極大降低了病理學家的工作量。目前,在其它癌種如肺癌等癌癥中,已經有利用組織切片的人工智能模型。食管癌在組織切片層面亦存在明顯形態特征,但目前尚未有此方面研究,這可能是未來機器學習在食管癌診療中應用的重要方向。
3.2 機器學習用于食管癌患者生存、分期、分級、療效預測
癌癥預后受到眾多因素影響。傳統的卡普蘭-梅爾估計量(Kaplan-Meier estimator)難以對多個因子進行聯合分析,logistic回歸等模型也不夠準確。因此,建立準確的預測模型,是臨床診療亟需解決的問題。
人工神經網絡(artificial neural network,ANN)早在2005年就被Sato等[21]利用在食管癌患者的生存預測中。Sato等[21]根據來自418例食管癌患者的臨床數據、TNM分期等信息創建了模型。但是,預測1年、5年生存率模型的精確度并不高。隨后, Mofidi等[22]利用216例食管癌患者的臨床信息、體重指數和病理數據集建立了預測食管癌和食管-胃連接部手術切除患者生存率的模型。獲得了接近90%的預測準確率,超過國際癌癥聯合會建立的TNM分類系統的準確率。可見,除患者數量之外,單一患者的數據維度和對數據的預處理方法都對模型準確性有影響。近期,Liu等[23]從523例患者的28個臨床變量中,篩選出了腫瘤浸潤深度、腫瘤長度、吞咽情況、腫瘤分化程度和淋巴血管浸潤程度這5個變量,進而用ANN建立了基于上述5個變量預測淋巴結擴散的模型。
最小分類誤差法(minimum classification error,MCE)方面,基于患者年齡、居住地、吸煙史、口腔健康等食管癌常見危險因素構建的風險預測模型,獲得了接近90%的準確率,超過了傳統的logistic回歸模型[24]。
SVM方面,Hayashida等[25]通過從27份血清樣本中獲得的蛋白質譜數據訓練了預測食管癌患者化學治療和放射治療療效模型。近期,Wang等[26]亦通過SVM模型利用1 200例CT掃描食管壁厚度數據,預測原發性胸段食管鱗狀細胞癌的T分期,得到可用于區分食管鱗狀細胞癌患者不同T期病變的最佳食管壁厚度閾值。值得注意的是,所用患者數據均經過了嚴格的CT和病理檢查,為數據的準確性和后期臨床應用的安全性提供了保證。
在CNN方面,Yeh等[27]收集了798例食管鱗狀細胞癌患者的PET圖像,278例接受食管切除術患者的PET圖像和309例Ⅰ期肺癌患者的PET圖像。首先,他們利用ResNet實現了基于PET圖像的食管鱗狀細胞癌與肺癌的區分。隨后,他們實現了食管癌患者淋巴血管浸潤(lymphovascular infiltration,LVI)和神經周圍浸潤(perineural infiltration,PNI)的分類和預測。
3.3 機器學習用于食管癌分子生物信息學解析
相比于醫學影像,隨著下一代測序技術和納米孔測序技術的發展,海量的基因組和轉錄組數據被生產出來。通過生物信息學分析差異基因和高突變基因,并結合逆轉錄定量聚合酶鏈反應、蛋白免疫印跡(Western blotting,WB)和基因編輯等方式在細胞水平或小鼠模型水平進行驗證,已經成為過去幾十年中極為重要的癌生物學研究方式。在整個生物信息學分析中最重要的內容可用“降維”二字來概括。通俗地講,就是如何從數量巨大的在統計學上有差異的基因中找出最有可能與疾病有關的基因。在基因組高度不穩定和具有異質性的癌癥中,這項工作更為困難,而食管癌就是這樣的一種癌癥。因為傳統生物信息學分析所得到的差異可能是由于腫瘤異質性得到的假陽性(false positive, type 2 error)結果。Mourikis等[28]通過機器學習算法實現了對每例患者中所有突變基因危害的整合描述。這一研究,發現除了公認癌基因(oncogene)之外的許多促癌基因(oncogenic promoter)并用實驗加以驗證。這一研究改變了傳統正向遺傳學(forward genetics)或反向遺傳學(reverse genetics)關注單一基因和信號通路的局限,為后續測序數據整合分析提供了良好范式。
針對轉錄組數據,亦有較多機器學習模型提出。比如利用SVM反卷積,通過RNA-seq數據推測免疫細胞組分和免疫浸潤狀態的CIBERSORT工具[29]。這項工具的開發,給本來已經被挖掘殆盡的轉錄組公共數據提供了新的挖掘途徑,并為單細胞測序提供佐證與對照。Pratama等[30]通過挖掘TCGA數據庫中口腔鱗癌的轉錄組數據,并通過CNN識別標志性基因,對口腔鱗癌的分子機制研究做出貢獻。Li等[31]整合5種機器學習模型(LR、SVM、ANN、RF、XGBoost),利用癌癥基因組圖譜計劃(the cancer genome atlas,TCGA)和基因表達數據庫(gene expression omnibus,GEO)公開轉錄組數據對食管癌中與預后有關的分子進行篩選,證明上皮分層蛋白(stratifin)是一個理想的預后標記物。
4 當前深度學習在食管癌診療中的困境
綜合上述,以ANN、SVM、MCE等為代表的傳統機器學習方法,學習內容簡單,并且需要人類注釋和設計。同時,學習內容也以數字記錄為主,圖像信息較少,難以進一步轉化利用。而以CNN為代表的深度學習技術可以依靠模型自主提取特征,不僅節省了人類注釋和設計的繁瑣工作;同時計算機視覺識別得出的特征亦可以促進人類對疾病特點的認識。故而,深度學習在智能醫學中的應用被寄予厚望。
4.1 深度學習模型運用的醫學倫理問題
臨床應用的深度學習模型在應用過程中存在倫理問題。首先是責任劃分問題,智能診斷系統并非完全準確的系統。對于誤診產生的后果,患者、醫院和制造商都是難以承受的。況且目前尚無有關法律法規出臺,責任界限難以劃分。其次是隱私保護問題,職業醫師被要求不能泄露患者隱私,但儲存在電腦中的人工智能程序可能被人為入侵,亦可能被有關人員故意泄露。這對于患者的隱私權是一種侵犯,并會對國家的生物安全造成影響[32]。基于以上問題,對策主要從制造、監管與使用3個層面展開。制造商應該遵守基本的倫理原則,同時做到數據來源透明,故障可被追溯。有關監管部門應該嚴格市場準入機制并根據人工智能醫療產品的迭代速度及時更新有關規定。使用時應該加強對患者和醫生的教育,避免對人工智能技術的片面理解,在人工智能發展初期堅持人類的全過程介入[33]。
4.2 深度學習需要的巨大算力與海量數據量問題
前文中已經提到,巨大的數據量是深度學習模型準確的必要條件,算力需要巨大。而大部分醫院儲存數據用服務器并不會用到深度學習所必須的圖形處理器(graphics processing unit,GPU),使用服務器供應商提供的算力支持又存在著患者數據泄露的問題。
在獲取到的海量數據中,也并非所有數據均可用于深度學習。這可能是各個醫院數據收集和數據標注的不統一導致的。部分采集設備市場保有率不高,通過這些采集設備獲得的數據可能存在批次效應(batch effect)。同時,對于數據的標注不同醫院精度相差很大。一方面,這是由不同醫院醫師的年資和經驗不同導致;另一方面,這是由醫院數據管理規范不嚴格導致。例如,CT圖像需要標注出食管腫瘤邊緣和食管結構,內鏡數據需要畫出病灶位置,病理切片需要區分出不同類型組織和癌癥浸潤區域。
4.3 深度學習應當推陳出新和服務理論研究與患者
目前基于深度學習或機器學習模型進行食管癌診療研究的論文層出不窮。但在真實世界診療過程中卻少見深度學習的運用。首先,這是由于論文探索目的大多具有同質性特征。目前深度學習的論文大多集中在對生存情況的預測,因為訓練所需數據量小且訓練算力需求少。這類重復發表的生存預測模型難以有實際的作用和對未來研究方向的指導。其次,基于深度學習的圖像預測模型,在訓練中,研究人員為了獲得較高的準確率,往往對數據進行了過度的處理和篩選,訓練集和驗證集來自同一數據集,在真實世界測試中無法滿足臨床要求。
在機制研究方面,由于食管癌深度學習缺少基于組織切片的模型,難以獲得腫瘤細胞形態與組織結構上的認識,深度學習難以對食管癌發生發展的機制研究有所啟示。同時,大多深度學習模型探索圖像類型單一,沒有建立CT與內鏡,內鏡與MRI或多特征整合分析模型,更缺乏RNA-seq、圖像數據及組織切片間的聯系。
5 未來深度學習在食管癌研究領域中可能的方向
5.1 建立醫學影像或組織切片與測序數據之間聯系的深度學習模型
目前絕大部分腫瘤學研究均基于中心法則進行,在脫氧核糖核酸、信使核糖核酸和蛋白質3個層面,通過基因組測序、轉錄組測序、熒光實時定量PCR等技術逐步闡明機制。同時,目前大多的正向遺傳學研究,闡明的表型僅僅在腫瘤大小和組織化學特征上,少有闡述其與醫學影像特征和轉錄組整體特征間的關系。這是因為人類在認知過程中無法同時關注醫學影像和轉錄組中的海量數據特征,且對特征的選擇和評價人與人之間存在差異。然而,拓展正向遺傳學研究邊界對遺傳學成果臨床運用具有重要理論與實踐價值。例如,Hippo信號通路已經被證明在調節器官大小和器官發育過程中具有重要作用,Hippo信號通路中的關鍵基因,如Yes1相關轉錄調節因子被認為是重要的生物標記物[34],但是其表達強度和影像學中器官大小與形態關系無定量表述。定量判斷作為精準醫療的重要步驟,深度學習模型的建立對其發展將產生深遠影響,因為神經網絡中的卷積和池化過程能夠對特征進行有效提取和總結。深度學習模型可用于藥物用量判定、手術方案指導等。同時,在此過程中由于強烈的理論研究特性和全過程的人類參與流程,規避了潛在的醫學倫理問題,創造了識錯糾錯的可能。
5.2 通過總結深度學習識別的特征,構建可解釋的機器學習模型進而深化對食管癌的認識
可解釋性被定義為“用可理解的語言向人解釋或表達的能力”[35]。構建可解釋的學習模型被認為是深度學習未來發展的重要方向。首先,面對復雜的醫學數據和患者個體特征,人類無法模擬所有的輸入情況來測試程序的穩定性,而獲取程序運算的邏輯有助于人類判斷程序的合理性并根據可視化中呈現出的錯誤有針對地改進算法[36]。其次,對于醫生而言,只能看到深度學習模型的輸入值和輸出值,無法知道運算的過程。這是醫生無法信任深度學習工具的重要原因。提高醫學深度學習模型的可解釋性有助于消除醫生與計算機模型之間的隔閡。更重要的是,作為知識發現的重要手段,可解釋的模型可以助力疾病機制的探究,人類有可能通過神經網絡總結出的聯系發現潛在的疾病影響因素。Rajpurkar等[37]通過可視化肺炎患者胸部X線片中病變區域,為臨床診斷提供重要輔助。Chen等[38]建立了上皮間質轉化(epithelial-mesenchymal transition,EMT)與蘇木精-伊紅染色切片的深度學習模型,并可視化了細胞形態,這為轉分化研究提供了重要線索。目前,尚未有可解釋的機器學習模型在食管癌研究中得到運用。然而,目前食管癌的發病機理尚未闡明。傳統的影像學、病理學、細胞和分子生物學等方法并不能完全滿足科研及臨床需求,比如病理切片中癌細胞侵犯區域特征和組織形態變化規律等。因此構建可解釋的機器學習模型在食管癌研究中至關重要。
6 總結與展望
綜上,機器學習技術在癌癥領域研究中存在巨大的理論研究價值和臨床應用價值。目前,該領域已經取得了許多令人矚目的成果。然而,當下的生物信息學研究工作已出現模式化趨勢,深度學習成果內容大同小異,使用同一模型對多個已知功能基因進行重復研究或對已有模型進行重復計算和模仿難以產生有效成果[39]。在尚有許多關鍵問題未被解決的今天,應該用好深度學習這一工具,探索未知癌癥發展機理,設法提高診斷準確率。 同時,目前食管癌領域的機器學習研究和其它癌癥相比處于滯后的狀態。部分原因是缺乏高質量的食管癌數據。一方面,應該加強數據的搜集與管理;另一方面,對于類似的小樣本癌癥與其它罕見病,建立可遷移學習模型。總體上來講,人工智能是未來醫學發展的重要方向之一,應該用積極的心態和辯證的眼光去看待它。醫學研究承載著造福人類健康的使命,將深度學習技術用于醫學研究,是計算機科學發展提供的機遇,也是歷史進程賦予的使命。
利益沖突:無。
作者貢獻:吳明負責論文主題構思;吳越峰負責文獻檢索、論文撰寫;王琪負責論文修改。
癌癥的早期診斷與篩查是提高癌癥治愈率、延長患者生存時間、減輕患者經濟和精神負擔的重要方法。通過各種方法提高早期診斷與篩查的準確性是醫學影像學的重要研究內容。目前常見的用于各種癌癥診斷的醫學影像學手段主要有胸部 X線片、電子計算機斷層成像(computed tomography,CT)、磁共振成像(magnetic resonance imaging,MRI)等[1]。影像學手段多用于判斷癌癥的存在與否和發病位置。然而,在病灶較小時難以進行準確判斷。除影像學檢查之外,穿刺取樣后進行病理學檢查具有重要的地位。病理學檢查被認為是癌癥診斷的“金標準”。常見的組織學方法有蘇木精-伊紅染色和針對特定癌癥標志物的免疫組織化學染色。病理學手段可在影像學診斷的基礎上明確癌癥的性質,進行評級分類。傳統的病理學研究主要集中在通過提升醫師職業技能和制定診斷標準來提高疾病診斷的準確性上[2]。準確度上,前述方法受制于醫師個人經驗;效率上,認讀圖片需要耗費執業醫師較長時間和較多精力。與此同時,人類大腦難以完整處理影像檢查或病理切片產生的海量數據,更難以通過觀察醫學影像,總結出普適規律。這對于過去積累的海量醫學數據是一種巨大浪費。隨著計算機技術的發展,利用計算機技術處理和分析醫學數據已經成為了一種必然。利用人工智能參與治療輔助的系統可大致分為兩類,即完全由人類設計的系統和計算機使用提取特征向量的示例數據進行訓練的系統[3]。圖像特征向量提取與運用可以由醫師完成,也可以由深度學習算法完成。卷積神經網絡(convolutional neural networks,CNN)就是一個目前被廣泛應用的深度學習算法。如今,深度學習已經被廣泛運用在病變分類、病變組織檢測、器官與組織分割、器官配準和其它任務中[4]。
1 機器學習在癌癥研究領域的應用
在過去10年中,人工智能技術已經廣泛被使用在癌癥的早期篩查、臨床輔助診斷和機理研究等方面。楊文靜等[5]通過文獻可視化計量等方式發現,過去10年發表的文獻集中在對于乳腺癌和肺癌的研究中。通過對高頻詞統計,其發現研究核心關注點在于對癌癥的分類和生存的預測。利用材料主要是X射線、CT、MRI和病理切片圖像等。在過去10年發表的成果中機器學習模型U-Net和支持向量機(support vector machines, SVM)被廣泛使用。基于這些模型,針對醫學圖像特征而改造的網絡模型也不斷涌現。然而,目前利用人工智能揭示分子和細胞生物學機理的研究成果較少。主要原因在于,深度學習模型難以進行合理解釋,常常被認為是“黑箱模型”。因此,構建可解釋的深度學習模型非常關鍵[6]。
影像學方面,目前已經實現對肺部結節的切分與良性惡性的分類[7],亦可以檢測肺癌與肺癌的分期[8]。相似的許多工作都建立了圖像與癌癥分期的模型。引人關注的是,基于CT圖像,表皮生長因子受體(epidermal growth factor receptor,EGFR)基因的突變和細胞程式死亡-配體1(programmed cell death-ligand 1,PD-L1)的表達情況亦可被預測。這是建立圖像與分子關系的重要工作[9],但不排除是此類關鍵基因突變造成了器官重大組織形態變化的可能。這些工作并不意味著深度學習模型可被用來預測所有基因的表達。
病理學方面,目前已經實現基于蘇木精-伊紅染色組織切片的突變分類[10]。根據基因組或轉錄組測序數據構建組織形態與基因表達關系的工作是當前研究的熱點。然而,目前大部分工作停留在對已有表型和基因之間的回顧性驗證,沒有發現新的機制。對所發現驗證機制也均停留在公開數據集層面,沒有收集新的數據,更罕有生物化學層面的驗證。這些模型存在缺乏普適性和應用前景的缺點。
2 食管癌診療的現狀和困境
食管癌是指來源于食管黏膜上皮細胞的惡性腫瘤。組織學上,食管癌大致可分為鱗狀細胞癌和腺癌兩種。我國食管癌患者大多表現為鱗狀細胞癌。隨著癌癥的發生與發展,深度上,食管癌從早期的局限于黏膜層的食管浸潤性癌逐步向黏膜下層甚至更深肌層轉移;廣度上,從局限于食管,向胃部轉移擴散[11]。通過組織切片可直觀觀察到癌變細胞的侵犯區域和癌癥的進展狀態。
食管癌在中國的發病率和死亡率居高不下。食管癌在中國惡性腫瘤發病率中位列第六,死亡率位列第四[12]。每年新增食管癌患者占全世界食管癌新增患者人數總和的50%左右[13]。其分布在中國存在明顯的地域特征和城鄉差異。食管癌發病率與地域飲食差異、生活習性、地方習俗和環境因素等存在密切聯系。目前已經證明飲酒、吸煙、喜燙食、好辣食與食管癌發病存在密切聯系[14]。
確診食管癌之后,手術是主要的治療手段。早期患者可采用內鏡下的微創治療(endoscopic mucosal resection,EMR),中晚期可切除患者可采用以手術為主的治療方式。對于不可切除的患者,采用以放射治療為主的綜合治療。早期食管癌手術治療效果佳[15],但是中晚期食管癌手術治療效果差強人意[16]。因此,食管癌的早期篩查和對應生物標記物的尋找對提升食管癌治療效果具有重要作用。
對高危人群和有吞咽異物感患者,往往采用影像學方式做初步的食管癌篩查。X射線氣鋇雙重對比造影、CT、MRI、超聲檢查、正電子發射計算機斷層顯像(positron emission computed tomography,PET-CT)檢查等影像學方法被列入國家衛生健康委員會制定的《食管癌診療規范》。 X射線與CT是兩種較為常用、經濟的影像學診斷方式。食管癌患者X射線影像可見食管壁僵硬及黏膜破壞。但是,X射線圖像對食管外侵診斷正確率較低,也不能對縱隔淋巴結轉移作出診斷。CT圖像可見食管壁增厚、軟組織腫塊等,可為探明周圍組織器官浸潤情況、淋巴結轉移情況以及后續治療方式提供參考。但是,CT圖像組織分辨率還不夠高,評估不夠準確,對癌癥的原發灶-淋巴結-遠處轉移(tumor-node-metastasis,TNM)分期無法進行精準判斷。而癌癥的準確分期恰是癌癥精準治療的重要環節[17]。
目前的局限在于,大多數腫瘤發生發展的分子機制研究和生物標記物的確定均集中在轉錄組測序技術(RNA-sequencing,RNA-seq)、全基因組測序(whole genome sequencing,WGS)和免疫組織化學(immunohistochemistry,IHC)層面。醫學影像學與腫瘤分子機制間存在的關系及規律尚未闡明。
3 當前機器學習在食管癌診療中的應用
為了全面總結當前機器學習在食管癌診療中的應用,本文系統梳理了近20年來被CNKI與PubMed檢索的關鍵詞為“食管癌” AND “機器學習”或“esophageal cancer”AND “machine learning”的非綜述類文獻。近年來,以CNN為代表的機器學習模式—深度學習被廣泛運用于食管癌診療中。傳統機器學習模型建立在大量的 “如果-就”(If-Then)規則之上,本質是概率論和事件處理方式。神經網絡(neural network)建立在對大腦神經元的模擬之上,本質是通過卷積層(convolution)從海量不同點中提取出信息,利用池化層(pooling)獲取有預測能力的特征,激活層可以建立輸入與輸出之間的聯系,通過不斷調整迭代(iteration)增加預測精度。
3.1 機器學習用于食管癌患者的早期診斷
早期診斷是改善食管癌預后的重要途徑。由于早期食管癌的隱蔽性,普通白光內鏡(white light endoscopy,WLI)、窄帶成像(narrow-band imaging,NBI)、激光共聚焦顯微內鏡(confocal laser microendoscopy,CLE)的結果存在較大的主觀性和不準確性[18]。隨著計算機視覺和圖像模式識別技術的發展,基于深度學習模型的各種圖像分類系統已經達到了令人驚嘆的準確度。四川大學華西醫院胡兵教授團隊開發了一個基于深度學習模型的食管癌診斷系統,利用6 473張經過專業醫師標記了癌前病變和食管鱗狀細胞癌NBI圖像,通過CNN模型(SegNet)提取圖像特征,構建了敏感性和特異性均超過90%的早期篩查模型 [19]。
Gehrung等[20]利用經典CNN模型VGG-16,基于來自2 331例食管癌患者的4 662個cytosponge-TFF3檢測樣本,構建優先級分類模型。這一模型極大降低了病理學家的工作量。目前,在其它癌種如肺癌等癌癥中,已經有利用組織切片的人工智能模型。食管癌在組織切片層面亦存在明顯形態特征,但目前尚未有此方面研究,這可能是未來機器學習在食管癌診療中應用的重要方向。
3.2 機器學習用于食管癌患者生存、分期、分級、療效預測
癌癥預后受到眾多因素影響。傳統的卡普蘭-梅爾估計量(Kaplan-Meier estimator)難以對多個因子進行聯合分析,logistic回歸等模型也不夠準確。因此,建立準確的預測模型,是臨床診療亟需解決的問題。
人工神經網絡(artificial neural network,ANN)早在2005年就被Sato等[21]利用在食管癌患者的生存預測中。Sato等[21]根據來自418例食管癌患者的臨床數據、TNM分期等信息創建了模型。但是,預測1年、5年生存率模型的精確度并不高。隨后, Mofidi等[22]利用216例食管癌患者的臨床信息、體重指數和病理數據集建立了預測食管癌和食管-胃連接部手術切除患者生存率的模型。獲得了接近90%的預測準確率,超過國際癌癥聯合會建立的TNM分類系統的準確率。可見,除患者數量之外,單一患者的數據維度和對數據的預處理方法都對模型準確性有影響。近期,Liu等[23]從523例患者的28個臨床變量中,篩選出了腫瘤浸潤深度、腫瘤長度、吞咽情況、腫瘤分化程度和淋巴血管浸潤程度這5個變量,進而用ANN建立了基于上述5個變量預測淋巴結擴散的模型。
最小分類誤差法(minimum classification error,MCE)方面,基于患者年齡、居住地、吸煙史、口腔健康等食管癌常見危險因素構建的風險預測模型,獲得了接近90%的準確率,超過了傳統的logistic回歸模型[24]。
SVM方面,Hayashida等[25]通過從27份血清樣本中獲得的蛋白質譜數據訓練了預測食管癌患者化學治療和放射治療療效模型。近期,Wang等[26]亦通過SVM模型利用1 200例CT掃描食管壁厚度數據,預測原發性胸段食管鱗狀細胞癌的T分期,得到可用于區分食管鱗狀細胞癌患者不同T期病變的最佳食管壁厚度閾值。值得注意的是,所用患者數據均經過了嚴格的CT和病理檢查,為數據的準確性和后期臨床應用的安全性提供了保證。
在CNN方面,Yeh等[27]收集了798例食管鱗狀細胞癌患者的PET圖像,278例接受食管切除術患者的PET圖像和309例Ⅰ期肺癌患者的PET圖像。首先,他們利用ResNet實現了基于PET圖像的食管鱗狀細胞癌與肺癌的區分。隨后,他們實現了食管癌患者淋巴血管浸潤(lymphovascular infiltration,LVI)和神經周圍浸潤(perineural infiltration,PNI)的分類和預測。
3.3 機器學習用于食管癌分子生物信息學解析
相比于醫學影像,隨著下一代測序技術和納米孔測序技術的發展,海量的基因組和轉錄組數據被生產出來。通過生物信息學分析差異基因和高突變基因,并結合逆轉錄定量聚合酶鏈反應、蛋白免疫印跡(Western blotting,WB)和基因編輯等方式在細胞水平或小鼠模型水平進行驗證,已經成為過去幾十年中極為重要的癌生物學研究方式。在整個生物信息學分析中最重要的內容可用“降維”二字來概括。通俗地講,就是如何從數量巨大的在統計學上有差異的基因中找出最有可能與疾病有關的基因。在基因組高度不穩定和具有異質性的癌癥中,這項工作更為困難,而食管癌就是這樣的一種癌癥。因為傳統生物信息學分析所得到的差異可能是由于腫瘤異質性得到的假陽性(false positive, type 2 error)結果。Mourikis等[28]通過機器學習算法實現了對每例患者中所有突變基因危害的整合描述。這一研究,發現除了公認癌基因(oncogene)之外的許多促癌基因(oncogenic promoter)并用實驗加以驗證。這一研究改變了傳統正向遺傳學(forward genetics)或反向遺傳學(reverse genetics)關注單一基因和信號通路的局限,為后續測序數據整合分析提供了良好范式。
針對轉錄組數據,亦有較多機器學習模型提出。比如利用SVM反卷積,通過RNA-seq數據推測免疫細胞組分和免疫浸潤狀態的CIBERSORT工具[29]。這項工具的開發,給本來已經被挖掘殆盡的轉錄組公共數據提供了新的挖掘途徑,并為單細胞測序提供佐證與對照。Pratama等[30]通過挖掘TCGA數據庫中口腔鱗癌的轉錄組數據,并通過CNN識別標志性基因,對口腔鱗癌的分子機制研究做出貢獻。Li等[31]整合5種機器學習模型(LR、SVM、ANN、RF、XGBoost),利用癌癥基因組圖譜計劃(the cancer genome atlas,TCGA)和基因表達數據庫(gene expression omnibus,GEO)公開轉錄組數據對食管癌中與預后有關的分子進行篩選,證明上皮分層蛋白(stratifin)是一個理想的預后標記物。
4 當前深度學習在食管癌診療中的困境
綜合上述,以ANN、SVM、MCE等為代表的傳統機器學習方法,學習內容簡單,并且需要人類注釋和設計。同時,學習內容也以數字記錄為主,圖像信息較少,難以進一步轉化利用。而以CNN為代表的深度學習技術可以依靠模型自主提取特征,不僅節省了人類注釋和設計的繁瑣工作;同時計算機視覺識別得出的特征亦可以促進人類對疾病特點的認識。故而,深度學習在智能醫學中的應用被寄予厚望。
4.1 深度學習模型運用的醫學倫理問題
臨床應用的深度學習模型在應用過程中存在倫理問題。首先是責任劃分問題,智能診斷系統并非完全準確的系統。對于誤診產生的后果,患者、醫院和制造商都是難以承受的。況且目前尚無有關法律法規出臺,責任界限難以劃分。其次是隱私保護問題,職業醫師被要求不能泄露患者隱私,但儲存在電腦中的人工智能程序可能被人為入侵,亦可能被有關人員故意泄露。這對于患者的隱私權是一種侵犯,并會對國家的生物安全造成影響[32]。基于以上問題,對策主要從制造、監管與使用3個層面展開。制造商應該遵守基本的倫理原則,同時做到數據來源透明,故障可被追溯。有關監管部門應該嚴格市場準入機制并根據人工智能醫療產品的迭代速度及時更新有關規定。使用時應該加強對患者和醫生的教育,避免對人工智能技術的片面理解,在人工智能發展初期堅持人類的全過程介入[33]。
4.2 深度學習需要的巨大算力與海量數據量問題
前文中已經提到,巨大的數據量是深度學習模型準確的必要條件,算力需要巨大。而大部分醫院儲存數據用服務器并不會用到深度學習所必須的圖形處理器(graphics processing unit,GPU),使用服務器供應商提供的算力支持又存在著患者數據泄露的問題。
在獲取到的海量數據中,也并非所有數據均可用于深度學習。這可能是各個醫院數據收集和數據標注的不統一導致的。部分采集設備市場保有率不高,通過這些采集設備獲得的數據可能存在批次效應(batch effect)。同時,對于數據的標注不同醫院精度相差很大。一方面,這是由不同醫院醫師的年資和經驗不同導致;另一方面,這是由醫院數據管理規范不嚴格導致。例如,CT圖像需要標注出食管腫瘤邊緣和食管結構,內鏡數據需要畫出病灶位置,病理切片需要區分出不同類型組織和癌癥浸潤區域。
4.3 深度學習應當推陳出新和服務理論研究與患者
目前基于深度學習或機器學習模型進行食管癌診療研究的論文層出不窮。但在真實世界診療過程中卻少見深度學習的運用。首先,這是由于論文探索目的大多具有同質性特征。目前深度學習的論文大多集中在對生存情況的預測,因為訓練所需數據量小且訓練算力需求少。這類重復發表的生存預測模型難以有實際的作用和對未來研究方向的指導。其次,基于深度學習的圖像預測模型,在訓練中,研究人員為了獲得較高的準確率,往往對數據進行了過度的處理和篩選,訓練集和驗證集來自同一數據集,在真實世界測試中無法滿足臨床要求。
在機制研究方面,由于食管癌深度學習缺少基于組織切片的模型,難以獲得腫瘤細胞形態與組織結構上的認識,深度學習難以對食管癌發生發展的機制研究有所啟示。同時,大多深度學習模型探索圖像類型單一,沒有建立CT與內鏡,內鏡與MRI或多特征整合分析模型,更缺乏RNA-seq、圖像數據及組織切片間的聯系。
5 未來深度學習在食管癌研究領域中可能的方向
5.1 建立醫學影像或組織切片與測序數據之間聯系的深度學習模型
目前絕大部分腫瘤學研究均基于中心法則進行,在脫氧核糖核酸、信使核糖核酸和蛋白質3個層面,通過基因組測序、轉錄組測序、熒光實時定量PCR等技術逐步闡明機制。同時,目前大多的正向遺傳學研究,闡明的表型僅僅在腫瘤大小和組織化學特征上,少有闡述其與醫學影像特征和轉錄組整體特征間的關系。這是因為人類在認知過程中無法同時關注醫學影像和轉錄組中的海量數據特征,且對特征的選擇和評價人與人之間存在差異。然而,拓展正向遺傳學研究邊界對遺傳學成果臨床運用具有重要理論與實踐價值。例如,Hippo信號通路已經被證明在調節器官大小和器官發育過程中具有重要作用,Hippo信號通路中的關鍵基因,如Yes1相關轉錄調節因子被認為是重要的生物標記物[34],但是其表達強度和影像學中器官大小與形態關系無定量表述。定量判斷作為精準醫療的重要步驟,深度學習模型的建立對其發展將產生深遠影響,因為神經網絡中的卷積和池化過程能夠對特征進行有效提取和總結。深度學習模型可用于藥物用量判定、手術方案指導等。同時,在此過程中由于強烈的理論研究特性和全過程的人類參與流程,規避了潛在的醫學倫理問題,創造了識錯糾錯的可能。
5.2 通過總結深度學習識別的特征,構建可解釋的機器學習模型進而深化對食管癌的認識
可解釋性被定義為“用可理解的語言向人解釋或表達的能力”[35]。構建可解釋的學習模型被認為是深度學習未來發展的重要方向。首先,面對復雜的醫學數據和患者個體特征,人類無法模擬所有的輸入情況來測試程序的穩定性,而獲取程序運算的邏輯有助于人類判斷程序的合理性并根據可視化中呈現出的錯誤有針對地改進算法[36]。其次,對于醫生而言,只能看到深度學習模型的輸入值和輸出值,無法知道運算的過程。這是醫生無法信任深度學習工具的重要原因。提高醫學深度學習模型的可解釋性有助于消除醫生與計算機模型之間的隔閡。更重要的是,作為知識發現的重要手段,可解釋的模型可以助力疾病機制的探究,人類有可能通過神經網絡總結出的聯系發現潛在的疾病影響因素。Rajpurkar等[37]通過可視化肺炎患者胸部X線片中病變區域,為臨床診斷提供重要輔助。Chen等[38]建立了上皮間質轉化(epithelial-mesenchymal transition,EMT)與蘇木精-伊紅染色切片的深度學習模型,并可視化了細胞形態,這為轉分化研究提供了重要線索。目前,尚未有可解釋的機器學習模型在食管癌研究中得到運用。然而,目前食管癌的發病機理尚未闡明。傳統的影像學、病理學、細胞和分子生物學等方法并不能完全滿足科研及臨床需求,比如病理切片中癌細胞侵犯區域特征和組織形態變化規律等。因此構建可解釋的機器學習模型在食管癌研究中至關重要。
6 總結與展望
綜上,機器學習技術在癌癥領域研究中存在巨大的理論研究價值和臨床應用價值。目前,該領域已經取得了許多令人矚目的成果。然而,當下的生物信息學研究工作已出現模式化趨勢,深度學習成果內容大同小異,使用同一模型對多個已知功能基因進行重復研究或對已有模型進行重復計算和模仿難以產生有效成果[39]。在尚有許多關鍵問題未被解決的今天,應該用好深度學習這一工具,探索未知癌癥發展機理,設法提高診斷準確率。 同時,目前食管癌領域的機器學習研究和其它癌癥相比處于滯后的狀態。部分原因是缺乏高質量的食管癌數據。一方面,應該加強數據的搜集與管理;另一方面,對于類似的小樣本癌癥與其它罕見病,建立可遷移學習模型。總體上來講,人工智能是未來醫學發展的重要方向之一,應該用積極的心態和辯證的眼光去看待它。醫學研究承載著造福人類健康的使命,將深度學習技術用于醫學研究,是計算機科學發展提供的機遇,也是歷史進程賦予的使命。
利益沖突:無。
作者貢獻:吳明負責論文主題構思;吳越峰負責文獻檢索、論文撰寫;王琪負責論文修改。