隨著醫學信息技術與計算機科學的蓬勃發展,醫療服務行業逐漸從信息化向智慧化過渡。醫學知識圖譜在知識問答和智能診斷等智能醫療應用中發揮了重要作用,是推進智慧醫療的關鍵技術,也是醫療信息智能化管理的基礎。為了充分發掘知識圖譜在醫學領域中的巨大潛力,本文從藥物間關系發現、輔助診斷、個性化推薦、決策支持和智能預測這五個方面展開,介紹了醫學知識圖譜的最新研究進展,并結合當前醫學知識圖譜面臨的挑戰與問題提出相關建議,為推進醫學知識圖譜廣泛應用提供參考。
0 引言
知識圖譜是完善知識管理和智能服務的新興技術,以更接近人類認知世界的形式進行信息表示,為組織、管理和理解海量信息提供了更好的方法。知識圖譜于2012年由Google正式提出,其初衷是為了提高搜索引擎的能力,增強用戶的搜索質量及搜索體驗,主要包括通用知識圖譜和領域知識圖譜[1]。通用知識圖譜更注重廣度,強調融合更多的實體,包含大量的常識性內容。領域知識圖譜所包含的知識具有很強的專業性,依靠特定領域的數據來進行構建。較通用知識圖譜而言,領域知識圖譜的準確度較高,具有特定的領域意義,目前主要的應用領域包括地理學領域、醫學領域、電子商務領域等[2-3]。
醫學知識圖譜以結構化的形式描述醫學實體和關系,是整合海量醫學資源的重要表示之一[4]。將醫學知識圖譜與人工智能技術相結合,可以提高醫生的診斷效率,在智慧醫療建設中具有關鍵性作用。為了探究知識圖譜在醫學領域中的應用現狀與發展前景,本文從藥物間關系發現、輔助診斷、個性化推薦、決策支持和智能預測這五個方面討論了知識圖譜在醫學領域的具體應用。
1 藥物間關系發現
藥物的研究歷史悠久,但許多藥理作用的發現確是偶然的[5]。僅僅依靠傳統的方法去探究藥理已經不能滿足藥物研究的需求,知識圖譜作為一種新的方法應用到藥物研究中,有望彌補傳統方法在藥物研究方面的不足。目前基于知識圖譜的藥物研究主要集中在藥物再利用、藥物間不良反應、聯合藥物治療等方面。
新藥研發具有周期長、成本高的特點,這使得研發新藥成為一項艱巨的任務,而藥物再利用作為新藥研發的重要補充,有效緩解了新藥研發面臨的難題。目前基于知識圖譜的藥物再利用已在識別傳統疑難疾病和突發性傳染病有效藥物的任務中取得一定的成果。在識別傳統疑難疾病的有效藥物研究中,桑盛田等[6]提出融合知識圖譜與深度學習的藥物發現方法,從已發表的文獻中挖掘疾病的潛在治療藥物。在識別突發急性傳染病有效藥物的研究中,Korn等[7]將現有的生物醫學知識圖譜與新型冠狀病毒感染 (corona virus disease 2019, COVID-19)最新生物醫學文獻信息相結合,建立了一個基于COVID-19的知識庫,通過對知識圖節點之間的關系進行推斷來確定潛在的候選藥物,實現已知藥物和臨床候選藥物的再利用。除此以外,還有更多藥物發現相關的工作也在陸續展開[8-12]。
現有藥物的未知不良反應會給患者帶來巨大的安全隱患,也限制了研究人員對藥物成本的準確判斷,提前預知藥物可能帶來的不良反應是有效解決上述問題的突破點,而機器學習與知識圖譜相結合具有從現有知識中預測未知不良反應的潛力。Bean等[13]以藥物不良反應(adverse drug reactions,ADR)的知識圖譜為基礎,開發了一種基于簡單富集測試的機器學習算法,用于預測和了解臨床試驗中未觀察到的ADR,該算法可自動檢測到ADR并報告給相關監管機構,緩解了目前藥物上市后監測報告不足的問題,同時減少了藥物給患者帶來的安全隱患。
聯合藥物治療是治療復雜疾病的一種很有前景的策略,在缺乏有效的單一療法的情況下,聯合用藥發揮了重要作用[14]。Du等[15]提出一種自動化算法,根據從生物醫學文獻的結論性聲明中提取的語義預測,發現有關聯合藥物治療的知識,構建聯合藥物治療知識圖譜并應用到精準醫療中,根據患者基因譜的個體差異進行最佳的疾病管理,可幫助專家高效識別有效的聯合療法。
2 輔助診斷
在臨床診斷和治療的基本過程中,醫生收集患者信息,結合自己已有的經驗和知識來決定下一個臨床階段的具體診療措施。而醫生對患者信息的判斷可能會受到特定情況、感覺能力和實踐經驗的影響,其判斷具有主觀性,難以統一標準[16]。因此,需要將醫生診斷過程的經驗轉化為知識,使得診斷結果客觀可追溯,是目前診斷方式的轉變方向。要想完成這一轉變,構建可靠的醫學知識圖譜來輔助診斷是未來的研究重點。
基于知識圖譜的輔助診斷,主要采用知識嵌入、深度學習和知識推理等方法,根據醫學實體間的關系獲得對應的推理路徑,最后結合癥狀和疾病間的關系,明確疾病診斷。Chai等[17]以甲狀腺疾病為例,構建醫學知識圖譜提取生物醫學實體之間的關系,然后通過知識嵌入的方法將知識圖譜中的實體和關系轉化為低維的連續向量,利用已知的病理疾病關系數據,訓練雙向長短期記憶網絡(bi-directional long short-term memory,Bi-LSTM)的疾病診斷模型,結果表明基于深度學習和知識圖譜融合的甲狀腺疾病診斷比手工診斷更有效,比基于機器學習方法的診斷更準確。在中醫診斷領域,Xie等[18]在中醫癥狀知識圖譜中引入了強化學習算法來挖掘實體間的隱性關系并獲得推理路徑,根據這個推理路徑,可以推斷出從癥狀到綜合征的路徑。Zhang等[19]提出了一種通過知識圖譜上的演繹推理來模擬辨證論治的方法,該方法根據知識圖譜中路徑的加權得分計算可能性,從而對結果進行推理,以期實現中醫的自動化診斷。而針對傳統的知識圖譜診斷方法多針對靜態數據,不適用于具有動態變化特征醫學數據的缺點,Song等[20]提出了一種基于嵌入式表示的深度學習方法,通過使用門控循環單元將時間信息引入知識圖譜,并使用知識嵌入的方法保證知識圖譜的結構屬性,通過醫學知識與時間數據的融合,提高了算法的準確性和算術性能,有效提升了診斷方案的可靠性。
3 個性化推薦
隨著精準醫學的普及和發展,越來越多的患者開始尋求個性化醫療服務,但是患者在疾病和行為方面具有異質性的特點,提供個性化建議是一個巨大的挑戰[21]。為了滿足患者的需求,醫生需要不斷關注快速發展的醫學研究報告,并在大量領域知識的基礎上積累有效的臨床治療案例,因而加重了醫生學習領域知識的負擔。另一方面,隨著人工智能技術的興起,機器學習和深度學習為基于醫學知識圖譜的智能推薦提供了核心技術,在個性化推薦中充分應用人工智能技術,可以有效減輕醫生的負擔。目前,基于知識圖譜的智能推薦已應用在科室推薦、藥物推薦、處方推薦以及個性化飲食推薦等方面。例如,Liu等[22]基于區域衛生平臺和醫療網站的電子健康檔案數據,建立了一個疾病知識圖譜,在此基礎上開發了一個智能醫院指導系統,根據患者和系統的對話來為患者推薦合適的科室。Yang等[23]使用當前主流的草藥數據庫來構建草藥知識圖譜,其中包含草藥的名稱、功能、禁忌證、疾病、化學成分、靶基因和蛋白質等實體信息,使用知識圖中草藥的一些屬性作為附加的輔助信息,并提出了一種多層信息融合的圖卷積(graph convolutional networks,GCN)模型,利用草藥特性和融合不同層次的特征表示來增強草藥推薦效果,并在中藥處方數據集上的進行實驗,從而證實了該方法的有效性。Wang等[24]利用中醫知識圖譜實現了中醫病歷推薦系統,根據患者的癥狀推薦相關處方,并以真實的中醫臨床數據驗證了該方法的可行性,推薦的準確率在85%以上。
由于傳統的系統通常是根據歷史記錄來推薦藥物,推薦的變化速度無法跟上醫療實踐中新療法和治療方法的快速更新,在歷史電子病歷中,甚至在完善的知識圖譜中,幾乎沒有關于新的ADR信息,這使得基于歷史記錄的推薦模型很難支持新藥物的更新推薦。考慮到上述挑戰,Gong等[25]提出了一個框架,稱為安全醫學推薦(safe medical recommendations,SMR)。SMR通過橋接電子病歷和醫學知識圖譜構建了一個高質量的異質圖,且SMR將疾病、藥品、患者及其相應的關系共同嵌入到一個共享的低維空間,最后SMR使用嵌入將藥品推薦分解為一個鏈接預測過程,同時考慮患者的診斷方案和ADR,為患者推薦新出現的藥品。此外,還有研究者們基于構建的健康飲食知識圖譜,根據用戶的舌相分類,自動對用戶的體質類型進行分類,并提供個性化的食物建議[26]。
4 決策支持
決策支持系統是實現精準醫療的關鍵,高效的決策支持系統可以減輕醫生的壓力,盡可能減少誤診情況的發生[27]。為了實現精準醫療的決策支持,當前主要采用的方法是基于知識圖譜來構建監測和分析系統,從而實時監測和分析患者的狀態,并在系統中引入風險預測模型,根據患者狀態信息,自動生成診斷方案、評估潛在風險。Shang等[28]利用面向電子病歷的知識圖譜,創建了一個電子病歷數據軌跡,并通過語義規則進行推理,通過推理的足跡,識別其他科室被忽視的慢性腎臟病患者,幫助臨床醫生做出綜合決策。Wang等[29]將風險預測模型納入知識圖譜,可以為預防和控制糖尿病及其并發癥提供決策支持。Xiong等[30]從電子病歷中提取中成藥(Chinese patent medicine,CPM)、疾病、癥狀等信息,構建知識圖譜,基于該圖譜生成CPM監測的規則庫,對CPM的綜合使用、重復用藥、藥與病、藥量、循證治療等情況進行監測,提供決策支持,同時對醫生的處方進行多項基本審查,實現處方監控,確保用藥安全。
5 智能預測
智能預測是醫學知識圖譜研究的熱點也是難點,精準的預測是實現智慧醫療的最終目標。當前智能預測的方法主要包括基于GCN的方法、基于神經網絡的方法、基于知識圖譜和注意力機制結合的方法等。這些方法已經在臨床結果預測、疾病預測、癌癥致死率預測、醫學編碼預測等方面取得一定的成果。
臨床結果預測對患者和醫療服務提供者均具有重要影響,現有方法難以捕捉不同數據集特征和臨床結果之間的變化關系,因此會導致多中心臨床試驗的數據未能充分發揮其作用。為了緩解以上問題,Chu等[31]提出了一個對抗性學習模型來捕捉來自多中心異質臨床數據集的患者特征表示,這些特征用GCN自動編碼器來訓練,以預測心衰患者的急性腎臟損傷。
疾病間存在著錯綜復雜的關系,發現疾病之間的聯系,可以提前預知患者的潛在疾病,幫助醫生及時優化診斷方案,從而提高疾病的治愈率。Sun等[32]提出一種基于神經網絡的疾病預測模型,通過捕捉電子病歷和醫學數據庫的知識,結合患者的癥狀來歸納推斷其嵌入,實現對一般疾病和罕見疾病的準確預測。Pham等[33]從健康相關數據集和醫學領域知識的語料庫中學習,構建醫學領域知識圖譜,基于該圖譜開發出一個多疾病預測模型,以預測患者的潛在疾病。
在癌癥致死率和醫學編碼預測研究中,Wang等[34]提出了一種基于圖神經網絡的新模型,通過該模型將知識圖譜信息納入合成致死性預測任務中,用于人類癌癥綜合致死率預測。Teng等[35]將知識圖譜和注意力機制擴展到醫學編碼預測中,根據醫療記錄的內容預測最終的國際疾病分類編碼,將數據驅動的方法與醫學知識相結合,極大地提高了編碼預測的精度,減少了編碼人員的工作壓力。
6 結論和展望
本文總結了知識圖譜在醫學領域的研究進展,目前醫學知識圖譜的主要應用方向可歸納為五個方面:①基于藥物知識圖譜,結合機器學習和深度學習的方法,實現ADR預測、識別有效的聯合藥物療法、挖掘疾病的潛在治療藥物和快速確定流行病的候選藥物;②根據患者信息,采用知識嵌入、深度學習和知識推理等方法,結合癥狀間的關系確認疾病,輔助醫生進行疾病診斷;③根據不同類型的患者推薦不同的診斷方式方法,實現個性化的醫療服務,具體包括科室推薦、藥物推薦、處方推薦以及個性化飲食推薦等方面;④構建細粒度的垂直領域知識圖譜,基于該圖譜建立決策評估模型,實時檢測和分析患者狀態,自動生成診斷參考方案、評估潛在風險,幫助臨床醫生做出綜合決策;⑤知識圖譜結合GCN、神經網絡、注意力機制等方法實現智能預測,包括臨床結果預測、疾病預測、癌癥致死率預測、醫學編碼預測等。
綜上所述,知識圖譜作為聚合領域知識的一種有效手段,可以將醫生的臨床經驗轉換為醫學知識,使得臨床診斷的結果更加客觀可追溯。隨著醫學知識圖譜與圖推理、機器學習、深度學習等人工技術的結合,在藥物間關系發現、輔助診斷、個性化推薦、決策支持和智能預測方面取得優異的成果,大大減輕了醫生的負擔。但是在實際應用中,主要還存在以下兩個問題:全科醫學知識圖譜完整性不足和知識推理結果的可靠性難以保證。對于前者,仍需計算機科學家與醫學領域專家的共同努力,繼續完善規范醫學知識圖譜;對于后者,基于知識圖譜的推理系統主要是根據特定疾病的特點進行推理和預測,推理的方法還無法推廣普及,基于知識圖譜的推理系統只能扮演支持和輔助的角色,還不能完全有效保證推理結果的準確性和可靠性。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:鄭增亮提出研究思路及論文起草;蔡曉瓊負責論文最終版本修改;蘇前敏參與論文思路分析,論文修改指導;黃繼漢參與論文思路指導。
0 引言
知識圖譜是完善知識管理和智能服務的新興技術,以更接近人類認知世界的形式進行信息表示,為組織、管理和理解海量信息提供了更好的方法。知識圖譜于2012年由Google正式提出,其初衷是為了提高搜索引擎的能力,增強用戶的搜索質量及搜索體驗,主要包括通用知識圖譜和領域知識圖譜[1]。通用知識圖譜更注重廣度,強調融合更多的實體,包含大量的常識性內容。領域知識圖譜所包含的知識具有很強的專業性,依靠特定領域的數據來進行構建。較通用知識圖譜而言,領域知識圖譜的準確度較高,具有特定的領域意義,目前主要的應用領域包括地理學領域、醫學領域、電子商務領域等[2-3]。
醫學知識圖譜以結構化的形式描述醫學實體和關系,是整合海量醫學資源的重要表示之一[4]。將醫學知識圖譜與人工智能技術相結合,可以提高醫生的診斷效率,在智慧醫療建設中具有關鍵性作用。為了探究知識圖譜在醫學領域中的應用現狀與發展前景,本文從藥物間關系發現、輔助診斷、個性化推薦、決策支持和智能預測這五個方面討論了知識圖譜在醫學領域的具體應用。
1 藥物間關系發現
藥物的研究歷史悠久,但許多藥理作用的發現確是偶然的[5]。僅僅依靠傳統的方法去探究藥理已經不能滿足藥物研究的需求,知識圖譜作為一種新的方法應用到藥物研究中,有望彌補傳統方法在藥物研究方面的不足。目前基于知識圖譜的藥物研究主要集中在藥物再利用、藥物間不良反應、聯合藥物治療等方面。
新藥研發具有周期長、成本高的特點,這使得研發新藥成為一項艱巨的任務,而藥物再利用作為新藥研發的重要補充,有效緩解了新藥研發面臨的難題。目前基于知識圖譜的藥物再利用已在識別傳統疑難疾病和突發性傳染病有效藥物的任務中取得一定的成果。在識別傳統疑難疾病的有效藥物研究中,桑盛田等[6]提出融合知識圖譜與深度學習的藥物發現方法,從已發表的文獻中挖掘疾病的潛在治療藥物。在識別突發急性傳染病有效藥物的研究中,Korn等[7]將現有的生物醫學知識圖譜與新型冠狀病毒感染 (corona virus disease 2019, COVID-19)最新生物醫學文獻信息相結合,建立了一個基于COVID-19的知識庫,通過對知識圖節點之間的關系進行推斷來確定潛在的候選藥物,實現已知藥物和臨床候選藥物的再利用。除此以外,還有更多藥物發現相關的工作也在陸續展開[8-12]。
現有藥物的未知不良反應會給患者帶來巨大的安全隱患,也限制了研究人員對藥物成本的準確判斷,提前預知藥物可能帶來的不良反應是有效解決上述問題的突破點,而機器學習與知識圖譜相結合具有從現有知識中預測未知不良反應的潛力。Bean等[13]以藥物不良反應(adverse drug reactions,ADR)的知識圖譜為基礎,開發了一種基于簡單富集測試的機器學習算法,用于預測和了解臨床試驗中未觀察到的ADR,該算法可自動檢測到ADR并報告給相關監管機構,緩解了目前藥物上市后監測報告不足的問題,同時減少了藥物給患者帶來的安全隱患。
聯合藥物治療是治療復雜疾病的一種很有前景的策略,在缺乏有效的單一療法的情況下,聯合用藥發揮了重要作用[14]。Du等[15]提出一種自動化算法,根據從生物醫學文獻的結論性聲明中提取的語義預測,發現有關聯合藥物治療的知識,構建聯合藥物治療知識圖譜并應用到精準醫療中,根據患者基因譜的個體差異進行最佳的疾病管理,可幫助專家高效識別有效的聯合療法。
2 輔助診斷
在臨床診斷和治療的基本過程中,醫生收集患者信息,結合自己已有的經驗和知識來決定下一個臨床階段的具體診療措施。而醫生對患者信息的判斷可能會受到特定情況、感覺能力和實踐經驗的影響,其判斷具有主觀性,難以統一標準[16]。因此,需要將醫生診斷過程的經驗轉化為知識,使得診斷結果客觀可追溯,是目前診斷方式的轉變方向。要想完成這一轉變,構建可靠的醫學知識圖譜來輔助診斷是未來的研究重點。
基于知識圖譜的輔助診斷,主要采用知識嵌入、深度學習和知識推理等方法,根據醫學實體間的關系獲得對應的推理路徑,最后結合癥狀和疾病間的關系,明確疾病診斷。Chai等[17]以甲狀腺疾病為例,構建醫學知識圖譜提取生物醫學實體之間的關系,然后通過知識嵌入的方法將知識圖譜中的實體和關系轉化為低維的連續向量,利用已知的病理疾病關系數據,訓練雙向長短期記憶網絡(bi-directional long short-term memory,Bi-LSTM)的疾病診斷模型,結果表明基于深度學習和知識圖譜融合的甲狀腺疾病診斷比手工診斷更有效,比基于機器學習方法的診斷更準確。在中醫診斷領域,Xie等[18]在中醫癥狀知識圖譜中引入了強化學習算法來挖掘實體間的隱性關系并獲得推理路徑,根據這個推理路徑,可以推斷出從癥狀到綜合征的路徑。Zhang等[19]提出了一種通過知識圖譜上的演繹推理來模擬辨證論治的方法,該方法根據知識圖譜中路徑的加權得分計算可能性,從而對結果進行推理,以期實現中醫的自動化診斷。而針對傳統的知識圖譜診斷方法多針對靜態數據,不適用于具有動態變化特征醫學數據的缺點,Song等[20]提出了一種基于嵌入式表示的深度學習方法,通過使用門控循環單元將時間信息引入知識圖譜,并使用知識嵌入的方法保證知識圖譜的結構屬性,通過醫學知識與時間數據的融合,提高了算法的準確性和算術性能,有效提升了診斷方案的可靠性。
3 個性化推薦
隨著精準醫學的普及和發展,越來越多的患者開始尋求個性化醫療服務,但是患者在疾病和行為方面具有異質性的特點,提供個性化建議是一個巨大的挑戰[21]。為了滿足患者的需求,醫生需要不斷關注快速發展的醫學研究報告,并在大量領域知識的基礎上積累有效的臨床治療案例,因而加重了醫生學習領域知識的負擔。另一方面,隨著人工智能技術的興起,機器學習和深度學習為基于醫學知識圖譜的智能推薦提供了核心技術,在個性化推薦中充分應用人工智能技術,可以有效減輕醫生的負擔。目前,基于知識圖譜的智能推薦已應用在科室推薦、藥物推薦、處方推薦以及個性化飲食推薦等方面。例如,Liu等[22]基于區域衛生平臺和醫療網站的電子健康檔案數據,建立了一個疾病知識圖譜,在此基礎上開發了一個智能醫院指導系統,根據患者和系統的對話來為患者推薦合適的科室。Yang等[23]使用當前主流的草藥數據庫來構建草藥知識圖譜,其中包含草藥的名稱、功能、禁忌證、疾病、化學成分、靶基因和蛋白質等實體信息,使用知識圖中草藥的一些屬性作為附加的輔助信息,并提出了一種多層信息融合的圖卷積(graph convolutional networks,GCN)模型,利用草藥特性和融合不同層次的特征表示來增強草藥推薦效果,并在中藥處方數據集上的進行實驗,從而證實了該方法的有效性。Wang等[24]利用中醫知識圖譜實現了中醫病歷推薦系統,根據患者的癥狀推薦相關處方,并以真實的中醫臨床數據驗證了該方法的可行性,推薦的準確率在85%以上。
由于傳統的系統通常是根據歷史記錄來推薦藥物,推薦的變化速度無法跟上醫療實踐中新療法和治療方法的快速更新,在歷史電子病歷中,甚至在完善的知識圖譜中,幾乎沒有關于新的ADR信息,這使得基于歷史記錄的推薦模型很難支持新藥物的更新推薦。考慮到上述挑戰,Gong等[25]提出了一個框架,稱為安全醫學推薦(safe medical recommendations,SMR)。SMR通過橋接電子病歷和醫學知識圖譜構建了一個高質量的異質圖,且SMR將疾病、藥品、患者及其相應的關系共同嵌入到一個共享的低維空間,最后SMR使用嵌入將藥品推薦分解為一個鏈接預測過程,同時考慮患者的診斷方案和ADR,為患者推薦新出現的藥品。此外,還有研究者們基于構建的健康飲食知識圖譜,根據用戶的舌相分類,自動對用戶的體質類型進行分類,并提供個性化的食物建議[26]。
4 決策支持
決策支持系統是實現精準醫療的關鍵,高效的決策支持系統可以減輕醫生的壓力,盡可能減少誤診情況的發生[27]。為了實現精準醫療的決策支持,當前主要采用的方法是基于知識圖譜來構建監測和分析系統,從而實時監測和分析患者的狀態,并在系統中引入風險預測模型,根據患者狀態信息,自動生成診斷方案、評估潛在風險。Shang等[28]利用面向電子病歷的知識圖譜,創建了一個電子病歷數據軌跡,并通過語義規則進行推理,通過推理的足跡,識別其他科室被忽視的慢性腎臟病患者,幫助臨床醫生做出綜合決策。Wang等[29]將風險預測模型納入知識圖譜,可以為預防和控制糖尿病及其并發癥提供決策支持。Xiong等[30]從電子病歷中提取中成藥(Chinese patent medicine,CPM)、疾病、癥狀等信息,構建知識圖譜,基于該圖譜生成CPM監測的規則庫,對CPM的綜合使用、重復用藥、藥與病、藥量、循證治療等情況進行監測,提供決策支持,同時對醫生的處方進行多項基本審查,實現處方監控,確保用藥安全。
5 智能預測
智能預測是醫學知識圖譜研究的熱點也是難點,精準的預測是實現智慧醫療的最終目標。當前智能預測的方法主要包括基于GCN的方法、基于神經網絡的方法、基于知識圖譜和注意力機制結合的方法等。這些方法已經在臨床結果預測、疾病預測、癌癥致死率預測、醫學編碼預測等方面取得一定的成果。
臨床結果預測對患者和醫療服務提供者均具有重要影響,現有方法難以捕捉不同數據集特征和臨床結果之間的變化關系,因此會導致多中心臨床試驗的數據未能充分發揮其作用。為了緩解以上問題,Chu等[31]提出了一個對抗性學習模型來捕捉來自多中心異質臨床數據集的患者特征表示,這些特征用GCN自動編碼器來訓練,以預測心衰患者的急性腎臟損傷。
疾病間存在著錯綜復雜的關系,發現疾病之間的聯系,可以提前預知患者的潛在疾病,幫助醫生及時優化診斷方案,從而提高疾病的治愈率。Sun等[32]提出一種基于神經網絡的疾病預測模型,通過捕捉電子病歷和醫學數據庫的知識,結合患者的癥狀來歸納推斷其嵌入,實現對一般疾病和罕見疾病的準確預測。Pham等[33]從健康相關數據集和醫學領域知識的語料庫中學習,構建醫學領域知識圖譜,基于該圖譜開發出一個多疾病預測模型,以預測患者的潛在疾病。
在癌癥致死率和醫學編碼預測研究中,Wang等[34]提出了一種基于圖神經網絡的新模型,通過該模型將知識圖譜信息納入合成致死性預測任務中,用于人類癌癥綜合致死率預測。Teng等[35]將知識圖譜和注意力機制擴展到醫學編碼預測中,根據醫療記錄的內容預測最終的國際疾病分類編碼,將數據驅動的方法與醫學知識相結合,極大地提高了編碼預測的精度,減少了編碼人員的工作壓力。
6 結論和展望
本文總結了知識圖譜在醫學領域的研究進展,目前醫學知識圖譜的主要應用方向可歸納為五個方面:①基于藥物知識圖譜,結合機器學習和深度學習的方法,實現ADR預測、識別有效的聯合藥物療法、挖掘疾病的潛在治療藥物和快速確定流行病的候選藥物;②根據患者信息,采用知識嵌入、深度學習和知識推理等方法,結合癥狀間的關系確認疾病,輔助醫生進行疾病診斷;③根據不同類型的患者推薦不同的診斷方式方法,實現個性化的醫療服務,具體包括科室推薦、藥物推薦、處方推薦以及個性化飲食推薦等方面;④構建細粒度的垂直領域知識圖譜,基于該圖譜建立決策評估模型,實時檢測和分析患者狀態,自動生成診斷參考方案、評估潛在風險,幫助臨床醫生做出綜合決策;⑤知識圖譜結合GCN、神經網絡、注意力機制等方法實現智能預測,包括臨床結果預測、疾病預測、癌癥致死率預測、醫學編碼預測等。
綜上所述,知識圖譜作為聚合領域知識的一種有效手段,可以將醫生的臨床經驗轉換為醫學知識,使得臨床診斷的結果更加客觀可追溯。隨著醫學知識圖譜與圖推理、機器學習、深度學習等人工技術的結合,在藥物間關系發現、輔助診斷、個性化推薦、決策支持和智能預測方面取得優異的成果,大大減輕了醫生的負擔。但是在實際應用中,主要還存在以下兩個問題:全科醫學知識圖譜完整性不足和知識推理結果的可靠性難以保證。對于前者,仍需計算機科學家與醫學領域專家的共同努力,繼續完善規范醫學知識圖譜;對于后者,基于知識圖譜的推理系統主要是根據特定疾病的特點進行推理和預測,推理的方法還無法推廣普及,基于知識圖譜的推理系統只能扮演支持和輔助的角色,還不能完全有效保證推理結果的準確性和可靠性。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:鄭增亮提出研究思路及論文起草;蔡曉瓊負責論文最終版本修改;蘇前敏參與論文思路分析,論文修改指導;黃繼漢參與論文思路指導。