引用本文: 陳俊任, 曾瑜, 張超, 沈建通, 楊曉妍. 人工智能醫學應用的文獻傳播的可視化研究. 中國循證醫學雜志, 2021, 21(8): 973-979. doi: 10.7507/1672-2531.202102036 復制
近年來,隨著醫學數據類別與規模以前所未有的速度增長及人工智能技術的快速發展,人工智能醫學領域應用的研究呈爆發式增長[1-7]。人工智能的醫學應用與交叉學科人才培養越來越受重視:2020 年,四川大學計算機學院(軟件學院)牽頭自主設置人工智能交叉學科,本文通信作者負責組織醫學人工智能方向,獲批后,作為學校開設人工智能二級學科的學院之一,華西臨床醫學院在臨床醫學一級學科下增設人工智能二級學科,并將于 2021 年秋開始招收碩士和博士研究生,開展臨床醫學與計算機科學等交叉學科研究生培養;當前,國家新設置了第 14 個學科門類即“交叉學科”門類,四川大學、浙江大學、武漢大學、華中科技大學等高校正積極推進“人工智能”一級學科建設。另一方面,可視化技術日益成為研究醫學領域主題發展的熱點技術[8-12]。在這樣的背景下,本研究利用文獻可視化技術分析人工智能方法在醫學領域應用的發文時間趨勢、期刊分布、重點期刊高頻醫學主題詞共詞結構等,系統梳理總結人工智能醫學領域應用研究成果的發表情況,以期為學科交叉研究、人才培養與職稱評定提供參考。
1 資料和方法
1.1 納入和排除標準
1.1.1 納入標準
公開發表的醫學中應用人工智能方法的研究。
1.1.2 排除標準
① 重復發表文獻;② 二次研究文獻、綜述及評述類文獻;③ 關鍵信息缺失導致無法判斷是否符合納入標準的文獻。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase 數據庫,搜集人工智能方法在醫學領域應用的相關文獻。通過預檢索結果分析和專家咨詢,將常用人工智能方法整理歸類為關鍵檢索詞(表 1),根據關鍵詞逐一檢索文獻庫,最后將檢索結果合并。以 PubMed 文獻數據庫為例,具體檢索策略見框 1。


*所檢索的數據庫及檢出文獻數具體如下:PubMed(
1.3 文獻篩選與資料提取
由 2 名研究人員獨立篩選文獻與提取資料。如遇分歧討論解決,仍不能達成一致時咨詢第三方。資料提取的內容包括:文章標題、作者、發表日期、數據分析方法、文章類型、關鍵詞、醫學主題詞和雜志名稱等。
1.4 數據整理
為便于進行可視化和共詞分析,對獲取的文獻進行清洗,處理缺失值和無效值,同時保證數據一致性。以文獻名為主索引,利用 Pandas、Numpy 合并同名文獻,通過去除空格、特殊字符、大小寫統一等方法合并同名文獻,然后在 Excel 中人工篩查諸如“Neoplasm”、“Neoplasms”等實際同名單詞。同時合并發文時間、作者、機構、關鍵詞、醫學主題詞等相關字段,合并時如信息不一致則進行人工篩查;合并后,通過文獻搜索接口爬取對應發刊地區,如無檢索信息則進行人工搜索。
1.5 統計分析
采用 Python 編程語言結合 Matplotlib、Seaborn 和 Pyecharts 等開源軟件包進行可視化分析。對納入研究的發表時間、發表地區進行描述性分析,并用圖形進行分析結果的可視化展現。統計納入文獻的醫學主題詞,在排除性別、人群、國家和主題不清晰的英文醫學主題詞(如 methods、algorithms、networks、software 等)之后,選擇詞頻排名前 200 的高頻醫學主題詞并依據 Pathfinder Networks(PFNETs)算法[13, 14]對主題詞進行共詞分析。PFNETs 算法能夠以圖的形式表達各個數據之間存在的某種關系并建立有效的連接路徑。本文采用 PFNETs 算法將文獻的醫學主題詞作為獨立節點,以醫學主題詞間的共現關系作為圖中的連接線,其共現詞頻數作為節點間的連接權重值。此外,為了能夠度量與優化 PFNETs 算法對文獻的醫學主題詞劃分的性能,本文使用了 Blondel 等[15]提出的方法。該方法基于 Modularity 算法[16]中的模塊度,其核心公式如下:
其中,表示節點
和節點
之間的邊的權值;
是連接節點
的所有邊的權值之和;
表示為節點
被劃分所在的團體;函數
在
時,其值為 1,否則其取值為 0;此外,
。在本文 PFNETs 算法形成的圖譜中產生的關鍵節點表達了人工智能方法在醫學領域的走向,其余節點以關鍵節點為核心,形成不同的研究范式,進而構成基于人工智能方法的醫學研究全景,呈現醫學領域中人工智能方法應用主題的熱點方向和相互的聯系與發展情況。
2 結果
1 文獻篩選流程及結果
初檢共獲得 126 360 篇文獻,經逐層篩選后納入 73 999 篇文獻。文獻篩選流程及結果見圖 1。
2.2 論文發表時間趨勢分析
1990~2004 年,每年發文量較穩定;2005 年開始,每年發文量呈現出高速增長的趨勢;2012 年后呈爆發式增長;2019 年發文量突破 1 萬篇(圖 2)。

2.3 文獻的國別分布
美國發文量超 30 000 篇,英國次之,非洲大部分地區的文獻發布量為 0。發文量前 20 位見表 2。

第一作者數量所在國家排名前三依次為美國、中國和英國。其中第一梯隊的美國與中國數量較為接近,第二梯隊的英國不足第一梯隊國家的五分之一。此外,排名前 20 的國家地處歐洲的數量多于其他地區,且大部分為發達國家(圖 3)。

醫學領域基于人工智能方法的文獻第一作者數量排名前 25 位的機構中,美國加利福尼亞大學處于全球領先地位;中國浙江大學和中國科學院緊隨其后。排名前 25 位的機構中,中國和美國分別占 12 個和 11 個,明顯多于其他國家(圖 4)。

2.4 文獻的期刊分布
在本文中,根據專家經驗定義發文量在前 30 位的期刊中影響因子處于前 10 位的期刊為重點期刊,其重點期刊歷年表現見圖 5。1990~1994 年,發表的文獻量均較少,1995 年開始有所增加,但直到 2004 年前,重點期刊每年累計均不超過 100 篇。1995~1998 年,醫學領域中基于人工智能方法的文獻主要發表在 Neural Networks;1999~2000 年主要發表在 Analytica Chimica Acta;2002 年主要發表在 Analytica Chimica Acta 和 Bioinformatics;2002~2010 年主要發表在 Bioinformatics。2012 年,IEEE Trans Neural Netw Learn Syst 文獻發布量首次進入前 10 位,之后每年發文量都處于前 10 位,2018 和 2019 年,該期刊發文量排第 1 位,成為醫學領域人工智能方向發文量最多的期刊。

2.5 重點期刊高頻醫學主題詞共詞分析
醫學主題詞共現分析法[17]思想源于文獻計量學的引文耦合與共被引概念,在一定程度上代表本領域研究熱點。本文根據 PFNETs 算法選擇文獻中醫學主題詞為獨立節點,并以兩個醫學主題詞之間的共現為連接,以醫學主題詞的共現頻率為連接權重。如圖 6 所示,每一個圓形節點代表一個醫學主題詞,圓形節點面積的大小代表該主題詞的詞頻大小。相鄰節點間連線的粗細表示兩個醫學主題詞之間共現的頻數,連線越粗則表明兩個醫學主題詞之間共現頻數越大。此外,經過算法劃分,具有相同顏色的圓形節點可歸納為同一個類簇,具有最大面積的圓形節點為 PFNETs 算法所產生的關鍵節點。本研究結果表明,在醫學領域人工智能方法中,機器學習算法主要面向醫學圖像分析、疾病/癌癥分類、癌癥診斷等方向。神經網絡算法與人工神經網絡算法具有很強關聯度。自然語言處理方法是人工智能領域的一個分支,在醫學領域中通常被應用于電子病歷。核磁共振成像方向,主要使用圖像分割算法來處理正電子發射斷層掃描、計算機輔助斷層掃描等。偏最小二乘回歸算法這類統計學習方法也被廣泛應用在定量分析、紅外光譜等醫學領域。值得注意的是,支持向量機算法應用廣泛。此外,傳統的機器學習方法模型如貝葉斯模型、馬爾科夫鏈模型等也被應用于醫學領域。

3 討論
醫學領域中基于人工智能方法的研究與應用起源于上世紀末,但文獻數量較少。2000~2004 年發文量有所增多,2005~2012 年明顯增多,其原因是該時期人工智能方法中的分支領域—機器學習得到了全面且高速的發展。2012 年之后,每年發文量呈爆發式增長,這得益于人工智能中深度學習方法的發展。盡管早在 2006 年,機器學習領域泰斗 Hinton 和 Salakhutdinov 就提出了深度學習模型[18],但當時計算機的運算資源不足以支撐深度學習所需的海量運算,并未廣泛應用于醫學領域。2012 年后,計算機硬件設備在計算能力上有了突破性成果,間接促進了深度學習方法的發展。2012 年,Hinton 研究團隊采用深度卷積神經網絡模型[19]將分類錯誤率從 26%減少到 15%,贏得了計算機視覺領域最具影響力的 ImageNet 比賽[20]冠軍,這一驚人的改進使深度學習成為近年來人工智能方法的研究熱點。由于深度學習能自動化提取數據中的復雜高維抽象特征,這種強大的特征提取能力使得研究人員在生物信息學、醫學影像、臨床病歷和公共衛生等領域深入使用深度學習技術[21-25]。隨著預測性、個性化、預防性和參與性醫學概念的引入[26],計算機領域的人工智能方法已成為整合醫學數據,實現精準醫學的重要方法和工具。2019 年,醫學領域中基于人工智能方法的研究與應用文獻發表突破 1 萬篇,表明該領域已成為研究熱點。
當前美國在基于人工智能的醫學領域研究處于全球領先地位。科技和經濟發達國家(如美國、加拿大、日本等)或地區(如歐洲)以及科技和經濟發展迅猛的發展中國家(如中國、印度等)發表文獻較多,側面反映出國家層面的科技和經濟發展能夠促進交叉領域的研究。第一作者來源的機構排名顯示,在前 25 個機構中,第一作者來自大學的占主導地位,反映出高校具有豐富的人才及研究基金資源,是學科交叉研究高地。
重點期刊發文情況顯示,IEEE Trans Neural Netw Learn Syst 2012 年首次進入前 10 位,之后每年都處于領先地位,成為該領域最熱門期刊。該期刊屬信息科學、機器學習、人工智能的交叉學科領域,主要刊發神經網絡及其學習系統的最新研究成果,是 IEEE 計算智能學會核心刊物,也是神經網絡和學習系統方面的國際頂級期刊。近兩年重點期刊年發文量數據顯示,基于人工智能方法的醫學研究領域科研人員投稿目標多在交叉學科雜志,表明醫工交叉研究與應用近兩年呈現出上升趨勢,并逐漸成為熱門。
本文挖掘重點期刊排名靠前的高頻醫學主題詞并展示共詞網絡圖,發現神經網絡算法主要應用在基因組研究方面,這是由于神經網絡能夠模擬人類神經元,具有強大的數據分析能力。為了提高識別準確率,人工神經網絡的一些變體也被研究人員使用。自然語言處理方法通常被應用于電子病歷,這是由于電子病歷中含有大量文字表達數據。值得注意的是,傳統的機器學習方法—支持向量機,通過 PFNETs 算法選擇后作為單獨的分支,在文獻數據中占比大。這是由于支持向量機算法本質上是求解凸二次規劃的最優化算法,具有嚴格的數學理論支持和很強的可解釋性。在支持向量機算法中,其最終的決策函數只由少數的支持向量所確定,屬于一種小樣本學習的機器學習方法,因此,該算法非常適用于現實世界中不易大量獲取臨床醫學數據的研究。另一方面,支持向量機算法能夠通過引入核函數來處理非線性問題,這適用于現實世界獲取的非線性臨床醫學數據處理,因此該算法被廣泛應用于醫學領域。傳統統計學習方法如貝葉斯模型、馬爾科夫鏈等也被廣泛應用于醫學領域。盡管深度神經網絡正在醫學影像等多種醫學領域發揮重要作用,但仍存在一些局限性,如通常無法向用戶解釋這些模型的決策過程,這種不可解釋性導致許多臨床醫生和病人放棄使用這類黑盒模型,最終選擇可解釋性強的傳統統計學習方法。盡管傳統統計學習方法的性能效果可能不如當前流行的神經網絡模型,但由于其可解釋性強,仍被廣泛應用于醫學領域。
綜上所述,當前美國人工智能醫學應用研究處于全球領先地位,中國研究實力亦處于世界前列。醫學文獻在交叉學科期刊的發文量逐漸增多,反映出人工智能與醫學學科交叉成為近年研究的熱點。
近年來,隨著醫學數據類別與規模以前所未有的速度增長及人工智能技術的快速發展,人工智能醫學領域應用的研究呈爆發式增長[1-7]。人工智能的醫學應用與交叉學科人才培養越來越受重視:2020 年,四川大學計算機學院(軟件學院)牽頭自主設置人工智能交叉學科,本文通信作者負責組織醫學人工智能方向,獲批后,作為學校開設人工智能二級學科的學院之一,華西臨床醫學院在臨床醫學一級學科下增設人工智能二級學科,并將于 2021 年秋開始招收碩士和博士研究生,開展臨床醫學與計算機科學等交叉學科研究生培養;當前,國家新設置了第 14 個學科門類即“交叉學科”門類,四川大學、浙江大學、武漢大學、華中科技大學等高校正積極推進“人工智能”一級學科建設。另一方面,可視化技術日益成為研究醫學領域主題發展的熱點技術[8-12]。在這樣的背景下,本研究利用文獻可視化技術分析人工智能方法在醫學領域應用的發文時間趨勢、期刊分布、重點期刊高頻醫學主題詞共詞結構等,系統梳理總結人工智能醫學領域應用研究成果的發表情況,以期為學科交叉研究、人才培養與職稱評定提供參考。
1 資料和方法
1.1 納入和排除標準
1.1.1 納入標準
公開發表的醫學中應用人工智能方法的研究。
1.1.2 排除標準
① 重復發表文獻;② 二次研究文獻、綜述及評述類文獻;③ 關鍵信息缺失導致無法判斷是否符合納入標準的文獻。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase 數據庫,搜集人工智能方法在醫學領域應用的相關文獻。通過預檢索結果分析和專家咨詢,將常用人工智能方法整理歸類為關鍵檢索詞(表 1),根據關鍵詞逐一檢索文獻庫,最后將檢索結果合并。以 PubMed 文獻數據庫為例,具體檢索策略見框 1。


*所檢索的數據庫及檢出文獻數具體如下:PubMed(
1.3 文獻篩選與資料提取
由 2 名研究人員獨立篩選文獻與提取資料。如遇分歧討論解決,仍不能達成一致時咨詢第三方。資料提取的內容包括:文章標題、作者、發表日期、數據分析方法、文章類型、關鍵詞、醫學主題詞和雜志名稱等。
1.4 數據整理
為便于進行可視化和共詞分析,對獲取的文獻進行清洗,處理缺失值和無效值,同時保證數據一致性。以文獻名為主索引,利用 Pandas、Numpy 合并同名文獻,通過去除空格、特殊字符、大小寫統一等方法合并同名文獻,然后在 Excel 中人工篩查諸如“Neoplasm”、“Neoplasms”等實際同名單詞。同時合并發文時間、作者、機構、關鍵詞、醫學主題詞等相關字段,合并時如信息不一致則進行人工篩查;合并后,通過文獻搜索接口爬取對應發刊地區,如無檢索信息則進行人工搜索。
1.5 統計分析
采用 Python 編程語言結合 Matplotlib、Seaborn 和 Pyecharts 等開源軟件包進行可視化分析。對納入研究的發表時間、發表地區進行描述性分析,并用圖形進行分析結果的可視化展現。統計納入文獻的醫學主題詞,在排除性別、人群、國家和主題不清晰的英文醫學主題詞(如 methods、algorithms、networks、software 等)之后,選擇詞頻排名前 200 的高頻醫學主題詞并依據 Pathfinder Networks(PFNETs)算法[13, 14]對主題詞進行共詞分析。PFNETs 算法能夠以圖的形式表達各個數據之間存在的某種關系并建立有效的連接路徑。本文采用 PFNETs 算法將文獻的醫學主題詞作為獨立節點,以醫學主題詞間的共現關系作為圖中的連接線,其共現詞頻數作為節點間的連接權重值。此外,為了能夠度量與優化 PFNETs 算法對文獻的醫學主題詞劃分的性能,本文使用了 Blondel 等[15]提出的方法。該方法基于 Modularity 算法[16]中的模塊度,其核心公式如下:
其中,表示節點
和節點
之間的邊的權值;
是連接節點
的所有邊的權值之和;
表示為節點
被劃分所在的團體;函數
在
時,其值為 1,否則其取值為 0;此外,
。在本文 PFNETs 算法形成的圖譜中產生的關鍵節點表達了人工智能方法在醫學領域的走向,其余節點以關鍵節點為核心,形成不同的研究范式,進而構成基于人工智能方法的醫學研究全景,呈現醫學領域中人工智能方法應用主題的熱點方向和相互的聯系與發展情況。
2 結果
1 文獻篩選流程及結果
初檢共獲得 126 360 篇文獻,經逐層篩選后納入 73 999 篇文獻。文獻篩選流程及結果見圖 1。
2.2 論文發表時間趨勢分析
1990~2004 年,每年發文量較穩定;2005 年開始,每年發文量呈現出高速增長的趨勢;2012 年后呈爆發式增長;2019 年發文量突破 1 萬篇(圖 2)。

2.3 文獻的國別分布
美國發文量超 30 000 篇,英國次之,非洲大部分地區的文獻發布量為 0。發文量前 20 位見表 2。

第一作者數量所在國家排名前三依次為美國、中國和英國。其中第一梯隊的美國與中國數量較為接近,第二梯隊的英國不足第一梯隊國家的五分之一。此外,排名前 20 的國家地處歐洲的數量多于其他地區,且大部分為發達國家(圖 3)。

醫學領域基于人工智能方法的文獻第一作者數量排名前 25 位的機構中,美國加利福尼亞大學處于全球領先地位;中國浙江大學和中國科學院緊隨其后。排名前 25 位的機構中,中國和美國分別占 12 個和 11 個,明顯多于其他國家(圖 4)。

2.4 文獻的期刊分布
在本文中,根據專家經驗定義發文量在前 30 位的期刊中影響因子處于前 10 位的期刊為重點期刊,其重點期刊歷年表現見圖 5。1990~1994 年,發表的文獻量均較少,1995 年開始有所增加,但直到 2004 年前,重點期刊每年累計均不超過 100 篇。1995~1998 年,醫學領域中基于人工智能方法的文獻主要發表在 Neural Networks;1999~2000 年主要發表在 Analytica Chimica Acta;2002 年主要發表在 Analytica Chimica Acta 和 Bioinformatics;2002~2010 年主要發表在 Bioinformatics。2012 年,IEEE Trans Neural Netw Learn Syst 文獻發布量首次進入前 10 位,之后每年發文量都處于前 10 位,2018 和 2019 年,該期刊發文量排第 1 位,成為醫學領域人工智能方向發文量最多的期刊。

2.5 重點期刊高頻醫學主題詞共詞分析
醫學主題詞共現分析法[17]思想源于文獻計量學的引文耦合與共被引概念,在一定程度上代表本領域研究熱點。本文根據 PFNETs 算法選擇文獻中醫學主題詞為獨立節點,并以兩個醫學主題詞之間的共現為連接,以醫學主題詞的共現頻率為連接權重。如圖 6 所示,每一個圓形節點代表一個醫學主題詞,圓形節點面積的大小代表該主題詞的詞頻大小。相鄰節點間連線的粗細表示兩個醫學主題詞之間共現的頻數,連線越粗則表明兩個醫學主題詞之間共現頻數越大。此外,經過算法劃分,具有相同顏色的圓形節點可歸納為同一個類簇,具有最大面積的圓形節點為 PFNETs 算法所產生的關鍵節點。本研究結果表明,在醫學領域人工智能方法中,機器學習算法主要面向醫學圖像分析、疾病/癌癥分類、癌癥診斷等方向。神經網絡算法與人工神經網絡算法具有很強關聯度。自然語言處理方法是人工智能領域的一個分支,在醫學領域中通常被應用于電子病歷。核磁共振成像方向,主要使用圖像分割算法來處理正電子發射斷層掃描、計算機輔助斷層掃描等。偏最小二乘回歸算法這類統計學習方法也被廣泛應用在定量分析、紅外光譜等醫學領域。值得注意的是,支持向量機算法應用廣泛。此外,傳統的機器學習方法模型如貝葉斯模型、馬爾科夫鏈模型等也被應用于醫學領域。

3 討論
醫學領域中基于人工智能方法的研究與應用起源于上世紀末,但文獻數量較少。2000~2004 年發文量有所增多,2005~2012 年明顯增多,其原因是該時期人工智能方法中的分支領域—機器學習得到了全面且高速的發展。2012 年之后,每年發文量呈爆發式增長,這得益于人工智能中深度學習方法的發展。盡管早在 2006 年,機器學習領域泰斗 Hinton 和 Salakhutdinov 就提出了深度學習模型[18],但當時計算機的運算資源不足以支撐深度學習所需的海量運算,并未廣泛應用于醫學領域。2012 年后,計算機硬件設備在計算能力上有了突破性成果,間接促進了深度學習方法的發展。2012 年,Hinton 研究團隊采用深度卷積神經網絡模型[19]將分類錯誤率從 26%減少到 15%,贏得了計算機視覺領域最具影響力的 ImageNet 比賽[20]冠軍,這一驚人的改進使深度學習成為近年來人工智能方法的研究熱點。由于深度學習能自動化提取數據中的復雜高維抽象特征,這種強大的特征提取能力使得研究人員在生物信息學、醫學影像、臨床病歷和公共衛生等領域深入使用深度學習技術[21-25]。隨著預測性、個性化、預防性和參與性醫學概念的引入[26],計算機領域的人工智能方法已成為整合醫學數據,實現精準醫學的重要方法和工具。2019 年,醫學領域中基于人工智能方法的研究與應用文獻發表突破 1 萬篇,表明該領域已成為研究熱點。
當前美國在基于人工智能的醫學領域研究處于全球領先地位。科技和經濟發達國家(如美國、加拿大、日本等)或地區(如歐洲)以及科技和經濟發展迅猛的發展中國家(如中國、印度等)發表文獻較多,側面反映出國家層面的科技和經濟發展能夠促進交叉領域的研究。第一作者來源的機構排名顯示,在前 25 個機構中,第一作者來自大學的占主導地位,反映出高校具有豐富的人才及研究基金資源,是學科交叉研究高地。
重點期刊發文情況顯示,IEEE Trans Neural Netw Learn Syst 2012 年首次進入前 10 位,之后每年都處于領先地位,成為該領域最熱門期刊。該期刊屬信息科學、機器學習、人工智能的交叉學科領域,主要刊發神經網絡及其學習系統的最新研究成果,是 IEEE 計算智能學會核心刊物,也是神經網絡和學習系統方面的國際頂級期刊。近兩年重點期刊年發文量數據顯示,基于人工智能方法的醫學研究領域科研人員投稿目標多在交叉學科雜志,表明醫工交叉研究與應用近兩年呈現出上升趨勢,并逐漸成為熱門。
本文挖掘重點期刊排名靠前的高頻醫學主題詞并展示共詞網絡圖,發現神經網絡算法主要應用在基因組研究方面,這是由于神經網絡能夠模擬人類神經元,具有強大的數據分析能力。為了提高識別準確率,人工神經網絡的一些變體也被研究人員使用。自然語言處理方法通常被應用于電子病歷,這是由于電子病歷中含有大量文字表達數據。值得注意的是,傳統的機器學習方法—支持向量機,通過 PFNETs 算法選擇后作為單獨的分支,在文獻數據中占比大。這是由于支持向量機算法本質上是求解凸二次規劃的最優化算法,具有嚴格的數學理論支持和很強的可解釋性。在支持向量機算法中,其最終的決策函數只由少數的支持向量所確定,屬于一種小樣本學習的機器學習方法,因此,該算法非常適用于現實世界中不易大量獲取臨床醫學數據的研究。另一方面,支持向量機算法能夠通過引入核函數來處理非線性問題,這適用于現實世界獲取的非線性臨床醫學數據處理,因此該算法被廣泛應用于醫學領域。傳統統計學習方法如貝葉斯模型、馬爾科夫鏈等也被廣泛應用于醫學領域。盡管深度神經網絡正在醫學影像等多種醫學領域發揮重要作用,但仍存在一些局限性,如通常無法向用戶解釋這些模型的決策過程,這種不可解釋性導致許多臨床醫生和病人放棄使用這類黑盒模型,最終選擇可解釋性強的傳統統計學習方法。盡管傳統統計學習方法的性能效果可能不如當前流行的神經網絡模型,但由于其可解釋性強,仍被廣泛應用于醫學領域。
綜上所述,當前美國人工智能醫學應用研究處于全球領先地位,中國研究實力亦處于世界前列。醫學文獻在交叉學科期刊的發文量逐漸增多,反映出人工智能與醫學學科交叉成為近年研究的熱點。