引用本文: 歐沛靈, 溫茹, 石琳鋒, 王健, 劉晨. 基于文獻計量學的中國新型冠狀病毒感染影像學研究分析. 華西醫學, 2023, 38(8): 1203-1210. doi: 10.7507/1002-0179.202303134 復制
在世界衛生組織宣布新型冠狀病毒感染(coronavirus disease 2019, COVID-19)為一場大流行以來的 3 周年之際,COVID-19 仍然是全球范圍內關注的熱點話題,且全球各地一直采取措施來控制該病毒的傳播和影響[1-2]。隨著奧密克戎病毒致病性的減弱、疫苗接種的普及、防控經驗的積累,COVID-19 的病死率不斷下降。然而,據估計至少 6500 萬人在 COVID-19 康復后仍會面臨各種中期和長期的影響[3]。這種感染后多系統疾病統稱為“長新冠”綜合征,常見癥狀包括疲勞、氣促和認知功能障礙,影響數月或數年內進行日常活動的能力,其結果是對人們的健康、幸福和生計造成廣泛的全球性危害[4]。影像學在早期發現肺內病變,評估病變的大小、范圍、嚴重程度和演變過程中發揮著不可或缺的作用[5-6],大量關于 COVID-19 影像學的研究應運而生[7],如何準確把握眾多文獻的整體結構和客觀特點是研究者們面臨的一大挑戰。文獻計量學可基于數學和統計學對文獻進行定量分析和定性評估,以便于研究人員快速掌握該領域研究熱點及預測未來發展趨勢[8]。因此,對 COVID-19 影像領域文獻進行計量分析以更好應對長期 COVID-19 后遺癥是必要的。目前國內外僅有少量研究基于單一數據庫對 COVID-19 展開分析[9-10],國內外尚缺乏針對 COVID-19 影像方面的文獻計量研究。鑒于此,本研究借助 CiteSpace 軟件,對中國學者發表于國內外的 COVID-19 影像學領域論文進行系統回顧,以期直觀呈現研究的宏觀圖景及發展趨勢,為應對長期 COVID-19 帶來的挑戰提供參考和指引。
1 資料與方法
文獻納入與排除標準及檢索策略由 2 位資深影像學教授共同商討以確定,并由資深圖書管理學教授審查。
1.1 納入與排除標準
1.1.1 納入標準
① 文獻主題與 COVID-19 影像學研究相關;② 文獻類型為論著;③ 文獻的地區來源為中國。
1.1.2 排除標準
① 文獻研究內容與主題不相符;② 文獻重復、無效或信息不完整。
1.2 檢索策略
分別在 Web of Science(WOS)科技文獻檢索工具與科學引文索引數據庫及中國科學引文數據庫(Chinese Science Citation Database, CSCD)中檢索與 COVID-19 影像學研究相關文獻。利用高級檢索功能進行文獻檢索,具體檢索策略見框 1,檢索時間限定為 2020 年 1 月 1 日-2022 年 12 月 31 日,并將文獻的地區來源限定為“中國”且文獻類型限定為“論著”,對文獻語言沒有限制。數據的檢索與導出均在同一天(2023 年 2 月 1 日)內完成,以避免數據庫在檢索過程中的更新導致數據偏倚。

1.3 文獻篩選與資料提取
由 2 位資深影像學教授進行文獻的納入與排除,若意見不一致,則協商后達成一致。下載題錄進行分析,每條記錄均包含文獻的題目、作者、摘要、關鍵詞、國籍和引文等相關信息。以月份為單位進行分析,以詳細展示中國學者對 COVID-19 影像領域的關注與演變進程。
1.4 統計學方法
對最終納入的文獻進行統計分析,包括整體發文量、被引頻次、文獻來源。結合 CiteSpace 6.0.R3 軟件進行關鍵詞分析和文獻共被引聚類分析,用以追蹤 COVID-19 影像學研究相關文獻的發展趨勢和研究熱點。為確保文獻信息的規范性和統計分析的科學性,在原始文獻數據庫里對表達同一含義的不同關鍵詞進行標準化處理,如將指代疾病的“新冠肺炎”“新冠病毒肺炎”“新型冠狀病毒肺炎”等關鍵詞統一調整為“新冠肺炎”。中心度(centrality)是用來衡量網絡中節點的重要性或中心位置的指標之一,通過頻次結合節點的中心度可以綜合體現各節點在網絡中的相對重要程度。聚類模塊值(Q 值)和聚類平均輪廓值(S 值)用于評價聚類結構和可靠性。Q>0.3 表明聚類效果顯著,S>0.7 表明聚類結果令人信服[9]。
2 結果
2.1 文獻檢索結果
本研究共檢索文獻 9658 篇(WOS 數據庫 9183 篇和 CSCD 475 篇)。根據文獻納入及排除標準,對比文獻題目、作者、摘要及全文,排除重復、無效或信息不完整論文后納入文獻 2229 篇(WOS 數據庫 1771 篇和 CSCD 458 篇)。文獻篩選流程及結果見圖1。

WOS:Web of Science;CSCD:中國科學引文數據庫
2.2 月度發文量
自 COVID-19 疫情暴發以來,我國各領域科研人員全力開展科研攻關,影像學領域研究熱度呈上升趨勢,國內外月度發文量分別在 2020 年 3 月和 2021 年 1 月達到峰值。截至檢索當日,2022 年 12 月 CSCD 收錄 COVID-19 影像相關文獻僅 1 篇,可能由于入庫時間較文獻發表時間的滯后。總之,隨著我國的診療方案及防控舉措不斷優化調整,我國疫情已基本處于可控狀態。從圖2 變化趨勢可知發文量整體態勢呈顯著增長再緩慢下降,而后維持在穩定水平。

WOS:Web of Science;CSCD:中國科學引文數據庫;COVID-19:新型冠狀病毒感染
2.3 關鍵詞分析
對納入文獻合并同義詞并排除搜索詞和廣泛關鍵詞后,共提取英文關鍵詞 713 個、中文關鍵詞 188 個。表1 分別列出中英文前 20 位高頻關鍵詞,結合節點中心度可見 COVID-19 影像領域的熱門主題是臨床特征、鑒別診斷以及人工智能。關鍵詞聚類分析見圖3、4,結合全文分析研究主題可知,現階段我國 COVID-19 影像研究熱點主要集中在 COVID-19 的臨床影像特征及人工智能輔助診斷。研究前沿的興起,將導致關鍵詞在短時間里爆發,圖5 列出了我國 COVID-19 影像研究爆發強度前 20 位關鍵詞及爆發時長。爆發強度最強的關鍵詞是“deep learning”(深度學習),爆發時長最長的關鍵詞是“attention mechanism”(注意力機制)。自 2020 年初的觀察性研究到 2021 年的機器學習再到 2022 年的隊列研究,從側重點持續及轉移的趨勢來看,改進算法模型以拓展應用場景和控制并發癥以改善臨床預后是未來的研究熱點趨勢。



COVID-19:新型冠狀病毒感染

2.4 文獻共被引網絡分析
由引文分析可知,WOS 文獻被引頻次共 107138 次,篇均引用次數 60.5;CSCD 庫內被引頻次總計 670 次,篇均引用次數 1.46。在 CiteSpace 中設置以 reference 為節點類型,共產生 937 個節點及 4782 條連接線,我國 COVID-19 影像領域共被引文獻聚類網絡分析圖譜見圖6、7,聚類結果顯示 COVID-19 臨床特征、影像表現及人工智能的應用為國內外文獻共同關注熱點,其中 CSCD 文獻共被引聚類結果中 #2 shufeng jiedu capsule 及 #9 traditional Chinese medicine 展現出中國特色。COVID-19 影像領域施引與被引文獻來源期刊的雙圖疊加結果見圖8,可見 COVID-19 影像學相關研究傾向于引用分子、生物學和遺傳學的基礎研究成果。



COVID-19:新型冠狀病毒感染
3 討論
本研究基于 WOS 數據庫和 CSCD 對 2020 年 1 月 1 日-2022 年 12 月 31 日中國學者發表的 COVID-19 影像研究文獻進行文獻計量及可視化分析,這兩大權威引文數據庫可確保樣本的代表性、時效性和可靠性[11]。從發文量來看,僅 2020 年 1 月就有 64 篇文獻發表,可見我國學者在全球 COVID-19 影像研究中發揮了重要的積極作用。隨著研究的深入,越來越多中國學者活躍在國際學術舞臺,并及時向全球同行傳遞最新影像學研究成果。值得注意的是,結合國內外發文量來看,中國學者更傾向于將學術成果發表于國外期刊。這或將造成優質論文的流失及國內關注的滯后,國內優質期刊發展任重而道遠。
從高被引文獻來看,國內外率先對 COVID-19 患者進行臨床案例報告和胸部影像表現分析的文章獲得較高的引用量。Huang 等[12]的文章在 WOS 數據庫中的被引頻次高達 17558 次,該文章報告了 COVID-19 患者的流行病學、臨床特征、實驗室結果和影像學特征以及治療結局。Ai 等[13]率先證實胸部多排螺旋 CT 薄層掃描在 COVID-19 的早期發現、疑似病例鑒別、療效評估中起至關重要的作用,尤其是對于核酸檢測假陰性的病例,CT 是診斷不可或缺的一環。Pan 等[14]對 21 例 COVID-19 患者進行隊列研究以觀察患者胸部 CT 從初診到康復的變化。由此可見,影像學從疾病診斷到療效評價再到康復預后全鏈條都發揮著不可或缺的作用。
從高頻關鍵詞來看,COVID-19 影像中外文獻的研究熱點有所重疊也有所差異。中英文獻均出現“人工智能”“深度學習”等高頻關鍵詞,結合詞條爆發強度及持續時長可見人工智能研究熱度持續攀升,深度學習是人工智能領域 COVID-19 影像輔助診斷中執行醫學影像分析任務(如圖像分類、目標檢測、語義分割)最先進方法之一[15]。在 COVID-19 疫情肆虐全球的大背景下,早期診斷對疾病治療和控制至關重要。Li 等[16]構建的深度學習模型以高準確度區分 COVID-19 與其他肺部疾病,在人工智能輔助診斷模型的幫助下,放射科醫生實現了更精確的影像診斷。Wang 等[17]根據治療方案和入院后 48 h 內收集的患者信息,成功構建 COVID-19 患者的康復時間預測模型。由此可見,對患者肺部區域醫學影像的智能影像分析和研發部署各類模型,提高了胸部疾病診斷效率及準確率,推動了人工智能影像全鏈條的發展。綜合影像、臨床、生化、治療等復雜信息,實現早期精準診斷、預測胸部疾病康復及治療影響因素,這些都給人工智能賦能胸部影像發展帶來了契機。在未來,人工智能結合醫學影像將著重于改進算法模型以拓展應用場景,完善評價體系為影像診斷提供高附加值的數據處理[18-19]。
不同之處在于“瘟疫”“中醫藥”及“中醫癥候”等中醫藥領域高頻關鍵詞成為了中國方案的亮點,為世界疫情防控提供了中國經驗。Li 等[20]通過胸部 CT 觀察核酸轉陰的恢復期患者肺部炎癥吸收情況,發現中藥在改善臨床癥狀和促進炎癥吸收方面發揮重要作用。對于重癥患者,中西醫結合診治在改善肺部影像學異常(磨玻璃影、鋪路征和肺實變等)方面優于單純西醫治療[21]。現代醫學影像手段助力傳統中醫“望聞問切”,在 COVID-19 診療中更加精準判斷疾病進程,進行療效觀察和預后判斷。總體來說,中國學者在國內外發表文章的主題深度和寬度存在差異,后期可針對這些差異進一步深入研究。
本研究結果因數據庫的選用及文獻納入有限可能產生一定的偏倚。但 WOS 及 CSCD 收錄權威高質量期刊,因此本研究展示的 COVID-19 影像學研究現狀及趨勢走向仍然具有借鑒意義。本研究聚焦于中國學者,后續研究中可擴大研究范圍以更全面了解 COVID-19 影像學研究,為把握熱點前沿及應對“長新冠”帶來的挑戰提供更有價值的參考。
綜上所述,近年來 COVID-19 影像領域研究穩中有進,研究熱點內容相對集中,人工智能輔助診斷最受關注,未來的 COVID-19 影像研究的側重點可能借助人工智能從影像診斷方面的橫斷面研究轉向康復預測方面的縱向研究。因此,為應對 COVID-19 帶來的持續影響,學者們還需進行更系統的研究。
利益沖突:所有作者聲明不存在利益沖突。
在世界衛生組織宣布新型冠狀病毒感染(coronavirus disease 2019, COVID-19)為一場大流行以來的 3 周年之際,COVID-19 仍然是全球范圍內關注的熱點話題,且全球各地一直采取措施來控制該病毒的傳播和影響[1-2]。隨著奧密克戎病毒致病性的減弱、疫苗接種的普及、防控經驗的積累,COVID-19 的病死率不斷下降。然而,據估計至少 6500 萬人在 COVID-19 康復后仍會面臨各種中期和長期的影響[3]。這種感染后多系統疾病統稱為“長新冠”綜合征,常見癥狀包括疲勞、氣促和認知功能障礙,影響數月或數年內進行日常活動的能力,其結果是對人們的健康、幸福和生計造成廣泛的全球性危害[4]。影像學在早期發現肺內病變,評估病變的大小、范圍、嚴重程度和演變過程中發揮著不可或缺的作用[5-6],大量關于 COVID-19 影像學的研究應運而生[7],如何準確把握眾多文獻的整體結構和客觀特點是研究者們面臨的一大挑戰。文獻計量學可基于數學和統計學對文獻進行定量分析和定性評估,以便于研究人員快速掌握該領域研究熱點及預測未來發展趨勢[8]。因此,對 COVID-19 影像領域文獻進行計量分析以更好應對長期 COVID-19 后遺癥是必要的。目前國內外僅有少量研究基于單一數據庫對 COVID-19 展開分析[9-10],國內外尚缺乏針對 COVID-19 影像方面的文獻計量研究。鑒于此,本研究借助 CiteSpace 軟件,對中國學者發表于國內外的 COVID-19 影像學領域論文進行系統回顧,以期直觀呈現研究的宏觀圖景及發展趨勢,為應對長期 COVID-19 帶來的挑戰提供參考和指引。
1 資料與方法
文獻納入與排除標準及檢索策略由 2 位資深影像學教授共同商討以確定,并由資深圖書管理學教授審查。
1.1 納入與排除標準
1.1.1 納入標準
① 文獻主題與 COVID-19 影像學研究相關;② 文獻類型為論著;③ 文獻的地區來源為中國。
1.1.2 排除標準
① 文獻研究內容與主題不相符;② 文獻重復、無效或信息不完整。
1.2 檢索策略
分別在 Web of Science(WOS)科技文獻檢索工具與科學引文索引數據庫及中國科學引文數據庫(Chinese Science Citation Database, CSCD)中檢索與 COVID-19 影像學研究相關文獻。利用高級檢索功能進行文獻檢索,具體檢索策略見框 1,檢索時間限定為 2020 年 1 月 1 日-2022 年 12 月 31 日,并將文獻的地區來源限定為“中國”且文獻類型限定為“論著”,對文獻語言沒有限制。數據的檢索與導出均在同一天(2023 年 2 月 1 日)內完成,以避免數據庫在檢索過程中的更新導致數據偏倚。

1.3 文獻篩選與資料提取
由 2 位資深影像學教授進行文獻的納入與排除,若意見不一致,則協商后達成一致。下載題錄進行分析,每條記錄均包含文獻的題目、作者、摘要、關鍵詞、國籍和引文等相關信息。以月份為單位進行分析,以詳細展示中國學者對 COVID-19 影像領域的關注與演變進程。
1.4 統計學方法
對最終納入的文獻進行統計分析,包括整體發文量、被引頻次、文獻來源。結合 CiteSpace 6.0.R3 軟件進行關鍵詞分析和文獻共被引聚類分析,用以追蹤 COVID-19 影像學研究相關文獻的發展趨勢和研究熱點。為確保文獻信息的規范性和統計分析的科學性,在原始文獻數據庫里對表達同一含義的不同關鍵詞進行標準化處理,如將指代疾病的“新冠肺炎”“新冠病毒肺炎”“新型冠狀病毒肺炎”等關鍵詞統一調整為“新冠肺炎”。中心度(centrality)是用來衡量網絡中節點的重要性或中心位置的指標之一,通過頻次結合節點的中心度可以綜合體現各節點在網絡中的相對重要程度。聚類模塊值(Q 值)和聚類平均輪廓值(S 值)用于評價聚類結構和可靠性。Q>0.3 表明聚類效果顯著,S>0.7 表明聚類結果令人信服[9]。
2 結果
2.1 文獻檢索結果
本研究共檢索文獻 9658 篇(WOS 數據庫 9183 篇和 CSCD 475 篇)。根據文獻納入及排除標準,對比文獻題目、作者、摘要及全文,排除重復、無效或信息不完整論文后納入文獻 2229 篇(WOS 數據庫 1771 篇和 CSCD 458 篇)。文獻篩選流程及結果見圖1。

WOS:Web of Science;CSCD:中國科學引文數據庫
2.2 月度發文量
自 COVID-19 疫情暴發以來,我國各領域科研人員全力開展科研攻關,影像學領域研究熱度呈上升趨勢,國內外月度發文量分別在 2020 年 3 月和 2021 年 1 月達到峰值。截至檢索當日,2022 年 12 月 CSCD 收錄 COVID-19 影像相關文獻僅 1 篇,可能由于入庫時間較文獻發表時間的滯后。總之,隨著我國的診療方案及防控舉措不斷優化調整,我國疫情已基本處于可控狀態。從圖2 變化趨勢可知發文量整體態勢呈顯著增長再緩慢下降,而后維持在穩定水平。

WOS:Web of Science;CSCD:中國科學引文數據庫;COVID-19:新型冠狀病毒感染
2.3 關鍵詞分析
對納入文獻合并同義詞并排除搜索詞和廣泛關鍵詞后,共提取英文關鍵詞 713 個、中文關鍵詞 188 個。表1 分別列出中英文前 20 位高頻關鍵詞,結合節點中心度可見 COVID-19 影像領域的熱門主題是臨床特征、鑒別診斷以及人工智能。關鍵詞聚類分析見圖3、4,結合全文分析研究主題可知,現階段我國 COVID-19 影像研究熱點主要集中在 COVID-19 的臨床影像特征及人工智能輔助診斷。研究前沿的興起,將導致關鍵詞在短時間里爆發,圖5 列出了我國 COVID-19 影像研究爆發強度前 20 位關鍵詞及爆發時長。爆發強度最強的關鍵詞是“deep learning”(深度學習),爆發時長最長的關鍵詞是“attention mechanism”(注意力機制)。自 2020 年初的觀察性研究到 2021 年的機器學習再到 2022 年的隊列研究,從側重點持續及轉移的趨勢來看,改進算法模型以拓展應用場景和控制并發癥以改善臨床預后是未來的研究熱點趨勢。



COVID-19:新型冠狀病毒感染

2.4 文獻共被引網絡分析
由引文分析可知,WOS 文獻被引頻次共 107138 次,篇均引用次數 60.5;CSCD 庫內被引頻次總計 670 次,篇均引用次數 1.46。在 CiteSpace 中設置以 reference 為節點類型,共產生 937 個節點及 4782 條連接線,我國 COVID-19 影像領域共被引文獻聚類網絡分析圖譜見圖6、7,聚類結果顯示 COVID-19 臨床特征、影像表現及人工智能的應用為國內外文獻共同關注熱點,其中 CSCD 文獻共被引聚類結果中 #2 shufeng jiedu capsule 及 #9 traditional Chinese medicine 展現出中國特色。COVID-19 影像領域施引與被引文獻來源期刊的雙圖疊加結果見圖8,可見 COVID-19 影像學相關研究傾向于引用分子、生物學和遺傳學的基礎研究成果。



COVID-19:新型冠狀病毒感染
3 討論
本研究基于 WOS 數據庫和 CSCD 對 2020 年 1 月 1 日-2022 年 12 月 31 日中國學者發表的 COVID-19 影像研究文獻進行文獻計量及可視化分析,這兩大權威引文數據庫可確保樣本的代表性、時效性和可靠性[11]。從發文量來看,僅 2020 年 1 月就有 64 篇文獻發表,可見我國學者在全球 COVID-19 影像研究中發揮了重要的積極作用。隨著研究的深入,越來越多中國學者活躍在國際學術舞臺,并及時向全球同行傳遞最新影像學研究成果。值得注意的是,結合國內外發文量來看,中國學者更傾向于將學術成果發表于國外期刊。這或將造成優質論文的流失及國內關注的滯后,國內優質期刊發展任重而道遠。
從高被引文獻來看,國內外率先對 COVID-19 患者進行臨床案例報告和胸部影像表現分析的文章獲得較高的引用量。Huang 等[12]的文章在 WOS 數據庫中的被引頻次高達 17558 次,該文章報告了 COVID-19 患者的流行病學、臨床特征、實驗室結果和影像學特征以及治療結局。Ai 等[13]率先證實胸部多排螺旋 CT 薄層掃描在 COVID-19 的早期發現、疑似病例鑒別、療效評估中起至關重要的作用,尤其是對于核酸檢測假陰性的病例,CT 是診斷不可或缺的一環。Pan 等[14]對 21 例 COVID-19 患者進行隊列研究以觀察患者胸部 CT 從初診到康復的變化。由此可見,影像學從疾病診斷到療效評價再到康復預后全鏈條都發揮著不可或缺的作用。
從高頻關鍵詞來看,COVID-19 影像中外文獻的研究熱點有所重疊也有所差異。中英文獻均出現“人工智能”“深度學習”等高頻關鍵詞,結合詞條爆發強度及持續時長可見人工智能研究熱度持續攀升,深度學習是人工智能領域 COVID-19 影像輔助診斷中執行醫學影像分析任務(如圖像分類、目標檢測、語義分割)最先進方法之一[15]。在 COVID-19 疫情肆虐全球的大背景下,早期診斷對疾病治療和控制至關重要。Li 等[16]構建的深度學習模型以高準確度區分 COVID-19 與其他肺部疾病,在人工智能輔助診斷模型的幫助下,放射科醫生實現了更精確的影像診斷。Wang 等[17]根據治療方案和入院后 48 h 內收集的患者信息,成功構建 COVID-19 患者的康復時間預測模型。由此可見,對患者肺部區域醫學影像的智能影像分析和研發部署各類模型,提高了胸部疾病診斷效率及準確率,推動了人工智能影像全鏈條的發展。綜合影像、臨床、生化、治療等復雜信息,實現早期精準診斷、預測胸部疾病康復及治療影響因素,這些都給人工智能賦能胸部影像發展帶來了契機。在未來,人工智能結合醫學影像將著重于改進算法模型以拓展應用場景,完善評價體系為影像診斷提供高附加值的數據處理[18-19]。
不同之處在于“瘟疫”“中醫藥”及“中醫癥候”等中醫藥領域高頻關鍵詞成為了中國方案的亮點,為世界疫情防控提供了中國經驗。Li 等[20]通過胸部 CT 觀察核酸轉陰的恢復期患者肺部炎癥吸收情況,發現中藥在改善臨床癥狀和促進炎癥吸收方面發揮重要作用。對于重癥患者,中西醫結合診治在改善肺部影像學異常(磨玻璃影、鋪路征和肺實變等)方面優于單純西醫治療[21]。現代醫學影像手段助力傳統中醫“望聞問切”,在 COVID-19 診療中更加精準判斷疾病進程,進行療效觀察和預后判斷。總體來說,中國學者在國內外發表文章的主題深度和寬度存在差異,后期可針對這些差異進一步深入研究。
本研究結果因數據庫的選用及文獻納入有限可能產生一定的偏倚。但 WOS 及 CSCD 收錄權威高質量期刊,因此本研究展示的 COVID-19 影像學研究現狀及趨勢走向仍然具有借鑒意義。本研究聚焦于中國學者,后續研究中可擴大研究范圍以更全面了解 COVID-19 影像學研究,為把握熱點前沿及應對“長新冠”帶來的挑戰提供更有價值的參考。
綜上所述,近年來 COVID-19 影像領域研究穩中有進,研究熱點內容相對集中,人工智能輔助診斷最受關注,未來的 COVID-19 影像研究的側重點可能借助人工智能從影像診斷方面的橫斷面研究轉向康復預測方面的縱向研究。因此,為應對 COVID-19 帶來的持續影響,學者們還需進行更系統的研究。
利益沖突:所有作者聲明不存在利益沖突。