引用本文: 張笑, 黃偉, 宋彬. 基于 Citespace 的胃癌影像研究進展的可視化分析. 中國普外基礎與臨床雜志, 2021, 28(2): 256-259. doi: 10.7507/1007-9424.202012144 復制
胃癌(gastric cancer)是指原發于胃的上皮源性惡性腫瘤。近年來全球范圍內胃癌的發病率及死亡率整體有所下降[1],但是在我國的各種惡性腫瘤發病率中胃癌仍高居第 2 位,死亡率仍高居第3 位[2],嚴重危害人民健康。各國在胃癌多學科和規范化診治上不斷探索,定位診斷和分期診斷越來越受到重視,同時影像技術的發展也為胃癌分期提供了更多的選擇,在中華人民共和國國家衛生健康委員會醫政醫管局制定的胃癌診療規范[3]和國際抗癌聯盟及美國癌癥聯合會(UICC/AJCC)胃癌 TNM 分期系統[4]中,均提及了包括超聲內鏡(endoscopic ultrasonography,EUS)、多層螺旋 CT(MDCT)、MRI、正電子發射體層成像(PET)/CT 等多種影像檢查方法在定位診斷和分期診斷中的應用。筆者通過對胃癌影像相關的文獻進行可視化展示,依次分析胃癌影像的研究前沿、研究熱點等,結合時間線相關的演化路徑,預測研究趨勢,以期讓影像醫師和胃腸外科醫師把握胃癌影像研究的整體概貌。
1 數據與方法
1.1 數據來源
檢索 Web of Science(WOS)數據庫核心合集中 2010–2020 年(檢索時間至 2020 年 12 月 29 日,雖然數據不完整,但已包含 2020 年大部分的文獻)期間發表的關于胃癌影像的文獻,檢索式為:#1 TS=gastric cancer OR TS=stomach cancer OR TS=gastric carcinoma;#2 TS=diagnostic imaging OR TS=medical imaging。組配檢索式:#1 AND #2。語種:English。文獻類型:Article。檢索結果下載格式為“download_XXX.txt”。本研究數據符合 HIPAA 法案要求,且不需要所在機構倫理委員會批準。
1.2 分析方法
采用 CiteSpace 5.7.R3 軟件[5]對上述數據分別進行關鍵詞共現和文獻共被引分析,生成可視化彩色圖譜進行展示,并對數據分析結果和可視化圖譜進行解讀。
利用 Citespace,以 1 年作為時間分區。將共被引參考文獻運算關鍵參數設置為:Link Retaining Factor,2;Look Back Years,5;剪枝算法采用 Pathfinder;選擇標準為 g-index,共獻 K=30。高被引用文獻按照時間排序,繪制共被引網絡知識圖譜進行被引用文獻分析,得出節點和連線數目,節點代表被引用文獻,連線代表共被引關系,連線越多表明共被引次數越高。運用對數似然比算法取主題詞進行聚類計算,聚類標簽以序號顯示,數值越小表示該聚類文獻發表數量以及被引頻次越高[6]。
關鍵詞知識圖譜采用 Minimum spanning tree 的剪枝算法去除不重要的節點和連線,使得網絡中重要的節點和連線更加清晰,采用關鍵詞時間線進行研究前沿分析[6]。利用 CiteSpace 提供的詞頻探測技術在關鍵詞共現可視化網絡圖譜的基礎上進行突現值(burst term)分析,通過考察詞頻的時間分布,將其中頻次變化率高的詞從大量的主題詞中探測出來,依靠詞頻的變動演進反映領域發展趨勢[5]。突發檢測是一種算法,用于識別事件和其他類型信息的突然變化[5]。
2 結果
2.1 發表文獻的年代分布
共 726 篇文獻被納入研究,各年份發表文章數量如圖1。2010–2020 年期間胃癌影像相關研究的文章發表數量逐年增加。其中中國發表 201 篇,日本發表 198 篇,美國發表 101 篇,韓國發表73 篇,德國發表30 篇。

2.2 文獻共被引分析
采用 Citespace 生成文獻共被引網絡圖譜,得到節點 586 個、連線 1 569 條,采用聚類節點樣式、連線為直線型,取消網絡聚類的實心填充和邊界,網絡整體顏色顯示為彩色、時間線從深紫色向黃色演進,具體見圖2。

根據引文共被引聚類分析結果(圖2),可見網絡共劃分為 15 個同被引聚類,運用對數似然比算法計算聚類標簽,顯示出:#0 共聚焦激光顯微內鏡、#1 胃癌、#2 胃黏膜腸上皮化生、#3 手術前 T 分期、#4 卷積神經網絡、#5 深度學習、#6 進展期胃癌、#7 體內分化、#8 早期胃癌、#9 手術治療、#11 胃周淋巴結、#12 5-氨基乙酰丙酸載體熒光顯像、#13 腹部淋巴結轉移、#14 食管鱗狀細胞癌、#16 近鄰算法等聚類(#10 和#15 聚類因聚類數量過小剪掉以后未顯示)。
2.3 研究領域熱點結果
采用 Citespace 生成關鍵詞共現可視化網絡圖譜,得到節點 494 個、連線 852 條,繪制時間線圖并取圖的一部分展示近期研究的關鍵詞,根據時間線推演 2018–2020 年期間的關鍵詞有神經網絡、深度學習、人工智能、早期胃癌、圖像分割、分期、影像組學等。進行突發性檢測,一共檢測到 33 個突發性關鍵詞,見圖3。結合引用時間推演結果,得出 2018–2020 年期間的近期領域熱點關鍵詞:風險因素、特征、深度學習、化學療法和神經網絡。

3 討論
CiteSpace 是一款以引文和被引文獻數據為基礎的幫助研究人員對大量科學文獻數據進行計量和分析的可視化軟件,利用分時、動態的可視化圖譜去展示某一領域知識的宏觀結構以及發展脈絡,識別并顯示某一領域知識發展的趨勢和動態,展現研究熱點及前沿方向[7],有助于研究人員迅速了解某一研究領域。本研究通過 CiteSpace 知識圖譜可視化軟件,對基于 WOS 核心合集數據庫的數據進行了胃癌影像研究領域的探索,分析表明胃癌影像研究逐年增多,并且不只是理論研究,還有與真實世界數據[8]緊密相關的實踐探索。
有文獻顯示,在不同時期研究者們主要做的相關研究也反映了研究者對胃癌的不斷認識過程,不同時期側重用的影像技術不同[9-12],胃癌早期應用較多的是超聲、內鏡以及螺旋 CT,隨著研究的深入,明確了超聲內鏡在早癌篩查及術前分期中的作用[9-12],而 CT 檢查研究向多排多層 CT 應用和 CT 掃描評估方向發展。CT 對進展期胃癌的敏感度為65%~90%,對早期胃癌的敏感度約為 50%:對 T 分期的判斷準確率為 70%~90%,對 N 分期的判斷準確率為 40%~70%,因而目前胃癌的主要檢查方式是 CT 檢查,并在胃癌分期診斷中被推薦為首選影像方法[3]。
從共被引文獻聚類結果的時間演進可以看出,胃癌影像的相關研究熱點已經從之前的病理和手術治療相關研究(#0 共聚焦激光顯微內鏡、#2 胃黏膜腸上皮化生、#3 手術前 T 分期、#7 體內分化、#9 手術治療)向關注胃癌早期發現、進展評估、人工智能等新技術應用轉變(#4 卷積神經網絡、#5 深度學習、#6 進展期胃癌、#8 早期胃癌、#11 胃周淋巴結、#16 近鄰算法等聚類)。有學者[13]將卷積神經網絡與內窺鏡影像結合在一起進行胃癌和胃炎的鑒別診斷,有學者[14]將深度學習與 CT 掃描結合構建術前評估模型,也表明了胃癌影像研究已經從關注單純的診斷和服務于手術治療向疾病的系統診治、綜合評估和新技術應用發展。
隨著胃癌診療指南不斷更新,胃癌診療向規范化診療和多學科綜合治療發展[9-10]。隨著影像學檢查手段的廣泛使用和檢查技術的迅速發展,腫瘤影像學幾乎涉及到胃癌患者管理的每一個階段,系統性思維對診斷、治療和手術都很重要。我們要明確影像學檢查的目的在于確定有無胃癌,明確腫瘤的位置以及腫瘤累及的范圍,進行腫瘤分期,評估是否能手術切除,預測預后情況[3],結合新技術、新方法,引入新思維,建立早發現、早診治、精準診療的系統診治評估模型。由此,未來的研究前沿可能會在早期胃癌篩查、影像組學、人工智能輔助檢查等新方法應用中進一步展開。
本研究反映了近 11 年來胃癌影像研究的趨勢,但不足之處在于文獻檢索僅截止到 2020 年 12 月 29 日,未檢索 2020 年全年的文獻;搜索的數據庫僅限于 Web of Science 核心合集,且僅檢索了英文文獻,因此本研究尚不能完全反映胃癌影像相關研究的現狀與趨勢。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:張笑撰寫文章,黃偉參與研究,宋彬給予工作支持。
胃癌(gastric cancer)是指原發于胃的上皮源性惡性腫瘤。近年來全球范圍內胃癌的發病率及死亡率整體有所下降[1],但是在我國的各種惡性腫瘤發病率中胃癌仍高居第 2 位,死亡率仍高居第3 位[2],嚴重危害人民健康。各國在胃癌多學科和規范化診治上不斷探索,定位診斷和分期診斷越來越受到重視,同時影像技術的發展也為胃癌分期提供了更多的選擇,在中華人民共和國國家衛生健康委員會醫政醫管局制定的胃癌診療規范[3]和國際抗癌聯盟及美國癌癥聯合會(UICC/AJCC)胃癌 TNM 分期系統[4]中,均提及了包括超聲內鏡(endoscopic ultrasonography,EUS)、多層螺旋 CT(MDCT)、MRI、正電子發射體層成像(PET)/CT 等多種影像檢查方法在定位診斷和分期診斷中的應用。筆者通過對胃癌影像相關的文獻進行可視化展示,依次分析胃癌影像的研究前沿、研究熱點等,結合時間線相關的演化路徑,預測研究趨勢,以期讓影像醫師和胃腸外科醫師把握胃癌影像研究的整體概貌。
1 數據與方法
1.1 數據來源
檢索 Web of Science(WOS)數據庫核心合集中 2010–2020 年(檢索時間至 2020 年 12 月 29 日,雖然數據不完整,但已包含 2020 年大部分的文獻)期間發表的關于胃癌影像的文獻,檢索式為:#1 TS=gastric cancer OR TS=stomach cancer OR TS=gastric carcinoma;#2 TS=diagnostic imaging OR TS=medical imaging。組配檢索式:#1 AND #2。語種:English。文獻類型:Article。檢索結果下載格式為“download_XXX.txt”。本研究數據符合 HIPAA 法案要求,且不需要所在機構倫理委員會批準。
1.2 分析方法
采用 CiteSpace 5.7.R3 軟件[5]對上述數據分別進行關鍵詞共現和文獻共被引分析,生成可視化彩色圖譜進行展示,并對數據分析結果和可視化圖譜進行解讀。
利用 Citespace,以 1 年作為時間分區。將共被引參考文獻運算關鍵參數設置為:Link Retaining Factor,2;Look Back Years,5;剪枝算法采用 Pathfinder;選擇標準為 g-index,共獻 K=30。高被引用文獻按照時間排序,繪制共被引網絡知識圖譜進行被引用文獻分析,得出節點和連線數目,節點代表被引用文獻,連線代表共被引關系,連線越多表明共被引次數越高。運用對數似然比算法取主題詞進行聚類計算,聚類標簽以序號顯示,數值越小表示該聚類文獻發表數量以及被引頻次越高[6]。
關鍵詞知識圖譜采用 Minimum spanning tree 的剪枝算法去除不重要的節點和連線,使得網絡中重要的節點和連線更加清晰,采用關鍵詞時間線進行研究前沿分析[6]。利用 CiteSpace 提供的詞頻探測技術在關鍵詞共現可視化網絡圖譜的基礎上進行突現值(burst term)分析,通過考察詞頻的時間分布,將其中頻次變化率高的詞從大量的主題詞中探測出來,依靠詞頻的變動演進反映領域發展趨勢[5]。突發檢測是一種算法,用于識別事件和其他類型信息的突然變化[5]。
2 結果
2.1 發表文獻的年代分布
共 726 篇文獻被納入研究,各年份發表文章數量如圖1。2010–2020 年期間胃癌影像相關研究的文章發表數量逐年增加。其中中國發表 201 篇,日本發表 198 篇,美國發表 101 篇,韓國發表73 篇,德國發表30 篇。

2.2 文獻共被引分析
采用 Citespace 生成文獻共被引網絡圖譜,得到節點 586 個、連線 1 569 條,采用聚類節點樣式、連線為直線型,取消網絡聚類的實心填充和邊界,網絡整體顏色顯示為彩色、時間線從深紫色向黃色演進,具體見圖2。

根據引文共被引聚類分析結果(圖2),可見網絡共劃分為 15 個同被引聚類,運用對數似然比算法計算聚類標簽,顯示出:#0 共聚焦激光顯微內鏡、#1 胃癌、#2 胃黏膜腸上皮化生、#3 手術前 T 分期、#4 卷積神經網絡、#5 深度學習、#6 進展期胃癌、#7 體內分化、#8 早期胃癌、#9 手術治療、#11 胃周淋巴結、#12 5-氨基乙酰丙酸載體熒光顯像、#13 腹部淋巴結轉移、#14 食管鱗狀細胞癌、#16 近鄰算法等聚類(#10 和#15 聚類因聚類數量過小剪掉以后未顯示)。
2.3 研究領域熱點結果
采用 Citespace 生成關鍵詞共現可視化網絡圖譜,得到節點 494 個、連線 852 條,繪制時間線圖并取圖的一部分展示近期研究的關鍵詞,根據時間線推演 2018–2020 年期間的關鍵詞有神經網絡、深度學習、人工智能、早期胃癌、圖像分割、分期、影像組學等。進行突發性檢測,一共檢測到 33 個突發性關鍵詞,見圖3。結合引用時間推演結果,得出 2018–2020 年期間的近期領域熱點關鍵詞:風險因素、特征、深度學習、化學療法和神經網絡。

3 討論
CiteSpace 是一款以引文和被引文獻數據為基礎的幫助研究人員對大量科學文獻數據進行計量和分析的可視化軟件,利用分時、動態的可視化圖譜去展示某一領域知識的宏觀結構以及發展脈絡,識別并顯示某一領域知識發展的趨勢和動態,展現研究熱點及前沿方向[7],有助于研究人員迅速了解某一研究領域。本研究通過 CiteSpace 知識圖譜可視化軟件,對基于 WOS 核心合集數據庫的數據進行了胃癌影像研究領域的探索,分析表明胃癌影像研究逐年增多,并且不只是理論研究,還有與真實世界數據[8]緊密相關的實踐探索。
有文獻顯示,在不同時期研究者們主要做的相關研究也反映了研究者對胃癌的不斷認識過程,不同時期側重用的影像技術不同[9-12],胃癌早期應用較多的是超聲、內鏡以及螺旋 CT,隨著研究的深入,明確了超聲內鏡在早癌篩查及術前分期中的作用[9-12],而 CT 檢查研究向多排多層 CT 應用和 CT 掃描評估方向發展。CT 對進展期胃癌的敏感度為65%~90%,對早期胃癌的敏感度約為 50%:對 T 分期的判斷準確率為 70%~90%,對 N 分期的判斷準確率為 40%~70%,因而目前胃癌的主要檢查方式是 CT 檢查,并在胃癌分期診斷中被推薦為首選影像方法[3]。
從共被引文獻聚類結果的時間演進可以看出,胃癌影像的相關研究熱點已經從之前的病理和手術治療相關研究(#0 共聚焦激光顯微內鏡、#2 胃黏膜腸上皮化生、#3 手術前 T 分期、#7 體內分化、#9 手術治療)向關注胃癌早期發現、進展評估、人工智能等新技術應用轉變(#4 卷積神經網絡、#5 深度學習、#6 進展期胃癌、#8 早期胃癌、#11 胃周淋巴結、#16 近鄰算法等聚類)。有學者[13]將卷積神經網絡與內窺鏡影像結合在一起進行胃癌和胃炎的鑒別診斷,有學者[14]將深度學習與 CT 掃描結合構建術前評估模型,也表明了胃癌影像研究已經從關注單純的診斷和服務于手術治療向疾病的系統診治、綜合評估和新技術應用發展。
隨著胃癌診療指南不斷更新,胃癌診療向規范化診療和多學科綜合治療發展[9-10]。隨著影像學檢查手段的廣泛使用和檢查技術的迅速發展,腫瘤影像學幾乎涉及到胃癌患者管理的每一個階段,系統性思維對診斷、治療和手術都很重要。我們要明確影像學檢查的目的在于確定有無胃癌,明確腫瘤的位置以及腫瘤累及的范圍,進行腫瘤分期,評估是否能手術切除,預測預后情況[3],結合新技術、新方法,引入新思維,建立早發現、早診治、精準診療的系統診治評估模型。由此,未來的研究前沿可能會在早期胃癌篩查、影像組學、人工智能輔助檢查等新方法應用中進一步展開。
本研究反映了近 11 年來胃癌影像研究的趨勢,但不足之處在于文獻檢索僅截止到 2020 年 12 月 29 日,未檢索 2020 年全年的文獻;搜索的數據庫僅限于 Web of Science 核心合集,且僅檢索了英文文獻,因此本研究尚不能完全反映胃癌影像相關研究的現狀與趨勢。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:張笑撰寫文章,黃偉參與研究,宋彬給予工作支持。