引用本文: 譚善源, 黃夏璇, 袁師其, 凌一童, 黃禮瑩, 梁學致, 呂軍, 徐安定, 李媛潔. 基于文獻計量學的癡呆在英國生物銀行數據庫的研究現狀. 中國循證醫學雜志, 2023, 23(4): 426-432. doi: 10.7507/1672-2531.202301015 復制
1 引言
癡呆是指器質性疾病引起的一組嚴重認知功能缺陷或衰退的臨床綜合征,如進行性思維、記憶、行為和人格障礙等[1]。《柳葉刀-公共衛生》指出,2019年全球40歲以上成年人中共有5 700萬名癡呆患者,這一數字預計在2050年將增長至1.53億,人口增長和人口老齡化是主要原因[2]。國際阿爾茨海默病協會(Alzheimer's disease international,ADI)發布的《2022世界阿爾茨海默病報告》中提及,全球約75%的癡呆癥患者未得到診斷,在一些低收入和中等收入國家,這一比例高達90% [3]。因此,提高公眾對癡呆的防治意識,規范癡呆相關疾病的診斷標準十分重要。
英國生物銀行(UK Biobank,UKB)數據庫,又稱英國生物樣本庫,是迄今以來規模最大的有關致病或預防疾病的基因和環境因子的信息資源庫[4]。自2006年創建以來,共收錄約50萬英國人群的健康數據,因其納入的人口基數大,收集數據流程規范嚴謹,有利于研究人員探究諸多慢性病與健康的關系,從而有助于提高公共健康和環境水平。本文擬對SCIE和PubMed數據庫收錄的基于UKB數據庫在癡呆方面的研究進行梳理歸納并分析總結,以更好了解UKB數據庫癡呆研究現狀,對比國內外研究人員對該數據庫的信息挖掘水平,為今后的臨床研究提供參考。
2 ?資料與方法
2.1 ?納入與排除標準
納入標準:① SCIE和PubMed數據庫中已發表的基于UKB數據庫的癡呆相關研究[5-7];② 發表時間為2018年1月1日至2022年11月30日。
排除標準:① 研究內容僅與癡呆相關而與UKB數據庫無關的文獻;② 研究文獻載體為圖書、報紙、成果;③ 已在線發表但未正式見刊的文獻。④ 重復發表文獻僅納入數據最全最新的報告。
2.2 ?文獻檢索與數據來源
檢索2018年1月1日至2022年11月30日收錄于PubMed、SCIE數據庫,基于UKB數據庫的癡呆研究相關的文獻,主要檢索詞有:dementia、Alzheimer、amentia、aphrenia、UK Biobank等。
2.3 ?文獻篩選與資料提取
利用EndNote X9軟件對納入的文獻進行分類整理,去除重復文獻。對納入文獻研究年份、國家/地區、研究機構、研究方向、作者、文獻類型、來源出版物、高被引文獻及論文總被引頻次等信息進行提取。利用普賴斯定律和綜合指數法,探究核心作者群體分布[8-10]。
2.4 ?統計分析
采用文獻計量學方法進行分析,利用VOSviewer 1.6.18軟件對標題和摘要出現的高頻關鍵詞、核心作者分布進行分析,生成可視化網絡圖[11]。對于高頻關鍵詞關系網絡圖,主要由多個圓形節點和線條組成,不同的節點代表不同的關鍵詞,而節點的圓形直徑代表關鍵詞出現的頻次,節點直徑越大,頻次越高;具有相關性的關鍵詞用線條連接,線條的粗細代表被連接關鍵詞的相關性,線條越粗,相關性越強。核心作者關系圖,設定作者最少發文數為3篇,被引頻次等于或大于13次,并計算與其他作者之間合作連接的總強度,選擇總連接強度最大的作者,顏色范圍從藍色至黃色,作者之間的合作程度越緊密則顏色越接近黃色。在關鍵詞關系網絡圖中,每一個節點代表一個關鍵詞,節點的圓圈直徑越大則關鍵詞出現的頻次越高,不同關鍵詞之間連接線越粗,表示兩者之間的關系越緊密。通過Bibliometric [12-13]分析平臺、IBM SPSS 27.0統計軟件分析文獻的年份、地區、機構間關系、關鍵詞分布,探究研究熱點。
3 ?結果
3.1 ?基本特征
初步檢索獲得相關文獻463篇,其中PubMed數據庫156篇、SCIE數據庫307篇,根據納入與排除標準剔除不符合條件的文獻,最終納入文獻279篇。文獻類型以學術論文為主,共263篇(94.20%),其余類型為會議摘要(12篇,4.30%)、綜述(2篇,0.72%)、社論材料(2篇,0.72%),提示學術論文是UKB數據庫癡呆研究成果的主要產出形式。
3.2 ?文獻年載文量分布
對納入文獻發表年份和文獻累計量分布情況進行分析,結果顯示2018—2022年發文量呈逐年增長的趨勢,2021—2022年論文數量增長幅度最大,2022年截至11月30日已發表127篇,近5年文獻累積總量隨年份呈指數增長,反映了SCIE和PubMed數據庫收錄的與UKB數據庫有關的癡呆文獻的總體發展趨勢良好(圖1)。

注:2022年統計截至2022年11月30日。
3.3 ?文獻來源國家/地區分布
SCIE數據庫納入文獻共涉及39個國家和地區,通過分析檢索結果獲得文獻發表總量排名前10的國家/地區分布表(表1)。英國參與發表的文獻總量排名第一,有125篇;美國排名第二,有112篇;中國位列其后,有66篇。通過Bibliometric分析平臺發現,大部分都是以與本國國內作者合作論文為主,而英國作為該公共數據庫的創建國家,與其他國家/地區的作者合作比例最高,與英國合作排名前5位的國家/地區為美國、澳大利亞、德國、中國及瑞典;而與中國合作論文前3位的國家有澳大利亞、美國、英國(圖2)。


注:2022年統計截至2022年11月30日。
3.4 ?期刊載文量分布
圖3展示了主要出版商的發文情況。德國的Springer Nature排名第一(57篇),其次為荷蘭的Elsevier(42篇)、英國的Oxford Univ Press和美國的Wiley以26篇并列第三。發文量排名前十的期刊主要來自美國(5家)、英國(4家),對于UKB數據庫的臨床研究與數據挖掘在國際上具有一定的貢獻力和領先優勢。發文量大于5篇的期刊共計12本,其中發文最多的是荷蘭的Journal of Alzheimers Disease和英國的Scientific Reports,均為14篇(表2)。


3.5 ?文獻作者分布
納入文獻的主要作者共1 389位,表3統計了發文量前十位的作者的情況,發文量最大的是來自中國的Yu JT(11篇),被引頻次為23次,被引頻次最多的是來自英國的Deary IJ(403次),發文數量為7篇,中英兩國作者群體發文量與被引頻次存在明顯差異。對所獲得數據利用IBM SPSS 27.0軟件進行統計分析,根據兩獨立樣本比較的Wilcoxon秩和檢驗結果顯示,中英兩國作者所發表文獻出版年份分布存在統計學差異(Z=?4.448,P<0.01),中國作者文章發表年份集中分布在近三年,如圖4顯示。


納入文獻中,作者最大發文量為11篇,單篇文獻最大被引用次數為274次,依據文獻計量學中著名學者普賴斯(PRICED) [14]所提出的計算公式進行統計:
Mp=0.749×=0.749×
=2.48(篇),
Mc=0.749×=0.749×
=12.40(次)
得出核心作者最少發文量為2.48篇,最小被引頻次為12.40次,即發表3篇或3篇以上論文(137人)、被引頻次為13次或13次以上(383人)的作者入選核心作者候選人。根據統計,同時滿足以上兩點的作者人數為101人,中國作者占19人,占比約18.8%,核心作者關系熱圖詳見圖5,呈現多島嶼狀,核心作者跨機構或跨國家/地區合作研究較少,尚未出現發文量大,被引頻次多的領軍人物[15]。

3.6 ?癡呆主要類型分析
2018中國癡呆與認知障礙診治指南指出,癡呆按照是否為變性病可分為變性病癡呆和非變性病癡呆[16],前者主要類型為阿爾茨海默病,后者的主要類型為血管性癡呆,對納入文獻標題及摘要利用EndNote X9軟件進行統計分析,研究全因性癡呆的文獻有38篇;有關變性病癡呆的文獻中,研究阿爾茨海默病的文獻最多,有143篇,其中12篇主要研究晚發型阿爾茨海默病,額顳葉癡呆有10篇,路易體癡呆有2篇;有關非變性病癡呆的文獻中,血管性癡呆有30篇。阿爾茨海默病和血管性癡呆作為癡呆的兩種主要類型,相關的文獻數量較多。
3.7 ?文獻關鍵詞的可視化分析
對納入文獻的關鍵詞借助VOSviewer 1.6.18軟件進行分析,出現頻次大于40次的主題詞共有9個,其中Alzheimer(阿爾茨海默病)出現124次,其次為volume(體積)57次、incident dementia(癡呆事件)47次、hazard ratio(相對風險比)46次、genome-wide association study(全基因組關聯研究)46次。根據關鍵詞關聯性強度進行統計可得表4,可見關聯性強關鍵詞中基本以基因為主題。根據關鍵詞出現頻次得到所有關鍵詞之間的網絡關系,結果顯示,癡呆的風險評估是UKB數據庫的研究熱點和數據挖掘潛力點。

4 ?討論
UKB數據庫是迄今為止最大的高通量基因、基線、影像數據庫,對其進行研究有利于慢性病健康和公共衛生的發展[4]。UKB數據庫作為一個大型前瞻性隊列研究及生物醫學數據庫,對癡呆進行臨床研究十分有優勢[17]。本文基于SCIE和PubMed數據庫,采用文獻計量學分析方法,使用EndNote X9文獻管理軟件進行文獻篩選和整理,部分統計數據使用IBM SPSS 27.0進行統計分析,借助VOSviewer分析軟件和Bibliometric文獻分析網站平臺進行文獻統計及可視化分析,對自2018年1月1日至2022年11月30日發表的基于UKB數據庫的癡呆相關文獻從發文量、國家/地區、作者、期刊、出版機構、關鍵詞等方面進行了統計分析,為進一步的研究提供參考。
根據Shneider [18]提出的科學學科發展的四階段理論,即緩慢增長的初始階段、指數增長階段、線性增長階段和緩慢增長階段。2018至2022年間癡呆在UKB數據庫臨床研究的相關文獻數量呈現逐年增長的趨勢,基本達到了指數增長的階段,推測未來該領域發文量將呈現可觀的態勢。
通過分析納入文獻的國家/地區分布、出版期刊與出版商信息,本研究發現:英國發文量最多、發文量前10的期刊以美國數量最多,影響力較大,體現了英美學者在基于UKB數據庫對癡呆的研究參與度較高。中國文章占比約24.4%,位列第三,提示中國在該研究領域初露頭角,主要文章分布在最近三年,具有一定的研究水平,但總體文獻影響力仍有待提升。
通過對核心作者關系的統計和分析,可以反映作者在UKB數據庫癡呆領域研究的影響力,包括發表的論文數、被引次數和發文量等。本研究結果顯示,中國學者Yu JT的發文數量最大,而被引頻次最多的為英國學者Deary IJ,可以初步判斷該領域尚未形成主要的核心作者群。從作者關系熱圖可以看出,核心作者分布以研究機構成群,跨國合作研究占比不高,尚不利于提升該研究領域的影響力和參與性。因此,各國學者應積極與其他國家學者合作交流,提高科研合作水平[19]。
對于癡呆的主要類型,通過分析納入文獻的標題和摘要,UKB數據庫對癡呆亞型的研究主要集中在阿爾茨海默病和血管性癡呆。文獻的關鍵詞凝聚了一篇文獻的主題,從關鍵詞出現頻次分析,以阿爾茨海默病出現最多,有124次。阿爾茨海默病是神經退行性癡呆最常見的類型[20],一直是全球神經退行性疾病的關注熱點。中國社會正在進入人口老齡化階段,王英全等[21]預測,如果不采取相應的有效預防措施,2050年阿爾茨海默病患病人數將是2015年的2.35倍。從關鍵詞關聯性強度分析,關聯性較強的關鍵詞基本和基因相關,Mendelian randomization(孟德爾隨機化研究)、genome-wide association study(全基因組關聯研究)均是目前UKB數據庫研究的熱點方法[22],得益于UKB數據庫收錄了高通量的基因組學遺傳數據。從關鍵詞出現時間分析,癡呆事件、相對危險比、癡呆風險等詞出現在2021—2022年,提示未來研究人員可從降低癡呆風險的角度設計相關UKB臨床研究課題。
本研究存在一定局限性。一方面,僅對PubMed、SCIE兩個數據庫進行了檢索,納入文獻涵蓋大部分英文文獻,但未對其他數據庫進行檢索,可能造成部分相關文獻缺失;部分統計僅分析了SCIE數據庫收錄的文獻;統計國家/地區時從參與作者角度分析,考慮到了所有作者,但未分析第一作者所屬國家/地區。另一方面,UKB數據庫納入人群基本為英國健康白人,在國家/地區分布、種族和收入方面存在選擇偏倚,無法短時間內推廣至其他人群;對UKB數據庫的了解不夠深入,檢索主題詞和自由詞的范圍受限,仍待更加完善的檢索方式以擴大檢索范圍提高查全查準率。
1 引言
癡呆是指器質性疾病引起的一組嚴重認知功能缺陷或衰退的臨床綜合征,如進行性思維、記憶、行為和人格障礙等[1]。《柳葉刀-公共衛生》指出,2019年全球40歲以上成年人中共有5 700萬名癡呆患者,這一數字預計在2050年將增長至1.53億,人口增長和人口老齡化是主要原因[2]。國際阿爾茨海默病協會(Alzheimer's disease international,ADI)發布的《2022世界阿爾茨海默病報告》中提及,全球約75%的癡呆癥患者未得到診斷,在一些低收入和中等收入國家,這一比例高達90% [3]。因此,提高公眾對癡呆的防治意識,規范癡呆相關疾病的診斷標準十分重要。
英國生物銀行(UK Biobank,UKB)數據庫,又稱英國生物樣本庫,是迄今以來規模最大的有關致病或預防疾病的基因和環境因子的信息資源庫[4]。自2006年創建以來,共收錄約50萬英國人群的健康數據,因其納入的人口基數大,收集數據流程規范嚴謹,有利于研究人員探究諸多慢性病與健康的關系,從而有助于提高公共健康和環境水平。本文擬對SCIE和PubMed數據庫收錄的基于UKB數據庫在癡呆方面的研究進行梳理歸納并分析總結,以更好了解UKB數據庫癡呆研究現狀,對比國內外研究人員對該數據庫的信息挖掘水平,為今后的臨床研究提供參考。
2 ?資料與方法
2.1 ?納入與排除標準
納入標準:① SCIE和PubMed數據庫中已發表的基于UKB數據庫的癡呆相關研究[5-7];② 發表時間為2018年1月1日至2022年11月30日。
排除標準:① 研究內容僅與癡呆相關而與UKB數據庫無關的文獻;② 研究文獻載體為圖書、報紙、成果;③ 已在線發表但未正式見刊的文獻。④ 重復發表文獻僅納入數據最全最新的報告。
2.2 ?文獻檢索與數據來源
檢索2018年1月1日至2022年11月30日收錄于PubMed、SCIE數據庫,基于UKB數據庫的癡呆研究相關的文獻,主要檢索詞有:dementia、Alzheimer、amentia、aphrenia、UK Biobank等。
2.3 ?文獻篩選與資料提取
利用EndNote X9軟件對納入的文獻進行分類整理,去除重復文獻。對納入文獻研究年份、國家/地區、研究機構、研究方向、作者、文獻類型、來源出版物、高被引文獻及論文總被引頻次等信息進行提取。利用普賴斯定律和綜合指數法,探究核心作者群體分布[8-10]。
2.4 ?統計分析
采用文獻計量學方法進行分析,利用VOSviewer 1.6.18軟件對標題和摘要出現的高頻關鍵詞、核心作者分布進行分析,生成可視化網絡圖[11]。對于高頻關鍵詞關系網絡圖,主要由多個圓形節點和線條組成,不同的節點代表不同的關鍵詞,而節點的圓形直徑代表關鍵詞出現的頻次,節點直徑越大,頻次越高;具有相關性的關鍵詞用線條連接,線條的粗細代表被連接關鍵詞的相關性,線條越粗,相關性越強。核心作者關系圖,設定作者最少發文數為3篇,被引頻次等于或大于13次,并計算與其他作者之間合作連接的總強度,選擇總連接強度最大的作者,顏色范圍從藍色至黃色,作者之間的合作程度越緊密則顏色越接近黃色。在關鍵詞關系網絡圖中,每一個節點代表一個關鍵詞,節點的圓圈直徑越大則關鍵詞出現的頻次越高,不同關鍵詞之間連接線越粗,表示兩者之間的關系越緊密。通過Bibliometric [12-13]分析平臺、IBM SPSS 27.0統計軟件分析文獻的年份、地區、機構間關系、關鍵詞分布,探究研究熱點。
3 ?結果
3.1 ?基本特征
初步檢索獲得相關文獻463篇,其中PubMed數據庫156篇、SCIE數據庫307篇,根據納入與排除標準剔除不符合條件的文獻,最終納入文獻279篇。文獻類型以學術論文為主,共263篇(94.20%),其余類型為會議摘要(12篇,4.30%)、綜述(2篇,0.72%)、社論材料(2篇,0.72%),提示學術論文是UKB數據庫癡呆研究成果的主要產出形式。
3.2 ?文獻年載文量分布
對納入文獻發表年份和文獻累計量分布情況進行分析,結果顯示2018—2022年發文量呈逐年增長的趨勢,2021—2022年論文數量增長幅度最大,2022年截至11月30日已發表127篇,近5年文獻累積總量隨年份呈指數增長,反映了SCIE和PubMed數據庫收錄的與UKB數據庫有關的癡呆文獻的總體發展趨勢良好(圖1)。

注:2022年統計截至2022年11月30日。
3.3 ?文獻來源國家/地區分布
SCIE數據庫納入文獻共涉及39個國家和地區,通過分析檢索結果獲得文獻發表總量排名前10的國家/地區分布表(表1)。英國參與發表的文獻總量排名第一,有125篇;美國排名第二,有112篇;中國位列其后,有66篇。通過Bibliometric分析平臺發現,大部分都是以與本國國內作者合作論文為主,而英國作為該公共數據庫的創建國家,與其他國家/地區的作者合作比例最高,與英國合作排名前5位的國家/地區為美國、澳大利亞、德國、中國及瑞典;而與中國合作論文前3位的國家有澳大利亞、美國、英國(圖2)。


注:2022年統計截至2022年11月30日。
3.4 ?期刊載文量分布
圖3展示了主要出版商的發文情況。德國的Springer Nature排名第一(57篇),其次為荷蘭的Elsevier(42篇)、英國的Oxford Univ Press和美國的Wiley以26篇并列第三。發文量排名前十的期刊主要來自美國(5家)、英國(4家),對于UKB數據庫的臨床研究與數據挖掘在國際上具有一定的貢獻力和領先優勢。發文量大于5篇的期刊共計12本,其中發文最多的是荷蘭的Journal of Alzheimers Disease和英國的Scientific Reports,均為14篇(表2)。


3.5 ?文獻作者分布
納入文獻的主要作者共1 389位,表3統計了發文量前十位的作者的情況,發文量最大的是來自中國的Yu JT(11篇),被引頻次為23次,被引頻次最多的是來自英國的Deary IJ(403次),發文數量為7篇,中英兩國作者群體發文量與被引頻次存在明顯差異。對所獲得數據利用IBM SPSS 27.0軟件進行統計分析,根據兩獨立樣本比較的Wilcoxon秩和檢驗結果顯示,中英兩國作者所發表文獻出版年份分布存在統計學差異(Z=?4.448,P<0.01),中國作者文章發表年份集中分布在近三年,如圖4顯示。


納入文獻中,作者最大發文量為11篇,單篇文獻最大被引用次數為274次,依據文獻計量學中著名學者普賴斯(PRICED) [14]所提出的計算公式進行統計:
Mp=0.749×=0.749×
=2.48(篇),
Mc=0.749×=0.749×
=12.40(次)
得出核心作者最少發文量為2.48篇,最小被引頻次為12.40次,即發表3篇或3篇以上論文(137人)、被引頻次為13次或13次以上(383人)的作者入選核心作者候選人。根據統計,同時滿足以上兩點的作者人數為101人,中國作者占19人,占比約18.8%,核心作者關系熱圖詳見圖5,呈現多島嶼狀,核心作者跨機構或跨國家/地區合作研究較少,尚未出現發文量大,被引頻次多的領軍人物[15]。

3.6 ?癡呆主要類型分析
2018中國癡呆與認知障礙診治指南指出,癡呆按照是否為變性病可分為變性病癡呆和非變性病癡呆[16],前者主要類型為阿爾茨海默病,后者的主要類型為血管性癡呆,對納入文獻標題及摘要利用EndNote X9軟件進行統計分析,研究全因性癡呆的文獻有38篇;有關變性病癡呆的文獻中,研究阿爾茨海默病的文獻最多,有143篇,其中12篇主要研究晚發型阿爾茨海默病,額顳葉癡呆有10篇,路易體癡呆有2篇;有關非變性病癡呆的文獻中,血管性癡呆有30篇。阿爾茨海默病和血管性癡呆作為癡呆的兩種主要類型,相關的文獻數量較多。
3.7 ?文獻關鍵詞的可視化分析
對納入文獻的關鍵詞借助VOSviewer 1.6.18軟件進行分析,出現頻次大于40次的主題詞共有9個,其中Alzheimer(阿爾茨海默病)出現124次,其次為volume(體積)57次、incident dementia(癡呆事件)47次、hazard ratio(相對風險比)46次、genome-wide association study(全基因組關聯研究)46次。根據關鍵詞關聯性強度進行統計可得表4,可見關聯性強關鍵詞中基本以基因為主題。根據關鍵詞出現頻次得到所有關鍵詞之間的網絡關系,結果顯示,癡呆的風險評估是UKB數據庫的研究熱點和數據挖掘潛力點。

4 ?討論
UKB數據庫是迄今為止最大的高通量基因、基線、影像數據庫,對其進行研究有利于慢性病健康和公共衛生的發展[4]。UKB數據庫作為一個大型前瞻性隊列研究及生物醫學數據庫,對癡呆進行臨床研究十分有優勢[17]。本文基于SCIE和PubMed數據庫,采用文獻計量學分析方法,使用EndNote X9文獻管理軟件進行文獻篩選和整理,部分統計數據使用IBM SPSS 27.0進行統計分析,借助VOSviewer分析軟件和Bibliometric文獻分析網站平臺進行文獻統計及可視化分析,對自2018年1月1日至2022年11月30日發表的基于UKB數據庫的癡呆相關文獻從發文量、國家/地區、作者、期刊、出版機構、關鍵詞等方面進行了統計分析,為進一步的研究提供參考。
根據Shneider [18]提出的科學學科發展的四階段理論,即緩慢增長的初始階段、指數增長階段、線性增長階段和緩慢增長階段。2018至2022年間癡呆在UKB數據庫臨床研究的相關文獻數量呈現逐年增長的趨勢,基本達到了指數增長的階段,推測未來該領域發文量將呈現可觀的態勢。
通過分析納入文獻的國家/地區分布、出版期刊與出版商信息,本研究發現:英國發文量最多、發文量前10的期刊以美國數量最多,影響力較大,體現了英美學者在基于UKB數據庫對癡呆的研究參與度較高。中國文章占比約24.4%,位列第三,提示中國在該研究領域初露頭角,主要文章分布在最近三年,具有一定的研究水平,但總體文獻影響力仍有待提升。
通過對核心作者關系的統計和分析,可以反映作者在UKB數據庫癡呆領域研究的影響力,包括發表的論文數、被引次數和發文量等。本研究結果顯示,中國學者Yu JT的發文數量最大,而被引頻次最多的為英國學者Deary IJ,可以初步判斷該領域尚未形成主要的核心作者群。從作者關系熱圖可以看出,核心作者分布以研究機構成群,跨國合作研究占比不高,尚不利于提升該研究領域的影響力和參與性。因此,各國學者應積極與其他國家學者合作交流,提高科研合作水平[19]。
對于癡呆的主要類型,通過分析納入文獻的標題和摘要,UKB數據庫對癡呆亞型的研究主要集中在阿爾茨海默病和血管性癡呆。文獻的關鍵詞凝聚了一篇文獻的主題,從關鍵詞出現頻次分析,以阿爾茨海默病出現最多,有124次。阿爾茨海默病是神經退行性癡呆最常見的類型[20],一直是全球神經退行性疾病的關注熱點。中國社會正在進入人口老齡化階段,王英全等[21]預測,如果不采取相應的有效預防措施,2050年阿爾茨海默病患病人數將是2015年的2.35倍。從關鍵詞關聯性強度分析,關聯性較強的關鍵詞基本和基因相關,Mendelian randomization(孟德爾隨機化研究)、genome-wide association study(全基因組關聯研究)均是目前UKB數據庫研究的熱點方法[22],得益于UKB數據庫收錄了高通量的基因組學遺傳數據。從關鍵詞出現時間分析,癡呆事件、相對危險比、癡呆風險等詞出現在2021—2022年,提示未來研究人員可從降低癡呆風險的角度設計相關UKB臨床研究課題。
本研究存在一定局限性。一方面,僅對PubMed、SCIE兩個數據庫進行了檢索,納入文獻涵蓋大部分英文文獻,但未對其他數據庫進行檢索,可能造成部分相關文獻缺失;部分統計僅分析了SCIE數據庫收錄的文獻;統計國家/地區時從參與作者角度分析,考慮到了所有作者,但未分析第一作者所屬國家/地區。另一方面,UKB數據庫納入人群基本為英國健康白人,在國家/地區分布、種族和收入方面存在選擇偏倚,無法短時間內推廣至其他人群;對UKB數據庫的了解不夠深入,檢索主題詞和自由詞的范圍受限,仍待更加完善的檢索方式以擴大檢索范圍提高查全查準率。