文章通過回顧性可視化分析方法,探討有關真實世界研究中文文獻的熱點與趨勢。本文檢索了知網、維普、萬方及中國生物醫學文獻數據庫,文獻收錄時間從數據庫起始截至 2020 年 9 月 30 日。將檢索到的文獻導入 NoteExpress 后做去重及篩查,最終納入 1 757 篇文獻,并利用 VOSviewer 軟件做文獻計量學分析。發現真實世界國內文獻研究主要在 2010 年后形成一定規模,中醫藥研究在其中占據重要地位,《中國中藥雜志》是最主要的發文期刊,發文 120 篇;中國中醫科學院是發文最多的機構,發文 338 篇;該機構的謝雁鳴發文 250 篇,是發文最多的作者。通過知識圖譜分析國內真實世界研究相關文獻的發展脈絡,有助于臨床醫生和研究人員更好地了解真實世界研究在國內的發展變化。
引用本文: 郭承鷺, 惠文, 何林, 李玲, 孫鑫. 基于文獻計量與知識圖譜分析的真實世界研究發展現狀及趨勢. 生物醫學工程學雜志, 2021, 38(2): 317-325. doi: 10.7507/1001-5515.202101006 復制
引言
真實世界研究源于對經典隨機對照試驗的補充和發展,后者要求在嚴格的試驗環境下按照標準納入受試人群,其結果的外部真實性往往受到質疑。然而真實世界數據通過恰當和充分的分析轉化成證據,這樣的研究結果更具有實用性[1]。隨著真實世界證據在我國藥械監管審批、醫保準入政策以及藥械上市后再評價中的作用逐漸凸顯,2020 年國家食品藥品監督管理局發布了《真實世界證據支持藥物研發與審評的指導原則(試行)》用于進一步指導和規范真實世界證據用于藥物研發和評審的相關工作。文件指出,真實世界研究是指“針對預設的臨床問題,在真實世界環境下收集與研究對象健康有關的數據(真實世界數據)或基于這些數據衍生的匯總數據,通過分析,獲得藥物的使用情況及潛在獲益-風險的臨床證據(真實世界證據)的研究過程”[2]。本研究中“真實世界研究”采用該定義。
近幾年,真實世界研究在我國無論從方法學、實際應用還是政策支持層面都有較大程度的發展。在方法學方面,真實世界研究的數據、樣本量、統計分析、研究設計、倫理審查、臨床應用、衛生經濟學、混合方法等方面發表了相關探討性文章和技術規范[3-12]。在實踐應用層面,2010 年,真實世界研究作為一個新的概念正式引入我國中醫藥研究領域,在消化系統、神經系統、心血管等疾病上廣泛應用,分為療效評價、安全性評價與臨床經驗挖掘三種類型[13-14]。2020 年,我國首個使用國內真實世界數據的進口醫療器械獲國家食品藥品監督管理局批準上市。在政策支持方面,2016 年 6 月,中國國務院發布了關于醫療行業大數據的開發和使用的正式通知,提出將大數據應用于健康和醫學是中國的國家優先事項[15];國家食品藥品監督管理局從 2018 年起先后制訂了一系列支持真實世界證據用于上市后安全監測、兒童藥物研發與審評等決策支持的文件[16],同時于 2019 年啟動了關于使用真實世界數據用于醫療器械臨床評價的方法學研究,進一步促進了真實世界研究在我國的發展。
隨著政府、高校科研院所以及企業等各方對真實世界研究的積極推進,越來越多的真實世界研究結果發表,文獻量有了大幅度增加,為開展文獻計量學研究提供了豐富的數據資源。文獻計量學是信息科學和圖書館學的一個研究領域,它用定量的方法分析出版物數據,如出版年份、作者、關鍵詞等[17]。目前,尚無系統、全面地對真實世界研究領域具體的發展現狀、重要團隊、作者、機構以及研究熱點等特征進行文獻計量學分析的研究。本研究旨在運用文獻計量學的基本理論和方法,采用可視化圖譜的方式全面呈現我國真實世界研究的領域發展現狀及其趨勢,為相關科研人員,特別是初步接觸該領域的科研人員系統了解該領域的發展狀況提供參考。
1 材料與方法
1.1 數據來源
本研究在中國知網(CNKI)、萬方、維普和中國生物醫學文獻數據庫(Sinomed)共 4 個中文數據庫平臺上檢索真實世界研究,時間為數據庫建庫至 2020 年 9 月 30 日,語言為中文,學科分類限定為醫學,文獻類型為僅限期刊論文。檢索策略如下:
CNKI 數據庫使用主題檢索以及篇關摘檢索,具體檢索式為:“(主題 = 真實世界) OR (篇關摘 = 注冊研究 + 患者登記 +(電子病歷 + 電子病案 not (病案管理 + 系統開發 + 信息化 + 質量管理)) + 醫保數據 + 實效性臨床試驗 + 實用性臨床試驗 + 實效性隨機對照試驗 + 實用性隨機對照試驗 + pRCT)) OR (篇關摘 = ((醫院信息系統 + HIS) not (開發 + 建設 + 優化 + 信息化) and (真實研究 + 真實證據 + 真實數據)))”;萬方數據庫采取題名和摘要檢索,檢索詞及其組配關系同 CNKI 數據庫檢索式;維普數據庫采取任意字段檢索以及題目和摘要檢索,檢索詞及其組配關系同 CNKI 數據庫檢索式;Sinomed 數據庫使用全部字段檢索和核心字段檢索,檢索詞及其組配關系同 CNKI 數據庫檢索式。
1.2 分析方法
知識圖譜分析是文獻計量分析的研究分支之一,也被稱為可視化分析,可用于分析研究內容、描述科研合作等[18]。一個完整的知識圖譜分析過程為檢索數據、數據預處理、構建關系矩陣網絡、規范化處理、可視化數據、圖譜參數調整與成型、解讀結果[19]。本研究使用文獻管理軟件 NoteExpress(V3.3.0.7997)進行數據去重和篩查,然后使用 VOSviewer 軟件(V1.6.15)進行知識圖譜分析。
VOSviewer 是文獻計量學分析的常用工具之一,由荷蘭萊頓大學的學者開發,第一版于 2009 年發布。其擅長的功能為社區檢測、文本挖掘與構建共現網絡,對大型網絡圖譜有清晰的呈現效果[19-20]。最初在信息科學和圖書館學中被采用,隨后擴散到其他領域[21]。VOSviewer 在構建圖譜時使用關聯強度進行相似性計算,項目 i 和項目 j 的相似性 Sij 的計算公式為:
![]() |
其中 Cij 指項目 i 和項目 j 的共現次數,Wi 和 Wj 分別指項目 i 和項目 j 的出現次數。經過歸一化、映射及聚類的數學處理,在圖譜上表現出兩個項目相似性越高,關聯強度越高,則兩個項目的距離越近。其中項目可為關鍵詞、作者、機構、引文等[20, 22]。
1.3 規范化處理
1.3.1 機構
對機構做規范化處理,醫院/大學/科學院有兩個或以上掛牌及名字時,如解放軍總醫院又名北京 301 醫院,北京協和醫學院又掛牌中國醫學科學院,選擇其中一個名稱予以統一。
規范化處理后,醫院/大學/科學院統一去掉下級單位視為一級單位進行統計,當醫院附屬于大學/科學院時,取大學/科學院作為一級單位,如四川大學華西醫院計入四川大學,不做單獨統計。
1.3.2 關鍵詞
規范化處理中,將“HIS”“HIS 數據庫”“HIS 系統”“醫院信息系統(his)”“醫院管理信息系統”“醫院管理信息系統 (his)”“his 數據倉庫”“醫院信息數據庫”“Hospital information system/醫院信息系統”等醫院信息系統的同義詞統一替換為醫院信息系統,其他關鍵詞保持原樣。
2 結果
本研究在 CNKI、萬方、維普和 Sinomed 數據庫中共檢索到文獻 9 968 篇,去重后剩余文獻 5 958 篇。經題目和摘要篩選,剔除研究類型為通知、公告、征文、體會、摘要匯編、翻譯、寄語、編者的話等非研究型論文 531 篇,剔除研究主題不屬于真實世界研究的文獻 3 670 篇,最終納入文獻 1 757 篇。依據作者地址字段提取機構,其中 34 篇文章作者地址字段存在“不詳”取值,作為缺失值處理。
2.1 文獻年代與來源分布
國內真實世界研究的文獻發表量總體呈現上升趨勢(見圖 1),特別是自 2011 年以來,數量有了明顯的增長,共發表文獻 1 593 篇,占總文獻量的 92.60%。所有納入論文來源于 513 種期刊,納入真實世界研究文獻量排名前十位的期刊中,有 6 種為中醫藥類期刊(見表1),其中載文量最多的期刊是《中國中藥雜志》,高達 120 篇,占總文獻量的 6.8%。


2.2 高貢獻作者與機構
所有納入論文的作者有 5 375 位,其中 169 位作者的論文量不少于 5 篇。中國中醫科學院的謝雁鳴、解放軍海軍總醫院的莊嚴和中國中醫科學院的楊薇是發文最多的作者,分別發表論文 250 篇、147 篇和 83 篇;同時他們也是與其他作者合作最多的作者,合作作者數分別為 56 位、39 位、30 位。
169 位作者形成 22 個聚類。最大的作者聚類團隊有 25 位,以謝雁鳴、莊嚴為中心,主要為應用性研究、中醫藥相關研究;謝雁鳴與其他 56 位發文量不低于 5 篇的作者有合作,包括其他聚類團隊的核心成員,參見圖2。

節點表示署名作者,節點大小表示發文量,連線表示合作關系,顏色表示聚類
Figure2. Co-authorship map of Xie Yanming (threshold is contributions≥5)node represents author, node size represents contributions, line represents collaboration, and color represents clustering
第二大的作者聚類團隊有 17 位,以張俊華發文量最多,鄭文科居于合作網絡中心位置,研究主題涵蓋真實世界研究的理論探討、具體應用等,主題較為多樣,團隊成員也與其他團隊間合作廣泛。人數第三多的作者團隊有兩隊,都為 16 位,其中之一以孫鑫為中心,圍繞理論探討、方法學研究展開;之二以張澍為中心,主要圍繞心臟疾病治療展開研究,該團隊與其他團隊間合作較少。作者共現圖譜見圖3。

節點表示署名作者,節點大小代表發文量,連線表示合作關系,顏色表示聚類
Figure3. Co-authorship map (threshold is contributions≥5)node represents author, node size represents contributions, line represents collaboration, and color represents clustering
有 72 家科研機構發文量≥5 篇。其中 70 家存在直接或間接合作的機構形成 6 個聚類。發文量前三位的機構是中國中醫科學院、中國人民大學、中國人民解放軍海軍總醫院,分別有 338、207、146 篇論文,占比分別為 19.2%、11.8% 與 8.3%。中國中醫科學院的重要作者有謝雁鳴、楊薇、張寅、王連心等,在署名最多的 10 位作者中,有 8 位屬于該機構;中國人民大學的重要作者有易丹輝、陳岑等;解放軍海軍總醫院的重要作者有莊嚴等。這三家機構相互之間也進行了大量的合作,但與其他機構之間距離較遠,合作較少。見表2 與圖4。


節點表示機構,節點大小表示發文量,連線表示合作關系,顏色表示聚類
Figure4. Institution co-authorship map (threshold is contributions≥5)node represents institution, node size represents contributions, line represents collaboration, and color represents clustering
北京中醫藥大學、天津中醫藥大學等中醫藥大學類機構之間形成一個聚類。北京大學、首都醫科大學與四川大學則是開展合作最多的機構,分別與 35、34、31 家機構有合作,見圖4。
2.3 熱門關鍵詞與研究熱點
共有 213 個關鍵詞出現頻次≥5。“真實世界研究”“真實世界”“電子病歷”“醫院信息系統”是 4 個最高頻的關鍵詞,頻次分別是 241、240、145、144 次;在去掉上述“真實世界研究”等檢索詞之后,“聯合用藥”“臨床研究”“安全性”是最高頻的關鍵詞,頻次分別為 63、47、39 次。“真實世界證據”“復方苦參注射液”“大數據”作為文章關鍵詞出現在 2016 年后,是相對較新的高頻關鍵詞。參見表3。

出現不低于 3 次的疾病類關鍵詞有 77 個,最受關注的疾病(出現 8 次及以上)是肺結核、冠心病、結核、糖尿病、高血壓、肝炎、慢性腎臟病、新型冠狀病毒肺炎、腦梗死、心力衰竭、急性心肌梗死、肺癌、2 型糖尿病、乳腺癌、心房顫動、新型冠狀病毒、腫瘤、冠狀動脈疾病、惡性腫瘤、癌、非小細胞肺癌等。出現不低于 3 次的藥品相關類關鍵詞有 38 個,復方苦參注射液、直接抗病毒藥物、清開靈注射液、燈盞細辛注射液、疏血通注射液、參芎葡萄糖注射液、參麥注射液、喜炎平注射液、脈血康膠囊、苦碟子注射液等頻次(出現 8 次及以上)最高,見圖5 與圖6。


在研究趨勢上,高頻關鍵詞中,肺結核是出現年份最早的關鍵詞,是真實世界研究長期關注的疾病;新型冠狀病毒肺炎是出現最晚的關鍵詞,出現年為 2020,是真實世界研究最近關注的疾病。
除 5 個關鍵詞較為分散外,剩余 202 個關鍵詞形成 13 個聚類。最大的兩個聚類研究主題分別為醫藥的不良反應評價、聯合用藥的治療評價。聚類Ⅰ與聚類Ⅱ之間的距離較近,二者的關鍵詞有較多關聯。在研究主題中,聚類Ⅰ與聚類Ⅳ相關研究平均發表時間跨度較久,分別為 2012—2018、2011—2019,即藥品不良反應、循證醫學相關主題是長期的研究熱點;聚類Ⅶ與聚類Ⅷ下關鍵詞的平均發表時間為 2015—2020 年,即基于大數據、數據挖掘的療效評價研究為較新的研究熱點,反映了數據技術進步對真實世界研究的推動。見表4 與圖7。


節點表示關鍵詞,節點大小代表頻次,連線代表共現量,顏色表示聚類。圖譜聚類時去掉了檢索詞“真實世界”“真實世界研究”“真實世界數據”“真實世界證據”“電子病歷”“醫院信息系統”
Figure7. Keyword co-occurrence map (threshold is occurrence≥5)node represents keyword, node size represents frequency, line represents co-ocurrence, and color represents clustering. The search terms “real-world”, “real-world research”, “real-world data”, “real-world evidence”, “electronic medical record” and “hospital information system” were removed when constructing the map
3 討論與結論
真實世界研究方法引入我國,為中醫藥領域的創新發展打開了一扇窗,這體現在發文機構上,中國中醫科學院是最多的發文機構,發文占比 19.2%。中國中醫科學院建立的多種結構化數據庫對其開展相關真實世界研究奠定了良好的基礎[10]。發文第二、第三的機構是中國人民大學與解放軍海軍總醫院,排名前三的機構之間合作較多,它們的研究主要圍繞中醫藥用藥展開,其中中國人民大學發文主要來自下級單位統計學院,其生物統計與流行病學系可能貢獻較多,做了大量醫學統計方面的工作。這三家機構在中醫藥領域的真實世界研究中具有重要地位,與已有研究一致[13]。機構合作帶有一定的地域集聚特征,南北方機構大多不在同一個聚類下,如北方高校院所合作較多,北京大學、首都醫科大學之間合作較多。今后不同地域的研究機構之間可以加強合作。
早期論文多為簡單的疾病登記的統計報告、電子病歷系統的建設和質控研究,在 2010 年后,真實世界研究在近十年來經歷了大量增長,形成規模,與世界趨勢較為一致[23]。真實世界相關研究的重要機構中國中醫科學院、中國人民大學、解放軍海軍總醫院大都在 2010 年后進入該領域。當時,中國中醫科學院已經參與建立中醫臨床數據庫[24],可能推動了該年為關鍵年份。在最新研究趨勢上,基于大數據、數據挖掘的研究在近五年成為新主題,數據技術的進步推動了真實世界相關研究;真實世界研究也關注了新的疾病——新型冠狀病毒肺炎。
受研究最多的具體中藥是復方苦參注射液、清開靈注射液、燈盞細辛注射液、疏血通注射液等;具體西藥是沙庫巴曲纈沙坦、阿帕替尼等,為治療效果存在風險爭議的藥品。
在關注的疾病上,真實世界研究關注的主要疾病有肺結核、冠心病、糖尿病、高血壓、肝炎、慢性腎臟病等,慢性疾病受到了大量關注與研究。2016 年啟動的心血管疾病、卒中、糖尿病、慢性腎病 4 個領域為主的國家注冊登記研究[25],以及在政策層面慢性疾病數據集的批準使用[15],可能是這些疾病研究較多的原因。已有研究中,中醫領域的真實世界研究主要為中風、冠心病、病毒性肝炎和高血壓[13],本文結果與此部分交叉,可能因本文納入的研究包含了非中醫的研究及檢索數據庫有所不同。由于數據是真實世界研究范式的關鍵組成部分[10],建立更多疾病數據庫能推動其他疾病相關的真實世界研究。
總體來看,中醫藥品是重要的研究熱點。與已有研究一致,目前真實世界研究主要用于上市后藥品評價[26-27];少量涉及中醫藥臨床診療指南的效果評價[28-29]。中文真實世界研究的特色在于中藥、中成藥是重要的研究主題,反映了真實世界研究為中醫藥療效評價提供了新思路[30-31]。但中醫藥領域的研究較多關注中藥注射劑,這與中藥注射劑存在爭議較多相符,其他醫藥種類關注較少。新出現的新冠肺炎也可能是未來一段時間真實世界研究領域的熱點,在新近文獻中已有所體現。真實世界研究也涉及西藥、與隨機對照試驗的研究方法對比、在循證醫學范疇內的方法學探討等研究。
本研究存在的不足是,由于中文數據庫導出題錄時無引文信息,無法對文獻的影響力進行評價。此外,文獻計量學分析重在數量而非質量,沒有對 1 757 篇論文進行內容分析,根據關鍵詞共現圖譜及專業知識對真實世界研究的結果進行解讀,在某種程度上可能有主觀性和信息偏見。此外,也未納入國內學者發表在國際期刊的真實世界研究文獻也可能造成某種偏差。
本研究收集了知網、萬方、維普和 Sinomed 等 4 個數據庫上國內發表的相關真實世界研究文獻,共計 1 757 篇,相較于已有研究[13, 27, 32-33],是迄今為止納入中文文獻最多的文獻計量學研究,系統、全面地為科研人員呈現了我國真實世界研究領域國內發文的研究作者團隊、機構、熱點等方面的現狀和發展趨勢。發現國內真實世界研究主要集中但不限于中醫藥研究,中國中醫科學院、中醫藥大學等均占有重要地位。《中國中藥雜志》《中醫雜志》等中醫藥類期刊刊載了大量發文,謝雁鳴等是最重要的作者。增加關注的疾病類型、非醫藥類治療方式的真實世界研究可能為可拓展的研究方向;建立標準化疾病、療效數據庫可推動真實世界研究實踐。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
引言
真實世界研究源于對經典隨機對照試驗的補充和發展,后者要求在嚴格的試驗環境下按照標準納入受試人群,其結果的外部真實性往往受到質疑。然而真實世界數據通過恰當和充分的分析轉化成證據,這樣的研究結果更具有實用性[1]。隨著真實世界證據在我國藥械監管審批、醫保準入政策以及藥械上市后再評價中的作用逐漸凸顯,2020 年國家食品藥品監督管理局發布了《真實世界證據支持藥物研發與審評的指導原則(試行)》用于進一步指導和規范真實世界證據用于藥物研發和評審的相關工作。文件指出,真實世界研究是指“針對預設的臨床問題,在真實世界環境下收集與研究對象健康有關的數據(真實世界數據)或基于這些數據衍生的匯總數據,通過分析,獲得藥物的使用情況及潛在獲益-風險的臨床證據(真實世界證據)的研究過程”[2]。本研究中“真實世界研究”采用該定義。
近幾年,真實世界研究在我國無論從方法學、實際應用還是政策支持層面都有較大程度的發展。在方法學方面,真實世界研究的數據、樣本量、統計分析、研究設計、倫理審查、臨床應用、衛生經濟學、混合方法等方面發表了相關探討性文章和技術規范[3-12]。在實踐應用層面,2010 年,真實世界研究作為一個新的概念正式引入我國中醫藥研究領域,在消化系統、神經系統、心血管等疾病上廣泛應用,分為療效評價、安全性評價與臨床經驗挖掘三種類型[13-14]。2020 年,我國首個使用國內真實世界數據的進口醫療器械獲國家食品藥品監督管理局批準上市。在政策支持方面,2016 年 6 月,中國國務院發布了關于醫療行業大數據的開發和使用的正式通知,提出將大數據應用于健康和醫學是中國的國家優先事項[15];國家食品藥品監督管理局從 2018 年起先后制訂了一系列支持真實世界證據用于上市后安全監測、兒童藥物研發與審評等決策支持的文件[16],同時于 2019 年啟動了關于使用真實世界數據用于醫療器械臨床評價的方法學研究,進一步促進了真實世界研究在我國的發展。
隨著政府、高校科研院所以及企業等各方對真實世界研究的積極推進,越來越多的真實世界研究結果發表,文獻量有了大幅度增加,為開展文獻計量學研究提供了豐富的數據資源。文獻計量學是信息科學和圖書館學的一個研究領域,它用定量的方法分析出版物數據,如出版年份、作者、關鍵詞等[17]。目前,尚無系統、全面地對真實世界研究領域具體的發展現狀、重要團隊、作者、機構以及研究熱點等特征進行文獻計量學分析的研究。本研究旨在運用文獻計量學的基本理論和方法,采用可視化圖譜的方式全面呈現我國真實世界研究的領域發展現狀及其趨勢,為相關科研人員,特別是初步接觸該領域的科研人員系統了解該領域的發展狀況提供參考。
1 材料與方法
1.1 數據來源
本研究在中國知網(CNKI)、萬方、維普和中國生物醫學文獻數據庫(Sinomed)共 4 個中文數據庫平臺上檢索真實世界研究,時間為數據庫建庫至 2020 年 9 月 30 日,語言為中文,學科分類限定為醫學,文獻類型為僅限期刊論文。檢索策略如下:
CNKI 數據庫使用主題檢索以及篇關摘檢索,具體檢索式為:“(主題 = 真實世界) OR (篇關摘 = 注冊研究 + 患者登記 +(電子病歷 + 電子病案 not (病案管理 + 系統開發 + 信息化 + 質量管理)) + 醫保數據 + 實效性臨床試驗 + 實用性臨床試驗 + 實效性隨機對照試驗 + 實用性隨機對照試驗 + pRCT)) OR (篇關摘 = ((醫院信息系統 + HIS) not (開發 + 建設 + 優化 + 信息化) and (真實研究 + 真實證據 + 真實數據)))”;萬方數據庫采取題名和摘要檢索,檢索詞及其組配關系同 CNKI 數據庫檢索式;維普數據庫采取任意字段檢索以及題目和摘要檢索,檢索詞及其組配關系同 CNKI 數據庫檢索式;Sinomed 數據庫使用全部字段檢索和核心字段檢索,檢索詞及其組配關系同 CNKI 數據庫檢索式。
1.2 分析方法
知識圖譜分析是文獻計量分析的研究分支之一,也被稱為可視化分析,可用于分析研究內容、描述科研合作等[18]。一個完整的知識圖譜分析過程為檢索數據、數據預處理、構建關系矩陣網絡、規范化處理、可視化數據、圖譜參數調整與成型、解讀結果[19]。本研究使用文獻管理軟件 NoteExpress(V3.3.0.7997)進行數據去重和篩查,然后使用 VOSviewer 軟件(V1.6.15)進行知識圖譜分析。
VOSviewer 是文獻計量學分析的常用工具之一,由荷蘭萊頓大學的學者開發,第一版于 2009 年發布。其擅長的功能為社區檢測、文本挖掘與構建共現網絡,對大型網絡圖譜有清晰的呈現效果[19-20]。最初在信息科學和圖書館學中被采用,隨后擴散到其他領域[21]。VOSviewer 在構建圖譜時使用關聯強度進行相似性計算,項目 i 和項目 j 的相似性 Sij 的計算公式為:
![]() |
其中 Cij 指項目 i 和項目 j 的共現次數,Wi 和 Wj 分別指項目 i 和項目 j 的出現次數。經過歸一化、映射及聚類的數學處理,在圖譜上表現出兩個項目相似性越高,關聯強度越高,則兩個項目的距離越近。其中項目可為關鍵詞、作者、機構、引文等[20, 22]。
1.3 規范化處理
1.3.1 機構
對機構做規范化處理,醫院/大學/科學院有兩個或以上掛牌及名字時,如解放軍總醫院又名北京 301 醫院,北京協和醫學院又掛牌中國醫學科學院,選擇其中一個名稱予以統一。
規范化處理后,醫院/大學/科學院統一去掉下級單位視為一級單位進行統計,當醫院附屬于大學/科學院時,取大學/科學院作為一級單位,如四川大學華西醫院計入四川大學,不做單獨統計。
1.3.2 關鍵詞
規范化處理中,將“HIS”“HIS 數據庫”“HIS 系統”“醫院信息系統(his)”“醫院管理信息系統”“醫院管理信息系統 (his)”“his 數據倉庫”“醫院信息數據庫”“Hospital information system/醫院信息系統”等醫院信息系統的同義詞統一替換為醫院信息系統,其他關鍵詞保持原樣。
2 結果
本研究在 CNKI、萬方、維普和 Sinomed 數據庫中共檢索到文獻 9 968 篇,去重后剩余文獻 5 958 篇。經題目和摘要篩選,剔除研究類型為通知、公告、征文、體會、摘要匯編、翻譯、寄語、編者的話等非研究型論文 531 篇,剔除研究主題不屬于真實世界研究的文獻 3 670 篇,最終納入文獻 1 757 篇。依據作者地址字段提取機構,其中 34 篇文章作者地址字段存在“不詳”取值,作為缺失值處理。
2.1 文獻年代與來源分布
國內真實世界研究的文獻發表量總體呈現上升趨勢(見圖 1),特別是自 2011 年以來,數量有了明顯的增長,共發表文獻 1 593 篇,占總文獻量的 92.60%。所有納入論文來源于 513 種期刊,納入真實世界研究文獻量排名前十位的期刊中,有 6 種為中醫藥類期刊(見表1),其中載文量最多的期刊是《中國中藥雜志》,高達 120 篇,占總文獻量的 6.8%。


2.2 高貢獻作者與機構
所有納入論文的作者有 5 375 位,其中 169 位作者的論文量不少于 5 篇。中國中醫科學院的謝雁鳴、解放軍海軍總醫院的莊嚴和中國中醫科學院的楊薇是發文最多的作者,分別發表論文 250 篇、147 篇和 83 篇;同時他們也是與其他作者合作最多的作者,合作作者數分別為 56 位、39 位、30 位。
169 位作者形成 22 個聚類。最大的作者聚類團隊有 25 位,以謝雁鳴、莊嚴為中心,主要為應用性研究、中醫藥相關研究;謝雁鳴與其他 56 位發文量不低于 5 篇的作者有合作,包括其他聚類團隊的核心成員,參見圖2。

節點表示署名作者,節點大小表示發文量,連線表示合作關系,顏色表示聚類
Figure2. Co-authorship map of Xie Yanming (threshold is contributions≥5)node represents author, node size represents contributions, line represents collaboration, and color represents clustering
第二大的作者聚類團隊有 17 位,以張俊華發文量最多,鄭文科居于合作網絡中心位置,研究主題涵蓋真實世界研究的理論探討、具體應用等,主題較為多樣,團隊成員也與其他團隊間合作廣泛。人數第三多的作者團隊有兩隊,都為 16 位,其中之一以孫鑫為中心,圍繞理論探討、方法學研究展開;之二以張澍為中心,主要圍繞心臟疾病治療展開研究,該團隊與其他團隊間合作較少。作者共現圖譜見圖3。

節點表示署名作者,節點大小代表發文量,連線表示合作關系,顏色表示聚類
Figure3. Co-authorship map (threshold is contributions≥5)node represents author, node size represents contributions, line represents collaboration, and color represents clustering
有 72 家科研機構發文量≥5 篇。其中 70 家存在直接或間接合作的機構形成 6 個聚類。發文量前三位的機構是中國中醫科學院、中國人民大學、中國人民解放軍海軍總醫院,分別有 338、207、146 篇論文,占比分別為 19.2%、11.8% 與 8.3%。中國中醫科學院的重要作者有謝雁鳴、楊薇、張寅、王連心等,在署名最多的 10 位作者中,有 8 位屬于該機構;中國人民大學的重要作者有易丹輝、陳岑等;解放軍海軍總醫院的重要作者有莊嚴等。這三家機構相互之間也進行了大量的合作,但與其他機構之間距離較遠,合作較少。見表2 與圖4。


節點表示機構,節點大小表示發文量,連線表示合作關系,顏色表示聚類
Figure4. Institution co-authorship map (threshold is contributions≥5)node represents institution, node size represents contributions, line represents collaboration, and color represents clustering
北京中醫藥大學、天津中醫藥大學等中醫藥大學類機構之間形成一個聚類。北京大學、首都醫科大學與四川大學則是開展合作最多的機構,分別與 35、34、31 家機構有合作,見圖4。
2.3 熱門關鍵詞與研究熱點
共有 213 個關鍵詞出現頻次≥5。“真實世界研究”“真實世界”“電子病歷”“醫院信息系統”是 4 個最高頻的關鍵詞,頻次分別是 241、240、145、144 次;在去掉上述“真實世界研究”等檢索詞之后,“聯合用藥”“臨床研究”“安全性”是最高頻的關鍵詞,頻次分別為 63、47、39 次。“真實世界證據”“復方苦參注射液”“大數據”作為文章關鍵詞出現在 2016 年后,是相對較新的高頻關鍵詞。參見表3。

出現不低于 3 次的疾病類關鍵詞有 77 個,最受關注的疾病(出現 8 次及以上)是肺結核、冠心病、結核、糖尿病、高血壓、肝炎、慢性腎臟病、新型冠狀病毒肺炎、腦梗死、心力衰竭、急性心肌梗死、肺癌、2 型糖尿病、乳腺癌、心房顫動、新型冠狀病毒、腫瘤、冠狀動脈疾病、惡性腫瘤、癌、非小細胞肺癌等。出現不低于 3 次的藥品相關類關鍵詞有 38 個,復方苦參注射液、直接抗病毒藥物、清開靈注射液、燈盞細辛注射液、疏血通注射液、參芎葡萄糖注射液、參麥注射液、喜炎平注射液、脈血康膠囊、苦碟子注射液等頻次(出現 8 次及以上)最高,見圖5 與圖6。


在研究趨勢上,高頻關鍵詞中,肺結核是出現年份最早的關鍵詞,是真實世界研究長期關注的疾病;新型冠狀病毒肺炎是出現最晚的關鍵詞,出現年為 2020,是真實世界研究最近關注的疾病。
除 5 個關鍵詞較為分散外,剩余 202 個關鍵詞形成 13 個聚類。最大的兩個聚類研究主題分別為醫藥的不良反應評價、聯合用藥的治療評價。聚類Ⅰ與聚類Ⅱ之間的距離較近,二者的關鍵詞有較多關聯。在研究主題中,聚類Ⅰ與聚類Ⅳ相關研究平均發表時間跨度較久,分別為 2012—2018、2011—2019,即藥品不良反應、循證醫學相關主題是長期的研究熱點;聚類Ⅶ與聚類Ⅷ下關鍵詞的平均發表時間為 2015—2020 年,即基于大數據、數據挖掘的療效評價研究為較新的研究熱點,反映了數據技術進步對真實世界研究的推動。見表4 與圖7。


節點表示關鍵詞,節點大小代表頻次,連線代表共現量,顏色表示聚類。圖譜聚類時去掉了檢索詞“真實世界”“真實世界研究”“真實世界數據”“真實世界證據”“電子病歷”“醫院信息系統”
Figure7. Keyword co-occurrence map (threshold is occurrence≥5)node represents keyword, node size represents frequency, line represents co-ocurrence, and color represents clustering. The search terms “real-world”, “real-world research”, “real-world data”, “real-world evidence”, “electronic medical record” and “hospital information system” were removed when constructing the map
3 討論與結論
真實世界研究方法引入我國,為中醫藥領域的創新發展打開了一扇窗,這體現在發文機構上,中國中醫科學院是最多的發文機構,發文占比 19.2%。中國中醫科學院建立的多種結構化數據庫對其開展相關真實世界研究奠定了良好的基礎[10]。發文第二、第三的機構是中國人民大學與解放軍海軍總醫院,排名前三的機構之間合作較多,它們的研究主要圍繞中醫藥用藥展開,其中中國人民大學發文主要來自下級單位統計學院,其生物統計與流行病學系可能貢獻較多,做了大量醫學統計方面的工作。這三家機構在中醫藥領域的真實世界研究中具有重要地位,與已有研究一致[13]。機構合作帶有一定的地域集聚特征,南北方機構大多不在同一個聚類下,如北方高校院所合作較多,北京大學、首都醫科大學之間合作較多。今后不同地域的研究機構之間可以加強合作。
早期論文多為簡單的疾病登記的統計報告、電子病歷系統的建設和質控研究,在 2010 年后,真實世界研究在近十年來經歷了大量增長,形成規模,與世界趨勢較為一致[23]。真實世界相關研究的重要機構中國中醫科學院、中國人民大學、解放軍海軍總醫院大都在 2010 年后進入該領域。當時,中國中醫科學院已經參與建立中醫臨床數據庫[24],可能推動了該年為關鍵年份。在最新研究趨勢上,基于大數據、數據挖掘的研究在近五年成為新主題,數據技術的進步推動了真實世界相關研究;真實世界研究也關注了新的疾病——新型冠狀病毒肺炎。
受研究最多的具體中藥是復方苦參注射液、清開靈注射液、燈盞細辛注射液、疏血通注射液等;具體西藥是沙庫巴曲纈沙坦、阿帕替尼等,為治療效果存在風險爭議的藥品。
在關注的疾病上,真實世界研究關注的主要疾病有肺結核、冠心病、糖尿病、高血壓、肝炎、慢性腎臟病等,慢性疾病受到了大量關注與研究。2016 年啟動的心血管疾病、卒中、糖尿病、慢性腎病 4 個領域為主的國家注冊登記研究[25],以及在政策層面慢性疾病數據集的批準使用[15],可能是這些疾病研究較多的原因。已有研究中,中醫領域的真實世界研究主要為中風、冠心病、病毒性肝炎和高血壓[13],本文結果與此部分交叉,可能因本文納入的研究包含了非中醫的研究及檢索數據庫有所不同。由于數據是真實世界研究范式的關鍵組成部分[10],建立更多疾病數據庫能推動其他疾病相關的真實世界研究。
總體來看,中醫藥品是重要的研究熱點。與已有研究一致,目前真實世界研究主要用于上市后藥品評價[26-27];少量涉及中醫藥臨床診療指南的效果評價[28-29]。中文真實世界研究的特色在于中藥、中成藥是重要的研究主題,反映了真實世界研究為中醫藥療效評價提供了新思路[30-31]。但中醫藥領域的研究較多關注中藥注射劑,這與中藥注射劑存在爭議較多相符,其他醫藥種類關注較少。新出現的新冠肺炎也可能是未來一段時間真實世界研究領域的熱點,在新近文獻中已有所體現。真實世界研究也涉及西藥、與隨機對照試驗的研究方法對比、在循證醫學范疇內的方法學探討等研究。
本研究存在的不足是,由于中文數據庫導出題錄時無引文信息,無法對文獻的影響力進行評價。此外,文獻計量學分析重在數量而非質量,沒有對 1 757 篇論文進行內容分析,根據關鍵詞共現圖譜及專業知識對真實世界研究的結果進行解讀,在某種程度上可能有主觀性和信息偏見。此外,也未納入國內學者發表在國際期刊的真實世界研究文獻也可能造成某種偏差。
本研究收集了知網、萬方、維普和 Sinomed 等 4 個數據庫上國內發表的相關真實世界研究文獻,共計 1 757 篇,相較于已有研究[13, 27, 32-33],是迄今為止納入中文文獻最多的文獻計量學研究,系統、全面地為科研人員呈現了我國真實世界研究領域國內發文的研究作者團隊、機構、熱點等方面的現狀和發展趨勢。發現國內真實世界研究主要集中但不限于中醫藥研究,中國中醫科學院、中醫藥大學等均占有重要地位。《中國中藥雜志》《中醫雜志》等中醫藥類期刊刊載了大量發文,謝雁鳴等是最重要的作者。增加關注的疾病類型、非醫藥類治療方式的真實世界研究可能為可拓展的研究方向;建立標準化疾病、療效數據庫可推動真實世界研究實踐。
利益沖突聲明:本文全體作者均聲明不存在利益沖突。