證據圖譜是通過對現有證據的系統收集、評價和綜合,明確研究現狀和差距,進而促進科學研究和決策的一種新型證據綜合研究方法。經過近 20 年的發展,證據圖譜的制作與報告方法不斷完善,獲得了國際社會的廣泛關注與認可。我國對于證據圖譜的關注較早,但相關理論和實踐研究相對較少,證據圖譜概念的定義尚不統一。本文系統梳理了證據圖譜的起源發展和定義演化,全面介紹了證據圖譜的制作與報告,供研究者借鑒參考,以期進一步促進證據圖譜在我國的研究與發展。
引用本文: 李艷飛, 李秀霞, 李睿, 曹柳嬌, 李美萱, 李慧娟, 后亮瑛, 張維益, 楊克虎. 證據圖譜的制作與報告. 中國循證醫學雜志, 2020, 20(9): 1098-1103. doi: 10.7507/1672-2531.202001079 復制
1 證據圖譜的起源和發展
證據圖譜(evidence mapping,EM)是對相關研究領域的現有證據進行系統收集、深入分析、綜合評價,整合凝練、以表格或圖形為主要呈現形式的一種新型證據綜合研究方法。2000 年,美國耶魯大學預防研究中心對補充與替代醫學相關的證據進行了一次系統審查,從而形成了一種可靠且可重復的 9 步驟的審查模型,這標志著證據圖譜的誕生[1]。2002 年, Arksey 等[2]關于“Scoping Study”的研究推動了對較大研究范圍的證據進行審查的進程。2003 年,Katz等[1]對 9 步驟模型進行了調整并發表了第一篇證據圖譜報告;2007 年,澳大利亞成立“The Global Evidence Mapping Initiative”[3];2008 年和 2009 年,Cochrane 協作網兩屆學術年會均對證據圖譜進行了專題研討[3, 4]。
由于證據圖譜是一種新型的證據綜合研究方法,其制作方法、呈現形式和報告規范均不統一,推廣和應用比較緩慢。截至 2010 年,僅有 10 篇證據圖譜論文發表[5]。2013 年,Althuis 等[6]和 Gaarder 等[7]對證據圖譜的定義和方法進行了全面介紹,極大地推動了證據圖譜的發展,僅 2014 年,就有 11 篇證據圖譜研究發表。近年來,證據圖譜作為一種新型證據綜合研究方法在國外備受關注,Campbell 協作網等多個證據生產、傳播與轉化的學術機構專門開展了證據圖譜的研究[8-15],進一步促進了證據圖譜的發展。
目前,我國關于證據圖譜的研究數量較少,方法學方面的研究和介紹更加缺乏。2019 年 12 月,以“證據圖譜、證據圖、差距圖”為檢索詞檢索 CNKI 數據庫,結果顯示證據圖譜方法的論文僅有 2 篇[4, 16]。李倫等[4]首次在國內提及證據圖的概念和相關報告流程;田金徽等[16]研究報告了證據圖撰寫注意事項。所以,系統梳理證據圖譜的起源發展,厘清證據圖譜的定義,介紹證據圖譜的制作與報告方法,對進一步促進證據圖譜在我國的研究與發展非常重要。
2 證據圖譜的定義
證據圖譜是系統收集相關研究領域的現有證據、進行綜合分析、科學評價,整合凝練、簡明直觀地呈現其研究現狀、存在問題、發展方向和證據差距的一種新型證據綜合研究方法[17, 18]。
目前,證據圖譜主要包括證據圖(evidence map)和差距圖(gap map)兩種研究類型[7]。證據圖主要描述某一特定領域的研究性質、特點和數量,并通過比較所研究問題的相關文獻來確定不同證據的樣本量和結論等信息(證據差距),一般不對納入研究進行質量評價,是證據圖譜中的一種較為常見的類型。差距圖通過可視化特定領域中的現有證據,為政策和實踐提供信息,其主要是對疾病干預措施有關的證據進行評價整合分析,不涉及預防和預后等,即干預性證據圖譜,目前主要由 Campbell 協作網進行研究和推廣。因此,這兩種證據圖譜的研究方法有一定差異。證據圖譜、證據圖和差距圖之間的關系如圖 1 所示。但近年發表的證據圖譜相關的論文中,證據圖譜、證據圖、差距圖三者常常相互代替使用,并沒有嚴格的區別。此外,與獲得普遍認可的系統評價、系統評價再評價相比較,證據圖譜突破了僅針對具體問題證據的局限,著眼于對更為廣泛的某一研究領域中的證據進行評價和綜合,并以更為直觀的方式呈現。證據圖譜是在系統評價理論的基礎上,更加快速、便捷地對相關研究領域的證據進行科學的整合、分析、凝練和呈現的一種方法。

3 證據圖譜的制作方法
自美國耶魯大學提出證據圖譜的 9 步驟以來[1],證據圖譜的撰寫步驟在不斷地變化。目前,已經發表的證據圖譜運用的方法和步驟不盡相同[6, 19-21],主要的研究方法和步驟詳見表 1。

4 證據圖譜的制作要點
雖然證據圖譜的制作方法與步驟尚無公認的制作流程,但歸納其制作要點,主要制作步驟如下。
4.1 確定研究主題
制作證據圖譜的第一步是確定一個合適的研究主題并通過制定研究框架來確定具體的研究范圍[18]。研究選題來源于實踐,又服務于實踐,因此一個好的研究主題應符合需要性原則、價值性原則和科學性原則。與系統評價/Meta 分析不同的是,證據圖譜的研究主題和范圍通常較廣,不同類型的證據圖譜選題也有區別。證據圖選題的方向通常沒有限制。但差距圖,即干預性證據圖譜,往往偏向于某個研究領域中的多種干預措施對特定人群的影響,研究內容包括各種重要干預措施和研究結果,從而系統全面地分析、呈現各種干預措施的具體應用情況,如以家庭為基礎的干預對老年人功能影響的差距圖[22]。此外,確定研究主題時還應與學術專家、決策者、從業者和資助者在內的利益相關方進行協商。
4.2 制定納入與排除標準
納入與排除標準的制定一般根據 PICO 原則進行[23]。限于證據圖譜的作用和意義,在納入排除標準制定時一般只考慮干預措施和人群,很少對結局指標和對照進行限制。此外,Miake-Lye 等[5]的研究顯示,有多個只針對系統評價的證據圖譜已發表。可見對于研究類型來說分為兩種,一種是納入所有的研究,包括系統評價/Meta 分析和原始研究等。例如早期雙相情感障礙的社會心理干預的證據圖[24],納入了符合納入標準的所有研究,未限制研究類型。一種是僅納入系統評價/Meta 分析,與系統評價再評價類似。但兩者仍有不同,系統評價再評價傾向于解決具體的臨床問題,而證據圖譜傾向于對某個研究領域進行歸納總結,其納入的研究涉及面更為廣泛[7],如按摩對于疼痛的證據圖譜[21]。
4.3 全面證據檢索
證據檢索的目的是為獲取該領域全面的資料信息[25]。證據圖譜的制作需要全面搜集研究證據。一般來說,制作證據圖譜需要對綜合性數據庫進行全面檢索,主要包括 CNKI、WanFang Data、VIP 和 CBM 等中文數據庫和 PubMed、Web of Science、The Cochrane Library、EMbase 等英文數據庫。對于某些專業領域,比如教育學、心理學、經濟學等專業,還需檢索本專業領域的專題數據庫。
4.4 數據提取
全面和準確地數據提取是證據圖譜真實性的保障。證據圖譜的數據提取可分為兩部分,一部分是研究的基本特征,展示研究的基本信息。另一部分是研究問題的特征,突出研究重點。以干預性證據圖譜為例,提取的信息主要包括[7, 23]:① 研究的基本特征:作者、出版年份、研究類型/設計、目的、檢索日期、納入研究數量和樣本大小等;② 研究問題的特征:人群、干預類型、對照措施和結局(PICO 原則)。
目前發表的部分研究只提取了研究的基本特征,如瑜伽對后背疼的證據圖[19],該研究提取了作者、年份、研究設計、年齡等信息,并對其進行了分析。而另有一些證據圖譜對研究的基本特征和研究問題特征都進行了非常詳細的提取與整理,如以胃腸道間質瘤患者干預措施系統評價為基礎的證據圖譜[20],該研究提取了納入研究的作者、發表年份、研究目的、原始研究數量、研究類型、干預組、對照組、人群和結局指標等信息,并以研究問題特征為基礎進行了深入分析。
4.5 質量評價
證據圖譜的質量評價主要是指對納入的系統評價/Meta 分析進行質量評價,評價內容包括方法學設計、實施步驟、各類偏倚狀況及偏倚控制、利益沖突報告等。目前系統評價的評價標準分為方法學質量評價工具和報告質量評價工具,較常用的方法學質量評價工具為 AMSTAR 2[26]、報告質量評價工具為 PRISMA[27]。研究者可根據具體情況,選擇恰當標準對其質量進行評價。此外,對于干預性證據圖譜(差距圖)來說,制作方法中明確包括了質量評價這一關鍵步驟,而證據圖則一般不對納入研究進行質量評價。但通過近年發表的研究來看,證據圖譜的研究通常都會對納入研究進行質量評價,并且主要針對納入的系統評價/Meta 分析。例如瑜伽質量后背痛的證據圖[19]、以家庭為基礎的干預對老年人影響的證據差距圖[22]、胃腸道間質瘤患者干預措施系統評價為基礎的證據圖譜[20]等,都采用 AMSTAR 對納入的系統評價/Meta 分析進行了方法學質量評價。
4.6 證據圖譜的結果呈現
證據圖譜的結果主要通過表格和圖形兩種形式展現,一個內容豐富、簡明直觀的結果呈現對于證據使用者,尤其是臨床決策者尤為重要[18]。
在證據圖譜的全文中,數據提取表所展示的內容是全文中非常重要的一部分,被稱為基本特征。但總體來看,數據提取表所展示的內容深度有限。因此,證據圖譜通常通過一個專門的表格去更深層次地對納入研究進行分析,例如質量評價結果的展示、通過 PICO 原則所繪制的研究問題(研究問題特征)等。以干預性證據圖譜為例,各種干預措施、人群重要特征和臨床上的研究熱點,均可用表格直觀展示。例如糖尿病前期干預的證據圖通過表格形式呈現了納入研究的基本特征、研究問題特征和研究質量信息[28]。
除制作表格之外,圖形展示是證據圖譜一大亮點。其中最常見的圖形是氣泡圖(bubble chart)[29]。氣泡圖能夠清晰地展示 3 個或多個變量之間的關系,在證據圖譜結果的呈現中有舉足輕重的地位。譬如它可在一張三維圖上同時展示出納入研究的質量、樣本量和干預措施的分布這 3 項重要內容。故在證據圖譜中除用表格展示結果之外,用氣泡圖來立體呈現重點證據的分布和狀態能夠明顯增加可讀性。例如按摩對疼痛的證據圖[21],該研究除通過表格的形式呈現結果外,還通過氣泡圖的形式直觀呈現研究數量、質量和結論等信息。
此外,與系統評價、系統評價再評價相比,證據圖譜的結果呈現更加簡潔、直觀和豐富。系統評價、系統評價再評價對納入研究的特征、質量評價結果及效應量等信息進行評價,結果主要通過文字、表格或者森林圖等來展示,其中系統評價再評價偏重報告證據的質量特征。而證據圖譜結果報告的是整體的證據差距(樣本量、原始研究的數量、結論、質量等),對證據差距中的各項內容無明顯傾向,主要通過可視化方法,如氣泡圖的方式呈現[7, 18]。
4.7 研究報告的撰寫結構
證據圖譜研究報告的撰寫結構與系統評價/Meta 分析相似,一般包括研究背景、材料和方法(研究設計、納入排除標準、檢索策略、數據提取及文獻篩選、質量評價、數據分析)、結果(納入研究的數量及基本特征、質量評價結果、證據圖譜的展示)、討論、結論及參考文獻[18]。
5 范例解讀
本文以“Evidence mapping and quality assessment of systematic reviews on therapeutic interventions for oral cancer”研究[17]為例,對證據圖譜進行解讀,以供研究者參考。
5.1 研究背景
證據圖譜研究背景的撰寫同其它研究論文一樣,主要是對所研究領域發展現狀進行概括性的闡述,從而使讀者迅速了解論文背景和目的。在本范例中其背景介紹如下:
口腔癌是全世界最常見的癌癥之一。口腔鱗狀細胞癌是口腔最常見的癌癥,全球每年新增病例約 30 萬;僅在美國,2017 年預計新增病例約 5 萬。目前,大量已發表研究提出了多種治療口腔癌的方法。但是人們不了解這些方法有效性的優劣,及何時選用何種治療方法。因此,需要對現有證據進行批判性分析和方法學質量評估。組織和批判性地評估已發表研究的選擇之一是系統評價,它是通過總結來自初級保健研究證據的結果,以回答一個具體的研究問題。同樣,也有新的證據綜合工具,如證據圖譜,它被開發出來以幫助臨床醫生、病人、研究人員和其他利益相關者做出基于證據的決策。證據圖譜適合于解決可能對很多人來說過于廣泛的問題,其研究目的是識別、描述和組織現有的關于口腔癌治療干預的系統評價證據。該方法的目的是確定科學文獻中評估的臨床問題和證據的相應質量,并提供關于有效性的一般信息,這些信息將有助于發現研究差別,并幫助利害相關方進行科學決策。
5.2 納入與排除標準
證據圖譜的納入與排除標準一般根據 PICO 原則進行設置,該研究納入已發表的口腔惡性腫瘤患者療效評估的系統評價,不管是否進行 Meta 分析。研究人員對至少兩個不同的數據庫進行了全面搜索,并報告了對所包含研究的方法學質量評估。在處理同一團隊在不同階段發表的相同主題的論文時,納入最近發表的論文。此外,排除了關于精神分裂、安全性或成本效益分析相關的研究。
5.3 文獻檢索策略
在 2018 年 10 月 25 日系統檢索了 MEDLINE、EMbase、Epistemonikos、The Cochrane Library 4 個數據庫。通過主題詞和自由詞進行口腔癌的檢索,檢索詞包括:mouth neoplasms、oral carcinoma、oral cancer、oral tumor、buccal carcinoma 等。根據每個數據庫的具體特點對檢索策略進行了調整,沒有語言限制。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。
5.4 質量評價
證據圖譜所報告的質量評價主要針對納入研究,納入研究的設計類型不同,需選用不同的質量評價工具。此范例主要針對系統評價/Meta 分析,對納入系統評價/Meta 分析的質量評價采用 AMSTAR 2。
5.5 數據提取
證據圖譜的數據提取分為研究的基本特征和研究問題的特征兩部分。該范例數據提取內容包括:① 研究的基本特征:作者、出版年份、系統評價的類型(是否進行 Meta 分析)、目的、檢索日期、納入研究的設計和數量及納入參與者的數量。② 研究問題的特征:根據作者所述的目的,納排標準和系統評價的結論確定每個系統評價的研究問題。研究問題使用 PICO 框架(人群、干預措施、對照措施和結局)。如果某研究提供了 PICO 框架的所有要素,并在系統評價中描述了關于干預效果的結論,則考慮納入。提取人口特征(如,人群、癌癥類型、癌癥分期階段和癌癥位置),干預和對照(如,干預和對照措施均可廣泛分類為化療、手術、放射治療、免疫治療和靶向治療)和結局。此外,根據先前報告的標準[20],將系統評價的結論分為五類:有益(研究結論顯示干預措施有效并且納入的研究偏倚風險極低)、可能有益(盡管結果中報道了結局指標有效,但結論中并沒有明顯指出干預措施是有益的)、有害(研究結論中明顯報告與對照相比干預措施是有害的)、無差異效應(研究結論指出干預組和對照組的效果類似)及不確定(多個研究結局得出了相沖突的結論或者納入的個別研究限制了結論的得出)。
5.6 結果展示
證據圖譜的結果主要通過表格和圖形兩種形式展示。此范例展示了系統評價的基本特征表、PICO 研究問題特征表和質量評價表,并對疾病嚴重程度進行了描述性分析從而設計了一個氣泡圖(圖 2),其中每個氣泡代表一個系統評價。該圖表從 3 個維度顯示信息:① 作者的結論:在橫軸上的評級為有益、可能有益、有害、無差別效應和不確定;② AMSTAR 2 評估結果,分為高、中、低和極低四個等級,在縱軸上展示;③ 系統評價中包含的主要研究的數量,其在每個氣泡中顯示并由氣泡大小表示。每個氣泡也代表一個餅圖,顯示使用黑色粗線包括的隨機對照試驗的比例。

5.7 討論
證據圖譜的結論主要是對研究領域內相關研究的發表現狀、差距、質量等進行綜合分析,以期給出未來的研究方向。此范例對結論部分做了以下報告:
關于口腔癌治療干預的現有證據有限。該證據圖譜中納入的系統評價的方法學質量為極低。作者報告的可切除口腔癌患者的主要有益治療干預措施是單獨手術或與放療或化療聯合使用。缺乏無法切除的口腔癌的治療證據。這些研究結果強調了未來研究的必要性,重點是對新的治療干預措施和該領域的知識探索,及需要加大努力來改善關于口腔癌治療的系統評價方法學質量和報告過程。
6 結論
綜上,證據圖譜和系統評價理念相似,都是通過對現有證據進行綜合研究,從而解決回答臨床問題的一種證據綜合研究方法。系統評價旨在解決較為具體的研究和實踐問題,而證據圖譜最大的優勢在于能夠更加方便快捷地解決某個領域的整體研究和實踐問題。一個高質量的證據圖譜,能夠清晰、簡明、全面、系統地展示當前證據的質量、有效性、數量和人群等各種信息,找出現有證據體系的不足與證據之間的差別,找準未來的研究方向,從而為政府、研究者、使用者及其他利益相關方提供科學的決策依據。證據圖譜是極具發展潛力的一種新興證據綜合研究方法。
1 證據圖譜的起源和發展
證據圖譜(evidence mapping,EM)是對相關研究領域的現有證據進行系統收集、深入分析、綜合評價,整合凝練、以表格或圖形為主要呈現形式的一種新型證據綜合研究方法。2000 年,美國耶魯大學預防研究中心對補充與替代醫學相關的證據進行了一次系統審查,從而形成了一種可靠且可重復的 9 步驟的審查模型,這標志著證據圖譜的誕生[1]。2002 年, Arksey 等[2]關于“Scoping Study”的研究推動了對較大研究范圍的證據進行審查的進程。2003 年,Katz等[1]對 9 步驟模型進行了調整并發表了第一篇證據圖譜報告;2007 年,澳大利亞成立“The Global Evidence Mapping Initiative”[3];2008 年和 2009 年,Cochrane 協作網兩屆學術年會均對證據圖譜進行了專題研討[3, 4]。
由于證據圖譜是一種新型的證據綜合研究方法,其制作方法、呈現形式和報告規范均不統一,推廣和應用比較緩慢。截至 2010 年,僅有 10 篇證據圖譜論文發表[5]。2013 年,Althuis 等[6]和 Gaarder 等[7]對證據圖譜的定義和方法進行了全面介紹,極大地推動了證據圖譜的發展,僅 2014 年,就有 11 篇證據圖譜研究發表。近年來,證據圖譜作為一種新型證據綜合研究方法在國外備受關注,Campbell 協作網等多個證據生產、傳播與轉化的學術機構專門開展了證據圖譜的研究[8-15],進一步促進了證據圖譜的發展。
目前,我國關于證據圖譜的研究數量較少,方法學方面的研究和介紹更加缺乏。2019 年 12 月,以“證據圖譜、證據圖、差距圖”為檢索詞檢索 CNKI 數據庫,結果顯示證據圖譜方法的論文僅有 2 篇[4, 16]。李倫等[4]首次在國內提及證據圖的概念和相關報告流程;田金徽等[16]研究報告了證據圖撰寫注意事項。所以,系統梳理證據圖譜的起源發展,厘清證據圖譜的定義,介紹證據圖譜的制作與報告方法,對進一步促進證據圖譜在我國的研究與發展非常重要。
2 證據圖譜的定義
證據圖譜是系統收集相關研究領域的現有證據、進行綜合分析、科學評價,整合凝練、簡明直觀地呈現其研究現狀、存在問題、發展方向和證據差距的一種新型證據綜合研究方法[17, 18]。
目前,證據圖譜主要包括證據圖(evidence map)和差距圖(gap map)兩種研究類型[7]。證據圖主要描述某一特定領域的研究性質、特點和數量,并通過比較所研究問題的相關文獻來確定不同證據的樣本量和結論等信息(證據差距),一般不對納入研究進行質量評價,是證據圖譜中的一種較為常見的類型。差距圖通過可視化特定領域中的現有證據,為政策和實踐提供信息,其主要是對疾病干預措施有關的證據進行評價整合分析,不涉及預防和預后等,即干預性證據圖譜,目前主要由 Campbell 協作網進行研究和推廣。因此,這兩種證據圖譜的研究方法有一定差異。證據圖譜、證據圖和差距圖之間的關系如圖 1 所示。但近年發表的證據圖譜相關的論文中,證據圖譜、證據圖、差距圖三者常常相互代替使用,并沒有嚴格的區別。此外,與獲得普遍認可的系統評價、系統評價再評價相比較,證據圖譜突破了僅針對具體問題證據的局限,著眼于對更為廣泛的某一研究領域中的證據進行評價和綜合,并以更為直觀的方式呈現。證據圖譜是在系統評價理論的基礎上,更加快速、便捷地對相關研究領域的證據進行科學的整合、分析、凝練和呈現的一種方法。

3 證據圖譜的制作方法
自美國耶魯大學提出證據圖譜的 9 步驟以來[1],證據圖譜的撰寫步驟在不斷地變化。目前,已經發表的證據圖譜運用的方法和步驟不盡相同[6, 19-21],主要的研究方法和步驟詳見表 1。

4 證據圖譜的制作要點
雖然證據圖譜的制作方法與步驟尚無公認的制作流程,但歸納其制作要點,主要制作步驟如下。
4.1 確定研究主題
制作證據圖譜的第一步是確定一個合適的研究主題并通過制定研究框架來確定具體的研究范圍[18]。研究選題來源于實踐,又服務于實踐,因此一個好的研究主題應符合需要性原則、價值性原則和科學性原則。與系統評價/Meta 分析不同的是,證據圖譜的研究主題和范圍通常較廣,不同類型的證據圖譜選題也有區別。證據圖選題的方向通常沒有限制。但差距圖,即干預性證據圖譜,往往偏向于某個研究領域中的多種干預措施對特定人群的影響,研究內容包括各種重要干預措施和研究結果,從而系統全面地分析、呈現各種干預措施的具體應用情況,如以家庭為基礎的干預對老年人功能影響的差距圖[22]。此外,確定研究主題時還應與學術專家、決策者、從業者和資助者在內的利益相關方進行協商。
4.2 制定納入與排除標準
納入與排除標準的制定一般根據 PICO 原則進行[23]。限于證據圖譜的作用和意義,在納入排除標準制定時一般只考慮干預措施和人群,很少對結局指標和對照進行限制。此外,Miake-Lye 等[5]的研究顯示,有多個只針對系統評價的證據圖譜已發表。可見對于研究類型來說分為兩種,一種是納入所有的研究,包括系統評價/Meta 分析和原始研究等。例如早期雙相情感障礙的社會心理干預的證據圖[24],納入了符合納入標準的所有研究,未限制研究類型。一種是僅納入系統評價/Meta 分析,與系統評價再評價類似。但兩者仍有不同,系統評價再評價傾向于解決具體的臨床問題,而證據圖譜傾向于對某個研究領域進行歸納總結,其納入的研究涉及面更為廣泛[7],如按摩對于疼痛的證據圖譜[21]。
4.3 全面證據檢索
證據檢索的目的是為獲取該領域全面的資料信息[25]。證據圖譜的制作需要全面搜集研究證據。一般來說,制作證據圖譜需要對綜合性數據庫進行全面檢索,主要包括 CNKI、WanFang Data、VIP 和 CBM 等中文數據庫和 PubMed、Web of Science、The Cochrane Library、EMbase 等英文數據庫。對于某些專業領域,比如教育學、心理學、經濟學等專業,還需檢索本專業領域的專題數據庫。
4.4 數據提取
全面和準確地數據提取是證據圖譜真實性的保障。證據圖譜的數據提取可分為兩部分,一部分是研究的基本特征,展示研究的基本信息。另一部分是研究問題的特征,突出研究重點。以干預性證據圖譜為例,提取的信息主要包括[7, 23]:① 研究的基本特征:作者、出版年份、研究類型/設計、目的、檢索日期、納入研究數量和樣本大小等;② 研究問題的特征:人群、干預類型、對照措施和結局(PICO 原則)。
目前發表的部分研究只提取了研究的基本特征,如瑜伽對后背疼的證據圖[19],該研究提取了作者、年份、研究設計、年齡等信息,并對其進行了分析。而另有一些證據圖譜對研究的基本特征和研究問題特征都進行了非常詳細的提取與整理,如以胃腸道間質瘤患者干預措施系統評價為基礎的證據圖譜[20],該研究提取了納入研究的作者、發表年份、研究目的、原始研究數量、研究類型、干預組、對照組、人群和結局指標等信息,并以研究問題特征為基礎進行了深入分析。
4.5 質量評價
證據圖譜的質量評價主要是指對納入的系統評價/Meta 分析進行質量評價,評價內容包括方法學設計、實施步驟、各類偏倚狀況及偏倚控制、利益沖突報告等。目前系統評價的評價標準分為方法學質量評價工具和報告質量評價工具,較常用的方法學質量評價工具為 AMSTAR 2[26]、報告質量評價工具為 PRISMA[27]。研究者可根據具體情況,選擇恰當標準對其質量進行評價。此外,對于干預性證據圖譜(差距圖)來說,制作方法中明確包括了質量評價這一關鍵步驟,而證據圖則一般不對納入研究進行質量評價。但通過近年發表的研究來看,證據圖譜的研究通常都會對納入研究進行質量評價,并且主要針對納入的系統評價/Meta 分析。例如瑜伽質量后背痛的證據圖[19]、以家庭為基礎的干預對老年人影響的證據差距圖[22]、胃腸道間質瘤患者干預措施系統評價為基礎的證據圖譜[20]等,都采用 AMSTAR 對納入的系統評價/Meta 分析進行了方法學質量評價。
4.6 證據圖譜的結果呈現
證據圖譜的結果主要通過表格和圖形兩種形式展現,一個內容豐富、簡明直觀的結果呈現對于證據使用者,尤其是臨床決策者尤為重要[18]。
在證據圖譜的全文中,數據提取表所展示的內容是全文中非常重要的一部分,被稱為基本特征。但總體來看,數據提取表所展示的內容深度有限。因此,證據圖譜通常通過一個專門的表格去更深層次地對納入研究進行分析,例如質量評價結果的展示、通過 PICO 原則所繪制的研究問題(研究問題特征)等。以干預性證據圖譜為例,各種干預措施、人群重要特征和臨床上的研究熱點,均可用表格直觀展示。例如糖尿病前期干預的證據圖通過表格形式呈現了納入研究的基本特征、研究問題特征和研究質量信息[28]。
除制作表格之外,圖形展示是證據圖譜一大亮點。其中最常見的圖形是氣泡圖(bubble chart)[29]。氣泡圖能夠清晰地展示 3 個或多個變量之間的關系,在證據圖譜結果的呈現中有舉足輕重的地位。譬如它可在一張三維圖上同時展示出納入研究的質量、樣本量和干預措施的分布這 3 項重要內容。故在證據圖譜中除用表格展示結果之外,用氣泡圖來立體呈現重點證據的分布和狀態能夠明顯增加可讀性。例如按摩對疼痛的證據圖[21],該研究除通過表格的形式呈現結果外,還通過氣泡圖的形式直觀呈現研究數量、質量和結論等信息。
此外,與系統評價、系統評價再評價相比,證據圖譜的結果呈現更加簡潔、直觀和豐富。系統評價、系統評價再評價對納入研究的特征、質量評價結果及效應量等信息進行評價,結果主要通過文字、表格或者森林圖等來展示,其中系統評價再評價偏重報告證據的質量特征。而證據圖譜結果報告的是整體的證據差距(樣本量、原始研究的數量、結論、質量等),對證據差距中的各項內容無明顯傾向,主要通過可視化方法,如氣泡圖的方式呈現[7, 18]。
4.7 研究報告的撰寫結構
證據圖譜研究報告的撰寫結構與系統評價/Meta 分析相似,一般包括研究背景、材料和方法(研究設計、納入排除標準、檢索策略、數據提取及文獻篩選、質量評價、數據分析)、結果(納入研究的數量及基本特征、質量評價結果、證據圖譜的展示)、討論、結論及參考文獻[18]。
5 范例解讀
本文以“Evidence mapping and quality assessment of systematic reviews on therapeutic interventions for oral cancer”研究[17]為例,對證據圖譜進行解讀,以供研究者參考。
5.1 研究背景
證據圖譜研究背景的撰寫同其它研究論文一樣,主要是對所研究領域發展現狀進行概括性的闡述,從而使讀者迅速了解論文背景和目的。在本范例中其背景介紹如下:
口腔癌是全世界最常見的癌癥之一。口腔鱗狀細胞癌是口腔最常見的癌癥,全球每年新增病例約 30 萬;僅在美國,2017 年預計新增病例約 5 萬。目前,大量已發表研究提出了多種治療口腔癌的方法。但是人們不了解這些方法有效性的優劣,及何時選用何種治療方法。因此,需要對現有證據進行批判性分析和方法學質量評估。組織和批判性地評估已發表研究的選擇之一是系統評價,它是通過總結來自初級保健研究證據的結果,以回答一個具體的研究問題。同樣,也有新的證據綜合工具,如證據圖譜,它被開發出來以幫助臨床醫生、病人、研究人員和其他利益相關者做出基于證據的決策。證據圖譜適合于解決可能對很多人來說過于廣泛的問題,其研究目的是識別、描述和組織現有的關于口腔癌治療干預的系統評價證據。該方法的目的是確定科學文獻中評估的臨床問題和證據的相應質量,并提供關于有效性的一般信息,這些信息將有助于發現研究差別,并幫助利害相關方進行科學決策。
5.2 納入與排除標準
證據圖譜的納入與排除標準一般根據 PICO 原則進行設置,該研究納入已發表的口腔惡性腫瘤患者療效評估的系統評價,不管是否進行 Meta 分析。研究人員對至少兩個不同的數據庫進行了全面搜索,并報告了對所包含研究的方法學質量評估。在處理同一團隊在不同階段發表的相同主題的論文時,納入最近發表的論文。此外,排除了關于精神分裂、安全性或成本效益分析相關的研究。
5.3 文獻檢索策略
在 2018 年 10 月 25 日系統檢索了 MEDLINE、EMbase、Epistemonikos、The Cochrane Library 4 個數據庫。通過主題詞和自由詞進行口腔癌的檢索,檢索詞包括:mouth neoplasms、oral carcinoma、oral cancer、oral tumor、buccal carcinoma 等。根據每個數據庫的具體特點對檢索策略進行了調整,沒有語言限制。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。
5.4 質量評價
證據圖譜所報告的質量評價主要針對納入研究,納入研究的設計類型不同,需選用不同的質量評價工具。此范例主要針對系統評價/Meta 分析,對納入系統評價/Meta 分析的質量評價采用 AMSTAR 2。
5.5 數據提取
證據圖譜的數據提取分為研究的基本特征和研究問題的特征兩部分。該范例數據提取內容包括:① 研究的基本特征:作者、出版年份、系統評價的類型(是否進行 Meta 分析)、目的、檢索日期、納入研究的設計和數量及納入參與者的數量。② 研究問題的特征:根據作者所述的目的,納排標準和系統評價的結論確定每個系統評價的研究問題。研究問題使用 PICO 框架(人群、干預措施、對照措施和結局)。如果某研究提供了 PICO 框架的所有要素,并在系統評價中描述了關于干預效果的結論,則考慮納入。提取人口特征(如,人群、癌癥類型、癌癥分期階段和癌癥位置),干預和對照(如,干預和對照措施均可廣泛分類為化療、手術、放射治療、免疫治療和靶向治療)和結局。此外,根據先前報告的標準[20],將系統評價的結論分為五類:有益(研究結論顯示干預措施有效并且納入的研究偏倚風險極低)、可能有益(盡管結果中報道了結局指標有效,但結論中并沒有明顯指出干預措施是有益的)、有害(研究結論中明顯報告與對照相比干預措施是有害的)、無差異效應(研究結論指出干預組和對照組的效果類似)及不確定(多個研究結局得出了相沖突的結論或者納入的個別研究限制了結論的得出)。
5.6 結果展示
證據圖譜的結果主要通過表格和圖形兩種形式展示。此范例展示了系統評價的基本特征表、PICO 研究問題特征表和質量評價表,并對疾病嚴重程度進行了描述性分析從而設計了一個氣泡圖(圖 2),其中每個氣泡代表一個系統評價。該圖表從 3 個維度顯示信息:① 作者的結論:在橫軸上的評級為有益、可能有益、有害、無差別效應和不確定;② AMSTAR 2 評估結果,分為高、中、低和極低四個等級,在縱軸上展示;③ 系統評價中包含的主要研究的數量,其在每個氣泡中顯示并由氣泡大小表示。每個氣泡也代表一個餅圖,顯示使用黑色粗線包括的隨機對照試驗的比例。

5.7 討論
證據圖譜的結論主要是對研究領域內相關研究的發表現狀、差距、質量等進行綜合分析,以期給出未來的研究方向。此范例對結論部分做了以下報告:
關于口腔癌治療干預的現有證據有限。該證據圖譜中納入的系統評價的方法學質量為極低。作者報告的可切除口腔癌患者的主要有益治療干預措施是單獨手術或與放療或化療聯合使用。缺乏無法切除的口腔癌的治療證據。這些研究結果強調了未來研究的必要性,重點是對新的治療干預措施和該領域的知識探索,及需要加大努力來改善關于口腔癌治療的系統評價方法學質量和報告過程。
6 結論
綜上,證據圖譜和系統評價理念相似,都是通過對現有證據進行綜合研究,從而解決回答臨床問題的一種證據綜合研究方法。系統評價旨在解決較為具體的研究和實踐問題,而證據圖譜最大的優勢在于能夠更加方便快捷地解決某個領域的整體研究和實踐問題。一個高質量的證據圖譜,能夠清晰、簡明、全面、系統地展示當前證據的質量、有效性、數量和人群等各種信息,找出現有證據體系的不足與證據之間的差別,找準未來的研究方向,從而為政府、研究者、使用者及其他利益相關方提供科學的決策依據。證據圖譜是極具發展潛力的一種新興證據綜合研究方法。