傘形綜述是對系統評價和Meta分析進行評價的一種方法,是在二次研究基礎上進行的證據綜合,屬于三次研究。國外對傘形綜述的研究方興未艾,我國目前仍處于初步認識和逐漸接受階段。本文旨在通過介紹傘形綜述的概念、實踐目的、研究現況、與系統評價和Meta分析的異同、開展傘形綜述的意義、局限性及中醫藥研究領域開展傘形綜述實踐等,為開展高水平的證據綜合及在臨床科研和診療中主動實踐循證理念奠定基礎。
引用本文: 孫重陽, 張浩然, 劉曉玉, 孫承頤, 閆世艷. 傘形綜述:選擇與應用最佳綜合證據的循證實踐. 中國循證醫學雜志, 2022, 22(5): 609-614. doi: 10.7507/1672-2531.202201021 復制
在臨床醫療實踐中,為獲得最好的防病治病效果,通常針對某個臨床問題選擇與應用當前最佳證據,作出科學的診治決策并付諸于臨床實踐。不難看出,這是踐行以循證為基礎的臨床實踐。隨著臨床科研的不斷開展,臨床研究結果的不斷產出,臨床醫生和研究人員對循證醫學投以極大關注,對研究證據進行整合和評價無疑會是臨床決策和研究的必然要求。系統評價和Meta分析是發現和獲取最佳證據的有效手段之一,它是通過篩選和綜合多個原始研究而得出更高層次的結論,屬于二次研究證據。據不完全統計,截止目前PubMed數據庫收錄的系統評價和Meta分析條目有35萬多條,面對如此眾多的綜合證據,需持謹慎態度以甄別真實可靠的高質量證據。傘形綜述應運而生,將在進一步綜合評價分析的基礎上助力臨床診療和衛生決策。目前,我國對傘形綜述仍處于初步認識和逐漸接受階段。本文旨在通過介紹傘形綜述的概念、研究現況和局限性等,為開展高水平的證據綜合及在臨床科研和診療中主動實踐循證理念奠定基礎。
1 傘形綜述的概念和實踐目的
傘形綜述(umbrella review)又被稱為傘形評價、“系統評價的系統評價”(systematic reviews of systematic reviews)、“Meta分析的系統評價”(systematic reviews of meta-analysis)、“綜述概述”(overviews of reviews)等[1],處于循證醫學金字塔頂端,代表目前證據綜合最高水平的方法之一。傘形綜述是通過明確定義研究問題,系統搜索證據綜合的基本單位(系統評價和Meta分析),提取、分析和匯總跨界結果,為醫療保健決策者提供特定主題問題的當前證據的綜合匯總[2]。傘形綜述的命名形象貼切,將這種更高層次的證據綜合評價方法比喻為一把傘,有兩種解釋:① 提供了“一把傘”,避免搜索者被大量的“證據雨”淋濕[1];② 像“一把傘”,將更多的證據囊括在特定范圍內。從其概念可以看出,傘形綜述實際上是在系統評價的基礎上再次進行系統評價,因此屬于三次研究[3]。
傘形綜述的實踐目的不僅具有強烈的臨床性,即服務于臨床醫療進而促進臨床醫學的發展;同時,通過嚴格系統的信息整合、分析與評價,也為醫學教育、科學研究及衛生政策提供最佳的證據。傘形綜述是一項“龐大的系統工程”,因此開展傘形綜述不應盲目,建議主要基于以下兩方面考慮:① 相關主題的二次研究數量相對較多。臨床醫生、研究人員和衛生決策者面對浩如煙海的信息源,要想較快地基本掌握本領域的最新進展和最新研究成果,需耗費大量的時間和精力;尤其面對數量眾多的系統評價或Meta分析所提供的證據,更是難以把握與取舍。而傘形綜述可在系統評價和Meta分析的基礎上,采用嚴格的評價方法,對現有二次研究證據進行去粗取精、去偽存真、多方取證,提高研究證據的真實性和可靠性。② 現有二次研究證據相互矛盾或存有爭議。針對同一臨床問題的諸多系統評價或Meta分析,往往因PICOS(疾病的診斷標準、研究對象的納入排除標準、治療措施、結果的測量方法和納入研究的設計類型)不同,導致不同系統評價結果可能存在不一致甚至相反的結論,如現今越來越多的證據評估針灸對體外受精的治療作用[4-7],但是結論不同,甚至相悖,臨床醫生面對矛盾的研究結果無法抉擇;同時,系統評價或Meta分析的實施方法正確與否也會影響結果的真實性和可靠性。為避免誤治、濫治或采用不可靠的證據給患者治療及衛生決策造成嚴重的傷害和不良后果,針對尚難定論的、易引起誤導的重要問題對癥下藥,將為提高臨床診治水平和下一步研究提供參考依據。傘形綜述在針對系統評價和Meta分析的結果進行分析合成的同時,更加審慎地對證據的質量進行評價,依據研究證據客觀地對其分級推薦,進而為臨床實踐、醫療決策和研究導向提出可供參考的建議。
2 國內外傘形綜述現狀
為全面系統了解目前國內外傘型綜述的研究現狀,采用主題詞和自由詞檢索CNKI、WanFang Data、Web of Science、PubMed和The Cochrane Library數據庫,并根據不同數據庫進行調整,檢索時間均為建庫至2021年12月。中文檢索詞包括:傘形綜述、傘形評價、系統評價概述、Meta分析綜述、系統評價的系統評價、系統評價再評價;英文檢索詞包括:umbrella review、systematic reviews of systematic reviews、umbrella systematic review、meta-review、review of reviews、meta-meta-analysis、overviews of reviews等。以PubMed為例,其具體檢索策略見框1。

2.1 國際情況
一些國家和國際組織,如英國國家衛生及醫療優化研究院(National Institute for Health and Care Excellence,NICE)、澳大利亞循證護理中心(Joanna Briggs Institute,JBI)和Cochrane協作網等,都致力于制作高質量系統評價和Meta分析。2009年Cochrane系統評價員手冊中特定章節引入了“綜述概述”(overview of reviews)這一概念[8],Cochrane工作小組在證據綜合方法上一直走在國際前沿,并從2006年開始定期在Evidence-based Child Health: A Cochrane Review Journal上發表關于綜述概述的相關文章,最早關注的干預措施是藥理學、非藥理學、或二者兼有[9]。近年來不斷發展,以umbrella review、systematic reviews of systematic reviews、umbrella systematic review、meta-review、review of reviews、meta-meta-analysis、overviews of reviews為檢索詞檢索Web of Science數據庫,可見傘形綜述的相關文獻發表數量逐年遞增(圖1)。至今為止在Web of Science上排名前10的領域為醫學公共環境職業健康、醫學綜合內科、精神病學、醫療保健科學服務、營養學、臨床神經病學、健康政策服務、藥理學、神經科學、環境科學,覆蓋了當代醫學領域熱點的話題,其中貢獻量排名前3的國家是英國、美國、澳大利亞,而在所屬機構的排名中英國的倫敦大學、倫敦國王學院、倫敦帝國理工學院則包攬前3的寶座。2021年傘形綜述的發文量和注冊量超過以前任何一年。2021年PROSPERO網站上注冊的標題為umbrella review占歷年來總注冊量的1/3,這一方面體現了當代科研大數據的進步;另一方面也從側面體現出傘形綜述現今被越來越多的科研工作者所關注。

2.2 國內情況
自2011年關于傘型綜述的概念及方法在我國就有較為全面的介紹[10],但是在證據強度和質量評價方面尚未引入證據體的分級評價標準及相關偏倚風險評估技術,但這一工作為后續促進系統評價再評價的普及和發展奠定了基礎。截至目前,國內研究者傘形綜述的發文量在國際總文獻量中占比7.40%,排名第9,主要關注的領域有醫學綜合內科、營養學、食品科學技術、腫瘤學、臨床神經病學、外科手術、心臟及心血管系統、內分泌代謝、胃腸病及肝臟病學、醫療保健科學服務等等,一方面表明國內緊跟國際研究熱點,另一方面也顯示某些領域比如精神病學、藥理學等還有很大的研究發展空間。雖然我國傘形綜述起步較晚,但2020年來自中山大學的研究者在柳葉刀子刊《柳葉刀糖尿病和內分泌》雜志上發表了《降糖藥物和心血管結局的關聯:一篇傘形綜述和證據圖》的高質量文章,為臨床上既有心血管疾病/心血管疾病高危風險又有糖尿病的患者在治療上提供了廣泛的證據信息,具有實際的指導意義[11]。
中醫藥是我國傳統文化的瑰寶,但因其整體觀念和辨證論治的基本特點,研究者使用客觀的測量方法和定量的評估方法是具有挑戰性的,商洪才等曾對發表在中文期刊上的系統評價和Meta分析進行方法學和證據質量評估,其結果表示整體質量欠佳[12]。近年來關于中醫藥方向的傘形綜述文章很少(圖2),已發表的研究也顯示納入研究的方法學質量存在缺陷和證據質量低導致結果可信度有限[13]。

基于中醫藥領域原始研究中設計的復雜性、方法學和證據質量較低等問題,二次研究的證據質量不可靠,若在此基礎上進行三次研究,那么證據可靠性金字塔就會搖搖欲墜。因此,目前中醫藥領域更應該著力于開展高質量的原始臨床研究,在臨床研究設計和實施早期邀請方法學專家共同合作以提高和保障原始研究質量,同時探索高水平證據綜合及適合中醫療效評估的方法,在穩固基礎的前提上邊探索邊提高,期求獲得真實可靠的綜合證據。
3 傘形綜述方法簡介及與系統評價和Meta分析的異同
3.1 傘形綜述方法簡介
關于傘形綜述的制作方法,國內外文獻中已有較為詳細的介紹[2-3,10]。傘形綜述與系統評價的證據綜合方法大體是相同的,首先確定一個需要解決的研究問題,其次根據PICO(人群、干預措施、對照、結局)原則確定研究主題的納入和排除標準,然后系統地檢索研究主題下所有的系統評價和Meta分析,基于系統評價和Meta分析的水平上提取、評估、整理數據,對數據進行描述性說明或定量的分析后,最終得出研究主題的綜合信息圖譜。
3.2 與系統評價和Meta分析的異同
傘形綜述與系統評價及Meta分析同為循證醫學大樹主干上的枝丫,其本質屬性是相同的,比如:同為證據綜合的方法;都使用經過驗證的AMSTAR 2和GRADE工具評估組成研究的方法學和證據質量[14-15];同樣要報告所包含研究的異質性和潛在偏倚;在一定條件下都可通過R語言、Stata等軟件對數據進行定量分析;都可選擇森林圖作為結果展示的形式等。
傘形綜述來源于系統評價和Meta分析,但其證據層級更高,兩者的不同主要體現在以下方面。
① 研究證據來源不同。系統評價是以原始單個研究為基本單位,針對某一問題的全部原始證據進行嚴格評價、整合處理、分析總結后得出綜合結論;在條件允許時運用Meta定量合成的方法將若干研究結果合并效應量以提高檢驗效能。而傘形綜述以系統評價和Meta分析為基本單位[11,16],對系統評價和Meta分析進行進一步的描述性總結或者必要時根據定義的研究問題提取數據、重新計算、分類匯總、評估證據質量、展示結果。
② 研究評價側重點不同。系統評價評價原始研究的偏倚風險,但傘形綜述評價系統評價和Meta分析的方法學質量和偏倚風險。
③ 研究廣度和深度不同。Cochrane系統評價員手冊上有較為詳細的關于如何開展系統評價和Meta分析的說明,主要集中在特定問題的PICO框架之中[17],研究范圍較小,干預措施單一,不包括其他競爭或輔助意義的干預措施,側重于直接將干預和對照進行比較[18],進而研究某一干預措施的有效性。不可否認的是,細化研究問題是高質量研究的基礎。但真實臨床實踐更為復雜,包括不同的條件、人群、治療方式、結果及不利影響,單一的系統評價和定量的Meta分析會產生片面的證據信息,傘形綜述的研究問題同樣也在PICO框架之中[19],但是研究范圍更廣。Cochrane協作網將系統評價概述研究的問題概括為五種類型[2]:相同條件或人群應用不同干預措施、不同條件或人群應用相同的干預措施、相同條件或人群的相同干預措施但不同的結果或時間點、相同條件或人群應用相同干預措施的不同方法途徑、不利影響檢查。例如:2019年BMJ發表《飲食在2型糖尿病發病率中的作用:前瞻性觀察性研究Meta分析的傘形綜述》[20],納入53個已發表的Meta分析,解決的問題是相同條件和人群的不同干預措施之間的比較。不同的飲食干預措施定義為三大類:飲食行為、食物組、營養素,而其中納入的一個子集Meta分析為《不吃早餐與2型糖尿病的風險:觀察性研究的Meta分析》[21],我們可以看出,干預措施采用不吃早餐僅為母集傘形綜述中眾多飲食行為之一,范圍的不同一眼即知。
④ 研究證據層級不同。如前所述,傘形綜述所提供的證據等級處于證據金字塔的最頂端,是目前所能提供的最高級別的循證證據;系統評價次之。
⑤ 證據體分級評價標準不同。傘形綜述在結論展示階段需對照證據分級標準進行分級評價:令人信服的證據(Ⅰ級),當病例數>1 000,P<10?6,I2<50%,95%預測區間排除了無效值(95% prediction interval excluding the null),沒有小研究效應,沒有過度顯著性偏倚;高度提示性證據(Ⅱ級),當病例數>1 000,P<10?6,樣本量最大的研究報告了有顯著統計學意義的結果,不滿足Ⅰ級的標準;提示性證據(Ⅲ級),當病例數>1 000,P<10?3,不滿足Ⅰ~Ⅱ級的標準;弱證據(Ⅳ級),當P<0.05且不滿足Ⅰ~Ⅲ級的標準;當P>0.05為不顯著[16,22],研究者在針對觀察性研究問題的結論展示時可參考此分級標準,亦可選擇適合研究問題的層級描述性標準,不必拘泥于上述形式。需注意的是,傘形綜述針對某個指標所形成的單個證據體進行分級劃分,如果研究者關注多個指標的臨床意義,那么需逐個對指標進行證據可靠性的證據評級。而系統評價和Meta分析不涉及這部分工作。
4 傘形綜述的價值
傘形綜述屬于循證醫學范疇,因此具有強烈的臨床實踐性。這也強調了實施傘形綜述須以臨床問題為出發點,尋找目前的最好證據,助力臨床診療策略和措施最優化。
除可提供目前最高級別水平之一綜合證據,傘形綜述還具有如下優勢:第一,綜合性。可比較某一干預/暴露對不同主題或不同干預/暴露對于同一主題的影響[11,16,20,23],或根據需要可將研究問題領域下的觀察性研究和干預性研究的系統評價和Meta分析同時納入,彌補了系統評價單一比較缺乏臨床復雜特征的缺陷。第二,包容性。當研究者比較了系統評價和Meta分析內原始研究之后,若有遺漏或者最新的研究尚未被系統評價納入,傘形綜述可將其囊括在內[24]。第三,清晰性。傘形綜述根據研究問題對納入的系統評價和Meta分析進行分類整理,在擴大研究問題范圍的基礎上細化目標證據體的分類,在每小類中根據研究者定義的標準(高質量、最近或最大原始研究數量等)對納入的文章進行篩選,基于二次研究的水平提取數據、整理或計算統計量,亦可合并未納入的原始研究的相關信息,最終得出清晰的證據圖表。第四,前瞻性。為醫療決策者或者機構的投資人在較緊迫的時間內以及臨床資源缺乏的情況下提供某一研究主題較為完整的信息綜合,直觀地比較主題下可用證據的有效性、精確度,明晰當前研究的現狀中的優勢和不足,為未來的研究指明了方向。第五,實踐性。如前所述,真實世界中針對某一疾病的干預措施或暴露因素不是單一存在的,原始單個研究細化研究問題雖然保證科學性而另一方面則忽視了臨床復雜性,傘形綜述可將研究問題所有相關因素囊括在內,兼具了部分臨床復雜性的特征,在一定程度上貼近了真實世界。
5 傘形綜述的局限性和需重點研究的方面
關于傘形綜述現有問題,主要體現在如下幾個方面。首先,關于納入傘形綜述重疊的研究,如何報告和處理沒有統一的標準,亦缺乏相應的指南指導。Pieper等[25]開發了“校正覆蓋面積”(corrected covered area,CCA)用以報告傘形綜述內系統評價的重疊程度。但應用并不廣泛,研究者大多根據自己的研究問題定義如何對重疊研究的處理[20,26]。其次,尚缺乏專門針對傘形綜述的計算軟件,大多定量的計算依托于R語言或者Stata等,傘形綜述動輒幾十甚至上百個結果計算和森林圖的繪制亟需更為適宜高效的計算工具。國外有研究團隊正在開發用于傘形綜述的專用分析工具[27]。第三,異質性的評估問題,傘形綜述同樣需客觀報告并探討異質性的來源,在充分考量各個指標證據體的異質性的前提下,謹慎推論。最后,應加強傘形綜述報告規范的制訂和推廣。傘形綜述的工作量大,其搜索、篩選、整理、評估及結果報告都很復雜,為驗證其可靠性和可重復性,研究者應將研究過程透明化,現有的文獻中這一部分報告較為薄弱,未來的研究中應強化報告規范,尤其應著重報告傘形綜述操作的方法學部分。
6 總結
本文系統介紹了傘形綜述的概念、應用場景、國內外研究現狀,同時與系統評價和Meta分析進行了比較進而提出開展傘形綜述的意義和現存的問題;另外作者結合所從事的研究領域針對傘形綜述在中醫藥方向的發展進行了介紹和思考,以期助力傘形綜述在我國傳統中醫學領域進行推廣應用。
總之,傘形綜述是當代研究綜合體系的新臺階,現今還在不斷完善和發展的階段,隨著研究的深入和研究方法的不斷創新演變,未來定能為總覽臨床研究現狀提供可靠技術支撐,從而指導臨床研究轉化,為促進衛生管理決策的科學化、完善可供衛生資源的最優化提供堅實的循證依據。
在臨床醫療實踐中,為獲得最好的防病治病效果,通常針對某個臨床問題選擇與應用當前最佳證據,作出科學的診治決策并付諸于臨床實踐。不難看出,這是踐行以循證為基礎的臨床實踐。隨著臨床科研的不斷開展,臨床研究結果的不斷產出,臨床醫生和研究人員對循證醫學投以極大關注,對研究證據進行整合和評價無疑會是臨床決策和研究的必然要求。系統評價和Meta分析是發現和獲取最佳證據的有效手段之一,它是通過篩選和綜合多個原始研究而得出更高層次的結論,屬于二次研究證據。據不完全統計,截止目前PubMed數據庫收錄的系統評價和Meta分析條目有35萬多條,面對如此眾多的綜合證據,需持謹慎態度以甄別真實可靠的高質量證據。傘形綜述應運而生,將在進一步綜合評價分析的基礎上助力臨床診療和衛生決策。目前,我國對傘形綜述仍處于初步認識和逐漸接受階段。本文旨在通過介紹傘形綜述的概念、研究現況和局限性等,為開展高水平的證據綜合及在臨床科研和診療中主動實踐循證理念奠定基礎。
1 傘形綜述的概念和實踐目的
傘形綜述(umbrella review)又被稱為傘形評價、“系統評價的系統評價”(systematic reviews of systematic reviews)、“Meta分析的系統評價”(systematic reviews of meta-analysis)、“綜述概述”(overviews of reviews)等[1],處于循證醫學金字塔頂端,代表目前證據綜合最高水平的方法之一。傘形綜述是通過明確定義研究問題,系統搜索證據綜合的基本單位(系統評價和Meta分析),提取、分析和匯總跨界結果,為醫療保健決策者提供特定主題問題的當前證據的綜合匯總[2]。傘形綜述的命名形象貼切,將這種更高層次的證據綜合評價方法比喻為一把傘,有兩種解釋:① 提供了“一把傘”,避免搜索者被大量的“證據雨”淋濕[1];② 像“一把傘”,將更多的證據囊括在特定范圍內。從其概念可以看出,傘形綜述實際上是在系統評價的基礎上再次進行系統評價,因此屬于三次研究[3]。
傘形綜述的實踐目的不僅具有強烈的臨床性,即服務于臨床醫療進而促進臨床醫學的發展;同時,通過嚴格系統的信息整合、分析與評價,也為醫學教育、科學研究及衛生政策提供最佳的證據。傘形綜述是一項“龐大的系統工程”,因此開展傘形綜述不應盲目,建議主要基于以下兩方面考慮:① 相關主題的二次研究數量相對較多。臨床醫生、研究人員和衛生決策者面對浩如煙海的信息源,要想較快地基本掌握本領域的最新進展和最新研究成果,需耗費大量的時間和精力;尤其面對數量眾多的系統評價或Meta分析所提供的證據,更是難以把握與取舍。而傘形綜述可在系統評價和Meta分析的基礎上,采用嚴格的評價方法,對現有二次研究證據進行去粗取精、去偽存真、多方取證,提高研究證據的真實性和可靠性。② 現有二次研究證據相互矛盾或存有爭議。針對同一臨床問題的諸多系統評價或Meta分析,往往因PICOS(疾病的診斷標準、研究對象的納入排除標準、治療措施、結果的測量方法和納入研究的設計類型)不同,導致不同系統評價結果可能存在不一致甚至相反的結論,如現今越來越多的證據評估針灸對體外受精的治療作用[4-7],但是結論不同,甚至相悖,臨床醫生面對矛盾的研究結果無法抉擇;同時,系統評價或Meta分析的實施方法正確與否也會影響結果的真實性和可靠性。為避免誤治、濫治或采用不可靠的證據給患者治療及衛生決策造成嚴重的傷害和不良后果,針對尚難定論的、易引起誤導的重要問題對癥下藥,將為提高臨床診治水平和下一步研究提供參考依據。傘形綜述在針對系統評價和Meta分析的結果進行分析合成的同時,更加審慎地對證據的質量進行評價,依據研究證據客觀地對其分級推薦,進而為臨床實踐、醫療決策和研究導向提出可供參考的建議。
2 國內外傘形綜述現狀
為全面系統了解目前國內外傘型綜述的研究現狀,采用主題詞和自由詞檢索CNKI、WanFang Data、Web of Science、PubMed和The Cochrane Library數據庫,并根據不同數據庫進行調整,檢索時間均為建庫至2021年12月。中文檢索詞包括:傘形綜述、傘形評價、系統評價概述、Meta分析綜述、系統評價的系統評價、系統評價再評價;英文檢索詞包括:umbrella review、systematic reviews of systematic reviews、umbrella systematic review、meta-review、review of reviews、meta-meta-analysis、overviews of reviews等。以PubMed為例,其具體檢索策略見框1。

2.1 國際情況
一些國家和國際組織,如英國國家衛生及醫療優化研究院(National Institute for Health and Care Excellence,NICE)、澳大利亞循證護理中心(Joanna Briggs Institute,JBI)和Cochrane協作網等,都致力于制作高質量系統評價和Meta分析。2009年Cochrane系統評價員手冊中特定章節引入了“綜述概述”(overview of reviews)這一概念[8],Cochrane工作小組在證據綜合方法上一直走在國際前沿,并從2006年開始定期在Evidence-based Child Health: A Cochrane Review Journal上發表關于綜述概述的相關文章,最早關注的干預措施是藥理學、非藥理學、或二者兼有[9]。近年來不斷發展,以umbrella review、systematic reviews of systematic reviews、umbrella systematic review、meta-review、review of reviews、meta-meta-analysis、overviews of reviews為檢索詞檢索Web of Science數據庫,可見傘形綜述的相關文獻發表數量逐年遞增(圖1)。至今為止在Web of Science上排名前10的領域為醫學公共環境職業健康、醫學綜合內科、精神病學、醫療保健科學服務、營養學、臨床神經病學、健康政策服務、藥理學、神經科學、環境科學,覆蓋了當代醫學領域熱點的話題,其中貢獻量排名前3的國家是英國、美國、澳大利亞,而在所屬機構的排名中英國的倫敦大學、倫敦國王學院、倫敦帝國理工學院則包攬前3的寶座。2021年傘形綜述的發文量和注冊量超過以前任何一年。2021年PROSPERO網站上注冊的標題為umbrella review占歷年來總注冊量的1/3,這一方面體現了當代科研大數據的進步;另一方面也從側面體現出傘形綜述現今被越來越多的科研工作者所關注。

2.2 國內情況
自2011年關于傘型綜述的概念及方法在我國就有較為全面的介紹[10],但是在證據強度和質量評價方面尚未引入證據體的分級評價標準及相關偏倚風險評估技術,但這一工作為后續促進系統評價再評價的普及和發展奠定了基礎。截至目前,國內研究者傘形綜述的發文量在國際總文獻量中占比7.40%,排名第9,主要關注的領域有醫學綜合內科、營養學、食品科學技術、腫瘤學、臨床神經病學、外科手術、心臟及心血管系統、內分泌代謝、胃腸病及肝臟病學、醫療保健科學服務等等,一方面表明國內緊跟國際研究熱點,另一方面也顯示某些領域比如精神病學、藥理學等還有很大的研究發展空間。雖然我國傘形綜述起步較晚,但2020年來自中山大學的研究者在柳葉刀子刊《柳葉刀糖尿病和內分泌》雜志上發表了《降糖藥物和心血管結局的關聯:一篇傘形綜述和證據圖》的高質量文章,為臨床上既有心血管疾病/心血管疾病高危風險又有糖尿病的患者在治療上提供了廣泛的證據信息,具有實際的指導意義[11]。
中醫藥是我國傳統文化的瑰寶,但因其整體觀念和辨證論治的基本特點,研究者使用客觀的測量方法和定量的評估方法是具有挑戰性的,商洪才等曾對發表在中文期刊上的系統評價和Meta分析進行方法學和證據質量評估,其結果表示整體質量欠佳[12]。近年來關于中醫藥方向的傘形綜述文章很少(圖2),已發表的研究也顯示納入研究的方法學質量存在缺陷和證據質量低導致結果可信度有限[13]。

基于中醫藥領域原始研究中設計的復雜性、方法學和證據質量較低等問題,二次研究的證據質量不可靠,若在此基礎上進行三次研究,那么證據可靠性金字塔就會搖搖欲墜。因此,目前中醫藥領域更應該著力于開展高質量的原始臨床研究,在臨床研究設計和實施早期邀請方法學專家共同合作以提高和保障原始研究質量,同時探索高水平證據綜合及適合中醫療效評估的方法,在穩固基礎的前提上邊探索邊提高,期求獲得真實可靠的綜合證據。
3 傘形綜述方法簡介及與系統評價和Meta分析的異同
3.1 傘形綜述方法簡介
關于傘形綜述的制作方法,國內外文獻中已有較為詳細的介紹[2-3,10]。傘形綜述與系統評價的證據綜合方法大體是相同的,首先確定一個需要解決的研究問題,其次根據PICO(人群、干預措施、對照、結局)原則確定研究主題的納入和排除標準,然后系統地檢索研究主題下所有的系統評價和Meta分析,基于系統評價和Meta分析的水平上提取、評估、整理數據,對數據進行描述性說明或定量的分析后,最終得出研究主題的綜合信息圖譜。
3.2 與系統評價和Meta分析的異同
傘形綜述與系統評價及Meta分析同為循證醫學大樹主干上的枝丫,其本質屬性是相同的,比如:同為證據綜合的方法;都使用經過驗證的AMSTAR 2和GRADE工具評估組成研究的方法學和證據質量[14-15];同樣要報告所包含研究的異質性和潛在偏倚;在一定條件下都可通過R語言、Stata等軟件對數據進行定量分析;都可選擇森林圖作為結果展示的形式等。
傘形綜述來源于系統評價和Meta分析,但其證據層級更高,兩者的不同主要體現在以下方面。
① 研究證據來源不同。系統評價是以原始單個研究為基本單位,針對某一問題的全部原始證據進行嚴格評價、整合處理、分析總結后得出綜合結論;在條件允許時運用Meta定量合成的方法將若干研究結果合并效應量以提高檢驗效能。而傘形綜述以系統評價和Meta分析為基本單位[11,16],對系統評價和Meta分析進行進一步的描述性總結或者必要時根據定義的研究問題提取數據、重新計算、分類匯總、評估證據質量、展示結果。
② 研究評價側重點不同。系統評價評價原始研究的偏倚風險,但傘形綜述評價系統評價和Meta分析的方法學質量和偏倚風險。
③ 研究廣度和深度不同。Cochrane系統評價員手冊上有較為詳細的關于如何開展系統評價和Meta分析的說明,主要集中在特定問題的PICO框架之中[17],研究范圍較小,干預措施單一,不包括其他競爭或輔助意義的干預措施,側重于直接將干預和對照進行比較[18],進而研究某一干預措施的有效性。不可否認的是,細化研究問題是高質量研究的基礎。但真實臨床實踐更為復雜,包括不同的條件、人群、治療方式、結果及不利影響,單一的系統評價和定量的Meta分析會產生片面的證據信息,傘形綜述的研究問題同樣也在PICO框架之中[19],但是研究范圍更廣。Cochrane協作網將系統評價概述研究的問題概括為五種類型[2]:相同條件或人群應用不同干預措施、不同條件或人群應用相同的干預措施、相同條件或人群的相同干預措施但不同的結果或時間點、相同條件或人群應用相同干預措施的不同方法途徑、不利影響檢查。例如:2019年BMJ發表《飲食在2型糖尿病發病率中的作用:前瞻性觀察性研究Meta分析的傘形綜述》[20],納入53個已發表的Meta分析,解決的問題是相同條件和人群的不同干預措施之間的比較。不同的飲食干預措施定義為三大類:飲食行為、食物組、營養素,而其中納入的一個子集Meta分析為《不吃早餐與2型糖尿病的風險:觀察性研究的Meta分析》[21],我們可以看出,干預措施采用不吃早餐僅為母集傘形綜述中眾多飲食行為之一,范圍的不同一眼即知。
④ 研究證據層級不同。如前所述,傘形綜述所提供的證據等級處于證據金字塔的最頂端,是目前所能提供的最高級別的循證證據;系統評價次之。
⑤ 證據體分級評價標準不同。傘形綜述在結論展示階段需對照證據分級標準進行分級評價:令人信服的證據(Ⅰ級),當病例數>1 000,P<10?6,I2<50%,95%預測區間排除了無效值(95% prediction interval excluding the null),沒有小研究效應,沒有過度顯著性偏倚;高度提示性證據(Ⅱ級),當病例數>1 000,P<10?6,樣本量最大的研究報告了有顯著統計學意義的結果,不滿足Ⅰ級的標準;提示性證據(Ⅲ級),當病例數>1 000,P<10?3,不滿足Ⅰ~Ⅱ級的標準;弱證據(Ⅳ級),當P<0.05且不滿足Ⅰ~Ⅲ級的標準;當P>0.05為不顯著[16,22],研究者在針對觀察性研究問題的結論展示時可參考此分級標準,亦可選擇適合研究問題的層級描述性標準,不必拘泥于上述形式。需注意的是,傘形綜述針對某個指標所形成的單個證據體進行分級劃分,如果研究者關注多個指標的臨床意義,那么需逐個對指標進行證據可靠性的證據評級。而系統評價和Meta分析不涉及這部分工作。
4 傘形綜述的價值
傘形綜述屬于循證醫學范疇,因此具有強烈的臨床實踐性。這也強調了實施傘形綜述須以臨床問題為出發點,尋找目前的最好證據,助力臨床診療策略和措施最優化。
除可提供目前最高級別水平之一綜合證據,傘形綜述還具有如下優勢:第一,綜合性。可比較某一干預/暴露對不同主題或不同干預/暴露對于同一主題的影響[11,16,20,23],或根據需要可將研究問題領域下的觀察性研究和干預性研究的系統評價和Meta分析同時納入,彌補了系統評價單一比較缺乏臨床復雜特征的缺陷。第二,包容性。當研究者比較了系統評價和Meta分析內原始研究之后,若有遺漏或者最新的研究尚未被系統評價納入,傘形綜述可將其囊括在內[24]。第三,清晰性。傘形綜述根據研究問題對納入的系統評價和Meta分析進行分類整理,在擴大研究問題范圍的基礎上細化目標證據體的分類,在每小類中根據研究者定義的標準(高質量、最近或最大原始研究數量等)對納入的文章進行篩選,基于二次研究的水平提取數據、整理或計算統計量,亦可合并未納入的原始研究的相關信息,最終得出清晰的證據圖表。第四,前瞻性。為醫療決策者或者機構的投資人在較緊迫的時間內以及臨床資源缺乏的情況下提供某一研究主題較為完整的信息綜合,直觀地比較主題下可用證據的有效性、精確度,明晰當前研究的現狀中的優勢和不足,為未來的研究指明了方向。第五,實踐性。如前所述,真實世界中針對某一疾病的干預措施或暴露因素不是單一存在的,原始單個研究細化研究問題雖然保證科學性而另一方面則忽視了臨床復雜性,傘形綜述可將研究問題所有相關因素囊括在內,兼具了部分臨床復雜性的特征,在一定程度上貼近了真實世界。
5 傘形綜述的局限性和需重點研究的方面
關于傘形綜述現有問題,主要體現在如下幾個方面。首先,關于納入傘形綜述重疊的研究,如何報告和處理沒有統一的標準,亦缺乏相應的指南指導。Pieper等[25]開發了“校正覆蓋面積”(corrected covered area,CCA)用以報告傘形綜述內系統評價的重疊程度。但應用并不廣泛,研究者大多根據自己的研究問題定義如何對重疊研究的處理[20,26]。其次,尚缺乏專門針對傘形綜述的計算軟件,大多定量的計算依托于R語言或者Stata等,傘形綜述動輒幾十甚至上百個結果計算和森林圖的繪制亟需更為適宜高效的計算工具。國外有研究團隊正在開發用于傘形綜述的專用分析工具[27]。第三,異質性的評估問題,傘形綜述同樣需客觀報告并探討異質性的來源,在充分考量各個指標證據體的異質性的前提下,謹慎推論。最后,應加強傘形綜述報告規范的制訂和推廣。傘形綜述的工作量大,其搜索、篩選、整理、評估及結果報告都很復雜,為驗證其可靠性和可重復性,研究者應將研究過程透明化,現有的文獻中這一部分報告較為薄弱,未來的研究中應強化報告規范,尤其應著重報告傘形綜述操作的方法學部分。
6 總結
本文系統介紹了傘形綜述的概念、應用場景、國內外研究現狀,同時與系統評價和Meta分析進行了比較進而提出開展傘形綜述的意義和現存的問題;另外作者結合所從事的研究領域針對傘形綜述在中醫藥方向的發展進行了介紹和思考,以期助力傘形綜述在我國傳統中醫學領域進行推廣應用。
總之,傘形綜述是當代研究綜合體系的新臺階,現今還在不斷完善和發展的階段,隨著研究的深入和研究方法的不斷創新演變,未來定能為總覽臨床研究現狀提供可靠技術支撐,從而指導臨床研究轉化,為促進衛生管理決策的科學化、完善可供衛生資源的最優化提供堅實的循證依據。