Meta流行病學報告規范基于PRISMA制訂,旨在增加Meta流行病學研究的報告質量和透明度。本文對Meta流行病學報告規范的24個條目進行介紹和解讀,以期為研究人員規范報告Meta流行病學研究提供參考。
引用本文: 郭嘉琪, 龍囿霖, 林春瀅, 王心怡, 郭瓊, 林逸飛, 黃進, 楊克虎, 章仲恒, 徐暢, 商洪才, 杜亮. Meta流行病學研究的報告規范解讀. 中國循證醫學雜志, 2022, 22(9): 1071-1079. doi: 10.7507/1672-2531.202205104 復制
Meta流行病學是指定量分析研究中的潛在偏倚特征對干預療效估計影響的一種研究,是識別與量化潛在偏倚特征影響的重要工具,可為未來控制研究偏倚提供實證證據[1]。Meta流行病學的研究對象多為系統評價/Meta分析,近年來系統評價/Meta分析數量的快速增長為開展Meta流行病學研究提供了基礎,同時促使了Meta流行病學研究數量的快速增長。
由于Meta流行病學研究與系統評價/Meta分析在研究步驟方面具有一定的相似性,因此過去一些Meta流行病學研究論文采用了系統評價/Meta分析報告規范(preferred reporting items for systematic reviews and meta-analysis,PRISMA)進行報告[2-4]。但實際上Meta流行病學研究存在許多特殊性,僅按照PRISMA進行報告可能會忽略掉重要信息。另外,過去多數的Meta流行病學研究未遵循任何報告規范,存在報告格式不統一、報告內容缺乏完整性及充分性、甚至未報告關鍵信息等問題[3],影響了Meta流行病學研究結果的認可度。
因此,2017年Murad等[5]基于PRISMA制訂了Meta流行病學研究報告規范(guidelines for reporting meta-epidemiological methodology research),該報告規范已被EQUATOR(enhancing the quality and transparency of health research)協作網收錄[6]。本文旨在對Meta流行病學報告規范的重點內容結合實例進行解讀,以促進該報告規范的使用,進而提高Meta流行病學研究的報告質量和透明度。
1 Meta流行病學報告規范清單介紹
Meta流行病學報告規范清單分為標題、摘要、前言、方法、結果、討論和資助7個部分,共包含24個條目(表1)。

2 條目解讀
2.1 標題
2.1.1 報告內容
明確報告該研究為Meta流行病學研究。
2.1.2 舉例
示例[7]:評價不同醫學學科的療效和發表偏倚:一個Meta流行病學研究(assessing treatment effects and publication bias across different specialties in medicine: a meta-epidemiological study)。
2.1.3 解釋
在標題中必須說明該研究為Meta流行病學研究,便于檢索及快速識別該研究的設計類型[5]。
2.2 結構式摘要
2.2.1 報告內容
概括研究背景、目的、數據來源、數據選擇方法、評價及合并方法、結果、局限性、結論和研究意義。
2.2.2 舉例
示例[8]:① 背景:未發表試驗及非英語發表試驗對Meta分析結果的影響不清。② 目的:采用Meta流行病學方法分別比較已發表和未發表的隨機對照試驗(randomized controlled trial,RCT)及英語和非英語發表的試驗間的療效。③ 數據來源:2011年3月至2017年1月發表的Cochrane系統評價及其納入的原始研究。④ 研究選擇:納入具有3個或更多RCT的二分類結局的Meta分析。⑤ 數據提取:試驗特征由原作者提取。由一名研究者評價論文發表狀態和語言,另一名研究者進行評價。⑥ 數據合成和結果:在698個Meta分析納入的5 659個RCT中,5 303個(93.7%)為已發表的期刊論文,356個(6.3%)未發表。在已發表期刊論文中,92.6%(4 910/5 303)用英語發表,7.4%(393/5 303)用其他語言發表。發表試驗比未發表試驗的效應更大,比值比率(ratio of odds ratios,ROR)為0.90[95%CI(0.82,0.98),I2=19.3%,τ2=0.049 2]。非英語發表試驗的效應大于英語發表試驗,147個Meta分析的匯總ROR為0.86[95%CI(0.78,0.95),I2=0%,τ2=0.000 0]。⑦ 局限性:研究結果依賴于原始研究的質量。⑧ 結論:在Meta分析中,已發表試驗比未發表試驗的效應更大,而在已發表試驗中,非英語發表試驗比英語發表試驗的效應更大。
2.2.3 解讀
大多數期刊對結構式摘要有明確要求,如最常見的四段式結構式摘要要求報告“目的、方法、結果、結論”。在撰寫摘要時,建議在符合期刊要求的基礎上盡可能將研究背景、目的、數據來源、數據選擇方法、評價及合并方法、結果、局限性、結論和研究意義的相關內容包括在摘要中。
2.3 理論基礎
2.3.1 報告內容
描述與該Meta流行病學研究相關的背景和理論依據。
2.3.2 舉例
示例[9](有節選):在美國,慢性疾病是導致死亡和殘疾的主要原因,其在成年人中的患病率超過40%,醫護人員需使用高質量的證據以有效治療慢性疾病。RCT常被視為評價干預有效性的“金標準”。當其采用某種設計特征(如分配隱藏、盲法等)時可降低偏倚風險以產生高質量證據,相反,若未采用這些設計特征的研究可能存在偏倚從而夸大療效。但是,針對這些設計特征展開的實證研究結果通常是互相矛盾的。
2.3.3 解讀
示例中研究目的是分析慢性疾病研究的設計特征與療效的關聯,因此在前言部分闡述美國慢性病患病現狀與研究設計特征和療效間的理論關系是必要的,這利于讀者更充分理解該研究的重要性與意義。
2.4 目的
2.4.1 報告內容
描述Meta流行病學研究的目的和待檢驗的假設。
2.4.2 舉例
示例[10]:由于許多常規收集數據的研究作者都是在已有試驗證據的背景下進行數據收集,因此可能有意或無意受到試驗已有結果的影響。為此,我們旨在通過Meta流行病學研究,探究常規收集數據研究和RCT結果間的一致性。
2.4.3 解讀
在Meta流行病學研究中,前言部分必須明確報告研究目的和研究假設。系統評價一般不要求必須報告研究假設,而Meta流行病學研究更注重研究假設的報告。如示例中假設定期數據收集研究的作者可能有意識或無意識地受到已有結果影響,因此研究目的則是通過Meta流行病學研究,探究定期數據收集研究和RCT結果之間的一致性。
2.5 計劃書
2.5.1 報告內容
描述計劃書是否存在,若存在則需說明獲取途徑。目前計劃書的注冊是非強制的。
2.5.2 舉例
示例[11]:本Meta流行病學研究是基于前瞻性注冊方案(編號:CRD42020222287)。
2.5.3 解讀
公開計劃書有助于提高研究透明度、減少發表偏倚。自2013年起,PROSPERO平臺開始注冊Meta流行病學研究。但目前醫學期刊尚未對Meta流行病學研究的注冊提出強制要求,因此報告規范中強調需報告計劃書是否存在。此外,計劃書的獲取途徑可以是注冊號、網址或附件。
2.6 納入標準
2.6.1 報告內容
詳細描述符合納入標準的研究特征和理論依據。
2.6.2 舉例
示例[9]:合格的Meta分析必須滿足以下標準:① 來自系統評價;② 2007年1月1日至2019年6月10日之間發表;③ 符合美國國立衛生研究院(National Institutes of Health,NIH)定義的慢性疾病(持續一年或更長時間、需要持續醫療護理并影響日常活動的疾病);④ 比較不同的干預藥物、程序或器械;⑤ 報告二分類結局指標;⑥ 納入至少5個RCT。我們排除了診斷和預后Meta分析、觀察性研究的Meta分析及評價行為干預的Meta分析。當多個Meta分析符合上述條件時,我們對每個系統評價僅納入一個Meta分析,并選擇報告了對患者預后最重要的結局指標(如死亡率、疼痛緩解、心力衰竭)的Meta分析。當報告了多個符合條件的結局指標時,我們選擇納入RCT數量最多的。
2.6.3 解讀
研究中有許多因素會影響研究結果的真實性,導致結果出現偏倚。制訂科學合理的納入標準可獲得更加符合研究目的的單一群體,有效控制研究中的偏倚,使研究結果更接近真實情況。在Meta流行病學研究中,納入研究間一般存在較大差異,對納入標準的詳細報告有利于讀者了解研究的代表性和外推性。在制訂納入標準時,可從多個方面考慮,如研究設計類型、研究干預/暴露、對照、結局指標類型、研究數量、研究領域、發表時間[12]等。
2.7 信息來源
2.7.1 報告內容
描述所有信息來源(如檢索的數據庫及其收錄日期,與專家聯系獲取其他文獻,檢索互聯網)和檢索日期。
2.7.2 舉例
示例[13]:2016年6月11日檢索PubMed,以獲取相關的系統評價和Meta分析。檢索日期從2015年1月1日到2015年12月31日。
2.7.3 解讀
信息來源需全面報告,特別是檢索及收錄日期應具體到年月日以確保檢索的可重復性。例文中報告了具體檢索的數據庫名稱(PubMed)、檢索日期(2016年6月11日)及收錄日期(從2015年1月1日到2015年12月31日),但未提及是否采用了其他途徑獲取信息。
2.8 檢索
2.8.1 報告內容
至少提供一個數據庫的完整檢索策略,包括所有設定限制,以利于重復檢索。在Meta流行病學研究中,檢索策略的制訂一般不是基于臨床問題。
2.8.2 舉例
示例[13]:2016年6月11日檢索PubMed,以確定相關的系統評價和Meta分析。檢索策略為“(隨機[標題/摘要]或隨機[標題/摘要]或RCT[標題/摘要])和(Meta分析[ptyp]或系統[sb])”。檢索策略由一位研究者(LG)制訂,并獲得兩位有資歷的研究者支持(JHT和KHY),三位研究者都有超過10年的檢索經驗。
2.8.3 解讀
檢索策略必須足夠完整以保證檢索的可重復性。當檢索多個數據庫時,至少應報告一個數據庫的完整檢索策略,受限于篇幅時可以附件形式呈現。例文中提供了PubMed數據庫的完整報告策略,并且報告了檢索策略制訂者的專業性,利于增加讀者對檢索策略的信心。
2.9 文獻篩選
2.9.1 報告內容
描述文獻篩選的過程,如多少人參與了篩選、是否獨立篩選。
2.9.2 舉例
示例[9]:兩位研究者獨立篩選系統評價的標題和摘要,然后采用預先制訂的納入與排除標準閱讀全文進行篩選,若有分歧由第三位研究者解決。
2.9.3 解讀
例文中描述了由兩位研究者進行獨立文獻篩選,兩位研究者的篩選結果可能不一致,此時應報告解決不一致的方法。
2.10 數據提取
2.10.1 報告內容
描述從文獻中提取數據的方法(如是否預提取、獨立提取、雙重提取)及處理數據或向原作者獲取數據的過程。
2.10.2 舉例
示例[4]:我們制定了一個數據提取表格,由兩名研究者(RSB、AD)在完成5篇系統評價預提取后進行正式的數據提取,其中由一位研究者(RSB)提取所有數據,另一名研究者(JS)獨立隨機抽取一半文獻進行提取。任何分歧都由資深研究者(AD)協調解決,若存在主要分歧(僅在5種情況下發生)則由兩位研究者來檢查所有系統評價的數據。
2.10.3 解讀
Meta流行病學研究可能涉及同時多個層面的數據提取,如需同時收集系統評價的數據和系統評價中原始研究的數據。因此,Meta流行病學研究的數據提取往往比系統評價更為復雜,應詳細描述以便保證過程的復現性[5]。當多個研究者獨立提取數據時,可能存在不一致,應報告解決方法。
2.11 資料條目
2.11.1 報告內容
列出所有需提取數據的名稱、定義及相關假設和推斷。
2.11.2 舉例
示例[14](有節選):手動從試驗全文中提取試驗基本特征和盲法狀態的信息。通過Archie數據庫接口,從Cochrane系統評價數據庫中自動提取試驗結果:干預組和對照組的患者數量,二分類指標的事件數及連續性指標的平均值和標準差。我們還自動提取了Cochrane系統評價小組的名稱,及系統評價作者對“分配隱藏”和“不完整的結果數據”領域的偏倚風險評價結果。我們將盲法定義為在整個試驗過程中患者、醫護人員、結果評估者不清楚每個患者具體接受何種干預的情況。除非另有明確說明,對于使用安慰劑對照并被描述為“雙盲”或“三盲”的藥物試驗,患者、醫護人員、結果評估者都被歸類為被盲(可能是);對于沒有提到“安慰劑”、“雙假人”、“雙盲”、“三盲”、“單盲”或類似詞語的試驗,都被歸類為非盲(可能沒有)。
2.11.3 解讀
報告提取數據的條目時應當全面、具體。Meta流行病學研究所需提取數據一般可包含研究的基本特征(如作者信息、題目、發表時間、發表期刊、語言)、潛在偏倚特征、結果數據、納入研究數量、樣本量等。而對于潛在偏倚特征,如上例中的盲法,應報告其定義及判斷標準等。
2.12 單個研究存在的偏倚
2.12.1 報告內容
如果單個研究的偏倚風險評價與Meta流行病學分析相關,需描述使用的偏倚風險條目及該信息在數據合并時的使用情況。
2.12.2 舉例
示例[9](有節選):具有統計學意義的ROR>1.0表明在偏倚風險高或不明確的試驗中(與低風險的試驗相比)效應更大(可能被夸大)。未調整的模型分別包括11個研究設計特征,包括隨機序列生成(高風險/不清楚vs.低風險)、分配隱藏、對受試者和研究人員施盲、對結局評價者施盲、結果數據不完整等。我們通過排除對某一研究設計特征評為“不清楚”的試驗進行敏感性分析。
2.12.3 解讀
偏倚風險評價是系統評價的一個關鍵環節。但對于Meta流行病學研究,并未強制要求進行偏倚風險評價,因此僅當數據分析需要用到偏倚風險條目評價結果時,才需報告相關信息。例文中闡述了偏倚風險條目與研究結果具有相關性,并詳細報告了所需用到的5個偏倚風險條目及通過排除這些條目評為不清楚的試驗來進行敏感性分析。
2.13 合并效應指標
2.13.1 報告內容
描述主要的合并效應指標,并向讀者解釋其意義和方向。
2.13.2 舉例
示例[9]:模型的回歸系數為ROR。對結局事件的方向進行標準化,因此事件表現為有利于患者的結果(即將死亡轉化為生存)。因此,ROR>1.0且有統計學意義表明在具有較高或不清楚偏倚風險的試驗中(與低風險試驗相比)效應更大(可能被夸大)。ROR<1且有統計學意義表明效應降低。ROR若無統計學意義表明偏倚方向不可預測或檢驗效能不足。
2.13.3 解讀
由于Meta流行病學研究中的效應指標在其他研究中使用較少,讀者可能因不熟悉而不能理解這些指標的意義,因此應詳細報告[5]。例文中報告采用的效應指標為ROR,并闡述了在不同方向(>1或<1)時的意義(夸大或降低)。需要注意的是,在闡述不同方向意義時還應報告結局指標是處于有利還是不利的情況。
2.14 結果合并
2.14.1 報告內容
a.描述結果合并的統計分析或描述分析方法及異質性檢驗;b.若適用,描述統計或模擬模型的建立過程;c.描述如何證明假設合理及獲取相應的結果估計值;d.描述其他分析的方法(如敏感性分析、亞組分析或Meta回歸),若采用這些方法需說明是事前還是事后分析。
2.14.2 舉例(有節選)
a.示例[8]:描述性分析包括定性變量的頻率和百分比,定量變量的中位數和四分位數間距。我們采用了二步法,也被稱為Meta-Meta分析方法。使用I2統計量和Meta分析間方差τ2評估Meta分析的異質性。我們使用Stata/SE版本11.0(StataCorp)進行統計分析。P<0.05被認為差異具有統計學意義。b.示例[15]:此外,還對每個場景進行了3 000次迭代的事后模擬,以重復(敏感性)分析并通過納入和排除零事件研究來比較其偏倚百分比、均方誤差(mean squared error,MSE)和覆蓋率。采用偏倚百分比的中位數和MSE進行比較。我們參考Jackson等將對照組發病率設為0.01,Meta分析研究數設為10個。基于前面的經驗數據,我們模擬了試驗組和對照組的對數正態分布樣本量。對于真正的比值比(odds ratio,OR),我們考慮了5個從1到5的等距值。研究間方差被設置為0.2、0.4、0.6、0.8和1.0,代表異質性由小到大。c.示例[8]:我們采用了二步法,也被稱為Meta-Meta分析方法。在第一步中,我們使用隨機效應Meta回歸模型估計每個Meta分析的ROR及RCT間的異質性。然后,我們使用隨機效應Meta分析模型估計Meta分析中的匯總ROR及其95%CI,以解釋Meta分析之間的異質性。d.示例[8]:我們進行了敏感性分析,以考慮偏倚風險和樣本量影響。我們做了3個探索性的事后分析,以更好地理解語言偏倚的結果及其潛在影響。
2.14.3 解讀
由于Meta流行病學統計方法的復雜性及多樣性,尤其是在經典二步法中可能涉及不同統計模型的選擇,因此對于統計方法及模型的建立過程應詳細描述以便于讀者閱讀理解。對于模型的建立過程,應詳細報告抽樣分布(上例中的正態分布)及參數設定(上例中將對照組發病率、Meta分析研究數等)。事后分析即為在研究完成后所進行的分析,包括對于數據的檢查或分析等處理[16],而與之相對的即為事前分析。由于事后分析的結果及處理并非是預先指定而是在獲取研究數據之后,因此存在主觀偏倚的可能,如為獲取更小的P值而開展分析,所以事后分析的可信性往往不如事前分析。
2.15 文獻篩選
2.15.1 報告內容
研究者應報告符合納入標準和最終納入研究的文獻數量,并標注各階段文獻排除的原因,且最好提供研究納入排除過程的流程圖。由于往往是多個研究員背靠背進行篩選,因此可通過計算Kappa值等方式描述文獻篩選者的內部一致性。
2.15.2 舉例
示例[17]:對于以RCT為研究對象的系統評價,研究初步檢索得到相關文獻333篇,初篩后排除268篇,剩下65篇閱讀全文進行復篩,最終納入了25個研究。作者繪制了研究納入排除的流程圖(見原文補充圖1),并在原文補充表4中列出了各環節剔除文獻的原因。
2.15.3 解釋
上例分別報告了檢索、初篩、復篩和最終納入各階段的文獻數量,并列表說明了各階段剔除文獻的原因,但未報告Kappa值。建議分別報告檢索數據庫獲得的文獻數量和通過參考文獻等方式追溯的文獻數量,最后除納入文獻數量外還可報告納入患者數量等其他信息[5]。以流程圖的形式呈現文獻篩選過程,可更加直觀清晰。
2.16 研究特征
2.16.1 報告內容
報告各個研究的基本特征數據并附上參考文獻。基本特征數據不一定包括臨床特征。
2.16.2 舉例
示例[9]:檢索了符合納入條件的Meta分析中所含的RCT,從原文中提取了這些RCT的研究特征,包括作者姓名、發表時間、研究設計特征(隨機序列生成、分配隱藏、對受試者和研究人員施盲、對結局評價者施盲、結果數據不完整、研究地點數量、患者人數、試驗是否早停、資金來源、干預類型和結局指標類型,詳見原文表1)、及報告的療效結果。
2.16.3 解釋
Meta分析關注的納入研究特征一般參照PICOS(participant,intervention,control,outcome,study design)原則。而Meta流行病學研究關注的特征隨研究目的而不同,例如在證實分配隱藏不充分將導致效應量被高估的Meta流行病學研究中,并不需要描述各個試驗中的患者特征、共病情況等內容[5]。
2.17 研究內的偏倚風險
2.17.1 報告內容
若偏倚風險評價被用于Meta流行病學分析中,則需報告每個研究的偏倚風險評價結果,以便讓結果具有可重復性。
2.17.2 舉例
示例[17]:使用Cochrane偏倚風險評估工具對RCT的偏倚風險進行評價,包括是否生成隨機序列、分配隱藏等條目,補充表10展示了納入RCT的偏倚風險,并報告了每個領域低偏倚風險研究的數量。
2.17.3 解釋
Meta流行病學研究中,當偏倚風險條目作為研究特征、多因素分析的協變量,或用于敏感性分析時[17-19],數據分析通常需要用到偏倚風險評價結果,此時應報告每個研究的偏倚風險評價結果。
2.18 單個研究結果
2.18.1 報告內容
報告每個研究用于Meta流行病學分析中的結果數據,該數據不一定包括臨床結果。
2.18.2 舉例
示例[20]:原文表3展示了每個原始研究的結果,包括研究人群、干預措施、結局指標、試驗的風險比(risk ratio,RR)、絕對危險差(absolute risk difference,ARD)及其95%CI。
2.18.3 解釋
根據不同研究目的,Meta流行病學研究中需要報告的結果數據略有不同。應注意的是,此處更強調報告原始研究層面的結果數據,如每個原始研究的效應指標[RR、OR、危險比(hazard ratio,HR)、均數差(mean difference,MD)、ARD]、效應量及其95%CI。
2.19 結果合并
2.19.1 報告內容
報告目前進行的統計分析結果,包括結果精確性和異質性等。若適用,還需進行假設的合理性證明,描述統計/模擬模型的擬合結果。
2.19.2 舉例
a.示例[19]:原文表2報告了統計分析結果,包括所有偏倚條目對應的樣本量、單/多中心、資助來源、效應量及其95%CI、τ2、P值等。b.示例[15]:為進一步檢驗結果的穩健性,探究在Meta分析中排除雙臂零事件研究是否會影響結論,作者進行了事后模擬研究。原文圖5展示了零事件研究對OR值和P值的影響。排除零事件的研究后,0%~5.78%的Meta分析的OR值發生方向改變,0.80%~6.15%的Meta分析的P值發生方向改變。
2.19.3 解釋
Meta流行病學研究中常見的結果指標有ROR、風險比率(ratio of risk ratio,RRR)、標準化均數差的差值(differences in standardized mean differences,dSMD)。報告置信區間可反映結果精確性,報告τ2可反映結果異質性。
2.20 其他分析
2.20.1 報告內容
若進行了敏感性分析、亞組分析等其他分析,還需對這些分析結果進行報告。
2.20.2 舉例
a.示例[9]:敏感性分析時,進行了去重、剔除特定試驗特征評估結果為“不清楚”的試驗、剔除具有陽性對照組的試驗,并在原文表3報告了敏感性分析結果。結果顯示,對受試者和研究人員施盲與效應無相關性。b.示例[17]:根據結果與PI/ECO(population,intervention or exposure,comparator,outcome)相似程度等分類方法進行了亞組分析。結果顯示,PI/ECO匹配對相似但不相同的隊列研究,與RCT的結果略有不同,RRR為1.05[95%CI(1.00,1.10),I2=61%,τ2=0.016],95%CI為(0.81,1.36);相似的兩組上存在較大的差異,RRR為1.20[95%CI(1.10,1.30),I2=62%,τ2=0.020],95%CI為(0.88,1.63)。
2.20.3 解釋
敏感性分析能夠反映結果的穩健性。如上述示例a中,對受試者和研究人員施盲與效應的相關性在主分析中具有統計學意義,但進行敏感性分析后,統計結果卻發生了方向變化,提示了研究結果不穩定。研究進行異質性檢驗后,若發現異質性較大,需進一步進行亞組分析,探索可能導致異質性的因素。
2.21 證據總結
2.21.1 報告內容
總結本研究的主要發現,并將其和現有相似研究的結論進行比較和分析。證據質量可能與Meta流行病學研究無關,但研究者應描述對結果的確定性。
2.21.2 舉例
示例[17]:該研究探索了從RCT和隊列研究中得出的飲食-疾病關聯估計在多大程度上是一致的。共確定了97對飲食-疾病對,其中83對能進行Meta分析,總體來看證據合并結果的差異很小,但考慮到隊列研究的可信區間過寬及部分研究間統計異質性大,尚不能排除個體研究中的重要差異或潛在偏倚。該結論與其他營養、醫學領域的相關研究結論一致,且該研究在其他研究基礎上進一步匹配了PI/ECO、計算了95%CI,并對各種類型的干預和結果進行區分,因此作者對結果有較大把握。
2.21.3 解釋
在討論的第一部分,應報告研究得到的主要結論及證據質量。此外,研究者報告結果的確定性時,可從研究效應量大小、精確性、異質性、穩定性及和同類研究結果進行比較等方面來考慮,并在討論部分加以描述。
2.22 局限性
2.22.1 報告內容
要對研究的局限性進行討論,例如發表偏倚或報告偏倚的可能性。
2.22.2 舉例
示例[7]:本研究存在一些局限性。首先,回歸方法被認為統計效能低下,且不適用于研究異質性大、研究無陽性結果或所有研究樣本量相似的情況,因此我們按照指南對研究進行評估,僅納入了異質性低(I2<50%)的Meta分析,但這一行為可能會引入選擇性偏倚。其次,由于大多數研究的研究對象數量小于10個,在98 966個Meta分析中我們最終僅納入了5 534個研究(5.6%),這樣的選擇也極可能引入選擇性偏倚。
2.22.3 解釋
作者應充分報告研究存在的局限性,以便讀者進行批判性思考,也可為未來研究提出改善研究有效性方法提供參考。Meta流行病學研究本身屬于觀察性研究,更容易出現偏倚和混雜[21],如上例中從可能引入選擇性偏倚角度考慮了該研究存在的局限性。
2.23 結論
2.23.1 報告內容
應該對研究結果進行解釋,并提出對未來研究的啟示及對臨床實踐的可能影響。
2.23.2 舉例
示例[9]:本研究結果提示,Meta分析結果的偏倚方向在很大程度上是不可預測的,因此,對于試驗開展者,我們建議采取措施以減少偏倚風險,并在可行的情況下盡可能堅持使用盲法和分配隱藏。對于研究人員,我們建議即使患者停止接受研究干預,仍要追蹤其結局以降低失訪偏倚風險。偏倚方向的不可預測性強調了必須堅持這些基本的流行病學原則。
2.23.3 解釋
結論部分應該對結果進行合理推斷。盡管Meta流行病學研究更可能間接而不是直接影響臨床實踐,仍應盡可能報告研究結果可能帶來的影響。
2.24 資助
2.24.1 報告內容
要寫明研究的資金來源,及資助者在研究中的角色和發揮的作用。
2.24.2 舉例
示例[7]:本研究得到了聯邦基金的支持,雖然該基金會是紐約的一個私人獨立基金會,但研究者申明論文觀點是研究者觀點而非聯邦基金或其董事、理事等的觀點,資助者對研究設計和實施沒有任何作用。
2.24.3 解釋
上例報告了研究基金來源,并直接表明資助者未參與研究過程。不同資金來源會影響讀者對研究結果的信任度,特別是對于來自廠家的資助,更應詳細介紹資助者對研究的影響情況,以增加研究的透明性。
3 討論
全球的臨床研究方法學家們為提高各類研究的報告質量,開發出了針對不同領域或研究類型的報告規范。隨著Meta流行病學的發展及研究數量的增加[22],對Meta流行病學研究報告透明性和規范性的需求愈加迫切。
Meta流行病學研究報告規范基于PRISMA制訂,兩者在條目設置上存在相似性,但在具體內容上存在很大不同[5,23-25]:① 標題:要求報告類型為Meta流行病學研究;② 前言:要求研究者報告假設檢驗;③ 計劃書:并未強制要求注冊,而PRISMA要求注冊或有計劃書;④ 文獻篩選:增加了對于描述評價文獻篩選者內部一致性的方法的報告要求;⑤ 偏倚風險:強調僅當偏倚風險與Meta流行病學研究中數據分析相關時,才需描述其使用的偏倚風險條目情況及結果,而非一定要進行偏倚風險評價;⑥ 合并效應指標:Meta流行病學研究涉及指標更復雜,強調應向讀者解釋指標方向及意義;⑦ 結果合并:對于分析性Meta流行病學研究,強調要闡明研究假設的合理性、統計/模擬模型的建立過程和擬合結果,還應報告是事前或事后分析[26]。其與PRISMA的部分區別見表2。

Meta流行病學報告規范仍存在一定局限性:① 報告規范本身制訂過程的科學性難以判斷,且未詳細報告制訂方法及過程,一方面不清楚報告規范的制訂是否采用了德爾菲法或專家共識法等,另一方面不清楚制訂各個階段的詳細信息,如制訂報告前的前期工作及對草案的設定過程和修訂的次數過程等;② 使用率仍不高,2017年發表以后的Meta流行病學研究仍有較高比例采用PRISMA進行報告[2,4];③ 缺乏闡釋性文件和示例,僅在報告規范正文中具有少量內容解讀,但缺乏由作者團隊對每個條目進行詳細闡述及舉例解讀的文件;④ 缺乏配套的相關報告規范,例如PRISMA具有配套的PRISMA摘要條目清單(PRISMA 2020 for Abstracts checklist)。
隨著系統評價/Meta分析研究數量快速增長,其對臨床實踐、衛生決策的重要性日益增加,但其研究結果受限于研究質量(特別是納入RCT的偏倚風險),當研究質量低時可能導致無效甚至有害的干預進入臨床大量應用。科學的Meta流行病學研究證據可促使RCT更加全方位地控制相關偏倚因素,這就必然要求Meta流行病學研究本身的結果需要具有透明性且受到認可。因此,盡管國內的Meta流行病學研究還處于起步階段,但仍應從源頭把關,提高Meta流行病學研究的報告質量,產生更受認可的Meta流行病學研究證據。
Meta流行病學是指定量分析研究中的潛在偏倚特征對干預療效估計影響的一種研究,是識別與量化潛在偏倚特征影響的重要工具,可為未來控制研究偏倚提供實證證據[1]。Meta流行病學的研究對象多為系統評價/Meta分析,近年來系統評價/Meta分析數量的快速增長為開展Meta流行病學研究提供了基礎,同時促使了Meta流行病學研究數量的快速增長。
由于Meta流行病學研究與系統評價/Meta分析在研究步驟方面具有一定的相似性,因此過去一些Meta流行病學研究論文采用了系統評價/Meta分析報告規范(preferred reporting items for systematic reviews and meta-analysis,PRISMA)進行報告[2-4]。但實際上Meta流行病學研究存在許多特殊性,僅按照PRISMA進行報告可能會忽略掉重要信息。另外,過去多數的Meta流行病學研究未遵循任何報告規范,存在報告格式不統一、報告內容缺乏完整性及充分性、甚至未報告關鍵信息等問題[3],影響了Meta流行病學研究結果的認可度。
因此,2017年Murad等[5]基于PRISMA制訂了Meta流行病學研究報告規范(guidelines for reporting meta-epidemiological methodology research),該報告規范已被EQUATOR(enhancing the quality and transparency of health research)協作網收錄[6]。本文旨在對Meta流行病學報告規范的重點內容結合實例進行解讀,以促進該報告規范的使用,進而提高Meta流行病學研究的報告質量和透明度。
1 Meta流行病學報告規范清單介紹
Meta流行病學報告規范清單分為標題、摘要、前言、方法、結果、討論和資助7個部分,共包含24個條目(表1)。

2 條目解讀
2.1 標題
2.1.1 報告內容
明確報告該研究為Meta流行病學研究。
2.1.2 舉例
示例[7]:評價不同醫學學科的療效和發表偏倚:一個Meta流行病學研究(assessing treatment effects and publication bias across different specialties in medicine: a meta-epidemiological study)。
2.1.3 解釋
在標題中必須說明該研究為Meta流行病學研究,便于檢索及快速識別該研究的設計類型[5]。
2.2 結構式摘要
2.2.1 報告內容
概括研究背景、目的、數據來源、數據選擇方法、評價及合并方法、結果、局限性、結論和研究意義。
2.2.2 舉例
示例[8]:① 背景:未發表試驗及非英語發表試驗對Meta分析結果的影響不清。② 目的:采用Meta流行病學方法分別比較已發表和未發表的隨機對照試驗(randomized controlled trial,RCT)及英語和非英語發表的試驗間的療效。③ 數據來源:2011年3月至2017年1月發表的Cochrane系統評價及其納入的原始研究。④ 研究選擇:納入具有3個或更多RCT的二分類結局的Meta分析。⑤ 數據提取:試驗特征由原作者提取。由一名研究者評價論文發表狀態和語言,另一名研究者進行評價。⑥ 數據合成和結果:在698個Meta分析納入的5 659個RCT中,5 303個(93.7%)為已發表的期刊論文,356個(6.3%)未發表。在已發表期刊論文中,92.6%(4 910/5 303)用英語發表,7.4%(393/5 303)用其他語言發表。發表試驗比未發表試驗的效應更大,比值比率(ratio of odds ratios,ROR)為0.90[95%CI(0.82,0.98),I2=19.3%,τ2=0.049 2]。非英語發表試驗的效應大于英語發表試驗,147個Meta分析的匯總ROR為0.86[95%CI(0.78,0.95),I2=0%,τ2=0.000 0]。⑦ 局限性:研究結果依賴于原始研究的質量。⑧ 結論:在Meta分析中,已發表試驗比未發表試驗的效應更大,而在已發表試驗中,非英語發表試驗比英語發表試驗的效應更大。
2.2.3 解讀
大多數期刊對結構式摘要有明確要求,如最常見的四段式結構式摘要要求報告“目的、方法、結果、結論”。在撰寫摘要時,建議在符合期刊要求的基礎上盡可能將研究背景、目的、數據來源、數據選擇方法、評價及合并方法、結果、局限性、結論和研究意義的相關內容包括在摘要中。
2.3 理論基礎
2.3.1 報告內容
描述與該Meta流行病學研究相關的背景和理論依據。
2.3.2 舉例
示例[9](有節選):在美國,慢性疾病是導致死亡和殘疾的主要原因,其在成年人中的患病率超過40%,醫護人員需使用高質量的證據以有效治療慢性疾病。RCT常被視為評價干預有效性的“金標準”。當其采用某種設計特征(如分配隱藏、盲法等)時可降低偏倚風險以產生高質量證據,相反,若未采用這些設計特征的研究可能存在偏倚從而夸大療效。但是,針對這些設計特征展開的實證研究結果通常是互相矛盾的。
2.3.3 解讀
示例中研究目的是分析慢性疾病研究的設計特征與療效的關聯,因此在前言部分闡述美國慢性病患病現狀與研究設計特征和療效間的理論關系是必要的,這利于讀者更充分理解該研究的重要性與意義。
2.4 目的
2.4.1 報告內容
描述Meta流行病學研究的目的和待檢驗的假設。
2.4.2 舉例
示例[10]:由于許多常規收集數據的研究作者都是在已有試驗證據的背景下進行數據收集,因此可能有意或無意受到試驗已有結果的影響。為此,我們旨在通過Meta流行病學研究,探究常規收集數據研究和RCT結果間的一致性。
2.4.3 解讀
在Meta流行病學研究中,前言部分必須明確報告研究目的和研究假設。系統評價一般不要求必須報告研究假設,而Meta流行病學研究更注重研究假設的報告。如示例中假設定期數據收集研究的作者可能有意識或無意識地受到已有結果影響,因此研究目的則是通過Meta流行病學研究,探究定期數據收集研究和RCT結果之間的一致性。
2.5 計劃書
2.5.1 報告內容
描述計劃書是否存在,若存在則需說明獲取途徑。目前計劃書的注冊是非強制的。
2.5.2 舉例
示例[11]:本Meta流行病學研究是基于前瞻性注冊方案(編號:CRD42020222287)。
2.5.3 解讀
公開計劃書有助于提高研究透明度、減少發表偏倚。自2013年起,PROSPERO平臺開始注冊Meta流行病學研究。但目前醫學期刊尚未對Meta流行病學研究的注冊提出強制要求,因此報告規范中強調需報告計劃書是否存在。此外,計劃書的獲取途徑可以是注冊號、網址或附件。
2.6 納入標準
2.6.1 報告內容
詳細描述符合納入標準的研究特征和理論依據。
2.6.2 舉例
示例[9]:合格的Meta分析必須滿足以下標準:① 來自系統評價;② 2007年1月1日至2019年6月10日之間發表;③ 符合美國國立衛生研究院(National Institutes of Health,NIH)定義的慢性疾病(持續一年或更長時間、需要持續醫療護理并影響日常活動的疾病);④ 比較不同的干預藥物、程序或器械;⑤ 報告二分類結局指標;⑥ 納入至少5個RCT。我們排除了診斷和預后Meta分析、觀察性研究的Meta分析及評價行為干預的Meta分析。當多個Meta分析符合上述條件時,我們對每個系統評價僅納入一個Meta分析,并選擇報告了對患者預后最重要的結局指標(如死亡率、疼痛緩解、心力衰竭)的Meta分析。當報告了多個符合條件的結局指標時,我們選擇納入RCT數量最多的。
2.6.3 解讀
研究中有許多因素會影響研究結果的真實性,導致結果出現偏倚。制訂科學合理的納入標準可獲得更加符合研究目的的單一群體,有效控制研究中的偏倚,使研究結果更接近真實情況。在Meta流行病學研究中,納入研究間一般存在較大差異,對納入標準的詳細報告有利于讀者了解研究的代表性和外推性。在制訂納入標準時,可從多個方面考慮,如研究設計類型、研究干預/暴露、對照、結局指標類型、研究數量、研究領域、發表時間[12]等。
2.7 信息來源
2.7.1 報告內容
描述所有信息來源(如檢索的數據庫及其收錄日期,與專家聯系獲取其他文獻,檢索互聯網)和檢索日期。
2.7.2 舉例
示例[13]:2016年6月11日檢索PubMed,以獲取相關的系統評價和Meta分析。檢索日期從2015年1月1日到2015年12月31日。
2.7.3 解讀
信息來源需全面報告,特別是檢索及收錄日期應具體到年月日以確保檢索的可重復性。例文中報告了具體檢索的數據庫名稱(PubMed)、檢索日期(2016年6月11日)及收錄日期(從2015年1月1日到2015年12月31日),但未提及是否采用了其他途徑獲取信息。
2.8 檢索
2.8.1 報告內容
至少提供一個數據庫的完整檢索策略,包括所有設定限制,以利于重復檢索。在Meta流行病學研究中,檢索策略的制訂一般不是基于臨床問題。
2.8.2 舉例
示例[13]:2016年6月11日檢索PubMed,以確定相關的系統評價和Meta分析。檢索策略為“(隨機[標題/摘要]或隨機[標題/摘要]或RCT[標題/摘要])和(Meta分析[ptyp]或系統[sb])”。檢索策略由一位研究者(LG)制訂,并獲得兩位有資歷的研究者支持(JHT和KHY),三位研究者都有超過10年的檢索經驗。
2.8.3 解讀
檢索策略必須足夠完整以保證檢索的可重復性。當檢索多個數據庫時,至少應報告一個數據庫的完整檢索策略,受限于篇幅時可以附件形式呈現。例文中提供了PubMed數據庫的完整報告策略,并且報告了檢索策略制訂者的專業性,利于增加讀者對檢索策略的信心。
2.9 文獻篩選
2.9.1 報告內容
描述文獻篩選的過程,如多少人參與了篩選、是否獨立篩選。
2.9.2 舉例
示例[9]:兩位研究者獨立篩選系統評價的標題和摘要,然后采用預先制訂的納入與排除標準閱讀全文進行篩選,若有分歧由第三位研究者解決。
2.9.3 解讀
例文中描述了由兩位研究者進行獨立文獻篩選,兩位研究者的篩選結果可能不一致,此時應報告解決不一致的方法。
2.10 數據提取
2.10.1 報告內容
描述從文獻中提取數據的方法(如是否預提取、獨立提取、雙重提取)及處理數據或向原作者獲取數據的過程。
2.10.2 舉例
示例[4]:我們制定了一個數據提取表格,由兩名研究者(RSB、AD)在完成5篇系統評價預提取后進行正式的數據提取,其中由一位研究者(RSB)提取所有數據,另一名研究者(JS)獨立隨機抽取一半文獻進行提取。任何分歧都由資深研究者(AD)協調解決,若存在主要分歧(僅在5種情況下發生)則由兩位研究者來檢查所有系統評價的數據。
2.10.3 解讀
Meta流行病學研究可能涉及同時多個層面的數據提取,如需同時收集系統評價的數據和系統評價中原始研究的數據。因此,Meta流行病學研究的數據提取往往比系統評價更為復雜,應詳細描述以便保證過程的復現性[5]。當多個研究者獨立提取數據時,可能存在不一致,應報告解決方法。
2.11 資料條目
2.11.1 報告內容
列出所有需提取數據的名稱、定義及相關假設和推斷。
2.11.2 舉例
示例[14](有節選):手動從試驗全文中提取試驗基本特征和盲法狀態的信息。通過Archie數據庫接口,從Cochrane系統評價數據庫中自動提取試驗結果:干預組和對照組的患者數量,二分類指標的事件數及連續性指標的平均值和標準差。我們還自動提取了Cochrane系統評價小組的名稱,及系統評價作者對“分配隱藏”和“不完整的結果數據”領域的偏倚風險評價結果。我們將盲法定義為在整個試驗過程中患者、醫護人員、結果評估者不清楚每個患者具體接受何種干預的情況。除非另有明確說明,對于使用安慰劑對照并被描述為“雙盲”或“三盲”的藥物試驗,患者、醫護人員、結果評估者都被歸類為被盲(可能是);對于沒有提到“安慰劑”、“雙假人”、“雙盲”、“三盲”、“單盲”或類似詞語的試驗,都被歸類為非盲(可能沒有)。
2.11.3 解讀
報告提取數據的條目時應當全面、具體。Meta流行病學研究所需提取數據一般可包含研究的基本特征(如作者信息、題目、發表時間、發表期刊、語言)、潛在偏倚特征、結果數據、納入研究數量、樣本量等。而對于潛在偏倚特征,如上例中的盲法,應報告其定義及判斷標準等。
2.12 單個研究存在的偏倚
2.12.1 報告內容
如果單個研究的偏倚風險評價與Meta流行病學分析相關,需描述使用的偏倚風險條目及該信息在數據合并時的使用情況。
2.12.2 舉例
示例[9](有節選):具有統計學意義的ROR>1.0表明在偏倚風險高或不明確的試驗中(與低風險的試驗相比)效應更大(可能被夸大)。未調整的模型分別包括11個研究設計特征,包括隨機序列生成(高風險/不清楚vs.低風險)、分配隱藏、對受試者和研究人員施盲、對結局評價者施盲、結果數據不完整等。我們通過排除對某一研究設計特征評為“不清楚”的試驗進行敏感性分析。
2.12.3 解讀
偏倚風險評價是系統評價的一個關鍵環節。但對于Meta流行病學研究,并未強制要求進行偏倚風險評價,因此僅當數據分析需要用到偏倚風險條目評價結果時,才需報告相關信息。例文中闡述了偏倚風險條目與研究結果具有相關性,并詳細報告了所需用到的5個偏倚風險條目及通過排除這些條目評為不清楚的試驗來進行敏感性分析。
2.13 合并效應指標
2.13.1 報告內容
描述主要的合并效應指標,并向讀者解釋其意義和方向。
2.13.2 舉例
示例[9]:模型的回歸系數為ROR。對結局事件的方向進行標準化,因此事件表現為有利于患者的結果(即將死亡轉化為生存)。因此,ROR>1.0且有統計學意義表明在具有較高或不清楚偏倚風險的試驗中(與低風險試驗相比)效應更大(可能被夸大)。ROR<1且有統計學意義表明效應降低。ROR若無統計學意義表明偏倚方向不可預測或檢驗效能不足。
2.13.3 解讀
由于Meta流行病學研究中的效應指標在其他研究中使用較少,讀者可能因不熟悉而不能理解這些指標的意義,因此應詳細報告[5]。例文中報告采用的效應指標為ROR,并闡述了在不同方向(>1或<1)時的意義(夸大或降低)。需要注意的是,在闡述不同方向意義時還應報告結局指標是處于有利還是不利的情況。
2.14 結果合并
2.14.1 報告內容
a.描述結果合并的統計分析或描述分析方法及異質性檢驗;b.若適用,描述統計或模擬模型的建立過程;c.描述如何證明假設合理及獲取相應的結果估計值;d.描述其他分析的方法(如敏感性分析、亞組分析或Meta回歸),若采用這些方法需說明是事前還是事后分析。
2.14.2 舉例(有節選)
a.示例[8]:描述性分析包括定性變量的頻率和百分比,定量變量的中位數和四分位數間距。我們采用了二步法,也被稱為Meta-Meta分析方法。使用I2統計量和Meta分析間方差τ2評估Meta分析的異質性。我們使用Stata/SE版本11.0(StataCorp)進行統計分析。P<0.05被認為差異具有統計學意義。b.示例[15]:此外,還對每個場景進行了3 000次迭代的事后模擬,以重復(敏感性)分析并通過納入和排除零事件研究來比較其偏倚百分比、均方誤差(mean squared error,MSE)和覆蓋率。采用偏倚百分比的中位數和MSE進行比較。我們參考Jackson等將對照組發病率設為0.01,Meta分析研究數設為10個。基于前面的經驗數據,我們模擬了試驗組和對照組的對數正態分布樣本量。對于真正的比值比(odds ratio,OR),我們考慮了5個從1到5的等距值。研究間方差被設置為0.2、0.4、0.6、0.8和1.0,代表異質性由小到大。c.示例[8]:我們采用了二步法,也被稱為Meta-Meta分析方法。在第一步中,我們使用隨機效應Meta回歸模型估計每個Meta分析的ROR及RCT間的異質性。然后,我們使用隨機效應Meta分析模型估計Meta分析中的匯總ROR及其95%CI,以解釋Meta分析之間的異質性。d.示例[8]:我們進行了敏感性分析,以考慮偏倚風險和樣本量影響。我們做了3個探索性的事后分析,以更好地理解語言偏倚的結果及其潛在影響。
2.14.3 解讀
由于Meta流行病學統計方法的復雜性及多樣性,尤其是在經典二步法中可能涉及不同統計模型的選擇,因此對于統計方法及模型的建立過程應詳細描述以便于讀者閱讀理解。對于模型的建立過程,應詳細報告抽樣分布(上例中的正態分布)及參數設定(上例中將對照組發病率、Meta分析研究數等)。事后分析即為在研究完成后所進行的分析,包括對于數據的檢查或分析等處理[16],而與之相對的即為事前分析。由于事后分析的結果及處理并非是預先指定而是在獲取研究數據之后,因此存在主觀偏倚的可能,如為獲取更小的P值而開展分析,所以事后分析的可信性往往不如事前分析。
2.15 文獻篩選
2.15.1 報告內容
研究者應報告符合納入標準和最終納入研究的文獻數量,并標注各階段文獻排除的原因,且最好提供研究納入排除過程的流程圖。由于往往是多個研究員背靠背進行篩選,因此可通過計算Kappa值等方式描述文獻篩選者的內部一致性。
2.15.2 舉例
示例[17]:對于以RCT為研究對象的系統評價,研究初步檢索得到相關文獻333篇,初篩后排除268篇,剩下65篇閱讀全文進行復篩,最終納入了25個研究。作者繪制了研究納入排除的流程圖(見原文補充圖1),并在原文補充表4中列出了各環節剔除文獻的原因。
2.15.3 解釋
上例分別報告了檢索、初篩、復篩和最終納入各階段的文獻數量,并列表說明了各階段剔除文獻的原因,但未報告Kappa值。建議分別報告檢索數據庫獲得的文獻數量和通過參考文獻等方式追溯的文獻數量,最后除納入文獻數量外還可報告納入患者數量等其他信息[5]。以流程圖的形式呈現文獻篩選過程,可更加直觀清晰。
2.16 研究特征
2.16.1 報告內容
報告各個研究的基本特征數據并附上參考文獻。基本特征數據不一定包括臨床特征。
2.16.2 舉例
示例[9]:檢索了符合納入條件的Meta分析中所含的RCT,從原文中提取了這些RCT的研究特征,包括作者姓名、發表時間、研究設計特征(隨機序列生成、分配隱藏、對受試者和研究人員施盲、對結局評價者施盲、結果數據不完整、研究地點數量、患者人數、試驗是否早停、資金來源、干預類型和結局指標類型,詳見原文表1)、及報告的療效結果。
2.16.3 解釋
Meta分析關注的納入研究特征一般參照PICOS(participant,intervention,control,outcome,study design)原則。而Meta流行病學研究關注的特征隨研究目的而不同,例如在證實分配隱藏不充分將導致效應量被高估的Meta流行病學研究中,并不需要描述各個試驗中的患者特征、共病情況等內容[5]。
2.17 研究內的偏倚風險
2.17.1 報告內容
若偏倚風險評價被用于Meta流行病學分析中,則需報告每個研究的偏倚風險評價結果,以便讓結果具有可重復性。
2.17.2 舉例
示例[17]:使用Cochrane偏倚風險評估工具對RCT的偏倚風險進行評價,包括是否生成隨機序列、分配隱藏等條目,補充表10展示了納入RCT的偏倚風險,并報告了每個領域低偏倚風險研究的數量。
2.17.3 解釋
Meta流行病學研究中,當偏倚風險條目作為研究特征、多因素分析的協變量,或用于敏感性分析時[17-19],數據分析通常需要用到偏倚風險評價結果,此時應報告每個研究的偏倚風險評價結果。
2.18 單個研究結果
2.18.1 報告內容
報告每個研究用于Meta流行病學分析中的結果數據,該數據不一定包括臨床結果。
2.18.2 舉例
示例[20]:原文表3展示了每個原始研究的結果,包括研究人群、干預措施、結局指標、試驗的風險比(risk ratio,RR)、絕對危險差(absolute risk difference,ARD)及其95%CI。
2.18.3 解釋
根據不同研究目的,Meta流行病學研究中需要報告的結果數據略有不同。應注意的是,此處更強調報告原始研究層面的結果數據,如每個原始研究的效應指標[RR、OR、危險比(hazard ratio,HR)、均數差(mean difference,MD)、ARD]、效應量及其95%CI。
2.19 結果合并
2.19.1 報告內容
報告目前進行的統計分析結果,包括結果精確性和異質性等。若適用,還需進行假設的合理性證明,描述統計/模擬模型的擬合結果。
2.19.2 舉例
a.示例[19]:原文表2報告了統計分析結果,包括所有偏倚條目對應的樣本量、單/多中心、資助來源、效應量及其95%CI、τ2、P值等。b.示例[15]:為進一步檢驗結果的穩健性,探究在Meta分析中排除雙臂零事件研究是否會影響結論,作者進行了事后模擬研究。原文圖5展示了零事件研究對OR值和P值的影響。排除零事件的研究后,0%~5.78%的Meta分析的OR值發生方向改變,0.80%~6.15%的Meta分析的P值發生方向改變。
2.19.3 解釋
Meta流行病學研究中常見的結果指標有ROR、風險比率(ratio of risk ratio,RRR)、標準化均數差的差值(differences in standardized mean differences,dSMD)。報告置信區間可反映結果精確性,報告τ2可反映結果異質性。
2.20 其他分析
2.20.1 報告內容
若進行了敏感性分析、亞組分析等其他分析,還需對這些分析結果進行報告。
2.20.2 舉例
a.示例[9]:敏感性分析時,進行了去重、剔除特定試驗特征評估結果為“不清楚”的試驗、剔除具有陽性對照組的試驗,并在原文表3報告了敏感性分析結果。結果顯示,對受試者和研究人員施盲與效應無相關性。b.示例[17]:根據結果與PI/ECO(population,intervention or exposure,comparator,outcome)相似程度等分類方法進行了亞組分析。結果顯示,PI/ECO匹配對相似但不相同的隊列研究,與RCT的結果略有不同,RRR為1.05[95%CI(1.00,1.10),I2=61%,τ2=0.016],95%CI為(0.81,1.36);相似的兩組上存在較大的差異,RRR為1.20[95%CI(1.10,1.30),I2=62%,τ2=0.020],95%CI為(0.88,1.63)。
2.20.3 解釋
敏感性分析能夠反映結果的穩健性。如上述示例a中,對受試者和研究人員施盲與效應的相關性在主分析中具有統計學意義,但進行敏感性分析后,統計結果卻發生了方向變化,提示了研究結果不穩定。研究進行異質性檢驗后,若發現異質性較大,需進一步進行亞組分析,探索可能導致異質性的因素。
2.21 證據總結
2.21.1 報告內容
總結本研究的主要發現,并將其和現有相似研究的結論進行比較和分析。證據質量可能與Meta流行病學研究無關,但研究者應描述對結果的確定性。
2.21.2 舉例
示例[17]:該研究探索了從RCT和隊列研究中得出的飲食-疾病關聯估計在多大程度上是一致的。共確定了97對飲食-疾病對,其中83對能進行Meta分析,總體來看證據合并結果的差異很小,但考慮到隊列研究的可信區間過寬及部分研究間統計異質性大,尚不能排除個體研究中的重要差異或潛在偏倚。該結論與其他營養、醫學領域的相關研究結論一致,且該研究在其他研究基礎上進一步匹配了PI/ECO、計算了95%CI,并對各種類型的干預和結果進行區分,因此作者對結果有較大把握。
2.21.3 解釋
在討論的第一部分,應報告研究得到的主要結論及證據質量。此外,研究者報告結果的確定性時,可從研究效應量大小、精確性、異質性、穩定性及和同類研究結果進行比較等方面來考慮,并在討論部分加以描述。
2.22 局限性
2.22.1 報告內容
要對研究的局限性進行討論,例如發表偏倚或報告偏倚的可能性。
2.22.2 舉例
示例[7]:本研究存在一些局限性。首先,回歸方法被認為統計效能低下,且不適用于研究異質性大、研究無陽性結果或所有研究樣本量相似的情況,因此我們按照指南對研究進行評估,僅納入了異質性低(I2<50%)的Meta分析,但這一行為可能會引入選擇性偏倚。其次,由于大多數研究的研究對象數量小于10個,在98 966個Meta分析中我們最終僅納入了5 534個研究(5.6%),這樣的選擇也極可能引入選擇性偏倚。
2.22.3 解釋
作者應充分報告研究存在的局限性,以便讀者進行批判性思考,也可為未來研究提出改善研究有效性方法提供參考。Meta流行病學研究本身屬于觀察性研究,更容易出現偏倚和混雜[21],如上例中從可能引入選擇性偏倚角度考慮了該研究存在的局限性。
2.23 結論
2.23.1 報告內容
應該對研究結果進行解釋,并提出對未來研究的啟示及對臨床實踐的可能影響。
2.23.2 舉例
示例[9]:本研究結果提示,Meta分析結果的偏倚方向在很大程度上是不可預測的,因此,對于試驗開展者,我們建議采取措施以減少偏倚風險,并在可行的情況下盡可能堅持使用盲法和分配隱藏。對于研究人員,我們建議即使患者停止接受研究干預,仍要追蹤其結局以降低失訪偏倚風險。偏倚方向的不可預測性強調了必須堅持這些基本的流行病學原則。
2.23.3 解釋
結論部分應該對結果進行合理推斷。盡管Meta流行病學研究更可能間接而不是直接影響臨床實踐,仍應盡可能報告研究結果可能帶來的影響。
2.24 資助
2.24.1 報告內容
要寫明研究的資金來源,及資助者在研究中的角色和發揮的作用。
2.24.2 舉例
示例[7]:本研究得到了聯邦基金的支持,雖然該基金會是紐約的一個私人獨立基金會,但研究者申明論文觀點是研究者觀點而非聯邦基金或其董事、理事等的觀點,資助者對研究設計和實施沒有任何作用。
2.24.3 解釋
上例報告了研究基金來源,并直接表明資助者未參與研究過程。不同資金來源會影響讀者對研究結果的信任度,特別是對于來自廠家的資助,更應詳細介紹資助者對研究的影響情況,以增加研究的透明性。
3 討論
全球的臨床研究方法學家們為提高各類研究的報告質量,開發出了針對不同領域或研究類型的報告規范。隨著Meta流行病學的發展及研究數量的增加[22],對Meta流行病學研究報告透明性和規范性的需求愈加迫切。
Meta流行病學研究報告規范基于PRISMA制訂,兩者在條目設置上存在相似性,但在具體內容上存在很大不同[5,23-25]:① 標題:要求報告類型為Meta流行病學研究;② 前言:要求研究者報告假設檢驗;③ 計劃書:并未強制要求注冊,而PRISMA要求注冊或有計劃書;④ 文獻篩選:增加了對于描述評價文獻篩選者內部一致性的方法的報告要求;⑤ 偏倚風險:強調僅當偏倚風險與Meta流行病學研究中數據分析相關時,才需描述其使用的偏倚風險條目情況及結果,而非一定要進行偏倚風險評價;⑥ 合并效應指標:Meta流行病學研究涉及指標更復雜,強調應向讀者解釋指標方向及意義;⑦ 結果合并:對于分析性Meta流行病學研究,強調要闡明研究假設的合理性、統計/模擬模型的建立過程和擬合結果,還應報告是事前或事后分析[26]。其與PRISMA的部分區別見表2。

Meta流行病學報告規范仍存在一定局限性:① 報告規范本身制訂過程的科學性難以判斷,且未詳細報告制訂方法及過程,一方面不清楚報告規范的制訂是否采用了德爾菲法或專家共識法等,另一方面不清楚制訂各個階段的詳細信息,如制訂報告前的前期工作及對草案的設定過程和修訂的次數過程等;② 使用率仍不高,2017年發表以后的Meta流行病學研究仍有較高比例采用PRISMA進行報告[2,4];③ 缺乏闡釋性文件和示例,僅在報告規范正文中具有少量內容解讀,但缺乏由作者團隊對每個條目進行詳細闡述及舉例解讀的文件;④ 缺乏配套的相關報告規范,例如PRISMA具有配套的PRISMA摘要條目清單(PRISMA 2020 for Abstracts checklist)。
隨著系統評價/Meta分析研究數量快速增長,其對臨床實踐、衛生決策的重要性日益增加,但其研究結果受限于研究質量(特別是納入RCT的偏倚風險),當研究質量低時可能導致無效甚至有害的干預進入臨床大量應用。科學的Meta流行病學研究證據可促使RCT更加全方位地控制相關偏倚因素,這就必然要求Meta流行病學研究本身的結果需要具有透明性且受到認可。因此,盡管國內的Meta流行病學研究還處于起步階段,但仍應從源頭把關,提高Meta流行病學研究的報告質量,產生更受認可的Meta流行病學研究證據。