在缺乏數據進行 Meta 分析的系統評價中,通常使用替代合成方法,但這些方法卻很少被報道,而模糊的方法闡述可能會導致人們質疑系統評價結果的真實性。無 Meta 分析數據合成(SWiM)報告規范是用于指導采用了替代合成方法評估干預措施效應的系統評價進行清晰報告的規范。本文介紹了 SWiM 規范的研制過程及 9 個 SWiM 報告條目及其相應的解釋與示例。
引用本文: 李庚, 歐陽文偉, 周莉, 郭新峰, 溫澤淮, 譯. 無 Meta 分析數據合成(SWiM)的系統評價報告規范. 中國循證醫學雜志, 2020, 20(11): 1359-1364. doi: 10.7507/1672-2531.202008114 復制
決策者認為系統評價是基本的證據來源之一[1]。完整、透明地報告系統評價的方法和結果有助于用戶評估評價結果的真實性。為改善系統評價報告質量,已制訂了由 27 個條目清單組成的系統評價和 Meta 分析優先報告條目 PRISMA 聲明(http://www.prisma-statement.org/)[2]。目前,PRISMA 有多種擴展聲明,如進行系統評價的不同方法(如概括性評價[3])、具有特殊關注領域的系統評價(如損害[4])及使用特定方法的系統評價(如網狀 Meta 分析[5])。但 PRISMA 對于特定領域的系統評價的報告提供的指導比較有限,比如方法描述與數據合成,同時對于那些無 Meta 分析的系統評價則沒有報告規范。我們估計,約 32%與健康相關的干預性系統評價沒有進行 Meta 分析[6-8],而是使用了替代方法進行合成,這些替代方法通常用文字描述效應,也被稱為敘事性綜合[9]。最近有研究發現,敘事性綜合研究的報告存在嚴重缺陷,包括缺乏對采用方法的描述,研究層面的數據與敘事性綜合方法及其結論之間缺乏透明的聯系及缺乏對合成方法局限性的報告[7]。這表明,當不使用 Meta 分析時,研究者對清楚報告合成方法的要求普遍缺乏了解和存在誤解,故需要制訂一個專門的報告規范。
1 SWiM 報告規范的范圍
本文介紹了無 Meta 分析數據合成(SWiM)的報告規范,它主要適用于評估干預措施量化效應的系統評價,而這些效應的評估不可能或不適合進行 Meta 分析或者至少某個結局指標不適合進行 Meta 分析[10]。當效應評估報告不完整或由于研究特征(例如研究設計、干預類型或結局)過于多樣化而無法得出有意義的效應總體評估時[11],一般會出現無法進行 Meta 分析數據合并的情況。此時,可采用替代的報告和合成方法(如計算干預效果估計值的概要性統計,根據效果方向進行的計數統計及 P 值合并),SWiM 可為報告這些方法和結果提供指導[11]。具體而言,SWiM 規范擴展了當前可用的有關“結果合成”條目的規范,例如 PRISMA(條目 14 和 21)和 RAMESES(條目 11、14 和 15)[2, 12, 13]。SWiM 涵蓋了所有與數據合成相關的關鍵信息的報告,包括如何對研究進行分組、數據合成方法、數據與摘要的展示及合成方法的局限性。需要明確的是,SWiM 不適用于定性數據合成的系統評價,因為這類系統評價已有自己的報告規范,比如用于定性證據合成的 ENTREQ 和用于元民族志方法(meta-ethnography)的 eMERGe[14, 15]。
2 SWiM 報告規范的制訂
在確認沒有類似的報告規范正在制訂之后,本項目制訂了研究方案并在 EQUATOR 網上注冊[10]。所有 SWiM 研究團隊成員都是經驗豐富的系統評價員,其中一位還是開發敘事性綜合(AS)指南的合著者[9]。同時,成立了一個項目顧問小組以提供更多的專業知識,其成員包括來自 Cochrane 協作組、坎貝爾合作組織(Campbell Collaboration)和英國國家優化衛生與保健研究所(NICE)的代表(附件 1)。
本項目得到了制訂衛生研究報告規范的推薦[16]。我們評估了目前無 Meta 分析數據合成的報告方法,并與項目顧問小組協商制訂了 SWiM 報告條目的初始清單。然后,我們邀請了 91 名專家參與 3 輪德爾菲調查,所有這些專家都是系統評價方法學專家或有無 Meta 分析數據合成系統評價經驗的作者。3 輪調查的應答率分別為 48%(n=44/91)、54%(n=37/68)和 82%(n=32/39)。專家小組(項目顧問小組加另一名新的方法學專家)以共識會議形式討論了調查結果(附件 1)。然后我們試用修訂后的指南以評估其易用性和表面效度。接下來,我們還邀請了 8 位未參加德爾菲調查但有豐富經驗的系統評價員閱讀并試用了該指南。我們簡短地采訪了試用者,以確定條目中需要澄清的內容或其解釋,對條目進行了相應修改,并在最終定稿之前將其分發給專家小組以征求意見。附件 1 提供了 SWiM 制訂過程的方法學全部詳細信息。
3 SWiM 報告條目
我們確定了 9 個條目,以指導無 Meta 分析數據合成的報告。表 1 是 SWiM 報告指南的具體條目,通過網址:www.equator-network.org/reporting-guidelines 可獲得 SWiM 在線版本。下面將具體介紹每個報告條目的解釋和闡述。附件 2 提供了報告條目的示例和具體解釋。

條目 1:分組描述
1a)描述
提供組別的描述及分組的理由(例如:根據干預措施、人群、結局、研究設計分組)。
1a)解釋
由于可能存在方法學、臨床或概念上的多樣性(如由于包括了不同的研究設計、結局、干預措施、背景、人群),因而有必要清晰報告這些研究特征如何用于數據合成的分組及分組的合理性(參閱《Cochrane 系統評價員手冊》第 3 章[17])。盡管在所有系統評價中報告研究特征分組情況都很重要,但在無 Meta 分析的系統評價中尤為重要,因為與 Meta 分析相比,無 Meta 分析的系統評價分組可能沒那么明顯。
提供干預措施如何起作用并影響結局的合理性或變化的理論依據,將為作者和系統評價使用者提供信息以判定分組的適當性和有用性,可使用圖表或邏輯模型可視化地闡明系統評價中所用的變化的潛在理論依據[18, 19]。若干預措施的變化理論依據在其他(例如在方案中)提供了完整說明,則應予引用。在 Cochrane 評價中,分組合理性可在“干預措施將如何起作用”部分中給予說明。
1b)描述
詳細說明并提供用于數據合成的組別在方案制訂后所做的任何變更的理由。
1b)解釋
在研究篩選和數據提取之后,原先計劃的數據合成的分組決定可能需要更改。發生這種情況可能是由于數據收集之后才發現人群、干預措施、對照和/或結局指標有重大變化,或者可用于預先設定的分組的數據有限,可能需要對分組進行修改以便利于數據合成(《Cochrane 手冊》第 2 章[20])。
對于提高報告透明度,報告計劃分組的變更及其原因很重要,因為這可幫助讀者評估變更是否可能受到研究結果的影響。此外,在干預措施、人群或結局更廣泛層次(任何或多個)上進行分組,將對合成結果的解釋產生影響(參見條目 8)。
條目 2:描述所使用的標準化度量和轉換方法
描述
描述每個結局指標的標準化度量方法。解釋為什么要選擇這個/這些度量,并描述研究中所報告的用于將干預措施效應轉換為標準化度量的任何方法,同時引用相關的方法學指南。
解釋
術語“標準化度量”是指為數據合成或結果解釋或兩者兼而有之的目的、用于展示研究間的干預措施效應而采用的度量。
標準化度量的示例包括干預效應的測量[例如:危險度比(相對危險度)、比值比、危險度差(歸因危險度)、均數差、標準化均數差、均值比]、效應方向或 P 值。Chinn[21]提出了一種將比值比轉換為標準化均數差的統計方法的示例。有關其他方法和度量,可參閱《Cochrane 系統評價員手冊》第 6 章[22]。
條目 3:描述合成方法
描述
描述并解釋無法對估計效應值進行 Meta 分析時用于綜合每個結局效應的方法。
解釋
由于各種原因可能無法進行效應值的 Meta 分析。此時,需考慮和指定其他數據合成方法,比如合并 P 值,對干預效應估計值進行匯總統計(例如:中位數、四分位數間距)或基于效應方向的計數。有關可能的合成方法的總結,請參見表 2(更多詳細信息,可參見 McKenzie 和 Brennan 2019 年發表的論文[11])。同時,作者應該為所選的合成方法提供合理解釋。

條目 4:匯總和合成時用于對結果優先排序的標準
描述
如適用,提供用于選擇特定的一些研究或某項研究作為主要合成分析或從合成中得出結論的標準及其合理解釋(如基于研究設計、偏倚風險評估、與系統評價問題的直接關系)。
解釋
標準可用于優先報告某些研究結果而不是其他研究,或者將合成范圍限制為某些研究的子集。標準示例包括:研究設計的類型(如僅限隨機試驗)、偏倚風險評估(如僅限低偏倚風險的研究)、樣本量、證據與系統評價問題的相關性(結局、人群/背景或干預)或證據的確定性。預先指定這些標準可提高透明度,以便解釋為什么某些研究被優先排序,也限制了選擇性報告研究結果的風險。
條目 5:報告效應值異質性的審查
描述
當不可能進行效應值估計的 Meta 分析時,陳述用于檢測報告效應的異質性的方法及其擴展情況以審查異質性。
解釋
當不能使用常規的統計學方法諸如亞組分析和 Meta 回歸方法進行審查時,可考慮采用非正式方法來審查結果的異質性。非正式方法可包含排序表格、結構圖,這些圖表包括描述諸如方法學特征(如研究設計)、亞組人群(如性別、年齡)、干預措施的成分和/或研究背景/場所(請參閱 Cochrane 手冊第 12 章[11])等假定的效應修飾因素,而且應該合理解釋所用方法和所選方法。對異質性的審查具有局限性,因為異質性很少是明確的;使用非正式方法時,這種情況更有可能發生。如果未預先指定異質性審查方法,也應當指出。
條目 6:證據的確定性
描述
描述用于評估合成結果確定性的方法。
解釋
對證據確定性的評估應旨在考慮整合結果的精確性(置信區間,如果有的話)、研究數量和受試者的例數、研究間的一致性、研究的偏倚風險、納入研究如何解決計劃中的問題(直接性)及發表偏倚。GRADE 是最廣泛使用的評估確定性的框架(Cochrane 手冊第 14 章[23])。但是,由于使用的合成方法所限,可能難以評估某些領域的確定性(例如:使用計數法的效應的一致性)。
條目 7:數據的展示方法
描述
描述用于展示效應的圖形和表格方法(如表格、森林圖、收獲圖)。在文本及任何表格或圖中,明確指出用于對研究進行排序的關鍵研究特征(如研究設計、偏倚風險),并清晰引用所納入的研究。
解釋
表格或圖中展示的研究結果與敘事性文本中報告的合成結果應以相同的方式排序,以便于比較每個納入研究的結果。可能影響數據解釋的關鍵特征諸如研究設計、樣本量和偏倚風險也應陳述。可視化呈現的例子包括森林圖[24]、收獲圖[25]、效應方向圖[26]、負擔圖[27]、氣泡圖[28]和箱線圖[29]。McKenzie 和 Brennan 的研究對這些圖及何時使用這些圖及其優缺點進行了描述[11]。
條目 8:報告結果
描述
對于每項比較與結局,提供一個合成結果及其確定性的描述。使用與合成分析所解決的問題相一致的語言描述結果,并指出哪些研究對結果合成有貢獻。
解釋
對于每項比較和結局,都應提供對合成結果的描述,明確說明哪些研究對每項合成分結果有貢獻(如在文中列出或列表)。在描述這些結果時,作者應清楚所解決問題的性質(見表 2 第 1 列)、使用度量和合成方法、研究和受試者的數量及納入研究的關鍵特征(人群/研究場所、干預措施、結局)。可能的話,合成結果應附上置信區間。還應報告對效應確定性的評估。
任何異質性的審查結果都應加以說明,如果未預先計劃,注意避免對結果進行過度解釋。
如果使用了預先指定的邏輯模型,那么作者可報告在評價過程中或因評價結果導致邏輯模型所做的任何更改[30]。
條目 9:合成的局限性
描述
報告所使用的數據合成方法和/或合成中使用的分組的局限性及與原始評價問題相關的結論如何受這些局限性影響。
解釋
當報告數據合成的局限性時,要考慮的因素包括所使用的標準化度量、所用的合成方法及用于整合的分組再配置(比較、干預措施、人群、結局)。
度量和合成方法的選擇將影響所解決的問題(請參見表 2)。例如:如果標準化度量是效應方向,并且使用了計數方法,那么所需解決的問題將會是“是否有某一效應的任何證據?”而不是“干預的平均效應是什么?”,后者一般采用隨機效應 Meta 分析。
數據合成的局限性可能源于在制訂方案后合成的結構和方法的更改。這些更改可能是由于證據有限、不完整報告結局或效應估計、或者在納入研究中使用了不同的效應評測方法。這些局限性可能會影響數據合成回答預計的評價問題的能力,例如當計劃進行效應評估的 Meta 分析卻又不可能執行時。
4 討論
SWiM 報告規范旨在提高無法使用 Meta 分析進行效應估計的合成報告的透明度。該規范特別提出透明地報告數據合成和展示方法及結果,并且可能與包含了不適合做 Meta 分析的多種數據源的評價最相關。SWiM 報告規范應與涵蓋系統評價其他方面的規范結合使用,例如 PRISMA[31]。我們希望 SWiM 成為系統評價作者的資源,并支持期刊編輯和讀者評價某項系統評價研究的過程并審閱其結果的真實性。
SWiM 報告條目旨在涵蓋研究結果的陳述和合成方面,而這些方面在使用 Meta 分析之外的方法時經常不會報告[7]。這包括報告合成框架和比較分組(條目 1、4、5 和 6)、用于合成的標準化度量(條目 2)、合成方法(條目 3 和 9)、數據呈現(條目 7)及與有明確數據支持的合成結果的總結(條目 8)。盡管 SWiM 項目是專為無 Meta 分析的評價制訂的,但在報告包括 Meta 分析結果在內的所有綜合方法時,它也能體現提高報告透明度的核心原則。因此,無論使用哪種方法,進行定量效應數據的合成結果報告時,SWiM 條目都是相關的。
報告規范有時被理解為實施規范或用于評估研究或系統評價的質量;這并不是報告規范的適用范圍,因此 SWiM 不應被用于指導證據整合的實施。至于如何使用 SWiM 中提到的方法進行數據合成,我們建議讀者參考 Cochrane 干預性系統評價手冊第二版,特別是第 12 章[11]。盡管報告和實施之間不可避免地存在重疊,但 SWiM 報告規范并非旨在規定方法的選擇,并且每個條目的詳細程度都并不可能完全適用。例如:異質性的審查(條目 5)可能并不總是必要或有用的。涉及到 SWiM,我們預計即將發布的 PRISMA 更新版將包含更廣泛的合成方法的新條目[32],但是該版本將不會提供無 meta 分析數據合成方法的詳細指導和示例。
SWiM 報告規范起源于 ICONS-Quant 項目,該項目旨在改善敘事性合成的透明度及其實施情況[10]。在 SWiM 中有意避免使用“敘事性合成”一詞,以促進不依賴于 Meta 分析數據合成的系統評價中所用方法的清晰度。敘事(方法)在所有研究中普遍使用,并且它可在撰寫來自各種數據的連貫故事中發揮重要作用[33, 34]。但是,在證據合成領域,定量效應估計合成中的敘述方法缺乏透明性,因而難以評估其結果的真實性[7]。SWiM 報告規范和最近發布的關于替代合成方法的其他規范[11],旨在提高無 Meta 分析數據合成的系統評價的報告透明度,進而信任這些系統評價,尤其是針對干預效應的評價。
附件
附件 1:SWiM 報告規范制訂的方法學詳細信息,下載地址:https://www.bmj.com/content/bmj/suppl/2020/01/16/bmj.l6890.DC1/camm051291.ww1.pdf.
附件 2:報告條目的示例和具體解釋,下載地址:https://www.bmj.com/content/bmj/suppl/2020/01/16/bmj.l6890.DC1/camm051291.ww2.pdf.
決策者認為系統評價是基本的證據來源之一[1]。完整、透明地報告系統評價的方法和結果有助于用戶評估評價結果的真實性。為改善系統評價報告質量,已制訂了由 27 個條目清單組成的系統評價和 Meta 分析優先報告條目 PRISMA 聲明(http://www.prisma-statement.org/)[2]。目前,PRISMA 有多種擴展聲明,如進行系統評價的不同方法(如概括性評價[3])、具有特殊關注領域的系統評價(如損害[4])及使用特定方法的系統評價(如網狀 Meta 分析[5])。但 PRISMA 對于特定領域的系統評價的報告提供的指導比較有限,比如方法描述與數據合成,同時對于那些無 Meta 分析的系統評價則沒有報告規范。我們估計,約 32%與健康相關的干預性系統評價沒有進行 Meta 分析[6-8],而是使用了替代方法進行合成,這些替代方法通常用文字描述效應,也被稱為敘事性綜合[9]。最近有研究發現,敘事性綜合研究的報告存在嚴重缺陷,包括缺乏對采用方法的描述,研究層面的數據與敘事性綜合方法及其結論之間缺乏透明的聯系及缺乏對合成方法局限性的報告[7]。這表明,當不使用 Meta 分析時,研究者對清楚報告合成方法的要求普遍缺乏了解和存在誤解,故需要制訂一個專門的報告規范。
1 SWiM 報告規范的范圍
本文介紹了無 Meta 分析數據合成(SWiM)的報告規范,它主要適用于評估干預措施量化效應的系統評價,而這些效應的評估不可能或不適合進行 Meta 分析或者至少某個結局指標不適合進行 Meta 分析[10]。當效應評估報告不完整或由于研究特征(例如研究設計、干預類型或結局)過于多樣化而無法得出有意義的效應總體評估時[11],一般會出現無法進行 Meta 分析數據合并的情況。此時,可采用替代的報告和合成方法(如計算干預效果估計值的概要性統計,根據效果方向進行的計數統計及 P 值合并),SWiM 可為報告這些方法和結果提供指導[11]。具體而言,SWiM 規范擴展了當前可用的有關“結果合成”條目的規范,例如 PRISMA(條目 14 和 21)和 RAMESES(條目 11、14 和 15)[2, 12, 13]。SWiM 涵蓋了所有與數據合成相關的關鍵信息的報告,包括如何對研究進行分組、數據合成方法、數據與摘要的展示及合成方法的局限性。需要明確的是,SWiM 不適用于定性數據合成的系統評價,因為這類系統評價已有自己的報告規范,比如用于定性證據合成的 ENTREQ 和用于元民族志方法(meta-ethnography)的 eMERGe[14, 15]。
2 SWiM 報告規范的制訂
在確認沒有類似的報告規范正在制訂之后,本項目制訂了研究方案并在 EQUATOR 網上注冊[10]。所有 SWiM 研究團隊成員都是經驗豐富的系統評價員,其中一位還是開發敘事性綜合(AS)指南的合著者[9]。同時,成立了一個項目顧問小組以提供更多的專業知識,其成員包括來自 Cochrane 協作組、坎貝爾合作組織(Campbell Collaboration)和英國國家優化衛生與保健研究所(NICE)的代表(附件 1)。
本項目得到了制訂衛生研究報告規范的推薦[16]。我們評估了目前無 Meta 分析數據合成的報告方法,并與項目顧問小組協商制訂了 SWiM 報告條目的初始清單。然后,我們邀請了 91 名專家參與 3 輪德爾菲調查,所有這些專家都是系統評價方法學專家或有無 Meta 分析數據合成系統評價經驗的作者。3 輪調查的應答率分別為 48%(n=44/91)、54%(n=37/68)和 82%(n=32/39)。專家小組(項目顧問小組加另一名新的方法學專家)以共識會議形式討論了調查結果(附件 1)。然后我們試用修訂后的指南以評估其易用性和表面效度。接下來,我們還邀請了 8 位未參加德爾菲調查但有豐富經驗的系統評價員閱讀并試用了該指南。我們簡短地采訪了試用者,以確定條目中需要澄清的內容或其解釋,對條目進行了相應修改,并在最終定稿之前將其分發給專家小組以征求意見。附件 1 提供了 SWiM 制訂過程的方法學全部詳細信息。
3 SWiM 報告條目
我們確定了 9 個條目,以指導無 Meta 分析數據合成的報告。表 1 是 SWiM 報告指南的具體條目,通過網址:www.equator-network.org/reporting-guidelines 可獲得 SWiM 在線版本。下面將具體介紹每個報告條目的解釋和闡述。附件 2 提供了報告條目的示例和具體解釋。

條目 1:分組描述
1a)描述
提供組別的描述及分組的理由(例如:根據干預措施、人群、結局、研究設計分組)。
1a)解釋
由于可能存在方法學、臨床或概念上的多樣性(如由于包括了不同的研究設計、結局、干預措施、背景、人群),因而有必要清晰報告這些研究特征如何用于數據合成的分組及分組的合理性(參閱《Cochrane 系統評價員手冊》第 3 章[17])。盡管在所有系統評價中報告研究特征分組情況都很重要,但在無 Meta 分析的系統評價中尤為重要,因為與 Meta 分析相比,無 Meta 分析的系統評價分組可能沒那么明顯。
提供干預措施如何起作用并影響結局的合理性或變化的理論依據,將為作者和系統評價使用者提供信息以判定分組的適當性和有用性,可使用圖表或邏輯模型可視化地闡明系統評價中所用的變化的潛在理論依據[18, 19]。若干預措施的變化理論依據在其他(例如在方案中)提供了完整說明,則應予引用。在 Cochrane 評價中,分組合理性可在“干預措施將如何起作用”部分中給予說明。
1b)描述
詳細說明并提供用于數據合成的組別在方案制訂后所做的任何變更的理由。
1b)解釋
在研究篩選和數據提取之后,原先計劃的數據合成的分組決定可能需要更改。發生這種情況可能是由于數據收集之后才發現人群、干預措施、對照和/或結局指標有重大變化,或者可用于預先設定的分組的數據有限,可能需要對分組進行修改以便利于數據合成(《Cochrane 手冊》第 2 章[20])。
對于提高報告透明度,報告計劃分組的變更及其原因很重要,因為這可幫助讀者評估變更是否可能受到研究結果的影響。此外,在干預措施、人群或結局更廣泛層次(任何或多個)上進行分組,將對合成結果的解釋產生影響(參見條目 8)。
條目 2:描述所使用的標準化度量和轉換方法
描述
描述每個結局指標的標準化度量方法。解釋為什么要選擇這個/這些度量,并描述研究中所報告的用于將干預措施效應轉換為標準化度量的任何方法,同時引用相關的方法學指南。
解釋
術語“標準化度量”是指為數據合成或結果解釋或兩者兼而有之的目的、用于展示研究間的干預措施效應而采用的度量。
標準化度量的示例包括干預效應的測量[例如:危險度比(相對危險度)、比值比、危險度差(歸因危險度)、均數差、標準化均數差、均值比]、效應方向或 P 值。Chinn[21]提出了一種將比值比轉換為標準化均數差的統計方法的示例。有關其他方法和度量,可參閱《Cochrane 系統評價員手冊》第 6 章[22]。
條目 3:描述合成方法
描述
描述并解釋無法對估計效應值進行 Meta 分析時用于綜合每個結局效應的方法。
解釋
由于各種原因可能無法進行效應值的 Meta 分析。此時,需考慮和指定其他數據合成方法,比如合并 P 值,對干預效應估計值進行匯總統計(例如:中位數、四分位數間距)或基于效應方向的計數。有關可能的合成方法的總結,請參見表 2(更多詳細信息,可參見 McKenzie 和 Brennan 2019 年發表的論文[11])。同時,作者應該為所選的合成方法提供合理解釋。

條目 4:匯總和合成時用于對結果優先排序的標準
描述
如適用,提供用于選擇特定的一些研究或某項研究作為主要合成分析或從合成中得出結論的標準及其合理解釋(如基于研究設計、偏倚風險評估、與系統評價問題的直接關系)。
解釋
標準可用于優先報告某些研究結果而不是其他研究,或者將合成范圍限制為某些研究的子集。標準示例包括:研究設計的類型(如僅限隨機試驗)、偏倚風險評估(如僅限低偏倚風險的研究)、樣本量、證據與系統評價問題的相關性(結局、人群/背景或干預)或證據的確定性。預先指定這些標準可提高透明度,以便解釋為什么某些研究被優先排序,也限制了選擇性報告研究結果的風險。
條目 5:報告效應值異質性的審查
描述
當不可能進行效應值估計的 Meta 分析時,陳述用于檢測報告效應的異質性的方法及其擴展情況以審查異質性。
解釋
當不能使用常規的統計學方法諸如亞組分析和 Meta 回歸方法進行審查時,可考慮采用非正式方法來審查結果的異質性。非正式方法可包含排序表格、結構圖,這些圖表包括描述諸如方法學特征(如研究設計)、亞組人群(如性別、年齡)、干預措施的成分和/或研究背景/場所(請參閱 Cochrane 手冊第 12 章[11])等假定的效應修飾因素,而且應該合理解釋所用方法和所選方法。對異質性的審查具有局限性,因為異質性很少是明確的;使用非正式方法時,這種情況更有可能發生。如果未預先指定異質性審查方法,也應當指出。
條目 6:證據的確定性
描述
描述用于評估合成結果確定性的方法。
解釋
對證據確定性的評估應旨在考慮整合結果的精確性(置信區間,如果有的話)、研究數量和受試者的例數、研究間的一致性、研究的偏倚風險、納入研究如何解決計劃中的問題(直接性)及發表偏倚。GRADE 是最廣泛使用的評估確定性的框架(Cochrane 手冊第 14 章[23])。但是,由于使用的合成方法所限,可能難以評估某些領域的確定性(例如:使用計數法的效應的一致性)。
條目 7:數據的展示方法
描述
描述用于展示效應的圖形和表格方法(如表格、森林圖、收獲圖)。在文本及任何表格或圖中,明確指出用于對研究進行排序的關鍵研究特征(如研究設計、偏倚風險),并清晰引用所納入的研究。
解釋
表格或圖中展示的研究結果與敘事性文本中報告的合成結果應以相同的方式排序,以便于比較每個納入研究的結果。可能影響數據解釋的關鍵特征諸如研究設計、樣本量和偏倚風險也應陳述。可視化呈現的例子包括森林圖[24]、收獲圖[25]、效應方向圖[26]、負擔圖[27]、氣泡圖[28]和箱線圖[29]。McKenzie 和 Brennan 的研究對這些圖及何時使用這些圖及其優缺點進行了描述[11]。
條目 8:報告結果
描述
對于每項比較與結局,提供一個合成結果及其確定性的描述。使用與合成分析所解決的問題相一致的語言描述結果,并指出哪些研究對結果合成有貢獻。
解釋
對于每項比較和結局,都應提供對合成結果的描述,明確說明哪些研究對每項合成分結果有貢獻(如在文中列出或列表)。在描述這些結果時,作者應清楚所解決問題的性質(見表 2 第 1 列)、使用度量和合成方法、研究和受試者的數量及納入研究的關鍵特征(人群/研究場所、干預措施、結局)。可能的話,合成結果應附上置信區間。還應報告對效應確定性的評估。
任何異質性的審查結果都應加以說明,如果未預先計劃,注意避免對結果進行過度解釋。
如果使用了預先指定的邏輯模型,那么作者可報告在評價過程中或因評價結果導致邏輯模型所做的任何更改[30]。
條目 9:合成的局限性
描述
報告所使用的數據合成方法和/或合成中使用的分組的局限性及與原始評價問題相關的結論如何受這些局限性影響。
解釋
當報告數據合成的局限性時,要考慮的因素包括所使用的標準化度量、所用的合成方法及用于整合的分組再配置(比較、干預措施、人群、結局)。
度量和合成方法的選擇將影響所解決的問題(請參見表 2)。例如:如果標準化度量是效應方向,并且使用了計數方法,那么所需解決的問題將會是“是否有某一效應的任何證據?”而不是“干預的平均效應是什么?”,后者一般采用隨機效應 Meta 分析。
數據合成的局限性可能源于在制訂方案后合成的結構和方法的更改。這些更改可能是由于證據有限、不完整報告結局或效應估計、或者在納入研究中使用了不同的效應評測方法。這些局限性可能會影響數據合成回答預計的評價問題的能力,例如當計劃進行效應評估的 Meta 分析卻又不可能執行時。
4 討論
SWiM 報告規范旨在提高無法使用 Meta 分析進行效應估計的合成報告的透明度。該規范特別提出透明地報告數據合成和展示方法及結果,并且可能與包含了不適合做 Meta 分析的多種數據源的評價最相關。SWiM 報告規范應與涵蓋系統評價其他方面的規范結合使用,例如 PRISMA[31]。我們希望 SWiM 成為系統評價作者的資源,并支持期刊編輯和讀者評價某項系統評價研究的過程并審閱其結果的真實性。
SWiM 報告條目旨在涵蓋研究結果的陳述和合成方面,而這些方面在使用 Meta 分析之外的方法時經常不會報告[7]。這包括報告合成框架和比較分組(條目 1、4、5 和 6)、用于合成的標準化度量(條目 2)、合成方法(條目 3 和 9)、數據呈現(條目 7)及與有明確數據支持的合成結果的總結(條目 8)。盡管 SWiM 項目是專為無 Meta 分析的評價制訂的,但在報告包括 Meta 分析結果在內的所有綜合方法時,它也能體現提高報告透明度的核心原則。因此,無論使用哪種方法,進行定量效應數據的合成結果報告時,SWiM 條目都是相關的。
報告規范有時被理解為實施規范或用于評估研究或系統評價的質量;這并不是報告規范的適用范圍,因此 SWiM 不應被用于指導證據整合的實施。至于如何使用 SWiM 中提到的方法進行數據合成,我們建議讀者參考 Cochrane 干預性系統評價手冊第二版,特別是第 12 章[11]。盡管報告和實施之間不可避免地存在重疊,但 SWiM 報告規范并非旨在規定方法的選擇,并且每個條目的詳細程度都并不可能完全適用。例如:異質性的審查(條目 5)可能并不總是必要或有用的。涉及到 SWiM,我們預計即將發布的 PRISMA 更新版將包含更廣泛的合成方法的新條目[32],但是該版本將不會提供無 meta 分析數據合成方法的詳細指導和示例。
SWiM 報告規范起源于 ICONS-Quant 項目,該項目旨在改善敘事性合成的透明度及其實施情況[10]。在 SWiM 中有意避免使用“敘事性合成”一詞,以促進不依賴于 Meta 分析數據合成的系統評價中所用方法的清晰度。敘事(方法)在所有研究中普遍使用,并且它可在撰寫來自各種數據的連貫故事中發揮重要作用[33, 34]。但是,在證據合成領域,定量效應估計合成中的敘述方法缺乏透明性,因而難以評估其結果的真實性[7]。SWiM 報告規范和最近發布的關于替代合成方法的其他規范[11],旨在提高無 Meta 分析數據合成的系統評價的報告透明度,進而信任這些系統評價,尤其是針對干預效應的評價。
附件
附件 1:SWiM 報告規范制訂的方法學詳細信息,下載地址:https://www.bmj.com/content/bmj/suppl/2020/01/16/bmj.l6890.DC1/camm051291.ww1.pdf.
附件 2:報告條目的示例和具體解釋,下載地址:https://www.bmj.com/content/bmj/suppl/2020/01/16/bmj.l6890.DC1/camm051291.ww2.pdf.