引用本文: 肖毅, 任彥順, 王湘輝, 項紅軍. 2014 年外科手術干預療效的英文 Meta 分析的方法學和報告質量評價. 中國循證醫學雜志, 2018, 18(2): 216-224. doi: 10.7507/1672-2531.201702070 復制
Meta 分析與系統評價采用恰當的統計學方法合并大量的證據和研究結果,得出一個簡潔明確的結論。Meta 分析結果通常被視為最高級別的(1a 級)證據[1, 2],對臨床醫生、研究人員、衛生政策制定者和醫學教育工作者來說是可信證據的一個來源[3-5]。在過去的 20 年里,各種醫學專科或亞專科發表 Meta 分析的數量日益增多。然而,并非所有刊登 Meta 分析的期刊都具有規范的標準和發表指南,因此許多已發表的 Meta 分析方法學欠佳或是先前相同主題研究的重復性工作[6],而這些低質量的研究可能會被認為具有較強可信度,甚至誤導臨床決策[7]。故不是每一個 Meta 分析都能夠達到 1a 級證據的要求[8]。
為提高 Meta 分析報告的完整性和方法的科學性,1996 年最早已出現“Meta 分析報告質量(QUOROM)”量表[9],其更新版“系統評價/Meta 分析報告指南(PRISMA)”于 2009 年出版[10, 11]。同時,AMSTAR 量表是一種評估系統評價和 Meta 分析方法學質量的理想測量工具,其已被證明具有較好的一致性、可靠性、構建有效性和可行性[12, 13]。AMSTAR 量表是由“增強總體質量評估問卷量表(OQAQ)”、Sachs 等[5]創建的質量評估清單,以及 3 個附加項目組合而成[14, 15]。無論是評估報告質量還是方法學質量,以往研究主要是調查納入研究本身的特點和 Meta 分析質量之間的關系[16-21]。目前尚無關于 Meta 分析綜合質量與研究者和發表雜志特點的相關性分析。
由于外科臨床試驗的實施局限性,如手術無法實現隨機化等,以及隨機對照試驗(RCT)規模和納入患者數量有限,評估外科手術干預方式的 Meta 分析,相比其他領域的研究更容易出現較低的報告和方法學質量[21-23]。因此,本研究搜集 2014 年發表的所有與外科手術相關的英文 Meta 分析,使用 PRISMA 和 AMSTAR 量表分別評估其報告質量和方法學質量,并通過單因素和多因素分析,對與兩種質量相關的獨立預測因素進行評估。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 采用 Meta 分析方法合并納入原始研究結果的研究;② 兩組干預措施均采用外科手術;③ 其主要終點指標是評估外科手術干預的結果或有效性。
1.1.2 排除標準
① 其他類型綜述(如概述性綜述,評論性文章或專家意見);② Cochrane 數據庫的 Meta 分析(排除 Cochrane 數據庫 Meta 分析,是因其已被證明方法學更嚴謹,且并比紙質期刊發表的系統評價或 Meta 分析更頻繁地進行更新[25]);③ 重復發表的研究。
1.2 文獻檢索策略
計算機檢索 PubMed 和 EMbase 數據庫,搜集評估外科手術干預療效的英文研究,檢索時限均從 2014 年 1 月至 2014 年 12 月。同時,追溯納入研究的參考文獻,以補充獲取相關文獻。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 位研究者獨立篩選文獻和提取資料,如遇分歧則通過討論或咨詢第三位研究者以得到解決。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① Meta 分析的作者信息,包括通信作者所在的地區和國家、與署名研究中心的隸屬關系、所有作者所在單位的數目以及是否有統計學專業人員參與研究。此外,為調查 Meta 分析的第一作者是否有 Meta 分析發表經驗,我們通過 PubMed 對納入研究的第一作者進行檢索,查找是否有既往 Meta 分析發表記錄。② 出版刊物信息,包括雜志名稱、在臨床醫學學科中的類別以及其影響因子(2014 年)、存在或不存在任何出版費用、該雜志的研究方向在該學科和主題類別中的排名(依據 2014 年 SCImago 雜志和國家排名指示的最新數據[26],分為 Q1~Q4 等級)。③ Meta 分析的基本特征,在外科中的亞專科,存在或不存在任何基金或資助來源,存在或不存在任何預注冊,如在 PROSPERO 數據庫的預注冊[27],納入研究的數目,納入 RCT 的數目,數據整合采用的方法,對研究主要終點結果的結論(陽性或陰性,兩組干預有顯著差異的為陽性,兩組干預差異無統計學意義或有爭議的結果則為陰性)。
1.4 報告質量評價
采用 PRISMA 量表評價納入研究的報告質量,它包括 27 個條目,每個 PRISMA 條目均以“是”或“否”作答。“是”表明該項目已被滿足,“否”表明該項目沒有實現。2 位研究者在期刊和作者信息隱去的前提下獨立評估了 Meta 分析的報告質量,如有分歧討論解決。
1.5 方法學質量評價
采用 AMSTAR 清單評估 Meta 分析的方法學質量,它包含 11 個項目,每個單獨的項目被判定以“是”、“否”或“不能回答”回應。“是”表明該項目已被滿足,“否”表明該項目沒有實現,“不能回答”表明不確定該項目是否滿足。2 位研究者在作者和期刊信息隱去的前提下獨立評估 Meta 分析的方法學質量,如有分歧討論解決。
1.6 統計分析
采用 Microsoft Excel 2013 軟件錄入數據,采用 SPSS 18.0 軟件進行統計分析。2 位研究者的一致性由 Kappa 值反映,三個或多個類別的變量中使用二次權重加權 Kappa 值。Kappa 值≥0.65 表示結果足夠一致。組間均數的比較采用獨立樣本 t 檢驗。兩組以上比較采用單向方差分析(ANOVA)法,其中兩個因素之間的差異使用 Dunnett t 檢驗對比分析。采用 Pearson 相關測試評估 PRISMA 和 AMSTAR 評分之間的相關性。報告和方法學質量均以兩個量表的最高四分位數得分的 75% 作為臨界值,分為高、低質量組。利用單因素分析選擇可能影響兩組綜合質量的因素,對單因素分析發現具有顯著性差異(P<0.1)的因素進行多因素 Logistic 回歸分析。當P<0.05 時,差異被認為有統計學意義。
2 結果
2.1 文獻篩選流程和結果
初檢共獲得 1 637 篇潛在符合納入標準的 Meta 分析。按照標題和摘要進行篩選后,共 238 篇被選出并由 2 位研究者獨立進行的全文審查。最后,因為各種原因排除另外 41 篇研究后,從 102 種同行評議的 SCI 引用期刊中選出共 197 篇 Meta 分析。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入 Meta 分析的基本特征
納入研究的作者多來自于亞洲地區(44.2%,87/197),其中中國作者比例最大(88.5%,77/87)。所有納入 Meta 分析的第一作者近一半(50.8%,100/197)曾經發表至少一篇 Meta 分析。大多數出版期刊(73.1%,144/197)排名在 Q1 區,其次在 Q2 區(25.9%,51/197)。三分之二的納入研究(63.5%,125/197)在 Meta 分析中納入了至少一個 RCT。此外,僅 5 篇(2.5%)Meta 分析在 PROSPERO 數據庫上進行過預注冊,具體見表 1。

2.3 報告質量評價結果
2 位研究者使用 PRISMA 清單進行報告質量評估的一致性良好[Kappa=0.78,95%CI(0.62,0.89)]。所有納入 Meta 分析的平均 PRISMA 評分為 22.2±2.4 分。評分最低的 2 個項目為項目 5(僅 13 個研究報告了研究方案和注冊相關信息)和項目 27(僅 83 個報告了基金和資金支持情況)(圖 2)。

多因素分析結果顯示,通信作者來自亞洲、發表于 Q2 或 Q3 等級的期刊、第一作者無 Meta 分析發表經驗、未提供預注冊信息,以及原始研究未納入 RCT 等均為 Meta 分析報告質量較低的因素(表 2)。

2.4 方法學質量評價結果
2 位研究者使用 AMSTAR 清單進行方法學質量評估的一致性良好[Kappa=0.63,95%CI(0.41,0.82)]。所有納入 Meta 分析的平均 PRISMA 評分為 7.8±1.2 分。評分最低的 2 個項目依次是項目 5(僅 7 個研究提供了納入和排除的研究文獻清單)和項目 4(僅 37 個研究將發表情況考慮在納入標準中),見圖 3。

多因素分析結果顯示,與報告質量結果相似,通信作者來自亞洲、發表于 Q2 或 Q3 等級的期刊、第一作者無 Meta 分析發表經驗、未提供預注冊信息,以及原始文獻未納入 RCT 研究等均為 Meta 分析方法學質量較低的因素(表 3)。Pearson 相關分析結果提示,PRISMA 和 AMSTAR 結果之間具有顯著的線性正相關性(R2=0.754)。

3 討論
本研究結果顯示,PRISMA 和 AMSTAR 評分的中位數分別為 22 分和 8 分,表明 2014 年外科領域中已發表的英文 Meta 分析報告學和方法學質量并不理想。大多數(44.2%)納入研究來自亞洲。此外,我們發現了幾個識別 Meta 分析報告質量和方法學質量的獨立預測因子,包括第一作者(即研究者)、出版期刊及預注冊等因素。
第一作者的專業背景可能會影響 Meta 分析的整體質量,但是第一作者的培訓經歷、學術背景、教育程度和學習興趣等信息難以獲得,我們無法對這些因素進行評價。本研究將第一作者以往是否曾發表 Meta 分析作為反映其經驗的一個指標,因為該指標可從既往發表論文中客觀地獲得。正如預期所料,具有發表經驗的第一作者是 Meta 分析報告和方法學質量更高的獨立預測因子。因此,應鼓勵 Meta 分析的研究者接受足夠的培訓,無論是基于大學或其他機構的 Meta 分析研討會,還是與具有扎實知識或經驗的其他作者進行合作。本研究表明,提高 Meta 分析的質量也應致力于引導研究人員以正確的知識和方法開展 Meta 分析。
較高引用潛力是 Meta 分析受到臨床醫生、研究人員和期刊編輯青睞的原因之一。在本研究中,SJR 指標來區分不同亞專科之間期刊的排名[28]。SCI 影響因子(IF)未在本研究中采用,因為各種頂級醫療專科雜志的 IF 因學科亞專業存在很多不同,尤其在外科手術領域。本研究通過多因素分析證實,發表在高級別刊物上的 Meta 分析有較高的報告質量和方法學質量。可能原因是,等級排名較高的期刊往往有更多的投稿來源,更嚴格的編輯評審過程,更高專業水準的同行評議及更加審慎的編委會決策。因此,我們的研究結果也應得到期刊編輯的注意,從而提高 Meta 分析發表的質量標準。
為了避免重復研究和減少系統評價和 Meta 分析選擇性結果報告的偏倚,來自英國、加拿大和瑞士的科學家建立了系統評價國際注冊審查協議(PROSPERO),實際上是一個預注冊和正在進行的系統評價和 Meta 分析的查詢平臺[29]。雖然本研究納入的 197 篇 Meta 分析中僅 5 篇(2.5%)報告了 PROSPERO 預注冊信息,但預注冊仍被證明是較高的 Meta 分析報告學和方法學質量的獨立預測因子。顯然,預注冊是一種很有前途并且很可能顯著改善系統評價和 Meta 分析的質量的措施,值得研究者關注。
本研究的局限性:第一,本研究所評價的 Meta 分析僅限于同行評審期刊的英文 Meta 分析,且限定發表論文類型為 Meta 分析 ,這可能存在一定漏檢。第二,雖然本研究提示納入的 RCT 可作為研究質量的獨立預測因子,并沒有被評估納入 RCT 的數量和規模與 Meta 分析質量之間的關聯。有既往研究表明,納入大樣本(≥1 000 名受試者)相比納入小樣本的 RCT 研究在 Meta 分析方法學質量上存在顯著差異[30]。第三,本研究未納入 Cochrane 系統評價。但對于發表在期刊的 Cochrane 系統評價,本研究并未將其排除在外,這可能會影響本研究的結果。
總之,目前發表于外科學 Meta 分析的報告和方法學質量均不理想。Meta 分析第一作者具有既往 Meta 分析的發表經驗和期刊等級排名與 Meta 分析的報告和方法學質量顯著相關。因此,作者和期刊編輯應共同努力,提高未來發表 Meta 分析的質量。未來的研究者應當更多采用預注冊(例如 PROSPERO)以改善 Meta 分析的質量。
Meta 分析與系統評價采用恰當的統計學方法合并大量的證據和研究結果,得出一個簡潔明確的結論。Meta 分析結果通常被視為最高級別的(1a 級)證據[1, 2],對臨床醫生、研究人員、衛生政策制定者和醫學教育工作者來說是可信證據的一個來源[3-5]。在過去的 20 年里,各種醫學專科或亞專科發表 Meta 分析的數量日益增多。然而,并非所有刊登 Meta 分析的期刊都具有規范的標準和發表指南,因此許多已發表的 Meta 分析方法學欠佳或是先前相同主題研究的重復性工作[6],而這些低質量的研究可能會被認為具有較強可信度,甚至誤導臨床決策[7]。故不是每一個 Meta 分析都能夠達到 1a 級證據的要求[8]。
為提高 Meta 分析報告的完整性和方法的科學性,1996 年最早已出現“Meta 分析報告質量(QUOROM)”量表[9],其更新版“系統評價/Meta 分析報告指南(PRISMA)”于 2009 年出版[10, 11]。同時,AMSTAR 量表是一種評估系統評價和 Meta 分析方法學質量的理想測量工具,其已被證明具有較好的一致性、可靠性、構建有效性和可行性[12, 13]。AMSTAR 量表是由“增強總體質量評估問卷量表(OQAQ)”、Sachs 等[5]創建的質量評估清單,以及 3 個附加項目組合而成[14, 15]。無論是評估報告質量還是方法學質量,以往研究主要是調查納入研究本身的特點和 Meta 分析質量之間的關系[16-21]。目前尚無關于 Meta 分析綜合質量與研究者和發表雜志特點的相關性分析。
由于外科臨床試驗的實施局限性,如手術無法實現隨機化等,以及隨機對照試驗(RCT)規模和納入患者數量有限,評估外科手術干預方式的 Meta 分析,相比其他領域的研究更容易出現較低的報告和方法學質量[21-23]。因此,本研究搜集 2014 年發表的所有與外科手術相關的英文 Meta 分析,使用 PRISMA 和 AMSTAR 量表分別評估其報告質量和方法學質量,并通過單因素和多因素分析,對與兩種質量相關的獨立預測因素進行評估。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 采用 Meta 分析方法合并納入原始研究結果的研究;② 兩組干預措施均采用外科手術;③ 其主要終點指標是評估外科手術干預的結果或有效性。
1.1.2 排除標準
① 其他類型綜述(如概述性綜述,評論性文章或專家意見);② Cochrane 數據庫的 Meta 分析(排除 Cochrane 數據庫 Meta 分析,是因其已被證明方法學更嚴謹,且并比紙質期刊發表的系統評價或 Meta 分析更頻繁地進行更新[25]);③ 重復發表的研究。
1.2 文獻檢索策略
計算機檢索 PubMed 和 EMbase 數據庫,搜集評估外科手術干預療效的英文研究,檢索時限均從 2014 年 1 月至 2014 年 12 月。同時,追溯納入研究的參考文獻,以補充獲取相關文獻。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 位研究者獨立篩選文獻和提取資料,如遇分歧則通過討論或咨詢第三位研究者以得到解決。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① Meta 分析的作者信息,包括通信作者所在的地區和國家、與署名研究中心的隸屬關系、所有作者所在單位的數目以及是否有統計學專業人員參與研究。此外,為調查 Meta 分析的第一作者是否有 Meta 分析發表經驗,我們通過 PubMed 對納入研究的第一作者進行檢索,查找是否有既往 Meta 分析發表記錄。② 出版刊物信息,包括雜志名稱、在臨床醫學學科中的類別以及其影響因子(2014 年)、存在或不存在任何出版費用、該雜志的研究方向在該學科和主題類別中的排名(依據 2014 年 SCImago 雜志和國家排名指示的最新數據[26],分為 Q1~Q4 等級)。③ Meta 分析的基本特征,在外科中的亞專科,存在或不存在任何基金或資助來源,存在或不存在任何預注冊,如在 PROSPERO 數據庫的預注冊[27],納入研究的數目,納入 RCT 的數目,數據整合采用的方法,對研究主要終點結果的結論(陽性或陰性,兩組干預有顯著差異的為陽性,兩組干預差異無統計學意義或有爭議的結果則為陰性)。
1.4 報告質量評價
采用 PRISMA 量表評價納入研究的報告質量,它包括 27 個條目,每個 PRISMA 條目均以“是”或“否”作答。“是”表明該項目已被滿足,“否”表明該項目沒有實現。2 位研究者在期刊和作者信息隱去的前提下獨立評估了 Meta 分析的報告質量,如有分歧討論解決。
1.5 方法學質量評價
采用 AMSTAR 清單評估 Meta 分析的方法學質量,它包含 11 個項目,每個單獨的項目被判定以“是”、“否”或“不能回答”回應。“是”表明該項目已被滿足,“否”表明該項目沒有實現,“不能回答”表明不確定該項目是否滿足。2 位研究者在作者和期刊信息隱去的前提下獨立評估 Meta 分析的方法學質量,如有分歧討論解決。
1.6 統計分析
采用 Microsoft Excel 2013 軟件錄入數據,采用 SPSS 18.0 軟件進行統計分析。2 位研究者的一致性由 Kappa 值反映,三個或多個類別的變量中使用二次權重加權 Kappa 值。Kappa 值≥0.65 表示結果足夠一致。組間均數的比較采用獨立樣本 t 檢驗。兩組以上比較采用單向方差分析(ANOVA)法,其中兩個因素之間的差異使用 Dunnett t 檢驗對比分析。采用 Pearson 相關測試評估 PRISMA 和 AMSTAR 評分之間的相關性。報告和方法學質量均以兩個量表的最高四分位數得分的 75% 作為臨界值,分為高、低質量組。利用單因素分析選擇可能影響兩組綜合質量的因素,對單因素分析發現具有顯著性差異(P<0.1)的因素進行多因素 Logistic 回歸分析。當P<0.05 時,差異被認為有統計學意義。
2 結果
2.1 文獻篩選流程和結果
初檢共獲得 1 637 篇潛在符合納入標準的 Meta 分析。按照標題和摘要進行篩選后,共 238 篇被選出并由 2 位研究者獨立進行的全文審查。最后,因為各種原因排除另外 41 篇研究后,從 102 種同行評議的 SCI 引用期刊中選出共 197 篇 Meta 分析。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入 Meta 分析的基本特征
納入研究的作者多來自于亞洲地區(44.2%,87/197),其中中國作者比例最大(88.5%,77/87)。所有納入 Meta 分析的第一作者近一半(50.8%,100/197)曾經發表至少一篇 Meta 分析。大多數出版期刊(73.1%,144/197)排名在 Q1 區,其次在 Q2 區(25.9%,51/197)。三分之二的納入研究(63.5%,125/197)在 Meta 分析中納入了至少一個 RCT。此外,僅 5 篇(2.5%)Meta 分析在 PROSPERO 數據庫上進行過預注冊,具體見表 1。

2.3 報告質量評價結果
2 位研究者使用 PRISMA 清單進行報告質量評估的一致性良好[Kappa=0.78,95%CI(0.62,0.89)]。所有納入 Meta 分析的平均 PRISMA 評分為 22.2±2.4 分。評分最低的 2 個項目為項目 5(僅 13 個研究報告了研究方案和注冊相關信息)和項目 27(僅 83 個報告了基金和資金支持情況)(圖 2)。

多因素分析結果顯示,通信作者來自亞洲、發表于 Q2 或 Q3 等級的期刊、第一作者無 Meta 分析發表經驗、未提供預注冊信息,以及原始研究未納入 RCT 等均為 Meta 分析報告質量較低的因素(表 2)。

2.4 方法學質量評價結果
2 位研究者使用 AMSTAR 清單進行方法學質量評估的一致性良好[Kappa=0.63,95%CI(0.41,0.82)]。所有納入 Meta 分析的平均 PRISMA 評分為 7.8±1.2 分。評分最低的 2 個項目依次是項目 5(僅 7 個研究提供了納入和排除的研究文獻清單)和項目 4(僅 37 個研究將發表情況考慮在納入標準中),見圖 3。

多因素分析結果顯示,與報告質量結果相似,通信作者來自亞洲、發表于 Q2 或 Q3 等級的期刊、第一作者無 Meta 分析發表經驗、未提供預注冊信息,以及原始文獻未納入 RCT 研究等均為 Meta 分析方法學質量較低的因素(表 3)。Pearson 相關分析結果提示,PRISMA 和 AMSTAR 結果之間具有顯著的線性正相關性(R2=0.754)。

3 討論
本研究結果顯示,PRISMA 和 AMSTAR 評分的中位數分別為 22 分和 8 分,表明 2014 年外科領域中已發表的英文 Meta 分析報告學和方法學質量并不理想。大多數(44.2%)納入研究來自亞洲。此外,我們發現了幾個識別 Meta 分析報告質量和方法學質量的獨立預測因子,包括第一作者(即研究者)、出版期刊及預注冊等因素。
第一作者的專業背景可能會影響 Meta 分析的整體質量,但是第一作者的培訓經歷、學術背景、教育程度和學習興趣等信息難以獲得,我們無法對這些因素進行評價。本研究將第一作者以往是否曾發表 Meta 分析作為反映其經驗的一個指標,因為該指標可從既往發表論文中客觀地獲得。正如預期所料,具有發表經驗的第一作者是 Meta 分析報告和方法學質量更高的獨立預測因子。因此,應鼓勵 Meta 分析的研究者接受足夠的培訓,無論是基于大學或其他機構的 Meta 分析研討會,還是與具有扎實知識或經驗的其他作者進行合作。本研究表明,提高 Meta 分析的質量也應致力于引導研究人員以正確的知識和方法開展 Meta 分析。
較高引用潛力是 Meta 分析受到臨床醫生、研究人員和期刊編輯青睞的原因之一。在本研究中,SJR 指標來區分不同亞專科之間期刊的排名[28]。SCI 影響因子(IF)未在本研究中采用,因為各種頂級醫療專科雜志的 IF 因學科亞專業存在很多不同,尤其在外科手術領域。本研究通過多因素分析證實,發表在高級別刊物上的 Meta 分析有較高的報告質量和方法學質量。可能原因是,等級排名較高的期刊往往有更多的投稿來源,更嚴格的編輯評審過程,更高專業水準的同行評議及更加審慎的編委會決策。因此,我們的研究結果也應得到期刊編輯的注意,從而提高 Meta 分析發表的質量標準。
為了避免重復研究和減少系統評價和 Meta 分析選擇性結果報告的偏倚,來自英國、加拿大和瑞士的科學家建立了系統評價國際注冊審查協議(PROSPERO),實際上是一個預注冊和正在進行的系統評價和 Meta 分析的查詢平臺[29]。雖然本研究納入的 197 篇 Meta 分析中僅 5 篇(2.5%)報告了 PROSPERO 預注冊信息,但預注冊仍被證明是較高的 Meta 分析報告學和方法學質量的獨立預測因子。顯然,預注冊是一種很有前途并且很可能顯著改善系統評價和 Meta 分析的質量的措施,值得研究者關注。
本研究的局限性:第一,本研究所評價的 Meta 分析僅限于同行評審期刊的英文 Meta 分析,且限定發表論文類型為 Meta 分析 ,這可能存在一定漏檢。第二,雖然本研究提示納入的 RCT 可作為研究質量的獨立預測因子,并沒有被評估納入 RCT 的數量和規模與 Meta 分析質量之間的關聯。有既往研究表明,納入大樣本(≥1 000 名受試者)相比納入小樣本的 RCT 研究在 Meta 分析方法學質量上存在顯著差異[30]。第三,本研究未納入 Cochrane 系統評價。但對于發表在期刊的 Cochrane 系統評價,本研究并未將其排除在外,這可能會影響本研究的結果。
總之,目前發表于外科學 Meta 分析的報告和方法學質量均不理想。Meta 分析第一作者具有既往 Meta 分析的發表經驗和期刊等級排名與 Meta 分析的報告和方法學質量顯著相關。因此,作者和期刊編輯應共同努力,提高未來發表 Meta 分析的質量。未來的研究者應當更多采用預注冊(例如 PROSPERO)以改善 Meta 分析的質量。