引用本文: 郭瓊, 張晨陽, 楊柳, 楊會芳, 王心怡, 龍囿霖, 程祎凡, 馮堃, 黃進, 杜亮. 針刺干預系統評價的文獻篩選結果報告質量及其影響因素分析. 中國循證醫學雜志, 2022, 22(1): 89-96. doi: 10.7507/1672-2531.202111128 復制
針刺是一種傳統的中醫療法,在我國已有5 000多年的歷史,通常指在身體的特定部位將細針刺入體表的穴位,然后用手或電流進行刺激,針刺治療的形式多種多樣,包括電針、溫針、火針、靳三針、肩三針、舌針等[1]。目前世界上有183個國家和地區應用針刺,103個世界衛生組織成員國承認針刺療法的合法地位,其中18個甚至已將其納入醫療保險體系[2-4]。隨著針刺的廣泛應用,開展和發表的臨床研究越來越多,尤其是隨機對照試驗(randomized controlled trial,RCT)的數量和占比均明顯增加[4],基于針刺干預RCT的系統評價(systematic review,SR)數量也快速增加[5]。
SR是一種文獻綜合方法,是證據合成的金標準,常為醫學研究提供最佳證據,為政策的制定和實踐提供信息[6-7]。SR的制作和報告質量低下可能給結果帶來偏倚。2014年英國布里斯托爾大學牽頭制訂的SR偏倚風險評價工具ROBIS將偏倚產生的過程分為:納入排除過程、文獻檢索與篩選過程、數據提取與質量評價過程,以及數據合成與結果呈現過程四個領域,任一過程產生的偏倚均可能誤導臨床實踐和決策[8]。其中,文獻篩選環節是開展SR的初始步驟之一,該過程實施不當可引發選擇偏倚、錯分偏倚、實施偏倚和報告偏倚等,影響最終的研究結果[9]。
為提高SR/Meta分析的報告一致性和透明度,2009年Moher等制訂了SR和Meta分析優選報告條目清單(the preferred reporting items for systematic reviews and meta-analyses,PRISMA),旨在解決SR/Meta分析報告不當的問題[10-12]。有研究采用PRISMA聲明2009對中國科學引文數據庫收錄針灸期刊發表的Meta分析進行評價,結果顯示總體報告質量良好,但文獻篩選結果完整報告率僅56.5%[13]。然而,該研究納入研究少且僅局限于針灸專業期刊,對所有針刺干預SR的代表性較差。2014年的一項研究對476篇針刺干預SR的報告質量評價結果顯示,針刺干預SR對文獻篩選結果的報告率高達90.34%[14]。該研究僅從報告與否來評價文獻篩選結果的報告情況,未考慮報告內容的完整性和充分性,對其質量評價不全面。
PRISMA聲明2009明確要求,對文獻篩選環節應報告:① 初篩研究數;② 評價是否符合納入標準的研究數;③ 最終納入研究數;④ 每一階段排除的原因;⑤ 篩選流程圖(最好提供)[11]。前4部分包含了數據庫中的重復研究數,初篩、復篩情況及最終納入的定性和定量分析的研究數等。這4部分內容的完整和充分報告有利于SR文獻篩選全過程的溯源,提高篩選過程的透明性,同時有助于讀者判斷有無篩選不足或過度的問題,評估該過程的偏倚風險(如發表偏倚、選擇偏倚等)[15]。另外,篩選流程圖能清晰地展示篩選的思路、流程和各環節的結果,有助于對篩選過程的復現和復核,評估篩選過程的真實性和可靠性[16]。因此,盡管PRISMA聲明2009未強制要求報告,但文獻篩選流程圖的報告也很重要,尤其對于檢出文獻數量大、篩選過程復雜、納排標準多的研究,流程圖可讓整個篩選過程更加直觀易懂[17]。因此,本研究旨在了解針刺干預SR的文獻篩選結果報告方式及內容現狀,并分析影響其完整報告的因素,為今后提高針刺干預SR對文獻篩選結果的報告質量提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
針刺干預的SR或Meta分析。
1.1.2 研究對象
接受針刺干預的患者,其種族、國籍、病程不限。
1.1.3 干預措施
試驗組采用電針、舌針、眼針、頭針、腹針等針刺療法,對照組不限。
1.1.4 結局指標
① 有效性;② 安全性。
1.1.5 排除標準
① 干預類型為針藥聯合;② 針刺僅為輔助治療;③ 干預類型為針刺相關療法,即采用針以外形式刺激穴位,包括穴位按壓、穴位埋線、推拿和艾灸等;④ 無檢索篩選信息;⑤ 基于動物研究的SR;⑥ 重復發表文獻;⑦ 非中、英文文獻;⑧ 無法獲取全文。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、CNKI、WanFang Data和VIP數據庫,搜集關于針刺干預的SR/Meta分析,檢索時限均為建庫至2019年12月31日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。英文檢索詞包括acupuncture、electroacupuncture、systematic review、meta-analysis等;中文檢索詞包括針刺、電針、系統評價、Meta分析等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選和資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入研究的基本信息,包括:發表年份、發表國家、發表語言、發表期刊、全文頁碼數、納入研究數、檢索數據庫個數和研究疾病;② 文獻篩選結果報告方式,包括:僅文字、僅流程圖,以及文字+流程圖3種;③ 文獻篩選結果報告內容:初篩研究數、評價是否符合納入標準的研究數、最終納入SR的研究數和每一階段排除的原因4部分[11]。本研究將同時報告了以上4部分內容定義為完整報告。
1.4 統計分析
采用Excel 2016軟件和SPSS 16.0軟件進行統計分析。所有計數指標采用頻數及百分比描述。為充分了解不同發表語言的SR的報告方式及報告內容,我們基于發表語言的不同類型進行亞組分析,亞組間采用χ2檢驗進行比較分析。采用logistic回歸模型分析文獻篩選結果完整報告的影響因素[18],其中因變量是SR中文獻篩選結果的完整報告率,自變量包括SR的發表時間(PRISMA聲明發布前,即≤2009年;PRISMA聲明發布后,即>2009年)、發表國家(中國,其他國家)、全文發表語言(中文,英文)、發表期刊類型(SCI,非SCI)、全文頁碼數(<10頁,≥10頁)、檢索數據庫個數(1~5個,6~10個,>10個)和納入研究數(<10篇,≥10篇)。首先,采用向前法進行單因素logistic回歸分析。對于陽性結果指標采用向前逐步回歸,基于最大似然估計的方法(逐步概率:變量進入P<0.05;變量剔除P>0.10)進行多因素logistic回歸分析。采用Hosmer-Lemeshow擬合優度法檢驗logistic回歸模型,采用方差膨脹因子(variance inflation factor,VIF)檢測自變量之間是否存在共線性,若VIF>10則認為變量之間存在共線性。所有統計學檢驗水準均設置為α=0.05。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻8 349篇,經逐層篩選后,最終納入1 227個SR/Meta分析。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表1。針刺SR的發文量在2006年前較少,隨后呈逐年上升趨勢,其中中文發表比英文發表的SR增長更快(圖2)。


2.3 文獻篩選結果報告方式
所有納入的SR均報告了文獻篩選結果,447篇(36.4%)僅采用文字報告,6篇(0.5%)僅通過流程圖報告,774篇(63.1%)采用文字和流程圖相結合的方式報告,其中英文SR采用文字和流程圖結合報告的比例(84.6%)遠高于中文SR(46.9%)(P<0.001)(表2)。

2.4 文獻篩選結果報告內容
所有SR均報告了最終納入研究數,報告率較高的是初篩研究數(94.5%),評價是否符合納入標準研究數的報告率為73.2%,報告率最低的是每一階段排除的原因(67.0%),尤其對于中文SR,僅約半數(50.9%)研究報告了每一階段排除的原因。除最終納入研究數外,英文SR每一部分內容的報告率均顯著高于中文(P=0.071、P<0.001、P<0.001)(圖3)。

關于文獻篩選結果的完整報告情況,765篇(62.3%)SR完整報告了4部分內容,208篇(17.0%)SR僅報告初篩的研究數和最終納入SR的研究數,131篇(10.7%)SR同時報告了初篩的研究數、評價是否符合納入標準的研究數和最終納入SR的研究數。其中,英文SR完整報告四部分內容占比(85.6%)遠高于中文SR(44.9%)(P<0.001),超過1/4的中文SR僅報告初篩的研究數和最終納入SR的研究數(表3)。

2.5 文獻篩選結果完整報告率的影響因素分析
采用二元logistic回歸分析進行單因素分析,結果顯示SR的文獻篩選結果完整報告率與發表時間、發表國家、發表語言、期刊類型、全文頁碼數、檢索數據庫個數和納入研究數均有關。多因素logistic回歸分析結果顯示,在PRISMA聲明發布后發表、在SCI期刊上發表、全文頁碼數>10頁、檢索數據庫個數>5個的SR文獻篩選結果的完整報告率更高(表4)。Hosmer-Lemeshow 擬合優度檢驗顯示該模型擬合程度較好(P=0.43),VIF在1.02~1.44之間,認為共線性問題可忽略。

3 討論
本研究發現,基于PRISMA聲明2009,針刺干預SR文獻篩選結果的完整報告率僅為62.3%,報告率較低的內容包括每一階段排除的原因(67.0%)、評價是否符合納入標準的研究數(73.2%)。此外,文獻篩選流程圖的報告率也較低(63.6%)。中文SR報告率均顯著低于英文SR。多因素logistic回歸分析結果顯示,發表時間、期刊類型、篇幅長短和檢索數據庫數量均與文獻篩選結果報告完整性相關(P<0.001)。
首先,對于文獻篩選結果要求報告的4部分內容,每一階段排除的原因和評價是否符合納入標準的研究數的報告率低。但它們特別是復篩階段的排除原因,對提高文獻篩選過程的透明性非常重要,其有助于了解篩選邏輯,判斷排除理由是否合理。如因未報告某個結局指標而排除研究,可能會提高選擇性報告偏倚的風險[16]。因此,期刊、學者等應對于SR篩選中間環節的報告給予重視,并且最好同時報告初篩及進入全文復篩的標準,因為過嚴或過寬的標準都可能導致漏篩,影響最終納入文獻數。
其次,針刺干預SR對文獻篩選流程圖的報告率也較低,尤其是中文SR。既往研究也發現只有約50%的SR使用了流程圖[17,19]。然而流程圖不僅包含以上要求報告的4部分內容,而且包含數據庫檢出文獻數和其他來源的文獻數,對其充分報告還有助于評估檢索的全面性及可靠性,有利于讀者了解篩選過程的順序并發現偏倚來源,如選擇偏倚[17]。因此,PRISMA聲明2009和PRISMA聲明2020都建議最好報告流程圖[10,11]。流程圖報告率不高可能與研究者對這一環節的忽視,期刊對SR報告規范要求不嚴格及文章篇幅限制有關,尤其是中文SR,不但受發表篇幅限制且多無增強出版功能(即未提供附件發表功能),更加促使作者簡化報告[20]。
此外,文獻篩選結果完整報告的影響因素分析結果顯示,PRISMA聲明發布后發表的SR文獻篩選完整報告率顯著增加,提示PRISMA聲明有助于提高SR報告的規范性。Liu等[14]發現PRISMA聲明發布前后針刺干預SR的文獻篩選結果報告率沒有統計學差異,這可能是因為該研究僅評估文獻篩選結果報告與否,未考慮報告的完整性。在其他領域,PRISMA聲明發布后的研究報告質量也明顯高于PRISMA聲明發布前[21,22],尤其是文獻篩選結果報告方面差異也具有顯著性[22]。這說明規范文件的發布對研究質量的提升會產生直接影響,這與要求臨床試驗注冊后其注冊率顯著提高類似[23]。另外,本研究單因素分析顯示發表期刊、發表語言和發表國家都與文獻篩選結果完整報告率相關,但三者之間有明顯的相關性,因為非SCI期刊主要是中國期刊,其收錄主要為中國學者以中文發表的文章。在多因素分析時通過變量篩選僅保留了發表期刊變量,結果顯示發表在SCI期刊的針刺干預SR的報告率是非SCI期刊的4.9倍,可能是因為SCI期刊對SR的報告規范執行更好。既往研究也發現SCI期刊關于PRISMA聲明的報告總體上要比非SCI期刊的報告更完整,包括文獻篩選結果[14]。在其他領域,結果也相似[21]。而發表全文頁碼數超過10頁的研究,中文主要是學位論文,而英文多為Cochrane SR,由于Cochrane協作網要求詳實報告,故完整報告率高[24]。相似地,Sun等[21]也發現全文頁碼數超過13頁的SR的PRISMA聲明得分顯著更高。期刊對字數、圖表的限制可能使得作者省略報告部分信息,故篇幅限制在一定程度上可能降低研究的報告質量。而關于檢索數據庫個數,通常檢索數據庫越多的研究,作者越傾向于全面檢索,研究質量可能更高,進而報告更加規范[25]。以上研究結果提示期刊應加強對文獻篩選結果報告規范性和完整性的審核,同時可考慮開設SR/Meta分析的專欄,減少對其字數和版面限制,中文期刊建議建立在線閱讀系統以提供補充數據;而對于SR作者,建議全面學習研究報告規范,研究過程多咨詢相關專業人員,不斷提升研究質量。
既往有研究評估中醫藥SR[26],甚至針刺干預SR的整體報告質量[13,14],但本研究首次全面檢索中英文針刺干預SR,重點關注文獻篩選結果的報告,包括報告內容和報告方式,同時分析其報告質量的影響因素。但本研究也存在一定的局限性:① 未檢索非中、英文數據庫,也未納入其他語種的研究,存在選擇性偏倚的可能;② 本研究探討的完整報告率的影響因素多為間接因素,而可能直接影響論文報告質量的因素包括作者個人水平、是否接受過方法學培訓等無法評估;③ 本研究僅基于PRISMA聲明2009評估了文獻篩選結果報告的完整性,而未對報告是否充分進行評估,這也提示PRISMA聲明應進一步完善報告內容的具體要求,如報告最終納入SR的研究數應分別報告定性和定量分析的研究數。
綜上所述,目前針刺干預SR的文獻篩選結果完整報告率較低,中文SR遠差于英文SR。對于PRISMA聲明發布后發表、在SCI期刊上發表、篇幅更長、檢索數據庫多的SR,文獻篩選結果完整報告率更高。要提高文獻篩選結果的報告質量需從制定詳細報告規范及期刊政策要求等宏觀層面加以約束。
針刺是一種傳統的中醫療法,在我國已有5 000多年的歷史,通常指在身體的特定部位將細針刺入體表的穴位,然后用手或電流進行刺激,針刺治療的形式多種多樣,包括電針、溫針、火針、靳三針、肩三針、舌針等[1]。目前世界上有183個國家和地區應用針刺,103個世界衛生組織成員國承認針刺療法的合法地位,其中18個甚至已將其納入醫療保險體系[2-4]。隨著針刺的廣泛應用,開展和發表的臨床研究越來越多,尤其是隨機對照試驗(randomized controlled trial,RCT)的數量和占比均明顯增加[4],基于針刺干預RCT的系統評價(systematic review,SR)數量也快速增加[5]。
SR是一種文獻綜合方法,是證據合成的金標準,常為醫學研究提供最佳證據,為政策的制定和實踐提供信息[6-7]。SR的制作和報告質量低下可能給結果帶來偏倚。2014年英國布里斯托爾大學牽頭制訂的SR偏倚風險評價工具ROBIS將偏倚產生的過程分為:納入排除過程、文獻檢索與篩選過程、數據提取與質量評價過程,以及數據合成與結果呈現過程四個領域,任一過程產生的偏倚均可能誤導臨床實踐和決策[8]。其中,文獻篩選環節是開展SR的初始步驟之一,該過程實施不當可引發選擇偏倚、錯分偏倚、實施偏倚和報告偏倚等,影響最終的研究結果[9]。
為提高SR/Meta分析的報告一致性和透明度,2009年Moher等制訂了SR和Meta分析優選報告條目清單(the preferred reporting items for systematic reviews and meta-analyses,PRISMA),旨在解決SR/Meta分析報告不當的問題[10-12]。有研究采用PRISMA聲明2009對中國科學引文數據庫收錄針灸期刊發表的Meta分析進行評價,結果顯示總體報告質量良好,但文獻篩選結果完整報告率僅56.5%[13]。然而,該研究納入研究少且僅局限于針灸專業期刊,對所有針刺干預SR的代表性較差。2014年的一項研究對476篇針刺干預SR的報告質量評價結果顯示,針刺干預SR對文獻篩選結果的報告率高達90.34%[14]。該研究僅從報告與否來評價文獻篩選結果的報告情況,未考慮報告內容的完整性和充分性,對其質量評價不全面。
PRISMA聲明2009明確要求,對文獻篩選環節應報告:① 初篩研究數;② 評價是否符合納入標準的研究數;③ 最終納入研究數;④ 每一階段排除的原因;⑤ 篩選流程圖(最好提供)[11]。前4部分包含了數據庫中的重復研究數,初篩、復篩情況及最終納入的定性和定量分析的研究數等。這4部分內容的完整和充分報告有利于SR文獻篩選全過程的溯源,提高篩選過程的透明性,同時有助于讀者判斷有無篩選不足或過度的問題,評估該過程的偏倚風險(如發表偏倚、選擇偏倚等)[15]。另外,篩選流程圖能清晰地展示篩選的思路、流程和各環節的結果,有助于對篩選過程的復現和復核,評估篩選過程的真實性和可靠性[16]。因此,盡管PRISMA聲明2009未強制要求報告,但文獻篩選流程圖的報告也很重要,尤其對于檢出文獻數量大、篩選過程復雜、納排標準多的研究,流程圖可讓整個篩選過程更加直觀易懂[17]。因此,本研究旨在了解針刺干預SR的文獻篩選結果報告方式及內容現狀,并分析影響其完整報告的因素,為今后提高針刺干預SR對文獻篩選結果的報告質量提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
針刺干預的SR或Meta分析。
1.1.2 研究對象
接受針刺干預的患者,其種族、國籍、病程不限。
1.1.3 干預措施
試驗組采用電針、舌針、眼針、頭針、腹針等針刺療法,對照組不限。
1.1.4 結局指標
① 有效性;② 安全性。
1.1.5 排除標準
① 干預類型為針藥聯合;② 針刺僅為輔助治療;③ 干預類型為針刺相關療法,即采用針以外形式刺激穴位,包括穴位按壓、穴位埋線、推拿和艾灸等;④ 無檢索篩選信息;⑤ 基于動物研究的SR;⑥ 重復發表文獻;⑦ 非中、英文文獻;⑧ 無法獲取全文。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、CNKI、WanFang Data和VIP數據庫,搜集關于針刺干預的SR/Meta分析,檢索時限均為建庫至2019年12月31日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。英文檢索詞包括acupuncture、electroacupuncture、systematic review、meta-analysis等;中文檢索詞包括針刺、電針、系統評價、Meta分析等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選和資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入研究的基本信息,包括:發表年份、發表國家、發表語言、發表期刊、全文頁碼數、納入研究數、檢索數據庫個數和研究疾病;② 文獻篩選結果報告方式,包括:僅文字、僅流程圖,以及文字+流程圖3種;③ 文獻篩選結果報告內容:初篩研究數、評價是否符合納入標準的研究數、最終納入SR的研究數和每一階段排除的原因4部分[11]。本研究將同時報告了以上4部分內容定義為完整報告。
1.4 統計分析
采用Excel 2016軟件和SPSS 16.0軟件進行統計分析。所有計數指標采用頻數及百分比描述。為充分了解不同發表語言的SR的報告方式及報告內容,我們基于發表語言的不同類型進行亞組分析,亞組間采用χ2檢驗進行比較分析。采用logistic回歸模型分析文獻篩選結果完整報告的影響因素[18],其中因變量是SR中文獻篩選結果的完整報告率,自變量包括SR的發表時間(PRISMA聲明發布前,即≤2009年;PRISMA聲明發布后,即>2009年)、發表國家(中國,其他國家)、全文發表語言(中文,英文)、發表期刊類型(SCI,非SCI)、全文頁碼數(<10頁,≥10頁)、檢索數據庫個數(1~5個,6~10個,>10個)和納入研究數(<10篇,≥10篇)。首先,采用向前法進行單因素logistic回歸分析。對于陽性結果指標采用向前逐步回歸,基于最大似然估計的方法(逐步概率:變量進入P<0.05;變量剔除P>0.10)進行多因素logistic回歸分析。采用Hosmer-Lemeshow擬合優度法檢驗logistic回歸模型,采用方差膨脹因子(variance inflation factor,VIF)檢測自變量之間是否存在共線性,若VIF>10則認為變量之間存在共線性。所有統計學檢驗水準均設置為α=0.05。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻8 349篇,經逐層篩選后,最終納入1 227個SR/Meta分析。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表1。針刺SR的發文量在2006年前較少,隨后呈逐年上升趨勢,其中中文發表比英文發表的SR增長更快(圖2)。


2.3 文獻篩選結果報告方式
所有納入的SR均報告了文獻篩選結果,447篇(36.4%)僅采用文字報告,6篇(0.5%)僅通過流程圖報告,774篇(63.1%)采用文字和流程圖相結合的方式報告,其中英文SR采用文字和流程圖結合報告的比例(84.6%)遠高于中文SR(46.9%)(P<0.001)(表2)。

2.4 文獻篩選結果報告內容
所有SR均報告了最終納入研究數,報告率較高的是初篩研究數(94.5%),評價是否符合納入標準研究數的報告率為73.2%,報告率最低的是每一階段排除的原因(67.0%),尤其對于中文SR,僅約半數(50.9%)研究報告了每一階段排除的原因。除最終納入研究數外,英文SR每一部分內容的報告率均顯著高于中文(P=0.071、P<0.001、P<0.001)(圖3)。

關于文獻篩選結果的完整報告情況,765篇(62.3%)SR完整報告了4部分內容,208篇(17.0%)SR僅報告初篩的研究數和最終納入SR的研究數,131篇(10.7%)SR同時報告了初篩的研究數、評價是否符合納入標準的研究數和最終納入SR的研究數。其中,英文SR完整報告四部分內容占比(85.6%)遠高于中文SR(44.9%)(P<0.001),超過1/4的中文SR僅報告初篩的研究數和最終納入SR的研究數(表3)。

2.5 文獻篩選結果完整報告率的影響因素分析
采用二元logistic回歸分析進行單因素分析,結果顯示SR的文獻篩選結果完整報告率與發表時間、發表國家、發表語言、期刊類型、全文頁碼數、檢索數據庫個數和納入研究數均有關。多因素logistic回歸分析結果顯示,在PRISMA聲明發布后發表、在SCI期刊上發表、全文頁碼數>10頁、檢索數據庫個數>5個的SR文獻篩選結果的完整報告率更高(表4)。Hosmer-Lemeshow 擬合優度檢驗顯示該模型擬合程度較好(P=0.43),VIF在1.02~1.44之間,認為共線性問題可忽略。

3 討論
本研究發現,基于PRISMA聲明2009,針刺干預SR文獻篩選結果的完整報告率僅為62.3%,報告率較低的內容包括每一階段排除的原因(67.0%)、評價是否符合納入標準的研究數(73.2%)。此外,文獻篩選流程圖的報告率也較低(63.6%)。中文SR報告率均顯著低于英文SR。多因素logistic回歸分析結果顯示,發表時間、期刊類型、篇幅長短和檢索數據庫數量均與文獻篩選結果報告完整性相關(P<0.001)。
首先,對于文獻篩選結果要求報告的4部分內容,每一階段排除的原因和評價是否符合納入標準的研究數的報告率低。但它們特別是復篩階段的排除原因,對提高文獻篩選過程的透明性非常重要,其有助于了解篩選邏輯,判斷排除理由是否合理。如因未報告某個結局指標而排除研究,可能會提高選擇性報告偏倚的風險[16]。因此,期刊、學者等應對于SR篩選中間環節的報告給予重視,并且最好同時報告初篩及進入全文復篩的標準,因為過嚴或過寬的標準都可能導致漏篩,影響最終納入文獻數。
其次,針刺干預SR對文獻篩選流程圖的報告率也較低,尤其是中文SR。既往研究也發現只有約50%的SR使用了流程圖[17,19]。然而流程圖不僅包含以上要求報告的4部分內容,而且包含數據庫檢出文獻數和其他來源的文獻數,對其充分報告還有助于評估檢索的全面性及可靠性,有利于讀者了解篩選過程的順序并發現偏倚來源,如選擇偏倚[17]。因此,PRISMA聲明2009和PRISMA聲明2020都建議最好報告流程圖[10,11]。流程圖報告率不高可能與研究者對這一環節的忽視,期刊對SR報告規范要求不嚴格及文章篇幅限制有關,尤其是中文SR,不但受發表篇幅限制且多無增強出版功能(即未提供附件發表功能),更加促使作者簡化報告[20]。
此外,文獻篩選結果完整報告的影響因素分析結果顯示,PRISMA聲明發布后發表的SR文獻篩選完整報告率顯著增加,提示PRISMA聲明有助于提高SR報告的規范性。Liu等[14]發現PRISMA聲明發布前后針刺干預SR的文獻篩選結果報告率沒有統計學差異,這可能是因為該研究僅評估文獻篩選結果報告與否,未考慮報告的完整性。在其他領域,PRISMA聲明發布后的研究報告質量也明顯高于PRISMA聲明發布前[21,22],尤其是文獻篩選結果報告方面差異也具有顯著性[22]。這說明規范文件的發布對研究質量的提升會產生直接影響,這與要求臨床試驗注冊后其注冊率顯著提高類似[23]。另外,本研究單因素分析顯示發表期刊、發表語言和發表國家都與文獻篩選結果完整報告率相關,但三者之間有明顯的相關性,因為非SCI期刊主要是中國期刊,其收錄主要為中國學者以中文發表的文章。在多因素分析時通過變量篩選僅保留了發表期刊變量,結果顯示發表在SCI期刊的針刺干預SR的報告率是非SCI期刊的4.9倍,可能是因為SCI期刊對SR的報告規范執行更好。既往研究也發現SCI期刊關于PRISMA聲明的報告總體上要比非SCI期刊的報告更完整,包括文獻篩選結果[14]。在其他領域,結果也相似[21]。而發表全文頁碼數超過10頁的研究,中文主要是學位論文,而英文多為Cochrane SR,由于Cochrane協作網要求詳實報告,故完整報告率高[24]。相似地,Sun等[21]也發現全文頁碼數超過13頁的SR的PRISMA聲明得分顯著更高。期刊對字數、圖表的限制可能使得作者省略報告部分信息,故篇幅限制在一定程度上可能降低研究的報告質量。而關于檢索數據庫個數,通常檢索數據庫越多的研究,作者越傾向于全面檢索,研究質量可能更高,進而報告更加規范[25]。以上研究結果提示期刊應加強對文獻篩選結果報告規范性和完整性的審核,同時可考慮開設SR/Meta分析的專欄,減少對其字數和版面限制,中文期刊建議建立在線閱讀系統以提供補充數據;而對于SR作者,建議全面學習研究報告規范,研究過程多咨詢相關專業人員,不斷提升研究質量。
既往有研究評估中醫藥SR[26],甚至針刺干預SR的整體報告質量[13,14],但本研究首次全面檢索中英文針刺干預SR,重點關注文獻篩選結果的報告,包括報告內容和報告方式,同時分析其報告質量的影響因素。但本研究也存在一定的局限性:① 未檢索非中、英文數據庫,也未納入其他語種的研究,存在選擇性偏倚的可能;② 本研究探討的完整報告率的影響因素多為間接因素,而可能直接影響論文報告質量的因素包括作者個人水平、是否接受過方法學培訓等無法評估;③ 本研究僅基于PRISMA聲明2009評估了文獻篩選結果報告的完整性,而未對報告是否充分進行評估,這也提示PRISMA聲明應進一步完善報告內容的具體要求,如報告最終納入SR的研究數應分別報告定性和定量分析的研究數。
綜上所述,目前針刺干預SR的文獻篩選結果完整報告率較低,中文SR遠差于英文SR。對于PRISMA聲明發布后發表、在SCI期刊上發表、篇幅更長、檢索數據庫多的SR,文獻篩選結果完整報告率更高。要提高文獻篩選結果的報告質量需從制定詳細報告規范及期刊政策要求等宏觀層面加以約束。