引用本文: 劉登瑞, 許家科, 麻婷, 謝雨桑, 胡芳, 李曉鳳, 屈麗娜, 唐曉宇, 馬彬, 高明太. 國內兒科領域系統評價/Meta分析研究報告質量的回顧性分析. 中國循證醫學雜志, 2016, 16(11): 1345-1353. doi: 10.7507/1672-2531.20160203 復制
系統評價(systematic review,SR)是收集符合納入/排除標準的、有關某一具體醫療衛生問題的所有研究,進行定性和/或定量分析的一種二次研究方法,其中進行定量合并分析時常采用Meta分析(MA)的方法[1]。
目前,高質量的SR/MA已成為指南制定的主要依據,對臨床實踐和研究均有重要的指導意義。高質量的SR/MA不僅需要嚴謹、科學的設計,更需要規范化的報告。SR/MA的質量包括方法質量和報告質量,方法質量指SR/MA制作過程中方法設計的科學性,報告質量反映的是SR/MA報告內容的完整性和全面性,二者存在一定的聯系,但亦有差別。報告質量較高的研究不一定方法正確,但報告質量較低的研究,則會嚴重影響其研究結果的實用性和重復性[2],甚至得出與實際情況完全相反的結論[3, 4],不利于其成果的進一步轉化和利用。令人遺憾的是,越來越多的研究發現,已發表的一些SR/MA研究在報告質量方面均不盡如人意[5-10]。
為提高干預性研究MA的報告質量,早在1999年,由加拿大渥大華大學David Moher等30位臨床流行病學專家、臨床專家、統計學專家和醫學編輯,就制定了針對隨機對照試驗MA的報告規范QUOROM(quality of reporting of meta-analysis)[11]。后來為將SR也納入到報告規范的適用范圍,2009年對QUOROM清單進行修訂和擴充,形成PRISMA(preferred reporting items for systematic reviews and meta-analyses)清單[12]。國內外研究均表明,QUOROM和PRISMA的制定對于規范SR/MA的報告質量起到了重要作用[11, 13]。而對于觀察性研究的SR/MA研究的報告規范,則是2000年由Stroup等制定的MOOSE(Meta-analysis Of Observational Studies in Epidemiology)[14]清單。
目前,國內已有一些學者對中醫藥[15]、公共衛生[16]等不同領域已發表的SR/MA的報告質量進行了探討,發現這些領域的SR/MA在研究特征、研究間偏倚、研究方案及注冊信息、研究局限性和資金資助等方面均存在一定的局限性。國內僅檢索到安妮等人[17]對兒科領域SR/MA的報告質量進行了評價,但其只對兩本兒科專科雜志所發表的干預類SR/MA進行了檢索和對比,檢索范圍較窄,代表性較差。
因此,本研究將基于PRISMA和MOOSE清單對我國兒科領域SR/MA進行報告質量評價,以期了解兒科領域發表的SR/MA的現狀和存在的問題,為今后相關研究的開展提供參考,促進其成果的利用和轉化。
1 資料與方法
1.1 納入與排除標準
納入國內大陸地區期刊發表的兒科領域SR/MA研究,不限制SR/MA的研究類型。排除評述性、方法學介紹和SR/MA的計劃書等方面的文獻。
1.2 資料來源
逐篇手工檢索中國科學引文數據庫(CSCD)收錄的國內7本兒科專科雜志(臨床兒科雜志、中國當代兒科雜志、中國實用兒科雜志、中國循證兒科雜志、中華兒科雜志、中華實用兒科臨床雜志和中華小兒外科雜志),檢索時間為創刊至2014年12月。
1.3 文獻篩選
由2名研究者(許家科、麻婷),按照制定的納入/排除標準,獨立進行文獻篩選,并交叉核對(Kappa值為0.92)。如遇不同意見,交由第三位研究人員(劉登瑞)裁決或討論決定。
1.4 數據提取和分析
由2名研究人員(許家科、屈麗娜)獨立提取相關資料并交叉核對。根據自行擬定的資料提取表格,對每篇納入的SR/MA提取以下信息:①一般特征信息:包括發表時間、被引頻次、納入研究的數量及其類型(干預、病因、診斷、預后、基因多態和流行病學)和涉及疾病范圍(以ICD-10分類)等信息;②重要特征:包括檢索數據庫、是否提供檢索詞和/或檢索策略,是否實施補充檢索、納入研究偏倚風險評估工具及發表偏倚的評估方法等信息;③報告特征:分別基于PRISMA清單和MOOSE清單,提取納入的干預性SR/MA研究和觀察性SR/MA研究在各條目上的符合率,根據符合(yes)和不符合(no)來判斷,計算每個條目的符合百分率。
1.5 亞組分析
擬根據納入的SR/MA被引頻次(≤5 vs. > 5)、發表時間(干預性SR/MA: < 2009年vs.≥2009年;觀察性SR/MA: < 2000年vs.≥2000年)對清單各個條目的符合率進行亞組分析。
1.6 統計分析
使用SPSS 22.0進行統計分析,計數資料采用例數(n)和百分比(%)進行統計描述,組間比較采用卡方檢驗;計量資料采用中位數和四分位數間距進行統計描述。
2 結果
2.1 文獻篩選結果
文獻篩選流程及結果見圖 1。

2.2 納入研究的一般特征
國內自第一篇兒科領域SR/MA于1999年發表以來[18],呈現不斷增長的趨勢,截止目前,CSCD收錄的兒科雜志中共發表SR/MA 157篇(圖 2)。

納入的157篇SR/MA研究,以干預性研究最多占61.1%(96篇),75.2%(118篇)在題目使用“ Meta分析”,被引頻次≤5的占48.4%(76篇)。此外,臨床醫生為第一作者所占比例最高為86.0%(135篇)(圖 3)。

目前國內兒科領域發表的研究涉及的疾病譜以呼吸系統、消化系統疾病多見(表 1)。

2.3 納入研究的重要特征
納入研究均報告了具體的檢索數據庫,90%以上的研究報告了所用的檢索詞,一半以上研究報告進行了補充檢索,僅30%(41/157篇)的研究提供了至少一個數據庫的檢索策略及報告了文獻篩選流程圖,僅1.9%(3/157篇)的研究報告檢索了在研研究;約75%(118/157篇)的研究對納入研究的偏倚風險進行了評估,其中干預性SR/MA中采用Cochrane推薦的偏倚風險工具的占50.0%(48/96篇),病因學SR/MA采用NOS的占20.8%(5/24篇),診斷性SR/MA采用QUADAS量表的占61.5%(8/13篇);34.4%(54/157篇)的研究評估了發表偏倚,其中80%(45/54篇)以上的研究采用了漏斗圖進行評估,約10%(6/54篇)采用了Egger' s檢驗/Begg' s檢驗進行評估(表 2)。

2.4 統計分析結果
2.4.1 干預性SR/MA在PRISMA清單上的符合率
結果見表 3。干預性SR/MA在PRISMA清單各條目中符合率介于0.0%~99.0%之間,其中:①符合率超過80%的條目為12條(44.4%,12/27);②符合率介于50%~80%之間的為7條(25.9%,7/27);③符合率低于50%的條目為8條(29.6%,8/27),其中條目27符合率甚至低于20%,條目5的符合率甚至為0。

不同被引頻次干預性SR/MA PRISMA清單各條目中符合率均在0.0%~100.0%之間,其中:①被引頻次 > 5的干預性SR/MA在8個條目(29.6%,8/27)上的符合率高于被引頻次≤5的研究,差異均無統計學意義;②被引頻次 > 5的干預性SR/MA在18個條目(66.7%,18/27)上的符合率反而低于被引頻次≤5的研究,且在條目8、9、10、17上的符合率差異均具有統計學意義(P≤0.05)。
PRISMA清單發布前后( < 2009年vs.≥2009年),清單各條目符合率均介于0.0%~100.0%之間,其中:①發表時間≥2009的干預性SR/MA在22個條目(81.5%,22/27)上的符合率高于發表時間 < 2009的研究,且在條目8、17、19、20、23上的符合率差異具有統計學意義(P≤0.05);②發表時間≥2009的干預性SR/MA在4個條目(14.8%,4/27)上的符合率低于發表時間 < 2009的研究,但差異均無統計學意義。
2.4.2 觀察性SR/MA在MOOSE符合率
結果見表 4。觀察性SR/MA在MOOSE清單各條目符合率介于0.0%~93.4%之間,其中:①符合率超過80%的條目為8條(22.9%,8/35);②符合率介于50%~80%之間的為11條(31.4%,11/35);③符合率低于50%的條目為15條(42.9%,15/35),其中9、14、15、16、18、35符合率甚至低于20%,條目7的符合率甚至為0。

不同被引頻次的觀察性SR/MA在MOOSE清單各條目符合率分別介于0.0%~93.5%(被引頻次≤5)和0.0%~93.3%(被引頻次 > 5)之間,其中:①被引頻次 > 5的觀察性SR/MA在19個條目(54.3%,19/35)上的符合率高于被引頻次≤5的研究,差異均無統計學意義;②被引頻次 > 5的觀察性SR/MA在15個條目(42.9%,15/35)上的符合率低于被引頻次≤5的研究,僅在條目29上的符合率差異具有統計學意義(P≤0.05)。
3 討論
本研究共納入了157篇國內CSCD收錄的7本兒科專科雜志上發表的SR/MA研究,其中包括干預性SR/MA 96篇,觀察性SR/MA 61篇,是第一篇對國內兒科領域不同類型SR/MA的研究現狀、報告質量和存在的問題等開展全面調查的研究。
雖然國內兒科領域SR/MA發表的數量逐年遞增,且80%以上的研究為臨床醫生作為第一作者完成,但仍近70%的SR/MA研究的被引頻次低于5,甚至近50%的研究的被引頻次為零。這可能與當前納入研究的質量較低有關,特別是觀察性SR/MA研究,符合率低于50%的條目占到一半左右,而對于未被CSCD收錄期刊上發表的國內兒科領域SR/MA研究的質量可能就更令人擔憂。因此,當前國內重要的是提高兒科領域SR/MA研究的質量,而非數量的增長。此外,國內兒科領域發表的SR/MA仍以干預類研究為主(61.2%),未來可能需要更加關注觀察類SR/MA研究,并重視該領域下方法設計與報告的完善、相關培訓和教育。
廣泛而全面的檢索策略是影響SR/MA質量的重要因素之一,詳細報告檢索策略及相關信息是保證其結果可重復性、判斷其檢索的準確性和合理性的重要措施[19]。雖然,PRISMA和/或MOOSE清單在檢索部分已明確指出,需要報告至少一個數據庫的詳細檢索策略和流程圖。但我們的研究顯示:雖然絕大部分國內兒科領域SR/MA研究均報告了檢索數據庫和檢索詞,但僅30%的研究提供了至少一個數據庫的詳細檢索策略和流程圖。這可能與國內很多研究人員不了解PRISMA [20]和/或MOOSE清單,忽略了該部分的報告有關,亦或由于該清單在國內并非強制執行,加之國內期刊稿約對PRISMA等報告清單的引入了較低[20],可能在最終發表階段,受限于版面局限而刪去有關。
全面的文獻檢索依賴于合理而完善的檢索策略和多樣的檢索資源[21],有研究表明書目型數據庫僅包含不到2/3的相關試驗[22],因此,有必要通過手工查閱綜述、專著,或咨詢有關研究領域的專家以及查檢研究中引用的參考文獻、納入在研研究等方法來進行補充檢索[23],其中在研研究是指在WHO臨床試驗注冊平臺或其下屬一級注冊平臺注冊,對其研究從設計、實施和結果公布進行全程公開和監測的臨床研究[24],這些研究都是對已發表研究所能夠提供的信息的重要補充。但我們的研究顯示:僅50%的研究報告了其研究進行了補充檢索,僅2%(3篇)的研究報告檢索了在研研究。這對于讀者判斷這些研究檢索方法是否全面合理,研究結果是否具有一定的代表性是不利的。
選擇恰當、科學的偏倚風險評估工具對納入研究的偏倚風險進行有效評估是保證一個SR/MA研究質量的重要措施。但我們的研究顯示:25%的研究未評估納入研究的偏倚風險。干預性SR/MA中,50%的研究未采用Cochrane推薦的偏倚風險工具,病因學SR/MA中,79.2%的研究未采用NOS標準,診斷性SR/MA中,38.5%的研究未采用QUADAS量表。此外,一般而言,相比較于陽性結果的研究,陰性結果的研究更難以得到發表[25]。有研究顯示,存在發表偏倚的SR/MA研究結果有可能完全被改變[26]。但我們的研究顯示:納入研究中僅34.4%的研究評估了發表偏倚,這可能會大大降低發表SR/MA結果的可靠性。因此,今后國內兒科領域SR/MA研究應著眼于對其方法設計和實施的質控,特別是廣泛而全面的檢索策略的制定、合理的偏倚風險工具的選擇和科學的發表偏倚的評估等重要環節。
在PRISMA和MOOSE清單上的符合率方面,總體來說:①隨著PRISMA清單的引入和傳播,干預性SR/MA在絕大多數條目上的符合率得到一定程度的提高,但仍有15%的條目(5/27)的符合率并未得到改善和提高,且有2個條目的實際符合率低于20%,其中條目5的符合率甚至為零。此外,截至目前國內兒科領域觀察性SR/MA在MOOSE清單的符合率依然不高,近一半的觀察性SR/MA符合率低于50%,其中在7個條目符合率甚至低于20%;②與被引頻次≤5的研究相比,被引頻次 > 5的研究在PRISMA和MOOSE清單各條目的符合率上并未體現出優勢,且被引頻次 > 5的干預性和觀察性SR/MA在約60%和40%的條目上的符合率反而更低,這可能與目前國內兒科領域SR/MA的質量普遍偏低有關,盡管被引頻次達5次以上,但其報告學方面依然存在一定的局限,而且本研究納入的7本期刊,除《中國循證兒科雜志》外,其余期刊稿約中均未引入MOOSE和PRISMA等SR/MA報告清單[27-33]。
所有納入的干預性SR/MA均未對其研究計劃書和注冊信息進行報道,SR/MA的注冊可減少對同一選題重復評價的風險[34],并提高其研究全過程的透明度和結果的可信度[35]。就基金來源而言,納入的干預性和觀察性SR/MA研究均僅10%左右進行了報告,而已有研究說明潛在的利益相關可能對研究結果產生一定的偏倚影響[36]。此外,國內兒科領域觀察性SR/MA在文獻檢索者的資質、盡可能獲取所有文獻、處理只有摘要和未發表文獻的方法、描述與研究作者聯系的情況、數據整理和編碼的基本原則、公布研究資助來源等方面的報告符合率依然較低。MOOSE作為觀察性SR/MA的報告規范,能為研究者的撰寫和讀者正確理解SR/MA報告內容提供有力指導。因此,今后國內研究者在進行觀察性SR/MA報告時,參照MOOSE規范,不僅可幫助編輯和讀者充分獲取和評估研究信息,更有利于對該類型證據的進一步利用和轉化。
本研究亦存在一定的局限性:①僅納入CSCD收錄期刊發表的兒科領域SR/MA,而未對國內研究人員發表在國外期刊上的研究進行檢索。故我們的研究結果僅能說明國內期刊上所發表的兒科領域SR/MA的報告質量及其存在的問題;②評價過程主要基于作者在文獻中的報告,并未聯系作者,這可能會導致我們對某些信息的判斷出現偏差。
綜上所述,國內兒科領域SR/MA的數量呈現不斷增長的趨勢,且隨著PRISMA清單的發布,國內兒科領域干預類SR/MA在PRISMA清單中的大部分條目上的符合率得到一定程度的提高和改善,但對所納入研究總體來說在數據庫檢索策略的報告、文獻檢索篩選流程圖、檢索在研研究、評估發表偏倚、報告計劃書和注冊信息、基金資助等方面均還需進一步改善;觀察性SR/MA在MOOSE清單上的總體符合率依然不高,且在報告文獻檢索者的資質、處理只有摘要和未發表文獻的方法、描述與研究作者聯系的情況,報告數據整理和編碼的基本原則、公布研究資助來源等方面存在較多問題。因此今后應更加關注質量的提高而非數量的增長。因此,我們建議:①鼓勵國內期刊雜志在“稿約”中引入PRISMA、MOOSE清單等醫學報告規范,并在作者投稿、編輯審稿和同行評審階段嚴格施行;②建立國內SR/MA注冊制度,保證其研究全過程透明化和結果的可信度;③將SR/MA和報告規范引入醫學在校教育和繼續教育中,以促進其發展。
系統評價(systematic review,SR)是收集符合納入/排除標準的、有關某一具體醫療衛生問題的所有研究,進行定性和/或定量分析的一種二次研究方法,其中進行定量合并分析時常采用Meta分析(MA)的方法[1]。
目前,高質量的SR/MA已成為指南制定的主要依據,對臨床實踐和研究均有重要的指導意義。高質量的SR/MA不僅需要嚴謹、科學的設計,更需要規范化的報告。SR/MA的質量包括方法質量和報告質量,方法質量指SR/MA制作過程中方法設計的科學性,報告質量反映的是SR/MA報告內容的完整性和全面性,二者存在一定的聯系,但亦有差別。報告質量較高的研究不一定方法正確,但報告質量較低的研究,則會嚴重影響其研究結果的實用性和重復性[2],甚至得出與實際情況完全相反的結論[3, 4],不利于其成果的進一步轉化和利用。令人遺憾的是,越來越多的研究發現,已發表的一些SR/MA研究在報告質量方面均不盡如人意[5-10]。
為提高干預性研究MA的報告質量,早在1999年,由加拿大渥大華大學David Moher等30位臨床流行病學專家、臨床專家、統計學專家和醫學編輯,就制定了針對隨機對照試驗MA的報告規范QUOROM(quality of reporting of meta-analysis)[11]。后來為將SR也納入到報告規范的適用范圍,2009年對QUOROM清單進行修訂和擴充,形成PRISMA(preferred reporting items for systematic reviews and meta-analyses)清單[12]。國內外研究均表明,QUOROM和PRISMA的制定對于規范SR/MA的報告質量起到了重要作用[11, 13]。而對于觀察性研究的SR/MA研究的報告規范,則是2000年由Stroup等制定的MOOSE(Meta-analysis Of Observational Studies in Epidemiology)[14]清單。
目前,國內已有一些學者對中醫藥[15]、公共衛生[16]等不同領域已發表的SR/MA的報告質量進行了探討,發現這些領域的SR/MA在研究特征、研究間偏倚、研究方案及注冊信息、研究局限性和資金資助等方面均存在一定的局限性。國內僅檢索到安妮等人[17]對兒科領域SR/MA的報告質量進行了評價,但其只對兩本兒科專科雜志所發表的干預類SR/MA進行了檢索和對比,檢索范圍較窄,代表性較差。
因此,本研究將基于PRISMA和MOOSE清單對我國兒科領域SR/MA進行報告質量評價,以期了解兒科領域發表的SR/MA的現狀和存在的問題,為今后相關研究的開展提供參考,促進其成果的利用和轉化。
1 資料與方法
1.1 納入與排除標準
納入國內大陸地區期刊發表的兒科領域SR/MA研究,不限制SR/MA的研究類型。排除評述性、方法學介紹和SR/MA的計劃書等方面的文獻。
1.2 資料來源
逐篇手工檢索中國科學引文數據庫(CSCD)收錄的國內7本兒科專科雜志(臨床兒科雜志、中國當代兒科雜志、中國實用兒科雜志、中國循證兒科雜志、中華兒科雜志、中華實用兒科臨床雜志和中華小兒外科雜志),檢索時間為創刊至2014年12月。
1.3 文獻篩選
由2名研究者(許家科、麻婷),按照制定的納入/排除標準,獨立進行文獻篩選,并交叉核對(Kappa值為0.92)。如遇不同意見,交由第三位研究人員(劉登瑞)裁決或討論決定。
1.4 數據提取和分析
由2名研究人員(許家科、屈麗娜)獨立提取相關資料并交叉核對。根據自行擬定的資料提取表格,對每篇納入的SR/MA提取以下信息:①一般特征信息:包括發表時間、被引頻次、納入研究的數量及其類型(干預、病因、診斷、預后、基因多態和流行病學)和涉及疾病范圍(以ICD-10分類)等信息;②重要特征:包括檢索數據庫、是否提供檢索詞和/或檢索策略,是否實施補充檢索、納入研究偏倚風險評估工具及發表偏倚的評估方法等信息;③報告特征:分別基于PRISMA清單和MOOSE清單,提取納入的干預性SR/MA研究和觀察性SR/MA研究在各條目上的符合率,根據符合(yes)和不符合(no)來判斷,計算每個條目的符合百分率。
1.5 亞組分析
擬根據納入的SR/MA被引頻次(≤5 vs. > 5)、發表時間(干預性SR/MA: < 2009年vs.≥2009年;觀察性SR/MA: < 2000年vs.≥2000年)對清單各個條目的符合率進行亞組分析。
1.6 統計分析
使用SPSS 22.0進行統計分析,計數資料采用例數(n)和百分比(%)進行統計描述,組間比較采用卡方檢驗;計量資料采用中位數和四分位數間距進行統計描述。
2 結果
2.1 文獻篩選結果
文獻篩選流程及結果見圖 1。

2.2 納入研究的一般特征
國內自第一篇兒科領域SR/MA于1999年發表以來[18],呈現不斷增長的趨勢,截止目前,CSCD收錄的兒科雜志中共發表SR/MA 157篇(圖 2)。

納入的157篇SR/MA研究,以干預性研究最多占61.1%(96篇),75.2%(118篇)在題目使用“ Meta分析”,被引頻次≤5的占48.4%(76篇)。此外,臨床醫生為第一作者所占比例最高為86.0%(135篇)(圖 3)。

目前國內兒科領域發表的研究涉及的疾病譜以呼吸系統、消化系統疾病多見(表 1)。

2.3 納入研究的重要特征
納入研究均報告了具體的檢索數據庫,90%以上的研究報告了所用的檢索詞,一半以上研究報告進行了補充檢索,僅30%(41/157篇)的研究提供了至少一個數據庫的檢索策略及報告了文獻篩選流程圖,僅1.9%(3/157篇)的研究報告檢索了在研研究;約75%(118/157篇)的研究對納入研究的偏倚風險進行了評估,其中干預性SR/MA中采用Cochrane推薦的偏倚風險工具的占50.0%(48/96篇),病因學SR/MA采用NOS的占20.8%(5/24篇),診斷性SR/MA采用QUADAS量表的占61.5%(8/13篇);34.4%(54/157篇)的研究評估了發表偏倚,其中80%(45/54篇)以上的研究采用了漏斗圖進行評估,約10%(6/54篇)采用了Egger' s檢驗/Begg' s檢驗進行評估(表 2)。

2.4 統計分析結果
2.4.1 干預性SR/MA在PRISMA清單上的符合率
結果見表 3。干預性SR/MA在PRISMA清單各條目中符合率介于0.0%~99.0%之間,其中:①符合率超過80%的條目為12條(44.4%,12/27);②符合率介于50%~80%之間的為7條(25.9%,7/27);③符合率低于50%的條目為8條(29.6%,8/27),其中條目27符合率甚至低于20%,條目5的符合率甚至為0。

不同被引頻次干預性SR/MA PRISMA清單各條目中符合率均在0.0%~100.0%之間,其中:①被引頻次 > 5的干預性SR/MA在8個條目(29.6%,8/27)上的符合率高于被引頻次≤5的研究,差異均無統計學意義;②被引頻次 > 5的干預性SR/MA在18個條目(66.7%,18/27)上的符合率反而低于被引頻次≤5的研究,且在條目8、9、10、17上的符合率差異均具有統計學意義(P≤0.05)。
PRISMA清單發布前后( < 2009年vs.≥2009年),清單各條目符合率均介于0.0%~100.0%之間,其中:①發表時間≥2009的干預性SR/MA在22個條目(81.5%,22/27)上的符合率高于發表時間 < 2009的研究,且在條目8、17、19、20、23上的符合率差異具有統計學意義(P≤0.05);②發表時間≥2009的干預性SR/MA在4個條目(14.8%,4/27)上的符合率低于發表時間 < 2009的研究,但差異均無統計學意義。
2.4.2 觀察性SR/MA在MOOSE符合率
結果見表 4。觀察性SR/MA在MOOSE清單各條目符合率介于0.0%~93.4%之間,其中:①符合率超過80%的條目為8條(22.9%,8/35);②符合率介于50%~80%之間的為11條(31.4%,11/35);③符合率低于50%的條目為15條(42.9%,15/35),其中9、14、15、16、18、35符合率甚至低于20%,條目7的符合率甚至為0。

不同被引頻次的觀察性SR/MA在MOOSE清單各條目符合率分別介于0.0%~93.5%(被引頻次≤5)和0.0%~93.3%(被引頻次 > 5)之間,其中:①被引頻次 > 5的觀察性SR/MA在19個條目(54.3%,19/35)上的符合率高于被引頻次≤5的研究,差異均無統計學意義;②被引頻次 > 5的觀察性SR/MA在15個條目(42.9%,15/35)上的符合率低于被引頻次≤5的研究,僅在條目29上的符合率差異具有統計學意義(P≤0.05)。
3 討論
本研究共納入了157篇國內CSCD收錄的7本兒科專科雜志上發表的SR/MA研究,其中包括干預性SR/MA 96篇,觀察性SR/MA 61篇,是第一篇對國內兒科領域不同類型SR/MA的研究現狀、報告質量和存在的問題等開展全面調查的研究。
雖然國內兒科領域SR/MA發表的數量逐年遞增,且80%以上的研究為臨床醫生作為第一作者完成,但仍近70%的SR/MA研究的被引頻次低于5,甚至近50%的研究的被引頻次為零。這可能與當前納入研究的質量較低有關,特別是觀察性SR/MA研究,符合率低于50%的條目占到一半左右,而對于未被CSCD收錄期刊上發表的國內兒科領域SR/MA研究的質量可能就更令人擔憂。因此,當前國內重要的是提高兒科領域SR/MA研究的質量,而非數量的增長。此外,國內兒科領域發表的SR/MA仍以干預類研究為主(61.2%),未來可能需要更加關注觀察類SR/MA研究,并重視該領域下方法設計與報告的完善、相關培訓和教育。
廣泛而全面的檢索策略是影響SR/MA質量的重要因素之一,詳細報告檢索策略及相關信息是保證其結果可重復性、判斷其檢索的準確性和合理性的重要措施[19]。雖然,PRISMA和/或MOOSE清單在檢索部分已明確指出,需要報告至少一個數據庫的詳細檢索策略和流程圖。但我們的研究顯示:雖然絕大部分國內兒科領域SR/MA研究均報告了檢索數據庫和檢索詞,但僅30%的研究提供了至少一個數據庫的詳細檢索策略和流程圖。這可能與國內很多研究人員不了解PRISMA [20]和/或MOOSE清單,忽略了該部分的報告有關,亦或由于該清單在國內并非強制執行,加之國內期刊稿約對PRISMA等報告清單的引入了較低[20],可能在最終發表階段,受限于版面局限而刪去有關。
全面的文獻檢索依賴于合理而完善的檢索策略和多樣的檢索資源[21],有研究表明書目型數據庫僅包含不到2/3的相關試驗[22],因此,有必要通過手工查閱綜述、專著,或咨詢有關研究領域的專家以及查檢研究中引用的參考文獻、納入在研研究等方法來進行補充檢索[23],其中在研研究是指在WHO臨床試驗注冊平臺或其下屬一級注冊平臺注冊,對其研究從設計、實施和結果公布進行全程公開和監測的臨床研究[24],這些研究都是對已發表研究所能夠提供的信息的重要補充。但我們的研究顯示:僅50%的研究報告了其研究進行了補充檢索,僅2%(3篇)的研究報告檢索了在研研究。這對于讀者判斷這些研究檢索方法是否全面合理,研究結果是否具有一定的代表性是不利的。
選擇恰當、科學的偏倚風險評估工具對納入研究的偏倚風險進行有效評估是保證一個SR/MA研究質量的重要措施。但我們的研究顯示:25%的研究未評估納入研究的偏倚風險。干預性SR/MA中,50%的研究未采用Cochrane推薦的偏倚風險工具,病因學SR/MA中,79.2%的研究未采用NOS標準,診斷性SR/MA中,38.5%的研究未采用QUADAS量表。此外,一般而言,相比較于陽性結果的研究,陰性結果的研究更難以得到發表[25]。有研究顯示,存在發表偏倚的SR/MA研究結果有可能完全被改變[26]。但我們的研究顯示:納入研究中僅34.4%的研究評估了發表偏倚,這可能會大大降低發表SR/MA結果的可靠性。因此,今后國內兒科領域SR/MA研究應著眼于對其方法設計和實施的質控,特別是廣泛而全面的檢索策略的制定、合理的偏倚風險工具的選擇和科學的發表偏倚的評估等重要環節。
在PRISMA和MOOSE清單上的符合率方面,總體來說:①隨著PRISMA清單的引入和傳播,干預性SR/MA在絕大多數條目上的符合率得到一定程度的提高,但仍有15%的條目(5/27)的符合率并未得到改善和提高,且有2個條目的實際符合率低于20%,其中條目5的符合率甚至為零。此外,截至目前國內兒科領域觀察性SR/MA在MOOSE清單的符合率依然不高,近一半的觀察性SR/MA符合率低于50%,其中在7個條目符合率甚至低于20%;②與被引頻次≤5的研究相比,被引頻次 > 5的研究在PRISMA和MOOSE清單各條目的符合率上并未體現出優勢,且被引頻次 > 5的干預性和觀察性SR/MA在約60%和40%的條目上的符合率反而更低,這可能與目前國內兒科領域SR/MA的質量普遍偏低有關,盡管被引頻次達5次以上,但其報告學方面依然存在一定的局限,而且本研究納入的7本期刊,除《中國循證兒科雜志》外,其余期刊稿約中均未引入MOOSE和PRISMA等SR/MA報告清單[27-33]。
所有納入的干預性SR/MA均未對其研究計劃書和注冊信息進行報道,SR/MA的注冊可減少對同一選題重復評價的風險[34],并提高其研究全過程的透明度和結果的可信度[35]。就基金來源而言,納入的干預性和觀察性SR/MA研究均僅10%左右進行了報告,而已有研究說明潛在的利益相關可能對研究結果產生一定的偏倚影響[36]。此外,國內兒科領域觀察性SR/MA在文獻檢索者的資質、盡可能獲取所有文獻、處理只有摘要和未發表文獻的方法、描述與研究作者聯系的情況、數據整理和編碼的基本原則、公布研究資助來源等方面的報告符合率依然較低。MOOSE作為觀察性SR/MA的報告規范,能為研究者的撰寫和讀者正確理解SR/MA報告內容提供有力指導。因此,今后國內研究者在進行觀察性SR/MA報告時,參照MOOSE規范,不僅可幫助編輯和讀者充分獲取和評估研究信息,更有利于對該類型證據的進一步利用和轉化。
本研究亦存在一定的局限性:①僅納入CSCD收錄期刊發表的兒科領域SR/MA,而未對國內研究人員發表在國外期刊上的研究進行檢索。故我們的研究結果僅能說明國內期刊上所發表的兒科領域SR/MA的報告質量及其存在的問題;②評價過程主要基于作者在文獻中的報告,并未聯系作者,這可能會導致我們對某些信息的判斷出現偏差。
綜上所述,國內兒科領域SR/MA的數量呈現不斷增長的趨勢,且隨著PRISMA清單的發布,國內兒科領域干預類SR/MA在PRISMA清單中的大部分條目上的符合率得到一定程度的提高和改善,但對所納入研究總體來說在數據庫檢索策略的報告、文獻檢索篩選流程圖、檢索在研研究、評估發表偏倚、報告計劃書和注冊信息、基金資助等方面均還需進一步改善;觀察性SR/MA在MOOSE清單上的總體符合率依然不高,且在報告文獻檢索者的資質、處理只有摘要和未發表文獻的方法、描述與研究作者聯系的情況,報告數據整理和編碼的基本原則、公布研究資助來源等方面存在較多問題。因此今后應更加關注質量的提高而非數量的增長。因此,我們建議:①鼓勵國內期刊雜志在“稿約”中引入PRISMA、MOOSE清單等醫學報告規范,并在作者投稿、編輯審稿和同行評審階段嚴格施行;②建立國內SR/MA注冊制度,保證其研究全過程透明化和結果的可信度;③將SR/MA和報告規范引入醫學在校教育和繼續教育中,以促進其發展。