引用本文: 王昕, 馮鑫媛, 馮媛, 谷保紅, 茍若燕, 葛龍, 田金徽. 我國“系統評價/Meta分析”冠名學位論文文獻檢索情況分析. 中國循證醫學雜志, 2015, 15(11): 1343-1351. doi: 10.7507/1672-2531.20150220 復制
系統評價作為科學規范地從海量同類信息中篩選、整合最佳信息的方法與手段,不僅在衛生保健領域,未來在眾多行業都將會發揮越來越大的作用 [1]。系統評價中的偏倚主要產生于以下三個過程:文獻檢索、文獻篩選、提取數據。其中文獻檢索過程中的偏倚主要有:發表偏倚(有統計學意義的陽性結果較沒有統計學意義的陰性結果更容易發表)、被檢數據庫的標引偏倚(數據庫中標引不準確或錯誤導致相關文獻未被檢出)和檢索偏倚(檢索詞不準確或檢索策略有問題導致的漏檢)、參考文獻或引文偏倚、重復發表偏倚、重復使用研究對象偏倚和限制語種偏倚等 [2, 3]。全面、系統收集資料是進行系統評價的先決條件 [4]。有學者分析了我國干預類和診斷性試驗系統評價/Meta分析的文獻檢索情況,結果顯示,系統評價/Meta分析存在檢索策略細節報告不全面、數據庫使用率低、輔助檢索措施尤其是灰色文獻的檢索有待加強,以及未報告實施文獻檢索的人員等問題 [5, 6]。而以系統評價/Meta分析為學位論文的文獻檢索情況如何,尚不清楚。為此本研究調查我國以“系統評價/Meta分析”冠名學位論文文獻檢索和篩選方法,并對碩士論文和博士論文、211高校學位論文與非211高校學位論文的文獻檢索和篩選方法進行比較。
1 資料與方法
1.1 納入與排除標準
納入我國以“系統評價/Meta分析”冠名學位論文。排除單純文獻質量評價、系統評價/Meta分析述評或方法學介紹研究、未報告檢索相關信息以及動物研究。
1.2 檢索策略
計算機檢索中國學位論文全文數據庫(China Dissertation Database,CDDB)。該數據庫收錄自1980年以來的學位論文,其與國內600余所高校(含全國985高校和211重點高校)、科研院所(含中科院、工程院、農科院、醫科院、林科院等)等學位授予單位合作,占研究生學位授予單位的85%以上,內容涵蓋理學、工業技術、人文社會科學、醫藥衛生、農學、交通運輸、航空航天和環境科學等各學科領域,是我國收錄數量最多的學位論文全文數據庫。采用主題詞檢索,中文檢索詞包括:Meta分析、系統評價、系統綜述、系統綜合、薈萃分析。其具體檢索策略見框1。
框 1?CDDB 檢索策略
#1?Meta 分析 #2?系統評價 #3?系統綜述 #4?系統綜合 #5?薈萃分析 #6?#1 OR #2 OR #3 OR #4 OR #5
1.3 文獻篩選及資料提取
由2位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷。缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文,以確定最終是否納入。資料提取主要內容包括基本信息(研究生姓名、大學名稱及是否211高校、學位論文提交時間)、檢索信息(檢索的數據庫名稱和數量、是否描述檢索策略、是否實施手工檢索、是否實施搜索引擎檢索、是否追蹤參考文獻、是否追蹤會議文獻、是否與作者/機構聯系獲取相關信息、是否有檢索專業人員參與、是否報告了實施檢索的人數等)和篩選信息(是否描述了文獻篩選具體步驟、報告每個數據庫檢索獲得文獻數或獲得文獻總數、是否使用流程圖呈現文獻篩選過程及結果、是否報告文獻篩選者的數量等)。
1.4 統計分析
利用Excel 2007對納入的學位論文的所有提取信息進行描述性分析,采用Stata 12.0軟件對碩士學位論文與博士學位論文、211高校學位論文與非211高校學位論文檢索數據庫情況進行對比分析。
2 結果
2.1 文獻檢索結果
初檢出相關文獻1 857篇。經逐層篩選后,最終納入1 639篇學位論文(圖 1)。從發表年代來看,文獻數量2001~2013年總體呈逐年上升趨勢,2013~2014年有所下降(圖 2)。其中2009~2013年相關文獻量達1 157篇,占文獻總數的70.6%。


2.2 學位論文文獻檢索情況
2.2.1 檢索數據庫的一般信息
在檢索中英文數據方面,近20%的系統評價/Meta分析學位論文只對中文或英文數據進行了檢索,詳細情況見表 1。

在檢索數據庫數量方面,1 639篇學位論文檢索的數據庫中位數為10.5(范圍1~20);121篇博士學位論文和1 518篇碩士學位論文檢索的數據庫中位數分別為9(范圍1~17)和10.5(范圍1~20),且檢索數據庫數量在1~11之間的差異無統計學意義(表 2,圖 3);703篇211高校學位論文檢索的數據庫中位數為10.5(范圍1~20),936篇非211高校學位論文檢索的數據庫中位數為7.5(范圍1~14),在檢索1個、3個、5個、7個、9個和12個及以上數據庫數量方面的差異有統計學意義(表 2,圖 4)。



1 639篇學位論文中檢索頻率較高的中文數據庫依次是中國期刊全文數據庫(CNKI)、中國生物醫學文獻數據庫(CBM)、中文科技期刊全文數據庫(VIP)和萬方數據庫。博士和碩士論文檢索頻率也是如此,但在檢索萬方數據庫和其他數據庫方面的差異有統計學意義(表 3,圖 5)。211高校論文檢索頻率較高的中文數據庫依次是CBM、CNKI、VIP、萬方,非211高校論文檢索頻率較高的中文數據庫依次是CNKI、VIP、CBM、萬方,但在檢索CNKI、VIP和萬方數據庫方面的差異有統計學意義(表 4,圖 6)。




1 639篇學位論文中檢索頻率較高的英文數據庫依次是PubMed、The Cochrane Library、EMbase和Ovid。博士和211高校論文檢索英文數據庫依次是PubMed、EMbase、The Cochrane Library、Ovid,但在檢索The Cochrane Library數據庫方面的差異有統計學意義(表 4,圖 5)。碩士和非211高校論文檢索英文數據庫依次是PubMed、The Cochrane Library、EMbase、Ovid,但在檢索EMbase、Ovid和其他數據庫方面的差異有統計學意義(表 4,圖 6)。
2.2.2 檢索數據庫組合信息


2.2.2.1 中文數據庫檢索組合信息
(表 5)1 402篇學位論文檢索了中文數據庫,其中304篇(21.7%)同時檢索了2個中文數據庫,檢索組合頻率較高為CNKI + CBM,402篇檢索了3個中文數據庫(28.7%),組合頻率較高為 CNKI + CBM + VIP;同時檢索了CNKI + CBM + VIP + WanFang Data的有253篇(18.0%)。
94篇博士論文檢索了中文數據庫,其中25篇(26.6%)博士學位論文同時檢索了2個中文數據庫,31篇(33.0%)博士學位論文同時檢索了3個中文數據庫,同時檢索了CNKI + CBM + VIP + WanFang Data的有32篇(34.0%)。
1 308篇碩士學位論文檢索了中文數據庫,其中279篇(21.3%)碩士學位論文同時檢索了2個中文數據庫,371篇(28.4%)碩士學位論文同時檢索了3個中文數據庫,同時檢索了CNKI + CBM + VIP + WanFang Data的有221篇(16.9%)。
559篇211高校學位論文檢索了中文數據庫,其中111篇(19.9%)同時檢索了2個中文數據庫,145篇(25.9%)同時檢索了3個中文數據庫,同時檢索了CNKI + CBM + VIP + WanFang Data的有110篇(19.7%)。
843篇非211高校學位論文檢索了中文數據庫,其中193篇(22.9%)同時檢索了2個中文數據庫,257篇(30.5%)同時檢索了3個中文數據庫,同時檢索了CNKI + CBM + VIP + WanFang Data的有153篇(18.1%)。
2.2.2.2 外文數據庫檢索組合信息
(表 6)1 532篇學位論文檢索了英文數據庫,其中302篇(19.7%)同時檢索了2個英文數據庫,檢索組合頻率較高的為 PubMed + The Cochrane Library,596篇(38.9%)檢索了3個英文數據庫,組合頻率較高的為PubMed + EMbase + The Cochrane Library;253篇(16.5%)檢索了4個英文數據庫,組合頻率較高的是PubMed + EMbase + The Cochrane Library + Ovid;91篇(5.9%)同時檢索了5個數據庫,73篇(4.7%)同時檢索了6個及以上英文數據庫。
114篇博士學位論文檢索了英文數據庫,其中23篇(20.2%)同時檢索了2個英文數據庫,35篇(30.7%)同時檢索了3個英文數據庫,14篇(12.3%)檢索了4 個英文數據庫,16篇(14.0%)檢索了5個及以上英文數據庫。
1 418篇碩士學位論文檢索了英文數據庫,其中279篇(19.7%)同時檢索了2個英文數據庫,561篇(39.6%)同時檢索了3個英文數據庫,239篇(16.9%)檢索了4個英文數據庫,148篇(10.4%)檢索了5個及以上英文數據庫。
666篇211高校論文檢索了英文數據庫,其中130篇(19.5%)同時檢索了2個英文數據庫,260篇(39.0%)同時檢索3個英文數據庫,100篇(15.0%)檢索了4個英文數據庫,76篇(11.4%)同時檢索了5個及以上英文數據庫。
866篇非211高校學位論文同時檢索了英文數據庫,其中172篇(19.9%)同時檢索了2個英文數據庫,336篇(39.0%)同時檢索了3個英文數據庫,153篇(17.7%)檢索了4個英文數據庫,88篇(10.1%)同時檢索了5個及以上數據庫。
2.2.3 其他檢索資源及檢索策略
(表 7,圖 7)1 177篇系統評價/Meta分析報告使用了其他檢索途徑,其中73.4%實施了手工檢索,68.6%追蹤參考文獻,23.3%追蹤會議文獻,26.8%聯系作者/機構,23.3%使用搜索引擎。90篇博士學位論文和1 087篇碩士學位論文報告使用了其他檢索途徑,在5個方面的差異有統計學意義。507篇211高校和670篇非211高校學位論文報告使用了其他檢索途徑,在追蹤參考文獻、檢索會議資源和聯系作者或相關機構方面差異有統計學意義。


只有436篇學位論文(37.0%)報告了詳細的檢索策略,其中博士學位論文46篇(51.1%),碩士學位論文390篇(35.6%),201篇(39.6%)為211高校學位論文、235篇(35.1%)為非211高校學位論文。
2.2.4 文獻篩選報告情況
(表 8,圖 8)751篇詳細描述了文獻的篩選步驟,615篇報告了篩選流程圖,僅有245篇報告了每個數據庫的檢出文獻數量。博士學位論文有48篇詳細報告了文獻的篩選步驟,51篇附有篩選流程圖,僅11篇報告了每個數據庫的檢出文獻數量,碩士學位論文有703篇詳細報告了文獻的篩選步驟,564篇附有篩選流程圖,234篇報告了每個數據庫的檢出文獻數量。211高校學位論文中310篇詳細報告文獻篩選步驟,278篇附有篩選流程圖,121篇報告了每個數據庫的文獻檢出數量。非211高校學位論文有441篇詳細報告文獻篩選步驟,337篇附有篩選流程圖,有124篇報告了每個數據庫的文獻檢出數量。

文獻篩選為2人及以上者1 086篇(66.3%),文獻篩選人數1人者有54篇(3.3%),未明確指出文獻篩選人數者有499篇(30.4%)。博士學位論文與碩士學位論文在文獻篩選人數方面的差異無統計學意義。211高校學位論文與非211高校學位論文在文獻篩選人數、報告文獻篩選步驟和報告每個數據庫檢索獲得的具體數量方面的差異有統計學意義。

3 討論
本研究對我國以系統評價/Meta分析冠名的研究生論文的檢索策略進行了分析。我們發現,132篇學位論文檢索的數據庫少于3個,這可能會造成漏檢。根據Cochrane系統評價指導手冊,PubMed、EMbase和The Cochrane Library是Meta分析常檢索的3個數據庫。119篇學位論文同時檢索了PubMed和The Cochrane Library,99篇學位論文同時檢索了PubMed和EMbase,只有3篇學位論文同時檢索了The Cochrane Library和EMbase,只有不足1/3的學位論文同時檢索了PubMed、EMbase和The Cochrane Library。在其他資源檢索方面,近72%的學位論文報告使用了其他檢索方式。通過對博士論文和碩士論文、211高校學位論文與非211高校學位論文的對比分析,其結果顯示,博士論文和211高校學位論文在某些方面分別優于碩士論文和非211高校學位論文。由此可見,學位論文的檢索并不全面,主要表現在:檢索數據庫數量少和對其它資源和未發表數據的檢索不夠充分。因此,在撰寫系統評價/Meta分析進行文獻檢索時,應注意系統、全面、多渠道的文獻檢索,尤其可從以下方面進行。
(1)檢索相同主題已發表的系統評價/Meta分析:通過檢索相同主題已發表的系統評價/Meta分析,可以彌補選擇檢索詞過程中漏選的檢索詞以及補充數據庫檢索結果漏檢的研究。
(2)檢索必檢數據庫同時應重視與研究課題相關的專業數據庫:目前已發表系統評價/Meta分析檢索使用頻率較高的數據庫有PubMed/MEDLINE、EMbase和The Cochrane Library(圖 9),今后系統評價/Meta分析的檢索至少包含上述3個數據庫,同時根據課題選擇專業數據庫,如PsycINFO和CINAHL等 [7-12]。

(3)輔助檢索是獲取全面文獻信息的必要手段:為了檢索的全面性,避免漏檢,增強研究實用價值,研究者除了要全面檢索數據庫外,還應當進行手工檢索、追蹤參考文獻和檢索搜索引擎。
(4)利用可能的一切手段查找檢索詞的同義詞和近義詞:可以通過檢索已經發表、未發表和正在進行的系統評價/Meta分析;利用PubMed主題檢索界面Entry Terms下面的檢索詞;利用EMbase.com主題檢索界面Synonyms下面的同義詞;利用中文科技期刊全文數據庫的查看同義詞功能;利用藥典和藥物數據庫查找藥物商品名及其他近義詞;選擇一個較為核心的組面的主要檢索詞進行預檢索,并仔細瀏覽初步的檢索結果,尤其是特別符合需要的記錄,從中選擇更多、更合適的檢索詞補充到檢索式中,然后,再瀏覽命中的文獻記錄,再從中選擇檢索詞補充到檢索式中。如此反復操作。該方法具有直接、生動、靈活的特點,檢索詞選擇的有效性和針對性大大提高,但檢索過程較長,相對費時。
(5)利用關鍵詞進行檢索應注意的問題:必須選擇足夠的同義詞,因為關鍵詞檢索最容易產生的失誤就是漏檢。同義詞指檢索意義上同義詞,包括語言學意義上的同義詞、近義詞、甚至反義詞等,不同拼寫形式,全稱與簡稱、縮寫、略語,以及學名與商品名、習慣名等;若選用簡稱、縮寫、略語等作為關鍵詞,在檢索時需要考慮加入其他的主題詞或分類代碼,以避免產生各種誤檢;如果需要選用多個關鍵詞,還必須考慮各檢索詞之間的位置關系;盡量避免選用可能導致誤檢的多義詞,若非得如此,最好與其他的相關詞一起組配使用。
(6)建議嚴格制定和詳細報告檢索策略:合理、詳細的檢索策略既是提高文獻查全率、查準率及確保系統評價/Meta分析質量的前提,也是檢索結果得以重現的前提。檢索過程中,最好采用PRESS去評價檢索策略和呈現檢索。最好的檢索方式是自由詞和主題詞相結合。
(7)不要過分依靠已有的檢索策略或檢索過濾工具:檢索時不要過分依靠已有的檢索策略或檢索過濾工具,應注意針對不同的數據庫和不同的檢索平臺選擇檢索詞和制定檢索策略。
(8)咨詢信息檢索專家,提高納入研究的可信度:盡管目前已有系統評價/Meta分析撰寫和報告相關研究發表,但針對不同數據庫,系統評價/Meta分析檢索策略略有不同 [13]。在制定系統評價/Meta分析檢索策略時若能得到相關信息檢索專家或者圖書館相關工作人員的支持和指導,將有益于提高系統評價/Meta分析中相關研究檢索的全面性、準確性以及可靠性。
(9)建議系統評價/Meta分析應該清楚報告以下信息:① 檢索資源:應該報告檢索資源名稱及所屬者名稱和時間范圍,如果實施了手工檢索,應該詳細報告手工檢索的信息;② 檢索詞:應該包括自由詞和主題詞以及自由詞的同義詞。如果使用了檢索濾器,也應該報告;③ 檢索限制:說明限制類型以及原因,如果沒有任何限制,也應該在文章中報告;④ 檢索時間:除了報告檢索資源的時間區間外,還應該報告檢索的實施時間,如果更新了檢索,還需報告更新檢索實施時間;⑤ 檢索實施者:檢索實施者的名字和資質;⑥ 檢索結果:報告檢索的最終結果和各個數據庫的檢索結果和其他檢索的結果。
綜上所述,目前冠名為“系統評價/Meta分析”的學位論文數據庫檢索不夠全面,專業數據庫使用率低,博士論文和211高校學位論文的檢索優于碩士論文和非211高校學位論文。建議今后系統評價/Meta分析研究者至少檢索3種常用數據庫,同時加強追蹤參考文獻、會議文獻和搜索引擎使用,完善檢索策略和文獻篩選等方面的信息。
系統評價作為科學規范地從海量同類信息中篩選、整合最佳信息的方法與手段,不僅在衛生保健領域,未來在眾多行業都將會發揮越來越大的作用 [1]。系統評價中的偏倚主要產生于以下三個過程:文獻檢索、文獻篩選、提取數據。其中文獻檢索過程中的偏倚主要有:發表偏倚(有統計學意義的陽性結果較沒有統計學意義的陰性結果更容易發表)、被檢數據庫的標引偏倚(數據庫中標引不準確或錯誤導致相關文獻未被檢出)和檢索偏倚(檢索詞不準確或檢索策略有問題導致的漏檢)、參考文獻或引文偏倚、重復發表偏倚、重復使用研究對象偏倚和限制語種偏倚等 [2, 3]。全面、系統收集資料是進行系統評價的先決條件 [4]。有學者分析了我國干預類和診斷性試驗系統評價/Meta分析的文獻檢索情況,結果顯示,系統評價/Meta分析存在檢索策略細節報告不全面、數據庫使用率低、輔助檢索措施尤其是灰色文獻的檢索有待加強,以及未報告實施文獻檢索的人員等問題 [5, 6]。而以系統評價/Meta分析為學位論文的文獻檢索情況如何,尚不清楚。為此本研究調查我國以“系統評價/Meta分析”冠名學位論文文獻檢索和篩選方法,并對碩士論文和博士論文、211高校學位論文與非211高校學位論文的文獻檢索和篩選方法進行比較。
1 資料與方法
1.1 納入與排除標準
納入我國以“系統評價/Meta分析”冠名學位論文。排除單純文獻質量評價、系統評價/Meta分析述評或方法學介紹研究、未報告檢索相關信息以及動物研究。
1.2 檢索策略
計算機檢索中國學位論文全文數據庫(China Dissertation Database,CDDB)。該數據庫收錄自1980年以來的學位論文,其與國內600余所高校(含全國985高校和211重點高校)、科研院所(含中科院、工程院、農科院、醫科院、林科院等)等學位授予單位合作,占研究生學位授予單位的85%以上,內容涵蓋理學、工業技術、人文社會科學、醫藥衛生、農學、交通運輸、航空航天和環境科學等各學科領域,是我國收錄數量最多的學位論文全文數據庫。采用主題詞檢索,中文檢索詞包括:Meta分析、系統評價、系統綜述、系統綜合、薈萃分析。其具體檢索策略見框1。
框 1?CDDB 檢索策略
#1?Meta 分析 #2?系統評價 #3?系統綜述 #4?系統綜合 #5?薈萃分析 #6?#1 OR #2 OR #3 OR #4 OR #5
1.3 文獻篩選及資料提取
由2位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷。缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文,以確定最終是否納入。資料提取主要內容包括基本信息(研究生姓名、大學名稱及是否211高校、學位論文提交時間)、檢索信息(檢索的數據庫名稱和數量、是否描述檢索策略、是否實施手工檢索、是否實施搜索引擎檢索、是否追蹤參考文獻、是否追蹤會議文獻、是否與作者/機構聯系獲取相關信息、是否有檢索專業人員參與、是否報告了實施檢索的人數等)和篩選信息(是否描述了文獻篩選具體步驟、報告每個數據庫檢索獲得文獻數或獲得文獻總數、是否使用流程圖呈現文獻篩選過程及結果、是否報告文獻篩選者的數量等)。
1.4 統計分析
利用Excel 2007對納入的學位論文的所有提取信息進行描述性分析,采用Stata 12.0軟件對碩士學位論文與博士學位論文、211高校學位論文與非211高校學位論文檢索數據庫情況進行對比分析。
2 結果
2.1 文獻檢索結果
初檢出相關文獻1 857篇。經逐層篩選后,最終納入1 639篇學位論文(圖 1)。從發表年代來看,文獻數量2001~2013年總體呈逐年上升趨勢,2013~2014年有所下降(圖 2)。其中2009~2013年相關文獻量達1 157篇,占文獻總數的70.6%。


2.2 學位論文文獻檢索情況
2.2.1 檢索數據庫的一般信息
在檢索中英文數據方面,近20%的系統評價/Meta分析學位論文只對中文或英文數據進行了檢索,詳細情況見表 1。

在檢索數據庫數量方面,1 639篇學位論文檢索的數據庫中位數為10.5(范圍1~20);121篇博士學位論文和1 518篇碩士學位論文檢索的數據庫中位數分別為9(范圍1~17)和10.5(范圍1~20),且檢索數據庫數量在1~11之間的差異無統計學意義(表 2,圖 3);703篇211高校學位論文檢索的數據庫中位數為10.5(范圍1~20),936篇非211高校學位論文檢索的數據庫中位數為7.5(范圍1~14),在檢索1個、3個、5個、7個、9個和12個及以上數據庫數量方面的差異有統計學意義(表 2,圖 4)。



1 639篇學位論文中檢索頻率較高的中文數據庫依次是中國期刊全文數據庫(CNKI)、中國生物醫學文獻數據庫(CBM)、中文科技期刊全文數據庫(VIP)和萬方數據庫。博士和碩士論文檢索頻率也是如此,但在檢索萬方數據庫和其他數據庫方面的差異有統計學意義(表 3,圖 5)。211高校論文檢索頻率較高的中文數據庫依次是CBM、CNKI、VIP、萬方,非211高校論文檢索頻率較高的中文數據庫依次是CNKI、VIP、CBM、萬方,但在檢索CNKI、VIP和萬方數據庫方面的差異有統計學意義(表 4,圖 6)。




1 639篇學位論文中檢索頻率較高的英文數據庫依次是PubMed、The Cochrane Library、EMbase和Ovid。博士和211高校論文檢索英文數據庫依次是PubMed、EMbase、The Cochrane Library、Ovid,但在檢索The Cochrane Library數據庫方面的差異有統計學意義(表 4,圖 5)。碩士和非211高校論文檢索英文數據庫依次是PubMed、The Cochrane Library、EMbase、Ovid,但在檢索EMbase、Ovid和其他數據庫方面的差異有統計學意義(表 4,圖 6)。
2.2.2 檢索數據庫組合信息


2.2.2.1 中文數據庫檢索組合信息
(表 5)1 402篇學位論文檢索了中文數據庫,其中304篇(21.7%)同時檢索了2個中文數據庫,檢索組合頻率較高為CNKI + CBM,402篇檢索了3個中文數據庫(28.7%),組合頻率較高為 CNKI + CBM + VIP;同時檢索了CNKI + CBM + VIP + WanFang Data的有253篇(18.0%)。
94篇博士論文檢索了中文數據庫,其中25篇(26.6%)博士學位論文同時檢索了2個中文數據庫,31篇(33.0%)博士學位論文同時檢索了3個中文數據庫,同時檢索了CNKI + CBM + VIP + WanFang Data的有32篇(34.0%)。
1 308篇碩士學位論文檢索了中文數據庫,其中279篇(21.3%)碩士學位論文同時檢索了2個中文數據庫,371篇(28.4%)碩士學位論文同時檢索了3個中文數據庫,同時檢索了CNKI + CBM + VIP + WanFang Data的有221篇(16.9%)。
559篇211高校學位論文檢索了中文數據庫,其中111篇(19.9%)同時檢索了2個中文數據庫,145篇(25.9%)同時檢索了3個中文數據庫,同時檢索了CNKI + CBM + VIP + WanFang Data的有110篇(19.7%)。
843篇非211高校學位論文檢索了中文數據庫,其中193篇(22.9%)同時檢索了2個中文數據庫,257篇(30.5%)同時檢索了3個中文數據庫,同時檢索了CNKI + CBM + VIP + WanFang Data的有153篇(18.1%)。
2.2.2.2 外文數據庫檢索組合信息
(表 6)1 532篇學位論文檢索了英文數據庫,其中302篇(19.7%)同時檢索了2個英文數據庫,檢索組合頻率較高的為 PubMed + The Cochrane Library,596篇(38.9%)檢索了3個英文數據庫,組合頻率較高的為PubMed + EMbase + The Cochrane Library;253篇(16.5%)檢索了4個英文數據庫,組合頻率較高的是PubMed + EMbase + The Cochrane Library + Ovid;91篇(5.9%)同時檢索了5個數據庫,73篇(4.7%)同時檢索了6個及以上英文數據庫。
114篇博士學位論文檢索了英文數據庫,其中23篇(20.2%)同時檢索了2個英文數據庫,35篇(30.7%)同時檢索了3個英文數據庫,14篇(12.3%)檢索了4 個英文數據庫,16篇(14.0%)檢索了5個及以上英文數據庫。
1 418篇碩士學位論文檢索了英文數據庫,其中279篇(19.7%)同時檢索了2個英文數據庫,561篇(39.6%)同時檢索了3個英文數據庫,239篇(16.9%)檢索了4個英文數據庫,148篇(10.4%)檢索了5個及以上英文數據庫。
666篇211高校論文檢索了英文數據庫,其中130篇(19.5%)同時檢索了2個英文數據庫,260篇(39.0%)同時檢索3個英文數據庫,100篇(15.0%)檢索了4個英文數據庫,76篇(11.4%)同時檢索了5個及以上英文數據庫。
866篇非211高校學位論文同時檢索了英文數據庫,其中172篇(19.9%)同時檢索了2個英文數據庫,336篇(39.0%)同時檢索了3個英文數據庫,153篇(17.7%)檢索了4個英文數據庫,88篇(10.1%)同時檢索了5個及以上數據庫。
2.2.3 其他檢索資源及檢索策略
(表 7,圖 7)1 177篇系統評價/Meta分析報告使用了其他檢索途徑,其中73.4%實施了手工檢索,68.6%追蹤參考文獻,23.3%追蹤會議文獻,26.8%聯系作者/機構,23.3%使用搜索引擎。90篇博士學位論文和1 087篇碩士學位論文報告使用了其他檢索途徑,在5個方面的差異有統計學意義。507篇211高校和670篇非211高校學位論文報告使用了其他檢索途徑,在追蹤參考文獻、檢索會議資源和聯系作者或相關機構方面差異有統計學意義。


只有436篇學位論文(37.0%)報告了詳細的檢索策略,其中博士學位論文46篇(51.1%),碩士學位論文390篇(35.6%),201篇(39.6%)為211高校學位論文、235篇(35.1%)為非211高校學位論文。
2.2.4 文獻篩選報告情況
(表 8,圖 8)751篇詳細描述了文獻的篩選步驟,615篇報告了篩選流程圖,僅有245篇報告了每個數據庫的檢出文獻數量。博士學位論文有48篇詳細報告了文獻的篩選步驟,51篇附有篩選流程圖,僅11篇報告了每個數據庫的檢出文獻數量,碩士學位論文有703篇詳細報告了文獻的篩選步驟,564篇附有篩選流程圖,234篇報告了每個數據庫的檢出文獻數量。211高校學位論文中310篇詳細報告文獻篩選步驟,278篇附有篩選流程圖,121篇報告了每個數據庫的文獻檢出數量。非211高校學位論文有441篇詳細報告文獻篩選步驟,337篇附有篩選流程圖,有124篇報告了每個數據庫的文獻檢出數量。

文獻篩選為2人及以上者1 086篇(66.3%),文獻篩選人數1人者有54篇(3.3%),未明確指出文獻篩選人數者有499篇(30.4%)。博士學位論文與碩士學位論文在文獻篩選人數方面的差異無統計學意義。211高校學位論文與非211高校學位論文在文獻篩選人數、報告文獻篩選步驟和報告每個數據庫檢索獲得的具體數量方面的差異有統計學意義。

3 討論
本研究對我國以系統評價/Meta分析冠名的研究生論文的檢索策略進行了分析。我們發現,132篇學位論文檢索的數據庫少于3個,這可能會造成漏檢。根據Cochrane系統評價指導手冊,PubMed、EMbase和The Cochrane Library是Meta分析常檢索的3個數據庫。119篇學位論文同時檢索了PubMed和The Cochrane Library,99篇學位論文同時檢索了PubMed和EMbase,只有3篇學位論文同時檢索了The Cochrane Library和EMbase,只有不足1/3的學位論文同時檢索了PubMed、EMbase和The Cochrane Library。在其他資源檢索方面,近72%的學位論文報告使用了其他檢索方式。通過對博士論文和碩士論文、211高校學位論文與非211高校學位論文的對比分析,其結果顯示,博士論文和211高校學位論文在某些方面分別優于碩士論文和非211高校學位論文。由此可見,學位論文的檢索并不全面,主要表現在:檢索數據庫數量少和對其它資源和未發表數據的檢索不夠充分。因此,在撰寫系統評價/Meta分析進行文獻檢索時,應注意系統、全面、多渠道的文獻檢索,尤其可從以下方面進行。
(1)檢索相同主題已發表的系統評價/Meta分析:通過檢索相同主題已發表的系統評價/Meta分析,可以彌補選擇檢索詞過程中漏選的檢索詞以及補充數據庫檢索結果漏檢的研究。
(2)檢索必檢數據庫同時應重視與研究課題相關的專業數據庫:目前已發表系統評價/Meta分析檢索使用頻率較高的數據庫有PubMed/MEDLINE、EMbase和The Cochrane Library(圖 9),今后系統評價/Meta分析的檢索至少包含上述3個數據庫,同時根據課題選擇專業數據庫,如PsycINFO和CINAHL等 [7-12]。

(3)輔助檢索是獲取全面文獻信息的必要手段:為了檢索的全面性,避免漏檢,增強研究實用價值,研究者除了要全面檢索數據庫外,還應當進行手工檢索、追蹤參考文獻和檢索搜索引擎。
(4)利用可能的一切手段查找檢索詞的同義詞和近義詞:可以通過檢索已經發表、未發表和正在進行的系統評價/Meta分析;利用PubMed主題檢索界面Entry Terms下面的檢索詞;利用EMbase.com主題檢索界面Synonyms下面的同義詞;利用中文科技期刊全文數據庫的查看同義詞功能;利用藥典和藥物數據庫查找藥物商品名及其他近義詞;選擇一個較為核心的組面的主要檢索詞進行預檢索,并仔細瀏覽初步的檢索結果,尤其是特別符合需要的記錄,從中選擇更多、更合適的檢索詞補充到檢索式中,然后,再瀏覽命中的文獻記錄,再從中選擇檢索詞補充到檢索式中。如此反復操作。該方法具有直接、生動、靈活的特點,檢索詞選擇的有效性和針對性大大提高,但檢索過程較長,相對費時。
(5)利用關鍵詞進行檢索應注意的問題:必須選擇足夠的同義詞,因為關鍵詞檢索最容易產生的失誤就是漏檢。同義詞指檢索意義上同義詞,包括語言學意義上的同義詞、近義詞、甚至反義詞等,不同拼寫形式,全稱與簡稱、縮寫、略語,以及學名與商品名、習慣名等;若選用簡稱、縮寫、略語等作為關鍵詞,在檢索時需要考慮加入其他的主題詞或分類代碼,以避免產生各種誤檢;如果需要選用多個關鍵詞,還必須考慮各檢索詞之間的位置關系;盡量避免選用可能導致誤檢的多義詞,若非得如此,最好與其他的相關詞一起組配使用。
(6)建議嚴格制定和詳細報告檢索策略:合理、詳細的檢索策略既是提高文獻查全率、查準率及確保系統評價/Meta分析質量的前提,也是檢索結果得以重現的前提。檢索過程中,最好采用PRESS去評價檢索策略和呈現檢索。最好的檢索方式是自由詞和主題詞相結合。
(7)不要過分依靠已有的檢索策略或檢索過濾工具:檢索時不要過分依靠已有的檢索策略或檢索過濾工具,應注意針對不同的數據庫和不同的檢索平臺選擇檢索詞和制定檢索策略。
(8)咨詢信息檢索專家,提高納入研究的可信度:盡管目前已有系統評價/Meta分析撰寫和報告相關研究發表,但針對不同數據庫,系統評價/Meta分析檢索策略略有不同 [13]。在制定系統評價/Meta分析檢索策略時若能得到相關信息檢索專家或者圖書館相關工作人員的支持和指導,將有益于提高系統評價/Meta分析中相關研究檢索的全面性、準確性以及可靠性。
(9)建議系統評價/Meta分析應該清楚報告以下信息:① 檢索資源:應該報告檢索資源名稱及所屬者名稱和時間范圍,如果實施了手工檢索,應該詳細報告手工檢索的信息;② 檢索詞:應該包括自由詞和主題詞以及自由詞的同義詞。如果使用了檢索濾器,也應該報告;③ 檢索限制:說明限制類型以及原因,如果沒有任何限制,也應該在文章中報告;④ 檢索時間:除了報告檢索資源的時間區間外,還應該報告檢索的實施時間,如果更新了檢索,還需報告更新檢索實施時間;⑤ 檢索實施者:檢索實施者的名字和資質;⑥ 檢索結果:報告檢索的最終結果和各個數據庫的檢索結果和其他檢索的結果。
綜上所述,目前冠名為“系統評價/Meta分析”的學位論文數據庫檢索不夠全面,專業數據庫使用率低,博士論文和211高校學位論文的檢索優于碩士論文和非211高校學位論文。建議今后系統評價/Meta分析研究者至少檢索3種常用數據庫,同時加強追蹤參考文獻、會議文獻和搜索引擎使用,完善檢索策略和文獻篩選等方面的信息。