引用本文: 陳匡陽, 王亞楠, 趙雅琴, 陳朝虎, 許家科, 胡芳, 屈麗娜, 楊晶晶, 白皙, 麻婷, 張益恒, 馬彬. 國內動物實驗系統評價/Meta分析研究的現狀分析. 中國循證醫學雜志, 2015, 15(4): 414-418. doi: 10.7507/1672-2531.20150070 復制
英國最大的動物實驗資助機構,國際實驗動物3Rs中心(The National Centre for the Replacement,Refinement and Reduction of Animals in Research,NC3Rs)對其所資助的動物實驗進行回顧分析結果顯示 [1]:許多動物實驗都缺乏對實驗設計、實施和分析等重要信息的報告,僅59%的研究報告了實驗的假設和目的、實驗動物的數量及其基本特征,30%的研究未描述其統計學方法。因此,有必要對動物實驗進行系統評價,以提升動物實驗對臨床研究的指導價值,而高質量的系統評價更會縮短研究從發現到有效的診斷和策略實施之間的時間 [2]。
自國外第1個動物實驗系統評價于1996年發表以來 [3],該類論文呈現增長的趨勢,但Luciano等 [4]的研究卻顯示70%以上的動物實驗系統評價存在檢索不全面,50%的研究未對納入研究的內在真實性進行評價,僅1/3的研究對納入研究異質性進行分析,質量令人堪憂。國內自2008年以來陸續發表了諸多動物實驗系統評價,但目前尚無相關研究對其發表特點、涉及領域、方法質量等現狀進行全面調研。因此,本研究對中文期刊發表的動物實驗系統評價的研究現狀及存在的問題進行全面分析,以期為今后的研究提供參考依據。
1 資料與方法
1.1 納入與排除標準
納入中國大陸地區發表的醫學相關動物實驗系統評價/Meta分析研究,不限制動物的種屬。對“系統評價或Meta分析”的定義:報告中明確提到為“系統評價或Meta分析”研究,或通過閱讀確定其結果主要基于對多個研究的總結,且作者描述了文獻納入、檢索方法以及質量評價方法等,但不限制是否對以上信息進行詳細描述。排除重復發表的研究。
1.2 檢索策略
計算機檢索CNKI和WanFang Data數據庫,納入國內發表的動物實驗系統評價/Meta分析研究,不限制動物種屬,檢索時限均為建庫截至2014年3月。檢索詞包括:動物、鼠、兔、猴、豬、狗、系統評價、系統綜述、Meta分析、薈萃分析。
1.3 文獻篩選
由2位研究者(陳匡陽和趙雅琴)按照納入與排除標準通過閱讀文題、摘要和全文,獨立篩選文獻,之后交叉核對,如遇分歧討論或交由第三位研究者(馬彬)裁決。
1.4 資料提取
利用Excel建立資料提取表格,由2位研究者(陳匡陽、王亞楠)獨立進行提取,交叉核對,不同之處經討論或交由第三位研究者(馬彬)裁決。資料提取內容包括:① 基本特征:期刊類型、發表年份、被引次數、動物種屬和數量等;② 方法特征:納入研究類型、文獻來源、語言限制、質量評估工具、流程圖、異質性分析等信息。
1.5 統計分析
對提取的指標以頻數和百分比進行描述性統計分析。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻3 170篇,經逐層篩選,最終納入18個研究。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
2.2.1 發表年代情況
國內第1篇動物實驗系統評價 [5]發表于2008年,此后每年均陸續有研究發表,其中2009年2篇(11.1%),2010年4篇(22.2%),2011年和2012年各3篇(16.7%),2013年最多為5篇(27.8%)。
2.2.2 發表期刊情況
18篇系統評價分布在13種期刊上,綜合性期刊發表4篇(22.2%),專業性期刊發表14篇(70%),13篇(72.2%)發表在中國科學引文數據庫(CSCD)收錄期刊上。
2.2.3 作者情況
納入作者僅為1人的為2篇(11.1%),介于2~5人的為13篇(72.2%),5人以上為3篇(16.7%)。作者單位數量≥ 2的為11篇(61.1%)。單位性質是大學或研究所的6篇(33.3%),醫院3篇(16.7%),疾病預防控制中心2篇(11.1%),醫院和大學合作6篇(33.3%),研究所和大學合作1篇(5.6%)。
2.2.4 被引情況
納入的18篇系統評價,被引次數均低于2,14篇(77.8%)被引用次數為零。
2.2.5 納入動物種屬和數量
納入的動物種屬包括兔、獵犬、鼠、豬、山羊等,其中以鼠最為常見,納入的實驗動物數量的中位數為265.5(四分位數間距:219.75~509.75),但其中6個系統評價(33.3%)未報告所納入的動物數量。
2.2.6 納入研究數量及涉及疾病范圍
納入的原始動物實驗數量的中位數為12(四分位數間距:5.5~19.5),涉及疾病范圍包括神經系統損傷22.2%,移植16.7%,糖尿病、心血管疾病和生殖學均為11.1%,碘缺乏病、肝損傷、侵襲性肺曲霉病、移植瘤、缺血性卒中均為5.6%。
2.3 納入研究的方法特征
見表 1。國內大部分動物實驗系統評價文獻檢索不全面,納入研究不僅存在漏檢的較大可能,對數據庫名稱的描述亦不規范,如4個系統評價(22.2%)僅檢索了中文數據庫,3個系統評價(16.7%)僅檢索了英文數據庫。盡管11個系統評價(61.1%)報告同時檢索了中、外文數據庫,但同時檢索PubMed和EMbase數據庫的僅有8個系統評價,同時檢索3個中文數據庫的僅有4個系統評價。9個系統評價(50%)限制了文獻檢索的語種,而進行補充檢索、偏倚風險評估和發表偏倚評估的系統評價均僅有7個(38.9%),對納入研究進行偏倚風險評估的7個系統評價中,有4個(22.2%)基于Jadad量表 [6],1個(5.6%)基于CAMARADES評價標準 [7],1個基于自定義標準 [8],1個基于Jonas等 [9]和Macleod等 [10]的標準。僅3個系統評價(16.7%)在結果部分以流程圖的形式展示了文獻篩選的全過程,13個系統評價(72.2%)未對納入研究之間的異質性進行評估,13個系統評價(72.2%)進行了數據合并分析。

3 討論
我國最早的動物實驗系統評價開展于2008年 [5],之后陸續雖有發表,但與國外同類研究相比,起步較晚,數量較少。我們的研究顯示:盡管72.2%(13篇)的系統評價發表在CSCD收錄期刊上,但近80%(14篇)被引次數為零,這一比例低于Ma等 [11]關于國內中醫藥臨床干預性系統評價研究現狀的調查結果。這可能與國內基礎研究領域的研究人員對系統評價/Meta分析這一研究方法的研究過程、價值認知和了解不夠有關,亦可能與目前國內已發表的該類型研究的質量總體較低有關。Cochrane系統評價要求至少由3名研究人員共同完成,盡管目前尚無對動物實驗系統評價完成人數的最低要求,但我們的研究顯示:6篇系統評價(33.3%)作者數少于3人。作者人數過少,可能導致對部分重要研究環節的質控下降,如數據的交叉提取、核對,對動物安置、干預實施過程中的盲法應用等。
Cochrane系統評價要求一篇系統評價至少應檢索MEDLINE、EMbase和Cochrane圖書館 [12],但即便如此,仍會存在一定程度的漏檢。如有研究顯示僅檢索MEDLINE或EMbase數據庫,分別僅能獲得納入研究的55%和49% [13]。此外,已有研究顯示,在42%已發表的系統評價/Meta分析所納入的研究中,至少有1篇無法在MEDLINE上檢索到 [14]。盡管目前尚無對動物實驗系統評價檢索數據庫的最低標準要求,但我們的研究顯示:國內動物實驗系統評價/Meta分析在檢索策略的制定方面幾乎均存在漏檢、不規范檢索等問題,22.2%的研究不但僅檢索了中文數據庫且存在選擇不全的問題。2006年,英國萊特斯大學Peters等 [15]基于QUOROM及MOOSE的條目,提出動物實驗系統評價/Meta分析的報告規范,其中一條要求在結果部分呈現文獻篩選流程圖,以提高其透明度和可重復性。但我們的研究顯示:僅16.7%的研究提供了詳細的流程圖。這一方面可能與國內研究人員對該環節的重視程度不高有關,另外,也可能由于部分期刊出于版面的限制,在論文最終發表階段將其刪去。因此,建議國內相關期刊能在其稿約中引入該報告規范,以規范化報告動物實驗系統評價。
系統評價研究的重點之一就是對納入研究的方法學進行全面而科學的評估,以準確把握納入研究存在的偏倚風險程度及對其結果真實性的影響。我們的研究顯示:納入的18篇系統評價中,11篇(60.1%)系統評價未對其納入的動物實驗進行偏倚風險評估,其余7篇雖然對納入研究進行了質量評估,但在評估工具的選擇上仍存在一定的問題,例如:4篇選擇了Jadad量表 [6],而該工具是由哥倫比亞Jadad醫生及其團隊于1996年發表,用于評價臨床試驗方法學質量的工具。眾所周知,以往國際上用于評估動物實驗質量的條目/清單較多 [16-20],有些適用于特殊的研究領域如毒理、缺血性卒中等,有些同時適用于內在和外在真實性的評估,尚無統一標準。直到2014年,荷蘭動物實驗系統評價研究中心,基于Cochrane風險評估工具,由來自SYRCLE中心的Hooijmans等多名學者起草、制定并頒布了SYRCLE動物實驗風險評估工具(SYRCLE’s risk of bias tool for animal studies)[21],是目前唯一專門適用于動物實驗內在真實性評估的工具 [17],因此,我們強烈建議以后動物實驗系統評價采用SYRCLE動物實驗風險評估工具對納入研究的方法學質量進行科學評估。
總之,國內發表的動物實驗系統評價數量少,被引率低,在方法學上存在較多問題,如檢索不全面、未對納入研究進行方法學質量評估或評估工具選擇不恰當、文獻篩選流程不清楚、未采取有效的方法保證數據提取的可靠性等。因此,我們建議通過以下措施提高其質量:國內動物實驗領域相關期刊盡早在“稿約”中引入動物實驗系統評價報告規范;將與動物實驗系統評價相關的內容,特別是方法學質控流程、報告標準等加入醫學繼續教育課程中,由國家授權各地區具備資質的科研單位,對其服務地區的臨床醫生、科研人員進行全面的動物實驗系統評價方法學的培訓;在醫學在校教育中引入與動物實驗系統評價相關的知識內容。
英國最大的動物實驗資助機構,國際實驗動物3Rs中心(The National Centre for the Replacement,Refinement and Reduction of Animals in Research,NC3Rs)對其所資助的動物實驗進行回顧分析結果顯示 [1]:許多動物實驗都缺乏對實驗設計、實施和分析等重要信息的報告,僅59%的研究報告了實驗的假設和目的、實驗動物的數量及其基本特征,30%的研究未描述其統計學方法。因此,有必要對動物實驗進行系統評價,以提升動物實驗對臨床研究的指導價值,而高質量的系統評價更會縮短研究從發現到有效的診斷和策略實施之間的時間 [2]。
自國外第1個動物實驗系統評價于1996年發表以來 [3],該類論文呈現增長的趨勢,但Luciano等 [4]的研究卻顯示70%以上的動物實驗系統評價存在檢索不全面,50%的研究未對納入研究的內在真實性進行評價,僅1/3的研究對納入研究異質性進行分析,質量令人堪憂。國內自2008年以來陸續發表了諸多動物實驗系統評價,但目前尚無相關研究對其發表特點、涉及領域、方法質量等現狀進行全面調研。因此,本研究對中文期刊發表的動物實驗系統評價的研究現狀及存在的問題進行全面分析,以期為今后的研究提供參考依據。
1 資料與方法
1.1 納入與排除標準
納入中國大陸地區發表的醫學相關動物實驗系統評價/Meta分析研究,不限制動物的種屬。對“系統評價或Meta分析”的定義:報告中明確提到為“系統評價或Meta分析”研究,或通過閱讀確定其結果主要基于對多個研究的總結,且作者描述了文獻納入、檢索方法以及質量評價方法等,但不限制是否對以上信息進行詳細描述。排除重復發表的研究。
1.2 檢索策略
計算機檢索CNKI和WanFang Data數據庫,納入國內發表的動物實驗系統評價/Meta分析研究,不限制動物種屬,檢索時限均為建庫截至2014年3月。檢索詞包括:動物、鼠、兔、猴、豬、狗、系統評價、系統綜述、Meta分析、薈萃分析。
1.3 文獻篩選
由2位研究者(陳匡陽和趙雅琴)按照納入與排除標準通過閱讀文題、摘要和全文,獨立篩選文獻,之后交叉核對,如遇分歧討論或交由第三位研究者(馬彬)裁決。
1.4 資料提取
利用Excel建立資料提取表格,由2位研究者(陳匡陽、王亞楠)獨立進行提取,交叉核對,不同之處經討論或交由第三位研究者(馬彬)裁決。資料提取內容包括:① 基本特征:期刊類型、發表年份、被引次數、動物種屬和數量等;② 方法特征:納入研究類型、文獻來源、語言限制、質量評估工具、流程圖、異質性分析等信息。
1.5 統計分析
對提取的指標以頻數和百分比進行描述性統計分析。
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻3 170篇,經逐層篩選,最終納入18個研究。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本特征
2.2.1 發表年代情況
國內第1篇動物實驗系統評價 [5]發表于2008年,此后每年均陸續有研究發表,其中2009年2篇(11.1%),2010年4篇(22.2%),2011年和2012年各3篇(16.7%),2013年最多為5篇(27.8%)。
2.2.2 發表期刊情況
18篇系統評價分布在13種期刊上,綜合性期刊發表4篇(22.2%),專業性期刊發表14篇(70%),13篇(72.2%)發表在中國科學引文數據庫(CSCD)收錄期刊上。
2.2.3 作者情況
納入作者僅為1人的為2篇(11.1%),介于2~5人的為13篇(72.2%),5人以上為3篇(16.7%)。作者單位數量≥ 2的為11篇(61.1%)。單位性質是大學或研究所的6篇(33.3%),醫院3篇(16.7%),疾病預防控制中心2篇(11.1%),醫院和大學合作6篇(33.3%),研究所和大學合作1篇(5.6%)。
2.2.4 被引情況
納入的18篇系統評價,被引次數均低于2,14篇(77.8%)被引用次數為零。
2.2.5 納入動物種屬和數量
納入的動物種屬包括兔、獵犬、鼠、豬、山羊等,其中以鼠最為常見,納入的實驗動物數量的中位數為265.5(四分位數間距:219.75~509.75),但其中6個系統評價(33.3%)未報告所納入的動物數量。
2.2.6 納入研究數量及涉及疾病范圍
納入的原始動物實驗數量的中位數為12(四分位數間距:5.5~19.5),涉及疾病范圍包括神經系統損傷22.2%,移植16.7%,糖尿病、心血管疾病和生殖學均為11.1%,碘缺乏病、肝損傷、侵襲性肺曲霉病、移植瘤、缺血性卒中均為5.6%。
2.3 納入研究的方法特征
見表 1。國內大部分動物實驗系統評價文獻檢索不全面,納入研究不僅存在漏檢的較大可能,對數據庫名稱的描述亦不規范,如4個系統評價(22.2%)僅檢索了中文數據庫,3個系統評價(16.7%)僅檢索了英文數據庫。盡管11個系統評價(61.1%)報告同時檢索了中、外文數據庫,但同時檢索PubMed和EMbase數據庫的僅有8個系統評價,同時檢索3個中文數據庫的僅有4個系統評價。9個系統評價(50%)限制了文獻檢索的語種,而進行補充檢索、偏倚風險評估和發表偏倚評估的系統評價均僅有7個(38.9%),對納入研究進行偏倚風險評估的7個系統評價中,有4個(22.2%)基于Jadad量表 [6],1個(5.6%)基于CAMARADES評價標準 [7],1個基于自定義標準 [8],1個基于Jonas等 [9]和Macleod等 [10]的標準。僅3個系統評價(16.7%)在結果部分以流程圖的形式展示了文獻篩選的全過程,13個系統評價(72.2%)未對納入研究之間的異質性進行評估,13個系統評價(72.2%)進行了數據合并分析。

3 討論
我國最早的動物實驗系統評價開展于2008年 [5],之后陸續雖有發表,但與國外同類研究相比,起步較晚,數量較少。我們的研究顯示:盡管72.2%(13篇)的系統評價發表在CSCD收錄期刊上,但近80%(14篇)被引次數為零,這一比例低于Ma等 [11]關于國內中醫藥臨床干預性系統評價研究現狀的調查結果。這可能與國內基礎研究領域的研究人員對系統評價/Meta分析這一研究方法的研究過程、價值認知和了解不夠有關,亦可能與目前國內已發表的該類型研究的質量總體較低有關。Cochrane系統評價要求至少由3名研究人員共同完成,盡管目前尚無對動物實驗系統評價完成人數的最低要求,但我們的研究顯示:6篇系統評價(33.3%)作者數少于3人。作者人數過少,可能導致對部分重要研究環節的質控下降,如數據的交叉提取、核對,對動物安置、干預實施過程中的盲法應用等。
Cochrane系統評價要求一篇系統評價至少應檢索MEDLINE、EMbase和Cochrane圖書館 [12],但即便如此,仍會存在一定程度的漏檢。如有研究顯示僅檢索MEDLINE或EMbase數據庫,分別僅能獲得納入研究的55%和49% [13]。此外,已有研究顯示,在42%已發表的系統評價/Meta分析所納入的研究中,至少有1篇無法在MEDLINE上檢索到 [14]。盡管目前尚無對動物實驗系統評價檢索數據庫的最低標準要求,但我們的研究顯示:國內動物實驗系統評價/Meta分析在檢索策略的制定方面幾乎均存在漏檢、不規范檢索等問題,22.2%的研究不但僅檢索了中文數據庫且存在選擇不全的問題。2006年,英國萊特斯大學Peters等 [15]基于QUOROM及MOOSE的條目,提出動物實驗系統評價/Meta分析的報告規范,其中一條要求在結果部分呈現文獻篩選流程圖,以提高其透明度和可重復性。但我們的研究顯示:僅16.7%的研究提供了詳細的流程圖。這一方面可能與國內研究人員對該環節的重視程度不高有關,另外,也可能由于部分期刊出于版面的限制,在論文最終發表階段將其刪去。因此,建議國內相關期刊能在其稿約中引入該報告規范,以規范化報告動物實驗系統評價。
系統評價研究的重點之一就是對納入研究的方法學進行全面而科學的評估,以準確把握納入研究存在的偏倚風險程度及對其結果真實性的影響。我們的研究顯示:納入的18篇系統評價中,11篇(60.1%)系統評價未對其納入的動物實驗進行偏倚風險評估,其余7篇雖然對納入研究進行了質量評估,但在評估工具的選擇上仍存在一定的問題,例如:4篇選擇了Jadad量表 [6],而該工具是由哥倫比亞Jadad醫生及其團隊于1996年發表,用于評價臨床試驗方法學質量的工具。眾所周知,以往國際上用于評估動物實驗質量的條目/清單較多 [16-20],有些適用于特殊的研究領域如毒理、缺血性卒中等,有些同時適用于內在和外在真實性的評估,尚無統一標準。直到2014年,荷蘭動物實驗系統評價研究中心,基于Cochrane風險評估工具,由來自SYRCLE中心的Hooijmans等多名學者起草、制定并頒布了SYRCLE動物實驗風險評估工具(SYRCLE’s risk of bias tool for animal studies)[21],是目前唯一專門適用于動物實驗內在真實性評估的工具 [17],因此,我們強烈建議以后動物實驗系統評價采用SYRCLE動物實驗風險評估工具對納入研究的方法學質量進行科學評估。
總之,國內發表的動物實驗系統評價數量少,被引率低,在方法學上存在較多問題,如檢索不全面、未對納入研究進行方法學質量評估或評估工具選擇不恰當、文獻篩選流程不清楚、未采取有效的方法保證數據提取的可靠性等。因此,我們建議通過以下措施提高其質量:國內動物實驗領域相關期刊盡早在“稿約”中引入動物實驗系統評價報告規范;將與動物實驗系統評價相關的內容,特別是方法學質控流程、報告標準等加入醫學繼續教育課程中,由國家授權各地區具備資質的科研單位,對其服務地區的臨床醫生、科研人員進行全面的動物實驗系統評價方法學的培訓;在醫學在校教育中引入與動物實驗系統評價相關的知識內容。