引用本文: 雙梅, 趙晨, 張莉, 商洪才. 運用SYRCLE工具評價中文期刊發表卒中/中風動物實驗的方法學質量. 中國循證醫學雜志, 2016, 16(5): 592-597. doi: 10.7507/1672-2531.20160091 復制
動物實驗指在實驗室內,為了獲得有關生物學、醫學等方面的新知識或解決具體問題而使用動物進行的科學研究 [1],是臨床前研究的重要組成部分,亦是連接基礎研究和臨床試驗的重要橋梁 [2, 3],其結果直接影響著許多領域研究課題成果的確立和水平的高低。臨床前動物實驗的基本目的是初步驗證干預措施的安全性和有效性,并為新干預措施是否可以進入臨床研究階段提供科學證據 [4, 5]。然而很多因素會影響臨床前動物實驗的真實性和可靠性 [6],如原始實驗設計不需要專門委員會批準,非隨機的研究、對照設立欠佳,動物質量未標準化,觀察指標單一,結果報告不完整、可重復性差等。英國最大的動物實驗資助機構,國際實驗動物 3Rs(The National Centre for the Replacement,Refinement and Reduction of Animals in Research,NC3Rs)中心對其所資助的動物實驗的報告質量進行回顧性分析后發現 [7]:許多被資助的研究都缺乏對實驗設計、實施和分析等一些重要信息的報告,僅59%的論文說明了該實驗的假設和目的、動物的實驗數量和所用實驗動物的基本特征。30% 的實驗未描述其統計學方法以及未采用正確的統計指標描述統計結果。分別有 87% 和 86% 的實驗未實施“隨機分配”和“盲法”,更加嚴重的是在33個實施了“隨機化”原則的動物實驗中,僅9%(3/33)的實驗在其研究報告論文中闡述了具體的隨機化方法,最終導致許多3Rs中心資助動物實驗的研究成果的利用率和轉化率低下,使得3Rs中心科研基金的投入產出比不成正比。因此,準確科學評估動物實驗的方法學和報告質量非常必要。
SYRCLE(the SYstematic Review Centre for Laboratory animal Experimentation,SYRCLE)動物實驗偏倚風險評估工具(以下簡稱SYRCLE工具)是由荷蘭動物實驗系統評價研究中心研發,旨在提高動物實驗的方法質量及研究過程的透明化 [8, 9]。雖然當前已經存在較多的評價動物實驗質量的清單和工具 [11, 12, 13],但不同清單和工具針對的研究領域不同,且不同清單和工具關注動物實驗方法學質量的側重點也不一樣,缺乏統一標準。SYRCLE工具是基于Cochrane偏倚風險評估工具的制定方法,針對動物實驗設計、實施和測量過程中可能存在的偏倚或混雜進行客觀評價的工具,對不同類型和領域的動物實驗都適用。
本研究旨在采用SYRCLE工具評價卒中/中風動實驗的方法學質量,系統分析卒中/中風領域動物實驗在設計、實施和測量過程中存在的缺點和不足,為改善我國動物實驗的方法學質量,生產高質量臨床前研究提供思路。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
研究類型:動物實驗。研究對象:卒中/中風動物。干預措施:無限定。結局指標:無限定。
1.1.2 排除標準
① 重復發表的文獻(只納入最近發表的一篇);② 會議文獻以及動物實驗的系統評價/Meta分析等二次研究;③ 臨床研究合并動物實驗的研究;④ 無法獲取全文且無詳細摘要的文獻;⑤ 無法提取數據的研究。
1.2 資料來源
采用主題詞和自由詞結合檢索CBM、VIP、WanFang Data,以及CNKI等數據庫,全面搜集國內公開發表的卒中/中風的動物實驗。檢索日期截至2014年12月31日。檢索詞包括:動物模型、動物研究、臨床前研究、鼠、兔、蟾蜍、豬、狗、猴、牛、羊、卒中、中風、治療 [14]。
1.3 資料提取
課題組4名研究人員首先進行正式提取和評價的預試驗,每兩人針對一篇卒中/中風動物實驗獨立進行數據提取和評價。如有不一致,協商討論。資料提取內容包括:第一作者、發表年份、發表期刊、是否為中國科學文獻服務數據庫(CSCD)收錄、研究主題、實施和測量方法、利益聲明等。
1.4 質量評價
4名評價者分成2組分別運用SYRCLE工具,對納入的動物實驗進行評價。SYRCLE量表共包括22個條目(見表 2),每個條目分別用“低風險”、“不清楚”和“高風險”進行描述。參考每個條目的解釋,完全滿足條目的解釋,或綜合考慮未滿足部分不會導致結果產生重要偏倚,評為“低風險”;描述不清晰,不能分辨者,評為“不清楚”;完全不滿足條目內容,或者綜合考慮不滿足部分會導致結果產生重要偏倚,評為“高風險”。鑒于報告規范沒有說明條目的權重問題,故沒有將報告程度賦予分值。正式評價之前,選取15篇文獻進行預試驗,并計算組內一致性(ICC值),ICC值>0.75表明各評價者對條目的理解達成一致。
1.5 統計分析
運用Office Excel 2013軟件對納入文獻的方法學質量進行描述性分析,并從條目報告數量、不同年份區間發表文獻的質量以及運用是否發表在CSCD收錄期刊3個方面進行分層分析。運用SPSS 19.0計算預試驗ICC值。
2 結果
2.1 文獻篩選結果
初檢出相關文獻4 722篇,經過去重、閱讀題目和摘要后初步納入647篇文獻。進一步閱讀全文后,最終納入582篇卒中/中風動物實驗。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本信息
582篇動物實驗發表在272種期刊上,發文數前5位期刊分別為《中國臨床康復》(18篇,3.1%)、《中國中醫藥科技》(14篇,2.4%)、《中國組織工程研究與臨床康復》(13篇,2.2%)、《中西醫結合心腦血管病雜志》(12篇,2.1%)和《中華中醫藥學刊》(10篇,1.7%)。其中,433篇(74.4%)發表在CSCD期刊上,2005~2014這10年間發表的文獻占到總文獻的70%以上(表 1)。

2.3 卒中/中風動物實驗的總體SYRCLE工具評價結果
SYRCLE工具22個條目中,4個條目評價為“低風險”的研究數大于50%,包括:條目1描述具體的隨機方法(79.0%),條目2實驗組和對照組基線特征均衡(99.1%),條目17無法獲取研究計劃書但已發表文章中很清楚地報告了所有預期結果(100%),條目20 分析單位錯誤(100%)等。16個條目評價為“低風險”的研究數小于30%,詳見表 2。

2.4 SYSCLE工具不同條目“低風險”分布
SYSCLE工具22個條目中,99%的動物實驗滿足3個以上條目為“低風險”,17%的動物實驗滿足10個以上條目為“低風險”,不足1%的動物實驗滿足17個條目為“低風險”(詳見圖 2)。

2.5 不同時間段發表卒中/中風動物實驗的SYRCLE工具評價結果
按5年一個時間段,統計各時間段發表卒中/中風動物實驗采用SYRCLE工具評價為“低風險”的平均條目數見圖 3。動物實驗質量總體呈上升趨勢,但在2010~2014年段略有下降(圖 3)。

2.6 CSCD與非CSCD期刊發表卒中/中風動物實驗的SYRCLE工具評價結果
CSCD和非CSCD期刊發表卒中/中風動物實驗的質量總體上呈上升趨勢,但各時間段之間差異無統計學意義(P≥ 0.05)。非CSCD期刊發表動物實驗采用SYRCLE工具評價為“低風險”平均條目數在各時間段均高于CSCD期刊(詳見表 3)。

3 討論
3.1 總體偏倚風險情況
從SYSCLE工具的評價結果看,卒中/中風領域的動物實驗在選擇性偏倚、實施偏倚、測量偏倚、失訪偏倚以及報告偏倚方面仍然存在很多需要改進的地方。22個評價條目中,僅17%的文獻滿足了10個以上條目,不足1%的文獻滿足17個條目。進一步的分層分析發現,不同時間段發表的動物實驗,其總體偏倚風險差異不大(圖 3),評價為“低風險”的條目數基本在4~5個(18%~23%),說明在過去20年間,國內動物實驗質量未得到有效改善。并且,這種情況在CSCD期刊和非CSCD期刊發表的動物實驗間也無差異(表 3),甚至CSCD期刊發表的動物實驗質量有更糟的趨勢,雖然CSCD期刊在同行評審上和對數據質量和真實性的要求上可能比非CSCD期刊更高。
3.2 選擇性偏倚
SYSCLE對動物實驗選擇性偏倚的評價涉及5個條目,內容涉及隨機、分配隱藏、基線平衡以及疾病建模,其中有3個條目幾乎所有的卒中/中風動物實驗均未達標。首先是隨機和分配隱藏,如果動物實驗實現了完全隨機,則實驗組和對照組動物基線平衡。如果沒有施行隨機或分配隱藏,由于動物實驗的樣本相對臨床試驗要小很多,可導致在有些重要基線方面存在重大差異 [8],從而影響實驗結果的推斷。其次是誘導疾病的時間安排,主要是為了保證動物實驗疾病建模的時間充分,足以模擬卒中/中風的病理機制。
3.3 實施偏倚
SYSCLE對動物實驗實施偏倚的評價涉及3個條目,有2個條目(動物房中隨機安置籠子或動物和對結局指標的影響),所有的卒中/中風動物實驗均未報告。不同于人體研究,動物實驗中對于動物的安置方式對研究結果具有重要影響 [15-17],如不同溫度和光照等。如溫度對實驗動物的影響體現在,細微的溫度變化可導致動物的代謝率和毒性產生差異,從而對實驗結果產生影響。另一方面,若動物未隨機安置,研究人員可能會預見各組動物的行為表現,從而產生傾向性,影響實驗結果。
3.4 測量和失訪偏倚
測量偏倚主要考察的是在結果測量階段可能存在的偏倚,SYSCLE對動物實驗測量偏倚的評價涉及3個條目,其中有2個條目(對結果評價者未采用盲法但不影響其結局指標的測定和結果評價者的施盲不被打破)在卒中/中風動物實驗中的達標率僅為0.3%和2%。影響實驗結果測量的最主要因素是盲法的實施。失訪偏倚主要考察的是在實驗過程中可能遇到的動物死亡或丟失等因素造成的部分數據缺失對最終結果產生影響,共涉及4個條目,其中3個條目(對缺失數據采用恰當的方法進行估算、報告缺失數據影響結果真實性的原因和缺失數據在各干預組內相當且各組缺失原因相似)在卒中/中風動物實驗中的達標率僅為0.9%、2%和17%。在實驗過程中,存在一定的失訪是正常情況,關鍵在于對失訪數據的正確處理,臨床研究中經常使用意向性分析(ITT分析)的方法進行處理 [18-20],該方法在動物實驗中也同樣適用。
3.5 報告偏倚
實驗過程中常見的報告偏倚包括:對重要結局指標但結果為陰性的信息沒有進行報告,因為陽性的結果更容易解釋和發表,或者研究者存在可能影響實驗結果的利益沖突,如接受了與研究相關藥廠的基金資助,而未進行報告等。這些因素均可能對動物實驗結果的真實性產生影響。本研究納入的卒中/中風動物實驗均未提前注冊計劃書,將實驗中的主要和次要結局進行預先說明。造成這種結果的原因可能與當前國內外針對動物實驗廣泛適用的報告規范較多,一項橫斷面研究的結果顯示 [21],目前針對臨床前藥物研究的報告質量工具有很多 [22-25],其中ARRIVE和GSPC報告指南的使用相對廣泛,但在國內還未引起重視。
綜上所述,國內卒中/中風動實驗的方法學質量總體較差,存在選擇性偏倚、實施偏倚、測量偏倚、失訪偏倚以及報告偏倚等問題。由于動物實驗數量巨大,本研究僅選擇了卒中/中風領域的動物實驗進行評價,對該領域動物實驗的評價結果可能不能代表中文動物實驗的整體情況,為了彌補該缺陷,本課題組正在納入其他領域的動物實驗進行研究。
動物實驗指在實驗室內,為了獲得有關生物學、醫學等方面的新知識或解決具體問題而使用動物進行的科學研究 [1],是臨床前研究的重要組成部分,亦是連接基礎研究和臨床試驗的重要橋梁 [2, 3],其結果直接影響著許多領域研究課題成果的確立和水平的高低。臨床前動物實驗的基本目的是初步驗證干預措施的安全性和有效性,并為新干預措施是否可以進入臨床研究階段提供科學證據 [4, 5]。然而很多因素會影響臨床前動物實驗的真實性和可靠性 [6],如原始實驗設計不需要專門委員會批準,非隨機的研究、對照設立欠佳,動物質量未標準化,觀察指標單一,結果報告不完整、可重復性差等。英國最大的動物實驗資助機構,國際實驗動物 3Rs(The National Centre for the Replacement,Refinement and Reduction of Animals in Research,NC3Rs)中心對其所資助的動物實驗的報告質量進行回顧性分析后發現 [7]:許多被資助的研究都缺乏對實驗設計、實施和分析等一些重要信息的報告,僅59%的論文說明了該實驗的假設和目的、動物的實驗數量和所用實驗動物的基本特征。30% 的實驗未描述其統計學方法以及未采用正確的統計指標描述統計結果。分別有 87% 和 86% 的實驗未實施“隨機分配”和“盲法”,更加嚴重的是在33個實施了“隨機化”原則的動物實驗中,僅9%(3/33)的實驗在其研究報告論文中闡述了具體的隨機化方法,最終導致許多3Rs中心資助動物實驗的研究成果的利用率和轉化率低下,使得3Rs中心科研基金的投入產出比不成正比。因此,準確科學評估動物實驗的方法學和報告質量非常必要。
SYRCLE(the SYstematic Review Centre for Laboratory animal Experimentation,SYRCLE)動物實驗偏倚風險評估工具(以下簡稱SYRCLE工具)是由荷蘭動物實驗系統評價研究中心研發,旨在提高動物實驗的方法質量及研究過程的透明化 [8, 9]。雖然當前已經存在較多的評價動物實驗質量的清單和工具 [11, 12, 13],但不同清單和工具針對的研究領域不同,且不同清單和工具關注動物實驗方法學質量的側重點也不一樣,缺乏統一標準。SYRCLE工具是基于Cochrane偏倚風險評估工具的制定方法,針對動物實驗設計、實施和測量過程中可能存在的偏倚或混雜進行客觀評價的工具,對不同類型和領域的動物實驗都適用。
本研究旨在采用SYRCLE工具評價卒中/中風動實驗的方法學質量,系統分析卒中/中風領域動物實驗在設計、實施和測量過程中存在的缺點和不足,為改善我國動物實驗的方法學質量,生產高質量臨床前研究提供思路。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
研究類型:動物實驗。研究對象:卒中/中風動物。干預措施:無限定。結局指標:無限定。
1.1.2 排除標準
① 重復發表的文獻(只納入最近發表的一篇);② 會議文獻以及動物實驗的系統評價/Meta分析等二次研究;③ 臨床研究合并動物實驗的研究;④ 無法獲取全文且無詳細摘要的文獻;⑤ 無法提取數據的研究。
1.2 資料來源
采用主題詞和自由詞結合檢索CBM、VIP、WanFang Data,以及CNKI等數據庫,全面搜集國內公開發表的卒中/中風的動物實驗。檢索日期截至2014年12月31日。檢索詞包括:動物模型、動物研究、臨床前研究、鼠、兔、蟾蜍、豬、狗、猴、牛、羊、卒中、中風、治療 [14]。
1.3 資料提取
課題組4名研究人員首先進行正式提取和評價的預試驗,每兩人針對一篇卒中/中風動物實驗獨立進行數據提取和評價。如有不一致,協商討論。資料提取內容包括:第一作者、發表年份、發表期刊、是否為中國科學文獻服務數據庫(CSCD)收錄、研究主題、實施和測量方法、利益聲明等。
1.4 質量評價
4名評價者分成2組分別運用SYRCLE工具,對納入的動物實驗進行評價。SYRCLE量表共包括22個條目(見表 2),每個條目分別用“低風險”、“不清楚”和“高風險”進行描述。參考每個條目的解釋,完全滿足條目的解釋,或綜合考慮未滿足部分不會導致結果產生重要偏倚,評為“低風險”;描述不清晰,不能分辨者,評為“不清楚”;完全不滿足條目內容,或者綜合考慮不滿足部分會導致結果產生重要偏倚,評為“高風險”。鑒于報告規范沒有說明條目的權重問題,故沒有將報告程度賦予分值。正式評價之前,選取15篇文獻進行預試驗,并計算組內一致性(ICC值),ICC值>0.75表明各評價者對條目的理解達成一致。
1.5 統計分析
運用Office Excel 2013軟件對納入文獻的方法學質量進行描述性分析,并從條目報告數量、不同年份區間發表文獻的質量以及運用是否發表在CSCD收錄期刊3個方面進行分層分析。運用SPSS 19.0計算預試驗ICC值。
2 結果
2.1 文獻篩選結果
初檢出相關文獻4 722篇,經過去重、閱讀題目和摘要后初步納入647篇文獻。進一步閱讀全文后,最終納入582篇卒中/中風動物實驗。文獻篩選流程及結果見圖 1。

2.2 納入研究的基本信息
582篇動物實驗發表在272種期刊上,發文數前5位期刊分別為《中國臨床康復》(18篇,3.1%)、《中國中醫藥科技》(14篇,2.4%)、《中國組織工程研究與臨床康復》(13篇,2.2%)、《中西醫結合心腦血管病雜志》(12篇,2.1%)和《中華中醫藥學刊》(10篇,1.7%)。其中,433篇(74.4%)發表在CSCD期刊上,2005~2014這10年間發表的文獻占到總文獻的70%以上(表 1)。

2.3 卒中/中風動物實驗的總體SYRCLE工具評價結果
SYRCLE工具22個條目中,4個條目評價為“低風險”的研究數大于50%,包括:條目1描述具體的隨機方法(79.0%),條目2實驗組和對照組基線特征均衡(99.1%),條目17無法獲取研究計劃書但已發表文章中很清楚地報告了所有預期結果(100%),條目20 分析單位錯誤(100%)等。16個條目評價為“低風險”的研究數小于30%,詳見表 2。

2.4 SYSCLE工具不同條目“低風險”分布
SYSCLE工具22個條目中,99%的動物實驗滿足3個以上條目為“低風險”,17%的動物實驗滿足10個以上條目為“低風險”,不足1%的動物實驗滿足17個條目為“低風險”(詳見圖 2)。

2.5 不同時間段發表卒中/中風動物實驗的SYRCLE工具評價結果
按5年一個時間段,統計各時間段發表卒中/中風動物實驗采用SYRCLE工具評價為“低風險”的平均條目數見圖 3。動物實驗質量總體呈上升趨勢,但在2010~2014年段略有下降(圖 3)。

2.6 CSCD與非CSCD期刊發表卒中/中風動物實驗的SYRCLE工具評價結果
CSCD和非CSCD期刊發表卒中/中風動物實驗的質量總體上呈上升趨勢,但各時間段之間差異無統計學意義(P≥ 0.05)。非CSCD期刊發表動物實驗采用SYRCLE工具評價為“低風險”平均條目數在各時間段均高于CSCD期刊(詳見表 3)。

3 討論
3.1 總體偏倚風險情況
從SYSCLE工具的評價結果看,卒中/中風領域的動物實驗在選擇性偏倚、實施偏倚、測量偏倚、失訪偏倚以及報告偏倚方面仍然存在很多需要改進的地方。22個評價條目中,僅17%的文獻滿足了10個以上條目,不足1%的文獻滿足17個條目。進一步的分層分析發現,不同時間段發表的動物實驗,其總體偏倚風險差異不大(圖 3),評價為“低風險”的條目數基本在4~5個(18%~23%),說明在過去20年間,國內動物實驗質量未得到有效改善。并且,這種情況在CSCD期刊和非CSCD期刊發表的動物實驗間也無差異(表 3),甚至CSCD期刊發表的動物實驗質量有更糟的趨勢,雖然CSCD期刊在同行評審上和對數據質量和真實性的要求上可能比非CSCD期刊更高。
3.2 選擇性偏倚
SYSCLE對動物實驗選擇性偏倚的評價涉及5個條目,內容涉及隨機、分配隱藏、基線平衡以及疾病建模,其中有3個條目幾乎所有的卒中/中風動物實驗均未達標。首先是隨機和分配隱藏,如果動物實驗實現了完全隨機,則實驗組和對照組動物基線平衡。如果沒有施行隨機或分配隱藏,由于動物實驗的樣本相對臨床試驗要小很多,可導致在有些重要基線方面存在重大差異 [8],從而影響實驗結果的推斷。其次是誘導疾病的時間安排,主要是為了保證動物實驗疾病建模的時間充分,足以模擬卒中/中風的病理機制。
3.3 實施偏倚
SYSCLE對動物實驗實施偏倚的評價涉及3個條目,有2個條目(動物房中隨機安置籠子或動物和對結局指標的影響),所有的卒中/中風動物實驗均未報告。不同于人體研究,動物實驗中對于動物的安置方式對研究結果具有重要影響 [15-17],如不同溫度和光照等。如溫度對實驗動物的影響體現在,細微的溫度變化可導致動物的代謝率和毒性產生差異,從而對實驗結果產生影響。另一方面,若動物未隨機安置,研究人員可能會預見各組動物的行為表現,從而產生傾向性,影響實驗結果。
3.4 測量和失訪偏倚
測量偏倚主要考察的是在結果測量階段可能存在的偏倚,SYSCLE對動物實驗測量偏倚的評價涉及3個條目,其中有2個條目(對結果評價者未采用盲法但不影響其結局指標的測定和結果評價者的施盲不被打破)在卒中/中風動物實驗中的達標率僅為0.3%和2%。影響實驗結果測量的最主要因素是盲法的實施。失訪偏倚主要考察的是在實驗過程中可能遇到的動物死亡或丟失等因素造成的部分數據缺失對最終結果產生影響,共涉及4個條目,其中3個條目(對缺失數據采用恰當的方法進行估算、報告缺失數據影響結果真實性的原因和缺失數據在各干預組內相當且各組缺失原因相似)在卒中/中風動物實驗中的達標率僅為0.9%、2%和17%。在實驗過程中,存在一定的失訪是正常情況,關鍵在于對失訪數據的正確處理,臨床研究中經常使用意向性分析(ITT分析)的方法進行處理 [18-20],該方法在動物實驗中也同樣適用。
3.5 報告偏倚
實驗過程中常見的報告偏倚包括:對重要結局指標但結果為陰性的信息沒有進行報告,因為陽性的結果更容易解釋和發表,或者研究者存在可能影響實驗結果的利益沖突,如接受了與研究相關藥廠的基金資助,而未進行報告等。這些因素均可能對動物實驗結果的真實性產生影響。本研究納入的卒中/中風動物實驗均未提前注冊計劃書,將實驗中的主要和次要結局進行預先說明。造成這種結果的原因可能與當前國內外針對動物實驗廣泛適用的報告規范較多,一項橫斷面研究的結果顯示 [21],目前針對臨床前藥物研究的報告質量工具有很多 [22-25],其中ARRIVE和GSPC報告指南的使用相對廣泛,但在國內還未引起重視。
綜上所述,國內卒中/中風動實驗的方法學質量總體較差,存在選擇性偏倚、實施偏倚、測量偏倚、失訪偏倚以及報告偏倚等問題。由于動物實驗數量巨大,本研究僅選擇了卒中/中風領域的動物實驗進行評價,對該領域動物實驗的評價結果可能不能代表中文動物實驗的整體情況,為了彌補該缺陷,本課題組正在納入其他領域的動物實驗進行研究。