引用本文: 王歡, 劉亞麗, 朱敏, 武凱楠, 趙夢娜, 侯皓中, 魏晨如, 李彥佑, 廖緒亮, 李婧, 賈瑜, 邊天月, 趙璐璐, 馬彬. 國內期刊發表的干預類動物實驗報告質量的文獻計量分析. 中國循證醫學雜志, 2019, 19(1): 89-96. doi: 10.7507/1672-2531.201808056 復制
動物實驗指在實驗室內,為獲得有關生物學、醫學等方面的新知識或解決具體問題而使用動物進行的科學研究[1],它是生物醫學研究的基本手段之一。動物實驗是臨床前研究的重要組成部分,作為連接基礎研究和臨床試驗的橋梁,其設計和實施質量影響眾多領域課題研究的成果[2, 3]。
近年來,生物醫學期刊上發表的動物實驗數量急劇增加。但越來越多的研究發現[4-7],即使在一流雜志上發表的動物實驗,其報告質量也不盡如人意。國際實驗動物 3Rs(the national centre for the replacement,refinement and reduction of animals in research,NC3Rs)中心的研究顯示[8]:許多被資助的動物實驗都缺乏對實驗設計、實施和分析等方面重要信息的報告。隨機抽樣調查了 271 個動物實驗,41% 的論文未說明該實驗的假設和目的、動物的實驗數量和所用實驗動物的基本特征,30% 的實驗未描述其統計學方法及未采用正確的統計指標描述統計結果。論文報告不充分和不完整,論文報告質量低嚴重阻礙了動物實驗科學研究的價值。因此,為促進動物實驗報告質量的提高,基于 CONSORT 聲明[9],國際實驗動物 3R 中心研發了動物實驗研究報告指南(animal research reporting: in vivo experiments guidelines,ARRIVE 指南),并于 2010 年正式發表。該指南包括題目、摘要、引言、方法、結果和討論 6 部分,共 20 個條目及其細則[10]。國內亦有探討動物實驗報告質量的研究,但其僅限于特定疾病領域[11],亦未探討 ARRIVE 指南的發表是否促進了國內動物實驗報告質量的提升。因此,本研究全面收集國內已發表的動物實驗,基于 ARRIVE 指南全面回顧分析動物實驗報告質量及其存在的問題,為促進國內動物實驗報告質量的提升提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
干預類動物實驗,不限制動物種屬和干預手段。
1.1.2 排除標準
① 重復發表的研究;② 港澳臺地區相關期刊;③ 非醫學類動物實驗;④ 基于動物組織、器官或細胞等的體外實驗;⑤ 同時納入動物和人體的實驗。
1.2 文獻檢索策略
計算機檢索 CNKI、WanFang Data、VIP 和 CBM 數據庫,搜集干預類動物實驗,檢索時限從建庫截至 2018 年 7 月。檢索詞包括:鼠、兔、狗、豬、羊、猿、蛙、猩猩、猴、動物實驗等。CBM 的檢索策略見框 1。

1.3 文獻篩選與資料提取
由培訓合格的兩對研究員(王歡和吳凱楠、李靖和侯皓中)嚴格按照納入排除標準,獨立篩選文獻、提取資料,并交叉核對,如遇分歧則由第三方(馬彬)裁決。按照事先制定的全文數據提取表提取資料。主要內容包括:① 納入研究的基本特征:發表作者數量、作者單位、時間、雜志、動物種類、樣本量、干預措施等;② 報告質量評價的關鍵要素。
1.4 文獻報告質量評價
由 4 名培訓合格的研究員(王歡、趙夢娜、朱敏、侯皓中),基于 ARRIVE 指南包含的 20 個條目的 39 個亞條目對符合納入標準的文獻進行報告質量評價。待評價文獻針對每個亞條目的評價結果分別為“高風險”和“低風險”,其中“低風險”是指待評價文獻詳細報告了該亞條目中涉及的全部信息、或部分信息,或至少其中 1 條信息。反之,則為“高風險”。最后,計算 39 個亞條目“低風險”的符合率,即每個亞條目評價為“低風險”的文獻數目占納入文獻總數的百分比。
1.5 統計分析
基于 ARRIVE 指南的發表時間(2010 年),對不同時間文獻進行對比分析(<2010 年發表動物實驗 vs. ≥2010 年發表動物實驗)。分別計算不同時間實驗的 39 個亞條目“低風險”的符合率,即每個亞條目評價為“低風險”的文獻數目分別占納入<2010 年發表動物實驗總數和≥2010 年發表動物實驗總數的百分比。采用 Excel 2011 軟件進行統計分析,計數資料采用例數和百分比(%)。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 21 713 篇,排除重復、不符合納入標準的文獻后,最終納入 4 342 篇文獻,共 4 925 個動物實驗(部分納入文獻包含多個動物實驗)。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本情況
納入的 4 342 篇研究中,73.03%(3 171/4 342)的研究被引次數≤5 次(即納入文獻在百度學術中的被引次數),其中 47.62%(1 510/3 171)的研究被引次數為 0 次,僅 29.04% 的研究(1 261/4 342)發表在 CSCD 收錄的期刊,且第一作者為臨床醫生所占比例最高(45.07%,1 957/4 342)(表 1)。

納入的 4 925 個動物實驗中,在實驗動物的選擇上,排前 3 位分別為:鼠(81.26%,4 002/4 925)、兔子(15.07%,742/4 925)、犬(1.91%,94/4 925)。在干預措施的分類上,排前 3 位的分別是:藥物(82.23%,4 050/4 925)、手術(7.39%,364/4 925)和針灸(3.70%,182/4 925)(圖 2)。在涉及疾病范圍及分類上,排前 3 位分別為:循環系統疾病(10.92%,538/4 925)、消化系統疾病(10.64%,524/4 925)和腫瘤(9.66%,476/4 925)。

2.3 納入研究的報告質量
就 ARRIVE 指南的 6 個部分共 20 個條目及 39 個亞條目而言,超過一半的亞條目(51.28%,20/39)在“低風險”的符合率上低于 50%,其中 90%(18/20)的亞條目在“低風險”的符合率上低于 30%,甚至 65%(13/20)低于 10%;僅 28.21% 的亞條目(11/39)在“低風險”的符合率上高于 90%,見表 2。

對題目和摘要涉及的 2 個條目(條目 1~2)而言:條目 1 和條目 2 在“低風險”的符合率上均高于 90%,2010 年之后發表的研究其條目 1 和條目 2 在“低風險”的符合率上均高于 2010 年之前發表的研究,且兩組在條目 2 方面差異有統計學意義(P<0.05)。
對前言涉及的 3 個條目(條目 3a~4)而言:條目 3a 和條目 4 在“低風險”的符合率上均高于 90%,條目 3b 在“低風險”的符合率上僅為 37.06%。2010 年之后發表的研究其條目 3a、3b 和條目 4 在“低風險”的符合率上均高于 2010 年之前發表的研究。
對方法學涉及的 28 個條目(條目 5~13c)而言:條目 6a、6b、6c、7a、8a、8b、10a、11b、12、13a 和條目 13b 在“低風險”的符合率上均高于 50%,其中條目 6b、6c、7a、8a、11b 和條目 12 在“低風險”的符合率上均高于 90%;條目 5、6d、7b、7c、7d、9a、9b、9c、10b、10c、11a 和條目 13c 在“低風險”的符合率上均低于 50%,其中除了條目 7d 的其余條目在“低風險”的符合率上均低于 30%,條目 5、6d、7b、9c、10b 和亞條目 10c 在“低風險”的符合率上甚至均低于 10%。2010 年之后發表的研究其條目 5、6a、6b、6c、6d、7a、7d、8a、8b、9a、9b、9c、10a、10b、11a、11b、12、13a、13b 和條目 13c 在“低風險”的符合率上均略高于 2010 年之前發表的研究;而對條目 7b、7c、9c 和條目 10c 而言,2010 年之后發表的研究在“低風險”的符合率上甚至低于 2010 年之前發表的研究。
對結果涉及的 6 個條目(條目 14~17b)而言:條目 15a、15b 和條目 16 在“低風險”的符合率上均高于 50%,而條目 14、17a 和條目 17b 在“低風險”的符合率上均低于 6%。2010 年之后發表的研究,其條目 14、15a、15b、16 和條目 17a 在“低風險”的符合率上均高于 2010 年之前發表的研究;而對條目 17b 而言正好相反。
對討論涉及的 5 個條目(條目 18a~20)而言:除條目 18a 在“低風險”的符合率上高于 90% 外,其余條目在“低風險”的符合率上均低于 10%。2010 年之后發表的研究,這 5 個條目在“低風險”的符合率上均高于 2010 年之前發表的研究。
3 討論
本研究是首個基于 ARRIVE 指南,對國內中文期刊上已發表的動物實驗的報告質量進行全面、系統分析的研究。總體而言,隨著 ARRIVE 指南的正式發布,國內已發表的動物實驗在 ARRIVE 指南的大部分條目上的符合率均得到一定程度的提高,但在方法學部分涉及的實驗設計和步驟、樣本量,結果部分涉及的基線資料、不良反應及討論涉及的具體條目的報告方面尚存在一定的不足。
3.1 方法學部分
高質量的研究離不開科學設計和嚴謹實施。在 ARRIVE 指南中,其方法學部分包括“倫理聲明、研究設計、實驗步驟、實驗動物、飼養場所和飼養、樣本量、動物實驗組分配、實驗結果和統計學方法”共 9 個方面內容。我們的研究顯示:
(1)倫理聲明:國內發表的動物實驗中,僅 6.59% 的實驗報告了其倫理聲明(條目 5),ARRIVE 指南的發布雖在一定程度上促進了該條目的報告率,但僅提高到 7.74%。有研究顯示[12],我國每年至少有 2 000 萬只動物被用于科學實驗,其中約 25% 的實驗動物在實驗過程中會遭受痛苦,但這其中沒有給止痛藥的約占 10%。陳潔等[13]對我國實驗動物倫理現狀的分析顯示:隨意使用實驗動物,僅將實驗動物視為一種獲取實驗數據的工具,未考慮實驗動物在實驗過程中的感受和可能忍受的痛苦等問題較為嚴重。因此,有必要通過立法進一步規范動物實驗的操作和實驗動物的使用,需要更加關注動物倫理問題,遵守“3R”原則,尊重實驗動物的價值和權利。
(2)實驗設計方面:2010 年之后雖然更多的研究采用時線圖或流程圖詳細闡述了研究設計實施的全過程(條目 6d),但其實際的符合率也僅為 2.31%。有研究顯示:超過一半的臨床前研究不可重復[14],其主要原因包括實驗設計的缺陷、不正確的統計分析和不充分的報告等[8, 15-16]。而清晰詳盡的流程圖可有效展示實驗的全過程,提高實驗實施全過程的透明度。
(3)實驗步驟方面:國內發表的動物實驗中,僅 6.20% 和 11.81% 的研究報告實驗日期(條目 7b)和實驗場所(條目 7c)。國外有研究[17]顯示:76 篇高影響力動物實驗(被引次數超過 500 次),因缺乏對關鍵的方法學信息的報告,從而導致無法科學判斷其結果的可信度。因此,對實驗過程和步驟的詳細報告,是保證其結果的可重復性,提高其結果的利用率和轉化率的關鍵措施。
(4)飼養場所和飼養方面:雖然 2010 年之后發表的研究,在飼養場所(條目 9a)和飼養條件(條目 9b)方面的符合率得到有效提高(P<0.001),但其實際的符合率也僅分別為 29.46% 和 28.35%。眾所周知,動物飼養籠舍類型、安置方式、光/暗周期、溫度和水質等對實驗結果均會產生重要影響。而且,Hooijmans 等[2, 18-20]的研究中指出:架子頂端的籠子所接受的光照強度是架子底端的 4 倍,而光照強度的輕微改變會對動物生殖和行為產生重要影響和改變等。
(5)樣本量方面:國內發表的 4 342 篇動物實驗中,僅 1 篇研究報告所需樣本量的算法及計算公式(條目 10b),6 篇研究標明每個實驗的獨立重復的動物數量(條目 10c)。美國國家神經疾病和中風研究院(National Institute of Neurological Disorders and Stroke,NINDS)于 2012 年對如何改善動物研究報告制定的共識中指出[21]:樣本量不足可能導致假陰性的結果,同時會遺漏一些潛在的重要發現,故有必要報告實驗中每組使用了多少動物,實驗前用什么統計方法來確定樣本量。
(6)動物實驗組分配:盡管 2010 年之后發表的研究對實驗動物具體分組方法的報告率(條目 11a)明顯高于 2010 之前發表的研究(P<0.001),但其實際符合率也僅為 12.02%。有研究顯示[8]:實驗動物分組采用隨機分配和分配隱藏是降低一個干預性動物實驗內在偏倚風險的重要措施。
3.2 結果和討論部分
在 ARRIVE 指南中,其結果和討論部分包括“基線數據、數字分析、結果和評價、不良反應、詮釋/科學內涵、概括/轉換和基金支持”共 7 個方面內容。我們的研究顯示:① 不良反應:國內發表的絕大部分動物實驗(4 278/4 342,98.53%)未報告實驗過程中重要不良反應的詳細信息(條目 17a)。動物實驗同樣需要關注不良事件并分析其性質,這對判斷某一項干預措施利弊關系非常重要。因此,不可忽視對不良事件的準確評估和報告。② 詮釋/科學內涵:國內發表的 4 342 篇動物實驗中,僅 5.25% 和 0.35% 的實驗報告其局限性(條目 18b)及其研究方法或研究發現對于 3R 原則的意義(條目 18c)。試驗設計的目的是期望減少實驗過程中可能產生的偏倚。但在具體實施過程中,不同動物模型、實驗過程中任何造成偏倚的潛在來源及任何影響研究結果精確性等的一些因素均會降低研究的科學內涵[10]。因此,研究者有必要在論文的討論部分對此進行客觀評價和說明,以保證其結論的科學性,及證據使用者對其結論的把握和理解。此外,開展動物實驗需遵循減少、替代、或優化動物使用的 3R 原則,其核心是保護、少用或不用動物[1, 22]。科學的實驗設計可以減少實驗動物的數量[23, 24];完善的實驗技術路線、手段及優化的方案,可減輕、減少實驗過程中動物的疼痛和不安[22]。因此,作者有必要在論文的討論部分詮釋其科學內涵,可幫助讀者充分獲取和評估研究信息,促進 3R 原則的實施及推廣,提高動物實驗的質量。
本研究亦存在一定的局限性:① 僅基于發表在國內期刊上的動物實驗進行評價,其結果可能不能代表國內學者發表在國外同行評審期刊上的研究質量;② 僅納入干預類動物實驗,其結果不能代表其他類型動物實驗的報告質量。
綜上所述,基于 ARRIVE 指南國內動物實驗的報告質量總體中等偏低,尤其在方法學部分的倫理聲明、實驗設計及步驟、樣本量、動物實驗組分配等方面報告均不充分,導致證據使用者無法充分了解其實驗設計和實施的全過程,在一定程度上阻礙其成果的轉化和利用。因此,今后有必要普及 ARRIVE 指南及倡導研究者們遵循 ARRIVE 指南,特別是促進其在專業期刊稿約中的引入,以促進動物實驗的設計、實施和報告,最終提升動物實驗報告質量。
動物實驗指在實驗室內,為獲得有關生物學、醫學等方面的新知識或解決具體問題而使用動物進行的科學研究[1],它是生物醫學研究的基本手段之一。動物實驗是臨床前研究的重要組成部分,作為連接基礎研究和臨床試驗的橋梁,其設計和實施質量影響眾多領域課題研究的成果[2, 3]。
近年來,生物醫學期刊上發表的動物實驗數量急劇增加。但越來越多的研究發現[4-7],即使在一流雜志上發表的動物實驗,其報告質量也不盡如人意。國際實驗動物 3Rs(the national centre for the replacement,refinement and reduction of animals in research,NC3Rs)中心的研究顯示[8]:許多被資助的動物實驗都缺乏對實驗設計、實施和分析等方面重要信息的報告。隨機抽樣調查了 271 個動物實驗,41% 的論文未說明該實驗的假設和目的、動物的實驗數量和所用實驗動物的基本特征,30% 的實驗未描述其統計學方法及未采用正確的統計指標描述統計結果。論文報告不充分和不完整,論文報告質量低嚴重阻礙了動物實驗科學研究的價值。因此,為促進動物實驗報告質量的提高,基于 CONSORT 聲明[9],國際實驗動物 3R 中心研發了動物實驗研究報告指南(animal research reporting: in vivo experiments guidelines,ARRIVE 指南),并于 2010 年正式發表。該指南包括題目、摘要、引言、方法、結果和討論 6 部分,共 20 個條目及其細則[10]。國內亦有探討動物實驗報告質量的研究,但其僅限于特定疾病領域[11],亦未探討 ARRIVE 指南的發表是否促進了國內動物實驗報告質量的提升。因此,本研究全面收集國內已發表的動物實驗,基于 ARRIVE 指南全面回顧分析動物實驗報告質量及其存在的問題,為促進國內動物實驗報告質量的提升提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
干預類動物實驗,不限制動物種屬和干預手段。
1.1.2 排除標準
① 重復發表的研究;② 港澳臺地區相關期刊;③ 非醫學類動物實驗;④ 基于動物組織、器官或細胞等的體外實驗;⑤ 同時納入動物和人體的實驗。
1.2 文獻檢索策略
計算機檢索 CNKI、WanFang Data、VIP 和 CBM 數據庫,搜集干預類動物實驗,檢索時限從建庫截至 2018 年 7 月。檢索詞包括:鼠、兔、狗、豬、羊、猿、蛙、猩猩、猴、動物實驗等。CBM 的檢索策略見框 1。

1.3 文獻篩選與資料提取
由培訓合格的兩對研究員(王歡和吳凱楠、李靖和侯皓中)嚴格按照納入排除標準,獨立篩選文獻、提取資料,并交叉核對,如遇分歧則由第三方(馬彬)裁決。按照事先制定的全文數據提取表提取資料。主要內容包括:① 納入研究的基本特征:發表作者數量、作者單位、時間、雜志、動物種類、樣本量、干預措施等;② 報告質量評價的關鍵要素。
1.4 文獻報告質量評價
由 4 名培訓合格的研究員(王歡、趙夢娜、朱敏、侯皓中),基于 ARRIVE 指南包含的 20 個條目的 39 個亞條目對符合納入標準的文獻進行報告質量評價。待評價文獻針對每個亞條目的評價結果分別為“高風險”和“低風險”,其中“低風險”是指待評價文獻詳細報告了該亞條目中涉及的全部信息、或部分信息,或至少其中 1 條信息。反之,則為“高風險”。最后,計算 39 個亞條目“低風險”的符合率,即每個亞條目評價為“低風險”的文獻數目占納入文獻總數的百分比。
1.5 統計分析
基于 ARRIVE 指南的發表時間(2010 年),對不同時間文獻進行對比分析(<2010 年發表動物實驗 vs. ≥2010 年發表動物實驗)。分別計算不同時間實驗的 39 個亞條目“低風險”的符合率,即每個亞條目評價為“低風險”的文獻數目分別占納入<2010 年發表動物實驗總數和≥2010 年發表動物實驗總數的百分比。采用 Excel 2011 軟件進行統計分析,計數資料采用例數和百分比(%)。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 21 713 篇,排除重復、不符合納入標準的文獻后,最終納入 4 342 篇文獻,共 4 925 個動物實驗(部分納入文獻包含多個動物實驗)。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本情況
納入的 4 342 篇研究中,73.03%(3 171/4 342)的研究被引次數≤5 次(即納入文獻在百度學術中的被引次數),其中 47.62%(1 510/3 171)的研究被引次數為 0 次,僅 29.04% 的研究(1 261/4 342)發表在 CSCD 收錄的期刊,且第一作者為臨床醫生所占比例最高(45.07%,1 957/4 342)(表 1)。

納入的 4 925 個動物實驗中,在實驗動物的選擇上,排前 3 位分別為:鼠(81.26%,4 002/4 925)、兔子(15.07%,742/4 925)、犬(1.91%,94/4 925)。在干預措施的分類上,排前 3 位的分別是:藥物(82.23%,4 050/4 925)、手術(7.39%,364/4 925)和針灸(3.70%,182/4 925)(圖 2)。在涉及疾病范圍及分類上,排前 3 位分別為:循環系統疾病(10.92%,538/4 925)、消化系統疾病(10.64%,524/4 925)和腫瘤(9.66%,476/4 925)。

2.3 納入研究的報告質量
就 ARRIVE 指南的 6 個部分共 20 個條目及 39 個亞條目而言,超過一半的亞條目(51.28%,20/39)在“低風險”的符合率上低于 50%,其中 90%(18/20)的亞條目在“低風險”的符合率上低于 30%,甚至 65%(13/20)低于 10%;僅 28.21% 的亞條目(11/39)在“低風險”的符合率上高于 90%,見表 2。

對題目和摘要涉及的 2 個條目(條目 1~2)而言:條目 1 和條目 2 在“低風險”的符合率上均高于 90%,2010 年之后發表的研究其條目 1 和條目 2 在“低風險”的符合率上均高于 2010 年之前發表的研究,且兩組在條目 2 方面差異有統計學意義(P<0.05)。
對前言涉及的 3 個條目(條目 3a~4)而言:條目 3a 和條目 4 在“低風險”的符合率上均高于 90%,條目 3b 在“低風險”的符合率上僅為 37.06%。2010 年之后發表的研究其條目 3a、3b 和條目 4 在“低風險”的符合率上均高于 2010 年之前發表的研究。
對方法學涉及的 28 個條目(條目 5~13c)而言:條目 6a、6b、6c、7a、8a、8b、10a、11b、12、13a 和條目 13b 在“低風險”的符合率上均高于 50%,其中條目 6b、6c、7a、8a、11b 和條目 12 在“低風險”的符合率上均高于 90%;條目 5、6d、7b、7c、7d、9a、9b、9c、10b、10c、11a 和條目 13c 在“低風險”的符合率上均低于 50%,其中除了條目 7d 的其余條目在“低風險”的符合率上均低于 30%,條目 5、6d、7b、9c、10b 和亞條目 10c 在“低風險”的符合率上甚至均低于 10%。2010 年之后發表的研究其條目 5、6a、6b、6c、6d、7a、7d、8a、8b、9a、9b、9c、10a、10b、11a、11b、12、13a、13b 和條目 13c 在“低風險”的符合率上均略高于 2010 年之前發表的研究;而對條目 7b、7c、9c 和條目 10c 而言,2010 年之后發表的研究在“低風險”的符合率上甚至低于 2010 年之前發表的研究。
對結果涉及的 6 個條目(條目 14~17b)而言:條目 15a、15b 和條目 16 在“低風險”的符合率上均高于 50%,而條目 14、17a 和條目 17b 在“低風險”的符合率上均低于 6%。2010 年之后發表的研究,其條目 14、15a、15b、16 和條目 17a 在“低風險”的符合率上均高于 2010 年之前發表的研究;而對條目 17b 而言正好相反。
對討論涉及的 5 個條目(條目 18a~20)而言:除條目 18a 在“低風險”的符合率上高于 90% 外,其余條目在“低風險”的符合率上均低于 10%。2010 年之后發表的研究,這 5 個條目在“低風險”的符合率上均高于 2010 年之前發表的研究。
3 討論
本研究是首個基于 ARRIVE 指南,對國內中文期刊上已發表的動物實驗的報告質量進行全面、系統分析的研究。總體而言,隨著 ARRIVE 指南的正式發布,國內已發表的動物實驗在 ARRIVE 指南的大部分條目上的符合率均得到一定程度的提高,但在方法學部分涉及的實驗設計和步驟、樣本量,結果部分涉及的基線資料、不良反應及討論涉及的具體條目的報告方面尚存在一定的不足。
3.1 方法學部分
高質量的研究離不開科學設計和嚴謹實施。在 ARRIVE 指南中,其方法學部分包括“倫理聲明、研究設計、實驗步驟、實驗動物、飼養場所和飼養、樣本量、動物實驗組分配、實驗結果和統計學方法”共 9 個方面內容。我們的研究顯示:
(1)倫理聲明:國內發表的動物實驗中,僅 6.59% 的實驗報告了其倫理聲明(條目 5),ARRIVE 指南的發布雖在一定程度上促進了該條目的報告率,但僅提高到 7.74%。有研究顯示[12],我國每年至少有 2 000 萬只動物被用于科學實驗,其中約 25% 的實驗動物在實驗過程中會遭受痛苦,但這其中沒有給止痛藥的約占 10%。陳潔等[13]對我國實驗動物倫理現狀的分析顯示:隨意使用實驗動物,僅將實驗動物視為一種獲取實驗數據的工具,未考慮實驗動物在實驗過程中的感受和可能忍受的痛苦等問題較為嚴重。因此,有必要通過立法進一步規范動物實驗的操作和實驗動物的使用,需要更加關注動物倫理問題,遵守“3R”原則,尊重實驗動物的價值和權利。
(2)實驗設計方面:2010 年之后雖然更多的研究采用時線圖或流程圖詳細闡述了研究設計實施的全過程(條目 6d),但其實際的符合率也僅為 2.31%。有研究顯示:超過一半的臨床前研究不可重復[14],其主要原因包括實驗設計的缺陷、不正確的統計分析和不充分的報告等[8, 15-16]。而清晰詳盡的流程圖可有效展示實驗的全過程,提高實驗實施全過程的透明度。
(3)實驗步驟方面:國內發表的動物實驗中,僅 6.20% 和 11.81% 的研究報告實驗日期(條目 7b)和實驗場所(條目 7c)。國外有研究[17]顯示:76 篇高影響力動物實驗(被引次數超過 500 次),因缺乏對關鍵的方法學信息的報告,從而導致無法科學判斷其結果的可信度。因此,對實驗過程和步驟的詳細報告,是保證其結果的可重復性,提高其結果的利用率和轉化率的關鍵措施。
(4)飼養場所和飼養方面:雖然 2010 年之后發表的研究,在飼養場所(條目 9a)和飼養條件(條目 9b)方面的符合率得到有效提高(P<0.001),但其實際的符合率也僅分別為 29.46% 和 28.35%。眾所周知,動物飼養籠舍類型、安置方式、光/暗周期、溫度和水質等對實驗結果均會產生重要影響。而且,Hooijmans 等[2, 18-20]的研究中指出:架子頂端的籠子所接受的光照強度是架子底端的 4 倍,而光照強度的輕微改變會對動物生殖和行為產生重要影響和改變等。
(5)樣本量方面:國內發表的 4 342 篇動物實驗中,僅 1 篇研究報告所需樣本量的算法及計算公式(條目 10b),6 篇研究標明每個實驗的獨立重復的動物數量(條目 10c)。美國國家神經疾病和中風研究院(National Institute of Neurological Disorders and Stroke,NINDS)于 2012 年對如何改善動物研究報告制定的共識中指出[21]:樣本量不足可能導致假陰性的結果,同時會遺漏一些潛在的重要發現,故有必要報告實驗中每組使用了多少動物,實驗前用什么統計方法來確定樣本量。
(6)動物實驗組分配:盡管 2010 年之后發表的研究對實驗動物具體分組方法的報告率(條目 11a)明顯高于 2010 之前發表的研究(P<0.001),但其實際符合率也僅為 12.02%。有研究顯示[8]:實驗動物分組采用隨機分配和分配隱藏是降低一個干預性動物實驗內在偏倚風險的重要措施。
3.2 結果和討論部分
在 ARRIVE 指南中,其結果和討論部分包括“基線數據、數字分析、結果和評價、不良反應、詮釋/科學內涵、概括/轉換和基金支持”共 7 個方面內容。我們的研究顯示:① 不良反應:國內發表的絕大部分動物實驗(4 278/4 342,98.53%)未報告實驗過程中重要不良反應的詳細信息(條目 17a)。動物實驗同樣需要關注不良事件并分析其性質,這對判斷某一項干預措施利弊關系非常重要。因此,不可忽視對不良事件的準確評估和報告。② 詮釋/科學內涵:國內發表的 4 342 篇動物實驗中,僅 5.25% 和 0.35% 的實驗報告其局限性(條目 18b)及其研究方法或研究發現對于 3R 原則的意義(條目 18c)。試驗設計的目的是期望減少實驗過程中可能產生的偏倚。但在具體實施過程中,不同動物模型、實驗過程中任何造成偏倚的潛在來源及任何影響研究結果精確性等的一些因素均會降低研究的科學內涵[10]。因此,研究者有必要在論文的討論部分對此進行客觀評價和說明,以保證其結論的科學性,及證據使用者對其結論的把握和理解。此外,開展動物實驗需遵循減少、替代、或優化動物使用的 3R 原則,其核心是保護、少用或不用動物[1, 22]。科學的實驗設計可以減少實驗動物的數量[23, 24];完善的實驗技術路線、手段及優化的方案,可減輕、減少實驗過程中動物的疼痛和不安[22]。因此,作者有必要在論文的討論部分詮釋其科學內涵,可幫助讀者充分獲取和評估研究信息,促進 3R 原則的實施及推廣,提高動物實驗的質量。
本研究亦存在一定的局限性:① 僅基于發表在國內期刊上的動物實驗進行評價,其結果可能不能代表國內學者發表在國外同行評審期刊上的研究質量;② 僅納入干預類動物實驗,其結果不能代表其他類型動物實驗的報告質量。
綜上所述,基于 ARRIVE 指南國內動物實驗的報告質量總體中等偏低,尤其在方法學部分的倫理聲明、實驗設計及步驟、樣本量、動物實驗組分配等方面報告均不充分,導致證據使用者無法充分了解其實驗設計和實施的全過程,在一定程度上阻礙其成果的轉化和利用。因此,今后有必要普及 ARRIVE 指南及倡導研究者們遵循 ARRIVE 指南,特別是促進其在專業期刊稿約中的引入,以促進動物實驗的設計、實施和報告,最終提升動物實驗報告質量。