引用本文: 趙璐璐, 王歡, 武凱楠, 謝曄, 杜俊宏, 李彥佑, 朱敏, 李婧, 趙夢娜, 魏晨如, 侯皓中, 馬彬. 高影響力期刊 2014~2016 年動物實驗研究的方法學質量評價. 中國循證醫學雜志, 2018, 18(4): 373-378. doi: 10.7507/1672-2531.201709093 復制
動物實驗是臨床前研究的重要組成部分,作為連接基礎研究和臨床研究的橋梁,其質量影響著眾多領域課題研究的成果和水平的高低[1-3],而這些都有賴于動物實驗的科學設計和規范實施。國際實驗動物中心(the national center for the replacement, refinement and reduction of animals in research,3Rs)的研究顯示:由 3Rs 資助的許多動物實驗在方法學設計方面存在諸多問題,高達 87% 和 86% 的實驗未實施隨機分配和盲法;而在實施了隨機化原則的動物實驗中,僅 9% 的研究闡述了具體的隨機化方法,最終導致其成果轉化和利用率低下[4]。因此,為提高動物實驗的方法學質量及促進研究過程的全透明化,荷蘭 SYRCLE 中心的 Hooijmans 等[1]多名學者于 2014 年起草和制定了 SYRCLE 動物實驗偏倚風險評價工具,以提高動物實驗設計和實施的質量[5]。國內雖有學者探討了中國動物實驗的方法學質量[6],但其僅局限在卒中/中風領域,代表性較差,而且缺乏與國外同類研究的橫向對比。
因此,本研究全面收集國內外已發表的動物實驗,采用 SYRCLE 動物實驗偏倚風險評價工具全面評價其方法學質量,并將國內、外同類研究進行比較分析,探討其在方法設計等重點環節的差異及其可能的原因,為今后國內動物實驗設計和實施提供參考依據,以期提升我國動物實驗研究的方法學質量。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
所有涉及治療干預措施的動物實驗,不限制動物種屬和干預手段。
1.1.2 排除標準
① 重復發表的研究;② 非醫學類動物實驗;③ 基于動物組織、器官或細胞等的體外實驗;④ 同時涉及動物和人體的實驗。
1.2 文獻檢索策略
本文擬評價高影響力期刊收錄的動物實驗,因此,我們選擇檢索的數據庫為中國科學引文數據庫(CSCD)和 Web of science 數據庫。搜集所有涉及治療干預措施的動物實驗,以 SYRCLE 動物實驗偏倚風險評價工具發表時間為起始點,檢索時限為 2014 年至 2016 年 8 月。中文檢索詞包括:動物實驗、體內、鼠、兔、狗、豬、羊、牛、蟾蜍、蛙、猩猩、猴;英文檢索詞包括:murinae、guinea pigs、swine、rabbits、dogs、haplorhini、ranidae、bufonidae、sheep、goats、animal experimentation。以 CSCD 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 4 名研究者嚴格按照納入與排除標準,獨立篩選文獻、提取資料,并兩兩交叉核對,如遇分歧則由第三方(馬彬)協助解決。資料提取的內容主要包括:① 納入研究的基本特征:發表作者數量、作者單位、時間、雜志、動物種類、樣本量、干預措施等;② 偏倚風險評價的關鍵要素。
1.4 納入研究的偏倚風險評價
采用 SYRCLE 動物實驗偏倚風險評價工具[1]評價納入研究的偏倚風險,該評價工具包括 10 個條目(22 個亞條目)。本研究主要通過計算 22 個亞條目“低風險”符合率進行評價。對 4 名研究者(趙璐璐、謝曄、李彥佑、朱敏)進行培訓,使其全面掌握 SYRCLE 動物實驗偏倚風險評價工具的內涵和應用等。然后隨機抽取 10% 的樣本進行預實驗,并計算 Kappa 值,確保 4 名研究者的偏倚風險評價結果具有一致性。
1.5 統計分析
采用 Excel 2011 軟件進行統計分析,計數資料采用例數和百分比(%),計量資料采用中位數和四分位數間距進行統計描述,組間比較采用卡方檢驗,檢驗水準 α=0.05。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 15 539 篇,經逐層篩選后,最終納入 1 999 個動物實驗。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CSCD(
2.2 納入研究的基本情況比較結果
納入的 1 999 個研究中,1 050 個(52.53%)被引頻次為0。其中,中文被引頻次為0的研究占比(948/1 497,63.33%)遠高于英文研究(102/502,20.32%),差異有統計學意義(P<0.001)。納入研究樣本量的中位數和四分位間距為 40(22,78)只。在實驗動物的選擇上,前三位分別為:鼠(91.20%)、兔子(5.75%)和豬(1.60%),在鼠類的選擇方面,中英文研究的差異有統計學意義(P=0.001)。在干預措施的分類上,前三位的分別是藥物干預(77.64%)、手術干預(9.15%)和行為-飲食干預(5.80%);在行為-飲食干預(P=0.005)和針灸(P=0.003)方面,中英文研究差異有統計學意義(表 1)。

2.3 納入研究的偏倚風險評價結果
偏倚風險評價結果顯示:總體而言,納入研究在 SYRCLE 動物實驗偏倚風險評價工具包含的 22 個亞條目中,超過一半的亞條目(59.09%)的“低風險”符合率低于 30%,其中 84.62% 的亞條目符合率低于 10%,見表 2。對涉及選擇性偏倚的 5 個亞條目(亞條目 1~5)而言,亞條目 3 和亞條目 5 的“低風險”符合率均低于 5%(2.20% 和 1.05%)。中、英文研究在亞條目 1 和亞條目 2 方面,差異均有統計學意義(P=0.004,P=0.003)。對涉及實施偏倚的 3 個亞條目(亞條目 6~8)而言,“低風險”符合率均低于 10%。中、英文研究在亞條目 7 和亞條目 8 方面,差異均有統計學意義(P 均<0.001)。對涉及測量偏倚的 3 個亞條目(亞條目 9~11)而言,“低風險”符合率均低于 50%,其中亞條目 10 和亞條目 11 均低于 15%。中、英文研究在亞條目 10(P=0.010)和亞條目 11(P<0.001)方面,差異均有統計學意義。對涉及失訪偏倚的 4 個亞條目(亞條目 12~15)而言,亞條目 13、14 和亞條目 15 的“低風險”符合率均低于 5%(3.00%、2.15% 和 0.55%)。中、英文研究在亞條目 12 和亞條目 13 方面,差異均有統計學意義(P 均<0.001)。對涉及報告偏倚的 2 個亞條目(亞條目 16~17)而言,亞條目 16 的“低風險”符合率僅為 0.20%。中、英文研究在亞條目 16 方面,差異有統計學意義(P=0.004)。對涉及其他偏倚的 5 個亞條目(亞條目 18~22)而言,亞條目 22 的“低風險”符合率僅為 3.70%。中、英文研究在亞條目 21 和亞條目 22 方面,差異均有統計學意義(P 均<0.001)。

3 討論
自 2014 年 SYRCLE 動物實驗偏倚風險評價工具發表以來,陸續有國內學者對其進行解析[7],并采用 SYRCLE 工具對動物實驗的方法學質量進行了探討[6],但其僅局限在特定領域,且缺乏與國外同類研究的橫向對比。因此,本研究首次基于 SYRCLE 動物實驗偏倚風險評價工具對國內外動物實驗研究的方法學質量進行全面評價和對比分析。
本研究結果顯示:超過 90% 的研究被引頻次≤5 次,有 52.53% 的研究被引頻次為 0 次。而中文研究被引頻次為 0 的研究遠高于英文研究,提示國內已發表動物實驗研究的質量和影響力均較低,這與雙梅等[6]的研究結論一致。此外,我們對納入研究的偏倚風險評價結果亦有相同提示。
SYRCLE 工具包括選擇性偏倚、實施偏倚、測量偏倚、失訪偏倚、報告偏倚和其他偏倚 6 類偏倚類型,是迄今全球唯一一個適用于動物實驗內在真實性評價的工具[5]。選擇性偏倚是指相互比較的組間基本特征的系統差異[8],在動物實驗中主要通過隨機、分配隱藏、調整均衡基線以及疾病建模等多種措施進行控制,其目的是保證動物實驗中不同組間的基線平衡。若未實施,由于動物實驗的樣本量相對臨床試驗要小很多,可導致兩組受試動物在一些重要的影響結局預后的特征方面存在差異,從而影響實驗結果的推斷[1]。本研究顯示:雖然所有納入研究“實驗組和對照組基線特征均衡(亞條目 2)”和“誘導疾病的時間安排(亞條目 4)”的符合率較高,但“不均衡者基線特征調整(亞條目 3)”和“使隨機序列的不可預測性(亞條目 5)”的“低風險”符合率均不足 5%;而“描述具體的隨機方法(亞條目 1)”的符合率亦低于 30%,且國內研究該條目的符合率明顯低于國外研究。這些結果提示今后的動物實驗研究在偏倚風險控制方面,應該更加重視對隨機方法和隱蔽分組的正確實施,當不同組別基線不均衡時,需調整對基線均衡有重要影響的特征。
實施偏倚指除感興趣的干預措施外,組間護理、暴露因素等存在的系統差異[8],由于動物實驗不同于臨床研究,具有一定的差異和特性,如實驗動物的安置方式對結果具有重要影響,在 Hooijmans 等[1, 9-11]的研究中指出:架子頂端的籠子所接受的光照強度是架子底端的 4 倍,而光照強度的輕微改變會對動物生殖和行為產生重要影響和改變等。本研究結果顯示:在涉及“實施偏倚”3 個亞條目的“低風險”符合率方面,國內研究均明顯低于國外研究,這可能與國內科研人員對實施偏倚的重視程度不夠有關。Ma 等[12]的調查研究亦顯示:僅 30.8% 和 41.4% 的國內研究人員認為實施“動物安置隨機化”和“對動物飼養者和研究者實施盲法”是必要的。當然,國外研究在這 3 個亞條目的“低風險”符合率也較低(均低于 30%)。因此,今后的動物實驗研究應該更加重視實施偏倚對實驗結果的重要影響,并有必要根據實驗特點,采取多種途徑如隨機安置籠子或動物、實施盲法等控制可能產生的實施偏倚。
測量偏倚是指測量結局時組間存在的系統差異,其中盲法實施與否是影響測量偏倚大小的重要措施之一[8]。在動物實驗中,雖然沒必要對動物施盲,但由于在干預實施過程中,大部分研究者又同為動物飼養者,因此可能會導致主觀偏倚的產生[1, 13]。此外,由于動物實驗的特性,多數生物存在晝夜節律現象,如類脂(化合)物代謝作用、神經遞質水平、藥代動力學等的影響均會使動物的周期/晝夜節律發生變化[1, 14-16],在對結果進行測量時未采用隨機化方法,僅在某一個時間段對樣本進行測量和評價,則可能產生測量偏倚。本研究結果顯示:納入研究“隨機性結果評價(條目 6)”的“低風險”符合率低于 50%。此外,類似于臨床研究,對主觀指標而言,有必要采取盲法測量以降低測量偏倚[1, 8],但本研究顯示:所有納入研究在涉及盲法測量的兩個亞條目(亞條目 10、11)上的符合率均低于 15%,且國內研究的符合率更低。提示在降低測量偏倚方面,除需重視隨機測量評價結果外,對結局測量人員實施盲法也是非常必要的。
失訪偏倚是因動物死亡或丟失等因素造成的數據缺失,從而對最終結果產生影響。實驗過程中出現失訪屬于正常情況,關鍵在于研究者對失訪的控制措施以及對失訪數據的處理方法[8]。本研究結果顯示:國內外研究涉及失訪偏倚各條目的“低風險”符合率均較低,特別是“報告缺失數據影響結果真實性的原因”(亞條目 13)、“缺失數據在各干預組內相當且各組缺失原因相似”(亞條目 14)、“對缺失數據采用恰當的方法進行估算”(亞條目 15)的“低風險”符合率更是低于 5%。提示今后的研究應更加重視對實驗中失訪數據的處理,并嚴格評價失訪數據對研究結果的影響。另外,在臨床研究中,常使用意向性分析(ITT)方法處理失訪數據[17-19],此方法也同樣適用于動物實驗。
報告偏倚是指報告和未報告結果之間的系統差異,這可能與陽性的實驗結果更容易解釋和發表、或研究者存在可能影響實驗結果的利益沖突等有關[8]。本研究結果顯示:國內研究在“可獲取研究計劃書,所有的主要和次要結局均按計劃書預先說明的方式報告”(亞條目 16)的“低風險”符合率為 0。雖然對于臨床研究而言,目前已要求在招募到首例患者之前必須在 WHO 及其一級注冊平臺注冊,并鼓勵相關期刊發表其計劃書[20-22],但目前在動物實驗領域尚無任何要求。
在其他偏倚方面,中文研究在“與實驗設計相關的偏倚風險”(亞條目 21)和“新的動物加入到實驗組和對照組以彌補從原始種群中退出的樣本”(亞條目 22)的質量方面也需進一步提高。
本研究的局限性:① 研究樣本僅來自于 CSCD 和 Web of Science 數據庫,其結果有可能無法代表所有動物實驗的方法學質量;② 雖然本研究納入 2014 年之后發表研究,但部分研究可能是在 2013 年或之前實施完成,故未必符合 SYRCLE 動物實驗偏倚風險評價工具的標準。
綜上所述,國內外動物實驗研究在方法學質量方面均存在一定問題,國內研究在實施偏倚、測量偏倚、失訪偏倚等方面的問題尤為突出,其“低風險”符合率遠低于國外研究。建議采取針對性措施推廣與普及 SYRCLE 動物實驗偏倚風險評價工具,以有效指導動物實驗的開展,提高動物實驗的設計和實施質量。
動物實驗是臨床前研究的重要組成部分,作為連接基礎研究和臨床研究的橋梁,其質量影響著眾多領域課題研究的成果和水平的高低[1-3],而這些都有賴于動物實驗的科學設計和規范實施。國際實驗動物中心(the national center for the replacement, refinement and reduction of animals in research,3Rs)的研究顯示:由 3Rs 資助的許多動物實驗在方法學設計方面存在諸多問題,高達 87% 和 86% 的實驗未實施隨機分配和盲法;而在實施了隨機化原則的動物實驗中,僅 9% 的研究闡述了具體的隨機化方法,最終導致其成果轉化和利用率低下[4]。因此,為提高動物實驗的方法學質量及促進研究過程的全透明化,荷蘭 SYRCLE 中心的 Hooijmans 等[1]多名學者于 2014 年起草和制定了 SYRCLE 動物實驗偏倚風險評價工具,以提高動物實驗設計和實施的質量[5]。國內雖有學者探討了中國動物實驗的方法學質量[6],但其僅局限在卒中/中風領域,代表性較差,而且缺乏與國外同類研究的橫向對比。
因此,本研究全面收集國內外已發表的動物實驗,采用 SYRCLE 動物實驗偏倚風險評價工具全面評價其方法學質量,并將國內、外同類研究進行比較分析,探討其在方法設計等重點環節的差異及其可能的原因,為今后國內動物實驗設計和實施提供參考依據,以期提升我國動物實驗研究的方法學質量。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
所有涉及治療干預措施的動物實驗,不限制動物種屬和干預手段。
1.1.2 排除標準
① 重復發表的研究;② 非醫學類動物實驗;③ 基于動物組織、器官或細胞等的體外實驗;④ 同時涉及動物和人體的實驗。
1.2 文獻檢索策略
本文擬評價高影響力期刊收錄的動物實驗,因此,我們選擇檢索的數據庫為中國科學引文數據庫(CSCD)和 Web of science 數據庫。搜集所有涉及治療干預措施的動物實驗,以 SYRCLE 動物實驗偏倚風險評價工具發表時間為起始點,檢索時限為 2014 年至 2016 年 8 月。中文檢索詞包括:動物實驗、體內、鼠、兔、狗、豬、羊、牛、蟾蜍、蛙、猩猩、猴;英文檢索詞包括:murinae、guinea pigs、swine、rabbits、dogs、haplorhini、ranidae、bufonidae、sheep、goats、animal experimentation。以 CSCD 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 4 名研究者嚴格按照納入與排除標準,獨立篩選文獻、提取資料,并兩兩交叉核對,如遇分歧則由第三方(馬彬)協助解決。資料提取的內容主要包括:① 納入研究的基本特征:發表作者數量、作者單位、時間、雜志、動物種類、樣本量、干預措施等;② 偏倚風險評價的關鍵要素。
1.4 納入研究的偏倚風險評價
采用 SYRCLE 動物實驗偏倚風險評價工具[1]評價納入研究的偏倚風險,該評價工具包括 10 個條目(22 個亞條目)。本研究主要通過計算 22 個亞條目“低風險”符合率進行評價。對 4 名研究者(趙璐璐、謝曄、李彥佑、朱敏)進行培訓,使其全面掌握 SYRCLE 動物實驗偏倚風險評價工具的內涵和應用等。然后隨機抽取 10% 的樣本進行預實驗,并計算 Kappa 值,確保 4 名研究者的偏倚風險評價結果具有一致性。
1.5 統計分析
采用 Excel 2011 軟件進行統計分析,計數資料采用例數和百分比(%),計量資料采用中位數和四分位數間距進行統計描述,組間比較采用卡方檢驗,檢驗水準 α=0.05。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 15 539 篇,經逐層篩選后,最終納入 1 999 個動物實驗。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CSCD(
2.2 納入研究的基本情況比較結果
納入的 1 999 個研究中,1 050 個(52.53%)被引頻次為0。其中,中文被引頻次為0的研究占比(948/1 497,63.33%)遠高于英文研究(102/502,20.32%),差異有統計學意義(P<0.001)。納入研究樣本量的中位數和四分位間距為 40(22,78)只。在實驗動物的選擇上,前三位分別為:鼠(91.20%)、兔子(5.75%)和豬(1.60%),在鼠類的選擇方面,中英文研究的差異有統計學意義(P=0.001)。在干預措施的分類上,前三位的分別是藥物干預(77.64%)、手術干預(9.15%)和行為-飲食干預(5.80%);在行為-飲食干預(P=0.005)和針灸(P=0.003)方面,中英文研究差異有統計學意義(表 1)。

2.3 納入研究的偏倚風險評價結果
偏倚風險評價結果顯示:總體而言,納入研究在 SYRCLE 動物實驗偏倚風險評價工具包含的 22 個亞條目中,超過一半的亞條目(59.09%)的“低風險”符合率低于 30%,其中 84.62% 的亞條目符合率低于 10%,見表 2。對涉及選擇性偏倚的 5 個亞條目(亞條目 1~5)而言,亞條目 3 和亞條目 5 的“低風險”符合率均低于 5%(2.20% 和 1.05%)。中、英文研究在亞條目 1 和亞條目 2 方面,差異均有統計學意義(P=0.004,P=0.003)。對涉及實施偏倚的 3 個亞條目(亞條目 6~8)而言,“低風險”符合率均低于 10%。中、英文研究在亞條目 7 和亞條目 8 方面,差異均有統計學意義(P 均<0.001)。對涉及測量偏倚的 3 個亞條目(亞條目 9~11)而言,“低風險”符合率均低于 50%,其中亞條目 10 和亞條目 11 均低于 15%。中、英文研究在亞條目 10(P=0.010)和亞條目 11(P<0.001)方面,差異均有統計學意義。對涉及失訪偏倚的 4 個亞條目(亞條目 12~15)而言,亞條目 13、14 和亞條目 15 的“低風險”符合率均低于 5%(3.00%、2.15% 和 0.55%)。中、英文研究在亞條目 12 和亞條目 13 方面,差異均有統計學意義(P 均<0.001)。對涉及報告偏倚的 2 個亞條目(亞條目 16~17)而言,亞條目 16 的“低風險”符合率僅為 0.20%。中、英文研究在亞條目 16 方面,差異有統計學意義(P=0.004)。對涉及其他偏倚的 5 個亞條目(亞條目 18~22)而言,亞條目 22 的“低風險”符合率僅為 3.70%。中、英文研究在亞條目 21 和亞條目 22 方面,差異均有統計學意義(P 均<0.001)。

3 討論
自 2014 年 SYRCLE 動物實驗偏倚風險評價工具發表以來,陸續有國內學者對其進行解析[7],并采用 SYRCLE 工具對動物實驗的方法學質量進行了探討[6],但其僅局限在特定領域,且缺乏與國外同類研究的橫向對比。因此,本研究首次基于 SYRCLE 動物實驗偏倚風險評價工具對國內外動物實驗研究的方法學質量進行全面評價和對比分析。
本研究結果顯示:超過 90% 的研究被引頻次≤5 次,有 52.53% 的研究被引頻次為 0 次。而中文研究被引頻次為 0 的研究遠高于英文研究,提示國內已發表動物實驗研究的質量和影響力均較低,這與雙梅等[6]的研究結論一致。此外,我們對納入研究的偏倚風險評價結果亦有相同提示。
SYRCLE 工具包括選擇性偏倚、實施偏倚、測量偏倚、失訪偏倚、報告偏倚和其他偏倚 6 類偏倚類型,是迄今全球唯一一個適用于動物實驗內在真實性評價的工具[5]。選擇性偏倚是指相互比較的組間基本特征的系統差異[8],在動物實驗中主要通過隨機、分配隱藏、調整均衡基線以及疾病建模等多種措施進行控制,其目的是保證動物實驗中不同組間的基線平衡。若未實施,由于動物實驗的樣本量相對臨床試驗要小很多,可導致兩組受試動物在一些重要的影響結局預后的特征方面存在差異,從而影響實驗結果的推斷[1]。本研究顯示:雖然所有納入研究“實驗組和對照組基線特征均衡(亞條目 2)”和“誘導疾病的時間安排(亞條目 4)”的符合率較高,但“不均衡者基線特征調整(亞條目 3)”和“使隨機序列的不可預測性(亞條目 5)”的“低風險”符合率均不足 5%;而“描述具體的隨機方法(亞條目 1)”的符合率亦低于 30%,且國內研究該條目的符合率明顯低于國外研究。這些結果提示今后的動物實驗研究在偏倚風險控制方面,應該更加重視對隨機方法和隱蔽分組的正確實施,當不同組別基線不均衡時,需調整對基線均衡有重要影響的特征。
實施偏倚指除感興趣的干預措施外,組間護理、暴露因素等存在的系統差異[8],由于動物實驗不同于臨床研究,具有一定的差異和特性,如實驗動物的安置方式對結果具有重要影響,在 Hooijmans 等[1, 9-11]的研究中指出:架子頂端的籠子所接受的光照強度是架子底端的 4 倍,而光照強度的輕微改變會對動物生殖和行為產生重要影響和改變等。本研究結果顯示:在涉及“實施偏倚”3 個亞條目的“低風險”符合率方面,國內研究均明顯低于國外研究,這可能與國內科研人員對實施偏倚的重視程度不夠有關。Ma 等[12]的調查研究亦顯示:僅 30.8% 和 41.4% 的國內研究人員認為實施“動物安置隨機化”和“對動物飼養者和研究者實施盲法”是必要的。當然,國外研究在這 3 個亞條目的“低風險”符合率也較低(均低于 30%)。因此,今后的動物實驗研究應該更加重視實施偏倚對實驗結果的重要影響,并有必要根據實驗特點,采取多種途徑如隨機安置籠子或動物、實施盲法等控制可能產生的實施偏倚。
測量偏倚是指測量結局時組間存在的系統差異,其中盲法實施與否是影響測量偏倚大小的重要措施之一[8]。在動物實驗中,雖然沒必要對動物施盲,但由于在干預實施過程中,大部分研究者又同為動物飼養者,因此可能會導致主觀偏倚的產生[1, 13]。此外,由于動物實驗的特性,多數生物存在晝夜節律現象,如類脂(化合)物代謝作用、神經遞質水平、藥代動力學等的影響均會使動物的周期/晝夜節律發生變化[1, 14-16],在對結果進行測量時未采用隨機化方法,僅在某一個時間段對樣本進行測量和評價,則可能產生測量偏倚。本研究結果顯示:納入研究“隨機性結果評價(條目 6)”的“低風險”符合率低于 50%。此外,類似于臨床研究,對主觀指標而言,有必要采取盲法測量以降低測量偏倚[1, 8],但本研究顯示:所有納入研究在涉及盲法測量的兩個亞條目(亞條目 10、11)上的符合率均低于 15%,且國內研究的符合率更低。提示在降低測量偏倚方面,除需重視隨機測量評價結果外,對結局測量人員實施盲法也是非常必要的。
失訪偏倚是因動物死亡或丟失等因素造成的數據缺失,從而對最終結果產生影響。實驗過程中出現失訪屬于正常情況,關鍵在于研究者對失訪的控制措施以及對失訪數據的處理方法[8]。本研究結果顯示:國內外研究涉及失訪偏倚各條目的“低風險”符合率均較低,特別是“報告缺失數據影響結果真實性的原因”(亞條目 13)、“缺失數據在各干預組內相當且各組缺失原因相似”(亞條目 14)、“對缺失數據采用恰當的方法進行估算”(亞條目 15)的“低風險”符合率更是低于 5%。提示今后的研究應更加重視對實驗中失訪數據的處理,并嚴格評價失訪數據對研究結果的影響。另外,在臨床研究中,常使用意向性分析(ITT)方法處理失訪數據[17-19],此方法也同樣適用于動物實驗。
報告偏倚是指報告和未報告結果之間的系統差異,這可能與陽性的實驗結果更容易解釋和發表、或研究者存在可能影響實驗結果的利益沖突等有關[8]。本研究結果顯示:國內研究在“可獲取研究計劃書,所有的主要和次要結局均按計劃書預先說明的方式報告”(亞條目 16)的“低風險”符合率為 0。雖然對于臨床研究而言,目前已要求在招募到首例患者之前必須在 WHO 及其一級注冊平臺注冊,并鼓勵相關期刊發表其計劃書[20-22],但目前在動物實驗領域尚無任何要求。
在其他偏倚方面,中文研究在“與實驗設計相關的偏倚風險”(亞條目 21)和“新的動物加入到實驗組和對照組以彌補從原始種群中退出的樣本”(亞條目 22)的質量方面也需進一步提高。
本研究的局限性:① 研究樣本僅來自于 CSCD 和 Web of Science 數據庫,其結果有可能無法代表所有動物實驗的方法學質量;② 雖然本研究納入 2014 年之后發表研究,但部分研究可能是在 2013 年或之前實施完成,故未必符合 SYRCLE 動物實驗偏倚風險評價工具的標準。
綜上所述,國內外動物實驗研究在方法學質量方面均存在一定問題,國內研究在實施偏倚、測量偏倚、失訪偏倚等方面的問題尤為突出,其“低風險”符合率遠低于國外研究。建議采取針對性措施推廣與普及 SYRCLE 動物實驗偏倚風險評價工具,以有效指導動物實驗的開展,提高動物實驗的設計和實施質量。