目前,動物實驗系統評價已成為整合動物實驗結果、改善動物實驗質量和指導臨床研究的新趨勢和重要手段。但已發表的動物實驗系統評價在設計和實施過程均存在較多問題。因此,急需一個設計科學、實施規范的系統評價標準流程以提高動物實驗系統評價的質量。本文將詳細介紹動物實驗系統評價制作流程,以推動國內高質量動物實驗系統評價的開展。
引用本文: 許家科, 趙璐璐, 廖緒亮, 王歡, 閆瓊, 武凱楠, 謝曄, 趙夢娜, 魏晨如, 侯皓中, 肖政, 趙霏, 陳紅梅, 劉雅莉, 姜彥彪, 馬彬. 循證構建動物實驗系統評價制作流程. 中國循證醫學雜志, 2017, 17(11): 1357-1364. doi: 10.7507/1672-2531.201707133 復制
動物實驗是基礎研究的重要手段之一,是連接基礎研究和臨床試驗的重要橋梁[1],其結果對下一步設計和實施臨床研究具有重要參考價值,但由于部分臨床前動物實驗所獲結論常未經嚴格評估就作為開展臨床研究的證據,導致臨床研究或藥品上市后撤出的代價極大[2, 3]。因此,有必要開展動物實驗系統評價/Meta 分析(SRs/MAs),以降低動物實驗結果對臨床研究的風險[4]。
目前,動物實驗 SRs/MAs 已成為提升動物實驗結果和指導臨床研究的新趨勢和重要手段。但即便如此,與系統評價方法在臨床研究領域的廣泛采納和使用相比,其在基礎研究領域的應用仍然較少。Hoitinga 等[5]研究顯示:在所納入的系統評價中,動物實驗系統評價的比例低于 4%。Luciano 等[6]研究顯示:已發表的動物實驗 SRs/MAs 在文獻檢索、對納入研究偏倚風險評估和對納入研究間異質性分析方面均存在不足。因此,急需一個設計科學、實施規范的系統評價標準以提高動物實驗系統評價的質量。本文將詳細介紹動物實驗系統評價的流程和步驟,為國內學者在開展動物實驗系統評價時提供可操作的規范標準,從而提高國內動物實驗系統評價的質量。
1 資料與方法
1.1 納入與排除標準
納入與動物實驗 SRs/MAs 的制作流程、計劃書撰寫規范、偏倚風險評估工具、檢索策略制定方法和報告規范等相關的中英文文獻。排除重復研究、動物實驗 SRs/MAs 的方法和報告質量的評價、某一具體問題的動物實驗 SRs/MAs 等。
1.2 文獻檢索策略
計算機檢索 PubMed 和 CNKI 數據庫,檢索時間從建庫截至 2017 年 7 月。中文檢索詞包括:動物實驗、系統評價、Meta 分析、方法學;英文檢索詞包括:pre-clinical study、animal experiments、systematic reviews、meta-analyses、methodology、protocol registration、guidance、search guide、reporting guideline 等。
1.3 文獻篩選
由 2 名評價員(許家科、趙璐璐)獨立篩選文獻,如遇分歧,則通過討論解決,必要時由第三名研究人員(馬彬)協助解決。
1.4 研究方法
對納入的研究進行描述性分析。
2 結果
2.1 文獻篩選流程及結果
最終納入 8 個研究[7-14],全部為英文文獻。文獻篩選流程及結果見圖 1。

2.2 動物實驗系統評價和臨床試驗系統評價的區別
臨床試驗系統評價的目的多是評估干預的總效應量和副作用程度,以幫助臨床決策或優化治療方案。而動物實驗系統評價往往更具探索性,其結果常用于啟發研究者建立新假說,同時指導后續臨床試驗的設計[7]。動物實驗系統評價的主要目的是匯總/合并干預的效果,匯總/合并單組研究參數,建立不同變量之間的聯系或評估研究間的異質性。由于動物實驗在評估干預措施的毒性或研究疾病病理和機制方面,比臨床試驗涉及更為廣泛的范圍。因此,動物實驗系統評價在分析異質性來源方面比臨床試驗的系統評價具有更大的潛力[15]。
此外,雖然對動物實驗 Meta 分析與臨床試驗 Meta 分析的大部分步驟是相似的,但在以下方面仍然存在不同[8]:動物實驗中可能同時包括安慰劑組和假干預措施組、動物實驗樣本量通常較少而且異質性較大、納入研究的偏倚風險較高等[16]。
2.3 動物實驗系統評價的制作流程
2.3.1 計劃書的制定、注冊與發布
2.3.1.1 計劃書的制定
Cochrane 協作組要求在開展 Cochrane 系統評價之前,制定一個完善的研究方案/計劃書,促進研究者前瞻性評價該系統評價的研究方法,防止其方法學上的缺陷,有利于證據使用者客觀評估結果,也是提高 Cochrane 系統評價質量的重要措施之一。因此,對動物實驗系統評價研究亦不例外。2015 年,荷蘭 Radboud 大學醫學院 SYRCLE 動物實驗中心研發、制定和發布了動物實驗系統評價研究方案(Systematic Review Protocol for Animal Intervention Studies,SYRCLE)[9],即標準化的動物實驗系統評價計劃書。該研究計劃書適合于動物干預研究,即探究其干預手段有效性和安全性的動物實驗系統評價,由 3 個主題(A. 一般信息;B. 目的;C. 方法),8 個方面的子內容(背景、研究問題、檢索和納入研究的確定、文獻選擇、研究特征信息提取、偏倚風險評估、結果數據收集、數據分析/合成)和 50 個條目組成。詳見表 1。

2.3.1.2 計劃書的注冊與發布
SYRCLE 動物實驗系統評價方案,已經得到該領域兩個最大的網絡/中心的支持,即 CAMARADES 和 SYRCLE。目前,PROSPERO(The International Prospective Register of Systematic Review Protocols for Clinical Studies)的咨詢小組已批準擴展其注冊范圍,納入對臨床前系統評價計劃書的注冊。目前可以通過 CAMARADES 網站(www.dcn.ed.ac.uk/camarades/research.html# protocols)或 SYRCLE 網站(www.radboudumc.nl/ Research/Organisationofresearch/Departments/cdl/SYRCLE/Pages/Protocols.aspx)公開發布/發表動物實驗系統評價計劃書。
2.3.2 動物實驗系統評價實施步驟
動物實驗系統評價的開展和實施共包括 8 個步驟[7],包括:① 提出并明確研究問題;② 納入/排除標準的制定;③ 證據來源與檢索;④ 文獻篩選;⑤ 對納入研究的偏倚評估;⑥ 資料收集和提取;⑦ 分析和比較每項研究的結果,并在可能的情況下進行 Meta 分析;⑧ 呈現數據結果并作出相應的解釋。具體參見圖 2。

2.3.2.1 提出并明確研究問題
類似于臨床試驗系統評價需用 PICO(Participants、Interventions、Comparisons、Outcomes)4 要素來結構化研究問題,一個目的明確的動物實驗系統評價研究問題需包含以下 5 個方面的核心要素:① 感興趣疾病/健康問題(disease of interest/health problem);② 動物/種屬/菌株(population/species/strain);③ 干預措施/暴露因素(intervention/exposure);④ 對照措施(comparisons);⑤ 結局測量指標(outcome measures)。
例如:預探討干細胞對慢性顳葉癲癇的治療效果如何?針對這一臨床問題,按以上原則對研究的問題進行結構化處理:① 感興趣的疾病/健康問題:慢性顳葉癲癇;② 動物及其種屬:不限制動物種屬;③ 干預措施:干細胞治療,不限制其干細胞類型;④ 對照措施:空白對照;⑤ 結局測量指標:主要結局指標如癲癇發作頻率、持續時間和幅度;記憶和學習結果;次要結局指標如細胞遷移、細胞融合和細胞分化等。
2.3.2.2 納入/排除標準的確定
納入標準與排除標準的關系為:用納入標準定義研究的主體,用排除標準定義研究主體中具有影響結果因素的個體。同臨床研究系統評價一樣,動物實驗系統評價的納入/排除標準,也應體現結構化問題中所涉及的核心要素。以 Hb 等[17]的研究(后文中用 HIA 代指該研究)為例,來具體說明如何制定動物實驗系統評價的納入和排除標準。
(1) 動物物種及其種屬(包括感興趣的疾病/健康問題):納入的主體可以是健康動物、患有不同疾病的動物模型等。此外,還需考慮是否限定動物種屬、亞種等,及對實驗動物的質量控制和模型標準化等。例如:在 HIA 研究中,納入了所有急性缺血性腦卒中的動物模型,不限動物物種與種屬。
(2) 干預措施/對照措施:研究主體包括實驗組和對照組的治療方案,也可詳細規定兩組治療方案的各種比較組合。若在采用規定的治療藥物和對照藥物之外,某些個體還采用了其他藥物或治療措施,則研究結果出現混雜因素,故需排除這樣的個體。此外,還需考慮是否限定藥物劑量及給藥方式等。例如:在 HIA 研究中,干預組為低溫干預,對照組為空白對照。此外,還對具體的干預措施,如“低溫”進行了嚴格的定義。
(3) 測量指標:在動物實驗系統評價中,結局指標可來自于活體動物上所測得結果,也可來自于組織/細胞層面的結果。與臨床試驗系統評價相似,最好也可將所有指標按照主要指標、次要指標和重要的毒副作用相關指標進行分類。例如:在 HIA 研究中,結局指標包括大腦梗死面積所占百分比、神經系統評分等,但并未明確指出哪些為主要指標,哪些為次要指標。
2.3.2.3 證據來源與檢索
盡管目前動物實驗系統評價的檢索策略尚未形成共識,但國內外均已有研究顯示已發表的動物實驗 SRs/MAs 研究在其檢索策略的制定方面幾乎均存在一定程度的漏檢、不規則檢索等問題[7, 18]。因此,國外已有不少學者開始關注和探討動物實驗 SRs/MAs 檢索策略的制定。例如荷蘭的 Hooijmans 等[10, 11]陸續在 2010 年和 2011 年發表了針對 PubMed 和 EMbase 數據庫的動物實驗 SRs/MAs 檢索策略,可供今后動物實驗系統評價研究人員參考,并在 2012 年撰寫了動物實驗檢索策略的制定方法[12]。
在確定檢索詞方面至少應包括疾病/健康問題和干預措施 2 個方面的檢索詞,檢索數據庫除 PubMed、EMbase 和 Web of Science 外,還需要檢索研究者所在國家和地區的專業數據庫,如對中國的研究者而言,至少需要加入 CBM、WanFang Data、CNKI 等。另外,根據課題具體要求,可選取相關專業數據庫進行補充檢索。例如,毒理學研究可選擇 TOXNET。會議摘要、灰色文獻、參考文獻目錄檢索都是必要的補充檢索手段。對動物實驗 SRs/MAs 的檢索策略報告應包括檢索來源、檢索時間范圍、語種限制、研究類型限制、檢索詞及完整的檢索策略等信息。
2.3.2.4 文獻篩選
動物實驗系統評價文獻篩選流程及方法與臨床試驗系統評價相同。首先,應該確定其篩選流程,并制定每個階段的排除標準。然后,需要確定篩選的方法、篩選人員的入選標準等,以保證篩選過程的科學性和標準化。具體可參見 Cochrane 手冊的第七章第二節[19]。
2.3.2.5 對納入研究的偏倚風險評估
偏倚是在研究的設計、實施、資料收集及結果分析中所采用的方法不當而造成研究結果系統性偏離真實值的情況[13]。因此,評估每個納入研究的內在偏倚風險是制作系統評價的重要步驟之一。
之前用于評估動物實驗質量的條目/清單較多[20-24],但不同清單和工具針對的研究領域不同,且不同清單和工具關注動物實驗方法學質量的側重點也不一樣,故尚無統一標準。2014 年,基于 Cochrane 隨機對照試驗偏倚風險評估工具,由來自 SYRCLE 中心的 Hooijmans 等[13]多名學者研究、起草和制定的 SYRCLE 動物實驗風險評估工具(SYRCLE’s risk of bias tool for animal studies)發布,該工具也是迄今全球唯一一個專門適用于動物實驗內在真實性評估的工具[21]。因此,我們也推薦研究者使用該評估工具,對納入動物實驗研究的偏倚風險進行全面評價。SYRCLE 動物實驗偏倚風險評估工具共包括 10 個條目和 22 個問題。其中條目 1、3、8、9、10 與 Cochrane 隨機對照試驗偏倚風險評估工具一致;條目 5、7 為在 Cochrane 隨機對照試驗偏倚風險評估工具的基礎上修改的條目;條目 2、4、6 為完全新增條目。偏倚類型共包括選擇性偏倚、實施偏倚、測量偏倚、失訪偏倚、報告偏倚和其他偏倚。工具中 10 個條目的評估結果最終以“是”、“否”和“不確定”表示:“是”代表低風險偏倚,“否”代表高風險偏倚,“不確定”代表不確定風險偏倚。具體評價細則可詳見 Hooijmans 等[13]研究和筆者對其解讀的文章[25]。
2.3.2.6 資料收集和提取
動物實驗系統評價資料的收集和提取與臨床試驗系統評價相似。首先,需要確定收集的內容包括動物實驗的來源、合格性、方法學、研究對象、干預措施、結果數據等方面。然后,需要確定資料收集途徑、方法和合格人員的選擇。其次,當原始文獻中某些相關資料信息不全時(如數據報告不規范、方法細節報告不充分等),所采取的處理方法,例如是否聯系作者獲取信息,或作者聯系不到如何處理等。具體可參考 Cochrane Handbook[19]的第七章第四節。
2.3.2.7 分析和比較每項研究的結果,并在可能的情況下進行 Meta 分析
Meta 分析是對來自兩個或多個獨立研究結果的統計學合并,也是目前常使用的統計學方法之一;其潛在優勢具有深遠影響,包括增加檢驗效能、提高準確性、回答單個研究無法回答的問題和解決相互矛盾的觀點引發的爭論等[19]。該方法在臨床試驗系統評價中的應用過程與動物實驗系統評價中的應用基本相同,并無本質區別。基本實施步驟可包括如圖 1 所示的 9 個步驟。但臨床試驗的對象為人群,其代謝過程和疾病基本過程相近,遺傳背景相近,個體差異可認為較小。但不同種屬的動物之間差異很大,如要將來源于不同種屬動物實驗的結果合并,則面臨很多問題。
納入研究的異質性包括研究內和研究間兩方面,動物實驗的研究間異質性更明顯。如:將不同種屬動物的研究結果合并是否存在生物統計學基礎,不同種屬動物研究結果是否具有可合并性?如何確定動物實驗合并后代表的研究總體,是否產生了更大的不確定性?是否需要限定最低的樣本同質性和代表性?結論賴以存在的基礎數據是否具有代表性和可重復性?雖然采用多個不同種屬的動物模型開展療效研究有助于預測在人體是否會產生相似的干預效果,但系統評價中納入基于不同種屬動物模型的單個研究可能會引入納入研究間異質性。因而,問題的焦點之一是動物模型是否標準化,包括實驗動物的質量控制和模型標準化。故納入各獨立研究時需考察是否采用了公認而穩定的動物模型。
動物實驗系統評價本質是基于 Meta 分析方法整合多個研究結果,以合成證據,用于指導臨床試驗方案的制定或修正動物實驗設計缺陷。理想的情況是:待評估的干預措施進入臨床試驗階段應建立在對所有證據的無偏倚評估后。這種評估應包括效果及相應的觀察時間窗、劑量效應關系、干預時相、動物種屬和模型種類等。故采用定量 Meta 分析實現效應合并指導價值更大。但因消除這種異質性很困難,故 Meta 分析中選擇隨機效應模型合并效應量比較穩妥,但會使效應合并值 95%CI 變寬。合并多個研究的結局變量時,離散型結局變量通常以 OR 表達,若為連續型結局變量,可采用標準化的結局變量或利用研究報告的資料將連續型變量轉化為相對的 OR 值后計算效應值。當定量 Meta 分析不適合時亦可采用其他合成研究的方法,如 Meta 回歸和貝葉斯 Meta 分析,后者可分析異質性來源。
2.3.2.8 呈現數據結果并作出相應的解釋
結果的呈現應包括動物實驗檢索和篩選、納入動物實驗基本特征、納入動物實驗偏倚風險評估結果、證據圖和 Meta 分析結果等多個部分[8]。通過列表來展示每個研究的特點及其偏倚情況,Meta 分析的結果通常可通過森林圖來展示,漏斗圖可展示可能存在的發表偏倚。
2.3.3 動物實驗 SRs/MAs 報告
動物實驗 SRs/MAs 的報告規范僅見 Peter 等[14]標準,該標準主要借鑒 QUOROM 規范[26]和 MOOSE 規范[27],包括 6 大部分共 17 個條目。但該標準并未得到動物實驗 SRs/MAs 最重要的兩個組織 CAMARADES 和 SYRCLE 的引用,而且主要針對動物毒理性研究。除此之外,該標準① 在方法學部分“選擇標準”中,已經涉及了研究設計類型,而在“研究特征”中再次要求描述設計類型,似乎沒有必要;② 在方法學部分已提到對納入研究的偏倚風險評估,但在結果呈現部分卻未作任何要求,似乎不太妥當;③ 該報告標準中未要求作者報告利益沖突說明和基金資助來源,需要加入。因此,今后還需要進一步研發和改進已有報告規范。
3 結論
一個具有科學設計、規范實施步驟的系統評價,在推動動物實驗系統評價應用的同時,也有助于防止其出現方法學上的缺陷,并最小化系統評價研究的偏倚,有利于證據使用者對其結果的客觀評估,更有助于開展高質量的動物實驗系統評價。反過來,高質量的動物實驗系統評價又會促進研究人員對新的動物實驗和/或臨床試驗的設計進行更廣泛的反思,而這將有助于防止實驗室動物的“浪費”和試驗參與者進行不必要的、無效的或信息量較少的研究。當然,動物實驗系統評價報告質量的提高更需要研究者、編輯、審稿人和研究資助者的共同努力[28]。
動物實驗是基礎研究的重要手段之一,是連接基礎研究和臨床試驗的重要橋梁[1],其結果對下一步設計和實施臨床研究具有重要參考價值,但由于部分臨床前動物實驗所獲結論常未經嚴格評估就作為開展臨床研究的證據,導致臨床研究或藥品上市后撤出的代價極大[2, 3]。因此,有必要開展動物實驗系統評價/Meta 分析(SRs/MAs),以降低動物實驗結果對臨床研究的風險[4]。
目前,動物實驗 SRs/MAs 已成為提升動物實驗結果和指導臨床研究的新趨勢和重要手段。但即便如此,與系統評價方法在臨床研究領域的廣泛采納和使用相比,其在基礎研究領域的應用仍然較少。Hoitinga 等[5]研究顯示:在所納入的系統評價中,動物實驗系統評價的比例低于 4%。Luciano 等[6]研究顯示:已發表的動物實驗 SRs/MAs 在文獻檢索、對納入研究偏倚風險評估和對納入研究間異質性分析方面均存在不足。因此,急需一個設計科學、實施規范的系統評價標準以提高動物實驗系統評價的質量。本文將詳細介紹動物實驗系統評價的流程和步驟,為國內學者在開展動物實驗系統評價時提供可操作的規范標準,從而提高國內動物實驗系統評價的質量。
1 資料與方法
1.1 納入與排除標準
納入與動物實驗 SRs/MAs 的制作流程、計劃書撰寫規范、偏倚風險評估工具、檢索策略制定方法和報告規范等相關的中英文文獻。排除重復研究、動物實驗 SRs/MAs 的方法和報告質量的評價、某一具體問題的動物實驗 SRs/MAs 等。
1.2 文獻檢索策略
計算機檢索 PubMed 和 CNKI 數據庫,檢索時間從建庫截至 2017 年 7 月。中文檢索詞包括:動物實驗、系統評價、Meta 分析、方法學;英文檢索詞包括:pre-clinical study、animal experiments、systematic reviews、meta-analyses、methodology、protocol registration、guidance、search guide、reporting guideline 等。
1.3 文獻篩選
由 2 名評價員(許家科、趙璐璐)獨立篩選文獻,如遇分歧,則通過討論解決,必要時由第三名研究人員(馬彬)協助解決。
1.4 研究方法
對納入的研究進行描述性分析。
2 結果
2.1 文獻篩選流程及結果
最終納入 8 個研究[7-14],全部為英文文獻。文獻篩選流程及結果見圖 1。

2.2 動物實驗系統評價和臨床試驗系統評價的區別
臨床試驗系統評價的目的多是評估干預的總效應量和副作用程度,以幫助臨床決策或優化治療方案。而動物實驗系統評價往往更具探索性,其結果常用于啟發研究者建立新假說,同時指導后續臨床試驗的設計[7]。動物實驗系統評價的主要目的是匯總/合并干預的效果,匯總/合并單組研究參數,建立不同變量之間的聯系或評估研究間的異質性。由于動物實驗在評估干預措施的毒性或研究疾病病理和機制方面,比臨床試驗涉及更為廣泛的范圍。因此,動物實驗系統評價在分析異質性來源方面比臨床試驗的系統評價具有更大的潛力[15]。
此外,雖然對動物實驗 Meta 分析與臨床試驗 Meta 分析的大部分步驟是相似的,但在以下方面仍然存在不同[8]:動物實驗中可能同時包括安慰劑組和假干預措施組、動物實驗樣本量通常較少而且異質性較大、納入研究的偏倚風險較高等[16]。
2.3 動物實驗系統評價的制作流程
2.3.1 計劃書的制定、注冊與發布
2.3.1.1 計劃書的制定
Cochrane 協作組要求在開展 Cochrane 系統評價之前,制定一個完善的研究方案/計劃書,促進研究者前瞻性評價該系統評價的研究方法,防止其方法學上的缺陷,有利于證據使用者客觀評估結果,也是提高 Cochrane 系統評價質量的重要措施之一。因此,對動物實驗系統評價研究亦不例外。2015 年,荷蘭 Radboud 大學醫學院 SYRCLE 動物實驗中心研發、制定和發布了動物實驗系統評價研究方案(Systematic Review Protocol for Animal Intervention Studies,SYRCLE)[9],即標準化的動物實驗系統評價計劃書。該研究計劃書適合于動物干預研究,即探究其干預手段有效性和安全性的動物實驗系統評價,由 3 個主題(A. 一般信息;B. 目的;C. 方法),8 個方面的子內容(背景、研究問題、檢索和納入研究的確定、文獻選擇、研究特征信息提取、偏倚風險評估、結果數據收集、數據分析/合成)和 50 個條目組成。詳見表 1。

2.3.1.2 計劃書的注冊與發布
SYRCLE 動物實驗系統評價方案,已經得到該領域兩個最大的網絡/中心的支持,即 CAMARADES 和 SYRCLE。目前,PROSPERO(The International Prospective Register of Systematic Review Protocols for Clinical Studies)的咨詢小組已批準擴展其注冊范圍,納入對臨床前系統評價計劃書的注冊。目前可以通過 CAMARADES 網站(www.dcn.ed.ac.uk/camarades/research.html# protocols)或 SYRCLE 網站(www.radboudumc.nl/ Research/Organisationofresearch/Departments/cdl/SYRCLE/Pages/Protocols.aspx)公開發布/發表動物實驗系統評價計劃書。
2.3.2 動物實驗系統評價實施步驟
動物實驗系統評價的開展和實施共包括 8 個步驟[7],包括:① 提出并明確研究問題;② 納入/排除標準的制定;③ 證據來源與檢索;④ 文獻篩選;⑤ 對納入研究的偏倚評估;⑥ 資料收集和提取;⑦ 分析和比較每項研究的結果,并在可能的情況下進行 Meta 分析;⑧ 呈現數據結果并作出相應的解釋。具體參見圖 2。

2.3.2.1 提出并明確研究問題
類似于臨床試驗系統評價需用 PICO(Participants、Interventions、Comparisons、Outcomes)4 要素來結構化研究問題,一個目的明確的動物實驗系統評價研究問題需包含以下 5 個方面的核心要素:① 感興趣疾病/健康問題(disease of interest/health problem);② 動物/種屬/菌株(population/species/strain);③ 干預措施/暴露因素(intervention/exposure);④ 對照措施(comparisons);⑤ 結局測量指標(outcome measures)。
例如:預探討干細胞對慢性顳葉癲癇的治療效果如何?針對這一臨床問題,按以上原則對研究的問題進行結構化處理:① 感興趣的疾病/健康問題:慢性顳葉癲癇;② 動物及其種屬:不限制動物種屬;③ 干預措施:干細胞治療,不限制其干細胞類型;④ 對照措施:空白對照;⑤ 結局測量指標:主要結局指標如癲癇發作頻率、持續時間和幅度;記憶和學習結果;次要結局指標如細胞遷移、細胞融合和細胞分化等。
2.3.2.2 納入/排除標準的確定
納入標準與排除標準的關系為:用納入標準定義研究的主體,用排除標準定義研究主體中具有影響結果因素的個體。同臨床研究系統評價一樣,動物實驗系統評價的納入/排除標準,也應體現結構化問題中所涉及的核心要素。以 Hb 等[17]的研究(后文中用 HIA 代指該研究)為例,來具體說明如何制定動物實驗系統評價的納入和排除標準。
(1) 動物物種及其種屬(包括感興趣的疾病/健康問題):納入的主體可以是健康動物、患有不同疾病的動物模型等。此外,還需考慮是否限定動物種屬、亞種等,及對實驗動物的質量控制和模型標準化等。例如:在 HIA 研究中,納入了所有急性缺血性腦卒中的動物模型,不限動物物種與種屬。
(2) 干預措施/對照措施:研究主體包括實驗組和對照組的治療方案,也可詳細規定兩組治療方案的各種比較組合。若在采用規定的治療藥物和對照藥物之外,某些個體還采用了其他藥物或治療措施,則研究結果出現混雜因素,故需排除這樣的個體。此外,還需考慮是否限定藥物劑量及給藥方式等。例如:在 HIA 研究中,干預組為低溫干預,對照組為空白對照。此外,還對具體的干預措施,如“低溫”進行了嚴格的定義。
(3) 測量指標:在動物實驗系統評價中,結局指標可來自于活體動物上所測得結果,也可來自于組織/細胞層面的結果。與臨床試驗系統評價相似,最好也可將所有指標按照主要指標、次要指標和重要的毒副作用相關指標進行分類。例如:在 HIA 研究中,結局指標包括大腦梗死面積所占百分比、神經系統評分等,但并未明確指出哪些為主要指標,哪些為次要指標。
2.3.2.3 證據來源與檢索
盡管目前動物實驗系統評價的檢索策略尚未形成共識,但國內外均已有研究顯示已發表的動物實驗 SRs/MAs 研究在其檢索策略的制定方面幾乎均存在一定程度的漏檢、不規則檢索等問題[7, 18]。因此,國外已有不少學者開始關注和探討動物實驗 SRs/MAs 檢索策略的制定。例如荷蘭的 Hooijmans 等[10, 11]陸續在 2010 年和 2011 年發表了針對 PubMed 和 EMbase 數據庫的動物實驗 SRs/MAs 檢索策略,可供今后動物實驗系統評價研究人員參考,并在 2012 年撰寫了動物實驗檢索策略的制定方法[12]。
在確定檢索詞方面至少應包括疾病/健康問題和干預措施 2 個方面的檢索詞,檢索數據庫除 PubMed、EMbase 和 Web of Science 外,還需要檢索研究者所在國家和地區的專業數據庫,如對中國的研究者而言,至少需要加入 CBM、WanFang Data、CNKI 等。另外,根據課題具體要求,可選取相關專業數據庫進行補充檢索。例如,毒理學研究可選擇 TOXNET。會議摘要、灰色文獻、參考文獻目錄檢索都是必要的補充檢索手段。對動物實驗 SRs/MAs 的檢索策略報告應包括檢索來源、檢索時間范圍、語種限制、研究類型限制、檢索詞及完整的檢索策略等信息。
2.3.2.4 文獻篩選
動物實驗系統評價文獻篩選流程及方法與臨床試驗系統評價相同。首先,應該確定其篩選流程,并制定每個階段的排除標準。然后,需要確定篩選的方法、篩選人員的入選標準等,以保證篩選過程的科學性和標準化。具體可參見 Cochrane 手冊的第七章第二節[19]。
2.3.2.5 對納入研究的偏倚風險評估
偏倚是在研究的設計、實施、資料收集及結果分析中所采用的方法不當而造成研究結果系統性偏離真實值的情況[13]。因此,評估每個納入研究的內在偏倚風險是制作系統評價的重要步驟之一。
之前用于評估動物實驗質量的條目/清單較多[20-24],但不同清單和工具針對的研究領域不同,且不同清單和工具關注動物實驗方法學質量的側重點也不一樣,故尚無統一標準。2014 年,基于 Cochrane 隨機對照試驗偏倚風險評估工具,由來自 SYRCLE 中心的 Hooijmans 等[13]多名學者研究、起草和制定的 SYRCLE 動物實驗風險評估工具(SYRCLE’s risk of bias tool for animal studies)發布,該工具也是迄今全球唯一一個專門適用于動物實驗內在真實性評估的工具[21]。因此,我們也推薦研究者使用該評估工具,對納入動物實驗研究的偏倚風險進行全面評價。SYRCLE 動物實驗偏倚風險評估工具共包括 10 個條目和 22 個問題。其中條目 1、3、8、9、10 與 Cochrane 隨機對照試驗偏倚風險評估工具一致;條目 5、7 為在 Cochrane 隨機對照試驗偏倚風險評估工具的基礎上修改的條目;條目 2、4、6 為完全新增條目。偏倚類型共包括選擇性偏倚、實施偏倚、測量偏倚、失訪偏倚、報告偏倚和其他偏倚。工具中 10 個條目的評估結果最終以“是”、“否”和“不確定”表示:“是”代表低風險偏倚,“否”代表高風險偏倚,“不確定”代表不確定風險偏倚。具體評價細則可詳見 Hooijmans 等[13]研究和筆者對其解讀的文章[25]。
2.3.2.6 資料收集和提取
動物實驗系統評價資料的收集和提取與臨床試驗系統評價相似。首先,需要確定收集的內容包括動物實驗的來源、合格性、方法學、研究對象、干預措施、結果數據等方面。然后,需要確定資料收集途徑、方法和合格人員的選擇。其次,當原始文獻中某些相關資料信息不全時(如數據報告不規范、方法細節報告不充分等),所采取的處理方法,例如是否聯系作者獲取信息,或作者聯系不到如何處理等。具體可參考 Cochrane Handbook[19]的第七章第四節。
2.3.2.7 分析和比較每項研究的結果,并在可能的情況下進行 Meta 分析
Meta 分析是對來自兩個或多個獨立研究結果的統計學合并,也是目前常使用的統計學方法之一;其潛在優勢具有深遠影響,包括增加檢驗效能、提高準確性、回答單個研究無法回答的問題和解決相互矛盾的觀點引發的爭論等[19]。該方法在臨床試驗系統評價中的應用過程與動物實驗系統評價中的應用基本相同,并無本質區別。基本實施步驟可包括如圖 1 所示的 9 個步驟。但臨床試驗的對象為人群,其代謝過程和疾病基本過程相近,遺傳背景相近,個體差異可認為較小。但不同種屬的動物之間差異很大,如要將來源于不同種屬動物實驗的結果合并,則面臨很多問題。
納入研究的異質性包括研究內和研究間兩方面,動物實驗的研究間異質性更明顯。如:將不同種屬動物的研究結果合并是否存在生物統計學基礎,不同種屬動物研究結果是否具有可合并性?如何確定動物實驗合并后代表的研究總體,是否產生了更大的不確定性?是否需要限定最低的樣本同質性和代表性?結論賴以存在的基礎數據是否具有代表性和可重復性?雖然采用多個不同種屬的動物模型開展療效研究有助于預測在人體是否會產生相似的干預效果,但系統評價中納入基于不同種屬動物模型的單個研究可能會引入納入研究間異質性。因而,問題的焦點之一是動物模型是否標準化,包括實驗動物的質量控制和模型標準化。故納入各獨立研究時需考察是否采用了公認而穩定的動物模型。
動物實驗系統評價本質是基于 Meta 分析方法整合多個研究結果,以合成證據,用于指導臨床試驗方案的制定或修正動物實驗設計缺陷。理想的情況是:待評估的干預措施進入臨床試驗階段應建立在對所有證據的無偏倚評估后。這種評估應包括效果及相應的觀察時間窗、劑量效應關系、干預時相、動物種屬和模型種類等。故采用定量 Meta 分析實現效應合并指導價值更大。但因消除這種異質性很困難,故 Meta 分析中選擇隨機效應模型合并效應量比較穩妥,但會使效應合并值 95%CI 變寬。合并多個研究的結局變量時,離散型結局變量通常以 OR 表達,若為連續型結局變量,可采用標準化的結局變量或利用研究報告的資料將連續型變量轉化為相對的 OR 值后計算效應值。當定量 Meta 分析不適合時亦可采用其他合成研究的方法,如 Meta 回歸和貝葉斯 Meta 分析,后者可分析異質性來源。
2.3.2.8 呈現數據結果并作出相應的解釋
結果的呈現應包括動物實驗檢索和篩選、納入動物實驗基本特征、納入動物實驗偏倚風險評估結果、證據圖和 Meta 分析結果等多個部分[8]。通過列表來展示每個研究的特點及其偏倚情況,Meta 分析的結果通常可通過森林圖來展示,漏斗圖可展示可能存在的發表偏倚。
2.3.3 動物實驗 SRs/MAs 報告
動物實驗 SRs/MAs 的報告規范僅見 Peter 等[14]標準,該標準主要借鑒 QUOROM 規范[26]和 MOOSE 規范[27],包括 6 大部分共 17 個條目。但該標準并未得到動物實驗 SRs/MAs 最重要的兩個組織 CAMARADES 和 SYRCLE 的引用,而且主要針對動物毒理性研究。除此之外,該標準① 在方法學部分“選擇標準”中,已經涉及了研究設計類型,而在“研究特征”中再次要求描述設計類型,似乎沒有必要;② 在方法學部分已提到對納入研究的偏倚風險評估,但在結果呈現部分卻未作任何要求,似乎不太妥當;③ 該報告標準中未要求作者報告利益沖突說明和基金資助來源,需要加入。因此,今后還需要進一步研發和改進已有報告規范。
3 結論
一個具有科學設計、規范實施步驟的系統評價,在推動動物實驗系統評價應用的同時,也有助于防止其出現方法學上的缺陷,并最小化系統評價研究的偏倚,有利于證據使用者對其結果的客觀評估,更有助于開展高質量的動物實驗系統評價。反過來,高質量的動物實驗系統評價又會促進研究人員對新的動物實驗和/或臨床試驗的設計進行更廣泛的反思,而這將有助于防止實驗室動物的“浪費”和試驗參與者進行不必要的、無效的或信息量較少的研究。當然,動物實驗系統評價報告質量的提高更需要研究者、編輯、審稿人和研究資助者的共同努力[28]。