引用本文: 高洪陽, 趙陽, 高蕊, 李博. Cochrane Overview的研究現狀及制作方法調查. 中國循證醫學雜志, 2014, 14(12): 1514-1519. doi: 10.7507/1672-2531.20140242 復制
Cochrane Overview(以下簡稱為Overview)是指全面收集同一健康問題治療、病因、診斷等方面的相關系統評價,并進行匯總的一種研究方法[1]。Overview產生主要是因為多數系統評價專注于一種干預措施,系統評價用戶往往需要尋找多篇系統評價來獲取他們所需的多個相關證據,因此Overview最初的目的是為其研究者快速提供數據庫中相關的系統評價且能較全面地掌握各文獻的概要。自2009年第一篇Cochrane Overview [2]發表以來,Overview吸引了越來越多研究者的關注,最新5.1.0版本的Cochrane系統評價員手冊對Overview的制作方法提供了基本介紹并給出了報告規范[3],但對具體的研究質量評估、數據合并方法、結果呈現方式并未進行詳細闡述。2010年,有研究者搜集相關資料對Overview的制作方法進行了分析研究[4],但該研究僅納入了截至2009年底各數據庫收錄的Overview。自2010年起,發表于The Cochrane Library的Overview呈逐年增多的趨勢,其相關研究目的不再是單純匯總整理相關系統評價,有研究采用了更復雜的統計分析方法,如網狀Meta分析,且制作方法也呈現多樣化。為給科學制作高質量Overview提供依據,本研究對已發表于The Cochrane Library和PubMed的Overview的現狀及其制作方法進行了調查。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
①發表于The Cochrane Library的Overview;②以The Cochrane Library的系統評價/Meta分析為研究對象但發表于其他雜志的Overview;③研究有完整的方法學,所報告的研究方法包括納入排除標準、文獻檢索、文獻篩選、資料提取、質量評價、資料分析的全部或主要步驟;④同一Overview僅納入更新后的版本。
1.1.2 排除標準
①尚處于“protocol”及“title”階段的Cochrane Overview;②以Overview為研究對象的傳統綜述類文獻;③以Overview為研究對象的質量評價研究;④被The Cochrane Library標記為“withdrawn”。
1.2 文獻檢索
計算機檢索The Cochrane Library和PubMed數據庫,納入Cochrane Overview,檢索時限均截至2014年3月。檢索詞包括overview、overview of reviews、overview of Cochrane reviews、synthesis of reviews、umbrella reviews、summary of systematic reviews,檢索范圍為標題、摘要、關鍵詞。納入研究的文種無限制。以PubMed為例,其具體檢索策略見框1。
框1 PubMed檢索策略
#1 overview[Title/Abstract] #2 overview of reviews[Title/Abstract] #3 overview of Cochrane reviews[Title/Abstract] #4 synthesis of reviews[Title/Abstract] #5 umbrella reviews[Title/Abstract] #6 summary of systematic reviews[Title/Abstract] #7 #1 OR #2 OR #3 OR #4 OR #5 OR #6 #8 cochrane[Title/Abstract] #9 #7 AND #8
1.3 文獻篩選與資料提取
由兩位研究者按納入與排除標準獨立篩選文獻、提取資料并交叉核對,如遇分歧,咨詢第三位研究者解決。參考PRISMA [5]和AMSTAR [6]制定資料提取表,資料提取內容主要包括:①基本信息,包括研究題目、第一作者、發表國家;②文獻檢索策略;③質量評價方法;④數據統計方法;⑤研究結果。
1.4 分析方法
對納入Cochrane Overview的檢索策略、質量評價、統計方法、研究結果等進行歸納和分析。
2 結果
2.1 文獻檢索結果
初檢出Overview 314篇,最終納入18個Cochrane Overview [2, 7-23]。文獻篩選流程及結果見圖 1,納入文獻的基本特征見表 1。


2.2 Overview的概況
納入18個Overview的發表時間為2009~2014年,其中17個(94.4%)[2, 7-18, 20-23]來自The Cochrane Library,1個(5.6%)[19]來自PubMed。按是否存在間接比較將Overview分為三類:第一類是進行了正式的間接比較,共4個[2, 7-9];第二類是僅納入了直接比較,共8個[10-17];第三類是未進行任何數據合并僅對現有文獻進行匯總,共6個[18-23]。
2.3 Overview的檢索策略
如表 2所見,上述三類Overview中只檢索The Cochrane Library的分別有3個(75%)[2, 7, 9]、6個(75%)[11-14, 16, 17]及4個(66.7%)[19, 21-23];對MEDLINE、EMbase等非Cochrane數據庫進行檢索以完善納入研究的Overview分別有1個(25%)[8]、2個(25%)[10, 15]及2個(33.3%)[18, 20]。

在所有僅檢索The Cochrane Library的13個Overview中,4個(30.8%)[7, 11-13]采用了具有邏輯語言的檢索式檢索;7個(53.8%)[2, 9, 16, 17, 21-23]采用簡單檢索,即以干預措施或疾病名稱為關鍵詞在題目、摘要、關鍵詞中進行檢索;2個(15.4%)[14, 19]未詳述其檢索方式。在同時檢索The Cochrane Library及其他數據庫的5個Overview [8, 10, 15, 18, 20]中,均采用了具有邏輯語言的檢索式檢索。
2.4 Overview的方法學和證據質量評價情況
結果見表 3。對于納入系統評價的方法學質量,14個(77.8%)Overview采用了AMSTAR量表進行評價,1個[12]采用了QQAQ量表進行評價,3個[8, 16, 19]未進行評價。對于證據質量的評價,除1個Overview [19]未描述具體方法外,其余采用了GRADE工具和自擬標準進行評價。而對于系統評價納入的原始研究的方法學質量,二、三類Overview中,多數未予評價。

2.5 Overview采用的統計分析方法
如表 4所示,第一類Overview中,3個(75%)[2, 8, 9]應用了網狀Meta分析,1個(25%)[7]應用了經簡單修正的間接比較手段,其中1個(25%)個[8]同時采用了貝葉斯混合治療模型與廣義線性模型進行統計分析;第二類Overview僅對直接比較結果進行了合并分析,大多未描述使用的軟件,1個(12.5%)[12]描述了所用軟件及其版本號;第三類Overview未描述采用的軟件。

2.6 Overview的結論
如表 5所示,三類Overview分別有4個(100%)[2, 7-9]、4個(50%)[10, 12, 14, 16]和1個(16.7%)個[21]所得結論改變了原系統評價的結論。

3 討論
3.1 Overview的檢索策略
分析三類Overview采用的檢索策略,進行了正式間接比較的第一類Overview擴大檢索范圍值得提倡,因為其將不同系統評價納入研究采用網狀Meta分析等方法重新進行了分析,擴大檢索范圍可以納入更多研究,其結論將更可靠[24, 25]。第二類Overview只是對Cochrane系統評價進行匯總和一定程度的數據合并,并未引入間接比較,其目的決定了其只需檢索The Cochrane Library。而第三類Overview沒有進行數據合并,其目的是為使用者提供一張現有研究的“地圖”,因此需要擴大檢索范圍,以提供更全面的信息。因此,Overview采用何種檢索策略需根據其目的來制定。
3.2 Overview的質量評價
Overview的質量評價包括方法學質量評價與證據質量評價,二者在Overview制作中不可或缺[1]。多數研究采用AMSTAR量表來評價系統評價的方法學質量,反映了該量表具有相當的信度、結構效度和實用性[26]。半數以上Overview采用了GRADE工具來評價結局指標的證據質量,但部分Overview采用了自擬的證據質量評價標準,甚至未進行證據質量評價。GRADE系統是當前最完善的證據質量評價體系,被Cochrane協作網推薦用于系統評價的證據質量評價,也被世界衛生組織和諸多指南制定組織推薦為指南證據質量評價和推薦意見形成工具。相比于其他評定工具,其更具優勢,在制作Overview時,推薦使用GRADE工具。
納入的部分Overview還對系統評價納入的原始研究重新進行了偏倚風險評價,其主要集中在第一類Overview,第二、三類Overview相對較少。第一類Overview之所以要重新評價原始研究的偏倚風險,是因為其進行了間接比較。要通過Overview得到更加可靠的結果,需要考慮兩個層面偏倚風險因素的影響,一是系統評價層面,二是原始研究層面。因部分系統評價對原始研究偏倚風險的評價不全面,或存在錯誤評價,因此為獲得更高質量的間接比較證據,重新評價原始研究的偏倚風險很有必要。第三類Overview因只是對相關系統評價的匯總,系統評價本身的偏倚風險更加重要,因此無需重新評價原始研究的偏倚風險。而第二類Overview是否需要對原始研究的偏倚風險重新進行評價,則應視情況而定。
3.3 Overview的數據分析
網狀Meta分析和間接比較是Overview采用較多的數據分析方法。Overview往往涉及一類干預,需要通過網狀Meta分析和間接比較來對多個干預對不同結局指標的效應大小進行排序。但間接比較方法本身存在一定程度的風險,要得到有意義的結果,至少需要滿足三個層面的假設[27, 28]。我們納入的4個采用了間接比較的Overview,采用了不同的方法,在不同程度上對各個假設提前進行了驗證,因此其結果的可靠性較好。部分Overview將不同系統評價對同一結局指標的評價結果列于一張表格內,雖然便于比較,但易誤導讀者進行錯誤的“間接比較”,而得出錯誤的結論[29]。
3.4 Overview的臨床價值
第一類Overview采用網狀Meta分析和間接比較方法,在缺少頭對頭直接比較研究的情況下,間接獲得了各干預措施的效應比較大小。雖然通過間接比較獲得的證據強度較差,但從現實情況考慮,要獲得所有干預的兩兩直接比較研究,在人、財、物上都難以實現;在缺乏直接比較證據的情況下,間接比較證據也不失為一種選擇[30]。
第二類Overview中,3個將其研究結論與臨床指南進行了對比[10, 14, 17],其中2個[10, 14]與指南結論存在不一致;2個[12, 16]將其結論與其他系統評價結論進行比較,其結果也不相同。與指南證據不一致,分析其原因可能與指南制定當時的證據情況、指南的制作水平、是否結合專家意見、患者意愿等多種因素相關[31]。而與其他的系統評價結論不同,可能與Overview在進行證據匯總時納入了更多研究有關。
第三類Overview從與納入系統評價不同的角度進行重新分類分析,也具有重要價值。
總之,Overview作為一種新的研究手段,其制作的過程是將證據進一步匯總、檢驗、探索與發現的過程,具有極大的發展潛力[32],應給予其更多關注和重視,以促進其發展和完善。Overview的制作與報告目前尚無公認的統一要求,筆者建議在制作Overview時:①靈活選擇檢索策略,根據不同研究目的可擴大檢索范圍,不應只局限于The Cochrane Library;②使用AMSTAR量表及GRADE工具對納入的系統評價進行方法學質量評價與證據質量評價,必要時對每個臨床試驗進行單獨評價;③如果可能,應使用網狀Meta分析方法和間接比較來獲得多個干預之間的效應大小比較結果。
Cochrane Overview(以下簡稱為Overview)是指全面收集同一健康問題治療、病因、診斷等方面的相關系統評價,并進行匯總的一種研究方法[1]。Overview產生主要是因為多數系統評價專注于一種干預措施,系統評價用戶往往需要尋找多篇系統評價來獲取他們所需的多個相關證據,因此Overview最初的目的是為其研究者快速提供數據庫中相關的系統評價且能較全面地掌握各文獻的概要。自2009年第一篇Cochrane Overview [2]發表以來,Overview吸引了越來越多研究者的關注,最新5.1.0版本的Cochrane系統評價員手冊對Overview的制作方法提供了基本介紹并給出了報告規范[3],但對具體的研究質量評估、數據合并方法、結果呈現方式并未進行詳細闡述。2010年,有研究者搜集相關資料對Overview的制作方法進行了分析研究[4],但該研究僅納入了截至2009年底各數據庫收錄的Overview。自2010年起,發表于The Cochrane Library的Overview呈逐年增多的趨勢,其相關研究目的不再是單純匯總整理相關系統評價,有研究采用了更復雜的統計分析方法,如網狀Meta分析,且制作方法也呈現多樣化。為給科學制作高質量Overview提供依據,本研究對已發表于The Cochrane Library和PubMed的Overview的現狀及其制作方法進行了調查。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
①發表于The Cochrane Library的Overview;②以The Cochrane Library的系統評價/Meta分析為研究對象但發表于其他雜志的Overview;③研究有完整的方法學,所報告的研究方法包括納入排除標準、文獻檢索、文獻篩選、資料提取、質量評價、資料分析的全部或主要步驟;④同一Overview僅納入更新后的版本。
1.1.2 排除標準
①尚處于“protocol”及“title”階段的Cochrane Overview;②以Overview為研究對象的傳統綜述類文獻;③以Overview為研究對象的質量評價研究;④被The Cochrane Library標記為“withdrawn”。
1.2 文獻檢索
計算機檢索The Cochrane Library和PubMed數據庫,納入Cochrane Overview,檢索時限均截至2014年3月。檢索詞包括overview、overview of reviews、overview of Cochrane reviews、synthesis of reviews、umbrella reviews、summary of systematic reviews,檢索范圍為標題、摘要、關鍵詞。納入研究的文種無限制。以PubMed為例,其具體檢索策略見框1。
框1 PubMed檢索策略
#1 overview[Title/Abstract] #2 overview of reviews[Title/Abstract] #3 overview of Cochrane reviews[Title/Abstract] #4 synthesis of reviews[Title/Abstract] #5 umbrella reviews[Title/Abstract] #6 summary of systematic reviews[Title/Abstract] #7 #1 OR #2 OR #3 OR #4 OR #5 OR #6 #8 cochrane[Title/Abstract] #9 #7 AND #8
1.3 文獻篩選與資料提取
由兩位研究者按納入與排除標準獨立篩選文獻、提取資料并交叉核對,如遇分歧,咨詢第三位研究者解決。參考PRISMA [5]和AMSTAR [6]制定資料提取表,資料提取內容主要包括:①基本信息,包括研究題目、第一作者、發表國家;②文獻檢索策略;③質量評價方法;④數據統計方法;⑤研究結果。
1.4 分析方法
對納入Cochrane Overview的檢索策略、質量評價、統計方法、研究結果等進行歸納和分析。
2 結果
2.1 文獻檢索結果
初檢出Overview 314篇,最終納入18個Cochrane Overview [2, 7-23]。文獻篩選流程及結果見圖 1,納入文獻的基本特征見表 1。


2.2 Overview的概況
納入18個Overview的發表時間為2009~2014年,其中17個(94.4%)[2, 7-18, 20-23]來自The Cochrane Library,1個(5.6%)[19]來自PubMed。按是否存在間接比較將Overview分為三類:第一類是進行了正式的間接比較,共4個[2, 7-9];第二類是僅納入了直接比較,共8個[10-17];第三類是未進行任何數據合并僅對現有文獻進行匯總,共6個[18-23]。
2.3 Overview的檢索策略
如表 2所見,上述三類Overview中只檢索The Cochrane Library的分別有3個(75%)[2, 7, 9]、6個(75%)[11-14, 16, 17]及4個(66.7%)[19, 21-23];對MEDLINE、EMbase等非Cochrane數據庫進行檢索以完善納入研究的Overview分別有1個(25%)[8]、2個(25%)[10, 15]及2個(33.3%)[18, 20]。

在所有僅檢索The Cochrane Library的13個Overview中,4個(30.8%)[7, 11-13]采用了具有邏輯語言的檢索式檢索;7個(53.8%)[2, 9, 16, 17, 21-23]采用簡單檢索,即以干預措施或疾病名稱為關鍵詞在題目、摘要、關鍵詞中進行檢索;2個(15.4%)[14, 19]未詳述其檢索方式。在同時檢索The Cochrane Library及其他數據庫的5個Overview [8, 10, 15, 18, 20]中,均采用了具有邏輯語言的檢索式檢索。
2.4 Overview的方法學和證據質量評價情況
結果見表 3。對于納入系統評價的方法學質量,14個(77.8%)Overview采用了AMSTAR量表進行評價,1個[12]采用了QQAQ量表進行評價,3個[8, 16, 19]未進行評價。對于證據質量的評價,除1個Overview [19]未描述具體方法外,其余采用了GRADE工具和自擬標準進行評價。而對于系統評價納入的原始研究的方法學質量,二、三類Overview中,多數未予評價。

2.5 Overview采用的統計分析方法
如表 4所示,第一類Overview中,3個(75%)[2, 8, 9]應用了網狀Meta分析,1個(25%)[7]應用了經簡單修正的間接比較手段,其中1個(25%)個[8]同時采用了貝葉斯混合治療模型與廣義線性模型進行統計分析;第二類Overview僅對直接比較結果進行了合并分析,大多未描述使用的軟件,1個(12.5%)[12]描述了所用軟件及其版本號;第三類Overview未描述采用的軟件。

2.6 Overview的結論
如表 5所示,三類Overview分別有4個(100%)[2, 7-9]、4個(50%)[10, 12, 14, 16]和1個(16.7%)個[21]所得結論改變了原系統評價的結論。

3 討論
3.1 Overview的檢索策略
分析三類Overview采用的檢索策略,進行了正式間接比較的第一類Overview擴大檢索范圍值得提倡,因為其將不同系統評價納入研究采用網狀Meta分析等方法重新進行了分析,擴大檢索范圍可以納入更多研究,其結論將更可靠[24, 25]。第二類Overview只是對Cochrane系統評價進行匯總和一定程度的數據合并,并未引入間接比較,其目的決定了其只需檢索The Cochrane Library。而第三類Overview沒有進行數據合并,其目的是為使用者提供一張現有研究的“地圖”,因此需要擴大檢索范圍,以提供更全面的信息。因此,Overview采用何種檢索策略需根據其目的來制定。
3.2 Overview的質量評價
Overview的質量評價包括方法學質量評價與證據質量評價,二者在Overview制作中不可或缺[1]。多數研究采用AMSTAR量表來評價系統評價的方法學質量,反映了該量表具有相當的信度、結構效度和實用性[26]。半數以上Overview采用了GRADE工具來評價結局指標的證據質量,但部分Overview采用了自擬的證據質量評價標準,甚至未進行證據質量評價。GRADE系統是當前最完善的證據質量評價體系,被Cochrane協作網推薦用于系統評價的證據質量評價,也被世界衛生組織和諸多指南制定組織推薦為指南證據質量評價和推薦意見形成工具。相比于其他評定工具,其更具優勢,在制作Overview時,推薦使用GRADE工具。
納入的部分Overview還對系統評價納入的原始研究重新進行了偏倚風險評價,其主要集中在第一類Overview,第二、三類Overview相對較少。第一類Overview之所以要重新評價原始研究的偏倚風險,是因為其進行了間接比較。要通過Overview得到更加可靠的結果,需要考慮兩個層面偏倚風險因素的影響,一是系統評價層面,二是原始研究層面。因部分系統評價對原始研究偏倚風險的評價不全面,或存在錯誤評價,因此為獲得更高質量的間接比較證據,重新評價原始研究的偏倚風險很有必要。第三類Overview因只是對相關系統評價的匯總,系統評價本身的偏倚風險更加重要,因此無需重新評價原始研究的偏倚風險。而第二類Overview是否需要對原始研究的偏倚風險重新進行評價,則應視情況而定。
3.3 Overview的數據分析
網狀Meta分析和間接比較是Overview采用較多的數據分析方法。Overview往往涉及一類干預,需要通過網狀Meta分析和間接比較來對多個干預對不同結局指標的效應大小進行排序。但間接比較方法本身存在一定程度的風險,要得到有意義的結果,至少需要滿足三個層面的假設[27, 28]。我們納入的4個采用了間接比較的Overview,采用了不同的方法,在不同程度上對各個假設提前進行了驗證,因此其結果的可靠性較好。部分Overview將不同系統評價對同一結局指標的評價結果列于一張表格內,雖然便于比較,但易誤導讀者進行錯誤的“間接比較”,而得出錯誤的結論[29]。
3.4 Overview的臨床價值
第一類Overview采用網狀Meta分析和間接比較方法,在缺少頭對頭直接比較研究的情況下,間接獲得了各干預措施的效應比較大小。雖然通過間接比較獲得的證據強度較差,但從現實情況考慮,要獲得所有干預的兩兩直接比較研究,在人、財、物上都難以實現;在缺乏直接比較證據的情況下,間接比較證據也不失為一種選擇[30]。
第二類Overview中,3個將其研究結論與臨床指南進行了對比[10, 14, 17],其中2個[10, 14]與指南結論存在不一致;2個[12, 16]將其結論與其他系統評價結論進行比較,其結果也不相同。與指南證據不一致,分析其原因可能與指南制定當時的證據情況、指南的制作水平、是否結合專家意見、患者意愿等多種因素相關[31]。而與其他的系統評價結論不同,可能與Overview在進行證據匯總時納入了更多研究有關。
第三類Overview從與納入系統評價不同的角度進行重新分類分析,也具有重要價值。
總之,Overview作為一種新的研究手段,其制作的過程是將證據進一步匯總、檢驗、探索與發現的過程,具有極大的發展潛力[32],應給予其更多關注和重視,以促進其發展和完善。Overview的制作與報告目前尚無公認的統一要求,筆者建議在制作Overview時:①靈活選擇檢索策略,根據不同研究目的可擴大檢索范圍,不應只局限于The Cochrane Library;②使用AMSTAR量表及GRADE工具對納入的系統評價進行方法學質量評價與證據質量評價,必要時對每個臨床試驗進行單獨評價;③如果可能,應使用網狀Meta分析方法和間接比較來獲得多個干預之間的效應大小比較結果。