知證決策(informed-evidence decision-making,IEDM)已成為指導政策制定和實踐的主要原則,然而最佳證據是保證 IEDM 成功實施的前提。由于證據類型和綜述問題的種類存在多樣性,因此發展能更為有效且嚴格地進行證據識別與合成的方法勢在必行。當前已有 14 種文獻研究方法可用于證據的識別與合成,概況性評價(scoping review)是其中之一。本文將從發展背景、目的及方法學框架等方面對概況性評價進行介紹,并通過實例來展示該方法的具體應用,以推動該方法在國內的傳播與應用。
引用本文: 卞薇, 陳慧, 宋國敏, 靳英輝, 萬麗君, 譚明瓊, 曾憲濤, 田旭. 概況性評價簡介. 中國循證醫學雜志, 2017, 17(4): 488-493. doi: 10.7507/1672-2531.201608004 復制
隨著循證理念在國內的廣泛傳播與滲透,以最佳證據為基礎實現政策法規制定、教育策略發展及臨床實踐活動開展已變得日益普遍[1]。系統評價/Meta 分析作為高質量證據的主要來源,其數量亦隨著原始研究數量的增加而呈現出快速增長的態勢[2],其制作方法學也得到了顯著的發展[3]。面對證據類型的形式和綜述目的與問題種類的多元化與多樣性,如何更為有效且嚴格地進行證據識別與合成,已成為方法學家及證據用戶(包括政策制定者、行政管理人員及臨床實踐者等)所面臨的亟待解決的問題。Grant 與 Booth 于 2009 年采用系統性文獻研究方法發現,目前在健康與健康信息領域存在 14 種常見的綜述類型[4],其中系統評價/Meta 分析、敘述性綜述(narrative review,NR)和傳統文獻綜述(traditional review,TR)是最常見的證據資源識別與合成方法。
在常見的證據資源識別與合成方法中,系統評價/Meta 分析主要是通過納入經過偏倚風險評估的特定研究設計(以 RCTs 為主),借助一組精確的結局指標來評價某一特定干預的有效性,其處理的問題相對精確[5];而 NR 和 TR 則是通過主觀檢索與目標問題相關的經典和最新文獻,在不對文獻進行分析性再解釋的情況下,形成對目標問題的總體認識,其所得結果受偏倚影響較大[6]。然而,在真實世界中,我們需解決的問題或極具復雜性,或尚未廣泛評價,或具有明顯的變異性,此時若繼續應用上述方法,則是不適宜的選擇[7]。為此,概況性評價(scoping review)作為一種識別和整理研究證據的方法,用以全面了解研究者感興趣的領域現有研究的數量、屬性及特征[10]而得以提出和應用,并日益受到關注和重視[8-10]。本文將從概況性評價名稱與定義、目的與方法學框架等方面對概況性評價進行詳細介紹,并通過實例來展示該方法的具體應用,以促進該方法在國內的傳播與應用。
1 概況性評價的定義
概況性評價是一種相對較新的證據識別與整理方法,目前尚無統一的名稱。文獻中常用的術語包括概況性評價(scoping review)[11]、概況性研究(scoping study)[12]和概況性文獻綜述(scoping literature review)[13]。Levac 等認為隨意使用具有差異的術語將產生混淆,亦不利于研究者清晰闡釋制作概況性評價的原因,因此建議研究者使用概況性評價,以與 Arksey 和 O’Malley 提出的方法學框架保持一致[9]。Pham 等也支持規范和統一的使用術語,但其認為“評價”較“研究”等詞能更為明確的反應研究的設計類型,因此認為概況性評價對該方法的描述優于概況性研究等術語[10]。
概況性評價的定義目前亦缺乏一致性。Arkse 和 O’Malley[9] 將概況性評價定義為“快速明確某一領域的核心概念及現有證據的來源與類型的方法”。Anderson 等[14]將概況性評價定義為“關注用于明確當前理解狀態的情景知識及已知與未知的事情,并將這些結果整合到政策和實踐環境之中的方法”。Grant 等[15]將概況性評價定義為“對研究文獻的潛在數量和范圍進行初步評價的方法”。Davis 等[5]則認為“概況性評價是一種通過整合與分析大范圍的研究與非研究材料,從而為證據的某一特定主題或領域提供更好的概念闡釋的方法”。Daudt 等[16]于 2013 年給出的定義認為“概況性研究是一種明確某一特定主題或研究領域的文獻,從而明確可為實踐、政策制定和開展研究提供指導的關鍵概念、研究缺口、證據來源與類型的方法”。
在上述各種定義中,Arkse 和 O’Malley 的定義明確了概況性評價的對象范疇(某一特定領域)及目的(明確核心概念及現有證據的來源與類型),盡管其作為對概況性評價的首次定義,對促進及規范該領域的發展起到了重要作用,但該定義卻存在諸多不足,如未明確概況性評價的目標指向及研究手段。Anderson 的定義延展了概況性評價的目的,同時界定了其目標指向,但卻忽略了概況性評價的對象范疇、研究手段及作為獨立研究存在形式所需要的基本要素。Grant 的定義言簡意賅地界定了概況性評價的對象范疇及研究目的,并籠統地指出了其所需的研究手段(初步評價),但該定義忽略了概況性評價的目標指向,同時亦未明確研究手段。Davis 的定義亦清晰界定了概況性評價的對象范疇及研究目的,同時還較為具體地指出了概況性評價的研究手段(整合與分析),但其忽略了目標指向,且依然未提及概況性評價作為一種獨立研究的存在形式所需要的基本要素。而 Daudt 的定義既界定了概況性評價的對象范疇,明確了概況性評價的目的及目標指向,同時指明概況性評價本質上是一種文獻研究方法,該定義的缺憾在于采用了概況性研究而非概況性評價,但縱觀已有的關于概況性評價的定義,Daudt 的定義最為全面、系統,且有針對性的闡釋了概況性評價的內涵與外延屬性。
2 概況性評價的目的
概況性評價常被誤解為缺乏嚴謹性的系統評價,然而概況性評價與系統評價實際上是有著不同研究目標和研究目的的兩種不同實體[17]。就概況性評價而言,其目的包括如下四個方面[6,7,10]:① 調查主題領域研究活動的程度、范圍和屬性;② 明確開展完整系統評價的價值、潛在范圍及花費;③ 總結與傳播研究發現;④ 明確現有文獻的研究局限。概括而言,根據概況性評價扮演角色的差異,上述四個目的可按兩種不同的思考類別進行歸類[7]。前兩個目的可歸為第一類,說明概況性評價是開展系統評價的前期步驟,其最終目的是為制作一篇完整的系統評價而服務;后兩個目的可歸為第二類,說明概況性評價可以作為獨立的研究項目,發表和傳播某一特定領域的研究發現。
3 概況性評價的方法學框架
由于缺乏統一規范的制作方法和報告規范,致使概況性評價的報告形式存在極大的變異性,其報告質量亦參差不齊[10]。為給制作概況性評價的研究者提供方法和技術指導,Arksey 和 O’Malley 于 2005 年首次提出了制作概況性評價的方法學框架,該框架由確定研究問題,明確相關研究,研究選擇,資料提取,整理、總結與報告結果及咨詢(可選項)六個步驟構成[7](圖 1)。該框架有助于研究者了解何時、采用何種方法制作概況性評價,其在一段時間內對概況性評價的制作產生了一定的影響。

盡管 Arksey 和 O’Malley 提出的方法學框架對于推動概況性評價起了極為重要的作用,然而其所涵蓋的六個步驟均存在不可忽視的缺陷:① 確定研究問題階段:界定的研究問題寬泛,確定概況性評價目的與階段不相關,概況性評價的四個目的不明確;② 明確相關研究階段:平衡概況性評價的廣泛性及全面性與資源獲取的可行性面臨挑戰;③ 研究選擇階段:方法學框架各階段的線性排列存在誤導性,研究選擇的決策過程不清楚;④ 記錄資料(資料提取)階段:從納入研究中提取的資料的屬性和程度不清晰,用于記錄資料的描述性分析方法的定義不明確;⑤ 整理、總結及報告結果階段:細節描述不充分,將多個步驟總結為方法學框架的一個階段;⑥ 咨詢(可選項)階段:該階段被設定為可選項,缺乏何時、如何、為何要咨詢利益相關者,以及如何將信息與發現進行整合的信息。
由于概況性評價是一種正處于發展和完善階段的方法,如何提高其制作過程的清晰性和嚴謹性,以及所得發現的可靠性是方法學家、證據合成與應用者持續關注的問題。為了提高概況性評價制作過程的清晰性與嚴謹性,Levac 等[5]于 2010 年對 Arksey 和 O’Malley 的方法學框架進行了完善。研究者分析了原有框架所面臨的挑戰,并給出了相應的推薦建議。此外,為進一步促進概況性評價方法學框架的發展與完善,Daudt 與同事在參考 Levac 等給出的推薦意見,并結合自身團隊應用方法學框架制作概況性評價經驗的基礎上,對 Arksey 和 O’Malley 方法學框架存在的挑戰提出了進一步的推薦意見。兩種方法學框架的比較見表 1。

4 概況性評價與系統評價的區別
概況性評價的多個制作步驟與系統評價相同,如兩者均采用嚴格、透明的方法,全面地查找和分析與某一研究問題相關的研究證據[18]。兩種文獻研究方法的主要差別源自于研究目的與目標的不同,兩者的區別主要體現在如下三個方面:① 概況性評價旨在明確主題領域的大量文獻,因此其主要是呈現與寬泛的主題相關的大范圍的、多樣化的文獻概況[7];而系統評價的目的則在于總結針對某一特定問題的最佳證據[19],因此其主要是整理來自于與所關注的研究問題相關的、數量相對較少的研究所提供的證據[20]。② 概況性評價通常納入大量的研究設計和方法學,而處理干預有效性的系統評價通常只關注于設計嚴謹的隨機對照研究(randomized controlled trials,RCTs)[7]。③ 概況性評價旨在提供評價材料的描述性概述,而不評價單個研究的質量,亦不對來自不同研究的證據進行整合[7,17];而系統評價的目的則在于整合來自經過偏倚風險評估的不同研究的證據[20]。
5 實例介紹
以高爾夫運動與身心健康之間的關系[21]為例,介紹概況性評價的應用。
5.1 研究目的
評價高爾夫運動與身心健康之間的關系。
5.2 研究方法
5.2.1 明確研究問題 本研究基于感興趣的人群、概念及背景構建如下涵蓋范圍較為廣泛的研究問題:對高爾夫運動與身心健康間的關系及其對身心健康的作用效果當前已有哪些認識。
5.2.2 獲取相關研究 基于研究小組討論及專家咨詢擬定納入排除標準。
5.2.2.1 納入標準 ① 研究性論文,不限制地域、語種及研究場所;② 不區分研究對象年齡與性別;③ 以普通人群及特定人群(患有特定身心疾病)為研究對象的研究;④ 不區分高爾夫運動的類型;⑤ 不區分身心狀態類別;⑥ 合格文獻種類包括原始研究、傳統綜述、系統綜述、概況性評價、Meta 分析、指南以及未發表和正在進行的研究、年報、學位論文及會議摘要等灰色文獻。
5.2.2.2 排除標準 ① 個人觀點、雜志與新聞簡報、病例報告及無數據的文章;② 與打高爾夫或看高爾夫不相關的健康與安全或職業問題;③ 關注生理機制或高爾夫運動效能的研究。
5.2.2.3 檢索策略與目標數據庫 ① 初始的限制性檢索:于 2015 年 9 月在 SPORTDiscus 及 Goole 檢索綜述類文獻,在 ProQuest 檢索學位論文;② 明確關鍵詞與索引詞:基于初始限制性檢索文獻的分析結果,以“golf”為主要檢索詞,以布爾邏輯運算符為檢索式構建規則,檢索 MEDLINE、PsycINFO、SPORTDiscus、Web of Science 及 Google Scholar,并以同樣的方式檢索灰色文獻;③ 檢核合格文獻的參考文獻列表及引文。
5.2.3 研究選擇 1 名研究者通過閱讀文獻題目與摘要評價其合格性,第 2 名研究者以同樣的方式的評價文獻的合格性,直至對每篇文獻的評價結果達成共識。
5.2.4 資料整理 3 名研究者根據提前設定的資料類別,采用標準化的數據提取表提取所要分析的資料,包括作者信息、研究的出處(開展地點及發表期刊)、目標/目的、研究人群與樣本量、方法學/具體方法、干預及對照類型以及具體詳情、干預持續時間、結局及詳情、與概況性評價問題相關的關鍵發現。
5.2.5 結果的整理、匯總與報告
5.2.5.1 描述性分析、數據匯總、根據發表時間、地點、研究方法及研究主題展示研究的分布情況。
5.2.5.2 主題匯總、描述如何識別與研究問題和目標相關的研究以及主要發現。
5.3 結果與討論
初檢獲得文獻題錄 4 944 條,經過逐層篩選后納入 301 篇合格研究。研究結果表明高爾夫運動可提供中等強度的體力活動,并可改善機體身體健康狀態,包括心血管、呼吸肌代謝獲益,同時可改善集體的整體健康狀態。但是當前有關高爾夫運動與精神健康相關的證據有限。但值得注意的是,高爾夫運動有中等程度的致傷率,尤其是后背受損較為頻發。意外頭部損傷較為罕見,但一旦發生將導致嚴重后果。
6 討論
從海量信息中識別可用于解決所關注的研究問題的證據,是利益相關者(如政府部門、社會團體及個人)必須具備的能力之一。但是,當我們所關注的問題極為復雜或資源極少,或二者兼有時,傳統的文獻綜述、敘述性綜述和系統評價便不再是一種適宜的證據識別與整合方法,而概況性評價則為識別、整理與上述問題相關的證據資源提供了可能[7]。
盡管每年發表的概況性評價數量日益增加(圖 2),作為一種相對較新的文獻研究方法,概況性評價尚無統一的術語稱謂和概念定義[6],這可直接導致研究者在術語使用上的隨意性,從而致使研究問題的確定及檢索策略的制定缺乏清晰性,最終導致資源獲取的局限性。因此,規范概況性評價的術語及定義是研究者們必須重點關注的問題。

高質量研究所得結果對研究和實踐均具有極大的指導性,然而概況性評價并不對納入研究的方法學質量進行評價,因此難以明確研究缺口及得出高質量的發現,直接影響了概況性評價對未來研究和實踐的指導價值。盡管研究者們均承認對納入研究的方法學質量進行評價是很重要的,但是就其在概況性評價中的必要性尚存爭議,例如 Pham 等[10]對發表于 1999 年至 2012 年期間的 344 篇概況性評價進行分析發現,22.38% 的概況性評價并未實施納入文獻的方法學質量評價。因此,深入討論方法學質量對概況性評價的必要性是一個必須重視的問題。
Davis 等[5]認為,最佳的概況性評價應具有嚴格的制作步驟和方法學,以及對這些信息的詳細報告。然而 Pham 等[10]卻發現,盡管在發表于 1999 年至 2012 年期間的 344 篇概況性評價中,51% 參考了已發表的方法學框架,但多數未充分描述其制作過程和使用的具體方法學,而這些信息的缺乏將使區分設計方面的缺陷和報告質量的低下變得困難。這一問題的存在和繼續,歸因于針對概況性評價的報告規范的缺乏[6]。因此,為了改善概況性評價的報告質量,發展特定的報告規范和相應的檢查清單極為重要,但目前研究者可依據系統評價與 Meta 分析優先報告條目(Preferred Reporting Items for Systematic reviews and Meta-Analysis,PRISMA)的推薦來制作和報告概況性評價。當然,由于概況性評價的方法學框架亦處于不斷完善的階段,因此如何促進其方法學的發展亦是研究者應該關注的點。
總之,隨著術語和定義的規范、方法學框架的完善及報告規范和方法學質量評價量表的發布,概況性評價的報告形式和質量將得以改善,所得結果對未來研究和實踐的指導價值亦將提升,其也終將成為識別和整理研究證據的一種重要方法。
隨著循證理念在國內的廣泛傳播與滲透,以最佳證據為基礎實現政策法規制定、教育策略發展及臨床實踐活動開展已變得日益普遍[1]。系統評價/Meta 分析作為高質量證據的主要來源,其數量亦隨著原始研究數量的增加而呈現出快速增長的態勢[2],其制作方法學也得到了顯著的發展[3]。面對證據類型的形式和綜述目的與問題種類的多元化與多樣性,如何更為有效且嚴格地進行證據識別與合成,已成為方法學家及證據用戶(包括政策制定者、行政管理人員及臨床實踐者等)所面臨的亟待解決的問題。Grant 與 Booth 于 2009 年采用系統性文獻研究方法發現,目前在健康與健康信息領域存在 14 種常見的綜述類型[4],其中系統評價/Meta 分析、敘述性綜述(narrative review,NR)和傳統文獻綜述(traditional review,TR)是最常見的證據資源識別與合成方法。
在常見的證據資源識別與合成方法中,系統評價/Meta 分析主要是通過納入經過偏倚風險評估的特定研究設計(以 RCTs 為主),借助一組精確的結局指標來評價某一特定干預的有效性,其處理的問題相對精確[5];而 NR 和 TR 則是通過主觀檢索與目標問題相關的經典和最新文獻,在不對文獻進行分析性再解釋的情況下,形成對目標問題的總體認識,其所得結果受偏倚影響較大[6]。然而,在真實世界中,我們需解決的問題或極具復雜性,或尚未廣泛評價,或具有明顯的變異性,此時若繼續應用上述方法,則是不適宜的選擇[7]。為此,概況性評價(scoping review)作為一種識別和整理研究證據的方法,用以全面了解研究者感興趣的領域現有研究的數量、屬性及特征[10]而得以提出和應用,并日益受到關注和重視[8-10]。本文將從概況性評價名稱與定義、目的與方法學框架等方面對概況性評價進行詳細介紹,并通過實例來展示該方法的具體應用,以促進該方法在國內的傳播與應用。
1 概況性評價的定義
概況性評價是一種相對較新的證據識別與整理方法,目前尚無統一的名稱。文獻中常用的術語包括概況性評價(scoping review)[11]、概況性研究(scoping study)[12]和概況性文獻綜述(scoping literature review)[13]。Levac 等認為隨意使用具有差異的術語將產生混淆,亦不利于研究者清晰闡釋制作概況性評價的原因,因此建議研究者使用概況性評價,以與 Arksey 和 O’Malley 提出的方法學框架保持一致[9]。Pham 等也支持規范和統一的使用術語,但其認為“評價”較“研究”等詞能更為明確的反應研究的設計類型,因此認為概況性評價對該方法的描述優于概況性研究等術語[10]。
概況性評價的定義目前亦缺乏一致性。Arkse 和 O’Malley[9] 將概況性評價定義為“快速明確某一領域的核心概念及現有證據的來源與類型的方法”。Anderson 等[14]將概況性評價定義為“關注用于明確當前理解狀態的情景知識及已知與未知的事情,并將這些結果整合到政策和實踐環境之中的方法”。Grant 等[15]將概況性評價定義為“對研究文獻的潛在數量和范圍進行初步評價的方法”。Davis 等[5]則認為“概況性評價是一種通過整合與分析大范圍的研究與非研究材料,從而為證據的某一特定主題或領域提供更好的概念闡釋的方法”。Daudt 等[16]于 2013 年給出的定義認為“概況性研究是一種明確某一特定主題或研究領域的文獻,從而明確可為實踐、政策制定和開展研究提供指導的關鍵概念、研究缺口、證據來源與類型的方法”。
在上述各種定義中,Arkse 和 O’Malley 的定義明確了概況性評價的對象范疇(某一特定領域)及目的(明確核心概念及現有證據的來源與類型),盡管其作為對概況性評價的首次定義,對促進及規范該領域的發展起到了重要作用,但該定義卻存在諸多不足,如未明確概況性評價的目標指向及研究手段。Anderson 的定義延展了概況性評價的目的,同時界定了其目標指向,但卻忽略了概況性評價的對象范疇、研究手段及作為獨立研究存在形式所需要的基本要素。Grant 的定義言簡意賅地界定了概況性評價的對象范疇及研究目的,并籠統地指出了其所需的研究手段(初步評價),但該定義忽略了概況性評價的目標指向,同時亦未明確研究手段。Davis 的定義亦清晰界定了概況性評價的對象范疇及研究目的,同時還較為具體地指出了概況性評價的研究手段(整合與分析),但其忽略了目標指向,且依然未提及概況性評價作為一種獨立研究的存在形式所需要的基本要素。而 Daudt 的定義既界定了概況性評價的對象范疇,明確了概況性評價的目的及目標指向,同時指明概況性評價本質上是一種文獻研究方法,該定義的缺憾在于采用了概況性研究而非概況性評價,但縱觀已有的關于概況性評價的定義,Daudt 的定義最為全面、系統,且有針對性的闡釋了概況性評價的內涵與外延屬性。
2 概況性評價的目的
概況性評價常被誤解為缺乏嚴謹性的系統評價,然而概況性評價與系統評價實際上是有著不同研究目標和研究目的的兩種不同實體[17]。就概況性評價而言,其目的包括如下四個方面[6,7,10]:① 調查主題領域研究活動的程度、范圍和屬性;② 明確開展完整系統評價的價值、潛在范圍及花費;③ 總結與傳播研究發現;④ 明確現有文獻的研究局限。概括而言,根據概況性評價扮演角色的差異,上述四個目的可按兩種不同的思考類別進行歸類[7]。前兩個目的可歸為第一類,說明概況性評價是開展系統評價的前期步驟,其最終目的是為制作一篇完整的系統評價而服務;后兩個目的可歸為第二類,說明概況性評價可以作為獨立的研究項目,發表和傳播某一特定領域的研究發現。
3 概況性評價的方法學框架
由于缺乏統一規范的制作方法和報告規范,致使概況性評價的報告形式存在極大的變異性,其報告質量亦參差不齊[10]。為給制作概況性評價的研究者提供方法和技術指導,Arksey 和 O’Malley 于 2005 年首次提出了制作概況性評價的方法學框架,該框架由確定研究問題,明確相關研究,研究選擇,資料提取,整理、總結與報告結果及咨詢(可選項)六個步驟構成[7](圖 1)。該框架有助于研究者了解何時、采用何種方法制作概況性評價,其在一段時間內對概況性評價的制作產生了一定的影響。

盡管 Arksey 和 O’Malley 提出的方法學框架對于推動概況性評價起了極為重要的作用,然而其所涵蓋的六個步驟均存在不可忽視的缺陷:① 確定研究問題階段:界定的研究問題寬泛,確定概況性評價目的與階段不相關,概況性評價的四個目的不明確;② 明確相關研究階段:平衡概況性評價的廣泛性及全面性與資源獲取的可行性面臨挑戰;③ 研究選擇階段:方法學框架各階段的線性排列存在誤導性,研究選擇的決策過程不清楚;④ 記錄資料(資料提取)階段:從納入研究中提取的資料的屬性和程度不清晰,用于記錄資料的描述性分析方法的定義不明確;⑤ 整理、總結及報告結果階段:細節描述不充分,將多個步驟總結為方法學框架的一個階段;⑥ 咨詢(可選項)階段:該階段被設定為可選項,缺乏何時、如何、為何要咨詢利益相關者,以及如何將信息與發現進行整合的信息。
由于概況性評價是一種正處于發展和完善階段的方法,如何提高其制作過程的清晰性和嚴謹性,以及所得發現的可靠性是方法學家、證據合成與應用者持續關注的問題。為了提高概況性評價制作過程的清晰性與嚴謹性,Levac 等[5]于 2010 年對 Arksey 和 O’Malley 的方法學框架進行了完善。研究者分析了原有框架所面臨的挑戰,并給出了相應的推薦建議。此外,為進一步促進概況性評價方法學框架的發展與完善,Daudt 與同事在參考 Levac 等給出的推薦意見,并結合自身團隊應用方法學框架制作概況性評價經驗的基礎上,對 Arksey 和 O’Malley 方法學框架存在的挑戰提出了進一步的推薦意見。兩種方法學框架的比較見表 1。

4 概況性評價與系統評價的區別
概況性評價的多個制作步驟與系統評價相同,如兩者均采用嚴格、透明的方法,全面地查找和分析與某一研究問題相關的研究證據[18]。兩種文獻研究方法的主要差別源自于研究目的與目標的不同,兩者的區別主要體現在如下三個方面:① 概況性評價旨在明確主題領域的大量文獻,因此其主要是呈現與寬泛的主題相關的大范圍的、多樣化的文獻概況[7];而系統評價的目的則在于總結針對某一特定問題的最佳證據[19],因此其主要是整理來自于與所關注的研究問題相關的、數量相對較少的研究所提供的證據[20]。② 概況性評價通常納入大量的研究設計和方法學,而處理干預有效性的系統評價通常只關注于設計嚴謹的隨機對照研究(randomized controlled trials,RCTs)[7]。③ 概況性評價旨在提供評價材料的描述性概述,而不評價單個研究的質量,亦不對來自不同研究的證據進行整合[7,17];而系統評價的目的則在于整合來自經過偏倚風險評估的不同研究的證據[20]。
5 實例介紹
以高爾夫運動與身心健康之間的關系[21]為例,介紹概況性評價的應用。
5.1 研究目的
評價高爾夫運動與身心健康之間的關系。
5.2 研究方法
5.2.1 明確研究問題 本研究基于感興趣的人群、概念及背景構建如下涵蓋范圍較為廣泛的研究問題:對高爾夫運動與身心健康間的關系及其對身心健康的作用效果當前已有哪些認識。
5.2.2 獲取相關研究 基于研究小組討論及專家咨詢擬定納入排除標準。
5.2.2.1 納入標準 ① 研究性論文,不限制地域、語種及研究場所;② 不區分研究對象年齡與性別;③ 以普通人群及特定人群(患有特定身心疾病)為研究對象的研究;④ 不區分高爾夫運動的類型;⑤ 不區分身心狀態類別;⑥ 合格文獻種類包括原始研究、傳統綜述、系統綜述、概況性評價、Meta 分析、指南以及未發表和正在進行的研究、年報、學位論文及會議摘要等灰色文獻。
5.2.2.2 排除標準 ① 個人觀點、雜志與新聞簡報、病例報告及無數據的文章;② 與打高爾夫或看高爾夫不相關的健康與安全或職業問題;③ 關注生理機制或高爾夫運動效能的研究。
5.2.2.3 檢索策略與目標數據庫 ① 初始的限制性檢索:于 2015 年 9 月在 SPORTDiscus 及 Goole 檢索綜述類文獻,在 ProQuest 檢索學位論文;② 明確關鍵詞與索引詞:基于初始限制性檢索文獻的分析結果,以“golf”為主要檢索詞,以布爾邏輯運算符為檢索式構建規則,檢索 MEDLINE、PsycINFO、SPORTDiscus、Web of Science 及 Google Scholar,并以同樣的方式檢索灰色文獻;③ 檢核合格文獻的參考文獻列表及引文。
5.2.3 研究選擇 1 名研究者通過閱讀文獻題目與摘要評價其合格性,第 2 名研究者以同樣的方式的評價文獻的合格性,直至對每篇文獻的評價結果達成共識。
5.2.4 資料整理 3 名研究者根據提前設定的資料類別,采用標準化的數據提取表提取所要分析的資料,包括作者信息、研究的出處(開展地點及發表期刊)、目標/目的、研究人群與樣本量、方法學/具體方法、干預及對照類型以及具體詳情、干預持續時間、結局及詳情、與概況性評價問題相關的關鍵發現。
5.2.5 結果的整理、匯總與報告
5.2.5.1 描述性分析、數據匯總、根據發表時間、地點、研究方法及研究主題展示研究的分布情況。
5.2.5.2 主題匯總、描述如何識別與研究問題和目標相關的研究以及主要發現。
5.3 結果與討論
初檢獲得文獻題錄 4 944 條,經過逐層篩選后納入 301 篇合格研究。研究結果表明高爾夫運動可提供中等強度的體力活動,并可改善機體身體健康狀態,包括心血管、呼吸肌代謝獲益,同時可改善集體的整體健康狀態。但是當前有關高爾夫運動與精神健康相關的證據有限。但值得注意的是,高爾夫運動有中等程度的致傷率,尤其是后背受損較為頻發。意外頭部損傷較為罕見,但一旦發生將導致嚴重后果。
6 討論
從海量信息中識別可用于解決所關注的研究問題的證據,是利益相關者(如政府部門、社會團體及個人)必須具備的能力之一。但是,當我們所關注的問題極為復雜或資源極少,或二者兼有時,傳統的文獻綜述、敘述性綜述和系統評價便不再是一種適宜的證據識別與整合方法,而概況性評價則為識別、整理與上述問題相關的證據資源提供了可能[7]。
盡管每年發表的概況性評價數量日益增加(圖 2),作為一種相對較新的文獻研究方法,概況性評價尚無統一的術語稱謂和概念定義[6],這可直接導致研究者在術語使用上的隨意性,從而致使研究問題的確定及檢索策略的制定缺乏清晰性,最終導致資源獲取的局限性。因此,規范概況性評價的術語及定義是研究者們必須重點關注的問題。

高質量研究所得結果對研究和實踐均具有極大的指導性,然而概況性評價并不對納入研究的方法學質量進行評價,因此難以明確研究缺口及得出高質量的發現,直接影響了概況性評價對未來研究和實踐的指導價值。盡管研究者們均承認對納入研究的方法學質量進行評價是很重要的,但是就其在概況性評價中的必要性尚存爭議,例如 Pham 等[10]對發表于 1999 年至 2012 年期間的 344 篇概況性評價進行分析發現,22.38% 的概況性評價并未實施納入文獻的方法學質量評價。因此,深入討論方法學質量對概況性評價的必要性是一個必須重視的問題。
Davis 等[5]認為,最佳的概況性評價應具有嚴格的制作步驟和方法學,以及對這些信息的詳細報告。然而 Pham 等[10]卻發現,盡管在發表于 1999 年至 2012 年期間的 344 篇概況性評價中,51% 參考了已發表的方法學框架,但多數未充分描述其制作過程和使用的具體方法學,而這些信息的缺乏將使區分設計方面的缺陷和報告質量的低下變得困難。這一問題的存在和繼續,歸因于針對概況性評價的報告規范的缺乏[6]。因此,為了改善概況性評價的報告質量,發展特定的報告規范和相應的檢查清單極為重要,但目前研究者可依據系統評價與 Meta 分析優先報告條目(Preferred Reporting Items for Systematic reviews and Meta-Analysis,PRISMA)的推薦來制作和報告概況性評價。當然,由于概況性評價的方法學框架亦處于不斷完善的階段,因此如何促進其方法學的發展亦是研究者應該關注的點。
總之,隨著術語和定義的規范、方法學框架的完善及報告規范和方法學質量評價量表的發布,概況性評價的報告形式和質量將得以改善,所得結果對未來研究和實踐的指導價值亦將提升,其也終將成為識別和整理研究證據的一種重要方法。