循證醫學強調將醫師的經驗、最佳的研究證據與患者的價值觀相結合以保證最佳的防治效果。“證據”是循證醫學的核心,定量系統評價能夠綜合高質量的干預性研究,但不能提供患者的需求、觀點與態度等證據綜合結果,定性系統評價則可彌補此類不足。隨著定性研究及其系統評價方法學的發展,定性研究數量逐年增長并為公共衛生、社會工作、管理學、教育學的循證實踐提供證據支持,同時為決策者知證決策提供證據。國際上Cochrane協作網、Campbell協作網和3ie等研究機構已經有成熟的定性系統評價撰寫方法,但國內缺少定性系統評價撰寫方法介紹。本文將簡要介紹定性系統評價的撰寫方法。
引用本文: 黃崇斐, 拜爭剛, 吳淑婷, 蓋瓊艷, 樊景春, 楊克虎, IrisChi. 定性系統評價的撰寫方法介紹. 中國循證醫學雜志, 2015, 15(9): 1106-1111. doi: 10.7507/1672-2531.20150183 復制
系統評價是指針對具體問題,采用科學的、規范的方法全面收集、嚴格篩選、客觀評價和科學分析納入研究,得出綜合可靠結論的研究方法 [1]。隨著循證醫學的不斷發展,大量基于定量研究的系統評價被廣泛用于指導臨床實踐,許多研究者認為系統評價即定量系統評價。實際上,系統評價是一種二次研究方法,其納入的研究為定量研究、定性研究或者定量和定性皆有的研究,納入研究類型取決于研究問題。定性系統評價(定性證據合成)即針對研究問題,進行系統檢索后納入定性研究并對其客觀評價、分析得出結論的研究類型。定性研究指通過觀察法、個人訪談、焦點組討論以及參與性研究等方法,或是分析文字或影音記錄資料等方法獲取資料,目的是從研究對象的角度去了解與解釋如行為、觀點、態度和經驗等現象 [2]。定性系統評價能夠從不同角度觀察、分析問題,例如能夠定性地探究某種干預措施的執行與持久程度的影響因素等問題,為決策者基于實際情況的決策提供可靠依據。同樣,針對某種干預措施,定性系統評價也能夠提供參與者對其接受程度和依從性證據,為定量研究提供前期理論基礎,彌補單純定量研究的不足。定量系統評價與定性系統評價的比較見表 1。本文將從提出問題、檢索證據、評價證據、綜合證據等方面介紹定性系統評價的撰寫方法。

1 提出及構建問題
系統評價由提出問題、確定納入排除標準、檢索證據、評價證據、分析、結論及討論組成。撰寫系統評價前需要有一個明確的研究問題。構建一個具有實際意義的研究問題可以幫助研究者深入認識研究問題,有助于制定科學合理的檢索策略。定量干預性系統評價常用的問題構建模型是被人們所熟知的PICO模型。然而相對于定量研究,定性研究具有樣本量小、注重研究對象的經驗與體會的特點,故而PICO模型不適用于定性系統評價,需要對其進行改良。SPIDER模型是由國內外相關研究者Cooke等基于PICO模型進行改良,適用于定性系統評價的模型 [3, 4],其將人群(Population)修改為研究對象(Sample),干預措施(Intervention)則改為側重于探究個人需求、觀點、態度、經驗的研究內容(Phenomenon of Interest)。具體SPIDER模型參見表 2。

通過對PICO模型的一系列拓展,SPIDER模型能夠更加系統、合理地構建定性系統評價問題。
例如社會工作者希望研究社區內老年抑郁癥患者對藥物治療的依從性影響因素,可使用SPIDER模型來構建問題:S(Sample):社區內老年抑郁癥患者及其家屬,社區醫生等工作人員;PI(Phenomenon of Interest):實施或接受藥物治療的經歷,但依從性不佳;D(Design):焦點組訪談法、個人訪談法;E(Evaluation):來自患者的因素,來自社區工作人員的因素,其他外部因素;R(Research Type):定性研究。
除了PICO模型和SPIDER模型外,澳大利亞的循證護理中心倡導運用SPICE(Setting,Population,Intervention,Comparison,Evaluation)模型構建問題 [4];健康法規與管理領域則倡導采用ECLIPSE(Expectation,Client Group,Location,Impact,Professionals,Service)模型 [5]。研究者根據研究需求選擇適合的研究問題構建模型。
2 制定納入與排除標準
具有明確的納入排除標準是系統評價區別于傳統綜述的第一個重要特征。定性系統評價的納入對象是有過某種經驗或者經歷的個體,必須事先制定相應的納入與排除標準。完成文獻檢索后,研究者需要基于納入與排除標準通過閱讀研究的文題、摘要等進行文獻篩選。納入標準指符合研究要求的一系列指標或者條件,排除標準指在滿足納入標準范圍內排除某些在研究對象或研究方法上會影響研究結果的研究。制定納入排除標準時可以考慮被納入研究的特征,利用SPIDER模型制定定性系統評價的納入排除標準。
3 文獻檢索
系統、全面地收集所有相關的文獻資料是系統評價的第二個重要特征。目前文獻檢索都采用電子數據庫檢索,手工檢索可以作為補充檢索。檢索過程中,首先應用SPIDER模型構建研究問題,隨后選擇數據庫并應用制定的檢索策略進行檢索。檢索定性研究主要使用Cochrane協作網定性研究小組推薦的PsycINFO、MEDLINE、EMbase與CINAHL四個外文數據庫(表 3),中文數據庫主要使用CNKI和CBM。

針對不同數據庫制定相應的檢索策略極為重要,一個好的檢索策略能夠平衡檢索結果的敏感性與特異性。使用泛指性較強的檢索詞(如上位主題詞)能提高敏感性,但特異性下降;使用專指性較強的檢索詞(如下位主題詞)能提高特異性,但敏感性下降。所以檢索策略需要根據研究的需求、檢索結果的文獻總量以及電子數據庫的特點綜合選用。
為了提高檢索結果的敏感性與特異性,檢索過程中需要使用方法學過濾器。過濾器是一種標準化的檢索策略,它能夠有效地從文獻中排除不符合納入標準的研究設計,查找到符合需要的研究設計,其原理就相當于將濾器的檢索結果與主題檢索用布爾邏輯運算符AND連接并輸出結果。方法學過濾器的使用分為兩步:① 利用主題詞、自由詞等進行主題檢索,并將分步檢索結果應用布爾邏輯運算符進行組配;② 使用過濾器篩選出適合于定性系統評價的原始研究設計。
考慮到過濾器的敏感性與特異性,在此推薦在英文數據庫中平衡敏感性與特異性的最佳過濾器:
PsycINFO:Experiences.tw. OR interview:.tw. OR qualitative.tw. [6]
MEDLINE:interview:.mp. OR experience:.mp. OR qualitative.tw. (Ovid’s search engine) [7]
EMbase:interview:.tw. OR exp health care organization/ OR experiences.tw. (Ovid’s search engine) [8]
CINAHL:interview.tw. OR audiorecording.sh. OR qualitative stud$.mp. [9]
4 文獻篩選
根據事先制定的納入排除標準,通常由兩位或兩位以上的研究人員背對背完成文獻篩選,以降低納入文獻時的選擇性偏倚。研究員通過背對背閱讀檢索的文獻題目、摘要和全文,參考納入標準,篩選符合納入標準的研究。然而實際情況具有復雜性,納入標準與排除標準之間存在灰色區域。考慮到不同的研究者或許對同一研究有不同的認識,被排除的文獻需要記錄在被排除的文獻清單中并注明原因,發表論文時以附件形式提交。文獻檢索和篩選過程可參考系統評價文獻檢索和篩選流程圖PRISMA [10]與Campbell系統評價的文獻檢索和報告標準ERICAR [11]。
5 質量評價
對納入研究的質量進行評價是系統評價的第三個重要特征。定性研究的評價要點包括研究目的(研究的目的是什么,為什么開展研究)、研究方法(能否解釋或說明參與者的行為或經驗)、研究設計(研究者是否選擇了合適的研究設計)等方面,同時還包括如何評價風險偏倚和如何在系統評價結果分析中處理和報告風險偏倚。風險偏倚評估的主要目的是盡可能找出風險偏倚的來源及分析其對系統評價結果的影響。
評價定性研究風險偏倚時,可以使用的評估工具有CASP(Critical Appraisal Skills Program)、ETQS(Evaluation Tool for Qualitative Studies)、JBI(Joanna Briggs Institute)等。CASP是由10個篩選問題以清單模式構成的嚴格評價工具,對每個標準都做了注釋,是許多評價員青睞的工具,但是CASP對原始研究的方法學評估相對而言并不突出 [12];JBI評價工具是一個計算機程序軟件包,需要兩名獨立的研究員分別進行評價,但很多評價條目沒有給予解釋,因此它更適合于定性研究專業分析員使用 [13];ETQS相對于JBI來說對其標準做出了更多細節性的說明。定性研究的評估工具各有千秋,研究者可以根據研究特點選用不同的工具進行嚴格評價(表 4)。

6 資料提取
定量研究中各項指標可以量化,數據的提取是一個相對的線性過程,可以通過某種模板對需要的數據進行提取 [11]。定性研究的證據多是用文字描述個人的行為或者經驗,提取定性資料有不同方式,可提取所有合格的信息以避免遺漏原始研究中的重要信息,也可有針對性地提取特殊形式的證據,例如只提取直接通過訪談所得的證據;可以只提取定性研究的核心設定,例如研究問題、研究設計等;也可收集該研究中提供的所有信息,包括該研究收集與分析數據的方法,作者對其數據的解釋等;還可選擇使用一個理論框架以指導數據提取,將納入研究的結果經過轉化以便于合并主題的綜合分析 [14]。但是框架法對選擇的理論框架要求較高,如果該框架并不適用于某些證據的提取,則需要對該框架進行修改。具體定性證據提取方法的選擇需要針對該研究的情況以及系統評價的需求自行設計。例如在勞埃德瓊斯提出的基于框架方法進行定性資料的提取中,首先對研究方法是否能夠滿足研究目的以及是否能夠準確地實施做了要求,在提取詳細的調查計劃內容中,該框架要求對問題清單、文獻回顧、研究人員的紀律性、傾向性,以及數據收集與分析策略等各大要素進行詳細劃分,并在最后利用幾個問題對研究的正確性與其報告形式的合理性進行探討。
7 資料綜合
定性系統評價所研究的問題具有多樣性,其納入的研究設計類型也具有多樣性,因此定性系統評價有其特有的資料綜合方法(表 5)。例如Meta-人種志(Meta-ethnography)致力于確定各定性研究之間的關系,主要針對結果相互支持的研究、相互對立的研究,也可以列舉兩個相關研究的論據進行對比,此方法適用于教育學與部分護理學領域 [15]。CIS(Critical Interpretive Synthesis)改編自Meta-人種志,適用于提取廣泛的研究對象的定性研究,如對弱勢群體的醫療保健和社會工作的可行性,最終目的是合成研究中的論點以提出新的學說或者概念。主題綜合(Thematic Synthesis)是通過分析主題的方式,首先對納入的研究進行信息提取以形成描述性或者分析性觀點,再通過綜合各研究之間的觀點,對分析的研究提出新的解釋與說明。面對越來越多的與定性合成有關的方法論,建立定性合成研究報告標準和證據分級方法可以進一步提高研究報告質量和促進證據轉化。ENTREQ(The Enhancing Transparency in Reporting the Synthesis of Qualitative Research)是一個提高定性研究合成報告透明度的指南 [16]。CERqual(Certainty of Qualitative Studies)工具是由挪威知識轉化中心為主的研究人員組織國際相關機構及人員制定的定性系統評價的分級系統,旨在為全球性的指南小組使用定性證據合成提供支持 [17]。

8 結果與討論
定性系統評價的結果部分需要對檢索以及篩選結果進行說明,描述納入研究的特征并分析納入研究的主題。不同于定量系統評價以統計圖表描述合成結果,定性系統評價納入的多為敘述性證據,因而結果也是以描述性的語言表達。定性系統評價的結果描述需要應合理運用上文介紹的資料提取與綜合方法,提出新的學說概念或者探討對原始研究的新看法,并對所使用的方法進行簡要的介紹與分析。需要對合并分析結果的可信度進行評估時可使用CERqual工具,關于結果報告的規范可以參考上文提到的ENTERQ工具以有效提升定性資料綜合的透明度。
在總結本次系統評價研究的主要結果后,應在論文的討論部分客觀地分析本系統評價與相關研究或者相關系統評價之間的關系,并說明其結果在實際運用中應當注意的方面或者可能存在的挑戰。定性系統評價存在一定的爭議與局限性,作者在討論部分也應當客觀地闡述本次系統評價存在的局限性,并闡述有關納入研究的質量、語言等的限制,以及相關偏倚可能對本次評價的影響,還需要客觀說明本系統評價的結果對于未來研究和實踐的指導價值和意義,提出具體的提高未來相關研究質量的指導意見。
9 示例:產科機構在中低收入國家應用的影響因素研究的定性系統評價 [18 ]
2010年,在全球范圍內約有287 000例產婦死亡的事件。研究提示撒哈拉以南的非洲地區與南亞地區死亡的產婦占據了總數的85%。以證據為基礎而實施的臨床與預防干預措施中,有一項為增加專門的產科機構來減少母嬰死亡率。高質量的產科機構能夠有效地減少母嬰的死亡率,然而這些地區產科機構的使用率很低。根據聯合國兒童基金會的估算,2014年撒哈拉以南的非洲地區,48%的婦女在產科機構內分娩,南亞地區為44%,中東與北非地區為71%。在最不發達的地區,2014年產科機構內分娩占比平均只有43%。
盡管基于人群的調查能計算產科機構內分娩人數占總人數的比例,但是不能收集婦女對此事的看法與做出該決定的原因。因此,需要通過定性研究了解影響婦女選擇分娩方式的因素。通過定性研究能夠探究婦女在選擇分娩方式時的想法、對分娩的理解以及各種因素對其決定的影響程度。本定性系統評價通過綜合定性資料,研究中低收入國家婦女對產科機構內分娩的看法及該方法推廣的障礙。
9.1 文獻檢索
在PubMed與CINAHL中的檢索詞中包含以下三部分:孕婦保健、圍產期保健與產科機構內分娩;中低收入國家;定性研究方法學。另外,在WHO、Global Health Library、The Cochrane Library、DARE、Google Scholar、CRD、OpenGrey與EThOs中檢索未出版文獻或者灰色文獻。
9.2 文獻篩選
由三名獨立的研究員通過閱讀文題與摘要的方式進行初步篩選,再通過閱讀全文進行二次篩選。
9.3 納入研究數據提取
兩位研究者利用標準化的數據提取方法對每一個研究進行數據的提取,包括以下方面:研究背景與人口統計數據、研究對象、研究設計、數據綜合與分析方法、主題、結論。
9.4 納入研究定性評估
兩位研究員利用改編后的CASP定性評估工具通過研究目的、方法學、研究設計等方面對納入的定性研究方法學進行評估(由于傳統CASP量表對方法學的評估并不突出),分為“高”、“中”、“低”三個等級。此外,利用CERqual工具對研究結果的可信度進行評估。
9.5 研究結果
通過數據庫與其他渠道共檢出2 283篇文獻,其中34篇被納入。經過CASP定性評估工具評價。影響產婦分娩方式的選擇因素可以歸為以下幾類:
① 文化因素:在傳統文化與社會文化影響下,許多人認為分娩是自然現象,分娩是女性的天賦,在產科機構內分娩不符合邏輯。
② 個人因素:婦女懼怕面對陌生的與非自然的分娩方式,如剖腹產與會陰切開術,并且在家庭之外的地方分娩會讓她們覺得自己的隱私受到侵犯。部分產婦因為有過傳統分娩經驗,她們便會認為利用設備分娩是多此一舉。
③ 家庭因素:產婦丈夫與其他家庭成員,特別是已有自然分娩經歷的家庭成員能影響產婦對分娩方式的選擇。甚至有些情況下分娩方式不是由產婦決定,而是由其家人決定。
此外,政策、資源與費用也是影響因素之一。
9.6 結論
產婦選擇分娩方式受到許多的客觀因素與主觀因素的影響。政府、公共衛生項目與健康工作者鼓勵婦女在產科機構分娩,但是由于隱私、經驗等問題,產婦更傾向于在家中分娩,而且普通分娩方式在幾代人之間的延續性也是決策的因素之一。同時,家中分娩的便利性起到了至關重要的作用。此外,地域因素與經濟因素也是推廣產科機構分娩的極為重要的障礙。政策與保險方案或者其他公共衛生項目往往不能有效地緩和此類客觀障礙,因此需要決策者與執行者進行協調,緩和上述障礙以增加在產科機構內分娩的婦女的數量。如開放醫療保健系統與社區的交流,通過提供詳細信息與告知產科機構內分娩的潛在的優勢,讓產婦及其家屬接受這一分娩方式。
總之,定性系統評價與定量系統評價的主要結構和撰寫步驟相似,但二者在關注研究問題、問題構建、證據檢索、證據評價和合成方法等方面不同。隨著定性系統評價方法學不斷完善,其在指南推薦、衛生決策等方面的知證決策將發揮重要作用,研究者有必要盡早掌握此種研究方法。
系統評價是指針對具體問題,采用科學的、規范的方法全面收集、嚴格篩選、客觀評價和科學分析納入研究,得出綜合可靠結論的研究方法 [1]。隨著循證醫學的不斷發展,大量基于定量研究的系統評價被廣泛用于指導臨床實踐,許多研究者認為系統評價即定量系統評價。實際上,系統評價是一種二次研究方法,其納入的研究為定量研究、定性研究或者定量和定性皆有的研究,納入研究類型取決于研究問題。定性系統評價(定性證據合成)即針對研究問題,進行系統檢索后納入定性研究并對其客觀評價、分析得出結論的研究類型。定性研究指通過觀察法、個人訪談、焦點組討論以及參與性研究等方法,或是分析文字或影音記錄資料等方法獲取資料,目的是從研究對象的角度去了解與解釋如行為、觀點、態度和經驗等現象 [2]。定性系統評價能夠從不同角度觀察、分析問題,例如能夠定性地探究某種干預措施的執行與持久程度的影響因素等問題,為決策者基于實際情況的決策提供可靠依據。同樣,針對某種干預措施,定性系統評價也能夠提供參與者對其接受程度和依從性證據,為定量研究提供前期理論基礎,彌補單純定量研究的不足。定量系統評價與定性系統評價的比較見表 1。本文將從提出問題、檢索證據、評價證據、綜合證據等方面介紹定性系統評價的撰寫方法。

1 提出及構建問題
系統評價由提出問題、確定納入排除標準、檢索證據、評價證據、分析、結論及討論組成。撰寫系統評價前需要有一個明確的研究問題。構建一個具有實際意義的研究問題可以幫助研究者深入認識研究問題,有助于制定科學合理的檢索策略。定量干預性系統評價常用的問題構建模型是被人們所熟知的PICO模型。然而相對于定量研究,定性研究具有樣本量小、注重研究對象的經驗與體會的特點,故而PICO模型不適用于定性系統評價,需要對其進行改良。SPIDER模型是由國內外相關研究者Cooke等基于PICO模型進行改良,適用于定性系統評價的模型 [3, 4],其將人群(Population)修改為研究對象(Sample),干預措施(Intervention)則改為側重于探究個人需求、觀點、態度、經驗的研究內容(Phenomenon of Interest)。具體SPIDER模型參見表 2。

通過對PICO模型的一系列拓展,SPIDER模型能夠更加系統、合理地構建定性系統評價問題。
例如社會工作者希望研究社區內老年抑郁癥患者對藥物治療的依從性影響因素,可使用SPIDER模型來構建問題:S(Sample):社區內老年抑郁癥患者及其家屬,社區醫生等工作人員;PI(Phenomenon of Interest):實施或接受藥物治療的經歷,但依從性不佳;D(Design):焦點組訪談法、個人訪談法;E(Evaluation):來自患者的因素,來自社區工作人員的因素,其他外部因素;R(Research Type):定性研究。
除了PICO模型和SPIDER模型外,澳大利亞的循證護理中心倡導運用SPICE(Setting,Population,Intervention,Comparison,Evaluation)模型構建問題 [4];健康法規與管理領域則倡導采用ECLIPSE(Expectation,Client Group,Location,Impact,Professionals,Service)模型 [5]。研究者根據研究需求選擇適合的研究問題構建模型。
2 制定納入與排除標準
具有明確的納入排除標準是系統評價區別于傳統綜述的第一個重要特征。定性系統評價的納入對象是有過某種經驗或者經歷的個體,必須事先制定相應的納入與排除標準。完成文獻檢索后,研究者需要基于納入與排除標準通過閱讀研究的文題、摘要等進行文獻篩選。納入標準指符合研究要求的一系列指標或者條件,排除標準指在滿足納入標準范圍內排除某些在研究對象或研究方法上會影響研究結果的研究。制定納入排除標準時可以考慮被納入研究的特征,利用SPIDER模型制定定性系統評價的納入排除標準。
3 文獻檢索
系統、全面地收集所有相關的文獻資料是系統評價的第二個重要特征。目前文獻檢索都采用電子數據庫檢索,手工檢索可以作為補充檢索。檢索過程中,首先應用SPIDER模型構建研究問題,隨后選擇數據庫并應用制定的檢索策略進行檢索。檢索定性研究主要使用Cochrane協作網定性研究小組推薦的PsycINFO、MEDLINE、EMbase與CINAHL四個外文數據庫(表 3),中文數據庫主要使用CNKI和CBM。

針對不同數據庫制定相應的檢索策略極為重要,一個好的檢索策略能夠平衡檢索結果的敏感性與特異性。使用泛指性較強的檢索詞(如上位主題詞)能提高敏感性,但特異性下降;使用專指性較強的檢索詞(如下位主題詞)能提高特異性,但敏感性下降。所以檢索策略需要根據研究的需求、檢索結果的文獻總量以及電子數據庫的特點綜合選用。
為了提高檢索結果的敏感性與特異性,檢索過程中需要使用方法學過濾器。過濾器是一種標準化的檢索策略,它能夠有效地從文獻中排除不符合納入標準的研究設計,查找到符合需要的研究設計,其原理就相當于將濾器的檢索結果與主題檢索用布爾邏輯運算符AND連接并輸出結果。方法學過濾器的使用分為兩步:① 利用主題詞、自由詞等進行主題檢索,并將分步檢索結果應用布爾邏輯運算符進行組配;② 使用過濾器篩選出適合于定性系統評價的原始研究設計。
考慮到過濾器的敏感性與特異性,在此推薦在英文數據庫中平衡敏感性與特異性的最佳過濾器:
PsycINFO:Experiences.tw. OR interview:.tw. OR qualitative.tw. [6]
MEDLINE:interview:.mp. OR experience:.mp. OR qualitative.tw. (Ovid’s search engine) [7]
EMbase:interview:.tw. OR exp health care organization/ OR experiences.tw. (Ovid’s search engine) [8]
CINAHL:interview.tw. OR audiorecording.sh. OR qualitative stud$.mp. [9]
4 文獻篩選
根據事先制定的納入排除標準,通常由兩位或兩位以上的研究人員背對背完成文獻篩選,以降低納入文獻時的選擇性偏倚。研究員通過背對背閱讀檢索的文獻題目、摘要和全文,參考納入標準,篩選符合納入標準的研究。然而實際情況具有復雜性,納入標準與排除標準之間存在灰色區域。考慮到不同的研究者或許對同一研究有不同的認識,被排除的文獻需要記錄在被排除的文獻清單中并注明原因,發表論文時以附件形式提交。文獻檢索和篩選過程可參考系統評價文獻檢索和篩選流程圖PRISMA [10]與Campbell系統評價的文獻檢索和報告標準ERICAR [11]。
5 質量評價
對納入研究的質量進行評價是系統評價的第三個重要特征。定性研究的評價要點包括研究目的(研究的目的是什么,為什么開展研究)、研究方法(能否解釋或說明參與者的行為或經驗)、研究設計(研究者是否選擇了合適的研究設計)等方面,同時還包括如何評價風險偏倚和如何在系統評價結果分析中處理和報告風險偏倚。風險偏倚評估的主要目的是盡可能找出風險偏倚的來源及分析其對系統評價結果的影響。
評價定性研究風險偏倚時,可以使用的評估工具有CASP(Critical Appraisal Skills Program)、ETQS(Evaluation Tool for Qualitative Studies)、JBI(Joanna Briggs Institute)等。CASP是由10個篩選問題以清單模式構成的嚴格評價工具,對每個標準都做了注釋,是許多評價員青睞的工具,但是CASP對原始研究的方法學評估相對而言并不突出 [12];JBI評價工具是一個計算機程序軟件包,需要兩名獨立的研究員分別進行評價,但很多評價條目沒有給予解釋,因此它更適合于定性研究專業分析員使用 [13];ETQS相對于JBI來說對其標準做出了更多細節性的說明。定性研究的評估工具各有千秋,研究者可以根據研究特點選用不同的工具進行嚴格評價(表 4)。

6 資料提取
定量研究中各項指標可以量化,數據的提取是一個相對的線性過程,可以通過某種模板對需要的數據進行提取 [11]。定性研究的證據多是用文字描述個人的行為或者經驗,提取定性資料有不同方式,可提取所有合格的信息以避免遺漏原始研究中的重要信息,也可有針對性地提取特殊形式的證據,例如只提取直接通過訪談所得的證據;可以只提取定性研究的核心設定,例如研究問題、研究設計等;也可收集該研究中提供的所有信息,包括該研究收集與分析數據的方法,作者對其數據的解釋等;還可選擇使用一個理論框架以指導數據提取,將納入研究的結果經過轉化以便于合并主題的綜合分析 [14]。但是框架法對選擇的理論框架要求較高,如果該框架并不適用于某些證據的提取,則需要對該框架進行修改。具體定性證據提取方法的選擇需要針對該研究的情況以及系統評價的需求自行設計。例如在勞埃德瓊斯提出的基于框架方法進行定性資料的提取中,首先對研究方法是否能夠滿足研究目的以及是否能夠準確地實施做了要求,在提取詳細的調查計劃內容中,該框架要求對問題清單、文獻回顧、研究人員的紀律性、傾向性,以及數據收集與分析策略等各大要素進行詳細劃分,并在最后利用幾個問題對研究的正確性與其報告形式的合理性進行探討。
7 資料綜合
定性系統評價所研究的問題具有多樣性,其納入的研究設計類型也具有多樣性,因此定性系統評價有其特有的資料綜合方法(表 5)。例如Meta-人種志(Meta-ethnography)致力于確定各定性研究之間的關系,主要針對結果相互支持的研究、相互對立的研究,也可以列舉兩個相關研究的論據進行對比,此方法適用于教育學與部分護理學領域 [15]。CIS(Critical Interpretive Synthesis)改編自Meta-人種志,適用于提取廣泛的研究對象的定性研究,如對弱勢群體的醫療保健和社會工作的可行性,最終目的是合成研究中的論點以提出新的學說或者概念。主題綜合(Thematic Synthesis)是通過分析主題的方式,首先對納入的研究進行信息提取以形成描述性或者分析性觀點,再通過綜合各研究之間的觀點,對分析的研究提出新的解釋與說明。面對越來越多的與定性合成有關的方法論,建立定性合成研究報告標準和證據分級方法可以進一步提高研究報告質量和促進證據轉化。ENTREQ(The Enhancing Transparency in Reporting the Synthesis of Qualitative Research)是一個提高定性研究合成報告透明度的指南 [16]。CERqual(Certainty of Qualitative Studies)工具是由挪威知識轉化中心為主的研究人員組織國際相關機構及人員制定的定性系統評價的分級系統,旨在為全球性的指南小組使用定性證據合成提供支持 [17]。

8 結果與討論
定性系統評價的結果部分需要對檢索以及篩選結果進行說明,描述納入研究的特征并分析納入研究的主題。不同于定量系統評價以統計圖表描述合成結果,定性系統評價納入的多為敘述性證據,因而結果也是以描述性的語言表達。定性系統評價的結果描述需要應合理運用上文介紹的資料提取與綜合方法,提出新的學說概念或者探討對原始研究的新看法,并對所使用的方法進行簡要的介紹與分析。需要對合并分析結果的可信度進行評估時可使用CERqual工具,關于結果報告的規范可以參考上文提到的ENTERQ工具以有效提升定性資料綜合的透明度。
在總結本次系統評價研究的主要結果后,應在論文的討論部分客觀地分析本系統評價與相關研究或者相關系統評價之間的關系,并說明其結果在實際運用中應當注意的方面或者可能存在的挑戰。定性系統評價存在一定的爭議與局限性,作者在討論部分也應當客觀地闡述本次系統評價存在的局限性,并闡述有關納入研究的質量、語言等的限制,以及相關偏倚可能對本次評價的影響,還需要客觀說明本系統評價的結果對于未來研究和實踐的指導價值和意義,提出具體的提高未來相關研究質量的指導意見。
9 示例:產科機構在中低收入國家應用的影響因素研究的定性系統評價 [18 ]
2010年,在全球范圍內約有287 000例產婦死亡的事件。研究提示撒哈拉以南的非洲地區與南亞地區死亡的產婦占據了總數的85%。以證據為基礎而實施的臨床與預防干預措施中,有一項為增加專門的產科機構來減少母嬰死亡率。高質量的產科機構能夠有效地減少母嬰的死亡率,然而這些地區產科機構的使用率很低。根據聯合國兒童基金會的估算,2014年撒哈拉以南的非洲地區,48%的婦女在產科機構內分娩,南亞地區為44%,中東與北非地區為71%。在最不發達的地區,2014年產科機構內分娩占比平均只有43%。
盡管基于人群的調查能計算產科機構內分娩人數占總人數的比例,但是不能收集婦女對此事的看法與做出該決定的原因。因此,需要通過定性研究了解影響婦女選擇分娩方式的因素。通過定性研究能夠探究婦女在選擇分娩方式時的想法、對分娩的理解以及各種因素對其決定的影響程度。本定性系統評價通過綜合定性資料,研究中低收入國家婦女對產科機構內分娩的看法及該方法推廣的障礙。
9.1 文獻檢索
在PubMed與CINAHL中的檢索詞中包含以下三部分:孕婦保健、圍產期保健與產科機構內分娩;中低收入國家;定性研究方法學。另外,在WHO、Global Health Library、The Cochrane Library、DARE、Google Scholar、CRD、OpenGrey與EThOs中檢索未出版文獻或者灰色文獻。
9.2 文獻篩選
由三名獨立的研究員通過閱讀文題與摘要的方式進行初步篩選,再通過閱讀全文進行二次篩選。
9.3 納入研究數據提取
兩位研究者利用標準化的數據提取方法對每一個研究進行數據的提取,包括以下方面:研究背景與人口統計數據、研究對象、研究設計、數據綜合與分析方法、主題、結論。
9.4 納入研究定性評估
兩位研究員利用改編后的CASP定性評估工具通過研究目的、方法學、研究設計等方面對納入的定性研究方法學進行評估(由于傳統CASP量表對方法學的評估并不突出),分為“高”、“中”、“低”三個等級。此外,利用CERqual工具對研究結果的可信度進行評估。
9.5 研究結果
通過數據庫與其他渠道共檢出2 283篇文獻,其中34篇被納入。經過CASP定性評估工具評價。影響產婦分娩方式的選擇因素可以歸為以下幾類:
① 文化因素:在傳統文化與社會文化影響下,許多人認為分娩是自然現象,分娩是女性的天賦,在產科機構內分娩不符合邏輯。
② 個人因素:婦女懼怕面對陌生的與非自然的分娩方式,如剖腹產與會陰切開術,并且在家庭之外的地方分娩會讓她們覺得自己的隱私受到侵犯。部分產婦因為有過傳統分娩經驗,她們便會認為利用設備分娩是多此一舉。
③ 家庭因素:產婦丈夫與其他家庭成員,特別是已有自然分娩經歷的家庭成員能影響產婦對分娩方式的選擇。甚至有些情況下分娩方式不是由產婦決定,而是由其家人決定。
此外,政策、資源與費用也是影響因素之一。
9.6 結論
產婦選擇分娩方式受到許多的客觀因素與主觀因素的影響。政府、公共衛生項目與健康工作者鼓勵婦女在產科機構分娩,但是由于隱私、經驗等問題,產婦更傾向于在家中分娩,而且普通分娩方式在幾代人之間的延續性也是決策的因素之一。同時,家中分娩的便利性起到了至關重要的作用。此外,地域因素與經濟因素也是推廣產科機構分娩的極為重要的障礙。政策與保險方案或者其他公共衛生項目往往不能有效地緩和此類客觀障礙,因此需要決策者與執行者進行協調,緩和上述障礙以增加在產科機構內分娩的婦女的數量。如開放醫療保健系統與社區的交流,通過提供詳細信息與告知產科機構內分娩的潛在的優勢,讓產婦及其家屬接受這一分娩方式。
總之,定性系統評價與定量系統評價的主要結構和撰寫步驟相似,但二者在關注研究問題、問題構建、證據檢索、證據評價和合成方法等方面不同。隨著定性系統評價方法學不斷完善,其在指南推薦、衛生決策等方面的知證決策將發揮重要作用,研究者有必要盡早掌握此種研究方法。