本文介紹混合方法研究系統評價的名稱與定義、適用情景、方法學并結合實例介紹該方法的具體應用,旨在促進該方法在國內應用,并幫助臨床決策者選擇適宜的系統評價定性結果來指導臨床實踐。
引用本文: 卞薇, 陳耀龍, 廖建梅, 王宗華, 譚明瓊, 萬君麗. 混合方法研究系統評價簡介. 中國循證醫學雜志, 2019, 19(4): 498-504. doi: 10.7507/1672-2531.201812131 復制
隨著循證醫學在國內的廣泛傳播和推廣,基于當前可獲得的最佳證據來制定衛生保健決策和支持臨床實踐活動成為一種發展趨勢[1]。系統評價作為一種研究證據合成方法,被認為是當前最高級別的證據而被廣泛應用于臨床實踐。目前,大部分系統評價是基于定量研究結果,僅少量系統評價基于定性研究結果。然而,無論定量研究或定性研究的系統評價均為單一研究方法的系統評價,在某些情景下適用性有限,無法充分地為政策和實踐方面提供更為全面可行的政策依據。混合方法研究系統評價(mixed methods systematic reviews,MMSR)是指針對某一具體研究問題進行全面的系統檢索后納入定量、定性和混合型研究,并對其進行嚴格的質量評價、分析和整合后,得出可靠結論。混合方法研究是一種結合研究者或研究團隊整合定性和定量研究方法要素(包括定性和定量的研究視角、數據收集/分析和推斷技巧)的研究類型,旨在拓展臨床證據的廣度和深度[2]。混合方法研究系統評價可通過對不同類型研究證據的整合和分析,來彌補單一研究方法系統評價提供的信息不足,從而最大限度地挖掘證據及為政策和臨床實踐提供決策依據。如 Harden 等[3]通過混合方法研究系統評價了解到兒童群體對食用蔬菜水果明顯有益于生長這一高級別證據的實踐并不理想的原因是,兒童對“健康”這一抽象概念不感興趣且并不認為這些食物跟未來健康相關,因此建議衛生政策部門在推薦食用水果和蔬菜時采用“美味的”而不是“健康的”概念,從而說服兒童多吃蔬菜水果。鑒于此,本文將通過混合方法研究系統評價定義、適用情景、方法論、與定量和定性系統評價的比較和具體應用實例來對該方法進行介紹,旨在促進該方法在國內的應用并幫助臨床決策人員選擇適宜的結果來指導臨床實踐。
1 混合方法研究系統評價的定義
由于混合方法研究系統評價領域尚處在起步階段,目前尚未對該類系統評價的定義達成共識。Thomas 等[4]首次在 BMJ 上提出將不同類型的研究數據納入健康干預系統評價的價值。他認為“混合方法研究系統評價是一種為全面了解健康干預效果而將定性和定量研究相結合的系統評價方法,應基于定性研究系統評價構建的框架,將定量研究系統評價結果納入后進行整合”。Bruinsma 等[5]認為“混合方法研究系統評價是即包含定量的系統評價又包含定性的系統評價,應分別分析定性和定量數據,并對最終結果進行簡要的敘述性討論”。Harden 等[3]將混合方法研究系統評價定義為“混合方法研究系統評價是一種全面且最大限度了解某一主題文獻從而為衛生政策制定和臨床實踐相關問題提供有效信息,涉及到兩種及以上研究方法,如定性和定量數據的系統評價方法。其結果應基于多種類型數據進行全面綜合,最終整合成統一而全面的混合型合成結果”。在上述各種定義中,Thomas 的定義明確了混合方法研究系統評價的研究目的(全面了解健康干預效果)和實現途徑(將定性和定量研究相結合),但該定義存在明顯的不足,如研究目的和實現途徑較為單一。Bruinsma 的定義擴展了混合方法研究系統評價的實現途徑,即分別分析定性和定量結果后進行綜合性的討論,但卻忽略了研究范疇、目的和兩種研究方法系統評價相容性。而 Harden 清楚明確地界定了混合方法研究系統評價的范疇、目的和實現途徑。因此,縱觀現有混合方法研究系統評價定義,我們認為 Harden 的定義最為系統和全面,最能清楚闡釋 MMSR 內涵和基本屬性。
2 混合方法研究系統評價的適用情景
目前,并非所有情景都適合采用混合方法研究系統評價。當研究者試圖了解變量關系、干預措施有效性等,應采用定量研究系統評價;當研究者探索某個問題、參與者觀點、干預措施有效或無效的原因及影響因素等,應采用定性研究系統評價。對于混合方法研究系統評價而言,采用的情景主要為以下 4 個方面[6, 7]:① 當單一研究方法的系統評價沒有完整地回答研究問題,有待進一步解釋;② 定性研究系統評價和定量研究系統評價結果矛盾;③ 為了利用第二種研究方法系統評價來深化研究;④ 為了推廣探索性研究的發現,如通過定性研究系統評價來了解哪些問題、變量等內容需要研究,然后采用定量研究系統評價來推廣、檢驗前期探索結果。總之根據混合方法研究系統評價的定位差異,上述情景可以按照不同目的進行歸類[8]。前三個情景歸為第一類,說明混合方法研究系統評價可以用于補充、解釋和推廣單一研究方法系統評價的不足;最后一個情景歸為第二類,說明混合方法研究系統評價可用于探索并檢驗前期探索結果。
3 混合方法研究系統評價的方法論
由于沒有統一制定混合方法研究系統評價的方法學質量評價和報告質量規范,導致該類系統評價的方法學和報告形式存在極大差異性。很多文獻雖在標題采用了“……混合方法研究系統評價”,但極少數文獻實現了真正意義上的混合方法研究系統評價,如數據沒有進行單一研究方法的合成,或是沒有在兩種研究方法分別合成后進行最終整合[9]。目前,混合方法研究系統評價的方法主要包括現實主義整合法[10]、Sandelowski 等[11]提出的現實主義整合法的替代框架、貝葉斯法[12]和 JBI 混合方法研究系統評價合成法[13]。
現實主義整合法遵循非結構化的設計,提出了遵循上下文機制的一種結果范式的理論驅動方法。它的主要過程包括:制定理論框架、提取來自不同信息來源數據、將提取數據整合到框架中、根據具體情境提出支持或反對理論的證據,從而試圖解釋干預措施在不同的情景下如何促進決策。雖然現實主義整合法對混合方法研究系統評價起到了極為重要的推動作用,但是存在明顯的弊端:① 在單一研究方法合成階段,證據選擇方面缺乏透明度[9];② 在兩種數據合成結果的整合階段對于如何處理矛盾證據結果缺乏明確的方法學指導[14];③ 整個過程存在高度重復,并且有可能不斷改變整個系統評價的方向和重點,因此可能導致嚴重的偏倚[15]。
Sandelowski 根據現實主義整合法的不足提出了一套替代框架,主要包括分離法、整合法和條件法(圖 1)。分離法是指在定量和定性證據之間進行明確區分,要求先分別單獨進行兩種研究方法合成,再對其結果進行最終整合。整合法不進行單獨的定量和定性合成,而將兩種形式的數據轉化成單一的兼容數據再進行混合型研究方法的整合。條件法是基于先前合成的結果按順序進行兩種或多種研究方法的合成。盡管上述三種方法都采用了定量和定性數據,但只有分離法是先進行單一研究方法的合成,再采用 Meta 分析或 Meta 整合將單一合成的數據進行整合。

而貝葉斯法認為應將不同研究方法的數據轉化為相互兼容的格式,然后再進行證據的總結性陳述(圖 2)。具體包括對定性數據賦予數值,然后對定量數據進行最終的 Meta 分析(即將定性數據轉化為定量);或將所有的定量數據賦予定性的主題描述,從而促成定性數據的最終 Meta 整合(即將定量數據轉化為定性數據)。雖然此類方法可以使定性和定量數據統計分析或主題整合更加容易,但仍存在一定的不足:① 將定性數據轉化為定量數據,會產生如何轉化不定程度語言詞為數字格式的問題,如“許多”、“少數”等詞匯;② 將定量數據轉化為定性數據,其定量數據編碼準確與否將會對結果產生巨大的影響;其次,單個研究的權重需要根據納入研究的不同證據等級和方法學質量進行調整,權重調整仍有主觀性。

JBI 混合方法研究系統評價合成法是在綜合考慮現實主義整合法和貝葉斯法的核心思想的基礎上設計的,即先采用分離法對不同研究方法結果分別進行系統評價,然后采用貝葉斯法將初始定量合成的結果轉化為定性主題描述,并將其與初始定性合成的結果進行 Meta 整合(圖 3)。

4 混合方法研究系統評價與定量、定性系統評價的比較
混合方法研究系統評價與定量、定性系統評價的制作步驟相同,三者均采用嚴格的方法學框架,全面系統檢索和分析某一研究話題相關的研究證據。它們主要的差別在于研究問題、問題構建、證據合成等方面(表 1)。

5 實例介紹
本文以減重干預對慢性骨骼肌疼痛的成人超重/肥胖人群的干預效果研究[15]為例,介紹混合方法研究系統評價的具體應用。
5.1 研究背景
超重和慢性骨骼肌疼痛對個人、醫療資源和經濟費用產生廣泛的影響,且兩者常常同時發生且相互影響。但目前沒有系統評價來證實減重干預對慢性骨骼肌疼痛的成人超重/肥胖人群的有效性、適宜性和持續性,無法指導臨床實踐。
5.2 研究目的
評估減重干預對慢性骨骼肌肉疼痛的成人超重/肥胖人群的體重和疼痛影響,以及減重干預的有效性、適宜性和可持續性。
5.3 研究方法
5.3.1 納入標準
① 研究類型:所有試驗性研究,包括隨機對照試驗和類實驗研究;② 年齡≥18 歲,診斷為超重/肥胖和慢性骨骼肌疼痛的患者;③ 定量研究的干預措施包括任何體重管理手段,如減肥藥、手術、生活方式的改變;④ 主要結局指標:體重變化;肥胖相關的客觀指標(如 BMI、腰圍)。次要結局指標;疼痛評分,如疼痛數字評分法(NRS)/視覺模擬量表(VAS);⑤ 定性研究內容主要包括長期接受減重干預和持續減肥努力的觀念和經驗。
5.3.2 文獻檢索策略和文獻篩選
檢索已發表和未發表研究,采用三步檢索策略。① 在 PubMed 和 CINAHL 進行初始的限制性檢索,以明確關鍵詞和索引詞;② 基于前一步文獻分析結果,在 The Cochrane Library、EBSCOHOSTMedline、EBSCOHOSTCinahl、Scopus、EBSCOHOSTPsycINFO、OvidEMbase、ERIC、Web of Science 及 Clinicaltrials.gov、EU Clinical、ISRCTN、PROSPERO 和 PQDT 試驗注冊中心、EthOS 和 OpenGrey 中檢索從 1990 年到 2016 年 7 月 23 日以來出版的文獻或者灰色文獻;③ 對合格文獻和報告中的參考文獻列表及引文進行復核,以獲得更多的研究。文獻篩選由 2 名研究者按照方案獨立進行,有爭議的結果由第 3 位研究者裁決。
5.3.3 文獻質量評價
使用 JBI 標準化評估工具(JBI-MAStARI)對納入研究進行質量評價。由 2 名評估員獨立評估,意見分歧由第 3 位研究者裁決。
5.3.4 數據提取
由 2 名研究者采用標準化數據提取工具獨立地對每個納入研究進行數據提取。① 定量部分,采用 JBI-MAStARI 來提取數據,包括干預措施、研究對象、研究方法以及重要結局指標;② 定性部分:采用 JBI-QARI 來提取數據,包括感興趣的現象、研究對象、研究方法、對研究問題和具體目標具有重要意義的結果和細節。
5.3.5 數據整合
共分為兩個步驟:① 第一步,定性研究和定量研究分別進行整合,對定量研究提取數據進行 Meta 分析,對定性研究提取的數據進行 Meta 整合;② 將定量研究 Meta 分析結果轉化為定性描述,然后將定量研究結果的定性描述與定性研究整合結果主題相結合,得出最終的整合結果。
5.3.6 證據分級
采用 GRADE 系統分級法對證據質量進行評價,證據質量等級分為高、中、低、極低四級。
5.4 研究結果
初檢獲得 14 671 條文獻,經逐層篩選后,最終納入 17 篇,包括 14 篇定量研究和 3 篇定性研究,文獻篩選流程及結果見圖 4。① 定量研究 Meta 分析結果顯示:減重干預組較對照組平均體重減輕 4.9 kg[95%CI(2.9,6.8)],平均減少疼痛為 7.3/100 單位[95%CI(4.1,10.5)],GRADE 證據質量分級為低質量;② 定性研究 Meta 整合結果顯示:醫護人員了解疼痛對控制體重能力影響的重要性并制定綜合管理和教育計劃,GRADE 證據質量分級中等質量;③ 將定量研究結果轉化為定性結果,同時與定性研究 Meta 整合結果相結合得出的最終整合結果:用于管理體重和特定慢性骨骼肌疼痛的綜合干預能獲得成人超重/肥胖且患慢性骨骼肌疼痛人群的積極響應,并被證實能有效減輕體重和疼痛。醫護人員需要了解疼痛對控制體重能力影響的重要性,并制定適當的綜合管理和教育計劃,從而持續減輕體重和疼痛。該混合方法研究系統評價不僅從定量 Meta 分析結果強調了減肥對體重和疼痛管理的益處,同時采用定性研究結果對干預方法實施的條件進行了補充,強調醫護人員的意識、綜合管理及教育計劃制定對減重干預實施的重要性,保證干預措施的適用性,從而最大限度地減輕體重和疼痛。

6 討論
近年來,有關定量和定性證據價值性的爭論仍在持續。一方面,定量證據提供了關于特定干預或治療有效性的可重復證據。然而,這種證據往往忽略了患者的意愿和真實世界環境而限制了臨床應用。定性研究證據作為框架性、敘事性和主體性的綜合,是通過在醫療保健決策過程中患者或提供者的話語來全面了解個體體驗。但是,他們無法提供任何實證證據來支持該措施的有效性。因此,無論是定性還是定量證據,僅僅專注于一種形式證據的系統評價只能提供一部分證據,在許多情況下其適用性十分有限,將會給臨床實踐者帶來極大的困擾。因此,尋找能有機整合定量證據和定性證據的方法極其重要,混合方法研究系統評價正是在該背景下應運而生。混合方法研究系統評價擴大了證據的廣度和深度,具有多種方法包容性,并能產生更大范圍應用的證據綜合,能更有效地促進醫療衛生保健政策、臨床指南和臨床決策的制定。通過開發結構合理的混合方法系統評價方法學,采用系統的方法將定性和定量數據進行結合,從而提高了后續結論的客觀性、人文性和科學性。但在進行混合方法研究系統評價時,研究者尤其需要注意:①在不同研究方法的數據轉化為兼容數據格式時,如何確保信息的準確性,如將定量研究 Meta 分析結果轉化為定性主題時,是否充分考慮其應用場景;定性研究結果轉化為定量研究結果通常會通過不適合計數的主題分析法和解釋法來表達結果。而頻繁應用語言計數轉化法,有可能會無意中造成嚴重的偏倚。② 第一階段單一研究方法整合結果可能存在不同質量等級,在最終整合過程中應如何綜合衡量證據的等級從而給出最恰當的推薦級別。
隨著醫患共同決策的倡導以及指南人文化的促進推廣和應用的需求,混合方法研究系統評價的應用將會越來越廣泛,同時也期待國內混合方法研究系統評價的出現,產生更多全面、多樣性和適應性更廣的證據。
隨著循證醫學在國內的廣泛傳播和推廣,基于當前可獲得的最佳證據來制定衛生保健決策和支持臨床實踐活動成為一種發展趨勢[1]。系統評價作為一種研究證據合成方法,被認為是當前最高級別的證據而被廣泛應用于臨床實踐。目前,大部分系統評價是基于定量研究結果,僅少量系統評價基于定性研究結果。然而,無論定量研究或定性研究的系統評價均為單一研究方法的系統評價,在某些情景下適用性有限,無法充分地為政策和實踐方面提供更為全面可行的政策依據。混合方法研究系統評價(mixed methods systematic reviews,MMSR)是指針對某一具體研究問題進行全面的系統檢索后納入定量、定性和混合型研究,并對其進行嚴格的質量評價、分析和整合后,得出可靠結論。混合方法研究是一種結合研究者或研究團隊整合定性和定量研究方法要素(包括定性和定量的研究視角、數據收集/分析和推斷技巧)的研究類型,旨在拓展臨床證據的廣度和深度[2]。混合方法研究系統評價可通過對不同類型研究證據的整合和分析,來彌補單一研究方法系統評價提供的信息不足,從而最大限度地挖掘證據及為政策和臨床實踐提供決策依據。如 Harden 等[3]通過混合方法研究系統評價了解到兒童群體對食用蔬菜水果明顯有益于生長這一高級別證據的實踐并不理想的原因是,兒童對“健康”這一抽象概念不感興趣且并不認為這些食物跟未來健康相關,因此建議衛生政策部門在推薦食用水果和蔬菜時采用“美味的”而不是“健康的”概念,從而說服兒童多吃蔬菜水果。鑒于此,本文將通過混合方法研究系統評價定義、適用情景、方法論、與定量和定性系統評價的比較和具體應用實例來對該方法進行介紹,旨在促進該方法在國內的應用并幫助臨床決策人員選擇適宜的結果來指導臨床實踐。
1 混合方法研究系統評價的定義
由于混合方法研究系統評價領域尚處在起步階段,目前尚未對該類系統評價的定義達成共識。Thomas 等[4]首次在 BMJ 上提出將不同類型的研究數據納入健康干預系統評價的價值。他認為“混合方法研究系統評價是一種為全面了解健康干預效果而將定性和定量研究相結合的系統評價方法,應基于定性研究系統評價構建的框架,將定量研究系統評價結果納入后進行整合”。Bruinsma 等[5]認為“混合方法研究系統評價是即包含定量的系統評價又包含定性的系統評價,應分別分析定性和定量數據,并對最終結果進行簡要的敘述性討論”。Harden 等[3]將混合方法研究系統評價定義為“混合方法研究系統評價是一種全面且最大限度了解某一主題文獻從而為衛生政策制定和臨床實踐相關問題提供有效信息,涉及到兩種及以上研究方法,如定性和定量數據的系統評價方法。其結果應基于多種類型數據進行全面綜合,最終整合成統一而全面的混合型合成結果”。在上述各種定義中,Thomas 的定義明確了混合方法研究系統評價的研究目的(全面了解健康干預效果)和實現途徑(將定性和定量研究相結合),但該定義存在明顯的不足,如研究目的和實現途徑較為單一。Bruinsma 的定義擴展了混合方法研究系統評價的實現途徑,即分別分析定性和定量結果后進行綜合性的討論,但卻忽略了研究范疇、目的和兩種研究方法系統評價相容性。而 Harden 清楚明確地界定了混合方法研究系統評價的范疇、目的和實現途徑。因此,縱觀現有混合方法研究系統評價定義,我們認為 Harden 的定義最為系統和全面,最能清楚闡釋 MMSR 內涵和基本屬性。
2 混合方法研究系統評價的適用情景
目前,并非所有情景都適合采用混合方法研究系統評價。當研究者試圖了解變量關系、干預措施有效性等,應采用定量研究系統評價;當研究者探索某個問題、參與者觀點、干預措施有效或無效的原因及影響因素等,應采用定性研究系統評價。對于混合方法研究系統評價而言,采用的情景主要為以下 4 個方面[6, 7]:① 當單一研究方法的系統評價沒有完整地回答研究問題,有待進一步解釋;② 定性研究系統評價和定量研究系統評價結果矛盾;③ 為了利用第二種研究方法系統評價來深化研究;④ 為了推廣探索性研究的發現,如通過定性研究系統評價來了解哪些問題、變量等內容需要研究,然后采用定量研究系統評價來推廣、檢驗前期探索結果。總之根據混合方法研究系統評價的定位差異,上述情景可以按照不同目的進行歸類[8]。前三個情景歸為第一類,說明混合方法研究系統評價可以用于補充、解釋和推廣單一研究方法系統評價的不足;最后一個情景歸為第二類,說明混合方法研究系統評價可用于探索并檢驗前期探索結果。
3 混合方法研究系統評價的方法論
由于沒有統一制定混合方法研究系統評價的方法學質量評價和報告質量規范,導致該類系統評價的方法學和報告形式存在極大差異性。很多文獻雖在標題采用了“……混合方法研究系統評價”,但極少數文獻實現了真正意義上的混合方法研究系統評價,如數據沒有進行單一研究方法的合成,或是沒有在兩種研究方法分別合成后進行最終整合[9]。目前,混合方法研究系統評價的方法主要包括現實主義整合法[10]、Sandelowski 等[11]提出的現實主義整合法的替代框架、貝葉斯法[12]和 JBI 混合方法研究系統評價合成法[13]。
現實主義整合法遵循非結構化的設計,提出了遵循上下文機制的一種結果范式的理論驅動方法。它的主要過程包括:制定理論框架、提取來自不同信息來源數據、將提取數據整合到框架中、根據具體情境提出支持或反對理論的證據,從而試圖解釋干預措施在不同的情景下如何促進決策。雖然現實主義整合法對混合方法研究系統評價起到了極為重要的推動作用,但是存在明顯的弊端:① 在單一研究方法合成階段,證據選擇方面缺乏透明度[9];② 在兩種數據合成結果的整合階段對于如何處理矛盾證據結果缺乏明確的方法學指導[14];③ 整個過程存在高度重復,并且有可能不斷改變整個系統評價的方向和重點,因此可能導致嚴重的偏倚[15]。
Sandelowski 根據現實主義整合法的不足提出了一套替代框架,主要包括分離法、整合法和條件法(圖 1)。分離法是指在定量和定性證據之間進行明確區分,要求先分別單獨進行兩種研究方法合成,再對其結果進行最終整合。整合法不進行單獨的定量和定性合成,而將兩種形式的數據轉化成單一的兼容數據再進行混合型研究方法的整合。條件法是基于先前合成的結果按順序進行兩種或多種研究方法的合成。盡管上述三種方法都采用了定量和定性數據,但只有分離法是先進行單一研究方法的合成,再采用 Meta 分析或 Meta 整合將單一合成的數據進行整合。

而貝葉斯法認為應將不同研究方法的數據轉化為相互兼容的格式,然后再進行證據的總結性陳述(圖 2)。具體包括對定性數據賦予數值,然后對定量數據進行最終的 Meta 分析(即將定性數據轉化為定量);或將所有的定量數據賦予定性的主題描述,從而促成定性數據的最終 Meta 整合(即將定量數據轉化為定性數據)。雖然此類方法可以使定性和定量數據統計分析或主題整合更加容易,但仍存在一定的不足:① 將定性數據轉化為定量數據,會產生如何轉化不定程度語言詞為數字格式的問題,如“許多”、“少數”等詞匯;② 將定量數據轉化為定性數據,其定量數據編碼準確與否將會對結果產生巨大的影響;其次,單個研究的權重需要根據納入研究的不同證據等級和方法學質量進行調整,權重調整仍有主觀性。

JBI 混合方法研究系統評價合成法是在綜合考慮現實主義整合法和貝葉斯法的核心思想的基礎上設計的,即先采用分離法對不同研究方法結果分別進行系統評價,然后采用貝葉斯法將初始定量合成的結果轉化為定性主題描述,并將其與初始定性合成的結果進行 Meta 整合(圖 3)。

4 混合方法研究系統評價與定量、定性系統評價的比較
混合方法研究系統評價與定量、定性系統評價的制作步驟相同,三者均采用嚴格的方法學框架,全面系統檢索和分析某一研究話題相關的研究證據。它們主要的差別在于研究問題、問題構建、證據合成等方面(表 1)。

5 實例介紹
本文以減重干預對慢性骨骼肌疼痛的成人超重/肥胖人群的干預效果研究[15]為例,介紹混合方法研究系統評價的具體應用。
5.1 研究背景
超重和慢性骨骼肌疼痛對個人、醫療資源和經濟費用產生廣泛的影響,且兩者常常同時發生且相互影響。但目前沒有系統評價來證實減重干預對慢性骨骼肌疼痛的成人超重/肥胖人群的有效性、適宜性和持續性,無法指導臨床實踐。
5.2 研究目的
評估減重干預對慢性骨骼肌肉疼痛的成人超重/肥胖人群的體重和疼痛影響,以及減重干預的有效性、適宜性和可持續性。
5.3 研究方法
5.3.1 納入標準
① 研究類型:所有試驗性研究,包括隨機對照試驗和類實驗研究;② 年齡≥18 歲,診斷為超重/肥胖和慢性骨骼肌疼痛的患者;③ 定量研究的干預措施包括任何體重管理手段,如減肥藥、手術、生活方式的改變;④ 主要結局指標:體重變化;肥胖相關的客觀指標(如 BMI、腰圍)。次要結局指標;疼痛評分,如疼痛數字評分法(NRS)/視覺模擬量表(VAS);⑤ 定性研究內容主要包括長期接受減重干預和持續減肥努力的觀念和經驗。
5.3.2 文獻檢索策略和文獻篩選
檢索已發表和未發表研究,采用三步檢索策略。① 在 PubMed 和 CINAHL 進行初始的限制性檢索,以明確關鍵詞和索引詞;② 基于前一步文獻分析結果,在 The Cochrane Library、EBSCOHOSTMedline、EBSCOHOSTCinahl、Scopus、EBSCOHOSTPsycINFO、OvidEMbase、ERIC、Web of Science 及 Clinicaltrials.gov、EU Clinical、ISRCTN、PROSPERO 和 PQDT 試驗注冊中心、EthOS 和 OpenGrey 中檢索從 1990 年到 2016 年 7 月 23 日以來出版的文獻或者灰色文獻;③ 對合格文獻和報告中的參考文獻列表及引文進行復核,以獲得更多的研究。文獻篩選由 2 名研究者按照方案獨立進行,有爭議的結果由第 3 位研究者裁決。
5.3.3 文獻質量評價
使用 JBI 標準化評估工具(JBI-MAStARI)對納入研究進行質量評價。由 2 名評估員獨立評估,意見分歧由第 3 位研究者裁決。
5.3.4 數據提取
由 2 名研究者采用標準化數據提取工具獨立地對每個納入研究進行數據提取。① 定量部分,采用 JBI-MAStARI 來提取數據,包括干預措施、研究對象、研究方法以及重要結局指標;② 定性部分:采用 JBI-QARI 來提取數據,包括感興趣的現象、研究對象、研究方法、對研究問題和具體目標具有重要意義的結果和細節。
5.3.5 數據整合
共分為兩個步驟:① 第一步,定性研究和定量研究分別進行整合,對定量研究提取數據進行 Meta 分析,對定性研究提取的數據進行 Meta 整合;② 將定量研究 Meta 分析結果轉化為定性描述,然后將定量研究結果的定性描述與定性研究整合結果主題相結合,得出最終的整合結果。
5.3.6 證據分級
采用 GRADE 系統分級法對證據質量進行評價,證據質量等級分為高、中、低、極低四級。
5.4 研究結果
初檢獲得 14 671 條文獻,經逐層篩選后,最終納入 17 篇,包括 14 篇定量研究和 3 篇定性研究,文獻篩選流程及結果見圖 4。① 定量研究 Meta 分析結果顯示:減重干預組較對照組平均體重減輕 4.9 kg[95%CI(2.9,6.8)],平均減少疼痛為 7.3/100 單位[95%CI(4.1,10.5)],GRADE 證據質量分級為低質量;② 定性研究 Meta 整合結果顯示:醫護人員了解疼痛對控制體重能力影響的重要性并制定綜合管理和教育計劃,GRADE 證據質量分級中等質量;③ 將定量研究結果轉化為定性結果,同時與定性研究 Meta 整合結果相結合得出的最終整合結果:用于管理體重和特定慢性骨骼肌疼痛的綜合干預能獲得成人超重/肥胖且患慢性骨骼肌疼痛人群的積極響應,并被證實能有效減輕體重和疼痛。醫護人員需要了解疼痛對控制體重能力影響的重要性,并制定適當的綜合管理和教育計劃,從而持續減輕體重和疼痛。該混合方法研究系統評價不僅從定量 Meta 分析結果強調了減肥對體重和疼痛管理的益處,同時采用定性研究結果對干預方法實施的條件進行了補充,強調醫護人員的意識、綜合管理及教育計劃制定對減重干預實施的重要性,保證干預措施的適用性,從而最大限度地減輕體重和疼痛。

6 討論
近年來,有關定量和定性證據價值性的爭論仍在持續。一方面,定量證據提供了關于特定干預或治療有效性的可重復證據。然而,這種證據往往忽略了患者的意愿和真實世界環境而限制了臨床應用。定性研究證據作為框架性、敘事性和主體性的綜合,是通過在醫療保健決策過程中患者或提供者的話語來全面了解個體體驗。但是,他們無法提供任何實證證據來支持該措施的有效性。因此,無論是定性還是定量證據,僅僅專注于一種形式證據的系統評價只能提供一部分證據,在許多情況下其適用性十分有限,將會給臨床實踐者帶來極大的困擾。因此,尋找能有機整合定量證據和定性證據的方法極其重要,混合方法研究系統評價正是在該背景下應運而生。混合方法研究系統評價擴大了證據的廣度和深度,具有多種方法包容性,并能產生更大范圍應用的證據綜合,能更有效地促進醫療衛生保健政策、臨床指南和臨床決策的制定。通過開發結構合理的混合方法系統評價方法學,采用系統的方法將定性和定量數據進行結合,從而提高了后續結論的客觀性、人文性和科學性。但在進行混合方法研究系統評價時,研究者尤其需要注意:①在不同研究方法的數據轉化為兼容數據格式時,如何確保信息的準確性,如將定量研究 Meta 分析結果轉化為定性主題時,是否充分考慮其應用場景;定性研究結果轉化為定量研究結果通常會通過不適合計數的主題分析法和解釋法來表達結果。而頻繁應用語言計數轉化法,有可能會無意中造成嚴重的偏倚。② 第一階段單一研究方法整合結果可能存在不同質量等級,在最終整合過程中應如何綜合衡量證據的等級從而給出最恰當的推薦級別。
隨著醫患共同決策的倡導以及指南人文化的促進推廣和應用的需求,混合方法研究系統評價的應用將會越來越廣泛,同時也期待國內混合方法研究系統評價的出現,產生更多全面、多樣性和適應性更廣的證據。