引用本文: 王曉燕, 劉瑛, 寧艷花. 中國社區干預系統評價的質量評價. 中國循證醫學雜志, 2018, 18(7): 729-734. doi: 10.7507/1672-2531.201710096 復制
社區衛生服務可提供預防保健、就診轉診及健康照護服務,滿足社區人群的基本醫療服務需求,節約大量的醫療資源[1, 2]。由于我國社區衛生服務起步較晚,社區衛生服務機構存在醫務人員配備不足、基本醫療設施配置不齊等問題,使得健康問題的社區管理尚存在諸多困難和問題[3]。對此,許多學者基于國內現狀開展了相關的研究,為衛生管理部門及基層衛生服務機構開展工作提供了證據。但是,往往單個研究的檢驗效能較低,隨機誤差較大,且研究結論因人群、地區和時間等因素具有一定的局限性;而系統評價/Meta 分析(統稱為系統評價)可對多個同類研究有爭議或矛盾的結果進行整合分析[4]。系統評價的方法學質量和報告質量會大大影響其結果的可靠性,繼而影響臨床治療或社區管理決策[5]。但目前尚無對我國社區干預系統評價的特點、方法學和報告質量的評價。因此,本研究對我國社區干預系統評價的方法學和報告質量進行評價,以期為社區衛生服務實踐及研究提供參考資料。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
系統評價或 Meta 分析。
1.1.2 研究對象
中國人群。
1.1.3 干預措施
社區干預或社區管理,采用綜合干預方式的社區護理干預研究。
1.1.4 結局指標
相關疾病治療率、控制率、知識知曉率和病情監測指標等。
1.1.5 排除標準
① 非中、英文文獻;② 重復發表的文獻;③ 單一干預方法的研究(如僅采用健康教育或運動等);④ 缺乏相關數據,聯系作者也無法獲取者。
1.2 文獻檢索策略
計算機檢索 The Cochrane Library、PubMed、EMbase、Web of Science、CNKI、VIP、WanFang Data 和 CBM 數據庫,搜集公開發表的國內社區干預 Meta 分析或系統評價,檢索時限為建庫至 2017 年 8 月 3 日。中文檢索詞包括:社區干預、社區管理、社區預防、系統評價、Meta 分析、薈萃分析;英文檢索詞包括:community intervention、community-based intervention、systematic review、meta-analyses 和 meta-analysis。以 CNKI 為例,檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:發表年份、基金支持、干預方式、干預疾病、文獻檢索方法、檢索數據庫和被引次數等。
1.4 納入研究的質量評價
采用 AMSTAR 和 PRISMA 量表分別評價納入研究的方法學和報告質量。AMSTAR 量表[6]包括 11 個條目,每個條目的計分為:“是”=1 分,“否”=0 分,“不清楚”或“不適用”=0 分。PRISMA 量表[7]包括 7 個部分 27 個條目,每個條目的計分為:“充分”=1 分,“部分符合”=0.5 分,“不符合”=0 分。評價前,培訓和預評價研究者對 AMSTAR 和 PRISMA 評價量表的理解,統一標準。正式評價時,由 2 名研究者進行獨立評價,然后交叉核對,遇到分歧時通過討論或與第三位研究者商定。
1.5 統計分析
采用 SPSS 19.0 軟件進行統計分析,采用 SigmaPlot 軟件制作統計圖。本研究涉及的計數資料采用頻數及構成比表示;AMSTAR 與 PRISMA 評分結果經正態分布檢驗服從正態分布,采用均數±標準差表示。
2 結果
2.1 文獻篩選流程及結果
根據預先制定的檢索策略共檢索到相關文獻 600 篇,經層層篩選,最終納入 18 篇文獻[8-25]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本特征
國內社區干預系統評價文獻總體數量較少,在 2014 年后發表數量逐漸增多,以高血壓、糖代謝異常和重性精神病的研究為主。納入研究中,僅 38.9% 有科研項目資助,被引頻次整體較低。文獻檢索方面,以主題詞檢索為主,50% 的研究僅檢索了中文數據庫。文獻質量評估時,多采用 Cochrane 協作網推薦的偏倚風險評價工具和 Jadad 評分量表。大多數(83.3%)社區干預系統評價未限定納入研究的干預時間,所有系統評價的納入研究均未報道干預措施引起的不良事件或存在的問題。尚無對已有系統評價的更新。結果見表 1。

2.3 國內社區干預研究系統評價的方法學質量
方法學質量評價結果見表 2,納入研究的 AMSTAR 評分最低為 2 分,最高為 8 分,平均為 4.67±1.68 分。大部分研究(83.3%)在納入研究選擇和資料提取的可重復性、納入研究特征描述和研究質量評價方面符合 AMSTAR 評分標準;但不足 50% 文獻在文獻檢索、結果合并方法和發表偏倚評估方面符合方法學要求;83.3% 納入研究沒有提供前期設計方案;88.9% 的納入標準未考慮灰色文獻;所有納入研究均未提供排除文獻清單;也未說明系統評價析及納入研究的利益沖突。

2.4 國內社區干預研究系統評價的報告質量
納入研究的報告質量評價結果見表 3,PRISMA 評分最低為 10.5 分,最高為 22 分,平均為 16.42±3.65 分。整體而言,大部分研究在條目 1、7、9、10、12、13、18、19、20 和 23 方面,均符合 PRISMA 評價量表。尚無一項研究完全符合 PRISMA 評分要求。在摘要部分,所有納入研究均只部分報道了研究背景、資料來源、納入研究標準或局限性等。在目的部分,許多研究未按照 PICO 標準描述研究目的。在方法部分,所有研究均未提供方案和注冊,大多數研究未詳細描述檢索策略(94.4%)和提取資料信息的界定(72.2%),部分納入研究的結果合并方法不妥,部分研究沒有提及發表偏倚或是否進行其他分析(如敏感性分析或 Meta 回歸分析等)。在結果部分,部分研究(55.6%)未報告發表偏倚,大部分研究(72.2%)文獻篩選報告僅采用簡單文字描述,66.1% 的研究在發現異質性后,未探索異質性原因直接采用隨機效應模型。在結論部分,大部分研究對證據總結、局限性及結論的報道不充分。在資金支持部分,僅部分研究報告了自身的項目資助情況,但均未闡述納入研究和該系統評價本身的利益沖突。

3 討論
3.1 國內社區干預系統評價研究的現狀
國務院于 2006 年下發了《國務院關于發展城市社區衛生服務的指導意見》(國發[2006]10 號),明確了社區衛生服務在衛生工作中的重要地位,及其對促進國民健康、減輕醫療費用負擔和建立和諧醫患關系的重要意義。2009 年,原國家衛生部也在 Lancet 上發表了我國醫療衛生改革計劃[26]。此后,我國社區衛生服務取得了較快發展,關于健康問題的社區管理或干預研究也顯著增加。本研究發現,國內社區干預的系統評價文獻總體較少,但在 2014 年以后發表數量逐漸增多,說明隨著社區衛生服務的發展,我國社區干預的研究也逐漸完善。從研究內容來看,納入研究主要以高血壓和糖代謝異常的研究為主。這與目前社區常見慢性病的管理目標相一致[26]。但是,社區衛生服務的對象廣泛,疾病繁多,涉及特殊人群和多種急、慢性病的管理。因此,有待進一步開展特殊人群社區管理及其他常見病社區干預的研究。本研究還發現,僅少數社區干預研究有科研項目資助,被引頻次整體較低。我們認為,社區衛生服務起步晚、科研項目資助少是社區干預研究證據較少的主要原因,因而呼吁相關部門給予社區相關研究更多的資金和政策資助,以科研促社區衛生服務發展。
此外,大多數社區干預研究采取社區綜合干預措施,主要包括健康教育、用藥指導、運動干預、心理干預、飲食指導、隨訪和疾病監測等,且大部分系統評價的納入研究未限定干預時間,也未報告社區干預帶來的問題或實施存在的實際困難。我們認為:① 針對不同疾病的社區干預方式應有所不同,或按疾病的特點不同有所側重;② 慢性病社區干預的效果與干預時間密切相關,因此在進行系統評價時應界定干預時間;③ 原始研究應該盡可能報道干預過程中的出現不良事件或存在的困難,這對進一步研究或決策制定具有重要的參考意義。本研究發現,13 篇系統評價被引頻次小于 5 次,占總納入研究數量的比重較大。進一步分析結果發現,研究的疾病種類對引用頻次的影響沒有顯著的統計學差異,這也可能與納入的文獻數量較少有關;但是,中文核心期刊收錄的文章被引頻次顯著高于非核心期刊收錄的文章,這可能與國內學者對中文核心期刊論文質量的認可度有關。
3.2 國內社區干預研究的方法學和報告質量
系統評價被認為是最佳證據的來源,但只有高質量的系統評價才能為相關決策者提供科學證據[27]。因此,對系統評價進行方法學和報告質量評價,有助于更客觀、科學地評判證據和推薦意見級別,作出合理的決策[6, 7]。本研究發現,社區干預研究系統評價方法學和報告質量整體相對較低,這與國內護理和中醫領域的結果較為一致[28, 29]。
社區干預研究系統評價方法學質量較差的原因,一是大部分納入研究在文獻檢索、結果合并方法和發表偏倚評估方面不符合規范要求(如文獻檢索不全面,未探討異質性來源便采用隨機效應模型合并結果,以及未評估發表偏倚等);二是大部分納入研究沒有提供前期設計方案,或在設計納入標準時未考慮納入灰色文獻;三是所有納入研究均未提供排除文獻清單,也未說明系統評價及納入研究的利益沖突。進一步對 AMSTAR 評分較低的研究進行分析發現,作者多為基層衛生服務機構工作人員。據此推測,缺乏循證醫學培訓可能是導致社區干預研究證據方法學質量較低的原因之一,建議相關部門開展“循證醫學培訓下基層”,培養基層衛生機構工作人員評價和運用證據的能力。
社區干預研究系統評價報告質量還存在以下報告問題:① 具體內容未報道或者不充分:大部分研究摘要未報道資料來源、納入標準或局限性,研究目的陳述也未體現 PICO 標準;大多數研究未提供檢索策略和提取資料信息的界定,也未闡述納入研究和系統評價的利益沖突。② 部分內容報道有誤:部分納入研究的結果綜合合并方法不妥,在發現異質性后,未進行異質性原因探索直接采用隨機效應模型分析;大部分社區干預研究系統評價雖然評價了納入研究質量,但是在證據總結和局限性陳述時未提及研究質量對系統評價結果的影響。PRISMA 規范一方面可以規范系統評價的報告內容,另一方面也可以指導作者正確實施系統評價。因此,建議社區干預研究系統評價作者在撰稿、學術期刊審稿時,采用 PRISMA 規范完善文章內容,從而保證研究報告的準確性和完整性,以供醫務工作者或管理者綜合考量研究結果并做出合理的決策。
本研究的局限性:首先,為探討我國社區干預證據的特點和質量,本文僅納入了基于中國人群社區干預的系統評價,可能存在選擇性偏倚;其次,研究質量評價完全依靠納入研究報道內容,可能存在因原文作者未報道而引起的偏倚。
綜上所述,本文系統分析了我國社區干預證據研究的方法學質量和報告質量,初步探討我國社區干預證據研究的現狀和存在的問題。我們建議未來應進一步開展特殊人群、其他常見病社區干預的證據研究;為保證研究質量,應注意研究結果合并方法的正確性、單個研究質量及發表偏倚的評估;為保障相關決策者科學合理利用證據,證據報告應遵循 PRISMA 規范。
社區衛生服務可提供預防保健、就診轉診及健康照護服務,滿足社區人群的基本醫療服務需求,節約大量的醫療資源[1, 2]。由于我國社區衛生服務起步較晚,社區衛生服務機構存在醫務人員配備不足、基本醫療設施配置不齊等問題,使得健康問題的社區管理尚存在諸多困難和問題[3]。對此,許多學者基于國內現狀開展了相關的研究,為衛生管理部門及基層衛生服務機構開展工作提供了證據。但是,往往單個研究的檢驗效能較低,隨機誤差較大,且研究結論因人群、地區和時間等因素具有一定的局限性;而系統評價/Meta 分析(統稱為系統評價)可對多個同類研究有爭議或矛盾的結果進行整合分析[4]。系統評價的方法學質量和報告質量會大大影響其結果的可靠性,繼而影響臨床治療或社區管理決策[5]。但目前尚無對我國社區干預系統評價的特點、方法學和報告質量的評價。因此,本研究對我國社區干預系統評價的方法學和報告質量進行評價,以期為社區衛生服務實踐及研究提供參考資料。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
系統評價或 Meta 分析。
1.1.2 研究對象
中國人群。
1.1.3 干預措施
社區干預或社區管理,采用綜合干預方式的社區護理干預研究。
1.1.4 結局指標
相關疾病治療率、控制率、知識知曉率和病情監測指標等。
1.1.5 排除標準
① 非中、英文文獻;② 重復發表的文獻;③ 單一干預方法的研究(如僅采用健康教育或運動等);④ 缺乏相關數據,聯系作者也無法獲取者。
1.2 文獻檢索策略
計算機檢索 The Cochrane Library、PubMed、EMbase、Web of Science、CNKI、VIP、WanFang Data 和 CBM 數據庫,搜集公開發表的國內社區干預 Meta 分析或系統評價,檢索時限為建庫至 2017 年 8 月 3 日。中文檢索詞包括:社區干預、社區管理、社區預防、系統評價、Meta 分析、薈萃分析;英文檢索詞包括:community intervention、community-based intervention、systematic review、meta-analyses 和 meta-analysis。以 CNKI 為例,檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:發表年份、基金支持、干預方式、干預疾病、文獻檢索方法、檢索數據庫和被引次數等。
1.4 納入研究的質量評價
采用 AMSTAR 和 PRISMA 量表分別評價納入研究的方法學和報告質量。AMSTAR 量表[6]包括 11 個條目,每個條目的計分為:“是”=1 分,“否”=0 分,“不清楚”或“不適用”=0 分。PRISMA 量表[7]包括 7 個部分 27 個條目,每個條目的計分為:“充分”=1 分,“部分符合”=0.5 分,“不符合”=0 分。評價前,培訓和預評價研究者對 AMSTAR 和 PRISMA 評價量表的理解,統一標準。正式評價時,由 2 名研究者進行獨立評價,然后交叉核對,遇到分歧時通過討論或與第三位研究者商定。
1.5 統計分析
采用 SPSS 19.0 軟件進行統計分析,采用 SigmaPlot 軟件制作統計圖。本研究涉及的計數資料采用頻數及構成比表示;AMSTAR 與 PRISMA 評分結果經正態分布檢驗服從正態分布,采用均數±標準差表示。
2 結果
2.1 文獻篩選流程及結果
根據預先制定的檢索策略共檢索到相關文獻 600 篇,經層層篩選,最終納入 18 篇文獻[8-25]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本特征
國內社區干預系統評價文獻總體數量較少,在 2014 年后發表數量逐漸增多,以高血壓、糖代謝異常和重性精神病的研究為主。納入研究中,僅 38.9% 有科研項目資助,被引頻次整體較低。文獻檢索方面,以主題詞檢索為主,50% 的研究僅檢索了中文數據庫。文獻質量評估時,多采用 Cochrane 協作網推薦的偏倚風險評價工具和 Jadad 評分量表。大多數(83.3%)社區干預系統評價未限定納入研究的干預時間,所有系統評價的納入研究均未報道干預措施引起的不良事件或存在的問題。尚無對已有系統評價的更新。結果見表 1。

2.3 國內社區干預研究系統評價的方法學質量
方法學質量評價結果見表 2,納入研究的 AMSTAR 評分最低為 2 分,最高為 8 分,平均為 4.67±1.68 分。大部分研究(83.3%)在納入研究選擇和資料提取的可重復性、納入研究特征描述和研究質量評價方面符合 AMSTAR 評分標準;但不足 50% 文獻在文獻檢索、結果合并方法和發表偏倚評估方面符合方法學要求;83.3% 納入研究沒有提供前期設計方案;88.9% 的納入標準未考慮灰色文獻;所有納入研究均未提供排除文獻清單;也未說明系統評價析及納入研究的利益沖突。

2.4 國內社區干預研究系統評價的報告質量
納入研究的報告質量評價結果見表 3,PRISMA 評分最低為 10.5 分,最高為 22 分,平均為 16.42±3.65 分。整體而言,大部分研究在條目 1、7、9、10、12、13、18、19、20 和 23 方面,均符合 PRISMA 評價量表。尚無一項研究完全符合 PRISMA 評分要求。在摘要部分,所有納入研究均只部分報道了研究背景、資料來源、納入研究標準或局限性等。在目的部分,許多研究未按照 PICO 標準描述研究目的。在方法部分,所有研究均未提供方案和注冊,大多數研究未詳細描述檢索策略(94.4%)和提取資料信息的界定(72.2%),部分納入研究的結果合并方法不妥,部分研究沒有提及發表偏倚或是否進行其他分析(如敏感性分析或 Meta 回歸分析等)。在結果部分,部分研究(55.6%)未報告發表偏倚,大部分研究(72.2%)文獻篩選報告僅采用簡單文字描述,66.1% 的研究在發現異質性后,未探索異質性原因直接采用隨機效應模型。在結論部分,大部分研究對證據總結、局限性及結論的報道不充分。在資金支持部分,僅部分研究報告了自身的項目資助情況,但均未闡述納入研究和該系統評價本身的利益沖突。

3 討論
3.1 國內社區干預系統評價研究的現狀
國務院于 2006 年下發了《國務院關于發展城市社區衛生服務的指導意見》(國發[2006]10 號),明確了社區衛生服務在衛生工作中的重要地位,及其對促進國民健康、減輕醫療費用負擔和建立和諧醫患關系的重要意義。2009 年,原國家衛生部也在 Lancet 上發表了我國醫療衛生改革計劃[26]。此后,我國社區衛生服務取得了較快發展,關于健康問題的社區管理或干預研究也顯著增加。本研究發現,國內社區干預的系統評價文獻總體較少,但在 2014 年以后發表數量逐漸增多,說明隨著社區衛生服務的發展,我國社區干預的研究也逐漸完善。從研究內容來看,納入研究主要以高血壓和糖代謝異常的研究為主。這與目前社區常見慢性病的管理目標相一致[26]。但是,社區衛生服務的對象廣泛,疾病繁多,涉及特殊人群和多種急、慢性病的管理。因此,有待進一步開展特殊人群社區管理及其他常見病社區干預的研究。本研究還發現,僅少數社區干預研究有科研項目資助,被引頻次整體較低。我們認為,社區衛生服務起步晚、科研項目資助少是社區干預研究證據較少的主要原因,因而呼吁相關部門給予社區相關研究更多的資金和政策資助,以科研促社區衛生服務發展。
此外,大多數社區干預研究采取社區綜合干預措施,主要包括健康教育、用藥指導、運動干預、心理干預、飲食指導、隨訪和疾病監測等,且大部分系統評價的納入研究未限定干預時間,也未報告社區干預帶來的問題或實施存在的實際困難。我們認為:① 針對不同疾病的社區干預方式應有所不同,或按疾病的特點不同有所側重;② 慢性病社區干預的效果與干預時間密切相關,因此在進行系統評價時應界定干預時間;③ 原始研究應該盡可能報道干預過程中的出現不良事件或存在的困難,這對進一步研究或決策制定具有重要的參考意義。本研究發現,13 篇系統評價被引頻次小于 5 次,占總納入研究數量的比重較大。進一步分析結果發現,研究的疾病種類對引用頻次的影響沒有顯著的統計學差異,這也可能與納入的文獻數量較少有關;但是,中文核心期刊收錄的文章被引頻次顯著高于非核心期刊收錄的文章,這可能與國內學者對中文核心期刊論文質量的認可度有關。
3.2 國內社區干預研究的方法學和報告質量
系統評價被認為是最佳證據的來源,但只有高質量的系統評價才能為相關決策者提供科學證據[27]。因此,對系統評價進行方法學和報告質量評價,有助于更客觀、科學地評判證據和推薦意見級別,作出合理的決策[6, 7]。本研究發現,社區干預研究系統評價方法學和報告質量整體相對較低,這與國內護理和中醫領域的結果較為一致[28, 29]。
社區干預研究系統評價方法學質量較差的原因,一是大部分納入研究在文獻檢索、結果合并方法和發表偏倚評估方面不符合規范要求(如文獻檢索不全面,未探討異質性來源便采用隨機效應模型合并結果,以及未評估發表偏倚等);二是大部分納入研究沒有提供前期設計方案,或在設計納入標準時未考慮納入灰色文獻;三是所有納入研究均未提供排除文獻清單,也未說明系統評價及納入研究的利益沖突。進一步對 AMSTAR 評分較低的研究進行分析發現,作者多為基層衛生服務機構工作人員。據此推測,缺乏循證醫學培訓可能是導致社區干預研究證據方法學質量較低的原因之一,建議相關部門開展“循證醫學培訓下基層”,培養基層衛生機構工作人員評價和運用證據的能力。
社區干預研究系統評價報告質量還存在以下報告問題:① 具體內容未報道或者不充分:大部分研究摘要未報道資料來源、納入標準或局限性,研究目的陳述也未體現 PICO 標準;大多數研究未提供檢索策略和提取資料信息的界定,也未闡述納入研究和系統評價的利益沖突。② 部分內容報道有誤:部分納入研究的結果綜合合并方法不妥,在發現異質性后,未進行異質性原因探索直接采用隨機效應模型分析;大部分社區干預研究系統評價雖然評價了納入研究質量,但是在證據總結和局限性陳述時未提及研究質量對系統評價結果的影響。PRISMA 規范一方面可以規范系統評價的報告內容,另一方面也可以指導作者正確實施系統評價。因此,建議社區干預研究系統評價作者在撰稿、學術期刊審稿時,采用 PRISMA 規范完善文章內容,從而保證研究報告的準確性和完整性,以供醫務工作者或管理者綜合考量研究結果并做出合理的決策。
本研究的局限性:首先,為探討我國社區干預證據的特點和質量,本文僅納入了基于中國人群社區干預的系統評價,可能存在選擇性偏倚;其次,研究質量評價完全依靠納入研究報道內容,可能存在因原文作者未報道而引起的偏倚。
綜上所述,本文系統分析了我國社區干預證據研究的方法學質量和報告質量,初步探討我國社區干預證據研究的現狀和存在的問題。我們建議未來應進一步開展特殊人群、其他常見病社區干預的證據研究;為保證研究質量,應注意研究結果合并方法的正確性、單個研究質量及發表偏倚的評估;為保障相關決策者科學合理利用證據,證據報告應遵循 PRISMA 規范。