引用本文: 徐桂興, 李涓, 銀子涵, 李雨谿, 付亞男, 周俊, 梁繁榮. 針刺治療原發性抑郁癥系統評價的方法學質量及適用性評價. 中國循證醫學雜志, 2019, 19(11): 1333-1340. doi: 10.7507/1672-2531.201903092 復制
抑郁癥是由多種原因導致的精神疾病,臨床表現為持續心情抑郁、思維遲鈍、興趣減退、意志活動減少,并伴有焦慮不安、食欲減退、性功能減退、睡眠障礙等癥狀[1]。隨著社會競爭越來越激烈,抑郁癥的發病率逐年增高,在年滿 20 歲的成年人中,抑郁癥患者正以每年 11.3% 的速率增加[2]。抑郁癥被認為是全球疾病負擔的十大病種之一。據 WHO 估計,到 2020 年,抑郁癥或將成為全球第二大疾病負擔[3]。目前抑郁癥的治療多采用西藥干預,雖然這些藥物能夠緩解患者的抑郁情緒,但幾乎都會帶來不同程度的不良反應,影響患者心血管、消化、內分泌等系統的穩態[4],若長期大劑量服用抗抑郁藥物,不僅可產生耐藥性,抑制性功能,還可引起單胺類遞質合成障礙,導致抑郁的復發甚至加重。新近發布的 Meta 分析結果顯示,與安慰劑相比,大部分抗抑郁藥物在改善患者的精神狀態方面并沒有優勢[5, 6]。
高質量的證據一直是循證醫學實踐的基石,系統評價作為對原始研究的證據整合,一直被認為具有高質量和可信度。但由于原始研究的質量和系統評價者對證據合成的理解差異,導致目前系統評價質量的差異很大,從而對臨床醫生決策的影響不一。系統評價再評價是根據一定的標準對已有的某疾病治療、診斷等方面的系統評價進行再次綜合評定的方法[7]。因系統評價再評價納入的本就是已具有較高質量的數據整合的證據,再評價得出的結論針對性更強,故系統評價再評價對納入的系統評價的質量需要進行嚴格評價,從而避免各種可能潛在的偏倚。
目前已有的針灸治療原發性抑郁癥的系統評價結果顯示,針灸對抑郁癥的療效存在爭議,研究結果間存在較大差異,甚至結論相反,導致臨床對于針灸治療抑郁癥療效仍不確定。之前也有外國學者在 2011 年對針刺治療抑郁癥的系統評價進行過質量評價,但僅采用了 OQAQ 量表(Overview Quality Assessment Questionnaire,OQAQ),其主要關注系統評價中容易產生偏倚的幾方面,未全面對其方法學質量和證據本體進行評價。且近年來新增了多項關于針刺治療原發性抑郁癥的系統評價,參考已有研究的建議[8],本研究選擇 AMSTAR 2(Assessment of Multiple Systematic ReviewsⅡ) 清單、ROBIS(Risk of Bias in Systematic Review)清單和 CASP-S.R(Critical Appraisal Skill Program in Systematic Review)清單來全面評價針刺治療原發性抑郁癥系統評價的方法學質量及其適用性,以期為未來開展高質量針刺治療原發性抑郁癥研究提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
針刺治療原發性抑郁癥的系統評價和 Meta 分析。
1.1.2 研究對象
原發性抑郁癥患者,其年齡、種族和性別等不限。
1.1.3 干預措施
試驗組:針刺、電針、耳針、溫針、頭皮針等或聯合使用;對照組:西藥、安慰劑和假針刺。
1.1.4 結局指標
① 總有效率;② 漢密爾頓抑郁量表;③ 抑郁自評量表;④ 不良反應等。
1.1.5 排除標準
① 重復發表的文獻;② 非中英文文獻;③ 質量評價或方法學研究的文獻;④ 系統評價計劃書。
1.2 文獻檢索策略
計算機檢索 Web of Science、EMBase、PubMed、The Cochrane Library、CNKI、CBM、WanFang Data 和 VIP 數據庫,檢索時限均從建庫至 2018 年 12 月 5 日。中文檢索詞包括:針灸、針刺、電針、溫針、頭皮針、耳針、穴位、抑郁癥、郁證、抑郁、系統評價、系統綜述、Meta 分析和薈萃分析等;英文檢索詞包括:acupuncture、electropuncture、auricular acupuncture、warm acupuncture、scalp acupuncture、systematic evaluation、systematic assessment、systematic review、meta-analysis、tristimania、depression。以 CNKI 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入研究的基本信息,包括研究題目、第一作者、發表時間、文獻數量等;② 研究對象的基線特征;③ 干預措施的具體細節;④ 質量評價的關鍵要素,包括 AMSTAR 2 工具條目、ROBIS 工具條目、CASP-S.R 條目工具等;⑤ 所關注的結局指標和結果測量數據。
1.4 方法學質量評價方法和適用性評價
根據 AMSTAR 2 清單[9, 10]的 16 個條目對針刺治療原發性抑郁癥系統評價的方法學質量進行評價。每個條目均采用“是”、“否”和“部分是”進行描述,“是”得 2 分,“否”得 0 分,“部分是”得 1 分。采用 AMSTAR 2 總分評價系統評價的總體質量:23~32 分為高質量研究;13~22 分為中等質量研究;0~12 分為低質量研究。
應用 ROBIS 工具評價納入研究的偏倚風險,使用“是”、“否”和“不清楚”評價每一條目,最后根據整體評價結果,評價每個研究的偏倚風險[11, 12]。
采用 CASP-S.R 清單中研究結果是否適用條目評價納入研究的適用性,每個條目均采用“是”、“否”和“不清楚”進行描述,最后統計納入所有系統評價的各條目報道次數。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻 530 篇,經逐層篩選后,最終納入 18 篇系統評價/Meta 分析。文獻篩選流程見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表 1。共納入 18 篇文獻[13-30],包括 12 篇中文文獻[13-24]和 6 篇英文文獻[25-30]。其中會議論文 1 篇[13],1 篇博士學位論文[14],1 篇碩士學位論文[15],15 篇為期刊公開發表文獻[16-30],發表時間為 2005 年至 2017 年,其中以 2017 年最多(4 篇),治療組干預措施為針刺、電針、手針、耳針、激光針、頭針或針灸聯合西藥,對照組多用西藥、安慰劑、假針刺、安慰針等。大部分研究認為針刺與西藥療效相當,但結果存在較大的異質性。

2.3 納入研究的方法學質量評價結果
AMSTAR 2 工具評價結果見表 2,包括高質量研究 3 篇(16.6%),中等質量研究 12 篇(66.7%),低質量研究 3 篇(16.6%)。高質量研究中 2 篇[22, 26]為 24 分,一篇[15]為 26 分,中等質量研究得分在 14~21 分之間。

ROBIS 清單評價結果見圖 2,結果顯示,低偏倚風險研究 4 篇(22.2%),中偏倚風險研究 7 篇(38.9%),高低偏倚風險研究 7 篇(38.9%)。在具體條目中,影響研究的偏倚主要存在于所有目前納入的研究均未進行注冊,對其預定的研究方案不清楚;文獻檢索方面,僅 7 篇(38.9%)的研究屬于低偏倚風險;在數據合成過程中對異質性的處理上,僅 5 篇(27.8%)的研究屬于低偏倚風險;在數據提取與文獻質量評價方面,僅 4 篇(22.2%)的研究屬于低偏倚風險。

a:納入研究存在偏倚的具體方面;b:納入研究偏倚風險總結
2.4 納入研究的研究結果適用性評價結果
根據 CASP-S.R 中關于研究結果是否適用的領域評價顯示:4 篇(22.2%)的研究可能是適用于當地人群,并且所有研究均未設計獲益與成本危害之間的關系,大部分研究(83.3%)都考慮了重要的結局指標(表 3)。

3 討論
目前對抑郁癥的發病機制缺乏統一的認識,在針刺治療抑郁時的選穴與辯證也存在爭議,針刺治療的臨床效果也受到質疑,限制了針刺療法的特色與優勢展現。盡管針刺治療原發性抑郁癥的系統評價很多,但結論不盡相同[13, 27]。因此對針刺治療抑郁癥的系統評價進行再評價刻不容緩。目前進行再評價的工具很多,如 AMSTAR 2、CASP、OQAQ、Sack’s quality assessment checklist(SQAC)和 Quality of reporting of meta-analysis(QUOROM)等是主要的工具[8]。本研究根據量表評價的內容選用常用的 AMSTAR 2,CASP 工具評價納入研究的方法學質量以及臨床適用性,同時針對研究是否存在偏倚采用 ROBIS 量表進行評價[11]。
本研究結果發現針刺治療原發性抑郁癥的系統評價在方法學質量方面,12 篇為中等質量研究,3 篇為高質量研究,3 篇為低質量研究。所有系統評價均未提供前期注冊方案;10.6% 的研究文獻篩選和數據提取不具有可重復性,這極大影響研究的質量;所有研究都進行了多數據庫的檢索,但只有 15.8% 的研究考慮了灰色文獻,對研究結果的準確性造成了一定的影響;只有 15.8% 的研究提供了所有納入排除文獻的清單;有 1 項研究未對文獻的科學性進行評價;26.3% 的研究未評估發表偏倚;77.8% 的研究未進行偏倚風險評價或者評價工具不完全適用;83.3% 的研究在進行 Meta 分析時未考慮納入研究的質量或者偏倚風險對分析或其他證據整合的影響;72.2% 的研究在進行結果解釋或者討論時,未考慮納入研究的偏倚風險;52.6% 的研究未說明研究是否涉及相關利益沖突。這些都是針刺治療原發性抑郁癥系統評價質量不高的原因。對臨床研究進行注冊可以有效地減少研究者在研究過程中根據結果改變研究計劃的情況發生,從而減少研究的偏倚,使得研究結果更加可信。進行系統評價的研究,主要是利用已有的原始研究的數據進行二次整合,因此,對原始研究的收集與數據提取就顯得尤為重要。數據庫的選擇和檢索策略的制定是一個系統評價能夠做好的第一步,但在針刺治療原發性抑郁癥的系統評價研究中,大部分的研究在檢索上就出現了很多問題,主要是對于灰色文獻的考慮不足。而大部分的灰色文獻主要是一些陰性結果的研究,如未對灰色文獻進行考慮,其對研究結果的影響就是夸大干預的療效,出現更多的陽性結果。同時還存在部分研究在進行文獻篩選、數據提取與文獻質量評價時由一個人完成所有工作,這將增加研究過程中的誤差以及增加研究者主觀意愿對結果的影響,使得研究的偏倚進一步增加。在偏倚風險評估方面,大部分研究均沒有進行有效評價,直接影響研究結果的可信度。這些在系統評價/Meta 分析中存在的不足,將極大影響研究結果的準確性,影響研究結果在臨床實踐中的使用。針對這些問題的存在,本研究建議今后進行系統評價的研究者應提前設計好研究方案,并對所要進行的研究進行注冊,同時在對研究結果進行報道時,應該遵循 PRISMA 報告規范,對研究過程進行細致的報道,增加研究的科學性和可信度。
本研究的偏倚風險評價結果發現,61.2% 的研究存在偏倚,原因主要在研究注冊、文獻檢索、數據的綜合與解讀上。因為對研究的前期設計缺少相關信息,因此我們不清楚研究是否完全根據預先設定的方案進行,在很大程度上增加了研究的偏倚風險。其次就是文獻檢索,其主要問題在 AMSTAR 2 部分條目已經討論。最后是研究的重要部分,數據綜合與結果的解讀,本研究在進行數據提取時發現部分(11.1%)文獻在進行數據綜合時所選用的數據合并方法有問題,在有較高異質性時依舊選擇固定效應模型,其大大增加了出現陽性結果的可能性;大部分研究在有異質性存在的情況下(83.3%)未進行敏感性分析,導致異質性對于結果穩定性影響如何并不清楚。同時在進行結果解讀時,部分研究使用顯著性差異等用語,僅強調有統計學意義的結果。針對這些問題,在 Meta 分析時,應該進行較為保守的數據綜合方式,即在研究存在一定異質性時可以考慮采用隨機效應模型,并且對于異質性的來源是研究結果當中應當重要呈現的內容,同時在進行結果陳述時注意統計結果的表達方式。
本研究還根據 CASP-S.R 清單對針刺治療原發性抑郁癥的適用性進行了評價,發現僅 38.9% 的研究可能適用于當地人群(僅檢索國內數據庫),但都沒有考慮針刺干預的獲益與成本之間的關系問題。因此在今后的研究中,建議能夠根據人種或者地區等的不同進行亞組分析,以提高研究結果的外部真實性,同時建議在研究中考慮到衛生經濟學等方面的內容,以提供全面的信息供臨床醫生和患者選擇。
本研究存在的局限性:① 納入研究語言限制在中英文,可能出現檢索數據不全的情況,從而對研究產生影響;② 檢索時間被限定,可能出現新的研究影響本結果;③ 納入的大部分研究的干預措施復雜,影響臨床應用;④ 本研究評價者的主觀性對結果的影響;⑤ 本研究未進行數據綜合,只進行了定性分析,無法定量得出研究結果。
綜上所述,針刺治療原發性抑郁癥的系統評價屬于中等質量水平,在改進方法學及提高研究結果的適用性上有很大空間。因此筆者建議:一方面,今后研究者在制作系統評價時,其方法學要根據 AMSTAR 2 清單進行,從而提高系統評價結果的可信度和科學性,同時能夠考慮衛生經濟學方面的研究內容,以供醫生與患者更好的決策,在報告結果時根據 PRISMA 報告規范。另一方面,原始研究的質量直接影響其結局指標的評定,其原因與針刺的操作手法及腧穴配伍有著很大程度的關系,在針刺過程中實施盲法是很困難的。因此,我們研究人員在不斷完善試驗設計的同時應當將中醫臨床辯證、針灸診療的特色與現代的臨床隨機對照試驗相結合,產生更多的具有中醫特色的高質量、科學和精確的臨床證據。
聲明:本研究無任何利益沖突。
抑郁癥是由多種原因導致的精神疾病,臨床表現為持續心情抑郁、思維遲鈍、興趣減退、意志活動減少,并伴有焦慮不安、食欲減退、性功能減退、睡眠障礙等癥狀[1]。隨著社會競爭越來越激烈,抑郁癥的發病率逐年增高,在年滿 20 歲的成年人中,抑郁癥患者正以每年 11.3% 的速率增加[2]。抑郁癥被認為是全球疾病負擔的十大病種之一。據 WHO 估計,到 2020 年,抑郁癥或將成為全球第二大疾病負擔[3]。目前抑郁癥的治療多采用西藥干預,雖然這些藥物能夠緩解患者的抑郁情緒,但幾乎都會帶來不同程度的不良反應,影響患者心血管、消化、內分泌等系統的穩態[4],若長期大劑量服用抗抑郁藥物,不僅可產生耐藥性,抑制性功能,還可引起單胺類遞質合成障礙,導致抑郁的復發甚至加重。新近發布的 Meta 分析結果顯示,與安慰劑相比,大部分抗抑郁藥物在改善患者的精神狀態方面并沒有優勢[5, 6]。
高質量的證據一直是循證醫學實踐的基石,系統評價作為對原始研究的證據整合,一直被認為具有高質量和可信度。但由于原始研究的質量和系統評價者對證據合成的理解差異,導致目前系統評價質量的差異很大,從而對臨床醫生決策的影響不一。系統評價再評價是根據一定的標準對已有的某疾病治療、診斷等方面的系統評價進行再次綜合評定的方法[7]。因系統評價再評價納入的本就是已具有較高質量的數據整合的證據,再評價得出的結論針對性更強,故系統評價再評價對納入的系統評價的質量需要進行嚴格評價,從而避免各種可能潛在的偏倚。
目前已有的針灸治療原發性抑郁癥的系統評價結果顯示,針灸對抑郁癥的療效存在爭議,研究結果間存在較大差異,甚至結論相反,導致臨床對于針灸治療抑郁癥療效仍不確定。之前也有外國學者在 2011 年對針刺治療抑郁癥的系統評價進行過質量評價,但僅采用了 OQAQ 量表(Overview Quality Assessment Questionnaire,OQAQ),其主要關注系統評價中容易產生偏倚的幾方面,未全面對其方法學質量和證據本體進行評價。且近年來新增了多項關于針刺治療原發性抑郁癥的系統評價,參考已有研究的建議[8],本研究選擇 AMSTAR 2(Assessment of Multiple Systematic ReviewsⅡ) 清單、ROBIS(Risk of Bias in Systematic Review)清單和 CASP-S.R(Critical Appraisal Skill Program in Systematic Review)清單來全面評價針刺治療原發性抑郁癥系統評價的方法學質量及其適用性,以期為未來開展高質量針刺治療原發性抑郁癥研究提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
針刺治療原發性抑郁癥的系統評價和 Meta 分析。
1.1.2 研究對象
原發性抑郁癥患者,其年齡、種族和性別等不限。
1.1.3 干預措施
試驗組:針刺、電針、耳針、溫針、頭皮針等或聯合使用;對照組:西藥、安慰劑和假針刺。
1.1.4 結局指標
① 總有效率;② 漢密爾頓抑郁量表;③ 抑郁自評量表;④ 不良反應等。
1.1.5 排除標準
① 重復發表的文獻;② 非中英文文獻;③ 質量評價或方法學研究的文獻;④ 系統評價計劃書。
1.2 文獻檢索策略
計算機檢索 Web of Science、EMBase、PubMed、The Cochrane Library、CNKI、CBM、WanFang Data 和 VIP 數據庫,檢索時限均從建庫至 2018 年 12 月 5 日。中文檢索詞包括:針灸、針刺、電針、溫針、頭皮針、耳針、穴位、抑郁癥、郁證、抑郁、系統評價、系統綜述、Meta 分析和薈萃分析等;英文檢索詞包括:acupuncture、electropuncture、auricular acupuncture、warm acupuncture、scalp acupuncture、systematic evaluation、systematic assessment、systematic review、meta-analysis、tristimania、depression。以 CNKI 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入研究的基本信息,包括研究題目、第一作者、發表時間、文獻數量等;② 研究對象的基線特征;③ 干預措施的具體細節;④ 質量評價的關鍵要素,包括 AMSTAR 2 工具條目、ROBIS 工具條目、CASP-S.R 條目工具等;⑤ 所關注的結局指標和結果測量數據。
1.4 方法學質量評價方法和適用性評價
根據 AMSTAR 2 清單[9, 10]的 16 個條目對針刺治療原發性抑郁癥系統評價的方法學質量進行評價。每個條目均采用“是”、“否”和“部分是”進行描述,“是”得 2 分,“否”得 0 分,“部分是”得 1 分。采用 AMSTAR 2 總分評價系統評價的總體質量:23~32 分為高質量研究;13~22 分為中等質量研究;0~12 分為低質量研究。
應用 ROBIS 工具評價納入研究的偏倚風險,使用“是”、“否”和“不清楚”評價每一條目,最后根據整體評價結果,評價每個研究的偏倚風險[11, 12]。
采用 CASP-S.R 清單中研究結果是否適用條目評價納入研究的適用性,每個條目均采用“是”、“否”和“不清楚”進行描述,最后統計納入所有系統評價的各條目報道次數。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻 530 篇,經逐層篩選后,最終納入 18 篇系統評價/Meta 分析。文獻篩選流程見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表 1。共納入 18 篇文獻[13-30],包括 12 篇中文文獻[13-24]和 6 篇英文文獻[25-30]。其中會議論文 1 篇[13],1 篇博士學位論文[14],1 篇碩士學位論文[15],15 篇為期刊公開發表文獻[16-30],發表時間為 2005 年至 2017 年,其中以 2017 年最多(4 篇),治療組干預措施為針刺、電針、手針、耳針、激光針、頭針或針灸聯合西藥,對照組多用西藥、安慰劑、假針刺、安慰針等。大部分研究認為針刺與西藥療效相當,但結果存在較大的異質性。

2.3 納入研究的方法學質量評價結果
AMSTAR 2 工具評價結果見表 2,包括高質量研究 3 篇(16.6%),中等質量研究 12 篇(66.7%),低質量研究 3 篇(16.6%)。高質量研究中 2 篇[22, 26]為 24 分,一篇[15]為 26 分,中等質量研究得分在 14~21 分之間。

ROBIS 清單評價結果見圖 2,結果顯示,低偏倚風險研究 4 篇(22.2%),中偏倚風險研究 7 篇(38.9%),高低偏倚風險研究 7 篇(38.9%)。在具體條目中,影響研究的偏倚主要存在于所有目前納入的研究均未進行注冊,對其預定的研究方案不清楚;文獻檢索方面,僅 7 篇(38.9%)的研究屬于低偏倚風險;在數據合成過程中對異質性的處理上,僅 5 篇(27.8%)的研究屬于低偏倚風險;在數據提取與文獻質量評價方面,僅 4 篇(22.2%)的研究屬于低偏倚風險。

a:納入研究存在偏倚的具體方面;b:納入研究偏倚風險總結
2.4 納入研究的研究結果適用性評價結果
根據 CASP-S.R 中關于研究結果是否適用的領域評價顯示:4 篇(22.2%)的研究可能是適用于當地人群,并且所有研究均未設計獲益與成本危害之間的關系,大部分研究(83.3%)都考慮了重要的結局指標(表 3)。

3 討論
目前對抑郁癥的發病機制缺乏統一的認識,在針刺治療抑郁時的選穴與辯證也存在爭議,針刺治療的臨床效果也受到質疑,限制了針刺療法的特色與優勢展現。盡管針刺治療原發性抑郁癥的系統評價很多,但結論不盡相同[13, 27]。因此對針刺治療抑郁癥的系統評價進行再評價刻不容緩。目前進行再評價的工具很多,如 AMSTAR 2、CASP、OQAQ、Sack’s quality assessment checklist(SQAC)和 Quality of reporting of meta-analysis(QUOROM)等是主要的工具[8]。本研究根據量表評價的內容選用常用的 AMSTAR 2,CASP 工具評價納入研究的方法學質量以及臨床適用性,同時針對研究是否存在偏倚采用 ROBIS 量表進行評價[11]。
本研究結果發現針刺治療原發性抑郁癥的系統評價在方法學質量方面,12 篇為中等質量研究,3 篇為高質量研究,3 篇為低質量研究。所有系統評價均未提供前期注冊方案;10.6% 的研究文獻篩選和數據提取不具有可重復性,這極大影響研究的質量;所有研究都進行了多數據庫的檢索,但只有 15.8% 的研究考慮了灰色文獻,對研究結果的準確性造成了一定的影響;只有 15.8% 的研究提供了所有納入排除文獻的清單;有 1 項研究未對文獻的科學性進行評價;26.3% 的研究未評估發表偏倚;77.8% 的研究未進行偏倚風險評價或者評價工具不完全適用;83.3% 的研究在進行 Meta 分析時未考慮納入研究的質量或者偏倚風險對分析或其他證據整合的影響;72.2% 的研究在進行結果解釋或者討論時,未考慮納入研究的偏倚風險;52.6% 的研究未說明研究是否涉及相關利益沖突。這些都是針刺治療原發性抑郁癥系統評價質量不高的原因。對臨床研究進行注冊可以有效地減少研究者在研究過程中根據結果改變研究計劃的情況發生,從而減少研究的偏倚,使得研究結果更加可信。進行系統評價的研究,主要是利用已有的原始研究的數據進行二次整合,因此,對原始研究的收集與數據提取就顯得尤為重要。數據庫的選擇和檢索策略的制定是一個系統評價能夠做好的第一步,但在針刺治療原發性抑郁癥的系統評價研究中,大部分的研究在檢索上就出現了很多問題,主要是對于灰色文獻的考慮不足。而大部分的灰色文獻主要是一些陰性結果的研究,如未對灰色文獻進行考慮,其對研究結果的影響就是夸大干預的療效,出現更多的陽性結果。同時還存在部分研究在進行文獻篩選、數據提取與文獻質量評價時由一個人完成所有工作,這將增加研究過程中的誤差以及增加研究者主觀意愿對結果的影響,使得研究的偏倚進一步增加。在偏倚風險評估方面,大部分研究均沒有進行有效評價,直接影響研究結果的可信度。這些在系統評價/Meta 分析中存在的不足,將極大影響研究結果的準確性,影響研究結果在臨床實踐中的使用。針對這些問題的存在,本研究建議今后進行系統評價的研究者應提前設計好研究方案,并對所要進行的研究進行注冊,同時在對研究結果進行報道時,應該遵循 PRISMA 報告規范,對研究過程進行細致的報道,增加研究的科學性和可信度。
本研究的偏倚風險評價結果發現,61.2% 的研究存在偏倚,原因主要在研究注冊、文獻檢索、數據的綜合與解讀上。因為對研究的前期設計缺少相關信息,因此我們不清楚研究是否完全根據預先設定的方案進行,在很大程度上增加了研究的偏倚風險。其次就是文獻檢索,其主要問題在 AMSTAR 2 部分條目已經討論。最后是研究的重要部分,數據綜合與結果的解讀,本研究在進行數據提取時發現部分(11.1%)文獻在進行數據綜合時所選用的數據合并方法有問題,在有較高異質性時依舊選擇固定效應模型,其大大增加了出現陽性結果的可能性;大部分研究在有異質性存在的情況下(83.3%)未進行敏感性分析,導致異質性對于結果穩定性影響如何并不清楚。同時在進行結果解讀時,部分研究使用顯著性差異等用語,僅強調有統計學意義的結果。針對這些問題,在 Meta 分析時,應該進行較為保守的數據綜合方式,即在研究存在一定異質性時可以考慮采用隨機效應模型,并且對于異質性的來源是研究結果當中應當重要呈現的內容,同時在進行結果陳述時注意統計結果的表達方式。
本研究還根據 CASP-S.R 清單對針刺治療原發性抑郁癥的適用性進行了評價,發現僅 38.9% 的研究可能適用于當地人群(僅檢索國內數據庫),但都沒有考慮針刺干預的獲益與成本之間的關系問題。因此在今后的研究中,建議能夠根據人種或者地區等的不同進行亞組分析,以提高研究結果的外部真實性,同時建議在研究中考慮到衛生經濟學等方面的內容,以提供全面的信息供臨床醫生和患者選擇。
本研究存在的局限性:① 納入研究語言限制在中英文,可能出現檢索數據不全的情況,從而對研究產生影響;② 檢索時間被限定,可能出現新的研究影響本結果;③ 納入的大部分研究的干預措施復雜,影響臨床應用;④ 本研究評價者的主觀性對結果的影響;⑤ 本研究未進行數據綜合,只進行了定性分析,無法定量得出研究結果。
綜上所述,針刺治療原發性抑郁癥的系統評價屬于中等質量水平,在改進方法學及提高研究結果的適用性上有很大空間。因此筆者建議:一方面,今后研究者在制作系統評價時,其方法學要根據 AMSTAR 2 清單進行,從而提高系統評價結果的可信度和科學性,同時能夠考慮衛生經濟學方面的研究內容,以供醫生與患者更好的決策,在報告結果時根據 PRISMA 報告規范。另一方面,原始研究的質量直接影響其結局指標的評定,其原因與針刺的操作手法及腧穴配伍有著很大程度的關系,在針刺過程中實施盲法是很困難的。因此,我們研究人員在不斷完善試驗設計的同時應當將中醫臨床辯證、針灸診療的特色與現代的臨床隨機對照試驗相結合,產生更多的具有中醫特色的高質量、科學和精確的臨床證據。
聲明:本研究無任何利益沖突。