引用本文: 鐘婉琪, 銀子涵, 李雅琴, 保瓊楠, 張欣悅, 夏嫚澤, 吳可欣, 姚瑾, 梁繁榮. 針灸干預帕金森病的系統評價再評價. 中國循證醫學雜志, 2023, 23(8): 936-944. doi: 10.7507/1672-2531.202303190 復制
帕金森病(Parkinson's disease,PD),也稱為震顫麻痹,其臨床特征主要為靜止性震顫、運動遲緩、肌肉強直和姿勢平衡障礙。根據2022年的數據,全球的PD患者約851萬人,其中中國患者約284萬人,占患病總數的33.37%,是全球PD患者最多的國家[1],而近年來PD患者的人均經濟負擔呈上漲趨勢,家庭負擔沉重[2-3]。作為PD的主要病理改變,黑質多巴胺能導致神經元變性死亡的原因目前并未被完全揭示[4]。當前臨床治療以藥物治療為首選[2],常用藥物主要包括復方左旋多巴、多巴胺受體激動劑、單胺氧化酶B抑制劑等,這些藥物雖然對延緩PD的發展有相應療效,但大多數患者需要長期甚至終身治療,而過度氧化作用及神經系統異常等不良反應又可能隨著藥物的長期使用而逐漸發生,降低患者的生活質量[5-7]。因此,國內外研究對使用非藥物療法干預PD的關注度也越來越高。
針灸作為一種簡、便、廉、效的治療方法,具有安全性高的特點。近年來,已有較多的高質量臨床隨機對照試驗(randomized controlled trial,RCT)、系統評價/Meta分析(systematic review/meta-analysis,SR/MA)證明針灸能有效改善PD患者的癥狀[8-10]。但作為二次研究,SR/MA所得證據的質量受限于納入研究本身的質量和研究者對方法學的理解,導致結論的可靠程度也有所不同;同時,由于相關文獻納入的針灸療法種類不一,結局指標選擇有別,各研究得出的結論并不完全統一,使得臨床工作者無法從中獲得可直接用于臨床的推薦意見。系統評價再評價作為一種綜合研究方法,通過對某一疾病診療相關的系統評價進行全面收集并再評估,對證據進行整合,可以增強其臨床實用性,并進一步提示該領域研究的不足,從而為使用者提供更集中可靠的高質量證據。
因此,本研究通過對針灸干預PD的SR/MA總結,應用AMSTAR 2評價納入研究的方法學質量,PRISMA聲明評價報告質量,GRADE工具評價證據質量,以期為針灸干預PD的臨床決策提供證據參考。
1 材料與方法
1.1 納入與排除標準
1.1.1 研究類型
納入相關RCT的SR/MA,語種限定為中、英文。
1.1.2 研究對象
明確診斷為PD的患者,診斷依據包括但不限于中國PD的診斷標準[11]、英國PD學會腦庫PD診斷標準[12]等。不限性別、年齡、病程、國籍和種族。
1.1.3 干預措施
試驗組:針灸(包括針刺、體針、電針、溫針、頭皮針、頭針、耳針、火針、腹針、浮針、三棱針、經皮電刺激、眼針、舌針、腕踝針、刃針、針刀、干針及灸法)作為主要干預方法。對照組:使用常規藥物治療、安慰劑、等待治療。
1.1.4 結局指標
主要結局指標:總有效率(判斷標準與率的轉換不作限定,均沿用原始納入文獻的標準);PD總體癥狀評價的相關指標,包括Webster評分和PD統一評分量表評分(unified Parkinson’s disease rating scale,UPDRS)。次要結局指標:PD的運動癥狀、非運動癥狀及日常生活能力評價的相關指標,包括精神行為和情緒評分(unified Parkinson’s disease rating scale Ⅰ,UPDRS Ⅰ)、日常生活能力評分(unified Parkinson’s disease rating scale Ⅱ,UPDRS Ⅱ)、運動評分(unified Parkinson’s disease rating scale Ⅲ,UPDRS Ⅲ)、并發癥評分(unified Parkinson’s disease rating scale Ⅳ,UPDRS Ⅳ)等。
1.1.5 排除標準
① 重復發表文獻;② 無法獲取具體數據的文獻;③ 針灸治療PD基礎研究的系統評價;④ 系統評價的計劃書或方案;⑤ 敘述性綜述。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、CBM、PubMed、EMbase、Cochrane Library和Web of Science數據庫,搜集針灸干預PD臨床療效的SR/MA,檢索時限均為建庫至2023年5月1日。檢索方式為主題詞與自由詞相結合。中文檢索詞包括:針灸、針刺、體針、手針、電針、溫針、頭針、針刀、帕金森病、帕金森氏病、帕金森綜合癥、帕金森氏綜合征、帕金森、震顫麻痹、系統評價、系統綜述、薈萃分析、Meta分析等;英文檢索詞包括:Parkinson disease、idiopathic Parkinson's disease、acupuncture therapy、acupuncture-moxibustion、warm acupuncture、electronic acupuncture、fire acupuncture、meta-analysis、systematic review等。PubMed、CNKI檢索式見附件表1、表2。
1.3 文獻篩選與資料提取
由2名研究者獨立進行文獻篩選和資料提取,并進行交叉核對。如遇分歧,則咨詢第3位研究者協助判斷。缺乏的資料盡量聯系作者以進行補充。初檢去重后閱讀文題和摘要進行初次篩選,以排除明顯無關的文獻;剩余文獻通過獲取和閱讀全文來確定最終是否納入。資料提取內容包括:① 基本信息(文章題目、第一作者、發表年份、納入研究類型、病例數、干預措施、對照措施、結局指標、質量評價工具、主要結論等);② 質量評價的關鍵信息(包括AMSTAR 2、PRISMA和GRADE工具條目中所需的各項內容)。
1.4 納入研究的質量評價
使用AMSTAR 2評價方法學質量,PRISMA聲明評價報告質量,GRADE工具評估證據質量分級。
1.4.1 方法學質量評價
使用AMSTAR 2評估納入SR/MA的方法學質量。其中條目2、4、7、9、11、13和15為影響SR/MA方法學質量的關鍵條目,其余則為非關鍵條目[13]。若≤1個非關鍵條目不滿足,則評價為“高”質量等級;若>1個非關鍵條目不滿足,則評價為“中”質量等級;若1個關鍵條目不滿足,伴或不伴非關鍵條目不滿足,則為“低”質量等級;若>1個關鍵條目不滿足,伴或不伴非關鍵條目不滿足,則評價為“極低”質量等級。
1.4.2 報告質量評價
采用PRISMA聲明評價納入SR/MA的報告質量[14]。PRISMA聲明包括27個條目,每個條目完整報告(完全滿足)計1分,部分報告(部分滿足)計0.5分,未報告(不滿足)計0分。滿分27分,≤15分為有相對嚴重的信息缺陷,15~21分為報告有一定缺陷,21~27分為報告相對完整。
1.4.3 證據質量評價
采用GRADE工具評價納入SR/MA的證據質量[15]。對于RCT而言,無降級證據為高質量證據,有1項降級為中質量證據,有2項降級為低質量證據,有3項及以上降級則為極低質量證據。
1.5 統計分析
本研究采用描述性分析方法對結果進行定性分析。
2 結果
2.1 文獻檢索結果
初檢出相關文獻602篇,經逐層篩選后,最終納入28篇文獻[16-43],包括16篇中文文獻[16-31]和12篇英文文獻[32-43]。具體篩選流程見附件圖1。
2.2 納入研究的基本特征
文獻發表時間在2008—2023年之間,28篇文獻納入的原始研究數量在4~61個之間,樣本量在184~2 652例之間,試驗組的主要干預措施為針灸或針灸聯合其他療法,對照組大多使用藥物進行干預。納入RCT的偏倚風險評價主要使用Cochrane協作網針對RCT的偏倚風險評估工具。21篇文獻[16-18,20-21,23-24,26-31,36-43]的研究結果認為針灸干預PD在改善綜合癥狀,改善震顫、肌強直等運動癥狀,以及改善睡眠障礙、消化道癥狀、神經精神癥狀等非運動癥狀方面都具有顯著優勢,且不良反應少;6篇文獻[19,22,32-35]認為由于納入研究的數量、異質性以及方法學等問題,無法得出關于針灸干預PD的有效性和安全性的可靠結論,還需進一步研究;1篇文獻[25]的研究顯示針灸結合藥物干預PD療效優于單用藥物,但由于受限于發表試驗數量,針刺組比假針刺組未體現顯著優勢;但其他研究并未報告同樣的結果。具體見表1。

2.3 結局指標和相關結論
2.3.1 總有效率
納入研究中,12篇文獻[19-21,23,28-32,36,38-39]合并分析了總有效率,其中3篇文獻[28-30]結論認為針灸治療PD療效優于藥物治療;8篇文獻[19-21,23,31,36,38-39]認為針刺、電針、艾灸、耳針等針灸療法結合常規藥物治療比單獨使用藥物更有療效;1篇文獻[32]認為艾灸療法與其他常規療法的療效相當(表2)。

2.3.2 Webster評分
15篇文獻[16-18,22-26,28-29,33-34,36,39,43]使用了Webster評分對患者的總體癥狀進行評價,其中3篇文獻[26,28-29]結論認為針灸治療比藥物治療后Webster評分更低,針刺治療優于藥物治療;3篇文獻[16,22,34]認為針灸治療與藥物治療后Webster評分無明顯差別,針灸的療效與藥物相當;8篇文獻[17-18,23-25,33,39,43]結論認為針刺、艾灸、電針等針灸療法結合藥物治療比單獨藥物治療后Webster評分更低,癥狀改善更明顯;1篇文獻[36]認為針灸療法對Webster評分的影響優于等待治療(表2)。
2.3.3 UPDRS總分
18篇文獻[16,18,21-26,28,30,32-36,38-39,41,43]使用UPDRS總分對患者的總體癥狀進行評價,其中3篇文獻[28,32,35]結論認為,針灸治療后UPDRS總分比其他治療方法更低,針灸療法優于其他治療方法;2篇文獻[16,22]認為針灸治療后UPDRS總分與藥物治療沒有明顯差別,二者作用相當;13篇文獻[18,23-26,30,33-34,36,38-39,41,43]認為針刺、艾灸、電針等針灸療法聯合藥物治療后UPDRS總分低于單用藥物治療,針灸聯合藥物優于單獨使用藥物;1篇文獻[21]認為艾灸配合藥物治療后UPDRS總分與僅用藥物治療無明顯差異(表2)。
2.3.4 UPDRS Ⅰ
8篇文獻[17,25,28,33,36-37,41,43]關注了UPDRS Ⅰ評分,其中1篇文獻[37]結論認為針刺治療后UPDRS Ⅰ評分比藥物治療更低,精神和情緒狀態改善作用更好;6篇文獻[17,25,28,33,41,43]認為針灸療法聯合藥物比單獨使用藥物的UPDRS Ⅰ評分更低;1篇文獻[36]認為針灸與藥物治療結合與單獨使用藥物相比UPDRS Ⅰ評分無明顯差異(表2)。
2.3.5 UPDRS Ⅱ
9篇文獻[17,25,28,33,36-37,41,42-43]關注了UPDRS Ⅱ評分,其中2篇文獻[28,42]結論認為針灸治療在降低UPDRS Ⅱ評分上與藥物的表現相當;7篇文獻[17,25,33,36-37,41,43]認為針灸療法聯合藥物療法在降低UPDRS Ⅱ評分上優于單獨使用藥物(表2)。
2.3.6 UPDRS Ⅲ
9篇文獻[25,27,33,36,39-43]關注了UPDRS Ⅲ評分,其中1篇文獻[42]結果認為針刺治療在降低UPDRS Ⅲ評分上優于藥物;8篇文獻[25,27,33,36,39-41,43]認為針灸療法聯合藥物療法比單獨使用藥物更具有優勢(表2)。
2.3.7 UPDRS Ⅳ
5篇文獻關注了UPDRS Ⅳ評分,其中4篇文獻[25,33,41,43]認為針灸療法聯合藥物療法比單獨使用藥物在降低UPDRS Ⅳ評分上具有優勢,1篇文獻[36]認為針灸療法聯合藥物療法比單獨使用藥物未體現出明顯優勢(表2)。
2.4 方法學質量評價結果
AMSTAR 2評價結果提示:每篇SR/MA均有至少有2項關鍵條目未達標,方法學質量均為極低。
在關鍵條目中,條目9的達標率為92.8%(有26篇文獻[16-21,23-25,27-43]達標),條目13的達標率為53.5%(有15篇文獻[16,18,22-23,29,32-40,43]達標),達標情況尚可;條目4的達標率為28.5%(有8篇文獻[18,28,33-34,36,39,41,43]達標),條目15的達標率同樣為28.5%(有8篇文獻[18,21,27,28-31,37,42]達標),條目11的達標率為25.0%(有7篇文獻[18,25,30-32,37,39]達標),條目2的達標率為10.7%(有3篇文獻[37-38,42]達標),達標結果欠佳;條目7無1篇文獻達標。
在非關鍵條目中,條目6的達標率為89.2%,條目1的達標率為53.5%,條目16達標率為50.0%,達標情況尚可;條目5(46.4%)、條目8(42.8%)、條目14(32.1%)和條目12(14.2%)的達標率欠佳;條目3和條目10無1篇文獻達標,見附件表3。
2.5 報告質量評價結果
PRISMA工具評價文獻報告顯示,納入的22篇文獻的評分在15~26分之間,其中≤15分的文獻占比3.6%(1篇[26]);15~21分的文獻占比50.0%(14篇[16-17,19-20,22,25,29,31,33-36,40-41] );≥21分的文獻占比46.4%(13篇[18,21,23-24,27-28,30,32,37-39,42-43])。沒有文獻完全符合PRISMA的27個條目要求。具體評價結果見附件圖2。
2.6 證據質量評價結果
使用GRADE工具對納入的22篇SR/MA的主要結局指標(總有效率、Webster評分、UPDRS評分、UPDRS Ⅰ評分、UPDRS Ⅱ評分、UPDRS Ⅲ評分、UPDRS Ⅳ評分)進行證據質量評價,共7個結局指標被報告了126次,其中總有效率15次(1個質量為高級,2個為中級,7個為低級,5個為極低);Webster評分21次(4個質量為中級,8個為低級,9個質量為極低);UPDRS評分34次(2個質量為中級,7個為低級,25個為極低),UPDRS Ⅰ評分13次(1個質量為中級,10個為低級,2個為極低),UPDRS Ⅱ評分18次(2個質量為中級,10個為低級,6個為極低),UPDRS Ⅲ評分18次(1個質量為中級,11個為低級,6個為極低),UPDRS Ⅳ評分7次(4個質量為低級,3個為極低)。結局指標的證據質量分級中,僅有1個高級,占0.8%;12個中級,占9.5%;57個低級,占45.2%;56個極低級,占44.4%,見附件表4。
3 討論
本研究整合現有的針灸干預PD的SR/MA進行再評價,以評估針灸研究質量和證據的臨床可用性。21篇SR/MA的結果表明,在改善PD患者的總體癥狀、提高生活質量以及減緩病程發展等方面,針灸干預具有顯著優勢;6篇SR/MA由于納入研究的數量較少,樣本量較小,且某些納入文獻存在一定的方法學缺陷和臨床異質性等原因,認為針灸干預PD暫時無法得出可靠結論,但通過更新[9,44]也明確了針灸干預的優勢;僅1篇文獻認為針藥結合療效優于單獨使用藥物[25],但針灸與安慰針刺比較未體現出明顯優勢(已有最新文獻[44]顯示針刺療效優于安慰針刺),這可能與針灸的安慰劑效應有關,同時,由于該研究進行時,采用安慰針刺進行對照的RCT數量較少,樣本量較小,該SR/MA僅納入了4篇文獻共174例樣本,且其中3篇文獻來源于國外,其發表偏倚也可能與結果的差異有一定關系。從主要結局指標來看,大部分證據顯示,針灸療法單獨治療或聯合藥物治療PD優于單獨使用藥物,僅1篇文獻[21]的合并分析結果顯示艾灸治療PD的UPDRS總分并未體現出優勢,這一結果與其他結果的差異原因可能與納入研究的樣本量小、使用的艾灸方法不統一有關。次要結局指標的結果同樣顯示針灸療法在改善患者的精神、情緒、生活質量、運動能力等方面更具有優勢,1篇文獻[36]在UPDRS Ⅰ評分上得出的結論略有不同,但其僅納入的兩項RCT發表時間較早,樣本量小且干預方式區別較大,證據質量評級低,因此該合并分析的結果并不能否定針灸的療效。
本研究使用AMASTAR 2量表評價納入文獻的方法學質量時發現,在研究前期方案注冊、納入研究類型的解釋、結果合并分析方法和偏倚風險影響的調查等方面,納入SR/MA存在報告不充分或者未報告的缺陷。25篇文獻[16-36, 39-41,43]在進行系統評價前未制定SR/MA的研究方案。高質量的SR/MA需要在開展研究之前就確定研究計劃,并在二次研究的注冊平臺進行注冊;撰寫時也應該對實施過程中與研究計劃不一致的情況進行詳細描述,以減少評價過程中的偏倚風險。所有文獻均未對納入研究的類型進行解釋。在評估某一干預措施的療效時,若RCT數量不足、結局指標缺失、統計效能不足,系統評價可以納入非隨機干預研究作為補充,盡管出于對結果的可靠性和嚴謹性的考慮,現有的SR/MA都只納入設計與實施都相對嚴謹RCT作為療效評價的證據,但是否考慮納入非隨機干預研究作為補充,也需要在進行SR/MA報告時對相關考量有所體現[13]。當Meta分析有異質性時,19篇文獻[16-17,19,21-24,26,28-30,32-33,35,38-39,41-43]未對納入RCT的異質性原因進行分析和報告。由于研究間存在的高異質性提示合并分析的結果可能是不可靠的,因此當Meta分析存在異質性時,嚴謹的研究需要對異質性來源進行探究,必要時進行亞組分析或剔除其中導致高異質性的某項或某幾項研究,才能使合并分析的結果更為可靠[45]。
從PRISMA評價結果中我們發現,納入的SR/MA的報告集中在中等質量區間。28篇文獻中,13篇文獻[18,21,23-24,27-28,30,32,37-39,42-43]的報告相對完全,14篇文獻[16-17,19-20,22,25,29,31,33-36,40-41]的報告有一定缺陷,1篇文獻[26]的報告存在嚴重缺陷。在27個條目中,所有文獻均較為全面的報告了文章的局限性和結論;報告的質量問題主要表現在摘要、檢索、其他分析和證據總結等方面。結構式摘要信息不全是所有文獻的共同問題,幾乎所有研究都未在結構式摘要中表述齊全。摘要是文章內容的濃縮,信息簡明的摘要能使讀者快速明確文獻的主要內容,因此,在對研究進行報告時簡潔且概括全面的摘要必不可少[46]。17篇文獻[16-17,19-22,24-25,27-31,33,37-38,40]只提到了檢索的數據庫、關鍵詞,而未提供詳細檢索式,或只進行了電子檢索;2篇文獻[26,36]只提供了檢索數據庫的名稱。在進行檢索時,對灰色文獻的檢索能有效減少發表偏倚的影響,而完整的數據檢索策略也是納入研究的全面性的保證,因此,報告的撰寫應該提供完整文獻檢索的策略并盡量檢索相應的灰色文獻,從而避免可能存在的發表偏倚對結果的影響[13]。所有文獻均未報告納入RCT的資金來源。研究的資金來源是評議專家和讀者把握研究是否存在利益沖突和發表偏倚的依據,因此SR/MA在撰寫時需要重視相應的報告,以期對相關結果的可靠性有更客觀的把握。
經GRADE工具評估,126次結局指標的報告中有1個高級別指標,12個中級別指標,大多數證據質量為低級別和極低級別,降級原因以研究的局限性為主,其次則是發表偏倚和不精確性。126次報告中選用UPDRS評分的結局指標最多。被評為高質量或中等質量的證據被認為是相對可靠的[47],這13個相對可靠的證據提示針灸對于PD的有效率優于藥物治療,針灸及針灸聯合藥物治療PD在減輕癥狀、降低UPDRS評分和Webster評分方面都具有優勢。但納入的絕大多數證據都因偏倚風險而降級,主要是由于研究對隨機、盲法、分配隱藏等的實施以及失訪和退出情況報告不充分,且文獻所納入的多數原始研究存在發表偏倚。在進行系統評價時,研究者對于原始文獻在隨機、盲法、分配隱藏和發表偏倚等方面需要進行評估和報告,以提供更完整的信息,提高結果的可靠性。部分文獻納入的原始研究樣本量不大,但效應量差異較大,可信區間重合度低,使得結果具有不精確性。此外,一些原始文獻數據的異質性大,分析時又未對高異質性的結果進行進一步處理,也是導致指標繼續降級的原因。這些問題提示研究者,SR/MA應盡可能全面地描述納入RCT的特征,以助于明確異質性來源,從而對結果進行更客觀合理的分析。
盡管納入研究的結局指標級別普遍不高,但在對文獻進行評估時,依舊可以發現,隨著研究的增加,針灸干預PD的SR/MA的證據質量有所提升,具體如下:在研究的局限性方面,近年的文獻對于隨機、盲法、分配隱藏等的報告呈逐步上升趨勢;作為使多數結局指標降級的重要原因,對異質性的處理在近幾年的文章中也是逐漸規范和細化,與早年的文章相比,近年有更多的文章在發現異質性時對其來源進行了調查并嘗試了亞組分析。可見,針灸干預PD的SR/MA文獻質量在隨研究的進展而不斷提高。
本研究納入近30年來針灸干預PD的相關SR/MA,結果提示針灸干預有利于改善PD各種癥狀,為臨床選擇針灸干預PD提供了證據支持。為了提高證據可信度,我們只納入了RCT的SR/MA。本研究評價的目標干預措施涵蓋了手針、電針、頭針、艾灸等多種針灸干預方式,可作為臨床工作者選用時的參考。為了盡量減少研究過程中的潛在偏倚,我們的文獻篩選、資料提取和質量評估等工作均由2名研究者獨立進行。
本研究同樣存在一定的局限性:① 由于PD本身的特點,干預前后的癥狀和體征大多只能通過量表進行評定,而量表評價又受主觀因素的制約,不同研究人員對于量表的條目理解可能有所差異,因此結果仍可能存在一定的主觀性。② 納入的SR/MA大多存在質量和偏倚問題,未來的研究很可能對現有證據產生重大影響,并可能改變評估結果。③ 由于語言方面的限制,故僅對中、英文數據庫進行了檢索,可能存在一定的選擇性偏倚。
綜上,目前文獻結論提示針灸干預PD具有臨床優勢,但是鑒于當前證據質量并不理想,相關結果仍需通過高質量,大樣本的RCT進行驗證。
帕金森病(Parkinson's disease,PD),也稱為震顫麻痹,其臨床特征主要為靜止性震顫、運動遲緩、肌肉強直和姿勢平衡障礙。根據2022年的數據,全球的PD患者約851萬人,其中中國患者約284萬人,占患病總數的33.37%,是全球PD患者最多的國家[1],而近年來PD患者的人均經濟負擔呈上漲趨勢,家庭負擔沉重[2-3]。作為PD的主要病理改變,黑質多巴胺能導致神經元變性死亡的原因目前并未被完全揭示[4]。當前臨床治療以藥物治療為首選[2],常用藥物主要包括復方左旋多巴、多巴胺受體激動劑、單胺氧化酶B抑制劑等,這些藥物雖然對延緩PD的發展有相應療效,但大多數患者需要長期甚至終身治療,而過度氧化作用及神經系統異常等不良反應又可能隨著藥物的長期使用而逐漸發生,降低患者的生活質量[5-7]。因此,國內外研究對使用非藥物療法干預PD的關注度也越來越高。
針灸作為一種簡、便、廉、效的治療方法,具有安全性高的特點。近年來,已有較多的高質量臨床隨機對照試驗(randomized controlled trial,RCT)、系統評價/Meta分析(systematic review/meta-analysis,SR/MA)證明針灸能有效改善PD患者的癥狀[8-10]。但作為二次研究,SR/MA所得證據的質量受限于納入研究本身的質量和研究者對方法學的理解,導致結論的可靠程度也有所不同;同時,由于相關文獻納入的針灸療法種類不一,結局指標選擇有別,各研究得出的結論并不完全統一,使得臨床工作者無法從中獲得可直接用于臨床的推薦意見。系統評價再評價作為一種綜合研究方法,通過對某一疾病診療相關的系統評價進行全面收集并再評估,對證據進行整合,可以增強其臨床實用性,并進一步提示該領域研究的不足,從而為使用者提供更集中可靠的高質量證據。
因此,本研究通過對針灸干預PD的SR/MA總結,應用AMSTAR 2評價納入研究的方法學質量,PRISMA聲明評價報告質量,GRADE工具評價證據質量,以期為針灸干預PD的臨床決策提供證據參考。
1 材料與方法
1.1 納入與排除標準
1.1.1 研究類型
納入相關RCT的SR/MA,語種限定為中、英文。
1.1.2 研究對象
明確診斷為PD的患者,診斷依據包括但不限于中國PD的診斷標準[11]、英國PD學會腦庫PD診斷標準[12]等。不限性別、年齡、病程、國籍和種族。
1.1.3 干預措施
試驗組:針灸(包括針刺、體針、電針、溫針、頭皮針、頭針、耳針、火針、腹針、浮針、三棱針、經皮電刺激、眼針、舌針、腕踝針、刃針、針刀、干針及灸法)作為主要干預方法。對照組:使用常規藥物治療、安慰劑、等待治療。
1.1.4 結局指標
主要結局指標:總有效率(判斷標準與率的轉換不作限定,均沿用原始納入文獻的標準);PD總體癥狀評價的相關指標,包括Webster評分和PD統一評分量表評分(unified Parkinson’s disease rating scale,UPDRS)。次要結局指標:PD的運動癥狀、非運動癥狀及日常生活能力評價的相關指標,包括精神行為和情緒評分(unified Parkinson’s disease rating scale Ⅰ,UPDRS Ⅰ)、日常生活能力評分(unified Parkinson’s disease rating scale Ⅱ,UPDRS Ⅱ)、運動評分(unified Parkinson’s disease rating scale Ⅲ,UPDRS Ⅲ)、并發癥評分(unified Parkinson’s disease rating scale Ⅳ,UPDRS Ⅳ)等。
1.1.5 排除標準
① 重復發表文獻;② 無法獲取具體數據的文獻;③ 針灸治療PD基礎研究的系統評價;④ 系統評價的計劃書或方案;⑤ 敘述性綜述。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、CBM、PubMed、EMbase、Cochrane Library和Web of Science數據庫,搜集針灸干預PD臨床療效的SR/MA,檢索時限均為建庫至2023年5月1日。檢索方式為主題詞與自由詞相結合。中文檢索詞包括:針灸、針刺、體針、手針、電針、溫針、頭針、針刀、帕金森病、帕金森氏病、帕金森綜合癥、帕金森氏綜合征、帕金森、震顫麻痹、系統評價、系統綜述、薈萃分析、Meta分析等;英文檢索詞包括:Parkinson disease、idiopathic Parkinson's disease、acupuncture therapy、acupuncture-moxibustion、warm acupuncture、electronic acupuncture、fire acupuncture、meta-analysis、systematic review等。PubMed、CNKI檢索式見附件表1、表2。
1.3 文獻篩選與資料提取
由2名研究者獨立進行文獻篩選和資料提取,并進行交叉核對。如遇分歧,則咨詢第3位研究者協助判斷。缺乏的資料盡量聯系作者以進行補充。初檢去重后閱讀文題和摘要進行初次篩選,以排除明顯無關的文獻;剩余文獻通過獲取和閱讀全文來確定最終是否納入。資料提取內容包括:① 基本信息(文章題目、第一作者、發表年份、納入研究類型、病例數、干預措施、對照措施、結局指標、質量評價工具、主要結論等);② 質量評價的關鍵信息(包括AMSTAR 2、PRISMA和GRADE工具條目中所需的各項內容)。
1.4 納入研究的質量評價
使用AMSTAR 2評價方法學質量,PRISMA聲明評價報告質量,GRADE工具評估證據質量分級。
1.4.1 方法學質量評價
使用AMSTAR 2評估納入SR/MA的方法學質量。其中條目2、4、7、9、11、13和15為影響SR/MA方法學質量的關鍵條目,其余則為非關鍵條目[13]。若≤1個非關鍵條目不滿足,則評價為“高”質量等級;若>1個非關鍵條目不滿足,則評價為“中”質量等級;若1個關鍵條目不滿足,伴或不伴非關鍵條目不滿足,則為“低”質量等級;若>1個關鍵條目不滿足,伴或不伴非關鍵條目不滿足,則評價為“極低”質量等級。
1.4.2 報告質量評價
采用PRISMA聲明評價納入SR/MA的報告質量[14]。PRISMA聲明包括27個條目,每個條目完整報告(完全滿足)計1分,部分報告(部分滿足)計0.5分,未報告(不滿足)計0分。滿分27分,≤15分為有相對嚴重的信息缺陷,15~21分為報告有一定缺陷,21~27分為報告相對完整。
1.4.3 證據質量評價
采用GRADE工具評價納入SR/MA的證據質量[15]。對于RCT而言,無降級證據為高質量證據,有1項降級為中質量證據,有2項降級為低質量證據,有3項及以上降級則為極低質量證據。
1.5 統計分析
本研究采用描述性分析方法對結果進行定性分析。
2 結果
2.1 文獻檢索結果
初檢出相關文獻602篇,經逐層篩選后,最終納入28篇文獻[16-43],包括16篇中文文獻[16-31]和12篇英文文獻[32-43]。具體篩選流程見附件圖1。
2.2 納入研究的基本特征
文獻發表時間在2008—2023年之間,28篇文獻納入的原始研究數量在4~61個之間,樣本量在184~2 652例之間,試驗組的主要干預措施為針灸或針灸聯合其他療法,對照組大多使用藥物進行干預。納入RCT的偏倚風險評價主要使用Cochrane協作網針對RCT的偏倚風險評估工具。21篇文獻[16-18,20-21,23-24,26-31,36-43]的研究結果認為針灸干預PD在改善綜合癥狀,改善震顫、肌強直等運動癥狀,以及改善睡眠障礙、消化道癥狀、神經精神癥狀等非運動癥狀方面都具有顯著優勢,且不良反應少;6篇文獻[19,22,32-35]認為由于納入研究的數量、異質性以及方法學等問題,無法得出關于針灸干預PD的有效性和安全性的可靠結論,還需進一步研究;1篇文獻[25]的研究顯示針灸結合藥物干預PD療效優于單用藥物,但由于受限于發表試驗數量,針刺組比假針刺組未體現顯著優勢;但其他研究并未報告同樣的結果。具體見表1。

2.3 結局指標和相關結論
2.3.1 總有效率
納入研究中,12篇文獻[19-21,23,28-32,36,38-39]合并分析了總有效率,其中3篇文獻[28-30]結論認為針灸治療PD療效優于藥物治療;8篇文獻[19-21,23,31,36,38-39]認為針刺、電針、艾灸、耳針等針灸療法結合常規藥物治療比單獨使用藥物更有療效;1篇文獻[32]認為艾灸療法與其他常規療法的療效相當(表2)。

2.3.2 Webster評分
15篇文獻[16-18,22-26,28-29,33-34,36,39,43]使用了Webster評分對患者的總體癥狀進行評價,其中3篇文獻[26,28-29]結論認為針灸治療比藥物治療后Webster評分更低,針刺治療優于藥物治療;3篇文獻[16,22,34]認為針灸治療與藥物治療后Webster評分無明顯差別,針灸的療效與藥物相當;8篇文獻[17-18,23-25,33,39,43]結論認為針刺、艾灸、電針等針灸療法結合藥物治療比單獨藥物治療后Webster評分更低,癥狀改善更明顯;1篇文獻[36]認為針灸療法對Webster評分的影響優于等待治療(表2)。
2.3.3 UPDRS總分
18篇文獻[16,18,21-26,28,30,32-36,38-39,41,43]使用UPDRS總分對患者的總體癥狀進行評價,其中3篇文獻[28,32,35]結論認為,針灸治療后UPDRS總分比其他治療方法更低,針灸療法優于其他治療方法;2篇文獻[16,22]認為針灸治療后UPDRS總分與藥物治療沒有明顯差別,二者作用相當;13篇文獻[18,23-26,30,33-34,36,38-39,41,43]認為針刺、艾灸、電針等針灸療法聯合藥物治療后UPDRS總分低于單用藥物治療,針灸聯合藥物優于單獨使用藥物;1篇文獻[21]認為艾灸配合藥物治療后UPDRS總分與僅用藥物治療無明顯差異(表2)。
2.3.4 UPDRS Ⅰ
8篇文獻[17,25,28,33,36-37,41,43]關注了UPDRS Ⅰ評分,其中1篇文獻[37]結論認為針刺治療后UPDRS Ⅰ評分比藥物治療更低,精神和情緒狀態改善作用更好;6篇文獻[17,25,28,33,41,43]認為針灸療法聯合藥物比單獨使用藥物的UPDRS Ⅰ評分更低;1篇文獻[36]認為針灸與藥物治療結合與單獨使用藥物相比UPDRS Ⅰ評分無明顯差異(表2)。
2.3.5 UPDRS Ⅱ
9篇文獻[17,25,28,33,36-37,41,42-43]關注了UPDRS Ⅱ評分,其中2篇文獻[28,42]結論認為針灸治療在降低UPDRS Ⅱ評分上與藥物的表現相當;7篇文獻[17,25,33,36-37,41,43]認為針灸療法聯合藥物療法在降低UPDRS Ⅱ評分上優于單獨使用藥物(表2)。
2.3.6 UPDRS Ⅲ
9篇文獻[25,27,33,36,39-43]關注了UPDRS Ⅲ評分,其中1篇文獻[42]結果認為針刺治療在降低UPDRS Ⅲ評分上優于藥物;8篇文獻[25,27,33,36,39-41,43]認為針灸療法聯合藥物療法比單獨使用藥物更具有優勢(表2)。
2.3.7 UPDRS Ⅳ
5篇文獻關注了UPDRS Ⅳ評分,其中4篇文獻[25,33,41,43]認為針灸療法聯合藥物療法比單獨使用藥物在降低UPDRS Ⅳ評分上具有優勢,1篇文獻[36]認為針灸療法聯合藥物療法比單獨使用藥物未體現出明顯優勢(表2)。
2.4 方法學質量評價結果
AMSTAR 2評價結果提示:每篇SR/MA均有至少有2項關鍵條目未達標,方法學質量均為極低。
在關鍵條目中,條目9的達標率為92.8%(有26篇文獻[16-21,23-25,27-43]達標),條目13的達標率為53.5%(有15篇文獻[16,18,22-23,29,32-40,43]達標),達標情況尚可;條目4的達標率為28.5%(有8篇文獻[18,28,33-34,36,39,41,43]達標),條目15的達標率同樣為28.5%(有8篇文獻[18,21,27,28-31,37,42]達標),條目11的達標率為25.0%(有7篇文獻[18,25,30-32,37,39]達標),條目2的達標率為10.7%(有3篇文獻[37-38,42]達標),達標結果欠佳;條目7無1篇文獻達標。
在非關鍵條目中,條目6的達標率為89.2%,條目1的達標率為53.5%,條目16達標率為50.0%,達標情況尚可;條目5(46.4%)、條目8(42.8%)、條目14(32.1%)和條目12(14.2%)的達標率欠佳;條目3和條目10無1篇文獻達標,見附件表3。
2.5 報告質量評價結果
PRISMA工具評價文獻報告顯示,納入的22篇文獻的評分在15~26分之間,其中≤15分的文獻占比3.6%(1篇[26]);15~21分的文獻占比50.0%(14篇[16-17,19-20,22,25,29,31,33-36,40-41] );≥21分的文獻占比46.4%(13篇[18,21,23-24,27-28,30,32,37-39,42-43])。沒有文獻完全符合PRISMA的27個條目要求。具體評價結果見附件圖2。
2.6 證據質量評價結果
使用GRADE工具對納入的22篇SR/MA的主要結局指標(總有效率、Webster評分、UPDRS評分、UPDRS Ⅰ評分、UPDRS Ⅱ評分、UPDRS Ⅲ評分、UPDRS Ⅳ評分)進行證據質量評價,共7個結局指標被報告了126次,其中總有效率15次(1個質量為高級,2個為中級,7個為低級,5個為極低);Webster評分21次(4個質量為中級,8個為低級,9個質量為極低);UPDRS評分34次(2個質量為中級,7個為低級,25個為極低),UPDRS Ⅰ評分13次(1個質量為中級,10個為低級,2個為極低),UPDRS Ⅱ評分18次(2個質量為中級,10個為低級,6個為極低),UPDRS Ⅲ評分18次(1個質量為中級,11個為低級,6個為極低),UPDRS Ⅳ評分7次(4個質量為低級,3個為極低)。結局指標的證據質量分級中,僅有1個高級,占0.8%;12個中級,占9.5%;57個低級,占45.2%;56個極低級,占44.4%,見附件表4。
3 討論
本研究整合現有的針灸干預PD的SR/MA進行再評價,以評估針灸研究質量和證據的臨床可用性。21篇SR/MA的結果表明,在改善PD患者的總體癥狀、提高生活質量以及減緩病程發展等方面,針灸干預具有顯著優勢;6篇SR/MA由于納入研究的數量較少,樣本量較小,且某些納入文獻存在一定的方法學缺陷和臨床異質性等原因,認為針灸干預PD暫時無法得出可靠結論,但通過更新[9,44]也明確了針灸干預的優勢;僅1篇文獻認為針藥結合療效優于單獨使用藥物[25],但針灸與安慰針刺比較未體現出明顯優勢(已有最新文獻[44]顯示針刺療效優于安慰針刺),這可能與針灸的安慰劑效應有關,同時,由于該研究進行時,采用安慰針刺進行對照的RCT數量較少,樣本量較小,該SR/MA僅納入了4篇文獻共174例樣本,且其中3篇文獻來源于國外,其發表偏倚也可能與結果的差異有一定關系。從主要結局指標來看,大部分證據顯示,針灸療法單獨治療或聯合藥物治療PD優于單獨使用藥物,僅1篇文獻[21]的合并分析結果顯示艾灸治療PD的UPDRS總分并未體現出優勢,這一結果與其他結果的差異原因可能與納入研究的樣本量小、使用的艾灸方法不統一有關。次要結局指標的結果同樣顯示針灸療法在改善患者的精神、情緒、生活質量、運動能力等方面更具有優勢,1篇文獻[36]在UPDRS Ⅰ評分上得出的結論略有不同,但其僅納入的兩項RCT發表時間較早,樣本量小且干預方式區別較大,證據質量評級低,因此該合并分析的結果并不能否定針灸的療效。
本研究使用AMASTAR 2量表評價納入文獻的方法學質量時發現,在研究前期方案注冊、納入研究類型的解釋、結果合并分析方法和偏倚風險影響的調查等方面,納入SR/MA存在報告不充分或者未報告的缺陷。25篇文獻[16-36, 39-41,43]在進行系統評價前未制定SR/MA的研究方案。高質量的SR/MA需要在開展研究之前就確定研究計劃,并在二次研究的注冊平臺進行注冊;撰寫時也應該對實施過程中與研究計劃不一致的情況進行詳細描述,以減少評價過程中的偏倚風險。所有文獻均未對納入研究的類型進行解釋。在評估某一干預措施的療效時,若RCT數量不足、結局指標缺失、統計效能不足,系統評價可以納入非隨機干預研究作為補充,盡管出于對結果的可靠性和嚴謹性的考慮,現有的SR/MA都只納入設計與實施都相對嚴謹RCT作為療效評價的證據,但是否考慮納入非隨機干預研究作為補充,也需要在進行SR/MA報告時對相關考量有所體現[13]。當Meta分析有異質性時,19篇文獻[16-17,19,21-24,26,28-30,32-33,35,38-39,41-43]未對納入RCT的異質性原因進行分析和報告。由于研究間存在的高異質性提示合并分析的結果可能是不可靠的,因此當Meta分析存在異質性時,嚴謹的研究需要對異質性來源進行探究,必要時進行亞組分析或剔除其中導致高異質性的某項或某幾項研究,才能使合并分析的結果更為可靠[45]。
從PRISMA評價結果中我們發現,納入的SR/MA的報告集中在中等質量區間。28篇文獻中,13篇文獻[18,21,23-24,27-28,30,32,37-39,42-43]的報告相對完全,14篇文獻[16-17,19-20,22,25,29,31,33-36,40-41]的報告有一定缺陷,1篇文獻[26]的報告存在嚴重缺陷。在27個條目中,所有文獻均較為全面的報告了文章的局限性和結論;報告的質量問題主要表現在摘要、檢索、其他分析和證據總結等方面。結構式摘要信息不全是所有文獻的共同問題,幾乎所有研究都未在結構式摘要中表述齊全。摘要是文章內容的濃縮,信息簡明的摘要能使讀者快速明確文獻的主要內容,因此,在對研究進行報告時簡潔且概括全面的摘要必不可少[46]。17篇文獻[16-17,19-22,24-25,27-31,33,37-38,40]只提到了檢索的數據庫、關鍵詞,而未提供詳細檢索式,或只進行了電子檢索;2篇文獻[26,36]只提供了檢索數據庫的名稱。在進行檢索時,對灰色文獻的檢索能有效減少發表偏倚的影響,而完整的數據檢索策略也是納入研究的全面性的保證,因此,報告的撰寫應該提供完整文獻檢索的策略并盡量檢索相應的灰色文獻,從而避免可能存在的發表偏倚對結果的影響[13]。所有文獻均未報告納入RCT的資金來源。研究的資金來源是評議專家和讀者把握研究是否存在利益沖突和發表偏倚的依據,因此SR/MA在撰寫時需要重視相應的報告,以期對相關結果的可靠性有更客觀的把握。
經GRADE工具評估,126次結局指標的報告中有1個高級別指標,12個中級別指標,大多數證據質量為低級別和極低級別,降級原因以研究的局限性為主,其次則是發表偏倚和不精確性。126次報告中選用UPDRS評分的結局指標最多。被評為高質量或中等質量的證據被認為是相對可靠的[47],這13個相對可靠的證據提示針灸對于PD的有效率優于藥物治療,針灸及針灸聯合藥物治療PD在減輕癥狀、降低UPDRS評分和Webster評分方面都具有優勢。但納入的絕大多數證據都因偏倚風險而降級,主要是由于研究對隨機、盲法、分配隱藏等的實施以及失訪和退出情況報告不充分,且文獻所納入的多數原始研究存在發表偏倚。在進行系統評價時,研究者對于原始文獻在隨機、盲法、分配隱藏和發表偏倚等方面需要進行評估和報告,以提供更完整的信息,提高結果的可靠性。部分文獻納入的原始研究樣本量不大,但效應量差異較大,可信區間重合度低,使得結果具有不精確性。此外,一些原始文獻數據的異質性大,分析時又未對高異質性的結果進行進一步處理,也是導致指標繼續降級的原因。這些問題提示研究者,SR/MA應盡可能全面地描述納入RCT的特征,以助于明確異質性來源,從而對結果進行更客觀合理的分析。
盡管納入研究的結局指標級別普遍不高,但在對文獻進行評估時,依舊可以發現,隨著研究的增加,針灸干預PD的SR/MA的證據質量有所提升,具體如下:在研究的局限性方面,近年的文獻對于隨機、盲法、分配隱藏等的報告呈逐步上升趨勢;作為使多數結局指標降級的重要原因,對異質性的處理在近幾年的文章中也是逐漸規范和細化,與早年的文章相比,近年有更多的文章在發現異質性時對其來源進行了調查并嘗試了亞組分析。可見,針灸干預PD的SR/MA文獻質量在隨研究的進展而不斷提高。
本研究納入近30年來針灸干預PD的相關SR/MA,結果提示針灸干預有利于改善PD各種癥狀,為臨床選擇針灸干預PD提供了證據支持。為了提高證據可信度,我們只納入了RCT的SR/MA。本研究評價的目標干預措施涵蓋了手針、電針、頭針、艾灸等多種針灸干預方式,可作為臨床工作者選用時的參考。為了盡量減少研究過程中的潛在偏倚,我們的文獻篩選、資料提取和質量評估等工作均由2名研究者獨立進行。
本研究同樣存在一定的局限性:① 由于PD本身的特點,干預前后的癥狀和體征大多只能通過量表進行評定,而量表評價又受主觀因素的制約,不同研究人員對于量表的條目理解可能有所差異,因此結果仍可能存在一定的主觀性。② 納入的SR/MA大多存在質量和偏倚問題,未來的研究很可能對現有證據產生重大影響,并可能改變評估結果。③ 由于語言方面的限制,故僅對中、英文數據庫進行了檢索,可能存在一定的選擇性偏倚。
綜上,目前文獻結論提示針灸干預PD具有臨床優勢,但是鑒于當前證據質量并不理想,相關結果仍需通過高質量,大樣本的RCT進行驗證。