引用本文: 王曉宇, 王虎城, 劉蕾蕾, 李華南, 孫慶, 張瑋, 王金貴. 小兒推拿類系統評價/Meta 分析的質量評價. 中國循證醫學雜志, 2019, 19(9): 1106-1112. doi: 10.7507/1672-2531.201901086 復制
目前,如何避免藥物給兒童帶來的可能性傷害日益受到家長重視,小兒推拿療法因其非藥物療法的特性逐漸被患者、臨床和科研人員所關注,在預防和治療兒童疾病中的應用越來越廣泛[1]。小兒推拿不但在防治兒童消化、呼吸及神經系統等疾病中發揮著重要作用[2],而且在治療新生兒疾病如新生兒營養不良、新生兒黃疸等方面也獨具特色[3]。高質量的系統評價(systematic review,SR)/Meta 分析(meta-analysis,MA)作為最佳證據,可有效評價干預措施臨床療效和指導臨床決策[4]。但目前面臨 SR/MA 量大但質量較差的嚴峻現實[5]。因此,對 SR/MA 進行質量評價顯得尤為重要,針灸[6]、護理學[7]、醫院藥學[8]、兒科[9]和口腔醫學[10]等領域已有相應 SR/MA 的質量評價發表,但小兒推拿尚未涉及。
本研究采用國際 SR/MA 方法學質量評價量表(a measurement tool to assess systematic reviews,AMSTAR2)[11]和報告質量評價(preferred reporting items for systematic reviews and meta-analyses,PRISMA)[12]聲明對已經發表的小兒推拿類 SR/MA 進行評價,以期了解其現狀和存在問題,為提高小兒推拿類 SR/MA 質量提供參考依據。
1 資料與方法
1.1 納入與排除標準
納入標準:涉及小兒推拿研究領域已公開發表在國內外期刊上的 SR/MA 文獻。排除標準:① 理論探討、方法學、教育學研究或文獻評價;② 進展、綜述、摘要、譯文;③ 重復發表文獻。
1.2 文獻檢索策略
計算機檢索 CBM、VIP、CNKI、WanFang Data、PubMed、EMbase 和 The Cochrane Library 數據庫,搜集已發表的小兒推拿類系統評價/Meta 分析,檢索時限均從建庫至 2018 年 12 月 10 日。同時追蹤所有納入文章的參考文獻,以補充獲取相關文獻。中文檢索詞包括:推拿、手法、按摩、小兒、嬰兒、寶貝、孩子、系統評價、Meta 分析、薈萃分析、系統綜述等;英文檢索詞包括:massage、tuina、zone therap*、pediatric、children、child、infant、baby、meta analysis、meta-analysis、systematic review 等。檢索采用主題詞與自由詞結合的方式進行,檢索策略經過多次預檢索后確定。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 名經過相關培訓的研究人員(王曉宇和王虎城)獨立對檢索到的文獻題目和摘要進行初篩,排除不符合納入標準的文獻。對初篩無法確定是否保留的文獻,通過查找全文再進行篩選。如遇分歧,則通過討論或參考第三名研究人員的意見達成一致。再由這兩名研究者采用統一的資料提取表,利用 Excel 2016 進行數據提取,提取內容包括:① 基本資料:標題、作者、發表時間、疾病病種、干預措施、對照措施、不良反應、研究結果;② 方法學質量評價的相關條目;③ 報告質量評價的相關條目。
1.4 文獻質量評價
1.4.1 方法學質量評價
2007 年發布的 AMSTAR 量表是實用性較好的評估 SR/MA 方法學質量的工具。2017 年 9 月其工作組重新修訂并正式發表了 AMSTAR2,具有較好的評價者間一致性和實用性。新的量表包含 16 個條目,其中 7 個條目為關鍵條目,系統評價的總體質量即對總的評價結果進行分級,根據評價標準的滿足程度評價為“是”、“部分是”和“否”,重點考慮關鍵條目的方法學質量,以判斷其總體質量[13, 14]。
1.4.2 報告質量評價
PRISMA 聲明旨在幫助作者改善 SR/MA 的報告質量,也適用于評價報告質量,確保報告的規范性、清晰度和完整度[15]。PRISMA 聲明計分方法為:每個條目“完全報告”記 1 分、“部分報告”記 0.5 分、“未報告”記 0 分,質量認定標準為:總評分“21.5~27 分”為相對完整,“15.5~21 分”為一定缺陷,“15 分以下”為嚴重缺陷[16]。
1.5 統計分析
采用 Excel 2016 軟件逐條記錄文獻相關信息,統計 AMSTAR2 量表評為“是”、“否”和“部分是”的條目百分率和 PRISMA 量表評為“充分”、“部分符合”及“不符合”的條目百分率,整個文獻的質量評分用均數±標準差(±SD)表示。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 365 篇,經逐層篩選,最終納入 18 篇文獻[17-34],其中中文文獻 14 篇[17-19, 21-24, 26-29, 31, 32, 34]、英文文獻 4 篇[20, 25, 30, 33]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本特征
納入 SR/MA 發表時間分布于 2012~2018 年。其中 14 篇(77.8%)采用 Cochrane 協作網推薦的偏倚風險評價工具[35]、5 篇(27.8%)采用 Jadad 量表[36]評價原始研究的偏倚風險。按研究病種分類(ICD-10),干預病種涉及 5 個系統疾病,其中消化系統疾病(K00-K93)9 篇(50%)、呼吸系統疾病(J00-J99)5 篇(27.8%)、泌尿系統(N00-N99)1 篇(5.6%)、神經系統疾病(G00-G99)1 篇(5.6%)、其他 2 篇。研究結論上,有 3 個研究報告明確提出無足夠證據證明干預組有效;有 15 個研究認為證據可支持干預組療效更好,但還需要高質量研究進一步驗證。9 個研究評價了安全性,均認為推拿療法較藥物治療更安全,僅 2 篇英文文獻提到了小兒推拿的不良反應,如:皮疹、不適、哭泣等,報告了不良反應的文獻有 4 篇方法學質量評價為低質量,5 篇報告質量為相對完整(表 1)。

2.3 納入研究的方法學質量評價
采用 AMSTAR2 量表對納入文獻進行方法學質量評價(表 2),結果顯示:較為完整報告的是條目 1“研究問題和納入標準”(94.5%)、條目 5“文獻篩選”(94.5%)與條目 6“數據提取”(94.5%);而存在問題最多的是條目 3“納入研究設計類型的原因”,納入文獻中均未提及,忽視對研究設計選擇類型依據的解釋。AMSTAR2 中的 7 個關鍵條目:條目 2“前期研究方案”無 1 篇回答為“是”,這增加了偏倚風險,也無法幫助讀者了解研究計劃的具體實施情況;條目 4“全面檢索”僅 1 篇[21]回答為“是”,缺乏對文獻檢索的詳細描述及灰色文獻的處理;條目 7“排除文獻清單及理由”無 1 篇回答為“是”,存在選擇性偏倚令讀者無法判斷排除文獻的質量;條目 9“偏倚風險評估方法”僅 2 篇[24, 32]回答為“是”,忽視對潛在偏倚風險的評估描述且評估有較大的主觀性,可信度較低;條目 11“統計學分析方法”14 篇[17, 19, 20, 22, 24-33]回答為“是”,較為正確的使用了數據合成分析;條目 13“納入研究的偏倚風險”11 篇[17, 19, 20, 24-26, 28-30, 32, 33]回答為“是”,部分文獻未合理解釋和討論偏倚風險對結果的影響;條目 15“充分評價發表偏倚及影響”8 篇[20, 24, 25, 28-30, 32, 33]回答為“是”,大部分文獻忽視對發表偏倚的檢測及解釋討論;由此可以總結得出關鍵條目的全面總結描述缺失比較嚴重,從而降低了 SR/MA 的方法學質量。按質量認定標準劃分:低質量 6 篇(33.3%),極低質量 12 篇(66.7%)。

2.4 納入研究的報告質量評價
采用 PRISMA 聲明對納入文獻進行報告質量評價(表 3),其結果顯示:充分報告數量最多的研究[33],滿足 22 條;充分報告數量最少的研究[22],僅滿足 9 條。條目 1“題目”和條目 26“結論”充分報告占比最高(100%);其次為條目 2“結構式摘要”、條目 4“目的”、條目 14“合成結果”,占比為 94.5%;條目 7“信息來源”均未充分報告,未對每次檢索及最終檢索的結果描述所有文獻信息的來源;條目 8“檢索”部分報告占比最高(88.9%),大多數部分報告了信息來源和檢索方法,不利于讀者的檢索重現,未滿足 SR /MA 文獻檢索查新、查全、查準的要求;條目 5“方案和注冊”未報告占比最高(88.9%),缺乏詳細的系統評價方案和注冊信息,不利于以后的研究者進行及時的更新;條目 22“研究間偏倚風險”和條目 23“補充分析”分別占 61.1% 和 55.6%。

大部分存在研究間偏倚控制不夠,缺乏對異質性的恰當處理,以及敏感性分析、亞組分析的運用;條目 27“資金”報告占比 50%,一半研究報道了資金來源,但均未描述資金提供者在其中所扮演的角色及利益沖突可能對結果產生的影響。報告評分中位數為 20.75 分(13.5~23.5 分),平均分為 20.92±2.36 分。按質量認定標準劃分:相對完整 7 篇(38.9%),一定缺陷 10 篇(55.6%),嚴重缺陷 1 篇(5.6%)。
3 討論
本研究納入的文獻從發表時間分布上呈遞增的趨勢,表明小兒推拿研究近年熱度和關注度不斷增加[37]。從干預病種來看,小兒推拿用于不同病種,可見小兒推拿研究廣度和深度不斷擴大。從安全性評價角度看,原始文獻及 SR/MA 對于不良反應等不利結局指標的報告較少,忽視兒童在接受推拿治療過程中的獲得感受。因納入研究的方法學質量較低,考慮到推拿和兒科疾病的特殊性,其研究結論需要高質量研究進一步驗證。
本研究發現,小兒推拿類 SR/MA 的方法學質量和報告質量整體較低,這與國內社區干預和護理的研究結果相當[38, 39]。
對于方法學質量,在 PICO 要素的描述和文獻篩選及數據提取較為完整,但也有以下不足:① 所有研究均未詳細描述納入研究類型,僅部分提供前期方案和利益沖突;② 大部分研究在文獻檢索、納入研究基本特征和發表偏倚評估方面的方法學使用不嚴謹(如文獻檢索不全面,未納入灰色文獻,缺乏對納入研究基本特征的詳細描述以及偏倚評估的詳細描述及誤評);③ 大部分研究未詳細提供排除清單及理由,對數據結果分析和納入研究的偏倚風險未能詳細解釋說明,證據可信度有待考證。建議相關 SR 制作者事先制定計劃書,認真學習 AMSTAR2 條目規范,嚴格控制偏倚風險,從而提高方法學質量。
對于報告質量,在“題目”、“摘要”、“目的”、“結果合成”、“結論報告”較為詳細闡述,文章主體結構較為完整,但也存在如下問題:“未進行方案和注冊”、“信息來源未說明”“檢索策略無法重現”、“效應指標處理未合理說明”、“偏倚風險的報告”“資金支持缺乏闡述”等。建議相關研究者認真學習和理解 PRISMA 聲明的相關條目,嚴格按照規范報告文章內容,努力提高報告質量。此外,大部分研究在結論部分提及受限于原始文獻數量較少、質量較低,導致結論證據強度較低,主要為研究設計不合理,隨機、盲法、分配隱藏的描述不清,主觀指標過多,未結合推拿的特點等,這需要小兒推拿工作者從源頭上規范原始文獻質量,開展高質量試驗,提高小兒推拿學研究整體水平。
本研究的局限性:① 量表評價有明顯的主觀性,盡管研究前對評價人員進行相關培訓和預評價,仍可能在具體實施評價過程中產生部分偏倚;② 納入文獻受期刊版面限制,未能詳細描述報告,導致偏倚產生。結論雖具有一定局限性,但對于規范小兒推拿研究者實施 SR/MA 有一定的指導作用。
綜上所述,小兒推拿類 SR /MA 的方法學質量和報告質量整體較低,建議對相關臨床工作人員及 SR/MA 制作者進行相關培訓,提高臨床研究和 SR/MA 質量,進一步指導臨床工作。
目前,如何避免藥物給兒童帶來的可能性傷害日益受到家長重視,小兒推拿療法因其非藥物療法的特性逐漸被患者、臨床和科研人員所關注,在預防和治療兒童疾病中的應用越來越廣泛[1]。小兒推拿不但在防治兒童消化、呼吸及神經系統等疾病中發揮著重要作用[2],而且在治療新生兒疾病如新生兒營養不良、新生兒黃疸等方面也獨具特色[3]。高質量的系統評價(systematic review,SR)/Meta 分析(meta-analysis,MA)作為最佳證據,可有效評價干預措施臨床療效和指導臨床決策[4]。但目前面臨 SR/MA 量大但質量較差的嚴峻現實[5]。因此,對 SR/MA 進行質量評價顯得尤為重要,針灸[6]、護理學[7]、醫院藥學[8]、兒科[9]和口腔醫學[10]等領域已有相應 SR/MA 的質量評價發表,但小兒推拿尚未涉及。
本研究采用國際 SR/MA 方法學質量評價量表(a measurement tool to assess systematic reviews,AMSTAR2)[11]和報告質量評價(preferred reporting items for systematic reviews and meta-analyses,PRISMA)[12]聲明對已經發表的小兒推拿類 SR/MA 進行評價,以期了解其現狀和存在問題,為提高小兒推拿類 SR/MA 質量提供參考依據。
1 資料與方法
1.1 納入與排除標準
納入標準:涉及小兒推拿研究領域已公開發表在國內外期刊上的 SR/MA 文獻。排除標準:① 理論探討、方法學、教育學研究或文獻評價;② 進展、綜述、摘要、譯文;③ 重復發表文獻。
1.2 文獻檢索策略
計算機檢索 CBM、VIP、CNKI、WanFang Data、PubMed、EMbase 和 The Cochrane Library 數據庫,搜集已發表的小兒推拿類系統評價/Meta 分析,檢索時限均從建庫至 2018 年 12 月 10 日。同時追蹤所有納入文章的參考文獻,以補充獲取相關文獻。中文檢索詞包括:推拿、手法、按摩、小兒、嬰兒、寶貝、孩子、系統評價、Meta 分析、薈萃分析、系統綜述等;英文檢索詞包括:massage、tuina、zone therap*、pediatric、children、child、infant、baby、meta analysis、meta-analysis、systematic review 等。檢索采用主題詞與自由詞結合的方式進行,檢索策略經過多次預檢索后確定。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 名經過相關培訓的研究人員(王曉宇和王虎城)獨立對檢索到的文獻題目和摘要進行初篩,排除不符合納入標準的文獻。對初篩無法確定是否保留的文獻,通過查找全文再進行篩選。如遇分歧,則通過討論或參考第三名研究人員的意見達成一致。再由這兩名研究者采用統一的資料提取表,利用 Excel 2016 進行數據提取,提取內容包括:① 基本資料:標題、作者、發表時間、疾病病種、干預措施、對照措施、不良反應、研究結果;② 方法學質量評價的相關條目;③ 報告質量評價的相關條目。
1.4 文獻質量評價
1.4.1 方法學質量評價
2007 年發布的 AMSTAR 量表是實用性較好的評估 SR/MA 方法學質量的工具。2017 年 9 月其工作組重新修訂并正式發表了 AMSTAR2,具有較好的評價者間一致性和實用性。新的量表包含 16 個條目,其中 7 個條目為關鍵條目,系統評價的總體質量即對總的評價結果進行分級,根據評價標準的滿足程度評價為“是”、“部分是”和“否”,重點考慮關鍵條目的方法學質量,以判斷其總體質量[13, 14]。
1.4.2 報告質量評價
PRISMA 聲明旨在幫助作者改善 SR/MA 的報告質量,也適用于評價報告質量,確保報告的規范性、清晰度和完整度[15]。PRISMA 聲明計分方法為:每個條目“完全報告”記 1 分、“部分報告”記 0.5 分、“未報告”記 0 分,質量認定標準為:總評分“21.5~27 分”為相對完整,“15.5~21 分”為一定缺陷,“15 分以下”為嚴重缺陷[16]。
1.5 統計分析
采用 Excel 2016 軟件逐條記錄文獻相關信息,統計 AMSTAR2 量表評為“是”、“否”和“部分是”的條目百分率和 PRISMA 量表評為“充分”、“部分符合”及“不符合”的條目百分率,整個文獻的質量評分用均數±標準差(±SD)表示。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 365 篇,經逐層篩選,最終納入 18 篇文獻[17-34],其中中文文獻 14 篇[17-19, 21-24, 26-29, 31, 32, 34]、英文文獻 4 篇[20, 25, 30, 33]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本特征
納入 SR/MA 發表時間分布于 2012~2018 年。其中 14 篇(77.8%)采用 Cochrane 協作網推薦的偏倚風險評價工具[35]、5 篇(27.8%)采用 Jadad 量表[36]評價原始研究的偏倚風險。按研究病種分類(ICD-10),干預病種涉及 5 個系統疾病,其中消化系統疾病(K00-K93)9 篇(50%)、呼吸系統疾病(J00-J99)5 篇(27.8%)、泌尿系統(N00-N99)1 篇(5.6%)、神經系統疾病(G00-G99)1 篇(5.6%)、其他 2 篇。研究結論上,有 3 個研究報告明確提出無足夠證據證明干預組有效;有 15 個研究認為證據可支持干預組療效更好,但還需要高質量研究進一步驗證。9 個研究評價了安全性,均認為推拿療法較藥物治療更安全,僅 2 篇英文文獻提到了小兒推拿的不良反應,如:皮疹、不適、哭泣等,報告了不良反應的文獻有 4 篇方法學質量評價為低質量,5 篇報告質量為相對完整(表 1)。

2.3 納入研究的方法學質量評價
采用 AMSTAR2 量表對納入文獻進行方法學質量評價(表 2),結果顯示:較為完整報告的是條目 1“研究問題和納入標準”(94.5%)、條目 5“文獻篩選”(94.5%)與條目 6“數據提取”(94.5%);而存在問題最多的是條目 3“納入研究設計類型的原因”,納入文獻中均未提及,忽視對研究設計選擇類型依據的解釋。AMSTAR2 中的 7 個關鍵條目:條目 2“前期研究方案”無 1 篇回答為“是”,這增加了偏倚風險,也無法幫助讀者了解研究計劃的具體實施情況;條目 4“全面檢索”僅 1 篇[21]回答為“是”,缺乏對文獻檢索的詳細描述及灰色文獻的處理;條目 7“排除文獻清單及理由”無 1 篇回答為“是”,存在選擇性偏倚令讀者無法判斷排除文獻的質量;條目 9“偏倚風險評估方法”僅 2 篇[24, 32]回答為“是”,忽視對潛在偏倚風險的評估描述且評估有較大的主觀性,可信度較低;條目 11“統計學分析方法”14 篇[17, 19, 20, 22, 24-33]回答為“是”,較為正確的使用了數據合成分析;條目 13“納入研究的偏倚風險”11 篇[17, 19, 20, 24-26, 28-30, 32, 33]回答為“是”,部分文獻未合理解釋和討論偏倚風險對結果的影響;條目 15“充分評價發表偏倚及影響”8 篇[20, 24, 25, 28-30, 32, 33]回答為“是”,大部分文獻忽視對發表偏倚的檢測及解釋討論;由此可以總結得出關鍵條目的全面總結描述缺失比較嚴重,從而降低了 SR/MA 的方法學質量。按質量認定標準劃分:低質量 6 篇(33.3%),極低質量 12 篇(66.7%)。

2.4 納入研究的報告質量評價
采用 PRISMA 聲明對納入文獻進行報告質量評價(表 3),其結果顯示:充分報告數量最多的研究[33],滿足 22 條;充分報告數量最少的研究[22],僅滿足 9 條。條目 1“題目”和條目 26“結論”充分報告占比最高(100%);其次為條目 2“結構式摘要”、條目 4“目的”、條目 14“合成結果”,占比為 94.5%;條目 7“信息來源”均未充分報告,未對每次檢索及最終檢索的結果描述所有文獻信息的來源;條目 8“檢索”部分報告占比最高(88.9%),大多數部分報告了信息來源和檢索方法,不利于讀者的檢索重現,未滿足 SR /MA 文獻檢索查新、查全、查準的要求;條目 5“方案和注冊”未報告占比最高(88.9%),缺乏詳細的系統評價方案和注冊信息,不利于以后的研究者進行及時的更新;條目 22“研究間偏倚風險”和條目 23“補充分析”分別占 61.1% 和 55.6%。

大部分存在研究間偏倚控制不夠,缺乏對異質性的恰當處理,以及敏感性分析、亞組分析的運用;條目 27“資金”報告占比 50%,一半研究報道了資金來源,但均未描述資金提供者在其中所扮演的角色及利益沖突可能對結果產生的影響。報告評分中位數為 20.75 分(13.5~23.5 分),平均分為 20.92±2.36 分。按質量認定標準劃分:相對完整 7 篇(38.9%),一定缺陷 10 篇(55.6%),嚴重缺陷 1 篇(5.6%)。
3 討論
本研究納入的文獻從發表時間分布上呈遞增的趨勢,表明小兒推拿研究近年熱度和關注度不斷增加[37]。從干預病種來看,小兒推拿用于不同病種,可見小兒推拿研究廣度和深度不斷擴大。從安全性評價角度看,原始文獻及 SR/MA 對于不良反應等不利結局指標的報告較少,忽視兒童在接受推拿治療過程中的獲得感受。因納入研究的方法學質量較低,考慮到推拿和兒科疾病的特殊性,其研究結論需要高質量研究進一步驗證。
本研究發現,小兒推拿類 SR/MA 的方法學質量和報告質量整體較低,這與國內社區干預和護理的研究結果相當[38, 39]。
對于方法學質量,在 PICO 要素的描述和文獻篩選及數據提取較為完整,但也有以下不足:① 所有研究均未詳細描述納入研究類型,僅部分提供前期方案和利益沖突;② 大部分研究在文獻檢索、納入研究基本特征和發表偏倚評估方面的方法學使用不嚴謹(如文獻檢索不全面,未納入灰色文獻,缺乏對納入研究基本特征的詳細描述以及偏倚評估的詳細描述及誤評);③ 大部分研究未詳細提供排除清單及理由,對數據結果分析和納入研究的偏倚風險未能詳細解釋說明,證據可信度有待考證。建議相關 SR 制作者事先制定計劃書,認真學習 AMSTAR2 條目規范,嚴格控制偏倚風險,從而提高方法學質量。
對于報告質量,在“題目”、“摘要”、“目的”、“結果合成”、“結論報告”較為詳細闡述,文章主體結構較為完整,但也存在如下問題:“未進行方案和注冊”、“信息來源未說明”“檢索策略無法重現”、“效應指標處理未合理說明”、“偏倚風險的報告”“資金支持缺乏闡述”等。建議相關研究者認真學習和理解 PRISMA 聲明的相關條目,嚴格按照規范報告文章內容,努力提高報告質量。此外,大部分研究在結論部分提及受限于原始文獻數量較少、質量較低,導致結論證據強度較低,主要為研究設計不合理,隨機、盲法、分配隱藏的描述不清,主觀指標過多,未結合推拿的特點等,這需要小兒推拿工作者從源頭上規范原始文獻質量,開展高質量試驗,提高小兒推拿學研究整體水平。
本研究的局限性:① 量表評價有明顯的主觀性,盡管研究前對評價人員進行相關培訓和預評價,仍可能在具體實施評價過程中產生部分偏倚;② 納入文獻受期刊版面限制,未能詳細描述報告,導致偏倚產生。結論雖具有一定局限性,但對于規范小兒推拿研究者實施 SR/MA 有一定的指導作用。
綜上所述,小兒推拿類 SR /MA 的方法學質量和報告質量整體較低,建議對相關臨床工作人員及 SR/MA 制作者進行相關培訓,提高臨床研究和 SR/MA 質量,進一步指導臨床工作。