引用本文: 秦嘉欣, 陳濤, 車剛, 王涵, 許志飛, 劉雅莉. 兒童新冠指南的質量評價. 中國循證醫學雜志, 2022, 22(4): 457-462. doi: 10.7507/1672-2531.202112046 復制
據世界衛生組織監測數據顯示,截至2021年11月12日,全球已報告新型冠狀病毒疾病(corona virus disease 2019,COVID-19)確診病例2.51億,死亡人數已達507.8萬[1]。近期報告的COVID-19兒童病例占比呈上升趨勢,2020年1月,5歲以下和5~14歲病例分別占1.0%和2.5%,而2021年7月,分別升至2.0%和8.7%[2]。在臨床工作中,高質量指南能指導臨床醫生更科學、更規范地診療疾病,為患者帶來更合理、更個體化的診療方案。但低質量指南使臨床決策和診療措施與臨床最佳證據之間相差甚遠,給臨床醫生和患者帶來雙重傷害。近兩年來,國內外發表的指導診治兒童COVID-19的臨床指南日益增多,但現有指南對于兒童確診病例的流行病學和癥狀學等方面的描述仍不足[3],提出的干預措施缺乏針對性[4],加之指南本身的形成也受到多種因素影響,所以目前兒童COVID-19診療指南質量仍有待提高。本研究采用國際公認評價指南方法學質量工具(appraisal of guidelines research and evaluation Ⅱ,AGREE Ⅱ)評價國內外已發表兒童新冠指南的方法學質量,以期為相關指南的制訂提供參考依據。
1 資料與方法
1.1 納入和排除標準
1.1.1 納入標準
① 研究對象:診斷為COVID-19的兒童;② 研究類型:臨床實踐指南;③ 如果兩篇指南存在更新關系,則只納入最新版本。
1.1.2 排除標準
① 非中、英文文獻;② 專家共識、草案等;③ 內容不完整的指南;④ 國內外指南的二次研究版本;⑤ 指南人群包括兒童,但無針對兒童的推薦意見。
1.2 文獻檢索策略
計算機檢索PubMed、CBM、CNKI、VIP、WanFang Data、Medlive、NGC、GIN、NICE數據庫,搜集國內外發表的兒童新冠指南,檢索時限均為建庫至2021年10月1日。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。中文檢索詞包括:兒童、嬰兒、新型冠狀病毒、2019冠狀病毒、指南等;英文檢索詞包括:child、infant、adolescent、SARS-CoV-2、COVID-19、guideline等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:指南名稱、通信作者、發表(更新)時間、制訂單位、發表期刊、利益沖突和資助情況等。如果存在信息不全或閱讀權限的情況,通過郵件聯系作者以獲取。
1.4 納入指南的方法學質量評價
由2名研究者獨立采用AGREE Ⅱ[5]對納入指南進行方法學質量評價。該評價工具包含6個領域共23個條目,每個條目的分數范圍為1~7分,6個領域的領域分值=(實際分數–最低可能得分)/(最高可能得分–最低可能得分)。
1.5 統計分析
1.5.1 組內相關系數(interclass correlation coefficient,ICC)
ICC[6-8]是衡量和評價兩位評價員之間信度和復測信度的系數指標之一。ICC值介于0到1之間,如果ICC值小于0.4,那么兩組數據的一致性較差;如果ICC值大于0.75,那么兩組數據的一致性較好。我們選擇雙向隨機模型對兩組數據進行一致性評價。
1.5.2 數據處理方法
采用SPSS 26.0軟件對不同條目評分進行數據可靠性分析,通過對兩列變量的ICC值范圍的判斷,來確定兩組數據是否具有顯著的差異性。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻1 646篇,經逐層篩選,納入24部指南[9-32],其中3部指南存在更新版本[9,29-30],因此最終納入21部指南[10-28,31-32]進行AGREE Ⅱ評價。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入指南的基本特征
見表1。

2.3 納入指南的質量評價結果
納入21部指南在6個領域的平均領域分值依次是:62.70%、36.24%、20.34%、50.42%、22.12%、53.17%(表2)。國內外兒童新冠指南對比見表3。


2.3.1 范圍和目的
該領域包括指南的總目的、衛生問題、適用人群。21部指南在此領域得分較高,平均分值為70.28%。但在指南所涵蓋的衛生問題這一條目中,所有指南均只說明了相關問題,缺乏對結局和設施環境的描述;在指南的適用人群這一條目,僅1部指南[13]描述了患者的納入和排除標準及涉及的基本分期,其余指南僅描述了人群特征。
2.3.2 參與人員
該領域包括指南開發小組人員信息及分工、收集目標人群的觀點和選擇意愿、指南的使用者。其中3部(14.29%)指南[12,14,22]完整描述了指南制訂成員的姓名、學科/專業、所在機構、充當角色、地理位置,而其他指南都闡述不完整。僅2部(9.52%)指南[22-23]考慮了患者的意愿和價值觀。
2.3.3 制訂的嚴謹性
該領域包含8個條目,用于評估指南在制訂過程中的步驟是否規范,從制訂納入和排除標準、檢索證據、評價與合成證據,到形成推薦意見的影響因素及方法,以及指南后期外審及更新等方面全面評價。納入指南中僅5部(23.81%)[11,14,22-23,27]描述了證據檢索的方法并提供了檢索策略,僅1部(4.76%)[22]較為清晰地說明了篩選證據的標準。
2.3.4 表達明晰性
該領域包含3個條目,主要和指南的語言和格式有關,包括推薦意見明確、清晰,具體列舉了不同的選擇或者衛生問題,以及容易識別重要的推薦建議。大多指南的推薦意見都比較具體,并且可以根據衛生問題提出各種方案,平均領域分值為49.88%,但2部指南[16,20]提供的方案較為單一。
2.3.5 應用性
該領域包括4個條目,涵蓋在實施指南過程中可能遇到的組織、行為和成本問題,包括對推廣和實施指南的障礙的描述,提出實施建議的意見和/或工具,審查執行建議的潛在相關資源,提交監督和/或審計標準。納入指南在該領域的平均得分為21.46%,得分較低,幾乎所有指南都沒有考慮到適用和推廣,也很少說明在執行建議方面可能投入的資源。
2.3.6 編輯獨立性
該領域包括2個條目,涉及到推薦建議的獨立性和記載指南制訂組中可能存在的利益沖突,包括贊助單位的觀點不影響指南的內容及指南開發小組成員的利益沖突要記載并公布。納入指南該領域平均領域分值為59.58%,有6部(28.57%)指南[11-12,15-16,22,27]明確說明了基金資助單位的觀點沒有影響指南的具體內容,記錄并強調了指南制訂組織成員的利益沖突,但其余指南均表達得不清楚或者完全未涉及。
2.4 結果可靠性分析
對2名評價員的評分一致性檢驗結果為[ICC=0.948,95%CI(0.927,0.962),F=36.752,P<0.001],提示評價一致性較好,對評分條目的理解相同,評價結果的信度較高。
3 討論
臨床研究結果表明,新冠病毒感染的兒童通常表現為輕度癥狀,常見癥狀為咳嗽和發熱,有些兒童呼吸道癥狀并不顯著,主要表現為呼吸系統以外的癥狀[33]。因此,對兒童新冠病毒感染的診斷和治療應與成人有所區別,需要制訂專門的診療規范。
本研究以AGREE Ⅱ條目為標準,對國內外已發表的兒童新冠指南進行質量評價。共納入21部指南,其中10部為多國合作制訂,6部針對成人和兒童,15部僅針對于兒童制訂。19部指南的用戶人群均為兒科醫生,其余指南還針對檢驗科醫生、護理工作者等。
本研究發現我國制訂指南的平均領域分值和國外制訂指南差異無統計學意義,說明我國兒童新冠指南的方法學質量與國際水平接近。但納入所有指南的方法學質量均有提升的空間。在AGREE Ⅱ評價領域中,范圍和目的、獨立性、清晰性領域的分值比較高,而參與人員、制訂的嚴謹性和應用性的分值均較低。尤其是制訂嚴謹性這一領域,該領域反應指南產生臨床推薦意見的過程是否規范化及證據質量高低,該領域分值較低主要是由于新冠肺炎是一個突發性傳染性疾病,在流行早期臨床證據以觀察類研究為主。對于指南所涵蓋的衛生問題這一條目,幾乎所有指南都僅描述了目標人群和干預措施,并沒有描述結局指標和衛生保健措施或環境。大部分指南對于指南的適用人群也僅描述了人群特征,并未提及細致的疾病分期及患者的排除標準,這可能對指南形成推薦意見的實施形成阻礙,缺乏針對性。在指南制訂過程中,納入指南幾乎均沒有提及指南針對人群的意愿和偏好。在證據檢索方面,很多指南都沒有說明證據檢索的方法及選擇證據的標準。幾乎所有指南在文中均未提及指南在發表前經過專家的外部評審。大多數指南缺乏對于指南更新步驟的陳述。在指南應用性方面,臨床醫生在運用指南來解決臨床問題時具體操作細則的描述缺乏全面性。在獨立性這一方面,大多數指南均說明了指南制訂專家組成員的利益沖突情況,但很多指南并沒有說明資助者的觀點對指南制訂的影響。
本研究的局限性:① 評價員對于評價工具的理解存在一定的主觀性偏差;② 僅納入中、英文文獻,可能存在語言偏倚;③ 兒童新冠的病例數相對較少,診療和管理仍然在探索階段,證據質量存在局限性。
綜上所述,現有兒童新冠指南在方法學質量方面仍然不夠,總體質量偏低。在未來指南制訂過程中,建議以AGREE Ⅱ為參考,重視指南制訂過程中的規范化問題,制訂更高質量的指南。
據世界衛生組織監測數據顯示,截至2021年11月12日,全球已報告新型冠狀病毒疾病(corona virus disease 2019,COVID-19)確診病例2.51億,死亡人數已達507.8萬[1]。近期報告的COVID-19兒童病例占比呈上升趨勢,2020年1月,5歲以下和5~14歲病例分別占1.0%和2.5%,而2021年7月,分別升至2.0%和8.7%[2]。在臨床工作中,高質量指南能指導臨床醫生更科學、更規范地診療疾病,為患者帶來更合理、更個體化的診療方案。但低質量指南使臨床決策和診療措施與臨床最佳證據之間相差甚遠,給臨床醫生和患者帶來雙重傷害。近兩年來,國內外發表的指導診治兒童COVID-19的臨床指南日益增多,但現有指南對于兒童確診病例的流行病學和癥狀學等方面的描述仍不足[3],提出的干預措施缺乏針對性[4],加之指南本身的形成也受到多種因素影響,所以目前兒童COVID-19診療指南質量仍有待提高。本研究采用國際公認評價指南方法學質量工具(appraisal of guidelines research and evaluation Ⅱ,AGREE Ⅱ)評價國內外已發表兒童新冠指南的方法學質量,以期為相關指南的制訂提供參考依據。
1 資料與方法
1.1 納入和排除標準
1.1.1 納入標準
① 研究對象:診斷為COVID-19的兒童;② 研究類型:臨床實踐指南;③ 如果兩篇指南存在更新關系,則只納入最新版本。
1.1.2 排除標準
① 非中、英文文獻;② 專家共識、草案等;③ 內容不完整的指南;④ 國內外指南的二次研究版本;⑤ 指南人群包括兒童,但無針對兒童的推薦意見。
1.2 文獻檢索策略
計算機檢索PubMed、CBM、CNKI、VIP、WanFang Data、Medlive、NGC、GIN、NICE數據庫,搜集國內外發表的兒童新冠指南,檢索時限均為建庫至2021年10月1日。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。中文檢索詞包括:兒童、嬰兒、新型冠狀病毒、2019冠狀病毒、指南等;英文檢索詞包括:child、infant、adolescent、SARS-CoV-2、COVID-19、guideline等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:指南名稱、通信作者、發表(更新)時間、制訂單位、發表期刊、利益沖突和資助情況等。如果存在信息不全或閱讀權限的情況,通過郵件聯系作者以獲取。
1.4 納入指南的方法學質量評價
由2名研究者獨立采用AGREE Ⅱ[5]對納入指南進行方法學質量評價。該評價工具包含6個領域共23個條目,每個條目的分數范圍為1~7分,6個領域的領域分值=(實際分數–最低可能得分)/(最高可能得分–最低可能得分)。
1.5 統計分析
1.5.1 組內相關系數(interclass correlation coefficient,ICC)
ICC[6-8]是衡量和評價兩位評價員之間信度和復測信度的系數指標之一。ICC值介于0到1之間,如果ICC值小于0.4,那么兩組數據的一致性較差;如果ICC值大于0.75,那么兩組數據的一致性較好。我們選擇雙向隨機模型對兩組數據進行一致性評價。
1.5.2 數據處理方法
采用SPSS 26.0軟件對不同條目評分進行數據可靠性分析,通過對兩列變量的ICC值范圍的判斷,來確定兩組數據是否具有顯著的差異性。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻1 646篇,經逐層篩選,納入24部指南[9-32],其中3部指南存在更新版本[9,29-30],因此最終納入21部指南[10-28,31-32]進行AGREE Ⅱ評價。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入指南的基本特征
見表1。

2.3 納入指南的質量評價結果
納入21部指南在6個領域的平均領域分值依次是:62.70%、36.24%、20.34%、50.42%、22.12%、53.17%(表2)。國內外兒童新冠指南對比見表3。


2.3.1 范圍和目的
該領域包括指南的總目的、衛生問題、適用人群。21部指南在此領域得分較高,平均分值為70.28%。但在指南所涵蓋的衛生問題這一條目中,所有指南均只說明了相關問題,缺乏對結局和設施環境的描述;在指南的適用人群這一條目,僅1部指南[13]描述了患者的納入和排除標準及涉及的基本分期,其余指南僅描述了人群特征。
2.3.2 參與人員
該領域包括指南開發小組人員信息及分工、收集目標人群的觀點和選擇意愿、指南的使用者。其中3部(14.29%)指南[12,14,22]完整描述了指南制訂成員的姓名、學科/專業、所在機構、充當角色、地理位置,而其他指南都闡述不完整。僅2部(9.52%)指南[22-23]考慮了患者的意愿和價值觀。
2.3.3 制訂的嚴謹性
該領域包含8個條目,用于評估指南在制訂過程中的步驟是否規范,從制訂納入和排除標準、檢索證據、評價與合成證據,到形成推薦意見的影響因素及方法,以及指南后期外審及更新等方面全面評價。納入指南中僅5部(23.81%)[11,14,22-23,27]描述了證據檢索的方法并提供了檢索策略,僅1部(4.76%)[22]較為清晰地說明了篩選證據的標準。
2.3.4 表達明晰性
該領域包含3個條目,主要和指南的語言和格式有關,包括推薦意見明確、清晰,具體列舉了不同的選擇或者衛生問題,以及容易識別重要的推薦建議。大多指南的推薦意見都比較具體,并且可以根據衛生問題提出各種方案,平均領域分值為49.88%,但2部指南[16,20]提供的方案較為單一。
2.3.5 應用性
該領域包括4個條目,涵蓋在實施指南過程中可能遇到的組織、行為和成本問題,包括對推廣和實施指南的障礙的描述,提出實施建議的意見和/或工具,審查執行建議的潛在相關資源,提交監督和/或審計標準。納入指南在該領域的平均得分為21.46%,得分較低,幾乎所有指南都沒有考慮到適用和推廣,也很少說明在執行建議方面可能投入的資源。
2.3.6 編輯獨立性
該領域包括2個條目,涉及到推薦建議的獨立性和記載指南制訂組中可能存在的利益沖突,包括贊助單位的觀點不影響指南的內容及指南開發小組成員的利益沖突要記載并公布。納入指南該領域平均領域分值為59.58%,有6部(28.57%)指南[11-12,15-16,22,27]明確說明了基金資助單位的觀點沒有影響指南的具體內容,記錄并強調了指南制訂組織成員的利益沖突,但其余指南均表達得不清楚或者完全未涉及。
2.4 結果可靠性分析
對2名評價員的評分一致性檢驗結果為[ICC=0.948,95%CI(0.927,0.962),F=36.752,P<0.001],提示評價一致性較好,對評分條目的理解相同,評價結果的信度較高。
3 討論
臨床研究結果表明,新冠病毒感染的兒童通常表現為輕度癥狀,常見癥狀為咳嗽和發熱,有些兒童呼吸道癥狀并不顯著,主要表現為呼吸系統以外的癥狀[33]。因此,對兒童新冠病毒感染的診斷和治療應與成人有所區別,需要制訂專門的診療規范。
本研究以AGREE Ⅱ條目為標準,對國內外已發表的兒童新冠指南進行質量評價。共納入21部指南,其中10部為多國合作制訂,6部針對成人和兒童,15部僅針對于兒童制訂。19部指南的用戶人群均為兒科醫生,其余指南還針對檢驗科醫生、護理工作者等。
本研究發現我國制訂指南的平均領域分值和國外制訂指南差異無統計學意義,說明我國兒童新冠指南的方法學質量與國際水平接近。但納入所有指南的方法學質量均有提升的空間。在AGREE Ⅱ評價領域中,范圍和目的、獨立性、清晰性領域的分值比較高,而參與人員、制訂的嚴謹性和應用性的分值均較低。尤其是制訂嚴謹性這一領域,該領域反應指南產生臨床推薦意見的過程是否規范化及證據質量高低,該領域分值較低主要是由于新冠肺炎是一個突發性傳染性疾病,在流行早期臨床證據以觀察類研究為主。對于指南所涵蓋的衛生問題這一條目,幾乎所有指南都僅描述了目標人群和干預措施,并沒有描述結局指標和衛生保健措施或環境。大部分指南對于指南的適用人群也僅描述了人群特征,并未提及細致的疾病分期及患者的排除標準,這可能對指南形成推薦意見的實施形成阻礙,缺乏針對性。在指南制訂過程中,納入指南幾乎均沒有提及指南針對人群的意愿和偏好。在證據檢索方面,很多指南都沒有說明證據檢索的方法及選擇證據的標準。幾乎所有指南在文中均未提及指南在發表前經過專家的外部評審。大多數指南缺乏對于指南更新步驟的陳述。在指南應用性方面,臨床醫生在運用指南來解決臨床問題時具體操作細則的描述缺乏全面性。在獨立性這一方面,大多數指南均說明了指南制訂專家組成員的利益沖突情況,但很多指南并沒有說明資助者的觀點對指南制訂的影響。
本研究的局限性:① 評價員對于評價工具的理解存在一定的主觀性偏差;② 僅納入中、英文文獻,可能存在語言偏倚;③ 兒童新冠的病例數相對較少,診療和管理仍然在探索階段,證據質量存在局限性。
綜上所述,現有兒童新冠指南在方法學質量方面仍然不夠,總體質量偏低。在未來指南制訂過程中,建議以AGREE Ⅱ為參考,重視指南制訂過程中的規范化問題,制訂更高質量的指南。