引用本文: 李雯燕, 曾力楠, 李思雨, 倪曉鳳, 易秋莎, 張川, 賈知軍, 劉瀚旻, 張伶俐. 中國兒童臨床指南現狀分析及循證臨床指南質量評價. 中國循證醫學雜志, 2021, 21(12): 1450-1456. doi: 10.7507/1672-2531.202108191 復制
據第七次全國人口普查結果,我國0~14歲兒童人口數量達到2.53億,占全人口的17.95%[1]。然而,由于兒科醫護人員不足和兒童醫療保障水平有限,我國兒科醫療資源供需存在較大不平衡[2]。高質量的臨床實踐指南對于解決兒童醫療資源供需矛盾問題有重要而積極的作用,其不但能優化資源使用、改善患者結局,還能減少不同地區、不同級別醫院的臨床實踐差異[3]。但目前中國臨床指南的水平參差不齊,其質量和西方發達國家仍有較大差距[3],因此有必要對兒童臨床指南進行評價,對指南質量進行鑒別,對指南推薦意見進行綜合評價,以供臨床推廣使用。
2011年,本課題組曾系統評價了中國兒童臨床指南[4],指出我國兒童臨床指南起步晚、數量少、質量有待提高。近10年來,我國兒童臨床指南發展迅速,但其質量是否提高尚不清楚。因此,本文系統評價2010~2021年發表的中國兒童臨床指南現狀,并使用指南質量評價工具(appraisal of guidelines research and evaluation Ⅱ,AGREE Ⅱ)評價循證指南的方法學質量,以期為我國兒童臨床指南的循證制訂提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
2010年1月1日之后公開發表的中國兒童臨床實踐指南。
1.1.2 排除標準
① 非中英文指南;② 臨床診療規范;③ 專家共識、指南的譯本或解讀版;④ 全文不可獲取的指南。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、WanFang Data、CNKI、VIP數據庫及國內外相關指南庫,搜集中國兒童臨床指南,檢索時限均從2010年1月1日至2021年9月13日。檢索采用自由詞和主題詞相結合的方式,并根據不同數據庫特點進行調整。中文檢索詞包括:兒童、嬰兒、小兒、新生兒、早產兒、未成年、學齡前合并指南和規范等;英文檢索詞包括:child、pediatrics、infant、newborn、China、Chinese、clinical pathway、consensus、guideline、best practice、CPG等。以CNKI為例,其具體檢索策略見框1。

1.3 文獻篩選和資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對,如遇分歧討論解決,或由第三方協助判斷。篩選文獻時,先通過瀏覽文題和摘要排除不相關的文獻,最終閱讀全文決定是否納入。資料提取內容包括:指南名稱、發表年份、發表機構、發表期刊、指南制訂方法、指南類型、更新情況和針對的疾病類型和采用的證據分級方法。指南類型包括診治指南、診斷指南、管理指南、操作指南、保健指南和臨床試驗設計指南。本文將基于系統文獻檢索和證據分級給出推薦意見的指南歸為循證指南[5],其余指南歸為非循證指南。指南更新情況根據指南正文的描述分為初版指南和修訂版指南。疾病分類參考國際疾病分類(ICD-10)。證據分級方法包括證據質量與推薦強度分級依據(grading of recommendations assessment,development and evaluation,GRADE)、中醫文獻依據分級標準、牛津證據分級與推薦意見強度、歐洲心血管病學會提出的證據和推薦意見分級方法和其他證據分級方法。
1.4 納入指南的質量評價
由4名研究者采用AGREE Ⅱ[6]評價納入循證指南的方法學質量。各領域得分采用標準化百分比表示,計算公式為:(實際得分?最低可能得分)/(最高可能得分?最低可能得分)×100%。標準化百分比越高,提示指南制訂越符合規范,質量越高。正式評價前,所有評價者均完成了AGREE Ⅱ網絡培訓課程,然后選取3篇指南進行預評價,并計算組內相關系數(intra-class correlation coefficients,ICC)來評價一致性,只有當ICC值大于0.75時,才開始正式評價,從而確保每位評價者對每個條目的理解基本一致。
1.5 統計分析
運用Excel 2016進行錄入和整理。對納入指南的基本信息進行描述性分析。運用SPSS 15.0軟件進行數據分析,采用均數(范圍)和頻數對納入指南的AGREE Ⅱ評分進行統計描述。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻8 524篇,經逐層篩選,最終納入指南164部。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入指南的基本特征
2.2.1 基本情況
2010年1月~2021年9月,我國共發表兒童臨床指南164部,其中循證指南65部(39.6%)[7-71],非循證指南99部(60.4%)。西醫指南113部(68.9%),其中最多制訂指南的機構為中華醫學會和中國醫師協會,數量分別為36部(22.0%)和16部(9.8%),兩者共同制訂13部(7.9%);中醫指南51部(31.1%),其中制訂最多的機構為中華中醫藥學會,數量達46部(28.0%)。西醫指南中,循證指南占30.1%(34部);中醫指南中,循證指南占60.8%(31部)。西醫指南中,發表中文指南最多的雜志為《中華兒科雜志》,為18部(11.0%);發表英文指南最多的雜志為World J Pediatr,為3部(1.8%);發表中醫指南最多的雜志為《中醫兒科雜志》,為24部(14.6%)。指南類型方面,診療指南96部(58.5%),操作指南21部(12.8%),臨床試驗設計指南15部(9.1%),保健指南14部(8.5%),診斷指南11部(6.7%),管理指南7部(4.3%)。
2.2.2 發表年份
2014年以前,每年發表不足10部;2014~2017年,指南發表數量逐年上漲,于2017年到達高峰33部;其后保持在每年10~20部。
2.2.3 更新情況
納入指南中,121部(73.8%)為初版指南,43部(26.2%)為修訂版指南。在非循證指南中,修訂版指南僅占14.1%(14部);而在循證指南中,修訂版指南占44.6%(29部)。
2.2.4 指南覆蓋疾病
164部指南涉及18種系統疾病,覆蓋了除循環系統疾病外的所有系統疾病。根據兒童住院疾病構成[72],我國兒童臨床指南數量、循證指南數量排名和住院患兒人數占比的排名大致相似,住院人數前十位的兒童疾病均有5部以上指南。各系統疾病指南數量如下 :① 呼吸系統疾病指南35部(21.3%);② 圍生期疾病指南11部(6.7%);③ 消化系統疾病指南16部(9.8%);④ 感染疾病指南19部(11.6%);⑤ 發育異常疾病指南5部(3.0%);⑥ 損傷、中毒和外因相關指南3部(1.8%);⑦ 影響健康狀態或與保健機構接觸的因素相關指南13部(7.9%);⑧ 血液、造血系統和免疫疾病指南7部(4.3%);⑨ 神經系統疾病指南9部(5.5%);⑩ 泌尿系統疾病指南17部(10.4%)。
2.3 兒童循證臨床指南的質量評價結果
2.3.1 一致性評價
ICC的平均值為0.902[95%CI(0.896,0.907)],說明4名研究者評價結果一致性較高,指南質量評價結果較為可靠。
2.3.2 兒童循證臨床指南各領域得分情況
各領域平均得分見表1。

2.3.2.1 領域一:范圍和目的
該領域平均得分為65.2%(29.2%~100.0%)。得分50%以上的58部(89.2%)循證指南均簡潔地闡明了健康內容和預期結果,且在指南中明確指出目標人群的適用范圍或給出了疾病的定義和診斷。僅7部(10.8%)指南在此領域得分低于50%,原因多為未闡述指南對患者的預期作用和結果,未清晰地提出指南涵蓋的健康問題,或者整體描述較為模糊。
2.3.2.2 領域二:參與人員
該領域平均得分為49.6%(13.9%~91.7%)。大部分循證臨床指南報告了團隊成員信息,得分大于50%的46部(70.8%)循證指南介紹了團隊成員基本信息,列舉職責和分工,陳述目標使用者及使用方法。35部(53.8%)循證指南明確指出在指南形成過程中考慮了目標人群意愿,但僅有1部指南指出患者或監護人的指南參與方式,并詳細報道目標人群意愿對指南制訂的影響。
2.3.2.3 領域三:嚴謹性
該領域平均得分為59.3%(22.4%~93.9%)。所有循證指南均不同程度地描述了檢索方法、證據選擇標準、推薦意見形成的方法和利弊考慮,但普遍缺少對外部評審和指南更新的描述。所有循證指南均描述了證據的強度,其中使用中醫文獻依據分級標準的指南共26部(40.0%)、使用GRADE分級方法的指南20部(30.8%)、使用歐洲心血管病學會提出的證據和推薦意見分級方法的指南8部(12.3%)、使用其他證據分級方法的指南8部(12.3%)、使用牛津證據分級與推薦意見強度的指南3部(4.6%),但僅有6部(9.2%)指南給出了證據概要表,并詳細報告納入研究之間的一致性和方向性。
2.3.2.4 領域四:清晰性
該領域平均得分為68.5%(48.6%~94.4%),說明我國兒童循證指南普遍能結合證據給出明確的推薦意見,并能對適用人群或臨床情境進行描述。但僅有19部(29.2%)循證指南突出顯示了推薦意見,并附有直觀的表格或流程圖來總結推薦意見。
2.3.2.5 領域五:應用性
該領域平均得分為23.9%(4.2%~65.6%),在6個領域中得分最低。僅2部(3.1%)得分高于50%的循證指南考慮了指南實施的促進因素、阻礙因素和應用時所需的資源,提供了其他實施材料,并提供了指南實施的審查標準。其他循證指南則欠缺對這部分的描述。該領域得分最低的為條目20(所需潛在資源)和條目19(促進實施的工具),說明指南制訂者對醫療費用和指南實施的關注度較低。
2.3.2.6 領域六:獨立性
該領域平均得分為83.6%(0%~100.0%)。得分高于50%的58部(89.2%)循證指南均報告了指南贊助單位和成員利益沖突。
3 討論
我國兒童臨床指南的起步較晚,近十年來指南數量顯著增加,2010年后發布指南164部,較之前增長了4倍,其中循證指南65部,較之前增長了12倍。
2010年以前,發育異常、循環、腫瘤、傳染病、圍生期疾病和外傷多種疾病均無兒童指南發表,導致兒童指南、住院和死亡負擔的供需三分離。2010~2021年間,隨著我國兒童指南數量大幅增長,住院率排名前十的系統疾病均被覆蓋,但循環系統疾病領域仍缺乏兒童指南,僅有專家共識。根據《中國心血管健康與疾病報告2019》,在循環系統疾病中,兒童高血壓和血脂異常是重點關注的領域,故應優先考慮制訂相關指南[73]。
本研究顯示我國2010~2021年制訂的兒童循證指南6個領域的平均標化得分分別為65.2%、49.6%、59.3%、68.5%、23.9%和83.6%。使用更新后的AGREE Ⅱ工具評價2010年以前的兒童循證指南,得分分別為38.3%、26.7%、26.7%、47.5%、12.7%和26.7%。縱向對比發現,相比2010年以前的指南,我國2010~2021年發表指南在所有領域的質量均明顯提升,尤其在獨立性和嚴謹性領域的提升幅度最大,絕對值分別增加56.9%和32.6%。
本研究納入循證指南在應用性、參與人員、嚴謹性3個方面的得分較低。指南的應用性是我國兒童臨床指南最薄弱的一個領域,考慮到兒童人群的特殊性,在推薦意見實施過程中更有可能存在障礙,因此在制訂兒童指南時考慮實施所需要的資源和實施的審查標準尤為重要。在參與人員方面,雖然53.8%的指南考慮了患者或家屬的偏好,但并不明確其參與方式和意見被采納的流程。在嚴謹性方面,有30.8%的指南聲明其依據GRADE分級方法,但詳細分析后發現大部分指南并未完整地使用該方法,如并未提及分級所考慮的因素,并未使用該方法設計問題、選擇結局指標和總結證據。因此,兒童臨床指南證據形成過程的透明度、規范性和嚴謹性可能受到影響。
基于本研究結果,我們建議:① 國內外指南制訂標準對指南制訂全過程提供了清晰的流程和標準,若參考相關國際標準可更大程度地促進制訂過程的嚴謹、透明,提升指南制訂質量。美國兒科學會(American academy of pediatrics,AAP)和世界衛生組織均對選題、工作組組建、系統評價、證據合成、形成推薦意見、撰寫指南、外部評審、發布實施、更新等步驟提出標準[74-76]。② 編寫指南時應考慮患兒及家屬偏好。從指南制訂初期就讓患兒或家屬參與指南問題的制訂,從而得出與患者相關的推薦意見,使指南更易于使用[77]。③ 提升指南的應用性和適用性。在臨床指南發表之后,可由指南目標使用者評價指南臨床適用性,甄別出臨床適用性高的指南,推廣其在臨床的應用,并為指南制訂者反饋指南的臨床適用性結果,以幫助優化指南制訂和更新,持續提升指南適用性[78,79]。
本研究的局限性:① 本研究采用AGREE Ⅱ工具評價中國兒童循證指南,由于該工具未明確定義其評分分值所代表的含義,對評分的解讀依據使用者判斷,結果容易受到各種偏倚因素的影響,在今后的研究中可結合不同的指南評價工具進行評價[80]。② 本研究僅基于指南報道的內容進行評價,未聯系指南制訂者進一步獲取指南制訂過程細節,有可能低估納入指南實際的方法學質量。
綜上所述,2010~2021年我國兒童臨床指南的數量大幅提升,覆蓋疾病面廣,循證指南的占比上升。盡管循證指南的質量明顯提高,但應用性、參與人員和嚴謹性評分仍較低。希望未來的指南制訂者能遵循指南制訂標準,規范指南制訂過程,進一步提高兒童臨床指南質量。
據第七次全國人口普查結果,我國0~14歲兒童人口數量達到2.53億,占全人口的17.95%[1]。然而,由于兒科醫護人員不足和兒童醫療保障水平有限,我國兒科醫療資源供需存在較大不平衡[2]。高質量的臨床實踐指南對于解決兒童醫療資源供需矛盾問題有重要而積極的作用,其不但能優化資源使用、改善患者結局,還能減少不同地區、不同級別醫院的臨床實踐差異[3]。但目前中國臨床指南的水平參差不齊,其質量和西方發達國家仍有較大差距[3],因此有必要對兒童臨床指南進行評價,對指南質量進行鑒別,對指南推薦意見進行綜合評價,以供臨床推廣使用。
2011年,本課題組曾系統評價了中國兒童臨床指南[4],指出我國兒童臨床指南起步晚、數量少、質量有待提高。近10年來,我國兒童臨床指南發展迅速,但其質量是否提高尚不清楚。因此,本文系統評價2010~2021年發表的中國兒童臨床指南現狀,并使用指南質量評價工具(appraisal of guidelines research and evaluation Ⅱ,AGREE Ⅱ)評價循證指南的方法學質量,以期為我國兒童臨床指南的循證制訂提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
2010年1月1日之后公開發表的中國兒童臨床實踐指南。
1.1.2 排除標準
① 非中英文指南;② 臨床診療規范;③ 專家共識、指南的譯本或解讀版;④ 全文不可獲取的指南。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、WanFang Data、CNKI、VIP數據庫及國內外相關指南庫,搜集中國兒童臨床指南,檢索時限均從2010年1月1日至2021年9月13日。檢索采用自由詞和主題詞相結合的方式,并根據不同數據庫特點進行調整。中文檢索詞包括:兒童、嬰兒、小兒、新生兒、早產兒、未成年、學齡前合并指南和規范等;英文檢索詞包括:child、pediatrics、infant、newborn、China、Chinese、clinical pathway、consensus、guideline、best practice、CPG等。以CNKI為例,其具體檢索策略見框1。

1.3 文獻篩選和資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對,如遇分歧討論解決,或由第三方協助判斷。篩選文獻時,先通過瀏覽文題和摘要排除不相關的文獻,最終閱讀全文決定是否納入。資料提取內容包括:指南名稱、發表年份、發表機構、發表期刊、指南制訂方法、指南類型、更新情況和針對的疾病類型和采用的證據分級方法。指南類型包括診治指南、診斷指南、管理指南、操作指南、保健指南和臨床試驗設計指南。本文將基于系統文獻檢索和證據分級給出推薦意見的指南歸為循證指南[5],其余指南歸為非循證指南。指南更新情況根據指南正文的描述分為初版指南和修訂版指南。疾病分類參考國際疾病分類(ICD-10)。證據分級方法包括證據質量與推薦強度分級依據(grading of recommendations assessment,development and evaluation,GRADE)、中醫文獻依據分級標準、牛津證據分級與推薦意見強度、歐洲心血管病學會提出的證據和推薦意見分級方法和其他證據分級方法。
1.4 納入指南的質量評價
由4名研究者采用AGREE Ⅱ[6]評價納入循證指南的方法學質量。各領域得分采用標準化百分比表示,計算公式為:(實際得分?最低可能得分)/(最高可能得分?最低可能得分)×100%。標準化百分比越高,提示指南制訂越符合規范,質量越高。正式評價前,所有評價者均完成了AGREE Ⅱ網絡培訓課程,然后選取3篇指南進行預評價,并計算組內相關系數(intra-class correlation coefficients,ICC)來評價一致性,只有當ICC值大于0.75時,才開始正式評價,從而確保每位評價者對每個條目的理解基本一致。
1.5 統計分析
運用Excel 2016進行錄入和整理。對納入指南的基本信息進行描述性分析。運用SPSS 15.0軟件進行數據分析,采用均數(范圍)和頻數對納入指南的AGREE Ⅱ評分進行統計描述。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻8 524篇,經逐層篩選,最終納入指南164部。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入指南的基本特征
2.2.1 基本情況
2010年1月~2021年9月,我國共發表兒童臨床指南164部,其中循證指南65部(39.6%)[7-71],非循證指南99部(60.4%)。西醫指南113部(68.9%),其中最多制訂指南的機構為中華醫學會和中國醫師協會,數量分別為36部(22.0%)和16部(9.8%),兩者共同制訂13部(7.9%);中醫指南51部(31.1%),其中制訂最多的機構為中華中醫藥學會,數量達46部(28.0%)。西醫指南中,循證指南占30.1%(34部);中醫指南中,循證指南占60.8%(31部)。西醫指南中,發表中文指南最多的雜志為《中華兒科雜志》,為18部(11.0%);發表英文指南最多的雜志為World J Pediatr,為3部(1.8%);發表中醫指南最多的雜志為《中醫兒科雜志》,為24部(14.6%)。指南類型方面,診療指南96部(58.5%),操作指南21部(12.8%),臨床試驗設計指南15部(9.1%),保健指南14部(8.5%),診斷指南11部(6.7%),管理指南7部(4.3%)。
2.2.2 發表年份
2014年以前,每年發表不足10部;2014~2017年,指南發表數量逐年上漲,于2017年到達高峰33部;其后保持在每年10~20部。
2.2.3 更新情況
納入指南中,121部(73.8%)為初版指南,43部(26.2%)為修訂版指南。在非循證指南中,修訂版指南僅占14.1%(14部);而在循證指南中,修訂版指南占44.6%(29部)。
2.2.4 指南覆蓋疾病
164部指南涉及18種系統疾病,覆蓋了除循環系統疾病外的所有系統疾病。根據兒童住院疾病構成[72],我國兒童臨床指南數量、循證指南數量排名和住院患兒人數占比的排名大致相似,住院人數前十位的兒童疾病均有5部以上指南。各系統疾病指南數量如下 :① 呼吸系統疾病指南35部(21.3%);② 圍生期疾病指南11部(6.7%);③ 消化系統疾病指南16部(9.8%);④ 感染疾病指南19部(11.6%);⑤ 發育異常疾病指南5部(3.0%);⑥ 損傷、中毒和外因相關指南3部(1.8%);⑦ 影響健康狀態或與保健機構接觸的因素相關指南13部(7.9%);⑧ 血液、造血系統和免疫疾病指南7部(4.3%);⑨ 神經系統疾病指南9部(5.5%);⑩ 泌尿系統疾病指南17部(10.4%)。
2.3 兒童循證臨床指南的質量評價結果
2.3.1 一致性評價
ICC的平均值為0.902[95%CI(0.896,0.907)],說明4名研究者評價結果一致性較高,指南質量評價結果較為可靠。
2.3.2 兒童循證臨床指南各領域得分情況
各領域平均得分見表1。

2.3.2.1 領域一:范圍和目的
該領域平均得分為65.2%(29.2%~100.0%)。得分50%以上的58部(89.2%)循證指南均簡潔地闡明了健康內容和預期結果,且在指南中明確指出目標人群的適用范圍或給出了疾病的定義和診斷。僅7部(10.8%)指南在此領域得分低于50%,原因多為未闡述指南對患者的預期作用和結果,未清晰地提出指南涵蓋的健康問題,或者整體描述較為模糊。
2.3.2.2 領域二:參與人員
該領域平均得分為49.6%(13.9%~91.7%)。大部分循證臨床指南報告了團隊成員信息,得分大于50%的46部(70.8%)循證指南介紹了團隊成員基本信息,列舉職責和分工,陳述目標使用者及使用方法。35部(53.8%)循證指南明確指出在指南形成過程中考慮了目標人群意愿,但僅有1部指南指出患者或監護人的指南參與方式,并詳細報道目標人群意愿對指南制訂的影響。
2.3.2.3 領域三:嚴謹性
該領域平均得分為59.3%(22.4%~93.9%)。所有循證指南均不同程度地描述了檢索方法、證據選擇標準、推薦意見形成的方法和利弊考慮,但普遍缺少對外部評審和指南更新的描述。所有循證指南均描述了證據的強度,其中使用中醫文獻依據分級標準的指南共26部(40.0%)、使用GRADE分級方法的指南20部(30.8%)、使用歐洲心血管病學會提出的證據和推薦意見分級方法的指南8部(12.3%)、使用其他證據分級方法的指南8部(12.3%)、使用牛津證據分級與推薦意見強度的指南3部(4.6%),但僅有6部(9.2%)指南給出了證據概要表,并詳細報告納入研究之間的一致性和方向性。
2.3.2.4 領域四:清晰性
該領域平均得分為68.5%(48.6%~94.4%),說明我國兒童循證指南普遍能結合證據給出明確的推薦意見,并能對適用人群或臨床情境進行描述。但僅有19部(29.2%)循證指南突出顯示了推薦意見,并附有直觀的表格或流程圖來總結推薦意見。
2.3.2.5 領域五:應用性
該領域平均得分為23.9%(4.2%~65.6%),在6個領域中得分最低。僅2部(3.1%)得分高于50%的循證指南考慮了指南實施的促進因素、阻礙因素和應用時所需的資源,提供了其他實施材料,并提供了指南實施的審查標準。其他循證指南則欠缺對這部分的描述。該領域得分最低的為條目20(所需潛在資源)和條目19(促進實施的工具),說明指南制訂者對醫療費用和指南實施的關注度較低。
2.3.2.6 領域六:獨立性
該領域平均得分為83.6%(0%~100.0%)。得分高于50%的58部(89.2%)循證指南均報告了指南贊助單位和成員利益沖突。
3 討論
我國兒童臨床指南的起步較晚,近十年來指南數量顯著增加,2010年后發布指南164部,較之前增長了4倍,其中循證指南65部,較之前增長了12倍。
2010年以前,發育異常、循環、腫瘤、傳染病、圍生期疾病和外傷多種疾病均無兒童指南發表,導致兒童指南、住院和死亡負擔的供需三分離。2010~2021年間,隨著我國兒童指南數量大幅增長,住院率排名前十的系統疾病均被覆蓋,但循環系統疾病領域仍缺乏兒童指南,僅有專家共識。根據《中國心血管健康與疾病報告2019》,在循環系統疾病中,兒童高血壓和血脂異常是重點關注的領域,故應優先考慮制訂相關指南[73]。
本研究顯示我國2010~2021年制訂的兒童循證指南6個領域的平均標化得分分別為65.2%、49.6%、59.3%、68.5%、23.9%和83.6%。使用更新后的AGREE Ⅱ工具評價2010年以前的兒童循證指南,得分分別為38.3%、26.7%、26.7%、47.5%、12.7%和26.7%。縱向對比發現,相比2010年以前的指南,我國2010~2021年發表指南在所有領域的質量均明顯提升,尤其在獨立性和嚴謹性領域的提升幅度最大,絕對值分別增加56.9%和32.6%。
本研究納入循證指南在應用性、參與人員、嚴謹性3個方面的得分較低。指南的應用性是我國兒童臨床指南最薄弱的一個領域,考慮到兒童人群的特殊性,在推薦意見實施過程中更有可能存在障礙,因此在制訂兒童指南時考慮實施所需要的資源和實施的審查標準尤為重要。在參與人員方面,雖然53.8%的指南考慮了患者或家屬的偏好,但并不明確其參與方式和意見被采納的流程。在嚴謹性方面,有30.8%的指南聲明其依據GRADE分級方法,但詳細分析后發現大部分指南并未完整地使用該方法,如并未提及分級所考慮的因素,并未使用該方法設計問題、選擇結局指標和總結證據。因此,兒童臨床指南證據形成過程的透明度、規范性和嚴謹性可能受到影響。
基于本研究結果,我們建議:① 國內外指南制訂標準對指南制訂全過程提供了清晰的流程和標準,若參考相關國際標準可更大程度地促進制訂過程的嚴謹、透明,提升指南制訂質量。美國兒科學會(American academy of pediatrics,AAP)和世界衛生組織均對選題、工作組組建、系統評價、證據合成、形成推薦意見、撰寫指南、外部評審、發布實施、更新等步驟提出標準[74-76]。② 編寫指南時應考慮患兒及家屬偏好。從指南制訂初期就讓患兒或家屬參與指南問題的制訂,從而得出與患者相關的推薦意見,使指南更易于使用[77]。③ 提升指南的應用性和適用性。在臨床指南發表之后,可由指南目標使用者評價指南臨床適用性,甄別出臨床適用性高的指南,推廣其在臨床的應用,并為指南制訂者反饋指南的臨床適用性結果,以幫助優化指南制訂和更新,持續提升指南適用性[78,79]。
本研究的局限性:① 本研究采用AGREE Ⅱ工具評價中國兒童循證指南,由于該工具未明確定義其評分分值所代表的含義,對評分的解讀依據使用者判斷,結果容易受到各種偏倚因素的影響,在今后的研究中可結合不同的指南評價工具進行評價[80]。② 本研究僅基于指南報道的內容進行評價,未聯系指南制訂者進一步獲取指南制訂過程細節,有可能低估納入指南實際的方法學質量。
綜上所述,2010~2021年我國兒童臨床指南的數量大幅提升,覆蓋疾病面廣,循證指南的占比上升。盡管循證指南的質量明顯提高,但應用性、參與人員和嚴謹性評分仍較低。希望未來的指南制訂者能遵循指南制訂標準,規范指南制訂過程,進一步提高兒童臨床指南質量。