引用本文: 黃橋, 任相穎, 張蓉, 李江, 閆思宇, 王云云, 靳英輝. GRADE在我國臨床實踐指南/專家共識中的應用研究. 中國循證醫學雜志, 2021, 21(12): 1457-1462. doi: 10.7507/1672-2531.202108187 復制
隨著醫療的規范化和決策的科學化,臨床實踐指南和專家共識(以下簡稱指南/共識)在醫學實踐中的作用和意義也越來越重要。高質量的指南/共識作為臨床實踐的指導性文件,能夠有效規范醫務人員的診療行為、提高醫療服務質量和降低醫療成本[1,2]。基于循證醫學方法制訂臨床實踐指南/共識在我國得到了逐步開展和重視[3,4]。在多個國際證據評價和推薦強度分級標準中,作為一套科學、系統、透明和實用的分級標準,推薦分級的評價、制訂預評估(grading of recommendations assessment, development and evaluation,GRADE)方法的創建與發展,是循證醫學與指南/共識制訂發展史上的里程碑事件,也是循證指南/共識制訂過程中最關鍵的要素之一[5]。GRADE方法學對循證醫學綜合證據體系提出了新的定義,符合循證臨床實踐的內在要求[6]。GRADE方法首次清楚地闡述了證據質量和推薦強度的定義,在厘清證據質量和區分推薦強度方面發揮著重要作用,突破了單從研究設計角度考慮證據質量的局限性[7]。目前,GRADE方法已經被世界衛生組織(world health organization,WHO)、美國疾病控制與預防中心(centers for disease control and prevention,CDC)、英國國立健康與臨床優化研究所(the national institute for health and care excellence,NICE)等超過100個國際指南制訂機構和組織認可與使用[8]。
GRADE分級適用于3個研究領域:系統評價、衛生技術評估及指南制訂,但在各自領域的應用不完全相同[9]。對于指南,需要在對證據質量分級的基礎上形成推薦意見,并對其推薦強度進行分級[10]。本研究系統檢索及分類總結了2010~2020年已發表的第一作者或作者機構為中國的臨床實踐指南/共識,將其按照是否使用GRADE方法來探討國內制訂指南/共識的質量,并為其制訂者及使用者提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
國內外公開發表的、可獲取全文的中國大陸學者制訂的原創指南/共識。
1.1.2 排除標準
① 解讀類、匯編、改編版指南/共識;② 國外指南的翻譯版本;③ 信息省略的非完整性指南/共識,如簡要版本。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、PubMed數據庫和醫脈通網站,搜集中國大陸學者制訂的原創指南/共識,檢索時限均為2010年1月1日~2020年12月31日。中文檢索詞包括:指南、實踐指南、臨床指南、臨床實踐、臨床實踐指南、共識、專家共識、專業共識。英文檢索詞包括:guideline,practice guideline,clinical guideline,clinical practice guideline,consensus,expert consensus,expert consensus statement,professional consensus,recommendation.
1.3 資料提取
本研究團隊根據指南質量評價工具AGREE Ⅱ(appraisal of guidelines for research and evaluation Ⅱ)的內容提取關注的條目:多學科合作制訂指南、具體文獻檢索策略、對納入文獻進行質量評價、推薦意見基于系統評價結果、有明確的證據及推薦強度分級標準、形成推薦意見時考慮了相關因素(可行性、經濟性、安全性、公平性及患者意愿等)、明確描述了推薦意見、標注了證據等級、標注了推薦意見強度、利益沖突的調查與報道。由4名評定者對納入指南/共識的質量進行獨立評價,通過測定組內相關系數(intraclass correlation coefficient,ICC)對評價人員間的內部一致性進行測定。ICC值在0~1之間,如果ICC為0.61~0.80,表明評定者間一致性好;如果ICC>0.80,評定者間具有非常好的一致性。
1.4 統計分析
將納入的指南/共識根據年份和是否使用GRADE進行描述,描述指標采用頻率和百分比,使用“色階圖”和折線圖反映近11年國內制訂并發布指南/共識的質量趨勢。根據納入指南/共識的方法學部分描述,將研究分為:使用GRADE組和未使用GRADE組,兩組在方法學質量9個條目中的比較采用卡方檢驗。使用SPSS 20.0軟件進行統計分析,P<0.05為差異有統計學意義。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻43 334篇,經逐層篩選,最終納入指南/共識2 661部。文獻篩選流程及結果見圖1。

2.2 納入指南/共識的基本情況
2010~2020年共發表2 661篇中國指南/共識,數量整體呈上升趨勢,近2年發表數量增加明顯。其中,未使用GRADE的指南/共識2 463部,占92.56%;使用GRADE的指南/共識僅198部,占7.44%。結果見圖2。

2.3 使用GRADE指南/共識的方法學質量
針對使用GRADE的指南/共識,采用色階圖展示在不同年份滿足方法學評價各條目要求的指南數量變化,結果見圖3。使用GRADE的指南/共識中標注證據等級和推薦強度的比例較高,形成推薦意見時考慮了可行性、經濟性及公平性等因素的比例最低。

2.4 使用和未使用GRADE的指南比較
使用GRADE和未使用GRADE的指南/共識的方法學質量比較結果見圖4。使用GRADE的指南/共識在9個條目中質量評價結果均高于未使用GRADE的指南/共識。

A. 多學科合作制訂指南;B. 行充分的文獻檢索;C. 對納入文獻進行質量評價;D. 推薦意見基于系統評價;E. 形成推薦意見時考慮了可行性、經濟性、安全性、公平性及患者意愿等因素;F. 明確描述了推薦意見;G. 標注了證據等級;H. 標注了推薦意見強度;I. 利益沖突的調查與報道。
2.4.1 多學科合作
173部(6.50%)指南/共識在制訂過程中成立了多學科工作組(至少包括1名方法學專家如系統評價專家、流行病學家、統計人員等)。其中,使用GRADE的指南/共識中有54部,未使用GRADE的指南/共識有119部,分別占其發表數量的27.27%(54/198)、4.83%(119/2 463),其差異有統計學意義(P<0.01)。
2.4.2 證據的檢索與評價
207部(7.78%)指南/共識進行了充分文獻檢索(至少檢索4個中英文數據庫)。其中,使用GRADE的指南/共識中有67部,占其發表數量的33.84%(67/198),未使用組中有140部,占5.68%(140/2 463),其差異有統計學意義(P<0.01)。131部指南/共識對納入文獻進行質量評價。其中,使用GRADE的指南/共識中有64部,占其發表數量的32.32%(64/198),未使用組中有67部,占2.72%(67/2463),其差異有統計學意義(P<0.01)。
2.4.3 系統評價支持
878部(33%)指南/共識基于系統評價支持開發,其中,使用GRADE的指南/共識有135部,未使用的有743部,分別占其發表數量的63.13%(125/198)和30.17%(743/2 463),其差異有統計學意義(P<0.01)。
2.4.4 證據等級、推薦強度分級和推薦意見的形成
共有758部(28.49%)指南/共識明確描述了推薦意見。但兩組在指南證據/推薦意見的分級標準、證據等級及呈現形式等方面差異較大。使用GRADE的指南/共識中,38部在其推薦意見的形成過程中考慮了可行性、經濟性、安全性、公平性和患者意愿等因素,占其發表總數19.19%(38/198),而在未使用GRADE的指南/共識中有30部,占1.22%(30/2463),差異有統計學意義(P<0.01)。在使用GRADE的198部指南/共識中,192部明確描述了推薦意見(96.97%),191部標注了證據等級(96.46%),194部標注了推薦意見強度(97.98%),均高于未使用GRADE組(23.02%、13.76%、14.78%),差異有統計學意義(P<0.01)。
2.4.5 基金資助和利益沖突
2010~2020年所發布指南/共識報告了在制訂過程中受到基金或項目資助的比例由12.00%提高到19.73%,其中,3.68%(98/2 661)的指南/共識受國家自然科學基金(包含面上項目、青年項目)資助,2%(53/2 661)的指南/共識受國家科技部科技支撐計劃項目(包括十一五、十二五)資助。共有503部(18.90%)指南/共識對制訂者的利益沖突進行了調查與報道。使用GRADE的指南/共識中有88部(44.44%)進行了報告,未使用組中的有413部(16.77%)進行了報告,差異有統計學意義(P<0.01)。
3 討論
本研究對近11年使用了GRADE分級系統的指南/共識進行了方法學質量評價,并與未使用GRADE的指南/共識比較,結果表明未使用GRADE的指南/共識仍然占多數且質量較低,使用GRADE分級系統的指南/共識在制訂過程中其方法學質量相對較高。除GRADE外,指南/共識仍使用多種證據質量與推薦意見分級標準,其表達形式也多種多樣,包括字母、數字、語言描述及其相互組合,大部分使用的證據質量及分級系統來自于北美、歐洲學會/協會所發布的分級標準,如英國牛津循證醫學中心(Oxford centre for evidence based medicine,OCEBM)、美國心臟協會(American heart association,AHA)/歐洲心臟病協會(European society of cardiology,ESC)等。
GRADE這一證據質量分級和推薦強度系統從狹義上理解是一個證據等級及推薦強度分級標準,實則涵蓋了從臨床問題到結局指標的確定,包括證據體的升降級,證據等級的劃分等,最終影響著推薦意見的形成與強度分級,故是否使用GRADE將會直接影響著指南/共識的質量。本研究所關注的9項方法學條目的內容結果均表明使用GRADE的指南/共識具有更高的方法學質量,這與近年來國內外相關研究報道相一致[11-14]。
證據質量與推薦強度分級方法的發展經歷了不斷發展和完善的過程[15],從單純考慮RCT試驗設計為高質量證據開始,到在研究設計的基礎上以系統評價/Meta分析為最高級別的證據,再到2004年GRADE證據質量及推薦強度系統的推出,強調在證據體試驗設計的基礎上考慮精確性、一致性等證據分級升級/降級因素。GRADE系統建立在證據體評估基礎上,對證據分級后,需要將證據進行整理并制作證據概要表,以便進入生成推薦意見的環節[16]。證據概要表和結果總結表是結構化呈現GRADE證據分級結果的標準化模板,有利于幫助系統評價和指南使用者快速查找關鍵信息,理解證據體的主要結果。遺憾的是,本研究發現雖然共有192篇使用GRADE的指南,但鮮有指南報告了GRADE證據概要表和結果總結表,盡管此前已有研究對其進行了詳盡的報道及使用說明[17]。
GRADE明確界定了證據質量和推薦強度及其區別,對不同級別證據的升級與降級有明確、統一的標準,從而保證在臨床證據到推薦意見的過程中決策的公開透明[4,16]。與此同時,GRADE工作組將健康公平性作為影響公共衛生和衛生系統推薦意見的影響因素,以及從群體角度(非個人角度)出發的臨床推薦意見強度的影響因素[18-20]。目前盡管使用GRADE系統制訂臨床指南的優勢已然明顯,但仍然還需要完善,如對GRADE分級結果一致性的研究,因為GRADE系統的升降級結合了判斷者的主觀因素,不同研究人員對同一系統評價,應用GRADE系統做出的證據質量分級可能存在差異[21]。近些年,隨著GRADE在國際組織上的廣泛使用,國內外學者對其使用的規范性已有研究[5,22-24],如Thomas等[23]發現分級結果與推薦意見之間的過程仍然不完全透明以至無法判斷分級結果與推薦意見的關系及其產生過程。國內學者周奇等[22]在評估基于GRADE康復臨床實踐指南證據質量與推薦強度研究一文也發現各指南制訂者對GRADE方法掌握參差不齊,分級的內部一致性和外部準確性可能存在問題。有研究表明,在應用GRADE的過程中接受過培訓或有過相關背景人員的工作質量更高[25]。由此可見,未來指南/共識的制訂仍需制訂者進一步掌握指南和GRADE方法學,來促進指南/共識的可靠性和應用性。
本研究的局限性:本研究主要納入的是2010~2020年間中國大陸學者制訂的原創指南/共識(包含僅發表在海外期刊的英文指南),因其數量龐大,本研究數據提取的內容未按照指南研究與評價工具AGREE Ⅱ的6個領域23個條目逐一提取,僅提取了我們所關注的相關內容,故方法學的分析結果不能完全反映指南/共識的方法學特征;部分研究結果基于指南/共識報告的數據進行統計分析,對沒有充分報告的信息,未聯系其制訂者進一步獲取與分析,故本研究的結果可能存在一定的信息偏倚。
綜上所述,臨床實踐指南/專家共識對GRADE分級系統的應用仍待提高,掌握GRADE方法學可有效改善臨床實踐指南/專家共識的方法學質量。
隨著醫療的規范化和決策的科學化,臨床實踐指南和專家共識(以下簡稱指南/共識)在醫學實踐中的作用和意義也越來越重要。高質量的指南/共識作為臨床實踐的指導性文件,能夠有效規范醫務人員的診療行為、提高醫療服務質量和降低醫療成本[1,2]。基于循證醫學方法制訂臨床實踐指南/共識在我國得到了逐步開展和重視[3,4]。在多個國際證據評價和推薦強度分級標準中,作為一套科學、系統、透明和實用的分級標準,推薦分級的評價、制訂預評估(grading of recommendations assessment, development and evaluation,GRADE)方法的創建與發展,是循證醫學與指南/共識制訂發展史上的里程碑事件,也是循證指南/共識制訂過程中最關鍵的要素之一[5]。GRADE方法學對循證醫學綜合證據體系提出了新的定義,符合循證臨床實踐的內在要求[6]。GRADE方法首次清楚地闡述了證據質量和推薦強度的定義,在厘清證據質量和區分推薦強度方面發揮著重要作用,突破了單從研究設計角度考慮證據質量的局限性[7]。目前,GRADE方法已經被世界衛生組織(world health organization,WHO)、美國疾病控制與預防中心(centers for disease control and prevention,CDC)、英國國立健康與臨床優化研究所(the national institute for health and care excellence,NICE)等超過100個國際指南制訂機構和組織認可與使用[8]。
GRADE分級適用于3個研究領域:系統評價、衛生技術評估及指南制訂,但在各自領域的應用不完全相同[9]。對于指南,需要在對證據質量分級的基礎上形成推薦意見,并對其推薦強度進行分級[10]。本研究系統檢索及分類總結了2010~2020年已發表的第一作者或作者機構為中國的臨床實踐指南/共識,將其按照是否使用GRADE方法來探討國內制訂指南/共識的質量,并為其制訂者及使用者提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
國內外公開發表的、可獲取全文的中國大陸學者制訂的原創指南/共識。
1.1.2 排除標準
① 解讀類、匯編、改編版指南/共識;② 國外指南的翻譯版本;③ 信息省略的非完整性指南/共識,如簡要版本。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、PubMed數據庫和醫脈通網站,搜集中國大陸學者制訂的原創指南/共識,檢索時限均為2010年1月1日~2020年12月31日。中文檢索詞包括:指南、實踐指南、臨床指南、臨床實踐、臨床實踐指南、共識、專家共識、專業共識。英文檢索詞包括:guideline,practice guideline,clinical guideline,clinical practice guideline,consensus,expert consensus,expert consensus statement,professional consensus,recommendation.
1.3 資料提取
本研究團隊根據指南質量評價工具AGREE Ⅱ(appraisal of guidelines for research and evaluation Ⅱ)的內容提取關注的條目:多學科合作制訂指南、具體文獻檢索策略、對納入文獻進行質量評價、推薦意見基于系統評價結果、有明確的證據及推薦強度分級標準、形成推薦意見時考慮了相關因素(可行性、經濟性、安全性、公平性及患者意愿等)、明確描述了推薦意見、標注了證據等級、標注了推薦意見強度、利益沖突的調查與報道。由4名評定者對納入指南/共識的質量進行獨立評價,通過測定組內相關系數(intraclass correlation coefficient,ICC)對評價人員間的內部一致性進行測定。ICC值在0~1之間,如果ICC為0.61~0.80,表明評定者間一致性好;如果ICC>0.80,評定者間具有非常好的一致性。
1.4 統計分析
將納入的指南/共識根據年份和是否使用GRADE進行描述,描述指標采用頻率和百分比,使用“色階圖”和折線圖反映近11年國內制訂并發布指南/共識的質量趨勢。根據納入指南/共識的方法學部分描述,將研究分為:使用GRADE組和未使用GRADE組,兩組在方法學質量9個條目中的比較采用卡方檢驗。使用SPSS 20.0軟件進行統計分析,P<0.05為差異有統計學意義。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻43 334篇,經逐層篩選,最終納入指南/共識2 661部。文獻篩選流程及結果見圖1。

2.2 納入指南/共識的基本情況
2010~2020年共發表2 661篇中國指南/共識,數量整體呈上升趨勢,近2年發表數量增加明顯。其中,未使用GRADE的指南/共識2 463部,占92.56%;使用GRADE的指南/共識僅198部,占7.44%。結果見圖2。

2.3 使用GRADE指南/共識的方法學質量
針對使用GRADE的指南/共識,采用色階圖展示在不同年份滿足方法學評價各條目要求的指南數量變化,結果見圖3。使用GRADE的指南/共識中標注證據等級和推薦強度的比例較高,形成推薦意見時考慮了可行性、經濟性及公平性等因素的比例最低。

2.4 使用和未使用GRADE的指南比較
使用GRADE和未使用GRADE的指南/共識的方法學質量比較結果見圖4。使用GRADE的指南/共識在9個條目中質量評價結果均高于未使用GRADE的指南/共識。

A. 多學科合作制訂指南;B. 行充分的文獻檢索;C. 對納入文獻進行質量評價;D. 推薦意見基于系統評價;E. 形成推薦意見時考慮了可行性、經濟性、安全性、公平性及患者意愿等因素;F. 明確描述了推薦意見;G. 標注了證據等級;H. 標注了推薦意見強度;I. 利益沖突的調查與報道。
2.4.1 多學科合作
173部(6.50%)指南/共識在制訂過程中成立了多學科工作組(至少包括1名方法學專家如系統評價專家、流行病學家、統計人員等)。其中,使用GRADE的指南/共識中有54部,未使用GRADE的指南/共識有119部,分別占其發表數量的27.27%(54/198)、4.83%(119/2 463),其差異有統計學意義(P<0.01)。
2.4.2 證據的檢索與評價
207部(7.78%)指南/共識進行了充分文獻檢索(至少檢索4個中英文數據庫)。其中,使用GRADE的指南/共識中有67部,占其發表數量的33.84%(67/198),未使用組中有140部,占5.68%(140/2 463),其差異有統計學意義(P<0.01)。131部指南/共識對納入文獻進行質量評價。其中,使用GRADE的指南/共識中有64部,占其發表數量的32.32%(64/198),未使用組中有67部,占2.72%(67/2463),其差異有統計學意義(P<0.01)。
2.4.3 系統評價支持
878部(33%)指南/共識基于系統評價支持開發,其中,使用GRADE的指南/共識有135部,未使用的有743部,分別占其發表數量的63.13%(125/198)和30.17%(743/2 463),其差異有統計學意義(P<0.01)。
2.4.4 證據等級、推薦強度分級和推薦意見的形成
共有758部(28.49%)指南/共識明確描述了推薦意見。但兩組在指南證據/推薦意見的分級標準、證據等級及呈現形式等方面差異較大。使用GRADE的指南/共識中,38部在其推薦意見的形成過程中考慮了可行性、經濟性、安全性、公平性和患者意愿等因素,占其發表總數19.19%(38/198),而在未使用GRADE的指南/共識中有30部,占1.22%(30/2463),差異有統計學意義(P<0.01)。在使用GRADE的198部指南/共識中,192部明確描述了推薦意見(96.97%),191部標注了證據等級(96.46%),194部標注了推薦意見強度(97.98%),均高于未使用GRADE組(23.02%、13.76%、14.78%),差異有統計學意義(P<0.01)。
2.4.5 基金資助和利益沖突
2010~2020年所發布指南/共識報告了在制訂過程中受到基金或項目資助的比例由12.00%提高到19.73%,其中,3.68%(98/2 661)的指南/共識受國家自然科學基金(包含面上項目、青年項目)資助,2%(53/2 661)的指南/共識受國家科技部科技支撐計劃項目(包括十一五、十二五)資助。共有503部(18.90%)指南/共識對制訂者的利益沖突進行了調查與報道。使用GRADE的指南/共識中有88部(44.44%)進行了報告,未使用組中的有413部(16.77%)進行了報告,差異有統計學意義(P<0.01)。
3 討論
本研究對近11年使用了GRADE分級系統的指南/共識進行了方法學質量評價,并與未使用GRADE的指南/共識比較,結果表明未使用GRADE的指南/共識仍然占多數且質量較低,使用GRADE分級系統的指南/共識在制訂過程中其方法學質量相對較高。除GRADE外,指南/共識仍使用多種證據質量與推薦意見分級標準,其表達形式也多種多樣,包括字母、數字、語言描述及其相互組合,大部分使用的證據質量及分級系統來自于北美、歐洲學會/協會所發布的分級標準,如英國牛津循證醫學中心(Oxford centre for evidence based medicine,OCEBM)、美國心臟協會(American heart association,AHA)/歐洲心臟病協會(European society of cardiology,ESC)等。
GRADE這一證據質量分級和推薦強度系統從狹義上理解是一個證據等級及推薦強度分級標準,實則涵蓋了從臨床問題到結局指標的確定,包括證據體的升降級,證據等級的劃分等,最終影響著推薦意見的形成與強度分級,故是否使用GRADE將會直接影響著指南/共識的質量。本研究所關注的9項方法學條目的內容結果均表明使用GRADE的指南/共識具有更高的方法學質量,這與近年來國內外相關研究報道相一致[11-14]。
證據質量與推薦強度分級方法的發展經歷了不斷發展和完善的過程[15],從單純考慮RCT試驗設計為高質量證據開始,到在研究設計的基礎上以系統評價/Meta分析為最高級別的證據,再到2004年GRADE證據質量及推薦強度系統的推出,強調在證據體試驗設計的基礎上考慮精確性、一致性等證據分級升級/降級因素。GRADE系統建立在證據體評估基礎上,對證據分級后,需要將證據進行整理并制作證據概要表,以便進入生成推薦意見的環節[16]。證據概要表和結果總結表是結構化呈現GRADE證據分級結果的標準化模板,有利于幫助系統評價和指南使用者快速查找關鍵信息,理解證據體的主要結果。遺憾的是,本研究發現雖然共有192篇使用GRADE的指南,但鮮有指南報告了GRADE證據概要表和結果總結表,盡管此前已有研究對其進行了詳盡的報道及使用說明[17]。
GRADE明確界定了證據質量和推薦強度及其區別,對不同級別證據的升級與降級有明確、統一的標準,從而保證在臨床證據到推薦意見的過程中決策的公開透明[4,16]。與此同時,GRADE工作組將健康公平性作為影響公共衛生和衛生系統推薦意見的影響因素,以及從群體角度(非個人角度)出發的臨床推薦意見強度的影響因素[18-20]。目前盡管使用GRADE系統制訂臨床指南的優勢已然明顯,但仍然還需要完善,如對GRADE分級結果一致性的研究,因為GRADE系統的升降級結合了判斷者的主觀因素,不同研究人員對同一系統評價,應用GRADE系統做出的證據質量分級可能存在差異[21]。近些年,隨著GRADE在國際組織上的廣泛使用,國內外學者對其使用的規范性已有研究[5,22-24],如Thomas等[23]發現分級結果與推薦意見之間的過程仍然不完全透明以至無法判斷分級結果與推薦意見的關系及其產生過程。國內學者周奇等[22]在評估基于GRADE康復臨床實踐指南證據質量與推薦強度研究一文也發現各指南制訂者對GRADE方法掌握參差不齊,分級的內部一致性和外部準確性可能存在問題。有研究表明,在應用GRADE的過程中接受過培訓或有過相關背景人員的工作質量更高[25]。由此可見,未來指南/共識的制訂仍需制訂者進一步掌握指南和GRADE方法學,來促進指南/共識的可靠性和應用性。
本研究的局限性:本研究主要納入的是2010~2020年間中國大陸學者制訂的原創指南/共識(包含僅發表在海外期刊的英文指南),因其數量龐大,本研究數據提取的內容未按照指南研究與評價工具AGREE Ⅱ的6個領域23個條目逐一提取,僅提取了我們所關注的相關內容,故方法學的分析結果不能完全反映指南/共識的方法學特征;部分研究結果基于指南/共識報告的數據進行統計分析,對沒有充分報告的信息,未聯系其制訂者進一步獲取與分析,故本研究的結果可能存在一定的信息偏倚。
綜上所述,臨床實踐指南/專家共識對GRADE分級系統的應用仍待提高,掌握GRADE方法學可有效改善臨床實踐指南/專家共識的方法學質量。