引用本文: 鞠春曉, 張瑤, 劉曉林, 李逸雯, 劉璐, 王碧晴, 梅俊, 趙俊男, 黃璐琦, 劉玥, 徐鳳芹. 慢性心力衰竭防治指南和共識的方法學質量評價. 中國循證醫學雜志, 2021, 21(9): 1091-1097. doi: 10.7507/1672-2531.202104066 復制
心力衰竭是造成心血管疾病患者死亡的原因之一,其中慢性心力衰竭影響著全球約 2% 成年人的健康[1, 2]。據《中國心血管健康與疾病報告 2019 概要》公布的數據,中國現有心力衰竭患者已達 890 萬,其患病率和死亡率仍處于上升階段[3]。在發達國家,預計未來 20 年與心力衰竭治療相關的醫療費用將增加 200% 以上[1]。心力衰竭在威脅人們身體健康的同時,也增加了公共衛生領域的經濟負擔。
臨床實踐指南是針對醫療衛生專業人員的臨床問題,基于當前可得的最佳證據,共識得出的推薦意見,是醫療實踐的指導性文件,均具有重要的臨床意義和價值[4]。制訂高質量的臨床實踐指南有利于疾病的規范化診療及更有效地利用醫療資源,所以對現有研究進行質量評價尤為重要。本研究使用國際公認的 AGREE Ⅱ評價工具對國內外公開發表的西醫、中醫、中西醫慢性心力衰竭的診療指南及專家共識進行評價,以期為今后指南的制訂和更新提供參考。
1 研究方法
1.1 納入與排除標準
1.1.1 納入標準
① 疾病診斷標準符合慢性心力衰竭的定義[5];② 符合臨床實踐指南[6]、專家共識[7]的定義和規范;③ 語種限定為中、英文。
1.1.2 排除標準
① 指南解讀或摘要;② 被新版指南代替的舊版指南;③ 無法獲取全文;④ 慢性心力衰竭合并癥診療指南;⑤ 指南內容只涉及慢性心力衰竭的診斷或用藥單個方面。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、SinoMed、CNKI、WanFang Data、VIP 數據庫及中華醫學會心血管病學分會、中國中西醫結合學會官方網站、National Institute for Health and Clinical Excellenc(NICE)、Scottish Intercollegiate Guidelines Network(SIGN)等相關網站,搜集慢性心力衰竭中醫及西醫診療指南(或專家共識),檢索時限均為 2011 年 1 月 1 日至 2020 年 12 月 31 日。檢索采用主題詞和自由詞相結合的方式進行,并根據不同的數據庫調整檢索策略。中文檢索詞包括:心力衰竭、慢性心力衰竭、指南、共識、規范等;英文檢索詞包括:heart failure、chronic heart failure、guideline、guidance、consensus、standard 等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料并互相核對,若有不同意見,則請第三方協助判斷,缺少的資料盡量與作者聯系以補充完整。文獻篩選時先閱讀題目和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入指南或共識的基本信息:指南或共識名稱、發表時間、指南類型、制訂機構、參考文獻數量、是否更新等;② 指南或共識的方法學質量評價:指南的范圍和目的、參與人員、制訂的嚴謹性、表達的清晰性、指南應用性和編輯獨立性 6 個領域及指南的整體評價。
1.4 方法學質量評價
由 4 名評價員采用 AGREE Ⅱ工具[8]對納入的研究進行方法學質量評價。該工具分為 6 個領域,共計 23 個條目,各條目得分從 1 分(完全不符合)至 7 分(完全符合)不等[9]。評價前對所有評價者進行專業培訓,確保對每個條目的理解基本一致,評價標準相同。根據指南各領域的標準化百分比將指南分為三級:A 級:6 個領域得分均≥60%,可直接推薦;B 級:得分≥30% 的領域大于等于 3 個,有領域得分<60%,可修改后推薦;C 級:3 個以上領域得分<30%,因指南制訂方法不當或原始證據質量低,暫不推薦。各領域標準化百分比=(實際得分?可得最低分)/(可得最高分?可得最低分)×100%[10]。
1.5 統計分析
采用 SPSS 20.0 軟件計算組內相關系數(intraclass correlation coefficient,ICC),對 4 名評價員各條目評價結果的一致性進行檢驗。若 ICC≥0.80,說明一致性較好;若 ICC<0.80,則需重新培訓評價員,對該條目進行討論,并再次獨立評分,直至 ICC≥0.80。其他相關信息用 Excel 2010 進行統計描述。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻共 3 254 篇,經逐層篩選,最終納入 17 部指南和共識[5, 11-26]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表 1。

2.3 納入研究的方法學質量評價結果
4 名評價員 ICC 值為 0.893(>0.8),具有較好的一致性,可對評價結果進行分析。17 部指南或共識在 6 個領域平均標準化百分比分別為:范圍和目的(69.61%)、參與人員(34.20%)、制訂的嚴謹性(33.13%)、表達的明晰性(84.53%)、應用性(42.40%)、編輯獨立性(37.09%),整體得分中等偏下。推薦級別評價顯示:10 部指南的推薦級別為 B 級(修改后推薦),7 部為 C 級(不推薦),其中 3 部[5, 13, 17]B 級指南的整體水平接近 A 級,對臨床實踐具有重要的參考價值,具體各指南評價結果見表 2。

2.3.1 范圍和目的
該領域包含 3 個條目,涉及指南總目的、涵蓋的衛生問題、應用的人群。AGREE Ⅱ評分的平均分分別為 4.94、5.24 和 5.35。平均標準化百分比為 69.61%,最大值為 88.89%[17],最小值為 40.74%[26]。該領域整體得分較高,除 1 部指南[22]未明確指出制訂指南的目的外,其余 16 部指南或專家共識(16/17,94.11%)在該領域的闡述均相對完整。
2.3.2 參與人員
該領域包含 3 個條目,涉及指南制訂人員、目標人群觀點和選擇、使用者。AGREE Ⅱ評分的平均分分別為 4.35、1.53 和 3.27。平均標準化百分比為 34.20%,最大值為 81.48%[18],最小值為 12.96%[23, 25]。該領域整體得分較低,15 部指南或專家共識(15/17,88.24%)未提及目標人群(患者、公眾等)對指南意見。11 部指南或專家共識(11/17,64.71%)對參與人員在指南制訂小組中的職務、研究領域、所在單位和地址等描述不全面。國內 4 部指南或專家共識(4/17,23.53%)未明確規定指南的使用者。
2.3.3 制訂的嚴謹性
該領域包含 8 個條目,是條目最多也是指南制訂最重要的部分。涉及指南檢索證據的方法,選擇證據的標準,證據群的優勢和不足,形成推薦意見的方法,對健康的效益、副作用及風險,推薦意見和支持證據之間的聯系,發表前是否經過專家的外部評審和更新的過程。AGREE Ⅱ評分的平均分為 2.00、1.73、2.22、2.78、5.39、5.25、2.76 和 1.76。平均標準化百分比為 33.13%,最大值為 56.25%[5, 17],最小值為 5.56%[23]。該領域整體得分較低,除推薦意見對健康的效益和副作用及推薦意見和支持證據之間的聯系 2 個條目闡述較為明確外,13 部指南或專家共識(13/17,76.47%)沒有詳細描述檢索證據的方法和選擇證據的標準[27]。國內 5 部指南或專家共識(5/17,29.41%)未闡述形成推薦意見的方法。有 6 部英文[5, 11-13, 17, 18]和 1 部中文[26]指南在發表前經過了外部專家評審,僅有 1 部指南[5]明確提及指南的更新過程,其余 16 部指南或專家共識(16/17,94.11%)均未闡述。
2.3.4 表達的明晰性
該領域包含 3 個條目,包括指南推薦意見明確、同一衛生問題的不同選擇、主要推薦意見清晰易辨。AGREE Ⅱ評分的平均分為 5.92、6.00 和 6.29。平均標準化百分比為 84.53%,最大值為 94.44%[5],最小值為 61.11%[26]。該領域整體得分為 6 個領域最高,方法學質量最好,所有指南或專家共識都對這 3 個條目都進行了較為明確的闡述。
2.3.5 應用性
該領域包含 4 個條目,涉及指南應用過程中的促進和阻礙因素、應用于實踐的建議和(或)配套工具、應用推薦建議時潛在的資源投入、監控和(或)審計的標準。AGREE Ⅱ評分的平均分為 1.53、4.88、2.39 和 5.37。平均標準化百分比為 42.40%,最大值為 73.61%[17],最小值為 9.72%[26]。該領域整體得分中等偏下。除 1 部指南[17]描述了應用過程中的促進和阻礙因素,其余 16 部指南或專家共識(16/17,94.11%)均未提及;7 部指南(7/17,41.18%)闡述了應用推薦建議時潛在的資源投入。僅有 1 部專家共識[23]沒有提及監控和審計標準。
2.3.6 編輯獨立性
該領域包含 2 個條目,涉及贊助單位的觀點對推薦意見的影響、制訂小組成員的利益沖突。AGREE Ⅱ評分的平均分分別為 2.37 和 4.08。平均標準化百分比為 37.09%,最大值為 83.33%[5, 11],最小值為 0.00%[16, 23, 24]。該領域整體得分中等偏下,但是最大值和最小值的差異較大。有 5 部指南[5, 11, 13, 14, 17]說明了贊助單位的觀點對推薦意見沒有影響,5 部未提及制訂小組成員的利益沖突[12, 16, 23, 24, 26]。
3 討論
2011 年美國醫學科學院對臨床實踐指南的最新定義是:基于系統評價的證據和平衡了不同干預措施的利弊,在此基礎上形成的能夠為患者提供最佳保健服務的推薦意見[6, 7]。制訂指南對于提高醫務人員醫療水平、規范醫療行為、科學配置醫療資源和保障患者權益等方面起著十分重要的作用[28]。指南的潛在益處取決于指南本身的質量,低質量指南可能會對醫務人員指導不當,浪費醫療資源甚至對患者健康產生不利影響[29]。因此,本研究使用國際公認的指南評價工具 AGREE Ⅱ對近十年全球范圍內慢性心力衰竭的診療指南或專家共識進行了方法學質量評價,以期為今后指南的制訂和更新提供參考。
本研究結果顯示,納入指南或共識在表達的明晰性領域得分最高,其次是范圍和目的,制訂的嚴謹性和參與人員 2 個領域得分較低,有 4 部指南(或專家共識)編輯獨立性領域得分為 0.00%。英文指南的方法學質量整體較好(B 級 10 部,C 級 1 部);中文指南(或專家共識)6 個領域得分均幾乎全部低于平均分,推薦等級均為 C 級,其中《中醫內科常見病診療指南(西醫疾病部分)心力衰竭》[26]在 6 個領域的整體得分最低,需要在今后更新的過程中全面修訂。此外,國內中醫或中西醫專家共識較西醫指南整體得分低,除今后需要規范中醫診療指南或專家共識的制訂流程外,還可能與中醫的診療特色有關。
目前指南或專家共識主要存在的不足為:① 對工作人員在指南制訂小組中的職責、研究領域、所在單位和地址等描述不全面;未考慮目標人群(患者、公眾等)對指南的觀點和選擇;② 指南制訂的嚴謹性不足,沒有描述詳細檢索策略、證據的納排標準;未明確指出證據優勢和劣勢;③ 未闡述形成推薦意見的方法,中醫領域多是非正式的共識;④ 半數以上的指南在發表前沒有經過外部專家和目標人群審核;⑤ 未提及指南是否會被更新,更新的方法、時間及周期等;⑥ 中文指南未闡述在推薦意見應用時需要投入的額外資金以及監控和審計標準。慢性心力衰竭臨床診療指南存在英文和中文質量差別較大的情況,雖然在方法學方面有一些共性的不足,但是中文指南(特別是中醫藥類專家共識)需要全面提高其各個領域的質量。
針對上述不足,提出以下建議:① 參與人員方面:預先制訂并報告指南工作組成員的職責、研究領域和所在單位等;可通過調查問卷、文獻綜述等方式獲取目標人群的觀點和選擇;② 嚴謹性方面:詳細闡述文獻的檢索策略和納排標準,說明制訂過程中使用的評估偏倚風險的方法或工具;詳細介紹制訂推薦意見的具體方法和形成最終意見的過程;指南發表前應進行外審;提供詳細的更新過程(包括更新的方法、時間及周期等);③ 應用性方面:詳細說明推薦意見應用時需要投入的額外資金;④ 編輯獨立性方面:若有贊助機構,需要明確其觀點或利益不會對指南產生任何影響。
本研究存在的局限性:① 本研究只納入了目前網絡上能夠檢索到的文獻,未在網絡上發表的指南可能會有遺漏;② 本研究只對指南或共識的方法學質量進行了評價,未評價指南的具體內容或原始證據等,評價結果對指南整體來說可能相對片面;③ 盡管在正式評價前對每位評價員都進行了培訓,但評分結果可能依然存在主觀性,可能有一定的偏倚風險。
綜上所述,慢性心力衰竭診療指南或共識在參與人員和制訂的嚴謹性方面需進一步完善,中文指南或專家共識應在多個方面借鑒英文指南制訂標準與方法提升質量,以更好地服務于臨床實踐。此外,推薦制訂者按照國際實踐指南報告規范 RIGHT 的條目對指南進行撰寫與報告,并在國際實踐指南注冊平臺進行注冊,推進指南制訂、評價工作的規范化和透明化。
聲明 本研究無任何利益沖突。
心力衰竭是造成心血管疾病患者死亡的原因之一,其中慢性心力衰竭影響著全球約 2% 成年人的健康[1, 2]。據《中國心血管健康與疾病報告 2019 概要》公布的數據,中國現有心力衰竭患者已達 890 萬,其患病率和死亡率仍處于上升階段[3]。在發達國家,預計未來 20 年與心力衰竭治療相關的醫療費用將增加 200% 以上[1]。心力衰竭在威脅人們身體健康的同時,也增加了公共衛生領域的經濟負擔。
臨床實踐指南是針對醫療衛生專業人員的臨床問題,基于當前可得的最佳證據,共識得出的推薦意見,是醫療實踐的指導性文件,均具有重要的臨床意義和價值[4]。制訂高質量的臨床實踐指南有利于疾病的規范化診療及更有效地利用醫療資源,所以對現有研究進行質量評價尤為重要。本研究使用國際公認的 AGREE Ⅱ評價工具對國內外公開發表的西醫、中醫、中西醫慢性心力衰竭的診療指南及專家共識進行評價,以期為今后指南的制訂和更新提供參考。
1 研究方法
1.1 納入與排除標準
1.1.1 納入標準
① 疾病診斷標準符合慢性心力衰竭的定義[5];② 符合臨床實踐指南[6]、專家共識[7]的定義和規范;③ 語種限定為中、英文。
1.1.2 排除標準
① 指南解讀或摘要;② 被新版指南代替的舊版指南;③ 無法獲取全文;④ 慢性心力衰竭合并癥診療指南;⑤ 指南內容只涉及慢性心力衰竭的診斷或用藥單個方面。
1.2 文獻檢索策略
計算機檢索 PubMed、EMbase、SinoMed、CNKI、WanFang Data、VIP 數據庫及中華醫學會心血管病學分會、中國中西醫結合學會官方網站、National Institute for Health and Clinical Excellenc(NICE)、Scottish Intercollegiate Guidelines Network(SIGN)等相關網站,搜集慢性心力衰竭中醫及西醫診療指南(或專家共識),檢索時限均為 2011 年 1 月 1 日至 2020 年 12 月 31 日。檢索采用主題詞和自由詞相結合的方式進行,并根據不同的數據庫調整檢索策略。中文檢索詞包括:心力衰竭、慢性心力衰竭、指南、共識、規范等;英文檢索詞包括:heart failure、chronic heart failure、guideline、guidance、consensus、standard 等。以 PubMed 為例,其具體檢索策略見框 1。

1.3 文獻篩選與資料提取
由 2 名研究者獨立篩選文獻、提取資料并互相核對,若有不同意見,則請第三方協助判斷,缺少的資料盡量與作者聯系以補充完整。文獻篩選時先閱讀題目和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入指南或共識的基本信息:指南或共識名稱、發表時間、指南類型、制訂機構、參考文獻數量、是否更新等;② 指南或共識的方法學質量評價:指南的范圍和目的、參與人員、制訂的嚴謹性、表達的清晰性、指南應用性和編輯獨立性 6 個領域及指南的整體評價。
1.4 方法學質量評價
由 4 名評價員采用 AGREE Ⅱ工具[8]對納入的研究進行方法學質量評價。該工具分為 6 個領域,共計 23 個條目,各條目得分從 1 分(完全不符合)至 7 分(完全符合)不等[9]。評價前對所有評價者進行專業培訓,確保對每個條目的理解基本一致,評價標準相同。根據指南各領域的標準化百分比將指南分為三級:A 級:6 個領域得分均≥60%,可直接推薦;B 級:得分≥30% 的領域大于等于 3 個,有領域得分<60%,可修改后推薦;C 級:3 個以上領域得分<30%,因指南制訂方法不當或原始證據質量低,暫不推薦。各領域標準化百分比=(實際得分?可得最低分)/(可得最高分?可得最低分)×100%[10]。
1.5 統計分析
采用 SPSS 20.0 軟件計算組內相關系數(intraclass correlation coefficient,ICC),對 4 名評價員各條目評價結果的一致性進行檢驗。若 ICC≥0.80,說明一致性較好;若 ICC<0.80,則需重新培訓評價員,對該條目進行討論,并再次獨立評分,直至 ICC≥0.80。其他相關信息用 Excel 2010 進行統計描述。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻共 3 254 篇,經逐層篩選,最終納入 17 部指南和共識[5, 11-26]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入研究的基本特征
納入研究的基本特征見表 1。

2.3 納入研究的方法學質量評價結果
4 名評價員 ICC 值為 0.893(>0.8),具有較好的一致性,可對評價結果進行分析。17 部指南或共識在 6 個領域平均標準化百分比分別為:范圍和目的(69.61%)、參與人員(34.20%)、制訂的嚴謹性(33.13%)、表達的明晰性(84.53%)、應用性(42.40%)、編輯獨立性(37.09%),整體得分中等偏下。推薦級別評價顯示:10 部指南的推薦級別為 B 級(修改后推薦),7 部為 C 級(不推薦),其中 3 部[5, 13, 17]B 級指南的整體水平接近 A 級,對臨床實踐具有重要的參考價值,具體各指南評價結果見表 2。

2.3.1 范圍和目的
該領域包含 3 個條目,涉及指南總目的、涵蓋的衛生問題、應用的人群。AGREE Ⅱ評分的平均分分別為 4.94、5.24 和 5.35。平均標準化百分比為 69.61%,最大值為 88.89%[17],最小值為 40.74%[26]。該領域整體得分較高,除 1 部指南[22]未明確指出制訂指南的目的外,其余 16 部指南或專家共識(16/17,94.11%)在該領域的闡述均相對完整。
2.3.2 參與人員
該領域包含 3 個條目,涉及指南制訂人員、目標人群觀點和選擇、使用者。AGREE Ⅱ評分的平均分分別為 4.35、1.53 和 3.27。平均標準化百分比為 34.20%,最大值為 81.48%[18],最小值為 12.96%[23, 25]。該領域整體得分較低,15 部指南或專家共識(15/17,88.24%)未提及目標人群(患者、公眾等)對指南意見。11 部指南或專家共識(11/17,64.71%)對參與人員在指南制訂小組中的職務、研究領域、所在單位和地址等描述不全面。國內 4 部指南或專家共識(4/17,23.53%)未明確規定指南的使用者。
2.3.3 制訂的嚴謹性
該領域包含 8 個條目,是條目最多也是指南制訂最重要的部分。涉及指南檢索證據的方法,選擇證據的標準,證據群的優勢和不足,形成推薦意見的方法,對健康的效益、副作用及風險,推薦意見和支持證據之間的聯系,發表前是否經過專家的外部評審和更新的過程。AGREE Ⅱ評分的平均分為 2.00、1.73、2.22、2.78、5.39、5.25、2.76 和 1.76。平均標準化百分比為 33.13%,最大值為 56.25%[5, 17],最小值為 5.56%[23]。該領域整體得分較低,除推薦意見對健康的效益和副作用及推薦意見和支持證據之間的聯系 2 個條目闡述較為明確外,13 部指南或專家共識(13/17,76.47%)沒有詳細描述檢索證據的方法和選擇證據的標準[27]。國內 5 部指南或專家共識(5/17,29.41%)未闡述形成推薦意見的方法。有 6 部英文[5, 11-13, 17, 18]和 1 部中文[26]指南在發表前經過了外部專家評審,僅有 1 部指南[5]明確提及指南的更新過程,其余 16 部指南或專家共識(16/17,94.11%)均未闡述。
2.3.4 表達的明晰性
該領域包含 3 個條目,包括指南推薦意見明確、同一衛生問題的不同選擇、主要推薦意見清晰易辨。AGREE Ⅱ評分的平均分為 5.92、6.00 和 6.29。平均標準化百分比為 84.53%,最大值為 94.44%[5],最小值為 61.11%[26]。該領域整體得分為 6 個領域最高,方法學質量最好,所有指南或專家共識都對這 3 個條目都進行了較為明確的闡述。
2.3.5 應用性
該領域包含 4 個條目,涉及指南應用過程中的促進和阻礙因素、應用于實踐的建議和(或)配套工具、應用推薦建議時潛在的資源投入、監控和(或)審計的標準。AGREE Ⅱ評分的平均分為 1.53、4.88、2.39 和 5.37。平均標準化百分比為 42.40%,最大值為 73.61%[17],最小值為 9.72%[26]。該領域整體得分中等偏下。除 1 部指南[17]描述了應用過程中的促進和阻礙因素,其余 16 部指南或專家共識(16/17,94.11%)均未提及;7 部指南(7/17,41.18%)闡述了應用推薦建議時潛在的資源投入。僅有 1 部專家共識[23]沒有提及監控和審計標準。
2.3.6 編輯獨立性
該領域包含 2 個條目,涉及贊助單位的觀點對推薦意見的影響、制訂小組成員的利益沖突。AGREE Ⅱ評分的平均分分別為 2.37 和 4.08。平均標準化百分比為 37.09%,最大值為 83.33%[5, 11],最小值為 0.00%[16, 23, 24]。該領域整體得分中等偏下,但是最大值和最小值的差異較大。有 5 部指南[5, 11, 13, 14, 17]說明了贊助單位的觀點對推薦意見沒有影響,5 部未提及制訂小組成員的利益沖突[12, 16, 23, 24, 26]。
3 討論
2011 年美國醫學科學院對臨床實踐指南的最新定義是:基于系統評價的證據和平衡了不同干預措施的利弊,在此基礎上形成的能夠為患者提供最佳保健服務的推薦意見[6, 7]。制訂指南對于提高醫務人員醫療水平、規范醫療行為、科學配置醫療資源和保障患者權益等方面起著十分重要的作用[28]。指南的潛在益處取決于指南本身的質量,低質量指南可能會對醫務人員指導不當,浪費醫療資源甚至對患者健康產生不利影響[29]。因此,本研究使用國際公認的指南評價工具 AGREE Ⅱ對近十年全球范圍內慢性心力衰竭的診療指南或專家共識進行了方法學質量評價,以期為今后指南的制訂和更新提供參考。
本研究結果顯示,納入指南或共識在表達的明晰性領域得分最高,其次是范圍和目的,制訂的嚴謹性和參與人員 2 個領域得分較低,有 4 部指南(或專家共識)編輯獨立性領域得分為 0.00%。英文指南的方法學質量整體較好(B 級 10 部,C 級 1 部);中文指南(或專家共識)6 個領域得分均幾乎全部低于平均分,推薦等級均為 C 級,其中《中醫內科常見病診療指南(西醫疾病部分)心力衰竭》[26]在 6 個領域的整體得分最低,需要在今后更新的過程中全面修訂。此外,國內中醫或中西醫專家共識較西醫指南整體得分低,除今后需要規范中醫診療指南或專家共識的制訂流程外,還可能與中醫的診療特色有關。
目前指南或專家共識主要存在的不足為:① 對工作人員在指南制訂小組中的職責、研究領域、所在單位和地址等描述不全面;未考慮目標人群(患者、公眾等)對指南的觀點和選擇;② 指南制訂的嚴謹性不足,沒有描述詳細檢索策略、證據的納排標準;未明確指出證據優勢和劣勢;③ 未闡述形成推薦意見的方法,中醫領域多是非正式的共識;④ 半數以上的指南在發表前沒有經過外部專家和目標人群審核;⑤ 未提及指南是否會被更新,更新的方法、時間及周期等;⑥ 中文指南未闡述在推薦意見應用時需要投入的額外資金以及監控和審計標準。慢性心力衰竭臨床診療指南存在英文和中文質量差別較大的情況,雖然在方法學方面有一些共性的不足,但是中文指南(特別是中醫藥類專家共識)需要全面提高其各個領域的質量。
針對上述不足,提出以下建議:① 參與人員方面:預先制訂并報告指南工作組成員的職責、研究領域和所在單位等;可通過調查問卷、文獻綜述等方式獲取目標人群的觀點和選擇;② 嚴謹性方面:詳細闡述文獻的檢索策略和納排標準,說明制訂過程中使用的評估偏倚風險的方法或工具;詳細介紹制訂推薦意見的具體方法和形成最終意見的過程;指南發表前應進行外審;提供詳細的更新過程(包括更新的方法、時間及周期等);③ 應用性方面:詳細說明推薦意見應用時需要投入的額外資金;④ 編輯獨立性方面:若有贊助機構,需要明確其觀點或利益不會對指南產生任何影響。
本研究存在的局限性:① 本研究只納入了目前網絡上能夠檢索到的文獻,未在網絡上發表的指南可能會有遺漏;② 本研究只對指南或共識的方法學質量進行了評價,未評價指南的具體內容或原始證據等,評價結果對指南整體來說可能相對片面;③ 盡管在正式評價前對每位評價員都進行了培訓,但評分結果可能依然存在主觀性,可能有一定的偏倚風險。
綜上所述,慢性心力衰竭診療指南或共識在參與人員和制訂的嚴謹性方面需進一步完善,中文指南或專家共識應在多個方面借鑒英文指南制訂標準與方法提升質量,以更好地服務于臨床實踐。此外,推薦制訂者按照國際實踐指南報告規范 RIGHT 的條目對指南進行撰寫與報告,并在國際實踐指南注冊平臺進行注冊,推進指南制訂、評價工作的規范化和透明化。
聲明 本研究無任何利益沖突。