引用本文: 李萬怡, 王永軍, 魏莉莉, 楊柳, 王文媛, 張瑞鵬, 杜威萍, 楊克虎, 劉東海, 易彬. 支氣管肺泡灌洗指南的方法學質量評價. 中國循證醫學雜志, 2021, 21(11): 1325-1331. doi: 10.7507/1672-2531.202108085 復制
支氣管肺泡灌洗是一項通過可彎曲支氣管鏡收集及清理肺泡表面覆著液體或聚集于肺泡內物質從而起到診斷或治療作用的技術[1]。隨著可彎曲支氣管鏡檢查技術的不斷發展,支氣管肺泡灌洗已成為診斷或治療某些肺部疾病的重要選擇。德國曾于2015年在全國范圍內實施關于支氣管鏡檢查臨床實踐的橫斷面調查,結果顯示在支氣管鏡檢查的實施過程中,支氣管肺泡灌洗的實施率可達97.0%,是支氣管鏡檢查操作中最常用檢查[2]。支氣管肺泡灌洗液可通過提供生物活性介質、細胞因子、酶類等生物學信息,為肺間質性疾病、呼吸道腫瘤、難治性肺炎等多種疑難疾病的診治搭建牢固的階梯。自支氣管肺泡灌洗技術問世至今,國內外已涌現多部對于肺泡灌洗技術操作、提樣分析等方面的指南,為臨床規范化治療工作奠定了的基礎。
對于臨床工作者而言,高質量指南是臨床實踐的最佳指導,因此,如何客觀公正且合理地評估指南的質量,是方法學研究的重要內容。AGREE評價工具于2003年由AGREE協作網制訂并發布,用于臨床實踐指南質量的評估和對比[3],并逐漸獲得了世界范圍內多個醫療機構的認可。2009年AGREE Next Steps協會為進一步修訂AGREE工具,提高其實用性和科學性,在其基礎上制訂了AGREE Ⅱ評價工具[4],該工具包括6個領域,共23個條目,是目前國際上用于指導臨床實踐指南的制訂、報告和評估的重要工具[5]。2018年我國學者也對AGREE Ⅱ評價工具進行了詳細的中文實例解釋和說明[6]。本研究采用AGREE Ⅱ評價工具對國內外支氣管肺泡灌洗指南進行質量評價,以期為我國的呼吸科臨床工作者和指南制訂專家完善支氣管肺泡灌洗相關指南制訂工作提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
國內外關于支氣管肺泡灌洗的指南、專家共識和立場文件等。
1.1.2 排除標準
① 非中英文指南;② 重復發表的指南;③ 指南的解讀、摘要和譯文;④ 已更新指南的舊版本;⑤ 無法獲取全文的指南。
1.2 文獻檢索策略
計算機檢索CNKI、VIP、WanFang Data、CBM、Web of Science、PubMed、EMbase數據庫及醫脈通、美國國立指南文庫(National Guideline Clearinghouse,NGC)、國際指南協作網(Guideline International Network,GIN)、蘇格蘭校際指南網絡(Scottish Intercollegiate Guidelines Network,SIGN)、英國國家臨床優化研究所(National Institute for Clinical Excellence,NICE)、世界衛生組織(World Health Organization,WHO)等網站,搜集關于支氣管肺泡灌洗的臨床實踐指南,檢索時限均從建庫至2020年12月。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。英文檢索詞包括:lung lavage*、bronchioalveolar lavage*、bronchoalveolar lavage fluid*、pulmonary lavage fluid*、guideline*、practice guideline、recommendation*、standard*等;中文檢索詞包括:支氣管鏡、支氣管肺泡灌洗、指南和專家共識等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。確定納入指南后,根據預先制訂好的信息提取表對納入指南進行提取數據,資料提取的內容包括:① 納入指南的基本信息,包括指南名稱、發布國家或區域、發布時間、發布機構、編委人數、頁數、參考文獻數;② 方法學質量評價需要的關鍵要素。
1.4 納入指南的質量評價和統計分析
由4名研究者獨立采用AGREE Ⅱ工具評價納入研究的方法學質量,并交叉核對結果。AGREE Ⅱ工具包含范圍和目的、參與人員、嚴謹性、清晰性、應用性和獨立性6個領域,共23個條目,每個條目的分值在1~7分之間,完全符合該條目評7分,完全不符合該條目評1分,介于二者之間依據具體情況評2~6分。
計算每部指南6個領域的標化得分,標化得分=(實際分數?最低可得分數)/(最高可得分數?最低可得分數)×100%;依據標化得分,將指南劃分為A、B、C三個等級,劃分標準如下:① 6個領域標化得分均大于或等于60.00%,劃分為A級(推薦);大于等于3個領域的得分大于或等于30.00%,有的領域得分小于60.00%,劃分為B級(不同程度修改完善后推薦);小于或等于3個領域的得分<30.00%劃分為C級(不推薦)。使用SPSS 20.0軟件分析數據,采用組內相關系數評估4名評價者的一致性。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻2 850篇,經逐層篩選,最終納入指南、專家共識或推薦意見共19篇[1,7-24]。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入指南的基本特征
納入指南的基本特征見表1。

2.3 評價結果
2.3.1 領域1:范圍和目的
此領域包括3個條目。納入指南在此領域得分較好,平均分50.73%(表2)。

2.3.2 領域2:參與人員
此領域包括3個條目。納入指南在該領域得分較低,平均分20.2%(表2)。
2.3.3 領域3:嚴謹性
此領域包括8個條目。納入指南在此領域得分較低,平均分僅15.13%(表2)。
2.3.4 領域4:清晰性
此領域包括3個條目。納入指南在此領域得分較低,平均分36.40%(表2)。
2.3.5 領域5:應用性
此領域包括4個條目。該領域平均得分最低,為3.51%(表2)。
2.3.6 領域6:獨立性
此領域共有2個條目。該領域平均得分為22.37%,但分數呈兩極分化(表2)。
2.3.7 總體評價
納入19部指南中,無A級指南,有3部(15.79%)B級指南,其余13部(84.21%)均為C級指南(表2)。
2.4 指南質量與AGREE Ⅱ發布時間的關系
AGREE Ⅱ評價工具于2009年發布[4]。在納入指南中,發布于2009年前的6篇(31.59%)指南均為C級;所有B級指南均發布于2009年及以后。2009年后發布的指南在范圍和目的、參與人員、嚴謹性及獨立性4個領域的得分較2009年前發布的指南均顯著提升(P<0.05)(表3)。


2.5 國內外指南方法學對比分析
納入中國指南5部,國外指南14部,兩組比較結果顯示,僅在“編輯獨立性”這一領域國外指南得分高于國內指南(P<0.05),其余5個領域的差異均無統計學意義(表4)。


3 討論
從第一部支氣管肺泡灌洗相關指南發布至今已有30余年,多部支氣管肺泡灌洗相關指南的發布、完善與修訂,指引著全國甚至世界的呼吸內科醫師更加精確、規范地實施支氣管肺泡灌洗技術。如何公正、客觀地評價這些指南的質量高低,從而選取科學可靠的建議或者為新指南的制訂提供思路與方法,成為業內人士越來越關注的問題。循證醫學的快速發展與進步,為這一關鍵問題帶來了較為完美方案[25-27]。AGREE Ⅱ評價工具以循證醫學理念為基礎,可清晰地反應指南制訂過程的透明性及嚴謹性,同時,也為新指南的制訂提供了合理的方法及思路。
本研究結果顯示,支氣管肺泡灌洗指南在6個領域所得平均分從低到高依次為領域5、領域3、領域2、領域6、領域4和領域1。根據得分劃分質量級別,納入指南中無A級指南,有3部B級指南和16部C級指南,可見目前發布的支氣管肺泡灌洗指南大部分級別較低。得分偏低主要集中于以下幾個領域:① 應用性領域:如果沒有對推薦的指南制訂過程和促進指南實施的干預措施進行評估,就無法知道該標準是否能夠產生公正、可信的影響[28]。指南發布的目的在于更好地幫助目標人群獲得規范且高質量的干預方案,若指南開發過程中忽視應用性的重要性,會影響指南開發的目的實施;此次研究納入指南中約80%指南均未涉及該領域,可見指南制訂者對于此領域的重視程度尚欠缺。② 嚴謹性領域:該領域反應指南產生建議的過程是否科學合理及證據質量高低。“證據質量”一詞用來描述關于證據所涉及的問題的結論的可信度或確定性水平[28],是反應指南嚴謹性的重要因素,高質量證據從產生到收集并不是一個容易的過程,其嚴格體現了醫學研究的嚴謹性和科學性[29-31]。這一領域對決定指南的質量高低有著至關重要的作用,研究表明該領域中的7~12條目對于指南的質量評估及推薦建議的使用方面影響最大[32]。本研究納入的19部指南或共識中,除3部評定為B級的指南評分高于50%,其余16部指南均得分在0%~26.04%之間,追其原因大部分指南未對證據的檢索、選擇、強度評定方面進行重點側重,且忽略了指南推薦建議的形成方法及推薦建議對于健康的收益及不利因素,亦未考慮推薦建議及證據間的聯系。且幾乎所有指南都未經過外部評審,未對更新計劃有預計步驟或實施。③ 參與人員領域:該領域是對指南制訂參與人員的專業性和多樣性的評估,指南制訂人員應當有多學科專家,方法學家、臨床醫生、臨床流行病學及循證醫學專家、護理專家、期刊編輯、國家政策制訂者的參與[33],納入的19篇指南,大部分僅提及臨床醫學領域專家,而方法學專家、流行病學和循證醫學專家等的參與度較低。高質量指南應當征求目標人群的觀點和選擇,本研究納入的指南中僅有1部指南提及征求目標人群的意見,但未詳細描述,除此外所以指南均未對目標人群意見進行收集;對于指南的適用者方面,大部分指南都有涉及,但較為含糊,未能明確指出。④ 獨立性領域,指南的獨立性是指須聲明指南制訂參與者及資金贊助者之間沒有利益沖突,本研究納入指南中超過一半均未提及。⑤ 清晰性領域:大部分指南均明確列出了所推薦的意見,但未突出重要建議的識別,且僅有部分在對于不同的衛生問題及選擇有所陳述,故該領域得分亦不理想。
以AGREE Ⅱ發布的年份2009年為節點進行前后比較,結果顯示2009年后指南在數量及質量上都有較大提升,提示AGREE Ⅱ的發表和傳播促進了指南質量進步[34]。對國內外指南進行對比,發現大部分領域兩者沒有顯著差異,但國內指南全部為C級,可見國內指南質量仍有提升空間,尤其在編輯獨立性方面需大幅改進。
本研究的局限性:① 由于研究者對AGREE Ⅱ工具存在主觀認識,可能引起偏差;② 本研究只限定于中英文指南,而對于其他文種指南并未納入,可能存在發表偏倚。
綜上所述,國內外支氣管肺泡灌洗相關指南的方法學質量有待進一步提高。建議指南制訂者掌握相關指南報告和評價工具,重視指南制訂過程中的細節問題和規范性,從而更好地提升指南的質量。
支氣管肺泡灌洗是一項通過可彎曲支氣管鏡收集及清理肺泡表面覆著液體或聚集于肺泡內物質從而起到診斷或治療作用的技術[1]。隨著可彎曲支氣管鏡檢查技術的不斷發展,支氣管肺泡灌洗已成為診斷或治療某些肺部疾病的重要選擇。德國曾于2015年在全國范圍內實施關于支氣管鏡檢查臨床實踐的橫斷面調查,結果顯示在支氣管鏡檢查的實施過程中,支氣管肺泡灌洗的實施率可達97.0%,是支氣管鏡檢查操作中最常用檢查[2]。支氣管肺泡灌洗液可通過提供生物活性介質、細胞因子、酶類等生物學信息,為肺間質性疾病、呼吸道腫瘤、難治性肺炎等多種疑難疾病的診治搭建牢固的階梯。自支氣管肺泡灌洗技術問世至今,國內外已涌現多部對于肺泡灌洗技術操作、提樣分析等方面的指南,為臨床規范化治療工作奠定了的基礎。
對于臨床工作者而言,高質量指南是臨床實踐的最佳指導,因此,如何客觀公正且合理地評估指南的質量,是方法學研究的重要內容。AGREE評價工具于2003年由AGREE協作網制訂并發布,用于臨床實踐指南質量的評估和對比[3],并逐漸獲得了世界范圍內多個醫療機構的認可。2009年AGREE Next Steps協會為進一步修訂AGREE工具,提高其實用性和科學性,在其基礎上制訂了AGREE Ⅱ評價工具[4],該工具包括6個領域,共23個條目,是目前國際上用于指導臨床實踐指南的制訂、報告和評估的重要工具[5]。2018年我國學者也對AGREE Ⅱ評價工具進行了詳細的中文實例解釋和說明[6]。本研究采用AGREE Ⅱ評價工具對國內外支氣管肺泡灌洗指南進行質量評價,以期為我國的呼吸科臨床工作者和指南制訂專家完善支氣管肺泡灌洗相關指南制訂工作提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
國內外關于支氣管肺泡灌洗的指南、專家共識和立場文件等。
1.1.2 排除標準
① 非中英文指南;② 重復發表的指南;③ 指南的解讀、摘要和譯文;④ 已更新指南的舊版本;⑤ 無法獲取全文的指南。
1.2 文獻檢索策略
計算機檢索CNKI、VIP、WanFang Data、CBM、Web of Science、PubMed、EMbase數據庫及醫脈通、美國國立指南文庫(National Guideline Clearinghouse,NGC)、國際指南協作網(Guideline International Network,GIN)、蘇格蘭校際指南網絡(Scottish Intercollegiate Guidelines Network,SIGN)、英國國家臨床優化研究所(National Institute for Clinical Excellence,NICE)、世界衛生組織(World Health Organization,WHO)等網站,搜集關于支氣管肺泡灌洗的臨床實踐指南,檢索時限均從建庫至2020年12月。檢索采用主題詞與自由詞相結合的方式進行,并根據各數據庫特點進行調整。同時檢索納入研究的參考文獻,以補充獲取相關資料。英文檢索詞包括:lung lavage*、bronchioalveolar lavage*、bronchoalveolar lavage fluid*、pulmonary lavage fluid*、guideline*、practice guideline、recommendation*、standard*等;中文檢索詞包括:支氣管鏡、支氣管肺泡灌洗、指南和專家共識等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選與資料提取
由2名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文文獻篩選時首先閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。確定納入指南后,根據預先制訂好的信息提取表對納入指南進行提取數據,資料提取的內容包括:① 納入指南的基本信息,包括指南名稱、發布國家或區域、發布時間、發布機構、編委人數、頁數、參考文獻數;② 方法學質量評價需要的關鍵要素。
1.4 納入指南的質量評價和統計分析
由4名研究者獨立采用AGREE Ⅱ工具評價納入研究的方法學質量,并交叉核對結果。AGREE Ⅱ工具包含范圍和目的、參與人員、嚴謹性、清晰性、應用性和獨立性6個領域,共23個條目,每個條目的分值在1~7分之間,完全符合該條目評7分,完全不符合該條目評1分,介于二者之間依據具體情況評2~6分。
計算每部指南6個領域的標化得分,標化得分=(實際分數?最低可得分數)/(最高可得分數?最低可得分數)×100%;依據標化得分,將指南劃分為A、B、C三個等級,劃分標準如下:① 6個領域標化得分均大于或等于60.00%,劃分為A級(推薦);大于等于3個領域的得分大于或等于30.00%,有的領域得分小于60.00%,劃分為B級(不同程度修改完善后推薦);小于或等于3個領域的得分<30.00%劃分為C級(不推薦)。使用SPSS 20.0軟件分析數據,采用組內相關系數評估4名評價者的一致性。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻2 850篇,經逐層篩選,最終納入指南、專家共識或推薦意見共19篇[1,7-24]。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:PubMed(
2.2 納入指南的基本特征
納入指南的基本特征見表1。

2.3 評價結果
2.3.1 領域1:范圍和目的
此領域包括3個條目。納入指南在此領域得分較好,平均分50.73%(表2)。

2.3.2 領域2:參與人員
此領域包括3個條目。納入指南在該領域得分較低,平均分20.2%(表2)。
2.3.3 領域3:嚴謹性
此領域包括8個條目。納入指南在此領域得分較低,平均分僅15.13%(表2)。
2.3.4 領域4:清晰性
此領域包括3個條目。納入指南在此領域得分較低,平均分36.40%(表2)。
2.3.5 領域5:應用性
此領域包括4個條目。該領域平均得分最低,為3.51%(表2)。
2.3.6 領域6:獨立性
此領域共有2個條目。該領域平均得分為22.37%,但分數呈兩極分化(表2)。
2.3.7 總體評價
納入19部指南中,無A級指南,有3部(15.79%)B級指南,其余13部(84.21%)均為C級指南(表2)。
2.4 指南質量與AGREE Ⅱ發布時間的關系
AGREE Ⅱ評價工具于2009年發布[4]。在納入指南中,發布于2009年前的6篇(31.59%)指南均為C級;所有B級指南均發布于2009年及以后。2009年后發布的指南在范圍和目的、參與人員、嚴謹性及獨立性4個領域的得分較2009年前發布的指南均顯著提升(P<0.05)(表3)。


2.5 國內外指南方法學對比分析
納入中國指南5部,國外指南14部,兩組比較結果顯示,僅在“編輯獨立性”這一領域國外指南得分高于國內指南(P<0.05),其余5個領域的差異均無統計學意義(表4)。


3 討論
從第一部支氣管肺泡灌洗相關指南發布至今已有30余年,多部支氣管肺泡灌洗相關指南的發布、完善與修訂,指引著全國甚至世界的呼吸內科醫師更加精確、規范地實施支氣管肺泡灌洗技術。如何公正、客觀地評價這些指南的質量高低,從而選取科學可靠的建議或者為新指南的制訂提供思路與方法,成為業內人士越來越關注的問題。循證醫學的快速發展與進步,為這一關鍵問題帶來了較為完美方案[25-27]。AGREE Ⅱ評價工具以循證醫學理念為基礎,可清晰地反應指南制訂過程的透明性及嚴謹性,同時,也為新指南的制訂提供了合理的方法及思路。
本研究結果顯示,支氣管肺泡灌洗指南在6個領域所得平均分從低到高依次為領域5、領域3、領域2、領域6、領域4和領域1。根據得分劃分質量級別,納入指南中無A級指南,有3部B級指南和16部C級指南,可見目前發布的支氣管肺泡灌洗指南大部分級別較低。得分偏低主要集中于以下幾個領域:① 應用性領域:如果沒有對推薦的指南制訂過程和促進指南實施的干預措施進行評估,就無法知道該標準是否能夠產生公正、可信的影響[28]。指南發布的目的在于更好地幫助目標人群獲得規范且高質量的干預方案,若指南開發過程中忽視應用性的重要性,會影響指南開發的目的實施;此次研究納入指南中約80%指南均未涉及該領域,可見指南制訂者對于此領域的重視程度尚欠缺。② 嚴謹性領域:該領域反應指南產生建議的過程是否科學合理及證據質量高低。“證據質量”一詞用來描述關于證據所涉及的問題的結論的可信度或確定性水平[28],是反應指南嚴謹性的重要因素,高質量證據從產生到收集并不是一個容易的過程,其嚴格體現了醫學研究的嚴謹性和科學性[29-31]。這一領域對決定指南的質量高低有著至關重要的作用,研究表明該領域中的7~12條目對于指南的質量評估及推薦建議的使用方面影響最大[32]。本研究納入的19部指南或共識中,除3部評定為B級的指南評分高于50%,其余16部指南均得分在0%~26.04%之間,追其原因大部分指南未對證據的檢索、選擇、強度評定方面進行重點側重,且忽略了指南推薦建議的形成方法及推薦建議對于健康的收益及不利因素,亦未考慮推薦建議及證據間的聯系。且幾乎所有指南都未經過外部評審,未對更新計劃有預計步驟或實施。③ 參與人員領域:該領域是對指南制訂參與人員的專業性和多樣性的評估,指南制訂人員應當有多學科專家,方法學家、臨床醫生、臨床流行病學及循證醫學專家、護理專家、期刊編輯、國家政策制訂者的參與[33],納入的19篇指南,大部分僅提及臨床醫學領域專家,而方法學專家、流行病學和循證醫學專家等的參與度較低。高質量指南應當征求目標人群的觀點和選擇,本研究納入的指南中僅有1部指南提及征求目標人群的意見,但未詳細描述,除此外所以指南均未對目標人群意見進行收集;對于指南的適用者方面,大部分指南都有涉及,但較為含糊,未能明確指出。④ 獨立性領域,指南的獨立性是指須聲明指南制訂參與者及資金贊助者之間沒有利益沖突,本研究納入指南中超過一半均未提及。⑤ 清晰性領域:大部分指南均明確列出了所推薦的意見,但未突出重要建議的識別,且僅有部分在對于不同的衛生問題及選擇有所陳述,故該領域得分亦不理想。
以AGREE Ⅱ發布的年份2009年為節點進行前后比較,結果顯示2009年后指南在數量及質量上都有較大提升,提示AGREE Ⅱ的發表和傳播促進了指南質量進步[34]。對國內外指南進行對比,發現大部分領域兩者沒有顯著差異,但國內指南全部為C級,可見國內指南質量仍有提升空間,尤其在編輯獨立性方面需大幅改進。
本研究的局限性:① 由于研究者對AGREE Ⅱ工具存在主觀認識,可能引起偏差;② 本研究只限定于中英文指南,而對于其他文種指南并未納入,可能存在發表偏倚。
綜上所述,國內外支氣管肺泡灌洗相關指南的方法學質量有待進一步提高。建議指南制訂者掌握相關指南報告和評價工具,重視指南制訂過程中的細節問題和規范性,從而更好地提升指南的質量。