引用本文: 靳英輝, 趙志慧, 黃粲然, 黃笛, 王云云, 閻思宇, 黃橋, 李緒輝, 黃超, 王強, 曾憲濤. 臨床實踐指南實施性評價工具的研制和驗證評價. 中國循證醫學雜志, 2022, 22(1): 111-119. doi: 10.7507/1672-2531.202106002 復制
國家衛生健康委“關于加強衛生與健康科技成果轉移轉化工作的指導意見”指出科技成果轉化是衛生與健康科技創新的重要內容,是加強科技創新和衛生與健康事業發展緊密結合的關鍵環節[1]。《健康中國2030規劃綱要》中提出中國應積極參與全球衛生治理,在相關國際標準、規范、指南等的研究、談判與制訂中發揮影響,提升我國健康領域國際影響力和制度性話語權[2]。
臨床實踐指南是基于系統評價的證據和平衡了不同干預措施的利弊,在此基礎上形成的能夠為患者提供最佳保健服務的推薦意見[3]。20世紀80年代以來,逐漸開始在全球范圍內制訂臨床實踐指南(以下簡稱為“指南”)。隨著循證醫學的發展,指南在臨床醫學中的作用愈發明顯。本課題組系統檢索CNKI和WanFang Data,發現2010年至2020年發表的指南/專家共識共2 654部,且中國指南/專家共識發布的數量呈逐年上升趨勢。指南的轉化和應用是醫學科技成果轉化的關鍵環節,也是指南制訂的最終目的。
1992年,美國醫學會就對指南實施進行了定義,指南實施是指采用具體的干預或行為促進政策向有利的結果轉化[4]。但我們的檢索結果顯示,我國指南在結構和內容上仍存在諸多問題,影響了指南的推廣與利用,如推薦意見不夠清晰,不利于臨床醫生快速定位和查找,推薦意見簡單解決不了復雜的臨床實踐問題,沒有提供傳播和實施策略,不利于推廣和應用等[5,6]。目前對指南的評價常常聚焦方法學與報告質量,對指南的實施性評價關注不夠。
本研究旨在制訂臨床實踐指南實施性評價工具,并對其進行驗證評價,以期為合理評價指南實施性提供標準和方法,也為后續國家指南文庫的建立和規范管理提供技術支撐。
1 制訂過程
本研究組首先邀請了來自全國各地的多學科專家,成立指南實施性評價工具制訂小組。在廣泛文獻閱讀及評價的基礎上,提取與實施性評價有關的內容,并召開制訂小組會議,面對面逐條討論,經過篩選后形成初始條目清單。然后通過共識會議法對初稿廣泛征求專家意見和建議,修改后確定修訂稿。最后通過兩次德爾菲專家咨詢后確定指南實施性評價工具的最終條目,指南制訂流程見圖1。

1.1 成立指南評價標準制訂小組
評價工具制訂小組成員以武漢大學循證與轉化醫學中心的人員為主,并邀請來自全國各地的多學科專家。制訂小組成員包括政策制訂者、指南制訂方法學家、臨床醫師、護理學專家、臨床流行病學、循證醫學專家和期刊編輯。
1.2 構建指南實施性評價工具初始條目清單
按照工具或量表構建的流程制訂指南實施性評價工具[7]。通過系統檢索已有指南制訂手冊提取有關指南實施策略相關內容;系統檢索文獻獲得已有指南實施性評價工具、框架或理論以提取相關條目;通過混合性研究方法確定影響我國指南實施的因素。以上工作完成后均已撰寫相關文章并發表[5,6,8,9]。
1.3 形成指南實施性評價工具初稿
通過共識會議法廣泛征求專家意見和建議以確定指南實施性評價工具初始領域及條目。召開面對面專家研討會2次,專家涉及臨床醫生(含心內科、胸外科、眼科、普外科、五官科、急診科、重癥、呼吸內科和泌尿外科專業)、循證醫學專家、指南制訂方法學家,共計60人次參加會議。通過共識會議法對初始領域及條目內涵進行深入討論。在第二次共識會議按照以下內容進行判斷:① 條目重要性的判斷,需要對各條目的重要性進行判斷;② 條目文字表述及計分方式是否合理。重要性的判斷采用李克特5分評價法(5分代表非常重要),對于均數小于3.5且變異系數大于15%的條目予以刪除。對未符合以上標準的條目,如專家對條目爭議較大,則討論解決。
1.4 德爾菲專家咨詢工具和方法
兩輪德爾菲專家咨詢一共邀請了32名來自全國各地的多學科專家,其中分為第一輪11名,第二輪21名。專家涉及臨床醫學、循證醫學、藥學、護理學和醫院管理等領域。采用電子郵件的方式發送咨詢問卷。問卷邀請32名專家對指南實施性評價工具的領域內容、條目內容、總的實施性評價方法給出評價和修改意見。評價內容包括評價5個領域的重要性和7個條目的重要性、可讀性。重要性得分為1~5分(1分為不重要,5分為非常重要);可讀性得分為1~5分(1分為難理解,5分為容易理解)。如專家對條目的測評方式和總的實施性評價方法持部分不同意或不同意的意見,需給出理由和具體的修改建議。研究小組將返回的問卷進行整理并討論決定是否對工具內容進行修改。
1.5 統計分析
采用Excel對問卷數據進行錄入,采用SPSS 25.0軟件計算條目評分均數和標準差。表面效度從專家的重要性評價得出。內容效度的考察通過計算內容效度指數(content validity index,CVI)確定,CVI包括條目水平內容效度指數(item-level CVI,I-CVI)和工具水平內容效度指數(scale-level CVI,S-CVI)[10]。對于均數<3.5,變異系數>15%且I-CVI<0.78的條目[11],經小組討論形成共識后,決定是否刪除。
2 結果
2.1 指南實施性評價工具構建初步領域和條目討論稿
經過前期調研、訪談及文獻系統評價,指南實施性評價工具確定了5個一級領域:全局性、推薦意見的可實施性、便利性/傳播性、溝通性、應用性。其中一級領域“推薦意見的可實施性”中包括可執行性、可接受性、靈活性和可測量性4個二級領域,5個一級領域共計22個條目。
2.2 兩次專家共識會議
在第一次專家共識會議對初始條目進行分析、討論,并確定本指南實施性評價工具聚焦國家指南文庫收錄指南時的指南文本評價,即在納入指南已滿足了國家指南文庫的入庫標準及AGREE-China后進行實施性評價。第一次會議專家意見主要集中在:① 不需要單獨列出“全局性-是否通過了AGREE-China方法學評價”,予以刪除;② 可接受性:內容不具體,評價難度高,建議刪除;③ 可測量性:不屬于指南文本可實施性評價階段的內容,予以刪除;④ 建議條目評價可采用分級評分制度;⑤ 該工具的使用者可以臨床專家為主導、方法學家為輔助,兩者達成共識后進行綜合評價;⑥ 條目較多,應精簡。
第二次專家共識會議對已修改稿進行了條目重要性判斷及再次分析和討論,形成的指南實施性評價工具包括推薦意見的便利性/傳播性、溝通性、可執行性、應用性4個領域,共計15個條目。第二次會議專家討論意見集中在:① 實施性評價工具的使用者建議由專業醫生和方法學家共同評價;② 是否建立評價委員會?是否存在評價結果主觀性較強?評價結果是否需要第三方評價?③ 指南實施的影響因素眾多,實施性評價的推動作用是否有限?④ 是否需要對評價條目進行權重設定?⑤ 建議一級指標名稱:便利性/傳播性,改為“可及性”更能反應條目的內涵;⑥ 便利性/傳播性領域的條目5“指南宣貫方式”及“指南修訂路徑計劃”,應刪去;⑦ 計分方式,建議刪去5、4、3、2、1的計分方式,改為“是”、“部分是”、“否”,實施性評價結果也參照AMSTAR 2.0的評價方法;⑧ 建議每一條目給出解釋或示例,以上內容詳見表1。

2.3 兩輪德爾菲咨詢結果分析
將經過兩次專家共識會議達成一致的評價工具條目進行兩輪德爾菲咨詢。指南實施性評價工具第一輪德爾菲結果顯示S-CVI值為0.91(>0.90)。除外溝通性不滿足I-CVI>0.78外,其他條目水平內容效度指數在0.82至1之間。整個工具的平均內容效度系數S-CVI為0.91。各條目平均值均高于4分,變異系數除溝通性外均滿足<20%。按照均數<3.5,變異系數>15%且I-CVI<0.78的標準暫不進行條目的刪減(表2)。均值最高的條目是可執行性(核心條目之一)。指南實施性評價工具第二輪德爾菲結果顯示S-CVI值為0.93(>0.90)。所有條目的水平內容效度指數均>0.78。各條目平均值均高于4分,變異系數除溝通性外均滿足<20%。按照均數<3.5,變異系數>15%且I-CVI<0.78的標準暫不進行條目的刪減(表3)。均值最高的條目也是可執行性(核心條目之一)。兩輪德爾菲咨詢結果顯示指南實施性評價工具的表面效度和內容效度均較好。


表4呈現了兩次德爾菲專家意見匯總的結果與實施性評價制訂小組的討論與對應回復或修改說明。表5為經兩輪德爾菲咨詢修改后的最終版評價工具。


2.4 指南實施性評價工具結構
2.4.1 指南實施性評價工具內容
最終形成的實施性評價工具包括5個評價領域(可及性、溝通性、可執行性、易識別性和應用性)共7個評價條目。其含義分別為:① 可及性:主要評估的是指南是否容易獲取。② 溝通性:是評估指南制訂者是否提供可利用的互動方式或平臺,了解指南使用者對指南方法學、推薦意見內容等的反饋。③ 可執行性:主要側重考慮是否清晰陳述了推薦的行為、推薦行為的具體實施方法、推薦行為的應用條件。④ 易識別性:主要考察指南使用者是不是可迅速定位推薦意見。⑤ 應用性:主要側重評估指南制訂者是否分析了推薦意見實施過程中可能存在的障礙因素以及是否設計提供了促進指南實施的輔助工具。每個條目的評價結果為“是”、“部分是”、“否”。完全滿足評價標準時,評價結果為“是”;部分滿足評價標準時,評價結果為“部分是”;當指南中沒有報告相關信息時,評價結果為“否”。
2.4.2 指南實施性評價工具使用方法
① 評價人員:該工具的使用者應包括至少一名臨床相關專業醫生(具備5年以上相關專業工作經驗,具備高級職稱)及一名指南制訂方法學家(作為方法學家參與指南制訂或長期從事指南方法學研究的人員,具備高級職稱)。兩者的評價意見應經討論后達成共識。② 評價時點:實踐指南通過了基本入庫標準及方法學質量評價(AGREE-China)后。③ 評價目的:從指南文本角度規范指南內容及形式的呈現,促進指南的實施,特別是規范指南推薦意見撰寫和設計實施策略。④ 評價結果:指南臨床實施性評價工具的整體質量評價結果為高、中、低、極低。“極低”表示指南的可實施性非常差;“低”表示指南的可實施性較差;“中”表示指南的可實施性一般;“高”代表指南具有非常強的可實施性。指南臨床實施性的整體質量主要是對上述5個領域的綜合評估,其中指南的“可執行性”和“易識別性”為其綜合評估過程中的關鍵領域。這一部分需要基于評估者共識完成。詳細操作過程見圖2。

3 討論
目前臨床實踐指南制訂過程中存在“重制作,輕推廣和實施”的現象,使臨床指南中的推薦意見無法轉化為臨床實踐的應用。指南實施是一個復雜的結構化過程,涵蓋醫患、醫療環境、組織機構、教育、技術、經濟、社會等多個方面。指南實施性評價工具的條目篩選過程盡量考慮了全面的實施相關信息,但本指南實施性評價工具的目的主要是服務國家指南文庫,故研究者在制訂過程中刪減了大量內容,力求條目精簡及可操作,最終確定了5個領域7個條目。
其中,“可及性”主要評估的是指南是否容易獲取。可從指南制訂者是否提供該指南多種獲取途徑及多種版本兩個方面考慮。指南的獲取途徑包括一般數據庫(如知網、萬方、維普等)、專業學會網站(如歐洲泌尿學會、美國心臟學會)、機構組織網站(WHO、NICE)、公眾號推送等。指南制訂者為方便使用者閱讀可提供多種版本,如完整版本、簡化版本(口袋版,推薦意見總結版)、手機APP版本、患者版本、PPT版本、視頻版本等。指南制訂者是否清晰地提供了上述信息的獲取方式,比如使用清晰的標識注明指南的獲取途徑、指南多種版本鏈接。在對該領域評價時,建議與指南制訂者進行聯系,以確定指南是否存在其他獲取途徑或版本。另外,指南的獲取途徑及推廣版本應由指南制訂組織統一管理及發布。而指南使用者的自由推送,如指南被分享至微信朋友圈,則不屬于“可及性”范疇。
“溝通性”是評估指南制訂者是否提供可利用的互動方式或平臺,以助于與指南使用者保持有效溝通,了解指南使用者對指南方法學、推薦意見內容等的反饋,如設置專人負責管理指南使用者的反饋信息,提供其電話號碼、郵箱地址等聯系方式在指南中,也可提供網址鏈接或第三方平臺等對指南內容、使用情況等反饋信息進行收集。這些促進指南制訂者和使用者溝通的方式,應清晰醒目地標記在指南正文或網頁中。
“可執行性”主要側重考慮是否清晰陳述了推薦的行為、推薦行為的具體實施方法、推薦行為的應用條件。
“易識別性”主要考慮指南使用者是不是可以迅速定位推薦意見。本條目評價需在指南已經明確標識推薦意見等級或證據等級基礎上進行,指南制訂者可尋找其他推薦意見突出表達的方式如標注“推薦意見”4個字,將推薦意見內容放置指南正文開始部位,推薦意見字體加粗或斜體等。
“應用性”主要側重評估指南制訂者是否分析了推薦意見實施過程中可能存在的障礙因素以及是否設計提供了促進指南實施的輔助工具。推薦意見實施過程障礙因素可能包括增加的資源消耗,如需要購置相應設備、增加的人力付出,如需要增加監護人員、推薦的診療方案或措施尚未進入醫保支付范圍、與患者一般意愿相違背等。促進指南實施的輔助工具可能包括共同決策工具、患者教育資料、基線評估表及/或患者記錄單、醫護培訓資料等。
已有研究表明,知識和實踐之間存在著巨大鴻溝,循證醫學證據如臨床實踐指南和系統評價的結果并沒有在臨床實踐中及時和合理地使用。證據轉化與實施科學是近些年來廣受關注的研究方向,我們相信從指南制訂角度與撰寫角度就開始關注指南的實施—即從源頭開始管理和引導,是促進指南實施的必要及有效步驟。本研究的前期調研顯示,指南缺乏可信度、指南陳舊過時或推薦意見沒有依據中國的研究也是重要的影響指南實施的因素,但我們考慮這些因素是指南方法學的評價內容,實施性評價是在指南通過了入庫標準及方法學評價后的第三步評價,所以與方法學有關的條目都不包含在此工具中。我們的工具各領域及條目和評價的最終結果,均參照AMSTAR 2.0的評價方法[12]。此工具的初步研制參考了國際現有標準和方法,以準確、公開、透明的方式討論和初步建立了由臨床相關專業醫生和指南制訂方法學專家擔任評價者的指南實施性評價工具。
文本形式導致臨床指南的內容不能被實時、準確地查詢和瀏覽,嚴重阻礙了指南在臨床決策和實踐中的可操作性,使其難以發揮真正的價值[13-14]。臨床指南的研究與利用明顯落后于信息時代的發展[15]。國內對于計算機化臨床指南的研究起步較晚,研究大多集中在指南知識的可視化表達以及指南與電子健康檔案的集成等方面,對智能化指南的知識自動獲取方式、指南計算機化的驗證、執行與維護等的研究較少[16-18]。我們在“應用性”中增加“與醫院電子病例系統吻合的數字化、電子化或智能化指南方案”借以促進指南智能化的發展,但是目前這一點仍然很難有指南達到。
本工具制訂和使用剛完成初期工作,仍有很多不足之處,下一步我們將對本工具的適用性開展實證研究。
利益沖突:無。
制定工作組成員
項目指導組成員:王強,國家衛健委醫療管理服務指導中心醫療標準管理處(政策制訂者);郭毅、曾憲濤、靳英輝,武漢大學中南醫院循證與轉化醫學中心(指南制訂方法學家)。
項目組工作人員:指南制訂與評價方法學人員:方程、黃橋、曹越、黃笛、王云云、王宇、張琪、鄧通、汪洋、梁丹、黃瑞秀,武漢大學中南醫院循證與轉化醫學中心;申泉、趙志慧、黃粲然,武漢大學健康學院;王丹琦,武漢大學基礎醫學院;張菁,武漢大學第一臨床學院。臨床醫師:黃興,武漢大學中南醫院。
共識會議專家組成員:拜爭剛,南京理工大學公共事務學院;陳昊,南京中醫藥大學第二臨床學院;曹士義,華中科技大學同濟醫學院;杜亮,四川大學華西醫院期刊社;施月仙,北京大學護理學院;陳曉凡,江西中醫藥大學;耿勁松,南通大學醫學院;郭毅,武漢大學中南醫院循證與轉化醫學中心;譚曉東,武漢大學健康學院;黎浩,武漢大學全球健康研究中心;任學群,河南大學淮河醫院;呂軍,西安交通大學臨床研究中心;張超,湖北醫藥學院附屬太和醫院;翁鴻,武漢大學泌尿外科;梁遠波,溫州醫科大學附屬眼視光醫院;戎萍,天津中醫藥大學第一附屬醫院;田國祥,北京陸軍總醫院;熊俊,江西中醫藥大學附屬醫院;謝文忠,開封市口腔醫院;楊芬,中山大學附屬第八醫院;張永剛,四川大學華西醫院期刊社;趙嘉國,天津醫院;趙國幀,首都醫科大學附屬北京中醫醫院;鄭亮,同濟大學附屬東方醫院;顧鶯,復旦大學附屬兒科醫院;劉義蘭,華中科技大學同濟醫學院附屬協和醫院;曾鐵英,華中科技大學同濟醫學院附屬同濟醫院;朱小平,武漢大學中南醫院。
兩輪德爾菲咨詢參與人員:杜亮,四川大學華西醫院期刊社;張伶俐,四川大學華西第二醫院;周支瑞,復旦大學附屬腫瘤醫院;胡雁,復旦大學護理學院;周英鳳,復旦大學護理學院;李博,北京中醫醫院;張博恒,復旦大學附屬中山醫院;陳昊,南京中醫藥大學第二臨床學院;鄭亮,同濟大學附屬東方醫院;王古巖,首都醫科大學附屬北京同仁醫院;施月仙,北京大學護理學院;喻佳潔,四川大學華西醫院;李娟娟,武漢大學人民醫院;劉雅麗,首都醫科大學附屬北京兒童醫院;趙嘉國,天津醫院;楊珍,南昌大學第一附屬醫院;宋禮坡,首都醫科大學宣武醫院;孟玲慧,首都兒科研究所;莊淑波,清華大學第一附屬醫院;王家瑩,南京醫科大學附屬無錫人民醫院;高維杰,天津中醫藥大學護理學院;鄧宏勇,上海中醫藥大學;邢維杰,復旦大學護理學院;邢丹,北京大學人民醫院;李迅,北京中醫藥大學;譚力銘,湖南省懷化市第二人民醫院;侯寧,山東省立醫院藥學部;張天嵩,上海市靜安區中心醫院;褚紅玲,北京大學第三醫院;詹紅生,上海曙光醫院;韓斐,北京宣武區中醫院;左力,北京大學人民醫院。
國家衛生健康委“關于加強衛生與健康科技成果轉移轉化工作的指導意見”指出科技成果轉化是衛生與健康科技創新的重要內容,是加強科技創新和衛生與健康事業發展緊密結合的關鍵環節[1]。《健康中國2030規劃綱要》中提出中國應積極參與全球衛生治理,在相關國際標準、規范、指南等的研究、談判與制訂中發揮影響,提升我國健康領域國際影響力和制度性話語權[2]。
臨床實踐指南是基于系統評價的證據和平衡了不同干預措施的利弊,在此基礎上形成的能夠為患者提供最佳保健服務的推薦意見[3]。20世紀80年代以來,逐漸開始在全球范圍內制訂臨床實踐指南(以下簡稱為“指南”)。隨著循證醫學的發展,指南在臨床醫學中的作用愈發明顯。本課題組系統檢索CNKI和WanFang Data,發現2010年至2020年發表的指南/專家共識共2 654部,且中國指南/專家共識發布的數量呈逐年上升趨勢。指南的轉化和應用是醫學科技成果轉化的關鍵環節,也是指南制訂的最終目的。
1992年,美國醫學會就對指南實施進行了定義,指南實施是指采用具體的干預或行為促進政策向有利的結果轉化[4]。但我們的檢索結果顯示,我國指南在結構和內容上仍存在諸多問題,影響了指南的推廣與利用,如推薦意見不夠清晰,不利于臨床醫生快速定位和查找,推薦意見簡單解決不了復雜的臨床實踐問題,沒有提供傳播和實施策略,不利于推廣和應用等[5,6]。目前對指南的評價常常聚焦方法學與報告質量,對指南的實施性評價關注不夠。
本研究旨在制訂臨床實踐指南實施性評價工具,并對其進行驗證評價,以期為合理評價指南實施性提供標準和方法,也為后續國家指南文庫的建立和規范管理提供技術支撐。
1 制訂過程
本研究組首先邀請了來自全國各地的多學科專家,成立指南實施性評價工具制訂小組。在廣泛文獻閱讀及評價的基礎上,提取與實施性評價有關的內容,并召開制訂小組會議,面對面逐條討論,經過篩選后形成初始條目清單。然后通過共識會議法對初稿廣泛征求專家意見和建議,修改后確定修訂稿。最后通過兩次德爾菲專家咨詢后確定指南實施性評價工具的最終條目,指南制訂流程見圖1。

1.1 成立指南評價標準制訂小組
評價工具制訂小組成員以武漢大學循證與轉化醫學中心的人員為主,并邀請來自全國各地的多學科專家。制訂小組成員包括政策制訂者、指南制訂方法學家、臨床醫師、護理學專家、臨床流行病學、循證醫學專家和期刊編輯。
1.2 構建指南實施性評價工具初始條目清單
按照工具或量表構建的流程制訂指南實施性評價工具[7]。通過系統檢索已有指南制訂手冊提取有關指南實施策略相關內容;系統檢索文獻獲得已有指南實施性評價工具、框架或理論以提取相關條目;通過混合性研究方法確定影響我國指南實施的因素。以上工作完成后均已撰寫相關文章并發表[5,6,8,9]。
1.3 形成指南實施性評價工具初稿
通過共識會議法廣泛征求專家意見和建議以確定指南實施性評價工具初始領域及條目。召開面對面專家研討會2次,專家涉及臨床醫生(含心內科、胸外科、眼科、普外科、五官科、急診科、重癥、呼吸內科和泌尿外科專業)、循證醫學專家、指南制訂方法學家,共計60人次參加會議。通過共識會議法對初始領域及條目內涵進行深入討論。在第二次共識會議按照以下內容進行判斷:① 條目重要性的判斷,需要對各條目的重要性進行判斷;② 條目文字表述及計分方式是否合理。重要性的判斷采用李克特5分評價法(5分代表非常重要),對于均數小于3.5且變異系數大于15%的條目予以刪除。對未符合以上標準的條目,如專家對條目爭議較大,則討論解決。
1.4 德爾菲專家咨詢工具和方法
兩輪德爾菲專家咨詢一共邀請了32名來自全國各地的多學科專家,其中分為第一輪11名,第二輪21名。專家涉及臨床醫學、循證醫學、藥學、護理學和醫院管理等領域。采用電子郵件的方式發送咨詢問卷。問卷邀請32名專家對指南實施性評價工具的領域內容、條目內容、總的實施性評價方法給出評價和修改意見。評價內容包括評價5個領域的重要性和7個條目的重要性、可讀性。重要性得分為1~5分(1分為不重要,5分為非常重要);可讀性得分為1~5分(1分為難理解,5分為容易理解)。如專家對條目的測評方式和總的實施性評價方法持部分不同意或不同意的意見,需給出理由和具體的修改建議。研究小組將返回的問卷進行整理并討論決定是否對工具內容進行修改。
1.5 統計分析
采用Excel對問卷數據進行錄入,采用SPSS 25.0軟件計算條目評分均數和標準差。表面效度從專家的重要性評價得出。內容效度的考察通過計算內容效度指數(content validity index,CVI)確定,CVI包括條目水平內容效度指數(item-level CVI,I-CVI)和工具水平內容效度指數(scale-level CVI,S-CVI)[10]。對于均數<3.5,變異系數>15%且I-CVI<0.78的條目[11],經小組討論形成共識后,決定是否刪除。
2 結果
2.1 指南實施性評價工具構建初步領域和條目討論稿
經過前期調研、訪談及文獻系統評價,指南實施性評價工具確定了5個一級領域:全局性、推薦意見的可實施性、便利性/傳播性、溝通性、應用性。其中一級領域“推薦意見的可實施性”中包括可執行性、可接受性、靈活性和可測量性4個二級領域,5個一級領域共計22個條目。
2.2 兩次專家共識會議
在第一次專家共識會議對初始條目進行分析、討論,并確定本指南實施性評價工具聚焦國家指南文庫收錄指南時的指南文本評價,即在納入指南已滿足了國家指南文庫的入庫標準及AGREE-China后進行實施性評價。第一次會議專家意見主要集中在:① 不需要單獨列出“全局性-是否通過了AGREE-China方法學評價”,予以刪除;② 可接受性:內容不具體,評價難度高,建議刪除;③ 可測量性:不屬于指南文本可實施性評價階段的內容,予以刪除;④ 建議條目評價可采用分級評分制度;⑤ 該工具的使用者可以臨床專家為主導、方法學家為輔助,兩者達成共識后進行綜合評價;⑥ 條目較多,應精簡。
第二次專家共識會議對已修改稿進行了條目重要性判斷及再次分析和討論,形成的指南實施性評價工具包括推薦意見的便利性/傳播性、溝通性、可執行性、應用性4個領域,共計15個條目。第二次會議專家討論意見集中在:① 實施性評價工具的使用者建議由專業醫生和方法學家共同評價;② 是否建立評價委員會?是否存在評價結果主觀性較強?評價結果是否需要第三方評價?③ 指南實施的影響因素眾多,實施性評價的推動作用是否有限?④ 是否需要對評價條目進行權重設定?⑤ 建議一級指標名稱:便利性/傳播性,改為“可及性”更能反應條目的內涵;⑥ 便利性/傳播性領域的條目5“指南宣貫方式”及“指南修訂路徑計劃”,應刪去;⑦ 計分方式,建議刪去5、4、3、2、1的計分方式,改為“是”、“部分是”、“否”,實施性評價結果也參照AMSTAR 2.0的評價方法;⑧ 建議每一條目給出解釋或示例,以上內容詳見表1。

2.3 兩輪德爾菲咨詢結果分析
將經過兩次專家共識會議達成一致的評價工具條目進行兩輪德爾菲咨詢。指南實施性評價工具第一輪德爾菲結果顯示S-CVI值為0.91(>0.90)。除外溝通性不滿足I-CVI>0.78外,其他條目水平內容效度指數在0.82至1之間。整個工具的平均內容效度系數S-CVI為0.91。各條目平均值均高于4分,變異系數除溝通性外均滿足<20%。按照均數<3.5,變異系數>15%且I-CVI<0.78的標準暫不進行條目的刪減(表2)。均值最高的條目是可執行性(核心條目之一)。指南實施性評價工具第二輪德爾菲結果顯示S-CVI值為0.93(>0.90)。所有條目的水平內容效度指數均>0.78。各條目平均值均高于4分,變異系數除溝通性外均滿足<20%。按照均數<3.5,變異系數>15%且I-CVI<0.78的標準暫不進行條目的刪減(表3)。均值最高的條目也是可執行性(核心條目之一)。兩輪德爾菲咨詢結果顯示指南實施性評價工具的表面效度和內容效度均較好。


表4呈現了兩次德爾菲專家意見匯總的結果與實施性評價制訂小組的討論與對應回復或修改說明。表5為經兩輪德爾菲咨詢修改后的最終版評價工具。


2.4 指南實施性評價工具結構
2.4.1 指南實施性評價工具內容
最終形成的實施性評價工具包括5個評價領域(可及性、溝通性、可執行性、易識別性和應用性)共7個評價條目。其含義分別為:① 可及性:主要評估的是指南是否容易獲取。② 溝通性:是評估指南制訂者是否提供可利用的互動方式或平臺,了解指南使用者對指南方法學、推薦意見內容等的反饋。③ 可執行性:主要側重考慮是否清晰陳述了推薦的行為、推薦行為的具體實施方法、推薦行為的應用條件。④ 易識別性:主要考察指南使用者是不是可迅速定位推薦意見。⑤ 應用性:主要側重評估指南制訂者是否分析了推薦意見實施過程中可能存在的障礙因素以及是否設計提供了促進指南實施的輔助工具。每個條目的評價結果為“是”、“部分是”、“否”。完全滿足評價標準時,評價結果為“是”;部分滿足評價標準時,評價結果為“部分是”;當指南中沒有報告相關信息時,評價結果為“否”。
2.4.2 指南實施性評價工具使用方法
① 評價人員:該工具的使用者應包括至少一名臨床相關專業醫生(具備5年以上相關專業工作經驗,具備高級職稱)及一名指南制訂方法學家(作為方法學家參與指南制訂或長期從事指南方法學研究的人員,具備高級職稱)。兩者的評價意見應經討論后達成共識。② 評價時點:實踐指南通過了基本入庫標準及方法學質量評價(AGREE-China)后。③ 評價目的:從指南文本角度規范指南內容及形式的呈現,促進指南的實施,特別是規范指南推薦意見撰寫和設計實施策略。④ 評價結果:指南臨床實施性評價工具的整體質量評價結果為高、中、低、極低。“極低”表示指南的可實施性非常差;“低”表示指南的可實施性較差;“中”表示指南的可實施性一般;“高”代表指南具有非常強的可實施性。指南臨床實施性的整體質量主要是對上述5個領域的綜合評估,其中指南的“可執行性”和“易識別性”為其綜合評估過程中的關鍵領域。這一部分需要基于評估者共識完成。詳細操作過程見圖2。

3 討論
目前臨床實踐指南制訂過程中存在“重制作,輕推廣和實施”的現象,使臨床指南中的推薦意見無法轉化為臨床實踐的應用。指南實施是一個復雜的結構化過程,涵蓋醫患、醫療環境、組織機構、教育、技術、經濟、社會等多個方面。指南實施性評價工具的條目篩選過程盡量考慮了全面的實施相關信息,但本指南實施性評價工具的目的主要是服務國家指南文庫,故研究者在制訂過程中刪減了大量內容,力求條目精簡及可操作,最終確定了5個領域7個條目。
其中,“可及性”主要評估的是指南是否容易獲取。可從指南制訂者是否提供該指南多種獲取途徑及多種版本兩個方面考慮。指南的獲取途徑包括一般數據庫(如知網、萬方、維普等)、專業學會網站(如歐洲泌尿學會、美國心臟學會)、機構組織網站(WHO、NICE)、公眾號推送等。指南制訂者為方便使用者閱讀可提供多種版本,如完整版本、簡化版本(口袋版,推薦意見總結版)、手機APP版本、患者版本、PPT版本、視頻版本等。指南制訂者是否清晰地提供了上述信息的獲取方式,比如使用清晰的標識注明指南的獲取途徑、指南多種版本鏈接。在對該領域評價時,建議與指南制訂者進行聯系,以確定指南是否存在其他獲取途徑或版本。另外,指南的獲取途徑及推廣版本應由指南制訂組織統一管理及發布。而指南使用者的自由推送,如指南被分享至微信朋友圈,則不屬于“可及性”范疇。
“溝通性”是評估指南制訂者是否提供可利用的互動方式或平臺,以助于與指南使用者保持有效溝通,了解指南使用者對指南方法學、推薦意見內容等的反饋,如設置專人負責管理指南使用者的反饋信息,提供其電話號碼、郵箱地址等聯系方式在指南中,也可提供網址鏈接或第三方平臺等對指南內容、使用情況等反饋信息進行收集。這些促進指南制訂者和使用者溝通的方式,應清晰醒目地標記在指南正文或網頁中。
“可執行性”主要側重考慮是否清晰陳述了推薦的行為、推薦行為的具體實施方法、推薦行為的應用條件。
“易識別性”主要考慮指南使用者是不是可以迅速定位推薦意見。本條目評價需在指南已經明確標識推薦意見等級或證據等級基礎上進行,指南制訂者可尋找其他推薦意見突出表達的方式如標注“推薦意見”4個字,將推薦意見內容放置指南正文開始部位,推薦意見字體加粗或斜體等。
“應用性”主要側重評估指南制訂者是否分析了推薦意見實施過程中可能存在的障礙因素以及是否設計提供了促進指南實施的輔助工具。推薦意見實施過程障礙因素可能包括增加的資源消耗,如需要購置相應設備、增加的人力付出,如需要增加監護人員、推薦的診療方案或措施尚未進入醫保支付范圍、與患者一般意愿相違背等。促進指南實施的輔助工具可能包括共同決策工具、患者教育資料、基線評估表及/或患者記錄單、醫護培訓資料等。
已有研究表明,知識和實踐之間存在著巨大鴻溝,循證醫學證據如臨床實踐指南和系統評價的結果并沒有在臨床實踐中及時和合理地使用。證據轉化與實施科學是近些年來廣受關注的研究方向,我們相信從指南制訂角度與撰寫角度就開始關注指南的實施—即從源頭開始管理和引導,是促進指南實施的必要及有效步驟。本研究的前期調研顯示,指南缺乏可信度、指南陳舊過時或推薦意見沒有依據中國的研究也是重要的影響指南實施的因素,但我們考慮這些因素是指南方法學的評價內容,實施性評價是在指南通過了入庫標準及方法學評價后的第三步評價,所以與方法學有關的條目都不包含在此工具中。我們的工具各領域及條目和評價的最終結果,均參照AMSTAR 2.0的評價方法[12]。此工具的初步研制參考了國際現有標準和方法,以準確、公開、透明的方式討論和初步建立了由臨床相關專業醫生和指南制訂方法學專家擔任評價者的指南實施性評價工具。
文本形式導致臨床指南的內容不能被實時、準確地查詢和瀏覽,嚴重阻礙了指南在臨床決策和實踐中的可操作性,使其難以發揮真正的價值[13-14]。臨床指南的研究與利用明顯落后于信息時代的發展[15]。國內對于計算機化臨床指南的研究起步較晚,研究大多集中在指南知識的可視化表達以及指南與電子健康檔案的集成等方面,對智能化指南的知識自動獲取方式、指南計算機化的驗證、執行與維護等的研究較少[16-18]。我們在“應用性”中增加“與醫院電子病例系統吻合的數字化、電子化或智能化指南方案”借以促進指南智能化的發展,但是目前這一點仍然很難有指南達到。
本工具制訂和使用剛完成初期工作,仍有很多不足之處,下一步我們將對本工具的適用性開展實證研究。
利益沖突:無。
制定工作組成員
項目指導組成員:王強,國家衛健委醫療管理服務指導中心醫療標準管理處(政策制訂者);郭毅、曾憲濤、靳英輝,武漢大學中南醫院循證與轉化醫學中心(指南制訂方法學家)。
項目組工作人員:指南制訂與評價方法學人員:方程、黃橋、曹越、黃笛、王云云、王宇、張琪、鄧通、汪洋、梁丹、黃瑞秀,武漢大學中南醫院循證與轉化醫學中心;申泉、趙志慧、黃粲然,武漢大學健康學院;王丹琦,武漢大學基礎醫學院;張菁,武漢大學第一臨床學院。臨床醫師:黃興,武漢大學中南醫院。
共識會議專家組成員:拜爭剛,南京理工大學公共事務學院;陳昊,南京中醫藥大學第二臨床學院;曹士義,華中科技大學同濟醫學院;杜亮,四川大學華西醫院期刊社;施月仙,北京大學護理學院;陳曉凡,江西中醫藥大學;耿勁松,南通大學醫學院;郭毅,武漢大學中南醫院循證與轉化醫學中心;譚曉東,武漢大學健康學院;黎浩,武漢大學全球健康研究中心;任學群,河南大學淮河醫院;呂軍,西安交通大學臨床研究中心;張超,湖北醫藥學院附屬太和醫院;翁鴻,武漢大學泌尿外科;梁遠波,溫州醫科大學附屬眼視光醫院;戎萍,天津中醫藥大學第一附屬醫院;田國祥,北京陸軍總醫院;熊俊,江西中醫藥大學附屬醫院;謝文忠,開封市口腔醫院;楊芬,中山大學附屬第八醫院;張永剛,四川大學華西醫院期刊社;趙嘉國,天津醫院;趙國幀,首都醫科大學附屬北京中醫醫院;鄭亮,同濟大學附屬東方醫院;顧鶯,復旦大學附屬兒科醫院;劉義蘭,華中科技大學同濟醫學院附屬協和醫院;曾鐵英,華中科技大學同濟醫學院附屬同濟醫院;朱小平,武漢大學中南醫院。
兩輪德爾菲咨詢參與人員:杜亮,四川大學華西醫院期刊社;張伶俐,四川大學華西第二醫院;周支瑞,復旦大學附屬腫瘤醫院;胡雁,復旦大學護理學院;周英鳳,復旦大學護理學院;李博,北京中醫醫院;張博恒,復旦大學附屬中山醫院;陳昊,南京中醫藥大學第二臨床學院;鄭亮,同濟大學附屬東方醫院;王古巖,首都醫科大學附屬北京同仁醫院;施月仙,北京大學護理學院;喻佳潔,四川大學華西醫院;李娟娟,武漢大學人民醫院;劉雅麗,首都醫科大學附屬北京兒童醫院;趙嘉國,天津醫院;楊珍,南昌大學第一附屬醫院;宋禮坡,首都醫科大學宣武醫院;孟玲慧,首都兒科研究所;莊淑波,清華大學第一附屬醫院;王家瑩,南京醫科大學附屬無錫人民醫院;高維杰,天津中醫藥大學護理學院;鄧宏勇,上海中醫藥大學;邢維杰,復旦大學護理學院;邢丹,北京大學人民醫院;李迅,北京中醫藥大學;譚力銘,湖南省懷化市第二人民醫院;侯寧,山東省立醫院藥學部;張天嵩,上海市靜安區中心醫院;褚紅玲,北京大學第三醫院;詹紅生,上海曙光醫院;韓斐,北京宣武區中醫院;左力,北京大學人民醫院。