循證臨床實踐指南的證據到推薦意見的轉化往往是復雜且繁瑣的。本文主要闡述兩部分內容:首先介紹證據及推薦意見分級的演進過程;其次,根據目前已有的、具有代表性的指南手冊,分析推薦意見制定時存在的問題,總結證據到推薦意見的形成途徑,并陳述形成最終推薦意見的方法。目前,雖尚無完善的、嚴謹的方法學指導證據到推薦意見的轉化,但部分組織針對推薦意見的制定提供了不同的內容框架或輔助工具,國內循證臨床實踐指南制定者可借鑒其經驗,結合本國國情,構建本土化的形成推薦意見的方法。
引用本文: 王云云, 靳英輝, 陳耀龍, 曾憲濤, 陳昊, 王利, 陸翠, 曹虹. 循證臨床實踐指南推薦意見形成的方法分析. 中國循證醫學雜志, 2017, 17(9): 1085-1092. doi: 10.7507/1672-2531.201612007 復制
2011 年,美國醫學科學院(institute of medicine,IOM)指出臨床實踐指南是針對患者特定的臨床問題,基于系統評價形成的證據,對各種備選干預方式進行全面的利弊平衡分析,并提出最優指導意見[1]。該組織強調了基于證據制定臨床實踐指南的重要性。一些國際組織專門開發了指南手冊,用以指導循證臨床實踐指南(evidence-based clinical practice guideline,E-CPG)的制定。我國也于 2016 年 1 月發布了國內首部“指南的指南”[2]。指南手冊的發布對規范和嚴謹地制定 E-CPG 起到極大的促進作用,但研究顯示現有的循證指南仍然存在一定的方法學缺陷,尤其在證據到推薦意見的轉化過程缺乏透明性及清晰性[3-5]。然而證據是 E-CPG 的基礎,推薦意見是 E-CPG 的核心內容,它們的概念、內涵的逐步發展及證據到推薦意見的轉化過程對 E-CPG 推薦意見的制定有重要意義。本文旨在總結 E-CPG 推薦意見制定的方法,以期為我國 E-CPG 制定者提供可參考的建議。
1 證據及推薦意見分級的歷史進展
自 20 世紀 60 年代,美國兩位社會學家 Campbell 和 Stanley 首次引入證據分級概念后[6-8],隨著循證醫學和臨床流行病學的逐步發展,證據的分級標準、證據與推薦意見的關系等概念和內涵也在持續不斷地完善(表 1)。主要表現在以下幾個方面:證據分級標準從單一因素考慮(試驗設計)到多因素(研究質量、間接性和結果一致性等)綜合評定;最高級別證據的定義標準從單個 RCT 到多個 RCT 的 Meta 分析;證據的來源愈發廣泛,逐步納入系統評價、動物研究和中醫文獻等;證據的分類從單一走向多樣化(治療、預防和經濟學分析等);證據與推薦意見的關系從最初的相互獨立、絕對對應(高質量證據的推薦強度也高),發展成相互影響又相互制約的關系(高質量證據的推薦強度不一定高)。

2 從證據到推薦意見的形成
2.1 制定推薦意見時考慮的標準
以往證據質量等級與推薦強度等級一一對應,如高質量證據常常意味著強推薦,即研究者在制定推薦級別時只考慮證據質量這一唯一因素。隨后,越來越多的學者認識到此方法存在弊端,推薦意見的制定不再單一地依賴證據質量,各指南工作組仍需考慮患者的價值觀和偏好、成本、利弊平衡、臨床意義等因素(表 2)。目前多個學術組織制定了指南手冊,其中對推薦意見在制定時需考慮因素的規定不完全相同。

2.1.1 “證據質量”、“證據體質量”的內涵有所不同 E-CPG 強調推薦意見的制定應著重考慮其收集的證據質量。證據質量是指對預測值的真實性有多大把握[31]。GRADE 工作組對不同級別的證據質量提出明確定義,如高質量證據,GRADE 工作組最初認為其是指進一步研究也不可能改變該療效評估結果可信度的證據;隨后,又將其定義為研究者非常確信真實的效應值接近效應估計的證據。而低質量證據,GRADE 工作組原先將其定義為進一步研究極有可能影響該療效評估結果的可信度,且該評估結果很可能改變;隨后,又將其解釋為對效應估計值的確信程度有限:真實值可能與估計值不相同[32-34]。“證據質量”等級概念描述的具體化,方便研究者對證據質量的正確理解,并對證據進行質量評價和分級。
然而在不同組織或機構制定的指南手冊或指南標準中,“證據質量”的內涵有所不同。一方面,如 ESHRE[18]、ASCO[26]、紐約州立大學等[19]認為證據質量既可以是單個或多個研究的質量,又可以是系統評價的質量。另一方面,有些組織雖以“證據體”為單位對證據進行質量分級,但對證據體質量的含義闡述不完全相同。GRADE 工作組將證據體(body of evidence)定義為系統評價的效應指標,且其質量是綜合考慮系統評價納入研究的偏倚風險、發表偏倚、不一致性及間接性等因素而評定的[35]。AAN[16]、KHA-CARI[25]、MINDS 項目組[21]等均應用 GRADE 系統對“證據體”進行質量評價。NHMRC[14]在其指南手冊中也應用了“證據體”一詞,但它認為“證據體”由證據基礎(evidence base)、一致性(consistency)、臨床意義(clinical impact)、普遍性(generalizability)、應用性(applicability)5 個要素構成,其中證據基礎包括證據數量(quantity of evidence)、證據水平(level of evidence)以及證據質量(quality of evidence)。這與 GRADE 證據分級有一定的相似性,也有一些區別,其除了考慮研究結果間的一致性和納入研究的質量等因素,也考慮了推薦意見在應用時需要評估的因素,如臨床意義、普遍性、應用性(表 2)。
2.1.2 制定推薦意見時考慮的因素不完全相同 如表 2 所示,不同組織或機構在推薦意見制定時考慮的因素有相同也有不同。患者的價值觀和意愿[15, 16, 19-22, 24, 25]、推薦意見實施時需要的成本或資源及實施后所帶來的利弊[13, 15-22, 24, 25]、推薦意見應用時需要的臨床條件與實踐中具體臨床環境的差距[14, 22-24, 27]是指南制定者常常考慮的因素。推薦意見制定時考慮的因素不同之處如:ASCO 是美國臨床腫瘤協會組織,致力于通過研究、教育及推廣最優質的病人治療護理方案以應對腫瘤,在其指南制定手冊中提及推薦意見制定時需關注腫瘤專家與患者的溝通方式這一主題[26];HICPAC[13]則認為其制定的推薦意見內容應與 FDA、EPA 的政策保持一致;NICE[30]注意社會價值觀、倫理性對推薦意見的影響;而 WHO[22]、SIGN[24]在推薦意見制定時還考慮臨床問題的優先性、推薦意見的可接受性及可行性等因素。
2.1.3 相同的因素在不同指南手冊或標準中的闡述有所不同 雖然各組織或機構制定推薦意見時考慮的標準有諸多相同之處,但具有相同措辭的標準其含義又略有差異。比如:關于成本的含義,一般來說,成本即指推薦意見實施時需要的器械、藥品、人員等物質或非物質成本,且其與干預效果的關系直接影響患者對推薦意見的選擇。因此,指南制定者可從成本-效果分析結果[29]或將其與臨床應用效果[30]結合等角度評估推薦意見。SIGN[24]進行成本分析時,特別強調了患者、衛生保健體系或醫療機構對成本的要求不同。然而,有些機構僅考慮納入文獻中提及的成本及成本效果問題,并未將“成本”作為推薦意見制定時必須評估的標準[27]。
普遍性和應用性是推薦意見制定時常考慮的因素,其含義相似,往往是指推薦意見在目標人群中可推廣的程度及推薦意見在臨床情境中的適應程度。NHMRC[14]認為“普遍性”是指證據中的研究人群及臨床情境與指南的應用人群、推薦意見將被應用的臨床環境的匹配程度;并將“應用性”解釋為證據與其所在的國家衛生保健系統或推薦意見應用的臨床情境的相關性,比如文化或組織基礎等。而 BTS[27]、MoHM[28]、AAN[16]僅將普遍性或應用性作為推薦意見制定時考慮的標準,并未給予詳細的解釋。
針對價值觀和偏好,不同組織設立該項推薦意見評估標準的出發點不同,大部分指南制定機構考慮的是患者或照顧者的價值觀和偏好對推薦意見的影響[19-22, 25, 30],而有的組織考慮的是指南制定工作組對主要結局指標的價值觀和偏好[13]。
2.1.4 制定推薦意見時相同含義的因素在不同組織間的分類不同 推薦意見需評估的因素中,有的本質上含義是相同的,但在不同指南手冊中的分類或歸屬略有所差異。比如,WHO[22]、SIGN[24]不僅將利弊平衡、資源等單獨作為推薦意見制定需評估的標準,也設立可接受性、可行性標準評估其對推薦意見產生的綜合影響。其中,“可接受性”是評定相關利益人員如患者、指南使用者等對干預的利與弊、成本等的可接受程度。這與 IDSA[20]、Center MG[21]只獨立考慮利弊平衡、成本和資源利用分別對推薦意見的影響不同。此外,“可行性”往往考慮推薦意見實施時可能遇到的障礙因素,如資源、法律、文化等,WHO[22]、SIGN[24]均綜合考慮資源的可獲取性、患者的價值觀或偏好、法律等對推薦意見實施的影響,并將“可行性”單獨作為一個評估標準。而部分組織在推薦意見評估標準清單中,提及患者的價值觀或偏好、資源、法律及公平等,未綜合考慮其對推薦意見實施的整體性影響(表 2)。
2.2 從證據到推薦意見的形成途徑
證據到推薦意見形成的過程往往是復雜且繁瑣的,少有指南系統地記錄從證據到推薦意見制定的過程[36]。如何使推薦意見制定的過程更加系統、透明是國際指南制定機構、各學術組織一直探討的問題。指南 2.0 清單明確提出了建議:制定推薦意見時需應用結構化分析框架和透明系統的過程綜合推薦意見的影響因素;選擇合適的模塊總結影響推薦意見的因素;規劃并分享共識會議中參與者制定推薦意見的具體細節;評估模版中影響推薦意見的因素等[37, 38]。
目前,各國際指南制定機構或學術組織根據推薦意見制定時需要考慮的因素,提供了不同的內容框架或輔助工具。比如,決策模型(USPSTF)[29]、FAME 框架(JBI)[23]、GRADE 框架(WHO)[22]、DECIDE EtD 框架(SIGN)[24]等。不同的內容框架均用文字、圖形或表格等形式對推薦意見制定需要評估的因素進行相關陳述,以及介紹如何用該內容框架指導指南推薦意見的制定。但每一種內容框架又各具特色,如:DECIDE EtD 框架將推薦意見的制定過程分為三個步驟:構建臨床問題、評估決策考慮標準、得出結論。其中,“構建臨床問題”以 PICO 的模式呈現[39],并陳述該臨床問題產生的主要背景、制定推薦意見的原因和指南制定者出于何種角度(政府或衛生部門/患者)制定推薦意見等;“評估決策考慮標準”包括對利弊平衡、可接受性和可行性等因素的評定;此外,“得出結論”是指指南制定者基于臨床問題和決策考慮標準的評估結果,填寫指南決策表,進而總結推薦意見并闡述強推薦或弱推薦的理由、實施推薦意見時的注意事項、監測和評估標準、推薦研究等信息[40]。
E-CPG 中的系統、透明的推薦意見制定過程,不僅需要內容框架作為指導,且需要相關表格、模板等不同的輔助工具[15, 16, 18-25, 29]。比如,MIND 項目組提供推薦意見提取表格、推薦意見強度投票表格、推薦意見呈現表格、推薦意見制定過程陳述表、證據及推薦意見總結表[21]。AAN[16]在考慮推薦意見是否適應臨床情境的問題時,建議利用“決策樹”或“因果路徑”等演繹推理的方式先將證據與推薦意見聯系起來,再進一步考慮干預措施的可得性及成本等問題,并提供結論和推薦意見構建工具、推薦意見主要評估因素陳述詞表格。
2.3 形成最終推薦意見的方法
推薦意見制定過程需綜合考慮多種因素,然而指南制定小組成員眾多,包括相關領域專家、方法學專家、一線臨床醫生和患者代表等,如何得出一致性較高的決策意見,專家共識在這個過程中起到重要作用。專家共識包括正式、非正式兩種方式。正式的專家共識方法包括德爾菲、名義群體法、共識形成會議法;非正式專家共識指沒有正式的達成共識的程序和流程,專家們自由討論,通過自由討論達成對一個問題的共識[41]。各指南制定組織推薦意見達成共識的方式不一。循證指南制定中采用的是正式的專家共識方法。如 ACCF/AHA[15]、ASCO[26]均在指南手冊中描述了達成正式共識的具體方法,其中,ACCF/AHA 應用的是共識形成會議法,通過組織會議、遴選會議成員、確定會議討論的問題及正式投票等過程達成共識;ASCO 采用了改良的德爾菲法,借用 5 分或 7 分的利克特量表,并制定達成共識的規則,促使達成統一的推薦意見[42]。
此外,當意見不一致時,指南制定小組可采用 GRADE 網格(GRADE Grid)達成共識指南[43],比如,《萬古霉素治療藥物監測指南》項目組基于 GRADE 網格,利用改良的德爾菲法,通過 3 輪調查就推薦意見達成共識,并制定了達成共識的規則:若除了“0”以外的任何一格票數超過 50%,則視為達成共識,可直接確定推薦意見的方向和強度;若“0”某一側兩格總數超過 70%,亦視為達成共識,可確定推薦方向,推薦強度則直接定為弱;其余情況視為未達成共識,推薦意見進入下一輪投票[44](表 3)。

同時注意,應用共識方法制定推薦意見時,可能存在以下兩點問題:一方面,參與共識專家的利益沖突,對推薦意見的形成有直接的影響。為解決這一問題,指南工作組可按照國際指南協會(Guideline International Network)管理利益沖突的方法[45],制訂詳細的利益沖突聲明表,對每一位參與共識的專家,要求其如實公布所有可能的經濟和非經濟利益,并委托獨立的第三方對利益沖突進行判斷,從而確定參與共識專家的最終名單,并及時公布專家的利益沖突聲明表。另一方面,共識后的推薦意見,在正式發表之前,仍需進一步送審指南制定小組之外的臨床相關專家、指南使用者和其他利益相關方;評審人員名單、評審意見的處理方法、根據反饋修改完善最終推薦意見均需指南工作組預先設定,以便確保外審的有效性和獨立性[46]。
2.4 推薦意見呈現的內容
指南中推薦意見呈現形式的多樣性、內容準確性及完整性有利于指南使用者或研究者更加直觀地查看針對特定臨床問題的建議,同時有助于使用者了解推薦意見的制定過程及實施推薦意見時可能存在的問題等。多數指南制定機構均對推薦意見呈現的內容進行了闡述。其中 AAN[16]提供的推薦意見組成成分表格與 KHA-CARI[25]、紐約州立大學等[19]的推薦意見陳述清單、ESHRE[18]的原則有相似之處,均建議推薦意見應對干預措施的實施者或被實施者、干預措施具體內容、推薦意見的應用條件、干預措施的實施方式等方面進行描述。此外,IDSA[20]提供了推薦意見呈現模板,由背景(backgrounds)、臨床問題(original clinical question)、推薦意見(original recommendation)、臨時推薦意見(interrim recommendation)、投票(如果應用的話,if application)、證據總結(summary of the evidence)等組成。EtD 內容框架也明確指出指南工作組在對推薦意見進行總結時,要陳述強推薦或弱推薦的理由、實施推薦意見時的注意事項、監測和評估標準、推薦研究等方面的信息[47]。
現有的證據及推薦意見分級標準日漸完善,但證據到推薦意見轉化的過程仍有許多問題,指南工作組在制定推薦意見時需注意以下幾點:① 明確推薦意見制定時需要考慮的標準,并對每一個標準的內涵進行詳細闡述;② 盡可能量化評估待考慮的標準;③ 盡可能借助于預先設計好的內容框架或輔助工具;④ 確定形成最終推薦意見的方法,并介紹達成共識的規則;⑤ 制定行之有效的方法嚴格管理共識階段的利益沖突;⑥ 選擇合適的評審人員,開展推薦意見外審并建立反饋機制;⑦ 運用適宜的圖表等形式,清晰、透明、系統地呈現推薦意見的相關內容。
證據是循證臨床實踐指南的基礎,但證據本身不能指導決策,推薦意見在證據應用到臨床實踐的過程中起到至關重要作用。目前,雖尚無完善的、嚴謹的證據到推薦意見形成的方法學,但部分組織提供了不同的內容框架或輔助工具指導推薦意見的制定,國內循證臨床實踐指南制定者可借鑒其經驗,結合本國國情,構建本土化的推薦意見形成的方法學。
2011 年,美國醫學科學院(institute of medicine,IOM)指出臨床實踐指南是針對患者特定的臨床問題,基于系統評價形成的證據,對各種備選干預方式進行全面的利弊平衡分析,并提出最優指導意見[1]。該組織強調了基于證據制定臨床實踐指南的重要性。一些國際組織專門開發了指南手冊,用以指導循證臨床實踐指南(evidence-based clinical practice guideline,E-CPG)的制定。我國也于 2016 年 1 月發布了國內首部“指南的指南”[2]。指南手冊的發布對規范和嚴謹地制定 E-CPG 起到極大的促進作用,但研究顯示現有的循證指南仍然存在一定的方法學缺陷,尤其在證據到推薦意見的轉化過程缺乏透明性及清晰性[3-5]。然而證據是 E-CPG 的基礎,推薦意見是 E-CPG 的核心內容,它們的概念、內涵的逐步發展及證據到推薦意見的轉化過程對 E-CPG 推薦意見的制定有重要意義。本文旨在總結 E-CPG 推薦意見制定的方法,以期為我國 E-CPG 制定者提供可參考的建議。
1 證據及推薦意見分級的歷史進展
自 20 世紀 60 年代,美國兩位社會學家 Campbell 和 Stanley 首次引入證據分級概念后[6-8],隨著循證醫學和臨床流行病學的逐步發展,證據的分級標準、證據與推薦意見的關系等概念和內涵也在持續不斷地完善(表 1)。主要表現在以下幾個方面:證據分級標準從單一因素考慮(試驗設計)到多因素(研究質量、間接性和結果一致性等)綜合評定;最高級別證據的定義標準從單個 RCT 到多個 RCT 的 Meta 分析;證據的來源愈發廣泛,逐步納入系統評價、動物研究和中醫文獻等;證據的分類從單一走向多樣化(治療、預防和經濟學分析等);證據與推薦意見的關系從最初的相互獨立、絕對對應(高質量證據的推薦強度也高),發展成相互影響又相互制約的關系(高質量證據的推薦強度不一定高)。

2 從證據到推薦意見的形成
2.1 制定推薦意見時考慮的標準
以往證據質量等級與推薦強度等級一一對應,如高質量證據常常意味著強推薦,即研究者在制定推薦級別時只考慮證據質量這一唯一因素。隨后,越來越多的學者認識到此方法存在弊端,推薦意見的制定不再單一地依賴證據質量,各指南工作組仍需考慮患者的價值觀和偏好、成本、利弊平衡、臨床意義等因素(表 2)。目前多個學術組織制定了指南手冊,其中對推薦意見在制定時需考慮因素的規定不完全相同。

2.1.1 “證據質量”、“證據體質量”的內涵有所不同 E-CPG 強調推薦意見的制定應著重考慮其收集的證據質量。證據質量是指對預測值的真實性有多大把握[31]。GRADE 工作組對不同級別的證據質量提出明確定義,如高質量證據,GRADE 工作組最初認為其是指進一步研究也不可能改變該療效評估結果可信度的證據;隨后,又將其定義為研究者非常確信真實的效應值接近效應估計的證據。而低質量證據,GRADE 工作組原先將其定義為進一步研究極有可能影響該療效評估結果的可信度,且該評估結果很可能改變;隨后,又將其解釋為對效應估計值的確信程度有限:真實值可能與估計值不相同[32-34]。“證據質量”等級概念描述的具體化,方便研究者對證據質量的正確理解,并對證據進行質量評價和分級。
然而在不同組織或機構制定的指南手冊或指南標準中,“證據質量”的內涵有所不同。一方面,如 ESHRE[18]、ASCO[26]、紐約州立大學等[19]認為證據質量既可以是單個或多個研究的質量,又可以是系統評價的質量。另一方面,有些組織雖以“證據體”為單位對證據進行質量分級,但對證據體質量的含義闡述不完全相同。GRADE 工作組將證據體(body of evidence)定義為系統評價的效應指標,且其質量是綜合考慮系統評價納入研究的偏倚風險、發表偏倚、不一致性及間接性等因素而評定的[35]。AAN[16]、KHA-CARI[25]、MINDS 項目組[21]等均應用 GRADE 系統對“證據體”進行質量評價。NHMRC[14]在其指南手冊中也應用了“證據體”一詞,但它認為“證據體”由證據基礎(evidence base)、一致性(consistency)、臨床意義(clinical impact)、普遍性(generalizability)、應用性(applicability)5 個要素構成,其中證據基礎包括證據數量(quantity of evidence)、證據水平(level of evidence)以及證據質量(quality of evidence)。這與 GRADE 證據分級有一定的相似性,也有一些區別,其除了考慮研究結果間的一致性和納入研究的質量等因素,也考慮了推薦意見在應用時需要評估的因素,如臨床意義、普遍性、應用性(表 2)。
2.1.2 制定推薦意見時考慮的因素不完全相同 如表 2 所示,不同組織或機構在推薦意見制定時考慮的因素有相同也有不同。患者的價值觀和意愿[15, 16, 19-22, 24, 25]、推薦意見實施時需要的成本或資源及實施后所帶來的利弊[13, 15-22, 24, 25]、推薦意見應用時需要的臨床條件與實踐中具體臨床環境的差距[14, 22-24, 27]是指南制定者常常考慮的因素。推薦意見制定時考慮的因素不同之處如:ASCO 是美國臨床腫瘤協會組織,致力于通過研究、教育及推廣最優質的病人治療護理方案以應對腫瘤,在其指南制定手冊中提及推薦意見制定時需關注腫瘤專家與患者的溝通方式這一主題[26];HICPAC[13]則認為其制定的推薦意見內容應與 FDA、EPA 的政策保持一致;NICE[30]注意社會價值觀、倫理性對推薦意見的影響;而 WHO[22]、SIGN[24]在推薦意見制定時還考慮臨床問題的優先性、推薦意見的可接受性及可行性等因素。
2.1.3 相同的因素在不同指南手冊或標準中的闡述有所不同 雖然各組織或機構制定推薦意見時考慮的標準有諸多相同之處,但具有相同措辭的標準其含義又略有差異。比如:關于成本的含義,一般來說,成本即指推薦意見實施時需要的器械、藥品、人員等物質或非物質成本,且其與干預效果的關系直接影響患者對推薦意見的選擇。因此,指南制定者可從成本-效果分析結果[29]或將其與臨床應用效果[30]結合等角度評估推薦意見。SIGN[24]進行成本分析時,特別強調了患者、衛生保健體系或醫療機構對成本的要求不同。然而,有些機構僅考慮納入文獻中提及的成本及成本效果問題,并未將“成本”作為推薦意見制定時必須評估的標準[27]。
普遍性和應用性是推薦意見制定時常考慮的因素,其含義相似,往往是指推薦意見在目標人群中可推廣的程度及推薦意見在臨床情境中的適應程度。NHMRC[14]認為“普遍性”是指證據中的研究人群及臨床情境與指南的應用人群、推薦意見將被應用的臨床環境的匹配程度;并將“應用性”解釋為證據與其所在的國家衛生保健系統或推薦意見應用的臨床情境的相關性,比如文化或組織基礎等。而 BTS[27]、MoHM[28]、AAN[16]僅將普遍性或應用性作為推薦意見制定時考慮的標準,并未給予詳細的解釋。
針對價值觀和偏好,不同組織設立該項推薦意見評估標準的出發點不同,大部分指南制定機構考慮的是患者或照顧者的價值觀和偏好對推薦意見的影響[19-22, 25, 30],而有的組織考慮的是指南制定工作組對主要結局指標的價值觀和偏好[13]。
2.1.4 制定推薦意見時相同含義的因素在不同組織間的分類不同 推薦意見需評估的因素中,有的本質上含義是相同的,但在不同指南手冊中的分類或歸屬略有所差異。比如,WHO[22]、SIGN[24]不僅將利弊平衡、資源等單獨作為推薦意見制定需評估的標準,也設立可接受性、可行性標準評估其對推薦意見產生的綜合影響。其中,“可接受性”是評定相關利益人員如患者、指南使用者等對干預的利與弊、成本等的可接受程度。這與 IDSA[20]、Center MG[21]只獨立考慮利弊平衡、成本和資源利用分別對推薦意見的影響不同。此外,“可行性”往往考慮推薦意見實施時可能遇到的障礙因素,如資源、法律、文化等,WHO[22]、SIGN[24]均綜合考慮資源的可獲取性、患者的價值觀或偏好、法律等對推薦意見實施的影響,并將“可行性”單獨作為一個評估標準。而部分組織在推薦意見評估標準清單中,提及患者的價值觀或偏好、資源、法律及公平等,未綜合考慮其對推薦意見實施的整體性影響(表 2)。
2.2 從證據到推薦意見的形成途徑
證據到推薦意見形成的過程往往是復雜且繁瑣的,少有指南系統地記錄從證據到推薦意見制定的過程[36]。如何使推薦意見制定的過程更加系統、透明是國際指南制定機構、各學術組織一直探討的問題。指南 2.0 清單明確提出了建議:制定推薦意見時需應用結構化分析框架和透明系統的過程綜合推薦意見的影響因素;選擇合適的模塊總結影響推薦意見的因素;規劃并分享共識會議中參與者制定推薦意見的具體細節;評估模版中影響推薦意見的因素等[37, 38]。
目前,各國際指南制定機構或學術組織根據推薦意見制定時需要考慮的因素,提供了不同的內容框架或輔助工具。比如,決策模型(USPSTF)[29]、FAME 框架(JBI)[23]、GRADE 框架(WHO)[22]、DECIDE EtD 框架(SIGN)[24]等。不同的內容框架均用文字、圖形或表格等形式對推薦意見制定需要評估的因素進行相關陳述,以及介紹如何用該內容框架指導指南推薦意見的制定。但每一種內容框架又各具特色,如:DECIDE EtD 框架將推薦意見的制定過程分為三個步驟:構建臨床問題、評估決策考慮標準、得出結論。其中,“構建臨床問題”以 PICO 的模式呈現[39],并陳述該臨床問題產生的主要背景、制定推薦意見的原因和指南制定者出于何種角度(政府或衛生部門/患者)制定推薦意見等;“評估決策考慮標準”包括對利弊平衡、可接受性和可行性等因素的評定;此外,“得出結論”是指指南制定者基于臨床問題和決策考慮標準的評估結果,填寫指南決策表,進而總結推薦意見并闡述強推薦或弱推薦的理由、實施推薦意見時的注意事項、監測和評估標準、推薦研究等信息[40]。
E-CPG 中的系統、透明的推薦意見制定過程,不僅需要內容框架作為指導,且需要相關表格、模板等不同的輔助工具[15, 16, 18-25, 29]。比如,MIND 項目組提供推薦意見提取表格、推薦意見強度投票表格、推薦意見呈現表格、推薦意見制定過程陳述表、證據及推薦意見總結表[21]。AAN[16]在考慮推薦意見是否適應臨床情境的問題時,建議利用“決策樹”或“因果路徑”等演繹推理的方式先將證據與推薦意見聯系起來,再進一步考慮干預措施的可得性及成本等問題,并提供結論和推薦意見構建工具、推薦意見主要評估因素陳述詞表格。
2.3 形成最終推薦意見的方法
推薦意見制定過程需綜合考慮多種因素,然而指南制定小組成員眾多,包括相關領域專家、方法學專家、一線臨床醫生和患者代表等,如何得出一致性較高的決策意見,專家共識在這個過程中起到重要作用。專家共識包括正式、非正式兩種方式。正式的專家共識方法包括德爾菲、名義群體法、共識形成會議法;非正式專家共識指沒有正式的達成共識的程序和流程,專家們自由討論,通過自由討論達成對一個問題的共識[41]。各指南制定組織推薦意見達成共識的方式不一。循證指南制定中采用的是正式的專家共識方法。如 ACCF/AHA[15]、ASCO[26]均在指南手冊中描述了達成正式共識的具體方法,其中,ACCF/AHA 應用的是共識形成會議法,通過組織會議、遴選會議成員、確定會議討論的問題及正式投票等過程達成共識;ASCO 采用了改良的德爾菲法,借用 5 分或 7 分的利克特量表,并制定達成共識的規則,促使達成統一的推薦意見[42]。
此外,當意見不一致時,指南制定小組可采用 GRADE 網格(GRADE Grid)達成共識指南[43],比如,《萬古霉素治療藥物監測指南》項目組基于 GRADE 網格,利用改良的德爾菲法,通過 3 輪調查就推薦意見達成共識,并制定了達成共識的規則:若除了“0”以外的任何一格票數超過 50%,則視為達成共識,可直接確定推薦意見的方向和強度;若“0”某一側兩格總數超過 70%,亦視為達成共識,可確定推薦方向,推薦強度則直接定為弱;其余情況視為未達成共識,推薦意見進入下一輪投票[44](表 3)。

同時注意,應用共識方法制定推薦意見時,可能存在以下兩點問題:一方面,參與共識專家的利益沖突,對推薦意見的形成有直接的影響。為解決這一問題,指南工作組可按照國際指南協會(Guideline International Network)管理利益沖突的方法[45],制訂詳細的利益沖突聲明表,對每一位參與共識的專家,要求其如實公布所有可能的經濟和非經濟利益,并委托獨立的第三方對利益沖突進行判斷,從而確定參與共識專家的最終名單,并及時公布專家的利益沖突聲明表。另一方面,共識后的推薦意見,在正式發表之前,仍需進一步送審指南制定小組之外的臨床相關專家、指南使用者和其他利益相關方;評審人員名單、評審意見的處理方法、根據反饋修改完善最終推薦意見均需指南工作組預先設定,以便確保外審的有效性和獨立性[46]。
2.4 推薦意見呈現的內容
指南中推薦意見呈現形式的多樣性、內容準確性及完整性有利于指南使用者或研究者更加直觀地查看針對特定臨床問題的建議,同時有助于使用者了解推薦意見的制定過程及實施推薦意見時可能存在的問題等。多數指南制定機構均對推薦意見呈現的內容進行了闡述。其中 AAN[16]提供的推薦意見組成成分表格與 KHA-CARI[25]、紐約州立大學等[19]的推薦意見陳述清單、ESHRE[18]的原則有相似之處,均建議推薦意見應對干預措施的實施者或被實施者、干預措施具體內容、推薦意見的應用條件、干預措施的實施方式等方面進行描述。此外,IDSA[20]提供了推薦意見呈現模板,由背景(backgrounds)、臨床問題(original clinical question)、推薦意見(original recommendation)、臨時推薦意見(interrim recommendation)、投票(如果應用的話,if application)、證據總結(summary of the evidence)等組成。EtD 內容框架也明確指出指南工作組在對推薦意見進行總結時,要陳述強推薦或弱推薦的理由、實施推薦意見時的注意事項、監測和評估標準、推薦研究等方面的信息[47]。
現有的證據及推薦意見分級標準日漸完善,但證據到推薦意見轉化的過程仍有許多問題,指南工作組在制定推薦意見時需注意以下幾點:① 明確推薦意見制定時需要考慮的標準,并對每一個標準的內涵進行詳細闡述;② 盡可能量化評估待考慮的標準;③ 盡可能借助于預先設計好的內容框架或輔助工具;④ 確定形成最終推薦意見的方法,并介紹達成共識的規則;⑤ 制定行之有效的方法嚴格管理共識階段的利益沖突;⑥ 選擇合適的評審人員,開展推薦意見外審并建立反饋機制;⑦ 運用適宜的圖表等形式,清晰、透明、系統地呈現推薦意見的相關內容。
證據是循證臨床實踐指南的基礎,但證據本身不能指導決策,推薦意見在證據應用到臨床實踐的過程中起到至關重要作用。目前,雖尚無完善的、嚴謹的證據到推薦意見形成的方法學,但部分組織提供了不同的內容框架或輔助工具指導推薦意見的制定,國內循證臨床實踐指南制定者可借鑒其經驗,結合本國國情,構建本土化的推薦意見形成的方法學。