引用本文: 沙茵茵, 徐立然, 馬秀霞, 孟鵬飛, 邵燦燦, 王雪婷, 頰艷丹. 成人艾滋病臨床指南和共識的質量評價. 中國循證醫學雜志, 2022, 22(6): 706-715. doi: 10.7507/1672-2531.202202085 復制
艾滋病,即獲得性免疫缺陷綜合征(acquired immunodeficiency syndrome,AIDS),目前仍然是嚴重威脅公眾健康的重要公共衛生問題之一。據聯合國艾滋病規劃署(Joint United Nations Programme on HIV and AIDS,UNAIDS)統計,截至2020年底,全球現存活的HIV/AIDS患者3 770萬[1]。根據中國疾病預防控制中心性病艾滋病預防控制中心統計,我國報告的現存活艾滋病患者105.3萬,新發感染13萬。2021年UNAIDS和世界衛生組織(World Health Organization,WHO)提出了希望在2030年終結艾滋病的愿景[2],這對艾滋病防治領域的工作提出了巨大挑戰,要求針對艾滋病患者群體的監測、管理、預防宣教工作更加規范有力。對于臨床工作者來說,高質量的診療指南能夠以最便捷的方式提供最新研究成果和相應的診療建議,指導并規范臨床實踐,使得患者受益最大化,并且對于控制新發感染數、保護未感染人群具有積極意義[3]。目前已發表的艾滋病領域成人的診療指南和專家共識眾多,客觀公正且合理地評估這些指南和共識的質量,能夠為臨床工作者提供參考,并為該領域指南的更新和發布提供方法學建議[4]。
AGREE(appraisal of guidelines for research and evaluation)評價系統于2003年由AGREE協作網制訂并發布[5],2009年被進一步修訂為AGREE Ⅱ評價工具,目前被廣泛用于臨床實踐指南方法學質量的評價和對比,并逐漸獲得了世界范圍內多個醫療機構的認可,是目前國際上用于指導臨床實踐指南的制訂、報告和評價的重要工具[6]。2016年,國際RIGHT(reporting items for practice guidelines in healthcare,RIGHT)工作組發布了RIGHT標準,作為指南報告的規范化標準以協助指南制訂人員撰寫和報告指南[7]。本研究采用AGREE Ⅱ評價工具和RIGHT標準對國內外成人艾滋病臨床指南和共識進行方法學質量和報告質量評價,為我國的艾滋病臨床工作者和指南制訂專家完善艾滋病相關指南制訂工作提供參考。
1 資料與方法
1.1 納入與排除標準
納入標準:① 期刊、會議、網站公開發表的臨床實踐指南/共識(后文簡稱為指南);② 指南目標人群為成人HIV感染者或成人艾滋病患者;③ 如果兩部指南互為更新關系,僅納入最新發布的指南。
排除標準:① 非中文、英文指南;② 由其他語言翻譯為中/英文的指南;③ 臨床指南的介紹、評析、應用指導、應用效果評價和勘誤表等;④ 無法獲取全文的指南;⑤ 不涉及治療方面的指南;⑥ 艾滋病并發癥或合并癥指南;⑦ 研究對象只涉及孕婦或兒童的指南。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、Web of Science、CBM、WanFang Data和CNKI數據庫。補充檢索GIN、NICE、NGC、WHO和醫脈通等主要臨床實踐指南網站[8],搜集艾滋病相關指南,檢索時限均從建庫至2021年12月。此外,追溯已納入臨床指南的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:艾滋病、HIV、獲得性免疫缺陷綜合征和指南、共識等;英文檢索詞包括:AIDS、HIV、acquired immunodeficiency syndrome、guideline、consensus等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選和資料提取
由2位研究人員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入指南的基本信息,包括題目、發表時間、制訂機構、制訂方法等;② 方法學質量評價的關鍵要素;③ 報告質量評價的關鍵要素。
1.4 納入研究的質量評價
由4位評價員采用AGREE Ⅱ和RIGHT評價工具分別評價納入研究的方法學質量和報告質量。4位評價員均為艾滋病領域博士研究生,在評價前對所有評價者進行專業培訓,確保對每個條目的理解基本一致,評價標準相同。AGREE Ⅱ指南評價工具包括6個領域23個條目,每個條目分值為1~7分,完全符合條目要求的賦予7分,完全不符合的賦予1分,介于二者之間的根據不同情況給予2~6分[9],每部指南各領域標準化百分比的計算公式如下:各領域標準化百分比=(實際得分?可得最低分)/(可得最高分?可得最低分)×100%[10]。RIGHT標準共7個領域22條目,以“報告”、“部分報告”或“未報告”進行條目評價,分別對“報告”、“部分報告”和“未報告”賦值1、0.5和0分,最后匯總每一部指南的總得分[7]。
1.5 統計分析
描述性分析采用Excel軟件,數據分析采用SPSS 20.0統計軟件,計量資料采用秩和檢驗,所有假設檢驗的檢驗水準為α=0.05。采用SPSS 20.0軟件計算組內相關系數(intraclass correlation coefficient,ICC),對4名評價員AGREEⅡ工具各條目評價結果的一致性進行檢驗。若ICC≥0.80,說明一致性較好;若ICC<0.80,則需重新培訓評價員,使評價員對該條目理解趨于一致,并再次獨立評分,直至ICC≥0.80。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻9 524篇,經逐層篩選后,最終納入成人艾滋病相關的臨床指南和共識17部。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:CBM(
2.2 納入研究的基本特征
納入研究的基本特征見表1,其中,共識7部(41.2%)[11-17],指南10部(58.8%)[18-27];個人發布2部(11.8%)[12,25],學會/協會發布15部(88.2%)[11,13-24,26-27];基于專家意見或綜述等制訂9部(53.0%)[11,13-15,17,19-21,25],基于循證醫學方法制訂8部(47.0%)[12,16,18,22-24,26,27];中國7部(41.2%)[13-17,20-21],國外10部(58.8%)[11-12,18-19,22-27];在應用類別方面,以治療指南為主,占64.7%(11部)[11,13-19,22,24-25],綜合類指南25.3%(6部)[12,20-21,23,26-27]。

2.3 納入研究方法學質量評價結果
4名評價員ICC值為0.939(>0.8),具有較好的一致性。各研究方法學質量評價結果見表2。

2.3.1 總體評價結果
① 范圍和目的:11部指南評分大于50%,絕大部分指南共識都不同程度地描述了該領域的3個部分內容,包括指南目的、涵蓋的臨床問題和指南的適用人群。AGREE Ⅱ評分的平均分分別為4.56、4.12和4.21。平均標準化百分比為59.48%,最高為94.44%[27],最低為15.28%[21]。該領域整體得分較高。
② 參與人員:有5部指南評分大于50%,該領域包含3個條目,涉及指南制訂人員、目標人群觀點和規定使用者。AGREE Ⅱ評分的平均分分別為3.40、1.97和4.04。平均標準化百分比為37.17%,最高為93.06%[27],最低為6.94%[15]。該領域整體得分較低,13部指南(13/17,76.47%)未提及目標人群(患者、公眾等)的觀點和選擇意愿。15部指南或專家共識(15/17,88.24%)對參與人員在指南制訂小組中的角色、學科專業、所在機構和地理位置等描述不全面。4部指南(4/17,23.53%)未明確規定指南的使用者。
③ 嚴謹性:僅有2部指南評分大于50%,該領域包含8個條目,是條目最多也是指南制訂最重要的部分,涉及:指南檢索證據的方法,選擇證據的標準,證據的強度和局限性,形成推薦意見的方法,對健康的益處、副作用以及危險,推薦建議和支持證據之間的聯系,發布前是否經過外部專家評審和更新步驟。AGREE Ⅱ評分的平均分為2.26、2.25、2.59、2.94、4.93、4.18、2.00和3.47。平均標準化百分比為30.76%,最高為92.71%[27],最低為4.17%[20]。該領域整體得分較低,除推薦意見對健康的益處、副作用、危險及推薦意見和支持證據之間的聯系2個條目闡述較為明確外,14部指南或共識(14/17,82.35%)沒有詳細描述檢索證據的方法和選擇證據的標準。3部英文和5部中文指南或共識(8/17,47.06%)未闡述形成推薦意見的方法。僅有2部英文指南[11,27]在發布前經過外部專家評審,有約半數指南未明確提及指南的更新步驟。
④ 清晰性:16部指南得分大于50%,該領域包含3個條目,AGREE Ⅱ評分的平均分為6.13、5.88和6.10。平均標準化百分比為74.75%,最高為95.83%[12],最低為38.89%[17]。該領域整體得分為6個領域最高,方法學質量最好,除2部指南[13,17]外,其他指南均對這3個條目進行了較為明確的闡述。
⑤ 應用性:6部指南評分大于50%,該領域包含4個條目,涉及指南應用時的促進和阻礙因素、提供應用推薦建議的意見和/或工具、應用時潛在的相關資源以及監督和/或審計標準。AGREE Ⅱ評分的平均分為3.76、3.90、4.01和3.90。平均標準化百分比為35.54%,最高為92.71%[27],最低為4.17%[14-15,20]。該領域整體得分中等偏下。約半數的指南未提及指南應用過程中的促進和阻礙因素、應用推薦建議的意見或工具,也未考慮應用推薦建議時潛在的資源投入問題,有11部指南(11/17,64.71%)不同程度提及了監督和審計標準。
⑥ 獨立性:約半數指南評分大于50%,該領域包含2個條目,涉及贊助單位的觀點對推薦意見的影響、指南開發小組成員的利益沖突。AGREE Ⅱ評分的平均分分別為4.72和5.19。平均標準化百分比為50.49%,最高為95.83%[27],最低為4.17%[12,13,15-18,20]。該領域整體得分中等偏上。有近半數(47.06%)說明了贊助單位的觀點對推薦意見沒有影響,7部指南(41.18%)未記錄和考慮制訂小組成員是否存在利益沖突。
2.3.2 亞組分析
不同條件分組下各亞組指南的AGREE Ⅱ各領域得分和比較情況見表3。指南類在清晰性、應用性和獨立性領域得分均較共識類高(P<0.05),基于循證醫學方法制訂的指南和共識較基于專家意見或綜述制訂的指南和共識在除獨立性領域外各領域得分均較高(P<0.05);國外指南和共識在在6個領域的得分均高于國內指南(P<0.05);AGREE Ⅱ發布前后、發布機構為個人或學會/協會在各領域得分差異無統計學意義。

2.4 報告質量評價結果
2.4.1 總體評價結果
根據RIGHT評價條目中報告率最高的為條目1a、1b、1c(100.00%),其次為條目3、4(94.12%),13a、13b(88.24%),7b、11a(76.47%),5(64.71%),其余條目報告率均在60%以下,未報告率最高的條目依次為17(88.24%),16(82.35%),10b、18b(70.59%),14a、15、19b(64.71%)(表4)。

2.4.2 亞組分析
指南較共識、基于循證制訂較基于專家意見或綜述制訂、國外指南共識較我國指南共識的RIGHT評分平均得分高且差異均具有統計學意義(P<0.05),而個人還是學會/協會發布的指南或共識的RIGHT評分平均得分比較差異無統計學意義(表5)。

3 討論
關于嚴謹性,本研究結果顯示,當前成人艾滋病指南在AGREEⅡ的6個領域中,得分最低的是嚴謹性領域(平均標準化百分比30.76%)。大部分指南或共識在制訂流程的嚴謹性方面有不同程度的欠缺,這會直接影響到推薦意見的可信程度和指導價值。分析原因,其一,可能符合循證要求的指南在制訂過程中方法學難度更高,需要投入的人力更多,對指南制訂工作組的專業能力和統籌能力要求也更高。其二,大部分指南在制訂方案的選題、設計、實施、質量控制等各關鍵環節缺乏方法學專家的指導。這可能與目前臨床醫學系統和基礎醫學系統明顯有關,多數學會組織及學術交流會議僅涵蓋本專業專家,不同領域及交叉學科之間的交流合作不足。其三,指南的使用者可能更重視指南推薦意見形成的結果,而非過程。
關于參與人員,納入的17部指南或共識在參與人員領域的平均標準化百分比為37.17%,近半數在制訂工作組成員規劃方面具有不足,除方法學專家參與不足以外,其他相關領域如流行病學、文獻學、統計學、衛生經濟學等領域專家及患者代表也少有參與。對于目標人群觀念和選擇意愿的征詢不足有悖于以患者為中心的醫療理念。
關于應用性,僅有6部指南在該領域的標準化百分比大于50%,大部分指南對于其在應用階段可能遇到的促進或阻礙因素評估不充分或完全未提及,也少有衛生經濟學方面的考量。若指南的推薦意見僅從理論角度出發,則可能會與應用區域的實際情況脫節,對政策制訂者的參考價值也可能隨之降低。不同地區的衛生服務水平、經濟水平、醫療資源、醫保政策等均會影響指南的具體應用,而指南制訂者對于該領域的重視程度尚有欠缺。
關于報告質量,RIGHT標準中未報告率最高的是條目17(質量保證),其次為條目14(外部評審)、條目10b(結局遴選和分類方法)、18b(資助者作用)。所納入研究的17部指南中有15部未提及質量保證和外部評審,RIGHT的評價結果與AGREEⅡ工具的評價結果一致,可見在指南制訂過程中的質量控制和在制訂結束后的外部同行評審往往被忽略。
針對以上不足,我們建議:① 指南制訂機構可考慮增加不同領域專家之間的交流機會,充分發揮機構的組織能力,合理規劃指南制訂的專家組成員,除臨床領域專家外,還需盡量涵蓋方法學、政策制訂、醫療機構管理、藥物供應等多領域專家,撰寫時應詳細記錄各專家的姓名、專業、機構、地理位置及在指南開發過程中的分工或貢獻。② 應在條件允許范圍內通過問卷調查、訪談或文獻綜述等方式對指南應用的目標人群進行調查,收集其觀點及選擇意愿,并在形成推薦意見時綜合考慮,同時進行相應描述。③ 應在指南或共識的嚴謹性方面更加關注,詳細描述文獻的檢索策略、納排標準、評估方法/工具,詳細介紹推薦意見的形成過程以及與支持證據之間的具體關系,指南發布之前應進行外部專家評審,并提供更新計劃。④ 在條件允許的情況下,應盡可能參考衛生經濟學證據,結合當地的衛生服務水平,對建議實施時可能的促進和阻礙因素、可能產生的費用進行描述。在撰寫指南時可考慮將推薦建議以便于查找和應用的方式形成附加文件或應用工具。⑤ 應如實記錄資助單位對指南觀點的影響情況及開發小組成員之間的利益沖突。
本研究的局限性:① 本研究所納入的指南是通過網絡數據庫檢索和相關指南網站檢索相結合,通過人工篩選的方式獲得。對于年代較久遠網絡上未能檢索到全文者,或僅在網站發布而未被數據庫收錄者可能有所遺漏,并且人工篩選存在一定主觀性。② 雖然已對評價員進行了方法學培訓和評價結果的一致性檢驗,但是評價結果依然存在個體主觀影響,存在偏倚風險。
綜上所述,國內成人艾滋病指南相對于國外在方法學上尚存在一定差距,建議嚴格遵照AGREEⅡ的要求進行指南開發,在參與人員、嚴謹性、應用性、獨立性方面進一步完善,提升指南質量,并根據國際實踐指南報告規范RIGHT的條目進行指南的撰寫,以免遺漏重要內容。
艾滋病,即獲得性免疫缺陷綜合征(acquired immunodeficiency syndrome,AIDS),目前仍然是嚴重威脅公眾健康的重要公共衛生問題之一。據聯合國艾滋病規劃署(Joint United Nations Programme on HIV and AIDS,UNAIDS)統計,截至2020年底,全球現存活的HIV/AIDS患者3 770萬[1]。根據中國疾病預防控制中心性病艾滋病預防控制中心統計,我國報告的現存活艾滋病患者105.3萬,新發感染13萬。2021年UNAIDS和世界衛生組織(World Health Organization,WHO)提出了希望在2030年終結艾滋病的愿景[2],這對艾滋病防治領域的工作提出了巨大挑戰,要求針對艾滋病患者群體的監測、管理、預防宣教工作更加規范有力。對于臨床工作者來說,高質量的診療指南能夠以最便捷的方式提供最新研究成果和相應的診療建議,指導并規范臨床實踐,使得患者受益最大化,并且對于控制新發感染數、保護未感染人群具有積極意義[3]。目前已發表的艾滋病領域成人的診療指南和專家共識眾多,客觀公正且合理地評估這些指南和共識的質量,能夠為臨床工作者提供參考,并為該領域指南的更新和發布提供方法學建議[4]。
AGREE(appraisal of guidelines for research and evaluation)評價系統于2003年由AGREE協作網制訂并發布[5],2009年被進一步修訂為AGREE Ⅱ評價工具,目前被廣泛用于臨床實踐指南方法學質量的評價和對比,并逐漸獲得了世界范圍內多個醫療機構的認可,是目前國際上用于指導臨床實踐指南的制訂、報告和評價的重要工具[6]。2016年,國際RIGHT(reporting items for practice guidelines in healthcare,RIGHT)工作組發布了RIGHT標準,作為指南報告的規范化標準以協助指南制訂人員撰寫和報告指南[7]。本研究采用AGREE Ⅱ評價工具和RIGHT標準對國內外成人艾滋病臨床指南和共識進行方法學質量和報告質量評價,為我國的艾滋病臨床工作者和指南制訂專家完善艾滋病相關指南制訂工作提供參考。
1 資料與方法
1.1 納入與排除標準
納入標準:① 期刊、會議、網站公開發表的臨床實踐指南/共識(后文簡稱為指南);② 指南目標人群為成人HIV感染者或成人艾滋病患者;③ 如果兩部指南互為更新關系,僅納入最新發布的指南。
排除標準:① 非中文、英文指南;② 由其他語言翻譯為中/英文的指南;③ 臨床指南的介紹、評析、應用指導、應用效果評價和勘誤表等;④ 無法獲取全文的指南;⑤ 不涉及治療方面的指南;⑥ 艾滋病并發癥或合并癥指南;⑦ 研究對象只涉及孕婦或兒童的指南。
1.2 文獻檢索策略
計算機檢索PubMed、EMbase、Web of Science、CBM、WanFang Data和CNKI數據庫。補充檢索GIN、NICE、NGC、WHO和醫脈通等主要臨床實踐指南網站[8],搜集艾滋病相關指南,檢索時限均從建庫至2021年12月。此外,追溯已納入臨床指南的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:艾滋病、HIV、獲得性免疫缺陷綜合征和指南、共識等;英文檢索詞包括:AIDS、HIV、acquired immunodeficiency syndrome、guideline、consensus等。以PubMed為例,其具體檢索策略見框1。

1.3 文獻篩選和資料提取
由2位研究人員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:① 納入指南的基本信息,包括題目、發表時間、制訂機構、制訂方法等;② 方法學質量評價的關鍵要素;③ 報告質量評價的關鍵要素。
1.4 納入研究的質量評價
由4位評價員采用AGREE Ⅱ和RIGHT評價工具分別評價納入研究的方法學質量和報告質量。4位評價員均為艾滋病領域博士研究生,在評價前對所有評價者進行專業培訓,確保對每個條目的理解基本一致,評價標準相同。AGREE Ⅱ指南評價工具包括6個領域23個條目,每個條目分值為1~7分,完全符合條目要求的賦予7分,完全不符合的賦予1分,介于二者之間的根據不同情況給予2~6分[9],每部指南各領域標準化百分比的計算公式如下:各領域標準化百分比=(實際得分?可得最低分)/(可得最高分?可得最低分)×100%[10]。RIGHT標準共7個領域22條目,以“報告”、“部分報告”或“未報告”進行條目評價,分別對“報告”、“部分報告”和“未報告”賦值1、0.5和0分,最后匯總每一部指南的總得分[7]。
1.5 統計分析
描述性分析采用Excel軟件,數據分析采用SPSS 20.0統計軟件,計量資料采用秩和檢驗,所有假設檢驗的檢驗水準為α=0.05。采用SPSS 20.0軟件計算組內相關系數(intraclass correlation coefficient,ICC),對4名評價員AGREEⅡ工具各條目評價結果的一致性進行檢驗。若ICC≥0.80,說明一致性較好;若ICC<0.80,則需重新培訓評價員,使評價員對該條目理解趨于一致,并再次獨立評分,直至ICC≥0.80。
2 結果
2.1 文獻篩選流程及結果
初檢出相關文獻9 524篇,經逐層篩選后,最終納入成人艾滋病相關的臨床指南和共識17部。文獻篩選流程及結果見圖1。

*所檢索的數據庫及檢出文獻數具體如下:CBM(
2.2 納入研究的基本特征
納入研究的基本特征見表1,其中,共識7部(41.2%)[11-17],指南10部(58.8%)[18-27];個人發布2部(11.8%)[12,25],學會/協會發布15部(88.2%)[11,13-24,26-27];基于專家意見或綜述等制訂9部(53.0%)[11,13-15,17,19-21,25],基于循證醫學方法制訂8部(47.0%)[12,16,18,22-24,26,27];中國7部(41.2%)[13-17,20-21],國外10部(58.8%)[11-12,18-19,22-27];在應用類別方面,以治療指南為主,占64.7%(11部)[11,13-19,22,24-25],綜合類指南25.3%(6部)[12,20-21,23,26-27]。

2.3 納入研究方法學質量評價結果
4名評價員ICC值為0.939(>0.8),具有較好的一致性。各研究方法學質量評價結果見表2。

2.3.1 總體評價結果
① 范圍和目的:11部指南評分大于50%,絕大部分指南共識都不同程度地描述了該領域的3個部分內容,包括指南目的、涵蓋的臨床問題和指南的適用人群。AGREE Ⅱ評分的平均分分別為4.56、4.12和4.21。平均標準化百分比為59.48%,最高為94.44%[27],最低為15.28%[21]。該領域整體得分較高。
② 參與人員:有5部指南評分大于50%,該領域包含3個條目,涉及指南制訂人員、目標人群觀點和規定使用者。AGREE Ⅱ評分的平均分分別為3.40、1.97和4.04。平均標準化百分比為37.17%,最高為93.06%[27],最低為6.94%[15]。該領域整體得分較低,13部指南(13/17,76.47%)未提及目標人群(患者、公眾等)的觀點和選擇意愿。15部指南或專家共識(15/17,88.24%)對參與人員在指南制訂小組中的角色、學科專業、所在機構和地理位置等描述不全面。4部指南(4/17,23.53%)未明確規定指南的使用者。
③ 嚴謹性:僅有2部指南評分大于50%,該領域包含8個條目,是條目最多也是指南制訂最重要的部分,涉及:指南檢索證據的方法,選擇證據的標準,證據的強度和局限性,形成推薦意見的方法,對健康的益處、副作用以及危險,推薦建議和支持證據之間的聯系,發布前是否經過外部專家評審和更新步驟。AGREE Ⅱ評分的平均分為2.26、2.25、2.59、2.94、4.93、4.18、2.00和3.47。平均標準化百分比為30.76%,最高為92.71%[27],最低為4.17%[20]。該領域整體得分較低,除推薦意見對健康的益處、副作用、危險及推薦意見和支持證據之間的聯系2個條目闡述較為明確外,14部指南或共識(14/17,82.35%)沒有詳細描述檢索證據的方法和選擇證據的標準。3部英文和5部中文指南或共識(8/17,47.06%)未闡述形成推薦意見的方法。僅有2部英文指南[11,27]在發布前經過外部專家評審,有約半數指南未明確提及指南的更新步驟。
④ 清晰性:16部指南得分大于50%,該領域包含3個條目,AGREE Ⅱ評分的平均分為6.13、5.88和6.10。平均標準化百分比為74.75%,最高為95.83%[12],最低為38.89%[17]。該領域整體得分為6個領域最高,方法學質量最好,除2部指南[13,17]外,其他指南均對這3個條目進行了較為明確的闡述。
⑤ 應用性:6部指南評分大于50%,該領域包含4個條目,涉及指南應用時的促進和阻礙因素、提供應用推薦建議的意見和/或工具、應用時潛在的相關資源以及監督和/或審計標準。AGREE Ⅱ評分的平均分為3.76、3.90、4.01和3.90。平均標準化百分比為35.54%,最高為92.71%[27],最低為4.17%[14-15,20]。該領域整體得分中等偏下。約半數的指南未提及指南應用過程中的促進和阻礙因素、應用推薦建議的意見或工具,也未考慮應用推薦建議時潛在的資源投入問題,有11部指南(11/17,64.71%)不同程度提及了監督和審計標準。
⑥ 獨立性:約半數指南評分大于50%,該領域包含2個條目,涉及贊助單位的觀點對推薦意見的影響、指南開發小組成員的利益沖突。AGREE Ⅱ評分的平均分分別為4.72和5.19。平均標準化百分比為50.49%,最高為95.83%[27],最低為4.17%[12,13,15-18,20]。該領域整體得分中等偏上。有近半數(47.06%)說明了贊助單位的觀點對推薦意見沒有影響,7部指南(41.18%)未記錄和考慮制訂小組成員是否存在利益沖突。
2.3.2 亞組分析
不同條件分組下各亞組指南的AGREE Ⅱ各領域得分和比較情況見表3。指南類在清晰性、應用性和獨立性領域得分均較共識類高(P<0.05),基于循證醫學方法制訂的指南和共識較基于專家意見或綜述制訂的指南和共識在除獨立性領域外各領域得分均較高(P<0.05);國外指南和共識在在6個領域的得分均高于國內指南(P<0.05);AGREE Ⅱ發布前后、發布機構為個人或學會/協會在各領域得分差異無統計學意義。

2.4 報告質量評價結果
2.4.1 總體評價結果
根據RIGHT評價條目中報告率最高的為條目1a、1b、1c(100.00%),其次為條目3、4(94.12%),13a、13b(88.24%),7b、11a(76.47%),5(64.71%),其余條目報告率均在60%以下,未報告率最高的條目依次為17(88.24%),16(82.35%),10b、18b(70.59%),14a、15、19b(64.71%)(表4)。

2.4.2 亞組分析
指南較共識、基于循證制訂較基于專家意見或綜述制訂、國外指南共識較我國指南共識的RIGHT評分平均得分高且差異均具有統計學意義(P<0.05),而個人還是學會/協會發布的指南或共識的RIGHT評分平均得分比較差異無統計學意義(表5)。

3 討論
關于嚴謹性,本研究結果顯示,當前成人艾滋病指南在AGREEⅡ的6個領域中,得分最低的是嚴謹性領域(平均標準化百分比30.76%)。大部分指南或共識在制訂流程的嚴謹性方面有不同程度的欠缺,這會直接影響到推薦意見的可信程度和指導價值。分析原因,其一,可能符合循證要求的指南在制訂過程中方法學難度更高,需要投入的人力更多,對指南制訂工作組的專業能力和統籌能力要求也更高。其二,大部分指南在制訂方案的選題、設計、實施、質量控制等各關鍵環節缺乏方法學專家的指導。這可能與目前臨床醫學系統和基礎醫學系統明顯有關,多數學會組織及學術交流會議僅涵蓋本專業專家,不同領域及交叉學科之間的交流合作不足。其三,指南的使用者可能更重視指南推薦意見形成的結果,而非過程。
關于參與人員,納入的17部指南或共識在參與人員領域的平均標準化百分比為37.17%,近半數在制訂工作組成員規劃方面具有不足,除方法學專家參與不足以外,其他相關領域如流行病學、文獻學、統計學、衛生經濟學等領域專家及患者代表也少有參與。對于目標人群觀念和選擇意愿的征詢不足有悖于以患者為中心的醫療理念。
關于應用性,僅有6部指南在該領域的標準化百分比大于50%,大部分指南對于其在應用階段可能遇到的促進或阻礙因素評估不充分或完全未提及,也少有衛生經濟學方面的考量。若指南的推薦意見僅從理論角度出發,則可能會與應用區域的實際情況脫節,對政策制訂者的參考價值也可能隨之降低。不同地區的衛生服務水平、經濟水平、醫療資源、醫保政策等均會影響指南的具體應用,而指南制訂者對于該領域的重視程度尚有欠缺。
關于報告質量,RIGHT標準中未報告率最高的是條目17(質量保證),其次為條目14(外部評審)、條目10b(結局遴選和分類方法)、18b(資助者作用)。所納入研究的17部指南中有15部未提及質量保證和外部評審,RIGHT的評價結果與AGREEⅡ工具的評價結果一致,可見在指南制訂過程中的質量控制和在制訂結束后的外部同行評審往往被忽略。
針對以上不足,我們建議:① 指南制訂機構可考慮增加不同領域專家之間的交流機會,充分發揮機構的組織能力,合理規劃指南制訂的專家組成員,除臨床領域專家外,還需盡量涵蓋方法學、政策制訂、醫療機構管理、藥物供應等多領域專家,撰寫時應詳細記錄各專家的姓名、專業、機構、地理位置及在指南開發過程中的分工或貢獻。② 應在條件允許范圍內通過問卷調查、訪談或文獻綜述等方式對指南應用的目標人群進行調查,收集其觀點及選擇意愿,并在形成推薦意見時綜合考慮,同時進行相應描述。③ 應在指南或共識的嚴謹性方面更加關注,詳細描述文獻的檢索策略、納排標準、評估方法/工具,詳細介紹推薦意見的形成過程以及與支持證據之間的具體關系,指南發布之前應進行外部專家評審,并提供更新計劃。④ 在條件允許的情況下,應盡可能參考衛生經濟學證據,結合當地的衛生服務水平,對建議實施時可能的促進和阻礙因素、可能產生的費用進行描述。在撰寫指南時可考慮將推薦建議以便于查找和應用的方式形成附加文件或應用工具。⑤ 應如實記錄資助單位對指南觀點的影響情況及開發小組成員之間的利益沖突。
本研究的局限性:① 本研究所納入的指南是通過網絡數據庫檢索和相關指南網站檢索相結合,通過人工篩選的方式獲得。對于年代較久遠網絡上未能檢索到全文者,或僅在網站發布而未被數據庫收錄者可能有所遺漏,并且人工篩選存在一定主觀性。② 雖然已對評價員進行了方法學培訓和評價結果的一致性檢驗,但是評價結果依然存在個體主觀影響,存在偏倚風險。
綜上所述,國內成人艾滋病指南相對于國外在方法學上尚存在一定差距,建議嚴格遵照AGREEⅡ的要求進行指南開發,在參與人員、嚴謹性、應用性、獨立性方面進一步完善,提升指南質量,并根據國際實踐指南報告規范RIGHT的條目進行指南的撰寫,以免遺漏重要內容。