引用本文: 曾憲濤, 吳凡, 鄔蘭, 夏凌云, 冷衛東, 樊明文. 中國口腔醫學領域臨床實踐指南的循證評價. 中國循證醫學雜志, 2015, 15(3): 264-269. doi: 10.7507/1672-2531.20150046 復制
1990年,美國醫學研究所(Institute of Medicine,IOM)首次將臨床實踐指南(clinical practice guideline,CPG)定義為:系統開發的多組臨床指導意見,以協助臨床工作者和患者針對特定的臨床問題快速做出最恰當的處理決定 [1]。指南作為最常用的指導性文件,促進了衛生服務公平性,節省了政府衛生支出 [2]。近年來,美國、澳大利亞、新西蘭、荷蘭、英國、法國等國家在臨床指南開發方面取得了舉世矚目的成就 [3],國內指南的數量也在逐年增加 [4]。隨著生活水平的提高,口腔保健逐漸受到人們的重視,對口腔領域醫療衛生服務服務的也越來越高。相比其他領域 [4-6],口腔醫學領域尚缺乏對相關指南的循證評價。因此,本研究對國內口腔醫學領域的臨床實踐指南進行循證評價,旨在分析我國口腔醫學領域臨床實踐指南的現狀,為規范和制定我國口腔臨床指南提供參考。
1 資料與方法
1.1 納入與排除標準
納入:公開發表的、符合指南定義的文獻。必須為口腔醫學領域臨床實踐指南,由國內學術團體或行政部門制定并頒發。
排除:① 直接翻譯的國外指南;② 文件、講座或專家筆談;③ 知識手冊。
1.2 檢索策略
計算機檢索CNKI、CBM、VIP和WanFang Data,全面檢索我國口腔醫學領域截至2014年1月所發表的相關指南,檢索時間為2014年1月30日。采用主題詞“指南”、“規范”、“共識”、“口腔”、“牙”、“齒”、“正畸”、“修復”、“種植”、“粘膜”進行檢索。
同時,手工檢索《中華口腔醫學雜志》、《中華口腔正畸學雜志》、《華西口腔醫學雜志》、《實用口腔醫學雜志》、《牙體牙髓牙周病學雜志》、《上海口腔醫學》、《口腔醫學研究》、《臨床口腔醫學雜志》、《中國口腔頜面外科雜志》、《牙體牙髓牙周病學雜志》、《現代口腔醫學雜志》、《北京口腔醫學》、《國際口腔醫學雜志》、《口腔醫學》和《中國實用口腔醫學雜志》2013年1月至2014年1月間已發表的文獻。
此外,根據疾病分類法檢索中國臨床指南文庫(China Guideline Clearinghouse,CGC)(http://cgc.bjmu.edu.cn:820/)中“口頜疾病”的指南,并且檢索美國國家臨床指南中心National Guideline Clearinghouse(NGC)(http://www.guideline.gov/),按照排列順序隨機挑選5部循證制定的臨床指南。
CNKI限定領域為“醫藥衛生科技”,檢索策略為:(TI='指南' OR TI='共識' OR TI='規范') AND (TI='口腔' OR TI='牙' OR TI='齒' OR TI='正畸' OR TI='修復' OR TI='種植' OR TI='粘膜');
CBM的檢索策略為:("指南"[標題] OR "共識"[標題] OR "規范"[標題]) AND ("口腔"[標題] OR "牙"[標題] OR "齒"[標題] OR "正畸"[標題] OR "修復"[標題] OR "種植"[標題] OR "粘膜"[標題]);
VIP的檢索策略為:(M='指南' OR M='共識' OR M='規范') AND (M='口腔' OR M='牙' OR M='齒' OR M='正畸' OR M='修復' OR M='種植' OR M='粘膜');
WanFang Data的檢索策略為:(Title=指南 OR Title=共識 OR Title=規范) AND (Title=口腔 OR Title=牙 OR Title=齒 OR Title=正畸 OR Title=修復 OR Title=種植 OR Title=粘膜)
1.3 文獻篩選與資料提取
指南篩選由2名評價者獨立完成并交叉核對,分為題目、摘要篩選和全文篩選兩個階段。提取指南名稱、發表年份、發表機構、制定組織、制定方法、針對疾病和參考文獻等內容。
1.4 質量評價
在正式評分之前進行了2次預評分,并采用Kappa檢驗檢測一致性,確保2名評價者對每個條目的理解基本一致。
然后,由2名評價者運用AGREE Ⅱ質量評價工具 [7]對納入指南進行評價,按下述4步進行:① 對6個領域的23個條目進行評分;② 每個條目分數為1~7分,完全符合條目要求記7分,完全不符合記1分,介于兩者之間的根據評分者的判斷記2~6分;③ 一致性檢驗即計算2名評價者Kappa值;④ 根據AGREE Ⅱ公式計算得分:領域分值=(實際得分-最小可能得分)/(最大可能得分-最小可能得分)。
1.5 統計分析
分析分為5個層面:① 對發表年份進行統計圖表描述,比較各年份指南頒布的情況。② 對指南所針對的專業領域進行比較分析。③ 對AGREE Ⅱ質量評價結果進行分析。④ 對指南制定納入的參考文獻亦進行比較分析。⑤ 將納入分析的口腔臨床指南與上述5部國外的循證指南進行比較分析。
采用Excel 2007軟件進行描述性分析并呈現AGREE Ⅱ質量評價結果,采用SPSS 19.0軟件進行一致性檢驗。
2 結果
2.1 文獻檢索結果
初檢出相關文獻1 320篇,最終納入指南18部 [8-25],均由中華口腔醫學會及其下屬學術團體制定,分別發表在《中國口腔頜面外科雜志》和《中華口腔醫學雜志》上(表 1)。排除相關文章16篇,其中7篇 [26-32]是直接翻譯的國外指南,5篇 [33-37]為診療標準(非明確定義的指南),1篇 [38]為講座,1篇 [39]為重要文件,2篇 [40, 41]為知識手冊。文獻篩選流程及結果見圖 1。


2.2 納入指南的基本特征
2.2.1 納入參考文獻數目
參考文獻為指南的制定提供證據,其數量的多少能夠間接地反映一部指南質量的高低。從表 1可以看出,各指南納入參考文獻的數目多少不一,參考文獻最多的為45篇,有3篇指南沒有參考文獻,參考文獻少于20篇的占66.7%。
2.2.2 發表年份
最早的2部指南 [10, 13]發表于2005年,2009年1部 [9],2010年5部,2011年7部,2012年3部(圖 2)。

2.2.3 制定方法
臨床指南根據制定的方法主要分為基于專家共識和基于循證醫學證據兩類 [42]。當前這些指南全部是基于專家共識制定的,無循證指南。即專家個人的主觀意見所占比重較大,無足夠的證據作為支撐。
2.2.4 針對疾病
口腔疾病主要包括牙體牙髓病、牙周病、口腔黏膜病、畸形、口腔頜面外科疾病等。已發表的指南疾病的覆蓋面比較窄,主要針對部分口腔頜面外科疾病(圖 3)。

2.3 AGREE Ⅱ評分結果
所有指南條目的Kappa值均>0.80,一致性較好。
2.3.1 范圍和目的
此領域考察指南是否明確描述了總目的、所涵蓋的衛生問題和適用人群。納入的18篇指南該領域分值均高于50.0%,表明這些指南清晰地描述了范圍和目的描述,能夠幫助指南使用者快速了解該指南是否為自己所需。
2.3.2 參與人員
此領域考察了指南是否包括了所有相關專業的人員、是否收集了目標人群的觀點和選擇意愿、是否明確規定了指南的使用者。該領域平均分為40.1%,僅3篇指南的分值在50.0%以上。所有指南都未收集目標人群的觀點和選擇意愿。
2.3.3 嚴謹性
此領域考察指南制定過程中各步驟的嚴謹程度,包括應用系統方法檢索證據、清楚描述選擇證據的標準、清楚描述證據的強度和局限性、清楚描述形成推薦建議的方法、形成推薦建議時考慮了對健康的益處、副作用以及危險、推薦建議和支持證據之間有明確的聯系、指南在發布前經過外部專家評審、提供指南更新的步驟該領域得分較低,平均分僅28.8%。表明指南的制定過程不夠嚴謹,主觀因素影響較大。
2.3.4 清晰性
此領域考察指南推薦建議的表達是否明確。包括推薦建議明確、明確列出不同的選擇或衛生問題、容易識別重要的推薦建議,能夠幫助指南使用者更好地解決問題。該領域平均得分為71.5%,各指南得分均在50.0%以上,但幾乎所有指南針對同一疾病提供的選擇較少。
2.3.5 應用性
此領域考察指南制定后的實際應用情況,包括描述應用時的促進和阻礙因素、提供應用推薦建議的意見和/或工具、考慮推薦建議應用時潛在的相關資源、提供了監督和/或審計標準。該領域平均得分為42.6%,納入指南對于應用過程中的促進和阻礙因素描述均不明確。
2.3.6 獨立性
此領域考察指南制定過程中是否受其他因素的影響,包括贊助單位的觀點不影響指南的內容、指南開發小組成員的利益沖突要記載并公布。該領域得分最低,平均分僅為8.6%,所有指南均未提及贊助單位,僅6篇指南直接申明無任何利益沖突,余未具體說明。
2.4 與5部國外循證指南比較
選取的5部國外循證制定的指南 [42-47] AGREE Ⅱ評價結果見圖 4。與之相比,國內外口腔指南的整體水平較差,尤其在參與人員、嚴謹性、應用性、獨立性方面得分均<50.0%,質量有待進一步提高(圖 4)。

3 討論
3.1 口腔領域現有指南數量少且質量差
我國口腔領域臨床實踐指南起步晚,發展較慢,且疾病覆蓋面比較窄。根據2010年發布的全球疾病負擔,口腔健康問題已是全球疾病負擔之一 [48]。然而,除口腔頜面外科領域外,其他專業的指南仍然匱乏,如作為全球疾病負擔的牙周病 [49],就無相關的臨床指南。因此,指南的數量及關注的領域還遠遠不夠。
此外,從指南納入的參考文獻來看,全部指南納入參考文獻數目均少于循證指南要求的參考文獻條數。說明指南在制定過程中,搜集的證據較少,不能為所提出的觀點提供足夠有利的支持。這可能與國內口腔領域證據缺乏 [50]、無法基于本國證據制定有關,亦限制了指南的質量 [51]。
3.2 指南的應用不夠廣泛
臨床指南用于指導和規范臨床醫務人員的診療行為,是針對某一疾病最規范的治療方案。但使用臨床指南的口腔醫師較少。這一方面受指南本身質量的影響;另一方面,可能與指南制定時沒有考慮到不同層次醫療機構技術、設備的限制有關;第三,由于各種原因,某些地區醫生在臨床指南的獲取上也存在一定的困難;第四,還可能與口腔醫療衛生領域工作者缺乏循證評價文獻、開展循證診療決策的技能有關。
3.3 缺乏循證指南
盡管循證醫學 [52]已經傳入我國多年,但從分析結果來看,國內口腔領域仍未出現循證制定的實踐指南。前中國衛生部副部長、中國醫師協會會長殷大奎教授指出 [53]:“中國所有的醫療工作者都應該學習并在實踐中應用高質量的循證指南,這不僅可以促進中國國民健康,對全球人民的健康也意義重大”。因此,使用循證的思想來指導臨床已經成為了現代醫學發展的必然趨勢。
3.4 本研究的局限性
本研究具有以下局限性:① 采用的檢索策略可能無法全面地檢索到所有相關指南;② 研究團隊首次將AGREE Ⅱ指南質量評價工具用于實踐,對其中每一個條目的把握可能存在一定的偏倚;③ 可能有些中文指南發表于英文期刊,但本研究未行檢索,可能存在納入不全。因此,本調查結論可能存在偏倚,需要其他相關研究和數據進一步確證。
3.5 結論和建議
綜上所述,我們提出以下建議:① 作為口腔衛生保健領域工作者,既要積極開展臨床科研,生產本土化的證據;又要善于借鑒國外循證指南制定的方法和策略,結合我國國情,循證制定口腔領域臨床實踐指南。② 開展針對我國口腔醫師使用指南意識、習慣,以及循證診療決策實踐意識與能力的調查,以便為制定及傳播指南提供參考。③ 指南制定之初就應成立專門負責更新的團隊或帶頭人,并根據證據的更新每2年更新一次指南。④ 將成本-效益分析納入指南。
1990年,美國醫學研究所(Institute of Medicine,IOM)首次將臨床實踐指南(clinical practice guideline,CPG)定義為:系統開發的多組臨床指導意見,以協助臨床工作者和患者針對特定的臨床問題快速做出最恰當的處理決定 [1]。指南作為最常用的指導性文件,促進了衛生服務公平性,節省了政府衛生支出 [2]。近年來,美國、澳大利亞、新西蘭、荷蘭、英國、法國等國家在臨床指南開發方面取得了舉世矚目的成就 [3],國內指南的數量也在逐年增加 [4]。隨著生活水平的提高,口腔保健逐漸受到人們的重視,對口腔領域醫療衛生服務服務的也越來越高。相比其他領域 [4-6],口腔醫學領域尚缺乏對相關指南的循證評價。因此,本研究對國內口腔醫學領域的臨床實踐指南進行循證評價,旨在分析我國口腔醫學領域臨床實踐指南的現狀,為規范和制定我國口腔臨床指南提供參考。
1 資料與方法
1.1 納入與排除標準
納入:公開發表的、符合指南定義的文獻。必須為口腔醫學領域臨床實踐指南,由國內學術團體或行政部門制定并頒發。
排除:① 直接翻譯的國外指南;② 文件、講座或專家筆談;③ 知識手冊。
1.2 檢索策略
計算機檢索CNKI、CBM、VIP和WanFang Data,全面檢索我國口腔醫學領域截至2014年1月所發表的相關指南,檢索時間為2014年1月30日。采用主題詞“指南”、“規范”、“共識”、“口腔”、“牙”、“齒”、“正畸”、“修復”、“種植”、“粘膜”進行檢索。
同時,手工檢索《中華口腔醫學雜志》、《中華口腔正畸學雜志》、《華西口腔醫學雜志》、《實用口腔醫學雜志》、《牙體牙髓牙周病學雜志》、《上海口腔醫學》、《口腔醫學研究》、《臨床口腔醫學雜志》、《中國口腔頜面外科雜志》、《牙體牙髓牙周病學雜志》、《現代口腔醫學雜志》、《北京口腔醫學》、《國際口腔醫學雜志》、《口腔醫學》和《中國實用口腔醫學雜志》2013年1月至2014年1月間已發表的文獻。
此外,根據疾病分類法檢索中國臨床指南文庫(China Guideline Clearinghouse,CGC)(http://cgc.bjmu.edu.cn:820/)中“口頜疾病”的指南,并且檢索美國國家臨床指南中心National Guideline Clearinghouse(NGC)(http://www.guideline.gov/),按照排列順序隨機挑選5部循證制定的臨床指南。
CNKI限定領域為“醫藥衛生科技”,檢索策略為:(TI='指南' OR TI='共識' OR TI='規范') AND (TI='口腔' OR TI='牙' OR TI='齒' OR TI='正畸' OR TI='修復' OR TI='種植' OR TI='粘膜');
CBM的檢索策略為:("指南"[標題] OR "共識"[標題] OR "規范"[標題]) AND ("口腔"[標題] OR "牙"[標題] OR "齒"[標題] OR "正畸"[標題] OR "修復"[標題] OR "種植"[標題] OR "粘膜"[標題]);
VIP的檢索策略為:(M='指南' OR M='共識' OR M='規范') AND (M='口腔' OR M='牙' OR M='齒' OR M='正畸' OR M='修復' OR M='種植' OR M='粘膜');
WanFang Data的檢索策略為:(Title=指南 OR Title=共識 OR Title=規范) AND (Title=口腔 OR Title=牙 OR Title=齒 OR Title=正畸 OR Title=修復 OR Title=種植 OR Title=粘膜)
1.3 文獻篩選與資料提取
指南篩選由2名評價者獨立完成并交叉核對,分為題目、摘要篩選和全文篩選兩個階段。提取指南名稱、發表年份、發表機構、制定組織、制定方法、針對疾病和參考文獻等內容。
1.4 質量評價
在正式評分之前進行了2次預評分,并采用Kappa檢驗檢測一致性,確保2名評價者對每個條目的理解基本一致。
然后,由2名評價者運用AGREE Ⅱ質量評價工具 [7]對納入指南進行評價,按下述4步進行:① 對6個領域的23個條目進行評分;② 每個條目分數為1~7分,完全符合條目要求記7分,完全不符合記1分,介于兩者之間的根據評分者的判斷記2~6分;③ 一致性檢驗即計算2名評價者Kappa值;④ 根據AGREE Ⅱ公式計算得分:領域分值=(實際得分-最小可能得分)/(最大可能得分-最小可能得分)。
1.5 統計分析
分析分為5個層面:① 對發表年份進行統計圖表描述,比較各年份指南頒布的情況。② 對指南所針對的專業領域進行比較分析。③ 對AGREE Ⅱ質量評價結果進行分析。④ 對指南制定納入的參考文獻亦進行比較分析。⑤ 將納入分析的口腔臨床指南與上述5部國外的循證指南進行比較分析。
采用Excel 2007軟件進行描述性分析并呈現AGREE Ⅱ質量評價結果,采用SPSS 19.0軟件進行一致性檢驗。
2 結果
2.1 文獻檢索結果
初檢出相關文獻1 320篇,最終納入指南18部 [8-25],均由中華口腔醫學會及其下屬學術團體制定,分別發表在《中國口腔頜面外科雜志》和《中華口腔醫學雜志》上(表 1)。排除相關文章16篇,其中7篇 [26-32]是直接翻譯的國外指南,5篇 [33-37]為診療標準(非明確定義的指南),1篇 [38]為講座,1篇 [39]為重要文件,2篇 [40, 41]為知識手冊。文獻篩選流程及結果見圖 1。


2.2 納入指南的基本特征
2.2.1 納入參考文獻數目
參考文獻為指南的制定提供證據,其數量的多少能夠間接地反映一部指南質量的高低。從表 1可以看出,各指南納入參考文獻的數目多少不一,參考文獻最多的為45篇,有3篇指南沒有參考文獻,參考文獻少于20篇的占66.7%。
2.2.2 發表年份
最早的2部指南 [10, 13]發表于2005年,2009年1部 [9],2010年5部,2011年7部,2012年3部(圖 2)。

2.2.3 制定方法
臨床指南根據制定的方法主要分為基于專家共識和基于循證醫學證據兩類 [42]。當前這些指南全部是基于專家共識制定的,無循證指南。即專家個人的主觀意見所占比重較大,無足夠的證據作為支撐。
2.2.4 針對疾病
口腔疾病主要包括牙體牙髓病、牙周病、口腔黏膜病、畸形、口腔頜面外科疾病等。已發表的指南疾病的覆蓋面比較窄,主要針對部分口腔頜面外科疾病(圖 3)。

2.3 AGREE Ⅱ評分結果
所有指南條目的Kappa值均>0.80,一致性較好。
2.3.1 范圍和目的
此領域考察指南是否明確描述了總目的、所涵蓋的衛生問題和適用人群。納入的18篇指南該領域分值均高于50.0%,表明這些指南清晰地描述了范圍和目的描述,能夠幫助指南使用者快速了解該指南是否為自己所需。
2.3.2 參與人員
此領域考察了指南是否包括了所有相關專業的人員、是否收集了目標人群的觀點和選擇意愿、是否明確規定了指南的使用者。該領域平均分為40.1%,僅3篇指南的分值在50.0%以上。所有指南都未收集目標人群的觀點和選擇意愿。
2.3.3 嚴謹性
此領域考察指南制定過程中各步驟的嚴謹程度,包括應用系統方法檢索證據、清楚描述選擇證據的標準、清楚描述證據的強度和局限性、清楚描述形成推薦建議的方法、形成推薦建議時考慮了對健康的益處、副作用以及危險、推薦建議和支持證據之間有明確的聯系、指南在發布前經過外部專家評審、提供指南更新的步驟該領域得分較低,平均分僅28.8%。表明指南的制定過程不夠嚴謹,主觀因素影響較大。
2.3.4 清晰性
此領域考察指南推薦建議的表達是否明確。包括推薦建議明確、明確列出不同的選擇或衛生問題、容易識別重要的推薦建議,能夠幫助指南使用者更好地解決問題。該領域平均得分為71.5%,各指南得分均在50.0%以上,但幾乎所有指南針對同一疾病提供的選擇較少。
2.3.5 應用性
此領域考察指南制定后的實際應用情況,包括描述應用時的促進和阻礙因素、提供應用推薦建議的意見和/或工具、考慮推薦建議應用時潛在的相關資源、提供了監督和/或審計標準。該領域平均得分為42.6%,納入指南對于應用過程中的促進和阻礙因素描述均不明確。
2.3.6 獨立性
此領域考察指南制定過程中是否受其他因素的影響,包括贊助單位的觀點不影響指南的內容、指南開發小組成員的利益沖突要記載并公布。該領域得分最低,平均分僅為8.6%,所有指南均未提及贊助單位,僅6篇指南直接申明無任何利益沖突,余未具體說明。
2.4 與5部國外循證指南比較
選取的5部國外循證制定的指南 [42-47] AGREE Ⅱ評價結果見圖 4。與之相比,國內外口腔指南的整體水平較差,尤其在參與人員、嚴謹性、應用性、獨立性方面得分均<50.0%,質量有待進一步提高(圖 4)。

3 討論
3.1 口腔領域現有指南數量少且質量差
我國口腔領域臨床實踐指南起步晚,發展較慢,且疾病覆蓋面比較窄。根據2010年發布的全球疾病負擔,口腔健康問題已是全球疾病負擔之一 [48]。然而,除口腔頜面外科領域外,其他專業的指南仍然匱乏,如作為全球疾病負擔的牙周病 [49],就無相關的臨床指南。因此,指南的數量及關注的領域還遠遠不夠。
此外,從指南納入的參考文獻來看,全部指南納入參考文獻數目均少于循證指南要求的參考文獻條數。說明指南在制定過程中,搜集的證據較少,不能為所提出的觀點提供足夠有利的支持。這可能與國內口腔領域證據缺乏 [50]、無法基于本國證據制定有關,亦限制了指南的質量 [51]。
3.2 指南的應用不夠廣泛
臨床指南用于指導和規范臨床醫務人員的診療行為,是針對某一疾病最規范的治療方案。但使用臨床指南的口腔醫師較少。這一方面受指南本身質量的影響;另一方面,可能與指南制定時沒有考慮到不同層次醫療機構技術、設備的限制有關;第三,由于各種原因,某些地區醫生在臨床指南的獲取上也存在一定的困難;第四,還可能與口腔醫療衛生領域工作者缺乏循證評價文獻、開展循證診療決策的技能有關。
3.3 缺乏循證指南
盡管循證醫學 [52]已經傳入我國多年,但從分析結果來看,國內口腔領域仍未出現循證制定的實踐指南。前中國衛生部副部長、中國醫師協會會長殷大奎教授指出 [53]:“中國所有的醫療工作者都應該學習并在實踐中應用高質量的循證指南,這不僅可以促進中國國民健康,對全球人民的健康也意義重大”。因此,使用循證的思想來指導臨床已經成為了現代醫學發展的必然趨勢。
3.4 本研究的局限性
本研究具有以下局限性:① 采用的檢索策略可能無法全面地檢索到所有相關指南;② 研究團隊首次將AGREE Ⅱ指南質量評價工具用于實踐,對其中每一個條目的把握可能存在一定的偏倚;③ 可能有些中文指南發表于英文期刊,但本研究未行檢索,可能存在納入不全。因此,本調查結論可能存在偏倚,需要其他相關研究和數據進一步確證。
3.5 結論和建議
綜上所述,我們提出以下建議:① 作為口腔衛生保健領域工作者,既要積極開展臨床科研,生產本土化的證據;又要善于借鑒國外循證指南制定的方法和策略,結合我國國情,循證制定口腔領域臨床實踐指南。② 開展針對我國口腔醫師使用指南意識、習慣,以及循證診療決策實踐意識與能力的調查,以便為制定及傳播指南提供參考。③ 指南制定之初就應成立專門負責更新的團隊或帶頭人,并根據證據的更新每2年更新一次指南。④ 將成本-效益分析納入指南。