1996 年 Fleming 提出循證病理學(evidence-based pathology,EBP)的概念。近年來 EBP 在疾病的診斷及預后方面均有較多研究,但發展尚存局限與挑戰,目前國內 EBP 發展才剛起步。本文回顧 EBP 的歷史,介紹最新研究進展和主要應用范圍,分析當前 EBP 發展的機遇與挑戰,進而提出建議。
引用本文: 賀婷婷, 閆沛靜, 楊克虎, 張敏. 循證病理學. 中國循證醫學雜志, 2020, 20(10): 1214-1220. doi: 10.7507/1672-2531.202006140 復制
當今醫學科學發展迅速,計算機、生物化學、分子檢測技術等與病理學的結合帶來革命性的變化[1-3],但特有的診斷主觀性仍制約著病理學的發展[4]。循證醫學提出不應單純以經驗、直覺,而是以證據作為臨床決策的基礎[5],為病理學帶來了新的思路與研究方法,被率先用于識別病理圖像的再現性[6]。
至今循證科學方法已在國際上被廣泛用于病理學的各個領域,如研究病理學指標與預后的關系[7]、優化疾病分類[8]、優化腫瘤分級分期[9]等。可見,循證病理學(evidence-based pathology,EBP)已不局限于將循證的概念及方法運用到診斷過程的范疇。近年來,國際上陸續誕生疾病的診斷[10-12]、分子標記物的應用[13, 14]、新型成像技術的應用[15]等各種病理指南。有關病理學各個領域的高質量 Meta 分析也層出不窮[7, 9, 16-18],可見國外在 EBP 方面的應用已有一定的積累。雖然我國研究人員做了不少病理學方面的 Meta 分析[19-23],但至今僅有 2 個研究較系統地介紹了 EBP,一篇從實踐應用角度分析[24],另一篇以講座的形式對截止 2012 年 EBP 的定義、原理和應用范圍進行簡單介紹[25]。因此本文總結國際近年來關于 EBP 的研究進展、機遇與挑戰,以期為國內 EBP 深化發展提供參考依據。
1 EBP 發展的機遇
近年來,循證醫學強調臨床決策基于當前最佳臨床證據的思維克服了經驗醫學模式的局限性[5, 26],其理念、思想和方法已經廣泛應用于醫學各個領域[27-30],以及管理、教育等社會科學研究領域[31, 32]。病理學,尤其是診斷解剖病理學長期作為臨床推理的決定性“證據”,在循證醫學的道路上發展相對緩慢,但隨著近年來技術的不斷革新和診斷方式的改變,應用于細胞學和組織標本的新技術在發展過程和臨床樣本分析中均需要循證醫學的方法和理念[33]。Meta 分析作為循證醫學最常用的分析方法,目前已經對許多科學領域產生了革命性影響[34],而最新的網狀 Meta 分析技術也為 EBP 發展帶來新的機遇[35, 36]。
基于循證理念,系統檢索、評價現有文獻證據;當研究的異質性可接受時進行證據合并,進而明確疾病的診斷一致性,減少甚至避免由病理醫師主觀性導致的診斷過失;當異質性較大,則采用分層分析等循證方法探索異質性來源,從而為后期的研究提供參考意見,提高診斷的一致性。GRADE 系統針對診斷測試提出的證據質量和建議強度的分級方法[37]可以指導病理醫師評價文獻證據的質量。STARD 計劃針對診斷準確性研究報告提出的清單與流程[38]進一步提升了診斷方面基礎研究的報告質量。循證診斷學的發展為 EBP 診斷測試部分提供了方法學支持,如診斷試驗數據提取研究[39]為 EBP 的發展奠定了基礎。分子病理學近年來發展迅速,病理學從單純的診斷發展到為臨床預后和治療提供指導,相關臨床研究日益增多,為 EBP 研究提供了診斷、預后和治療方面的證據,使 EBP 不局限于診斷領域,在疾病預后和治療方面也有迅速發展[7, 17, 40, 41],甚至形成復雜生物標志物的決策支持系統[42]。
此外,近年來信息技術在病理學的應用為 EBP 的發展提供了條件,全載玻片成像掃描(whole slide imaging,WSI)技術突破了傳統顯微鏡的限制,使原始圖像證據更易于存儲、管理和共享[43]。此外,人工智能對于數字玻片的解讀解決人類視覺掃描的主觀性與難以察覺的信息的局限,同時提高可重復性,進而提高證據的信度(一致性、穩定性和可靠性)和效度[43, 44](有效性和正確性),推動了 EBP 的發展。
2 EBP 的起源與發展
1992 年,Guyatt 提出循證醫學概念,建議不應依賴直覺、非系統的臨床經驗,而強調對臨床研究證據進行整合[5]。然而圖像診斷的特點使病理學診斷在一定程度上依賴直覺與經驗。針對細胞病理學的診斷主觀性,1996 年 Fleming 將循證醫學與病理學結合,首次提出 EBP,并指出病理醫師在重復識別和量化某些形態特征的一致性尚不足,導致此類病理特征的判斷不能有效指導甚至誤導臨床,因此鼓勵細胞病理學進行“循證”[6]。2002 年,Fleming 在此基礎上指出病理的取材、診斷以及報告發放都應采用循證醫學的方法規范管理[45]。Marchevsky 于 2004 年提到在分子病理與其它新技術(如蛋白質組學)的發展背景下,病理學應與循證醫學、醫療決策分析結合[46],并于 2016 年采用 IBM Watson 分析軟件作為示范預測了肺類癌患者的預后并討論了其潛在應用,指出將數據挖掘與預測分析結合才是 EBP 的大勢所趨[47]。至今,隨著病理指南及病理學領域高質量系統評價/Meta 分析的不斷誕生,EBP 提倡采用系統評價從科學文獻中獲取證據,嚴格評估每個證據的質量,并對現有證據進行“分級”,再將獲取的最佳證據集入證據摘要中供病理醫師參考使用[48]。臨床病理醫師已能在自身豐富的專業知識與診斷經驗基礎上,參考最佳證據并衡量患者的利弊得失后做出最后決策。另外免疫組織化學技術及各項分子技術作為病理學開展循證方法的重要載體,不僅能為診斷提供依據,而且基于對分子層面發病機制的認知,能夠形成針對單個患者靶向治療所依據的最高質量證據[33],使病理學決策能妥善地考慮患者個人差異。
2003 年,EBP 概念首次被引入國內,指出病理學指標在疾病預后評估、指導治療及在疾病分類、病理學特征的描述和病理技術評估方面均應采用循證理念和方法[24]。2012 年陳俊穎等[25]簡要介紹了 EBP 的概念、原則、應用范疇,并提出 EBP 應被引入病理工作的其它環節,如標本接收、取材、制片、報告發放等。目前我國在 EBP 領域也已取得不少成果,包括研究病理指標診斷效能[49, 50]、分子標記物預后價值[51]等。
3 EBP 的應用及其意義
3.1 明確診斷的再現性、病理技術的診斷性能
EBP 要求確保產生結果的各個環節都基于已被證實具有良好重復性的標準[45],其中病理診斷的可重復性是關鍵,這也是病理學為臨床提供診斷服務的精髓所在。病理診斷在臨床實踐中一直作為“金標準”,這基于假設病理學診斷具有良好的可重復性[45]。但事實上,病理學家之間甚至病理學家自身對許多疑難疾病或對部分基礎病理表現的診斷與解釋均存在不一致。這種不一致在系統評價出現之前難以被病理學家注意或被認為無法避免,但只有在病理學家能可靠、可重復地識別和量化某種形態學特征,討論其與臨床的相關性時,病理學診斷才有臨床意義[6]。
Fleming 首次提出采用 Kappa 評分驗證不同觀察者對病理診斷的一致性[6]。Stoler 研究了多位訓練有素的觀察者之間對于各種類型宮頸標本的解讀差異,結果表明有相當一部分疾病的診斷可重復性較弱,提示病理學家的診斷應遵循更為嚴格、統一,且被驗證具有良好重復性的指導原則或疾病分類[52]。Hodgson 通過評估兩種不同的宮頸腺癌分類標準在觀察者間的重現性,從而指導病理學家使用更合理的分類標準[53]。目前敏感性、特異性、預測值、似然比、優勢比、貝葉斯定理、ROC 曲線、Kappa 統計量等已經成熟用于診斷性試驗的 Meta 分析[54-57]。國內學者已制訂了診斷循證指南的制訂規范[58],并開展診斷準確性 Meta 分析的方法研究[39],這些方法也逐漸應用于 EBP。除了主觀性診斷的再現性問題,各種技術的診斷性能也是近年來 EBP 研究的一大熱點。如 Katsoula 等納入 12 個研究(6 204 例參與者)對糞便免疫化學測試診斷結腸直腸癌高危患者的診斷敏感性、特異性等診斷效能指標進行 Meta 分析[59]。
在系統評價某種疾病的診斷重復性或某種技術的診斷性能以前,病理醫師無法判斷其診斷標準是否真實有效,僅憑理論與經驗做的決策將會導致許多醫療錯誤,而醫療錯誤不僅浪費醫療資源,還會給患者造成無法挽回的損失[60]。基于循證理念,結合各種統計學工具,匯總最佳證據,可明確診斷的再現性問題,能夠檢驗各種技術的診斷性能,基于證據選擇性地淘汰重復性差的診斷方式,而保留性能良好的、結合個體患者的病理標本或實驗室檢測結果用于臨床診斷。
3.2 評估病理指標的診斷預后性能,指導臨床管理
近年來,病理學尤其是分子病理學的蓬勃發展極大地影響了病理診斷實踐和實驗室工作流程,新的基因療法的應用對病理學提出了更高要求,病理報告需要提供更多影響或直接決定臨床決策的信息[2],如推薦適用于結腸直腸癌患者的分子生物標志物[61]、指導肺癌患者的靶向酪氨酸激酶抑制劑治療的分子檢測[62]等。但由于評估基因檢測臨床效用的標準尚在發展中,檢測目標定義尚不清,缺乏有效的治療措施,也無較好的證據支持決策[33],因此病理學需要尋求最佳證據以指導臨床,具體表現為評估病理學指標為疾病提供診斷預后的性能并采用分子生物標志物指導治療,尤其在腫瘤方面的應用尤為廣泛[7, 17, 19, 20, 40, 63]。
對一種分子檢測物或藥物的開發必須有嚴謹的臨床證據支持,早在 1998 年,就有學者采用 Meta 分析評價血清 CA-125 對子宮內膜異位癥的診斷價值[64]。2011 年 Leo 等進行 Meta 分析評估了 HER2 和 TOP2A 預測早期乳腺癌患者對蒽環類藥物治療反應的性能,結論表明 HER2 和 TOP2A 在蒽環類藥物治療反應性方面具有一定預測價值[40]。Berry 等通過分析多個研究中急性淋巴細胞白血病患者微小殘留病 MRD 狀態與復發和死亡率的關系評估誘導治療的有效率,對提高臨床試驗效率,加速藥物開發大有裨益[65]。
除指導分子標志物應用與開發新型治療方法,EBP 還可糾正分子標志物指導臨床的相關醫療錯誤。如系統評價 c-erbB-2 在乳腺癌中的臨床應用,得出不應使用 c-erbB-2 狀態來確定女性是否接受輔助性全身治療的結論[66]。2017 年,Sekhar 等發現近幾年的臨床研究中肛門鱗狀細胞癌患者淋巴結陽性的比例可能被高估,在腫瘤學中引入新的分期技術可能會增加過度治療的風險[16]。關于分子標志物或其它病理學指標的預后功能的研究是近年來相對熱門的部分,通過綜合多方面文獻證據,可更準確地判定一種分子標記物是否適用于某種疾病的預后、生存分析,且能基于當前證據剔除沒有臨床意義的指標,避免醫療資源浪費。
3.3 優化疾病分類和腫瘤分級分期
疾病分類、腫瘤分級分期一直基于病理學。有研究證明某些疾病在指南中的分類與實際情況不匹配[67],急需對證據和指南進行更新,近年來關于優化疾病分類尤其是腫瘤分級分期的研究層出不窮。2013 年一個回顧性隊列研究提出了一種用于皮膚鱗狀細胞癌的替代性腫瘤分期系統,擬議的替代性腫瘤分期系統通過對 T2 期腫瘤進行分層,可以改善預后判斷[68]。2014 年 Schmitt 等進行了一個 Meta 分析,通過比較 AJCC 分期與替代分期系統的陽性前哨淋巴結活檢結局,證明了這種替代分期系統可以更精確地描繪 T2b 類別的高危病變,并指出未來的前瞻性研究對于驗證腫瘤分期與陽性 SLNB 結果之間的關系以及確定最佳分期系統是必要的[9]。采用可靠的文獻資料評價現有指南標準是否經得起實踐考驗是有必要的,通過分析不同疾病分類或是腫瘤分期分級指南在臨床應用的有效性,為臨床提供或優化最能體現預后或是最能精確描繪疾病特征的指南,避免在臨床實踐中盲目操作。
3.4 優化病理技術
切片的質量決定診斷質量,而切片質量取決于病理技術,其中病理取材的方式、數目、深淺等因素嚴重影響著診斷的準確性[69]。通過比較大樣本人群中不同取材技術方法對于診斷的影響,可以選出最準確、最合適的取材方法。如 2014 年 Arbyn 等進行了一個 Meta 分析,在 154 556 例女性中評估了 HPV 檢測中自行采集的樣本與臨床醫生采集的樣本,結果表明自行采集樣本的敏感性和特異性均低于臨床醫生抽取的樣品,由此認為在進行 HPV 篩查時,應建議由臨床醫生取樣,但對于未參加常規篩查計劃的婦女,可建議自我采樣進行 HPV 檢測,以提高篩查覆蓋率[70]。Korevaar 等分析了在非小細胞肺癌患者中進行縱隔淋巴結分期時,結合使用支氣管內超聲引導下經支氣管穿刺抽吸和經食管超聲內鏡引導下細針穿刺的診斷準確性,結果顯示結合使用支氣管內超聲引導下經支氣管穿刺抽吸顯著提高了檢測縱隔淋巴結轉移的敏感性,從而減少了采用縱膈鏡或胸腔鏡手術這些費用昂貴且侵入性強的分期方式[71]。
除取材方式,取材部位、數量、深淺制訂也需要依賴循證方法,如關于腫瘤分期淋巴結的取樣數量[72],有相關證據表明增加淋巴結取樣會影響分期[73],但仍存在相反的證據[74-76],顯然取樣過多過少都不可能是正確的[45],但這方面的相關循證研究仍較少。在大部分病理學家都將關注點放在切片的診斷準確度上時,對于標本的制備質量的研究通常被忽略,故更多開展這方面的研究是有必要的。通過整合文獻證據,比較制片過程中的不同技術、方法,開發更可靠的技術設備或方法,可保證切片質量,減少病理醫師的診斷失誤并減少資源浪費,不同環境下的樣本收集也減少了因操作環境、操作者帶來的偏倚,從而用科學的方式做出科學的決策。
3.5 結合信息技術推動數字病理學發展
EBP 發展史中具有前景但尚未廣泛普及的一部分是信息技術的應用與數字病理學的發展。如 Marchevsky 將數據挖掘與預測分析相結合,使用 IBM Watson 分析軟件評估和預測 101 例已確定 Ki-67 指數的典型和非典型肺癌患者的預后,并用該系統獲得的結果與使用常規統計和專業統計學家的報告所得到的結果進行比較,結果表明這些統計結果與使用常規統計工具獲得的統計結果類似,但速度要更快,且節約人力[47]。深度學習屬于機器學習領域的一個分支,其中深度學習視覺領域就在準確處理復雜醫學圖像方面有所體現[77]。Bejnordi 等評估了自動深度學習算法在檢測乳腺癌患者淋巴結蘇木精和伊紅染色組織切片轉移方面的性能,并將其與病理學家的診斷結果進行比較,結果深度學習算法比病理學家組成的小組獲得了更好的診斷性能[78]。最近的一個 Meta 分析研究了深度學習算法在分割視網膜圖像方面的靈敏度和特異性[18]。另一個重要的技術是 WSI 技術,Hanna 等比較了傳統顯微鏡與 WSI 技術在圖像報告的準確性與效率,表明 WSI 在臨床工作量與診斷準確性方面與常規顯微鏡相當,但其效率還有待提高[79]。即使 WSI 技術還不成熟,但不可否認數字切片的應用解決了病理圖像證據采集不全以及保存不易的困難[43],而人工智能在病理診斷預后方面的應用可有效避免人為因素導致的診斷失誤,其產生的臨床證據也更可信。人工智能與病理學交叉結合將成為新時代科技發展背景下的先進診斷技術手段,應進行更深入、更科學的研究。
4 EBP 發展的挑戰
雖然循證醫學在病理學的應用很多,但由于病理學科的特殊性,還是存在局限性。首先,樣本數目的限制導致關于解剖病理學的證據還停留在病例報告系列[80]與專家意見這類研究設計中,而這些恰好都處于證據結構的金字塔底端[4]。第二,病理學證據是由大量可視化的圖形內容建造的,人的主觀性可能使得在圖像解釋與管理方面做不到統一,導致有些證據的傳播沒有可信度,甚至會起誤導作用。第三,目前關于石蠟切片或冰凍切片質量控制方面的研究較少,如標本固定、浸蠟、包埋、切片和染色固封等過程。切片質量是病理學科很重要一環,直接影響到病理醫師的診斷,不應被忽視[81]。第四,由于人工智能尚未廣泛應用,關于其性能的研究證據很有限。第五,在病理學文獻中存在一些方法學缺陷,如診斷標準沒有明確定義,缺乏疾病特異性的隨訪數據來驗證檢測預后價值等[48]。
5 EBP 發展方向與建議
5.1 EBP 重點發展方向
推動 EBP 的深化發展需要在以下幾個方面予以重點關注:① 增加證據來源,提高證據質量,規范基礎研究設計;② 統一病理圖像證據的文字解釋,便于管理與傳播;③ 促進基層病理醫師的科研動力,做到物盡其用,避免資源浪費;④ 有效采用文獻資料,規范循證知識。
5.2 推進 EBP 發展的建議
面對 EBP 目前遇到的機遇與挑戰,病理學家一要有前瞻意識,進一步提升病理學科的工作質量,二要在限制病理證據升級的諸多問題中挖掘可行之道。
5.2.1 充分采用基層樣本,增加證據來源
針對樣本不足這一缺陷,病理學家應當深挖原因,除了疾病罕見的因素,是否做到了標本的物盡其用,如許多庫存多年的標本未被充分用于科研工作,在不影響病人診斷治療且經過患者同意的情況下,將封存的標本充分采用;或成立專項科研組在住院患者中募集志愿者病人,在符合倫理及相關規定的前提下,充分提高樣本利用率,讓證據級別不僅限于病例系列與專家意見。
5.2.2 統一標準,規范管理
針對大量以圖像為單位的證據資料,病理學會應當組織專家小組統一并細化疑難、交界性疾病甚至一些常見但標準參差不及的疾病的形態學特征,以便于在圖形解釋方面達到基本一致,才能使證據趨于規范,這是病理圖像證據能夠在世界范圍內能夠傳播的前提。其次,應當開發信息技術在證據管理方面的應用,具體操作方式還有待挖掘。
5.2.3 充分應用已有證據
面對繁雜的文獻信息,病理醫師或科研人員應充分應用文獻資料、鑒別文獻質量、系統規范的利用匯總的最佳證據解決實際問題。
總之,EBP 已取得一定成就:① 通過系統評價/Meta 分析為病理學領域創造了高質量的證據[9, 40, 51, 59],進而供臨床工作者借鑒使用;② 循證理念可不斷推動病理診斷方法的研發[82-84],也在很大程度優化病理學的操作流程[85, 86]。雖然在證據質量與級別方面,病理學與臨床學科有差距,但信息技術與分子病理的發展為病理學科圖像證據的判斷與管理開創了一片天地,促使 EBP 能跳出傳統病理診斷范疇,應用于疾病預后、指導精準治療等。病理學家在不放棄傳統經驗的基礎上,應該將目光聚焦到病理學與新技術、新知識的融合,基于高質量證據的 EBP 才能為臨床提供可信度較高的診斷結果及有效可靠的檢測技術與應用。
當今醫學科學發展迅速,計算機、生物化學、分子檢測技術等與病理學的結合帶來革命性的變化[1-3],但特有的診斷主觀性仍制約著病理學的發展[4]。循證醫學提出不應單純以經驗、直覺,而是以證據作為臨床決策的基礎[5],為病理學帶來了新的思路與研究方法,被率先用于識別病理圖像的再現性[6]。
至今循證科學方法已在國際上被廣泛用于病理學的各個領域,如研究病理學指標與預后的關系[7]、優化疾病分類[8]、優化腫瘤分級分期[9]等。可見,循證病理學(evidence-based pathology,EBP)已不局限于將循證的概念及方法運用到診斷過程的范疇。近年來,國際上陸續誕生疾病的診斷[10-12]、分子標記物的應用[13, 14]、新型成像技術的應用[15]等各種病理指南。有關病理學各個領域的高質量 Meta 分析也層出不窮[7, 9, 16-18],可見國外在 EBP 方面的應用已有一定的積累。雖然我國研究人員做了不少病理學方面的 Meta 分析[19-23],但至今僅有 2 個研究較系統地介紹了 EBP,一篇從實踐應用角度分析[24],另一篇以講座的形式對截止 2012 年 EBP 的定義、原理和應用范圍進行簡單介紹[25]。因此本文總結國際近年來關于 EBP 的研究進展、機遇與挑戰,以期為國內 EBP 深化發展提供參考依據。
1 EBP 發展的機遇
近年來,循證醫學強調臨床決策基于當前最佳臨床證據的思維克服了經驗醫學模式的局限性[5, 26],其理念、思想和方法已經廣泛應用于醫學各個領域[27-30],以及管理、教育等社會科學研究領域[31, 32]。病理學,尤其是診斷解剖病理學長期作為臨床推理的決定性“證據”,在循證醫學的道路上發展相對緩慢,但隨著近年來技術的不斷革新和診斷方式的改變,應用于細胞學和組織標本的新技術在發展過程和臨床樣本分析中均需要循證醫學的方法和理念[33]。Meta 分析作為循證醫學最常用的分析方法,目前已經對許多科學領域產生了革命性影響[34],而最新的網狀 Meta 分析技術也為 EBP 發展帶來新的機遇[35, 36]。
基于循證理念,系統檢索、評價現有文獻證據;當研究的異質性可接受時進行證據合并,進而明確疾病的診斷一致性,減少甚至避免由病理醫師主觀性導致的診斷過失;當異質性較大,則采用分層分析等循證方法探索異質性來源,從而為后期的研究提供參考意見,提高診斷的一致性。GRADE 系統針對診斷測試提出的證據質量和建議強度的分級方法[37]可以指導病理醫師評價文獻證據的質量。STARD 計劃針對診斷準確性研究報告提出的清單與流程[38]進一步提升了診斷方面基礎研究的報告質量。循證診斷學的發展為 EBP 診斷測試部分提供了方法學支持,如診斷試驗數據提取研究[39]為 EBP 的發展奠定了基礎。分子病理學近年來發展迅速,病理學從單純的診斷發展到為臨床預后和治療提供指導,相關臨床研究日益增多,為 EBP 研究提供了診斷、預后和治療方面的證據,使 EBP 不局限于診斷領域,在疾病預后和治療方面也有迅速發展[7, 17, 40, 41],甚至形成復雜生物標志物的決策支持系統[42]。
此外,近年來信息技術在病理學的應用為 EBP 的發展提供了條件,全載玻片成像掃描(whole slide imaging,WSI)技術突破了傳統顯微鏡的限制,使原始圖像證據更易于存儲、管理和共享[43]。此外,人工智能對于數字玻片的解讀解決人類視覺掃描的主觀性與難以察覺的信息的局限,同時提高可重復性,進而提高證據的信度(一致性、穩定性和可靠性)和效度[43, 44](有效性和正確性),推動了 EBP 的發展。
2 EBP 的起源與發展
1992 年,Guyatt 提出循證醫學概念,建議不應依賴直覺、非系統的臨床經驗,而強調對臨床研究證據進行整合[5]。然而圖像診斷的特點使病理學診斷在一定程度上依賴直覺與經驗。針對細胞病理學的診斷主觀性,1996 年 Fleming 將循證醫學與病理學結合,首次提出 EBP,并指出病理醫師在重復識別和量化某些形態特征的一致性尚不足,導致此類病理特征的判斷不能有效指導甚至誤導臨床,因此鼓勵細胞病理學進行“循證”[6]。2002 年,Fleming 在此基礎上指出病理的取材、診斷以及報告發放都應采用循證醫學的方法規范管理[45]。Marchevsky 于 2004 年提到在分子病理與其它新技術(如蛋白質組學)的發展背景下,病理學應與循證醫學、醫療決策分析結合[46],并于 2016 年采用 IBM Watson 分析軟件作為示范預測了肺類癌患者的預后并討論了其潛在應用,指出將數據挖掘與預測分析結合才是 EBP 的大勢所趨[47]。至今,隨著病理指南及病理學領域高質量系統評價/Meta 分析的不斷誕生,EBP 提倡采用系統評價從科學文獻中獲取證據,嚴格評估每個證據的質量,并對現有證據進行“分級”,再將獲取的最佳證據集入證據摘要中供病理醫師參考使用[48]。臨床病理醫師已能在自身豐富的專業知識與診斷經驗基礎上,參考最佳證據并衡量患者的利弊得失后做出最后決策。另外免疫組織化學技術及各項分子技術作為病理學開展循證方法的重要載體,不僅能為診斷提供依據,而且基于對分子層面發病機制的認知,能夠形成針對單個患者靶向治療所依據的最高質量證據[33],使病理學決策能妥善地考慮患者個人差異。
2003 年,EBP 概念首次被引入國內,指出病理學指標在疾病預后評估、指導治療及在疾病分類、病理學特征的描述和病理技術評估方面均應采用循證理念和方法[24]。2012 年陳俊穎等[25]簡要介紹了 EBP 的概念、原則、應用范疇,并提出 EBP 應被引入病理工作的其它環節,如標本接收、取材、制片、報告發放等。目前我國在 EBP 領域也已取得不少成果,包括研究病理指標診斷效能[49, 50]、分子標記物預后價值[51]等。
3 EBP 的應用及其意義
3.1 明確診斷的再現性、病理技術的診斷性能
EBP 要求確保產生結果的各個環節都基于已被證實具有良好重復性的標準[45],其中病理診斷的可重復性是關鍵,這也是病理學為臨床提供診斷服務的精髓所在。病理診斷在臨床實踐中一直作為“金標準”,這基于假設病理學診斷具有良好的可重復性[45]。但事實上,病理學家之間甚至病理學家自身對許多疑難疾病或對部分基礎病理表現的診斷與解釋均存在不一致。這種不一致在系統評價出現之前難以被病理學家注意或被認為無法避免,但只有在病理學家能可靠、可重復地識別和量化某種形態學特征,討論其與臨床的相關性時,病理學診斷才有臨床意義[6]。
Fleming 首次提出采用 Kappa 評分驗證不同觀察者對病理診斷的一致性[6]。Stoler 研究了多位訓練有素的觀察者之間對于各種類型宮頸標本的解讀差異,結果表明有相當一部分疾病的診斷可重復性較弱,提示病理學家的診斷應遵循更為嚴格、統一,且被驗證具有良好重復性的指導原則或疾病分類[52]。Hodgson 通過評估兩種不同的宮頸腺癌分類標準在觀察者間的重現性,從而指導病理學家使用更合理的分類標準[53]。目前敏感性、特異性、預測值、似然比、優勢比、貝葉斯定理、ROC 曲線、Kappa 統計量等已經成熟用于診斷性試驗的 Meta 分析[54-57]。國內學者已制訂了診斷循證指南的制訂規范[58],并開展診斷準確性 Meta 分析的方法研究[39],這些方法也逐漸應用于 EBP。除了主觀性診斷的再現性問題,各種技術的診斷性能也是近年來 EBP 研究的一大熱點。如 Katsoula 等納入 12 個研究(6 204 例參與者)對糞便免疫化學測試診斷結腸直腸癌高危患者的診斷敏感性、特異性等診斷效能指標進行 Meta 分析[59]。
在系統評價某種疾病的診斷重復性或某種技術的診斷性能以前,病理醫師無法判斷其診斷標準是否真實有效,僅憑理論與經驗做的決策將會導致許多醫療錯誤,而醫療錯誤不僅浪費醫療資源,還會給患者造成無法挽回的損失[60]。基于循證理念,結合各種統計學工具,匯總最佳證據,可明確診斷的再現性問題,能夠檢驗各種技術的診斷性能,基于證據選擇性地淘汰重復性差的診斷方式,而保留性能良好的、結合個體患者的病理標本或實驗室檢測結果用于臨床診斷。
3.2 評估病理指標的診斷預后性能,指導臨床管理
近年來,病理學尤其是分子病理學的蓬勃發展極大地影響了病理診斷實踐和實驗室工作流程,新的基因療法的應用對病理學提出了更高要求,病理報告需要提供更多影響或直接決定臨床決策的信息[2],如推薦適用于結腸直腸癌患者的分子生物標志物[61]、指導肺癌患者的靶向酪氨酸激酶抑制劑治療的分子檢測[62]等。但由于評估基因檢測臨床效用的標準尚在發展中,檢測目標定義尚不清,缺乏有效的治療措施,也無較好的證據支持決策[33],因此病理學需要尋求最佳證據以指導臨床,具體表現為評估病理學指標為疾病提供診斷預后的性能并采用分子生物標志物指導治療,尤其在腫瘤方面的應用尤為廣泛[7, 17, 19, 20, 40, 63]。
對一種分子檢測物或藥物的開發必須有嚴謹的臨床證據支持,早在 1998 年,就有學者采用 Meta 分析評價血清 CA-125 對子宮內膜異位癥的診斷價值[64]。2011 年 Leo 等進行 Meta 分析評估了 HER2 和 TOP2A 預測早期乳腺癌患者對蒽環類藥物治療反應的性能,結論表明 HER2 和 TOP2A 在蒽環類藥物治療反應性方面具有一定預測價值[40]。Berry 等通過分析多個研究中急性淋巴細胞白血病患者微小殘留病 MRD 狀態與復發和死亡率的關系評估誘導治療的有效率,對提高臨床試驗效率,加速藥物開發大有裨益[65]。
除指導分子標志物應用與開發新型治療方法,EBP 還可糾正分子標志物指導臨床的相關醫療錯誤。如系統評價 c-erbB-2 在乳腺癌中的臨床應用,得出不應使用 c-erbB-2 狀態來確定女性是否接受輔助性全身治療的結論[66]。2017 年,Sekhar 等發現近幾年的臨床研究中肛門鱗狀細胞癌患者淋巴結陽性的比例可能被高估,在腫瘤學中引入新的分期技術可能會增加過度治療的風險[16]。關于分子標志物或其它病理學指標的預后功能的研究是近年來相對熱門的部分,通過綜合多方面文獻證據,可更準確地判定一種分子標記物是否適用于某種疾病的預后、生存分析,且能基于當前證據剔除沒有臨床意義的指標,避免醫療資源浪費。
3.3 優化疾病分類和腫瘤分級分期
疾病分類、腫瘤分級分期一直基于病理學。有研究證明某些疾病在指南中的分類與實際情況不匹配[67],急需對證據和指南進行更新,近年來關于優化疾病分類尤其是腫瘤分級分期的研究層出不窮。2013 年一個回顧性隊列研究提出了一種用于皮膚鱗狀細胞癌的替代性腫瘤分期系統,擬議的替代性腫瘤分期系統通過對 T2 期腫瘤進行分層,可以改善預后判斷[68]。2014 年 Schmitt 等進行了一個 Meta 分析,通過比較 AJCC 分期與替代分期系統的陽性前哨淋巴結活檢結局,證明了這種替代分期系統可以更精確地描繪 T2b 類別的高危病變,并指出未來的前瞻性研究對于驗證腫瘤分期與陽性 SLNB 結果之間的關系以及確定最佳分期系統是必要的[9]。采用可靠的文獻資料評價現有指南標準是否經得起實踐考驗是有必要的,通過分析不同疾病分類或是腫瘤分期分級指南在臨床應用的有效性,為臨床提供或優化最能體現預后或是最能精確描繪疾病特征的指南,避免在臨床實踐中盲目操作。
3.4 優化病理技術
切片的質量決定診斷質量,而切片質量取決于病理技術,其中病理取材的方式、數目、深淺等因素嚴重影響著診斷的準確性[69]。通過比較大樣本人群中不同取材技術方法對于診斷的影響,可以選出最準確、最合適的取材方法。如 2014 年 Arbyn 等進行了一個 Meta 分析,在 154 556 例女性中評估了 HPV 檢測中自行采集的樣本與臨床醫生采集的樣本,結果表明自行采集樣本的敏感性和特異性均低于臨床醫生抽取的樣品,由此認為在進行 HPV 篩查時,應建議由臨床醫生取樣,但對于未參加常規篩查計劃的婦女,可建議自我采樣進行 HPV 檢測,以提高篩查覆蓋率[70]。Korevaar 等分析了在非小細胞肺癌患者中進行縱隔淋巴結分期時,結合使用支氣管內超聲引導下經支氣管穿刺抽吸和經食管超聲內鏡引導下細針穿刺的診斷準確性,結果顯示結合使用支氣管內超聲引導下經支氣管穿刺抽吸顯著提高了檢測縱隔淋巴結轉移的敏感性,從而減少了采用縱膈鏡或胸腔鏡手術這些費用昂貴且侵入性強的分期方式[71]。
除取材方式,取材部位、數量、深淺制訂也需要依賴循證方法,如關于腫瘤分期淋巴結的取樣數量[72],有相關證據表明增加淋巴結取樣會影響分期[73],但仍存在相反的證據[74-76],顯然取樣過多過少都不可能是正確的[45],但這方面的相關循證研究仍較少。在大部分病理學家都將關注點放在切片的診斷準確度上時,對于標本的制備質量的研究通常被忽略,故更多開展這方面的研究是有必要的。通過整合文獻證據,比較制片過程中的不同技術、方法,開發更可靠的技術設備或方法,可保證切片質量,減少病理醫師的診斷失誤并減少資源浪費,不同環境下的樣本收集也減少了因操作環境、操作者帶來的偏倚,從而用科學的方式做出科學的決策。
3.5 結合信息技術推動數字病理學發展
EBP 發展史中具有前景但尚未廣泛普及的一部分是信息技術的應用與數字病理學的發展。如 Marchevsky 將數據挖掘與預測分析相結合,使用 IBM Watson 分析軟件評估和預測 101 例已確定 Ki-67 指數的典型和非典型肺癌患者的預后,并用該系統獲得的結果與使用常規統計和專業統計學家的報告所得到的結果進行比較,結果表明這些統計結果與使用常規統計工具獲得的統計結果類似,但速度要更快,且節約人力[47]。深度學習屬于機器學習領域的一個分支,其中深度學習視覺領域就在準確處理復雜醫學圖像方面有所體現[77]。Bejnordi 等評估了自動深度學習算法在檢測乳腺癌患者淋巴結蘇木精和伊紅染色組織切片轉移方面的性能,并將其與病理學家的診斷結果進行比較,結果深度學習算法比病理學家組成的小組獲得了更好的診斷性能[78]。最近的一個 Meta 分析研究了深度學習算法在分割視網膜圖像方面的靈敏度和特異性[18]。另一個重要的技術是 WSI 技術,Hanna 等比較了傳統顯微鏡與 WSI 技術在圖像報告的準確性與效率,表明 WSI 在臨床工作量與診斷準確性方面與常規顯微鏡相當,但其效率還有待提高[79]。即使 WSI 技術還不成熟,但不可否認數字切片的應用解決了病理圖像證據采集不全以及保存不易的困難[43],而人工智能在病理診斷預后方面的應用可有效避免人為因素導致的診斷失誤,其產生的臨床證據也更可信。人工智能與病理學交叉結合將成為新時代科技發展背景下的先進診斷技術手段,應進行更深入、更科學的研究。
4 EBP 發展的挑戰
雖然循證醫學在病理學的應用很多,但由于病理學科的特殊性,還是存在局限性。首先,樣本數目的限制導致關于解剖病理學的證據還停留在病例報告系列[80]與專家意見這類研究設計中,而這些恰好都處于證據結構的金字塔底端[4]。第二,病理學證據是由大量可視化的圖形內容建造的,人的主觀性可能使得在圖像解釋與管理方面做不到統一,導致有些證據的傳播沒有可信度,甚至會起誤導作用。第三,目前關于石蠟切片或冰凍切片質量控制方面的研究較少,如標本固定、浸蠟、包埋、切片和染色固封等過程。切片質量是病理學科很重要一環,直接影響到病理醫師的診斷,不應被忽視[81]。第四,由于人工智能尚未廣泛應用,關于其性能的研究證據很有限。第五,在病理學文獻中存在一些方法學缺陷,如診斷標準沒有明確定義,缺乏疾病特異性的隨訪數據來驗證檢測預后價值等[48]。
5 EBP 發展方向與建議
5.1 EBP 重點發展方向
推動 EBP 的深化發展需要在以下幾個方面予以重點關注:① 增加證據來源,提高證據質量,規范基礎研究設計;② 統一病理圖像證據的文字解釋,便于管理與傳播;③ 促進基層病理醫師的科研動力,做到物盡其用,避免資源浪費;④ 有效采用文獻資料,規范循證知識。
5.2 推進 EBP 發展的建議
面對 EBP 目前遇到的機遇與挑戰,病理學家一要有前瞻意識,進一步提升病理學科的工作質量,二要在限制病理證據升級的諸多問題中挖掘可行之道。
5.2.1 充分采用基層樣本,增加證據來源
針對樣本不足這一缺陷,病理學家應當深挖原因,除了疾病罕見的因素,是否做到了標本的物盡其用,如許多庫存多年的標本未被充分用于科研工作,在不影響病人診斷治療且經過患者同意的情況下,將封存的標本充分采用;或成立專項科研組在住院患者中募集志愿者病人,在符合倫理及相關規定的前提下,充分提高樣本利用率,讓證據級別不僅限于病例系列與專家意見。
5.2.2 統一標準,規范管理
針對大量以圖像為單位的證據資料,病理學會應當組織專家小組統一并細化疑難、交界性疾病甚至一些常見但標準參差不及的疾病的形態學特征,以便于在圖形解釋方面達到基本一致,才能使證據趨于規范,這是病理圖像證據能夠在世界范圍內能夠傳播的前提。其次,應當開發信息技術在證據管理方面的應用,具體操作方式還有待挖掘。
5.2.3 充分應用已有證據
面對繁雜的文獻信息,病理醫師或科研人員應充分應用文獻資料、鑒別文獻質量、系統規范的利用匯總的最佳證據解決實際問題。
總之,EBP 已取得一定成就:① 通過系統評價/Meta 分析為病理學領域創造了高質量的證據[9, 40, 51, 59],進而供臨床工作者借鑒使用;② 循證理念可不斷推動病理診斷方法的研發[82-84],也在很大程度優化病理學的操作流程[85, 86]。雖然在證據質量與級別方面,病理學與臨床學科有差距,但信息技術與分子病理的發展為病理學科圖像證據的判斷與管理開創了一片天地,促使 EBP 能跳出傳統病理診斷范疇,應用于疾病預后、指導精準治療等。病理學家在不放棄傳統經驗的基礎上,應該將目光聚焦到病理學與新技術、新知識的融合,基于高質量證據的 EBP 才能為臨床提供可信度較高的診斷結果及有效可靠的檢測技術與應用。