在循證實踐的路徑中,證據的個體適用性評價依賴于臨床醫生的主觀判斷,缺少系統的方法學指導。而中醫臨床信息的復雜性增加了依靠主觀判斷證據適用性的不確定性和風險。本文分析循證臨床實踐流程,對中醫藥證據適用性評價的方法學進行了探索和嘗試,提出通過建立基于臨床試驗原始數據的療效預測模型來評價證據的個體適用性,以促進中醫藥證據的合理應用。
引用本文: 魏旭煦, 關曼柯, 石兆峰, 尤良震, 蔣寅, 趙晨, 商洪才. 中醫臨床試驗證據個體適用性評價方法的探索構建. 中國循證醫學雜志, 2021, 21(7): 858-862. doi: 10.7507/1672-2531.202102070 復制
在循證臨床實踐中,針對患者群體形成的臨床研究證據是需要遵循的主要原則性信息。但在證據的個體化應用中,對于如何綜合個體患者的臨床特征及其意愿和偏好,進一步形成循證決策,則尚缺乏系統的方法學指導[1, 2]。傳統理論指導下的中醫臨床實踐在結合證據進行臨床決策的過程中,需要考慮更多因素,增加了循證臨床決策的不確定性。圍繞中醫藥臨床證據的個體化診療實踐關鍵問題,亟待探索建立中醫臨床試驗證據個體應用的輔助方法。
1 循證中醫藥的發展—群體性證據積累
循證醫學的進步與證據體系的發展、證據的轉化是同步發展的。從以隨機對照試驗(randomized controlled trial,RCT)為代表的高質量原始研究到以系統評價(systematic review,SR)和 Meta 分析為代表的二次研究,再到循證臨床實踐指南和臨床路徑的本地化制定和實施[3-5],循證醫學證據生產和轉化的關注從臨床療效獲益,擴展到具體醫療環境下的決策流程,其對臨床實踐的指導和規范正在向更深入的方向持續發展。
循證醫學引入中國 20 多年[6],與中醫藥學發生了深刻的碰撞和交融,使循證研究的理念在中醫藥領域深入人心,相關證據生產方法及其證據成果蓬勃發展,原始研究和二次研究數量不斷增長,發文量呈逐年上升趨勢[7]。近年來更涌現出許多優秀研究成果[8-12]在國際知名醫學期刊上發表,獲得了國際同行的廣泛認可,以規范化的臨床流行病學和統計學方法為基礎的中醫藥臨床研究日益增多,為中醫臨床療效的驗證提供了可靠證據。
2 臨床循證實踐中的問題
2.1 從群體化證據到個體化決策
循證醫學被定義為“基于當前可獲得的最佳證據,結合醫生的經驗與患者的意愿,作出最適宜個體患者的臨床決策”[13]。因此通常也把最佳證據、醫生經驗、患者意愿稱為循證三要素,強調以證據作為臨床決策的基礎,而醫生的臨床經驗技能與個體患者的意愿和價值觀則是臨床決策的關鍵因素。循證醫學的目的是通過證據優化和指導臨床實踐,力求使個體患者得到最適宜的臨床決策。
值得強調的是,運用群體化的證據指導個體化的臨床決策,應當考慮個體患者臨床特征和治療意愿的差異。臨床原始研究和二次研究,均是在群體層面對某一臨床問題的整體獲益、風險進行評價。在證據生產過程中,對人群同質性的嚴格要求和證據形成過程中的統計學表達,給出了受試樣本所代表的總體的“平均最佳決策”,但卻忽略了試驗內個體的療效差異,包括無效甚至惡化的個體—即“平均最佳決策”并非所有個體患者的最佳決策,直接應用循證證據進行個體臨床決策存在風險。同時,患者對治療的期望和目標不同,也將影響醫師的臨床決策。例如,有的患者傾向于緩解主要癥狀,有的患者則傾向于控制理化指標。
2.2 目前循證實踐方法學對個體化診療的指導有限
臨床醫生在應用證據對個體患者進行循證臨床決策時,應當遵循循證實踐的五個步驟[14](5A 步驟),即提出問題(Ask)、獲取證據(Acquire)、評價證據(Apprise)、應用證據(Apply)、后效評價(Assess)。在真實臨床環境下,臨床醫生面對的個體患者即是其面對的臨床問題,而已獲取的證據則作為其知識儲備。因此,臨床醫生進行循證實踐的關鍵是結合患者意愿通過證據評價環節指導證據應用,進而形成個體化的臨床決策。
循證臨床實踐中的證據評價環節是指對證據的真實性、可靠性和適用性進行評價[14]。其中,證據的真實性和可靠性在證據獲取后即可通過現有的 PRISMA[15]、CONSORT[16]及其擴展版等一系列報告規范和 AMSTAR 2[17]、ROB[18]等方法學質量評價工具進行評價,與所獲取的證據一同作為臨床醫生的知識儲備。而證據的適用性則必須通過個體患者的具體情況來評價已有證據是否適用于該患者,并據其判斷進行臨床決策。然而,相較于現有相對成熟的客觀方法學工具支持的真實性和可靠性評價,證據的適用性評價目前尚缺乏系統的方法學工具支持。
3 建立中醫證據個體適用性評價方法
3.1 中醫臨床診療中個體信息的復雜性
中醫臨床實踐以辨證論治為核心指導原則。臨床醫生通過對患者的臨床資料進行有時序、有因果的綜合分析,以確定病位、病性、病勢,概括病機并辨明證候,作為選方用藥的依據:這些臨床資料不但包括癥狀、體征和舌象、脈象等中醫四診信息,還包括患者所處的生理狀態(體質)、地理環境、社會環境等特征,其性質、程度和因果關系都將影響辨證的結果。
中醫藥循證臨床實踐應當保留中醫臨床個體化實踐特征,結合證據進行臨床決策。在“以病統證”的中醫診療模式下,中醫診療除了遵循以西醫疾病定義的主要臨床問題所生產的群體化證據,考慮實驗室檢查、影像學檢查等西醫語境下的患者臨床特征,考慮中醫藥與西藥的合并用藥,同時需了解患者的證候、體質等中醫特征,據此進行證據的適用性評價并進行臨床決策[19, 20]。
3.2 構建中醫證據個體適用性評價方法的必要性
證據的適用性評價是連接“最佳證據”與個體“最適決策”的一道橋梁。但客觀方法學工具的缺失,導致了醫師在循證臨床實踐中只能通過主觀判斷來綜合個體患者的諸多臨床特征,權衡患者個體特征對證據應用可能產生的影響,給臨床決策帶來了極大的不確定性和風險。例如,根據性別、合并癥、并發癥等臨床特征的不同,頸動脈狹窄的頸動脈內膜切除術可以預防卒中,也可能升高卒中風險[21],而中醫臨床實踐中個體信息的復雜性大大加劇了這種不確定性。同時,患者的不同治療意愿也在一定程度上影響醫師的臨床決策。
中醫臨床個體化療效評價研究同時面向中醫辨證論治臨床診療和循證決策模式[2]。建立中醫臨床證據個體適用性評價的方法,將使得證據應用前的適用性評價環節得到可靠方法學指導,提升醫師對證據適用性判斷的客觀性,促進合理決策,降低用證風險。
3.3 中醫證據個體適用性評價方法初構
證據適用性評價的過程,實現路徑之一是通過分析個體患者的臨床特征,對群體證據用于該患者能夠產生的療效進行預測,同時綜合參考患者的價值取向和治療意愿,從而在有效性方面探討證據適用性。因此,可以考慮通過構建以中醫患者復雜臨床特征為預測因子的臨床療效預測工具,結合定量化表示的患者意愿進行綜合評價,從而構建證據適用性評價方法。
3.3.1 療效預測模型的建立
臨床預測模型[22]及其衍生的評分量表等是通過患者臨床特征來評估個體患者發病風險、治療結局或預后等的常用定量工具。臨床預測模型的核心思想是通過恰當的數理方法,探究和描述患者特征(自變量)與結局(因變量)之間的規律(模型),并用于個體患者的預測。
已有學者總結了建立和評價臨床預測模型的一般研究方法[23-25]:主要包括模型構建、模型驗證和模型應用等階段。在模型構建階段,需要進行數據預處理,篩選預測因子(即自變量)后選擇合適的方法(如 logistic 回歸、Cox 回歸等)進行模型構建。在模型驗證階段,大致可分為內部驗證和外部驗證,對模型的預測性能和外推性進行評估。最終將模型投入應用,并觀察模型是否能夠改善決策質量。例如 SYNTAX 評分Ⅱ[26],基于 SYNTAX 試驗的 1 800 例患者原始數據,使用 Cox 比例風險模型建模形成療效預測模型,通過 8 個變量對心梗患者使用 PCI 與 CABG 的獲益情況分別進行預測。采用自舉重采樣方法(bootstrap resampling)進行了內部驗證,并使用 DELTA 注冊登記研究[27]的 2 891 例病例數據進行了外部驗證,最終形成較為可靠的療效預測模型來為個體患者提供干預策略建議。
3.3.2 患者意愿的定量化表示
在中醫臨床療效評價領域,對患者意愿的定量化表示已有許多研究可供借鑒。如在中醫療效評價指標的研究中引入患者報告結局[28](PRO)、生存質量評價[29](QOL)等類型的指標,意在關注患者的主觀感受;重視患者主觀意愿的個體化評價方法則有循證目標成就評量法(循證 GAS 法)[30, 31]等。在回答“如何定量化體現患者意愿”這一問題時,可以考慮結合一定賦權方法,給患者關注的指標賦予適當權重,結合療效預測結果對證據適用性進行綜合評價。
受循證 GAS 法啟發,可首先以證據為基礎,通過 SR 或采用核心指標集等方法形成相應的療效評價指標池。此后在臨床醫師的指導和解釋下,使患者共同參與到療效評價指標體系的構建過程中,從療效評價指標池中選取患者關心的結局指標,并根據實現難度和重要性賦予相應權重,從而形成能夠反映患者意愿的個體化療效評價指標體系,實現定量化表示患者意愿。
在建立以基于臨床試驗原始數據的療效預測模型后,將個體患者特征變量輸入療效預測模型進行預測,并將結局指標預測值代入患者意愿參與形成的個體化療效評價指標體系中計算總分,即進行“個體化療效循證預測”,獲得患者療效評分的預測值。在證據應用前,通過比較試驗內不同組間的療效評分預測值,可表明證據被應用于個體后產生的療效期望的差異,為個體化證據適用性評價提供依據(如圖 1所示)。

4 基于機器學習的中醫證據個體適用性評價研究前瞻
人工智能和機器學習作為賦能手段,已經在醫療領域顯示出其廣泛的用途和可靠的效果,基于各類機器學習算法的研究成果被廣泛用于篩查[32]、診斷[33]、決策[34]等診療環節中。本研究以丹紅注射液在 STEMI 患者 PCI 圍手術期不同時點干預對心肌微循環障礙影響的隨機對照試驗(DIRECTION 試驗)[35]為例,進行基于機器學習的中醫證據個體適用性評價研究。
我們首先通過專家調查篩選預測因子,再在療效預測模型的構建中,使用支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)、K-最近鄰(K-nearest neighbor)、人工神經網絡(artificial neural network,ANN)等機器學習算法,通過預測因子對試驗內各結局指標分別建立療效預測模型。對不同模型進行內部驗證、性能評估和迭代,并確定可進入外部驗證階段的最優模型。通過開展前瞻性、觀察性病例系列研究,在真實世界情境下對模型進行外部驗證。同時面向患者以循證 GAS 法構建個體化療效評價指標體系,根據患者個體特征信息進行中醫個體化療效循證預測,作為證據適用性評價的參考。經前瞻性隨訪,對比證據適用性評價與患者療效結局評價結果,計算準確性等參數,驗證中醫證據個體適用性評價方法的可靠性(技術路線見圖 2)。

5 結語
隨著中醫藥臨床原始研究數量的不斷增長,中醫證據個體適用性評價研究對于指導個體化證據應用的意義將日益凸顯。本研究對中醫證據個體適用性評價方法的建立進行了探索,嘗試通過建立基于臨床試驗原始數據的療效預測模型,結合個體化療效評價指標體系進行中醫個體化療效循證預測,為證據個體適用性評價提供客觀依據。顯然,在本研究所采取的證據個體適用性評價方法的構建模式中,臨床試驗原始數據的數量和質量至關重要,而這均有賴于未來臨床試驗質量控制與透明化工作的進一步深入。
未來期望中醫證據個體適用性評價方法的構建模式得到延伸和推廣,推動從“最佳證據”到“最適決策”的轉化,降低證據的應用風險,提高中醫臨床決策質量,并形成新的證據流動模式。
在循證臨床實踐中,針對患者群體形成的臨床研究證據是需要遵循的主要原則性信息。但在證據的個體化應用中,對于如何綜合個體患者的臨床特征及其意愿和偏好,進一步形成循證決策,則尚缺乏系統的方法學指導[1, 2]。傳統理論指導下的中醫臨床實踐在結合證據進行臨床決策的過程中,需要考慮更多因素,增加了循證臨床決策的不確定性。圍繞中醫藥臨床證據的個體化診療實踐關鍵問題,亟待探索建立中醫臨床試驗證據個體應用的輔助方法。
1 循證中醫藥的發展—群體性證據積累
循證醫學的進步與證據體系的發展、證據的轉化是同步發展的。從以隨機對照試驗(randomized controlled trial,RCT)為代表的高質量原始研究到以系統評價(systematic review,SR)和 Meta 分析為代表的二次研究,再到循證臨床實踐指南和臨床路徑的本地化制定和實施[3-5],循證醫學證據生產和轉化的關注從臨床療效獲益,擴展到具體醫療環境下的決策流程,其對臨床實踐的指導和規范正在向更深入的方向持續發展。
循證醫學引入中國 20 多年[6],與中醫藥學發生了深刻的碰撞和交融,使循證研究的理念在中醫藥領域深入人心,相關證據生產方法及其證據成果蓬勃發展,原始研究和二次研究數量不斷增長,發文量呈逐年上升趨勢[7]。近年來更涌現出許多優秀研究成果[8-12]在國際知名醫學期刊上發表,獲得了國際同行的廣泛認可,以規范化的臨床流行病學和統計學方法為基礎的中醫藥臨床研究日益增多,為中醫臨床療效的驗證提供了可靠證據。
2 臨床循證實踐中的問題
2.1 從群體化證據到個體化決策
循證醫學被定義為“基于當前可獲得的最佳證據,結合醫生的經驗與患者的意愿,作出最適宜個體患者的臨床決策”[13]。因此通常也把最佳證據、醫生經驗、患者意愿稱為循證三要素,強調以證據作為臨床決策的基礎,而醫生的臨床經驗技能與個體患者的意愿和價值觀則是臨床決策的關鍵因素。循證醫學的目的是通過證據優化和指導臨床實踐,力求使個體患者得到最適宜的臨床決策。
值得強調的是,運用群體化的證據指導個體化的臨床決策,應當考慮個體患者臨床特征和治療意愿的差異。臨床原始研究和二次研究,均是在群體層面對某一臨床問題的整體獲益、風險進行評價。在證據生產過程中,對人群同質性的嚴格要求和證據形成過程中的統計學表達,給出了受試樣本所代表的總體的“平均最佳決策”,但卻忽略了試驗內個體的療效差異,包括無效甚至惡化的個體—即“平均最佳決策”并非所有個體患者的最佳決策,直接應用循證證據進行個體臨床決策存在風險。同時,患者對治療的期望和目標不同,也將影響醫師的臨床決策。例如,有的患者傾向于緩解主要癥狀,有的患者則傾向于控制理化指標。
2.2 目前循證實踐方法學對個體化診療的指導有限
臨床醫生在應用證據對個體患者進行循證臨床決策時,應當遵循循證實踐的五個步驟[14](5A 步驟),即提出問題(Ask)、獲取證據(Acquire)、評價證據(Apprise)、應用證據(Apply)、后效評價(Assess)。在真實臨床環境下,臨床醫生面對的個體患者即是其面對的臨床問題,而已獲取的證據則作為其知識儲備。因此,臨床醫生進行循證實踐的關鍵是結合患者意愿通過證據評價環節指導證據應用,進而形成個體化的臨床決策。
循證臨床實踐中的證據評價環節是指對證據的真實性、可靠性和適用性進行評價[14]。其中,證據的真實性和可靠性在證據獲取后即可通過現有的 PRISMA[15]、CONSORT[16]及其擴展版等一系列報告規范和 AMSTAR 2[17]、ROB[18]等方法學質量評價工具進行評價,與所獲取的證據一同作為臨床醫生的知識儲備。而證據的適用性則必須通過個體患者的具體情況來評價已有證據是否適用于該患者,并據其判斷進行臨床決策。然而,相較于現有相對成熟的客觀方法學工具支持的真實性和可靠性評價,證據的適用性評價目前尚缺乏系統的方法學工具支持。
3 建立中醫證據個體適用性評價方法
3.1 中醫臨床診療中個體信息的復雜性
中醫臨床實踐以辨證論治為核心指導原則。臨床醫生通過對患者的臨床資料進行有時序、有因果的綜合分析,以確定病位、病性、病勢,概括病機并辨明證候,作為選方用藥的依據:這些臨床資料不但包括癥狀、體征和舌象、脈象等中醫四診信息,還包括患者所處的生理狀態(體質)、地理環境、社會環境等特征,其性質、程度和因果關系都將影響辨證的結果。
中醫藥循證臨床實踐應當保留中醫臨床個體化實踐特征,結合證據進行臨床決策。在“以病統證”的中醫診療模式下,中醫診療除了遵循以西醫疾病定義的主要臨床問題所生產的群體化證據,考慮實驗室檢查、影像學檢查等西醫語境下的患者臨床特征,考慮中醫藥與西藥的合并用藥,同時需了解患者的證候、體質等中醫特征,據此進行證據的適用性評價并進行臨床決策[19, 20]。
3.2 構建中醫證據個體適用性評價方法的必要性
證據的適用性評價是連接“最佳證據”與個體“最適決策”的一道橋梁。但客觀方法學工具的缺失,導致了醫師在循證臨床實踐中只能通過主觀判斷來綜合個體患者的諸多臨床特征,權衡患者個體特征對證據應用可能產生的影響,給臨床決策帶來了極大的不確定性和風險。例如,根據性別、合并癥、并發癥等臨床特征的不同,頸動脈狹窄的頸動脈內膜切除術可以預防卒中,也可能升高卒中風險[21],而中醫臨床實踐中個體信息的復雜性大大加劇了這種不確定性。同時,患者的不同治療意愿也在一定程度上影響醫師的臨床決策。
中醫臨床個體化療效評價研究同時面向中醫辨證論治臨床診療和循證決策模式[2]。建立中醫臨床證據個體適用性評價的方法,將使得證據應用前的適用性評價環節得到可靠方法學指導,提升醫師對證據適用性判斷的客觀性,促進合理決策,降低用證風險。
3.3 中醫證據個體適用性評價方法初構
證據適用性評價的過程,實現路徑之一是通過分析個體患者的臨床特征,對群體證據用于該患者能夠產生的療效進行預測,同時綜合參考患者的價值取向和治療意愿,從而在有效性方面探討證據適用性。因此,可以考慮通過構建以中醫患者復雜臨床特征為預測因子的臨床療效預測工具,結合定量化表示的患者意愿進行綜合評價,從而構建證據適用性評價方法。
3.3.1 療效預測模型的建立
臨床預測模型[22]及其衍生的評分量表等是通過患者臨床特征來評估個體患者發病風險、治療結局或預后等的常用定量工具。臨床預測模型的核心思想是通過恰當的數理方法,探究和描述患者特征(自變量)與結局(因變量)之間的規律(模型),并用于個體患者的預測。
已有學者總結了建立和評價臨床預測模型的一般研究方法[23-25]:主要包括模型構建、模型驗證和模型應用等階段。在模型構建階段,需要進行數據預處理,篩選預測因子(即自變量)后選擇合適的方法(如 logistic 回歸、Cox 回歸等)進行模型構建。在模型驗證階段,大致可分為內部驗證和外部驗證,對模型的預測性能和外推性進行評估。最終將模型投入應用,并觀察模型是否能夠改善決策質量。例如 SYNTAX 評分Ⅱ[26],基于 SYNTAX 試驗的 1 800 例患者原始數據,使用 Cox 比例風險模型建模形成療效預測模型,通過 8 個變量對心梗患者使用 PCI 與 CABG 的獲益情況分別進行預測。采用自舉重采樣方法(bootstrap resampling)進行了內部驗證,并使用 DELTA 注冊登記研究[27]的 2 891 例病例數據進行了外部驗證,最終形成較為可靠的療效預測模型來為個體患者提供干預策略建議。
3.3.2 患者意愿的定量化表示
在中醫臨床療效評價領域,對患者意愿的定量化表示已有許多研究可供借鑒。如在中醫療效評價指標的研究中引入患者報告結局[28](PRO)、生存質量評價[29](QOL)等類型的指標,意在關注患者的主觀感受;重視患者主觀意愿的個體化評價方法則有循證目標成就評量法(循證 GAS 法)[30, 31]等。在回答“如何定量化體現患者意愿”這一問題時,可以考慮結合一定賦權方法,給患者關注的指標賦予適當權重,結合療效預測結果對證據適用性進行綜合評價。
受循證 GAS 法啟發,可首先以證據為基礎,通過 SR 或采用核心指標集等方法形成相應的療效評價指標池。此后在臨床醫師的指導和解釋下,使患者共同參與到療效評價指標體系的構建過程中,從療效評價指標池中選取患者關心的結局指標,并根據實現難度和重要性賦予相應權重,從而形成能夠反映患者意愿的個體化療效評價指標體系,實現定量化表示患者意愿。
在建立以基于臨床試驗原始數據的療效預測模型后,將個體患者特征變量輸入療效預測模型進行預測,并將結局指標預測值代入患者意愿參與形成的個體化療效評價指標體系中計算總分,即進行“個體化療效循證預測”,獲得患者療效評分的預測值。在證據應用前,通過比較試驗內不同組間的療效評分預測值,可表明證據被應用于個體后產生的療效期望的差異,為個體化證據適用性評價提供依據(如圖 1所示)。

4 基于機器學習的中醫證據個體適用性評價研究前瞻
人工智能和機器學習作為賦能手段,已經在醫療領域顯示出其廣泛的用途和可靠的效果,基于各類機器學習算法的研究成果被廣泛用于篩查[32]、診斷[33]、決策[34]等診療環節中。本研究以丹紅注射液在 STEMI 患者 PCI 圍手術期不同時點干預對心肌微循環障礙影響的隨機對照試驗(DIRECTION 試驗)[35]為例,進行基于機器學習的中醫證據個體適用性評價研究。
我們首先通過專家調查篩選預測因子,再在療效預測模型的構建中,使用支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)、K-最近鄰(K-nearest neighbor)、人工神經網絡(artificial neural network,ANN)等機器學習算法,通過預測因子對試驗內各結局指標分別建立療效預測模型。對不同模型進行內部驗證、性能評估和迭代,并確定可進入外部驗證階段的最優模型。通過開展前瞻性、觀察性病例系列研究,在真實世界情境下對模型進行外部驗證。同時面向患者以循證 GAS 法構建個體化療效評價指標體系,根據患者個體特征信息進行中醫個體化療效循證預測,作為證據適用性評價的參考。經前瞻性隨訪,對比證據適用性評價與患者療效結局評價結果,計算準確性等參數,驗證中醫證據個體適用性評價方法的可靠性(技術路線見圖 2)。

5 結語
隨著中醫藥臨床原始研究數量的不斷增長,中醫證據個體適用性評價研究對于指導個體化證據應用的意義將日益凸顯。本研究對中醫證據個體適用性評價方法的建立進行了探索,嘗試通過建立基于臨床試驗原始數據的療效預測模型,結合個體化療效評價指標體系進行中醫個體化療效循證預測,為證據個體適用性評價提供客觀依據。顯然,在本研究所采取的證據個體適用性評價方法的構建模式中,臨床試驗原始數據的數量和質量至關重要,而這均有賴于未來臨床試驗質量控制與透明化工作的進一步深入。
未來期望中醫證據個體適用性評價方法的構建模式得到延伸和推廣,推動從“最佳證據”到“最適決策”的轉化,降低證據的應用風險,提高中醫臨床決策質量,并形成新的證據流動模式。