引用本文: 馬玉, 惠文, 鄧可, 秦璇, 劉艷梅, 姚明宏, 李德華, 李凌鑫, 吳大嶸, 郭新峰, 李玲, 孫鑫. 缺血性腦卒中中成藥綜合評價指標體系構建研究. 中國循證醫學雜志, 2022, 22(9): 1055-1061. doi: 10.7507/1672-2531.202204039 復制
腦卒中是嚴重危害我國國民健康的重大慢性非傳染性疾病,具有發病率高、致殘率高、死亡率高、復發率高和疾病經濟負擔重等五大特點[1-2]。缺血性腦卒中是最常見的卒中類型,約占全部卒中的66%~84%[3-5]。中成藥作為傳統中醫藥理論與現代生產工藝相結合的產物,具有多組分、多靶點的藥理特點[4,6]。從中醫藥整體觀出發,中成藥在改善缺血性腦卒中患者微循環、增加腦供氧等方面具有獨特效果,其臨床應用越來越廣泛[7]。目前多部中西醫結合治療腦卒中循證實踐指南均推薦在缺血性腦卒中常規治療的基礎上聯用中成藥治療[3-4,6,8]。
治療缺血性腦卒中的中成藥種類豐富,不同中成藥臨床研究證據所使用的結局指標繁多且不統一,難以滿足實際臨床環境下不同藥品療效比較和選擇的實際需求。而且,在中成藥臨床決策和醫保藥品遴選時,需綜合評價和權衡臨床有效性、安全性和經濟性,但目前缺乏綜合、定量評價以上三個維度的評價指標體系[9-10],亟需構建一套科學規范并涵蓋中成藥療效、安全性和經濟性的指標評價體系。有鑒于此,本研究在系統梳理中成藥治療缺血性腦卒中臨床研究和經濟學評價文獻的基礎上,采用Delphi專家咨詢法構建缺血性腦卒中中成藥有效性、安全性和經濟性綜合評價指標體系,并采用層次分析法(analytic hierarchy process,AHP)設置各級指標權重,為腦卒中中成藥的綜合評價提供依據。
1 資料與方法
1.1 擬定指標體系
計算機檢索PubMed、EMbase、Cochrane Central Register of Controlled Trials(CENTRAL)、CNKI、VIP和WanFang Data數據庫,搜集中成藥治療缺血性腦卒中的相關研究,檢索時限為建庫到2020年7月。文種限制為英文和中文。研究類型為隨機對照試驗和經濟學評價,提取納入研究中描述中成藥治療缺血性腦卒中有效性、安全性和經濟性的指標,匯總整理后形成綜合評價指標池。根據指標池條目,使用頭腦風暴法和小組討論,修改和完善指標條目,初步形成缺血性腦卒中中成藥綜合評價指標體系。
1.2 構建指標體系
1.2.1 專家遴選
邀請從事神經內科、神經外科、中醫腦病科、中西醫結合科、循證醫學、臨床流行病學、衛生統計學、政策評價研究、衛生經濟學等腦卒中診療或研究相關,且具備中、高級專業技術職稱的專家開展Delphi專家咨詢。
1.2.2 咨詢問卷
專家依據指標的重要性和可行性對各指標進行打分,并對指標體系設置、指標增減等提出建議;同時,按專家對指標熟悉程度與判斷依據進行打分,用以評價專家權威程度。評分采用Likert 5級評分,分值越高表明此指標越重要、可操作性越高[11-12]。
1.2.3 咨詢過程
通過電子郵件的方式進行咨詢。在發放第一輪專家咨詢問卷時,詳細向專家說明本研究的背景、目的和方法。第一輪問卷回收后,分析問卷結果,整理專家意見,經課題組討論后,修改完善指標,形成第二輪咨詢問卷;同時邀請專家對指標及條目作進一步的指導和建議。
1.2.4 指標篩選方法
本研究采用主觀評價法從重要性和可及性角度篩選指標,按照專家對各指標平均評分高低來挑選指標,舍棄得分較低且臨床不常用的指標。同時結合專家意見,進行指標篩選和修訂。
1.2.5 可靠性分析
可靠性采用專家積極系數、權威程度和協調程度進行評價。其中,專家的積極系數表示專家對本研究的關心程度,以咨詢問卷的回收率表示[13]。專家的權威程度(Cr)通過專家對評價指標的判斷依據(Ca)和專家對指標的熟悉程度(Cs)得出[14]。專家意見協調程度可判斷專家對指標的評價是否存在較大分歧,采用變異系數(專家對單個指標的協調程度)和Kendall’s W系數(專家對全部指標的協調程度)來表示[13]。
1.3 確定指標體系
1.3.1 專題小組討論
對專家意見不一致的指標及專家相關建議,邀請課題組相關研究人員進行專題小組討論,進一步完善指標體系。
1.3.2 現場專家共識
專題小組討論后,采用現場專家共識法,邀請相關領域專家再次討論、修改和完善,最終達成一致意見,確定缺血性腦卒中中成藥綜合評價指標體系。
1.4 確定指標權重
1.4.1 指標權重的計算
1.4.1.1 構建層次結構與兩兩比較判斷矩陣
對總評價目標進行連續性分解,建立目標層、準則層和方案層三個遞階層次模型;繪制綜合評價缺血性腦卒中中成藥的目標樹圖,構建指標兩兩比較判斷矩陣,邀請專家采用Saaty 1~9標度法對同一矩陣中多個指標的相對重要性進行兩兩比較打分[15-16]。
1.4.1.2 計算初始權重系數Wi’
按照公式計算矩陣中每個評價對象的初始權重系數Wi’,m為待評價層次的子目標數,aim為第i層第m個指標的重要性評分。
1.4.1.3 計算歸一化權重系數Wi
按照公式計算歸一化權重系數Wi;此外,對于二、三級指標需計算各指標的組合權重,既考慮其在本級指標中的權重分配,又考慮其在整個指標體系中的權重分配[17]。
1.4.2 一致性檢驗
采用Python 3.7.3軟件對各級指標權重矩陣進行一致性檢驗。一致性檢驗公式為,λmax為最大特征根。依據Saaty標度法查找m對應的平均隨機一致性指數(RI),計算一致性比率(CR):
。通常情況下,CR越小說明矩陣一致性越好,當CR<0.10時,認為判斷矩陣具有良好的一致性,否則對判斷矩陣進行修正[18-20]。
2 結果
2.1 評價指標體系初步擬定
初檢共獲得相關文獻14 101篇,匯總整理所有指標后建立的缺血性腦卒中中成藥綜合評價指標池共包含317個指標,其中有效性261個,安全性52個,經濟性4個。基于指標池,通過對相同指標進行去重、同類指標進行歸類,并經頭腦風暴法和專題小組討論后初步形成的綜合評價指標體系包括3個一級指標、13個二級指標、37個三級指標,從有效性、安全性和經濟性三個維度進行綜合評價。
2.2 評價指標篩選與指標體系構建
2.2.1 研究的可靠性分析
本研究共邀請了27位來自北京、上海、廣東、河南、甘肅、四川等9個省(市),17家醫療機構和相關單位的腦卒中相關領域臨床專家和方法學家。專家從事相關工作年限平均為11.76年;16位(64.00%)專家具有高級職稱,22位(88.00%)專家具有博士學歷;所有專家均來自醫療和科研崗位。其中,9位(36.00%)為中西醫結合領域專家,9位(36.00%)為西醫領域專家,7位(28.00%)為方法學專家;專家所在部門/科室包括神經科、老年科、腦病科、中西醫結合科、針灸科、衛生經濟學評價和循證醫學等。
2.2.1.1 專家的積極系數
第一輪共發放咨詢問卷27份,回收25份,回收率92.59%;第二輪共發出25份咨詢問卷,回收24份,回收率96.00%。兩輪專家積極系數均>70%,表明專家具有很高的積極性。
2.2.1.2 專家權威程度
根據專家咨詢結果,計算一、二、三級指標的權威程度,除中醫證候積分權威系數Cr為0.776 1外,其他各級指標的權威系數均在0.800 0以上(最大為0.956 3)。一般認為,專家權威系數Cr≥0.70為可接受信度[21],本研究結果顯示,25位專家對綜合評價指標體系中所涉及指標的權威程度比較高,結果可信。
2.2.1.3 專家意見的協調程度
兩輪專家咨詢的變異系數均數分別為0.27和0.25,重要性評分Kendall’s W分別為0.224(P<0.001)、0.370(P<0.001),可及性評分Kendall’s W分別為0.211(P<0.001)、0.255(P<0.001)。本研究第二輪的專家意見協調系數高于第一輪,經χ2檢驗,P值均小于0.001,可認為兩輪咨詢專家意見的協調程度好(表1)。

2.2.2 指標篩選
2.2.2.1 第一輪專家咨詢結果
綜合考慮專家對指標重要性和可及性的評分結果及相應修改意見,對指標體系做如下調整:① 一級指標未做修改;② 二級指標中,有效性評價從器官功能水平層面、個體活動能力層面、社會參與度、中醫療效評價、卒中并發癥和終點事件發生6個層面進行評估;安全性評價從肝功能、腎功能、胃腸道、心血管等器官層面進行評估;經濟性評價從臨床決策和醫療保險決策兩個方面按研究目的進行評估;③ 指標評估數量:二級指標從13個增為15個、三級指標從37個增為42個。
2.2.2.2 第二輪專家咨詢結果
第二輪專家咨詢中各指標評分的標準差和變異系數較第一輪均有所減小,評分逐漸集中,表明專家意見趨向一致。根據咨詢問卷的統計分析結果和專家反饋意見,對第二輪指標再次進行了修改和完善:① 一、二級指標未做修改;② 三級指標中,刪除了“肺炎”、“心肌梗死”和“惡心嘔吐”等指標,將三級指標數量從42個精簡為33個。
2.3 評價指標體系確立
2.3.1 優化指標體系
對第二輪Delphi問卷調查結果顯示臨床常用但異質性較大的指標開展專題小組討論與現場專家共識,對指標體系的構建進行了精煉和優化:① 一級指標未做修改;② 二級指標中,有效性評價的“個體活動能力”修改為“日常生活活動能力”,“生活質量改善”修改為“生活質量”;安全性評價的“并發出血事件”修改為“嚴重出血事件”;③ 三級指標中,具有相同評估功能的量表保留臨床使用率較高的,簡化卒中并發癥和終點事件的類型;為更全面地評估中成藥對腎功能的影響,新增一個臨床常用的腎功能評估指標。
2.3.2 建立指標體系
最終建立的缺血性腦卒中中成藥綜合評價指標體系包括:3個一級指標(有效性、安全性和經濟性),15個二級指標,33個三級指標(表2)。其中,① 有效性評價的二級指標包括神經功能缺損情況、日常生活活動能力、生活質量、中醫療效評價指標、卒中并發癥和終點事件。② 安全性評價的二級指標包括肝功能損害、腎功能損害、胃腸道不適、心血管異常、過敏反應和嚴重出血事件。③ 經濟性評價的二級指標設置臨床決策和醫保決策兩個不同的應用場景,在增量成本-效果比指標和增量成本-效用比指標的基礎上,臨床決策場景增設成本指標,醫保決策場景增設基金預算影響指標。

2.4 指標體系權重確定
2.4.1 建立遞階層次結構和指標兩兩比較判斷矩陣
本研究建立的綜合評價指標體系共分為三層結構:目標層即構建缺血性腦卒中中成藥綜合評價指標體系;準則層分為三個亞層,分別對應一、二、三級指標;方案層即確定各指標的權重。以療效評價的二級指標(表3)為例,其判斷矩陣評分結果顯示,如神經功能缺損情況與日常生活活動能力的相對重要性比值為3,說明神經功能缺損情況較日常生活活動能力更重要,其余指標的對比比較判斷以此類推。

2.4.2 計算各指標歸一化權重并進行一致性檢驗
根據各矩陣指標兩兩比較評分得到各指標歸一化權重及一致性檢驗結果:其中,療效評價的二級指標歸一化權重及一致性檢驗結果顯示,神經功能缺損情況、日常生活活動能力、生活質量、中醫療效評價、卒中并發癥和終點事件的歸一化權重分別為0.342 3、0.207 3、0.164 6、0.084 6、0.108 8和0.092 4;一致性指標CI=0.063 4,隨機一致性比例CR=0.051 1,二者均<0.1,表明該判斷矩陣具有良好的一致性(表4)。

此外,二、三級指標在歸一化權重的基礎上乘以其上級指標權重得到的組合權重即為最終權重。各級指標所得權重顯示:一級指標有效性、安全性和經濟性的權重分別為0.626 4、0.301 2和0.072 4;二級指標權重大于0.100 0的指標包括神經功能缺損情況、日常生活活動能力和生活質量指標;三級指標權重大于0.050 0的指標分別包括美國國立衛生研究院卒中量表(national institutes of health stroke scale,NIHSS)評分、改良Rankin量表(modified Rankin score,mRS)評分、改良Barthel指數、腦卒中專用生活質量量表(stroke-specific quality of life,SS-QoL)評分、中醫證候積分和谷丙轉氨酶(alanine aminotransferase,ALT)升高指標(表2)。
3 討論
本文報告了缺血性腦卒中中成藥綜合評價指標體系的構建方法和實施過程。通過系統文獻復習、Delphi專家咨詢、專題小組討論和現場專家共識,建立了有效性、安全性和經濟性3個維度下的缺血性腦卒中中成藥綜合評價指標體系,并采用AHP賦予各級指標權重,實現了綜合評價指標體系從定性到定量的轉化,有利于減少主觀判斷的偏差,確保評估指標體系構建方法的可靠性和科學性。
咨詢專家的選擇是Delphi法成敗的關鍵[22],本研究選取的專家來自全國東部、中部和西部9省(市),17家醫療機構和科研院所,專業涵蓋神經內科學、神經外科學、中醫腦病學、衛生經濟學評價和循證醫學等,專家代表性好;咨詢專家從事腦病學和方法學相關工作平均10年以上,絕大部分為博士學歷且具有高級職稱,保證了專家組具有較高的學術權威性。咨詢專家主要是臨床和方法學專家,未來的研究若能納入患者代表、政策決策者等其他利益相關群體,可能會進一步提高綜合評價指標體系的可推廣性。
專家的積極系數反映專家對研究關心合作的程度。Delphi專家咨詢法相關研究顯示,專家積極系數為63%~84%[23-24]。本研究兩輪函詢的專家積極系數分別為92.59%和96.00%,表明專家的積極性高,對調查的內容關心。本研究函詢專家的權威系數均大于0.7,說明專家的權威程度較高,結果相對可靠。經過兩輪函詢,變異系數和Kendall協調系數第二輪均優于第一輪,Kendall協調系數高于部分文獻報告的0.22和0.26[25],且差異有統計學意義(P<0.001),說明專家意見趨于一致,咨詢結果可信。AHP結果顯示,所有指標權重系數的一致性檢驗CR值均小于0.1,說明該綜合評價指標體系的設置符合邏輯,指標權重分配合理。
本研究從多個維度對藥品進行綜合評價,不僅考慮了西醫的臨床重要結局指標,也同時設置了中醫特色的“中醫療效評價”指標和“中醫證候積分”指標,這對于中成藥的療效評價具有重要意義。此外,為提高指標的適用性,經濟學評價分別考慮了臨床決策和醫療保險決策兩個不同的應用場景,以期滿足不同研究視角的評價需求。
從當前指標體系的權重設置來看,一級指標中有效性和安全性的權重值相對較高,分別為0.626 4和0.301 2,體現了在臨床診療中對上市后中成藥療效和用藥安全的重視。二級指標組合權重值較大的為神經功能缺損情況(0.214 4)、日常生活活動能力(0.129 9)和生活質量(0.103 1),均大于0.100 0。缺血性腦卒中是一種因動脈粥樣硬化或血栓栓塞導致缺血中心區域神經元發生不可逆壞死的心腦血管疾病[26-27],由于腦組織結構損傷和部分腦功能喪失,從而出現相應的神經系統功能缺損[4,27],嚴重影響患者的生活質量[2,28]。因此,在評估腦卒中中成藥有效性時,綜合考慮了患者的器官功能水平、個體活動能力和社會參與度,旨在全面評估腦卒中患者用藥后神經功能缺損情況、日常生活活動能力和生活質量。
中成藥作為傳統中醫藥理論與現代生產工藝相結合的產物,在評價中成藥的臨床療效時也應使用能突出中醫特色的評價指標。本課題組在構建缺血性腦卒中中成藥綜合評價指標體系時,特別考慮了這一要點,在兩輪Delphi專家咨詢和現場專家共識中,中醫療效評價指標得到咨詢專家的認可,指標體系中設置了相關三級指標“中醫證候積分”,權重值為0.053 0。值得注意的是,由于目前存在中醫證候分類不一、證候名稱應用不規范和證候診斷標準不一致的現象[29],給科學合理評價中成藥療效帶來了挑戰。未來需要繼續開展和規范中醫證候的相關研究,為中醫證候積分科學評價中醫藥干預的療效提供研究基礎。此外,國內學者采用混合研究方法制定了中成藥綜合評價指標體系[30],該研究從“安全、有效、經濟、應用、科學和標準”六個維度建立了中成藥綜合評價應重點考慮的條目。與該研究不同的是,本研究聚焦于腦卒中這一中醫藥優勢病種,指標體系的設置基于腦卒中的疾病特點和腦卒中中成藥的功效特點,因此制定的指標體系主要適用于缺血性腦卒中中成藥的綜合評價。
本研究構建的缺血性腦卒中中成藥綜合評價指標體系不僅考慮了西醫常用的重要指標,同時兼顧中醫治療的特點,突出中醫療效評價特色指標。缺血性腦卒中中成藥綜合評價指標體系的建立具有重要臨床應用價值:① 可從有效性、安全性和經濟性三個維度對缺血性腦卒中中成藥進行綜合評價,為上市中成藥的綜合評價和推薦提供基礎和依據;② 可為今后開展其他類藥品的綜合評價與推薦提供方法學示范;③ 還可指導該領域臨床試驗設計、系統評價開展和臨床實踐指南制訂等如何選擇研究結局指標。
總之,本研究從有效性、安全性和經濟性3個維度構建了缺血性腦卒中中成藥綜合評價指標體系,包括一級指標3個、二級指標15個、三級指標33個;同時采用AHP賦予各級指標權重。該評價體系充分考慮了臨床決策和醫保決策不同的應用場景,同時兼顧中醫特色指標,為綜合評價缺血性腦卒中中成藥的有效性、安全性和經濟性提供了基礎和依據。此外,該指標體系對腦卒中臨床試驗結局指標設計、系統評價開展、臨床實踐指南制定等研究結局指標的選擇均具有重要意義。
腦卒中是嚴重危害我國國民健康的重大慢性非傳染性疾病,具有發病率高、致殘率高、死亡率高、復發率高和疾病經濟負擔重等五大特點[1-2]。缺血性腦卒中是最常見的卒中類型,約占全部卒中的66%~84%[3-5]。中成藥作為傳統中醫藥理論與現代生產工藝相結合的產物,具有多組分、多靶點的藥理特點[4,6]。從中醫藥整體觀出發,中成藥在改善缺血性腦卒中患者微循環、增加腦供氧等方面具有獨特效果,其臨床應用越來越廣泛[7]。目前多部中西醫結合治療腦卒中循證實踐指南均推薦在缺血性腦卒中常規治療的基礎上聯用中成藥治療[3-4,6,8]。
治療缺血性腦卒中的中成藥種類豐富,不同中成藥臨床研究證據所使用的結局指標繁多且不統一,難以滿足實際臨床環境下不同藥品療效比較和選擇的實際需求。而且,在中成藥臨床決策和醫保藥品遴選時,需綜合評價和權衡臨床有效性、安全性和經濟性,但目前缺乏綜合、定量評價以上三個維度的評價指標體系[9-10],亟需構建一套科學規范并涵蓋中成藥療效、安全性和經濟性的指標評價體系。有鑒于此,本研究在系統梳理中成藥治療缺血性腦卒中臨床研究和經濟學評價文獻的基礎上,采用Delphi專家咨詢法構建缺血性腦卒中中成藥有效性、安全性和經濟性綜合評價指標體系,并采用層次分析法(analytic hierarchy process,AHP)設置各級指標權重,為腦卒中中成藥的綜合評價提供依據。
1 資料與方法
1.1 擬定指標體系
計算機檢索PubMed、EMbase、Cochrane Central Register of Controlled Trials(CENTRAL)、CNKI、VIP和WanFang Data數據庫,搜集中成藥治療缺血性腦卒中的相關研究,檢索時限為建庫到2020年7月。文種限制為英文和中文。研究類型為隨機對照試驗和經濟學評價,提取納入研究中描述中成藥治療缺血性腦卒中有效性、安全性和經濟性的指標,匯總整理后形成綜合評價指標池。根據指標池條目,使用頭腦風暴法和小組討論,修改和完善指標條目,初步形成缺血性腦卒中中成藥綜合評價指標體系。
1.2 構建指標體系
1.2.1 專家遴選
邀請從事神經內科、神經外科、中醫腦病科、中西醫結合科、循證醫學、臨床流行病學、衛生統計學、政策評價研究、衛生經濟學等腦卒中診療或研究相關,且具備中、高級專業技術職稱的專家開展Delphi專家咨詢。
1.2.2 咨詢問卷
專家依據指標的重要性和可行性對各指標進行打分,并對指標體系設置、指標增減等提出建議;同時,按專家對指標熟悉程度與判斷依據進行打分,用以評價專家權威程度。評分采用Likert 5級評分,分值越高表明此指標越重要、可操作性越高[11-12]。
1.2.3 咨詢過程
通過電子郵件的方式進行咨詢。在發放第一輪專家咨詢問卷時,詳細向專家說明本研究的背景、目的和方法。第一輪問卷回收后,分析問卷結果,整理專家意見,經課題組討論后,修改完善指標,形成第二輪咨詢問卷;同時邀請專家對指標及條目作進一步的指導和建議。
1.2.4 指標篩選方法
本研究采用主觀評價法從重要性和可及性角度篩選指標,按照專家對各指標平均評分高低來挑選指標,舍棄得分較低且臨床不常用的指標。同時結合專家意見,進行指標篩選和修訂。
1.2.5 可靠性分析
可靠性采用專家積極系數、權威程度和協調程度進行評價。其中,專家的積極系數表示專家對本研究的關心程度,以咨詢問卷的回收率表示[13]。專家的權威程度(Cr)通過專家對評價指標的判斷依據(Ca)和專家對指標的熟悉程度(Cs)得出[14]。專家意見協調程度可判斷專家對指標的評價是否存在較大分歧,采用變異系數(專家對單個指標的協調程度)和Kendall’s W系數(專家對全部指標的協調程度)來表示[13]。
1.3 確定指標體系
1.3.1 專題小組討論
對專家意見不一致的指標及專家相關建議,邀請課題組相關研究人員進行專題小組討論,進一步完善指標體系。
1.3.2 現場專家共識
專題小組討論后,采用現場專家共識法,邀請相關領域專家再次討論、修改和完善,最終達成一致意見,確定缺血性腦卒中中成藥綜合評價指標體系。
1.4 確定指標權重
1.4.1 指標權重的計算
1.4.1.1 構建層次結構與兩兩比較判斷矩陣
對總評價目標進行連續性分解,建立目標層、準則層和方案層三個遞階層次模型;繪制綜合評價缺血性腦卒中中成藥的目標樹圖,構建指標兩兩比較判斷矩陣,邀請專家采用Saaty 1~9標度法對同一矩陣中多個指標的相對重要性進行兩兩比較打分[15-16]。
1.4.1.2 計算初始權重系數Wi’
按照公式計算矩陣中每個評價對象的初始權重系數Wi’,m為待評價層次的子目標數,aim為第i層第m個指標的重要性評分。
1.4.1.3 計算歸一化權重系數Wi
按照公式計算歸一化權重系數Wi;此外,對于二、三級指標需計算各指標的組合權重,既考慮其在本級指標中的權重分配,又考慮其在整個指標體系中的權重分配[17]。
1.4.2 一致性檢驗
采用Python 3.7.3軟件對各級指標權重矩陣進行一致性檢驗。一致性檢驗公式為,λmax為最大特征根。依據Saaty標度法查找m對應的平均隨機一致性指數(RI),計算一致性比率(CR):
。通常情況下,CR越小說明矩陣一致性越好,當CR<0.10時,認為判斷矩陣具有良好的一致性,否則對判斷矩陣進行修正[18-20]。
2 結果
2.1 評價指標體系初步擬定
初檢共獲得相關文獻14 101篇,匯總整理所有指標后建立的缺血性腦卒中中成藥綜合評價指標池共包含317個指標,其中有效性261個,安全性52個,經濟性4個。基于指標池,通過對相同指標進行去重、同類指標進行歸類,并經頭腦風暴法和專題小組討論后初步形成的綜合評價指標體系包括3個一級指標、13個二級指標、37個三級指標,從有效性、安全性和經濟性三個維度進行綜合評價。
2.2 評價指標篩選與指標體系構建
2.2.1 研究的可靠性分析
本研究共邀請了27位來自北京、上海、廣東、河南、甘肅、四川等9個省(市),17家醫療機構和相關單位的腦卒中相關領域臨床專家和方法學家。專家從事相關工作年限平均為11.76年;16位(64.00%)專家具有高級職稱,22位(88.00%)專家具有博士學歷;所有專家均來自醫療和科研崗位。其中,9位(36.00%)為中西醫結合領域專家,9位(36.00%)為西醫領域專家,7位(28.00%)為方法學專家;專家所在部門/科室包括神經科、老年科、腦病科、中西醫結合科、針灸科、衛生經濟學評價和循證醫學等。
2.2.1.1 專家的積極系數
第一輪共發放咨詢問卷27份,回收25份,回收率92.59%;第二輪共發出25份咨詢問卷,回收24份,回收率96.00%。兩輪專家積極系數均>70%,表明專家具有很高的積極性。
2.2.1.2 專家權威程度
根據專家咨詢結果,計算一、二、三級指標的權威程度,除中醫證候積分權威系數Cr為0.776 1外,其他各級指標的權威系數均在0.800 0以上(最大為0.956 3)。一般認為,專家權威系數Cr≥0.70為可接受信度[21],本研究結果顯示,25位專家對綜合評價指標體系中所涉及指標的權威程度比較高,結果可信。
2.2.1.3 專家意見的協調程度
兩輪專家咨詢的變異系數均數分別為0.27和0.25,重要性評分Kendall’s W分別為0.224(P<0.001)、0.370(P<0.001),可及性評分Kendall’s W分別為0.211(P<0.001)、0.255(P<0.001)。本研究第二輪的專家意見協調系數高于第一輪,經χ2檢驗,P值均小于0.001,可認為兩輪咨詢專家意見的協調程度好(表1)。

2.2.2 指標篩選
2.2.2.1 第一輪專家咨詢結果
綜合考慮專家對指標重要性和可及性的評分結果及相應修改意見,對指標體系做如下調整:① 一級指標未做修改;② 二級指標中,有效性評價從器官功能水平層面、個體活動能力層面、社會參與度、中醫療效評價、卒中并發癥和終點事件發生6個層面進行評估;安全性評價從肝功能、腎功能、胃腸道、心血管等器官層面進行評估;經濟性評價從臨床決策和醫療保險決策兩個方面按研究目的進行評估;③ 指標評估數量:二級指標從13個增為15個、三級指標從37個增為42個。
2.2.2.2 第二輪專家咨詢結果
第二輪專家咨詢中各指標評分的標準差和變異系數較第一輪均有所減小,評分逐漸集中,表明專家意見趨向一致。根據咨詢問卷的統計分析結果和專家反饋意見,對第二輪指標再次進行了修改和完善:① 一、二級指標未做修改;② 三級指標中,刪除了“肺炎”、“心肌梗死”和“惡心嘔吐”等指標,將三級指標數量從42個精簡為33個。
2.3 評價指標體系確立
2.3.1 優化指標體系
對第二輪Delphi問卷調查結果顯示臨床常用但異質性較大的指標開展專題小組討論與現場專家共識,對指標體系的構建進行了精煉和優化:① 一級指標未做修改;② 二級指標中,有效性評價的“個體活動能力”修改為“日常生活活動能力”,“生活質量改善”修改為“生活質量”;安全性評價的“并發出血事件”修改為“嚴重出血事件”;③ 三級指標中,具有相同評估功能的量表保留臨床使用率較高的,簡化卒中并發癥和終點事件的類型;為更全面地評估中成藥對腎功能的影響,新增一個臨床常用的腎功能評估指標。
2.3.2 建立指標體系
最終建立的缺血性腦卒中中成藥綜合評價指標體系包括:3個一級指標(有效性、安全性和經濟性),15個二級指標,33個三級指標(表2)。其中,① 有效性評價的二級指標包括神經功能缺損情況、日常生活活動能力、生活質量、中醫療效評價指標、卒中并發癥和終點事件。② 安全性評價的二級指標包括肝功能損害、腎功能損害、胃腸道不適、心血管異常、過敏反應和嚴重出血事件。③ 經濟性評價的二級指標設置臨床決策和醫保決策兩個不同的應用場景,在增量成本-效果比指標和增量成本-效用比指標的基礎上,臨床決策場景增設成本指標,醫保決策場景增設基金預算影響指標。

2.4 指標體系權重確定
2.4.1 建立遞階層次結構和指標兩兩比較判斷矩陣
本研究建立的綜合評價指標體系共分為三層結構:目標層即構建缺血性腦卒中中成藥綜合評價指標體系;準則層分為三個亞層,分別對應一、二、三級指標;方案層即確定各指標的權重。以療效評價的二級指標(表3)為例,其判斷矩陣評分結果顯示,如神經功能缺損情況與日常生活活動能力的相對重要性比值為3,說明神經功能缺損情況較日常生活活動能力更重要,其余指標的對比比較判斷以此類推。

2.4.2 計算各指標歸一化權重并進行一致性檢驗
根據各矩陣指標兩兩比較評分得到各指標歸一化權重及一致性檢驗結果:其中,療效評價的二級指標歸一化權重及一致性檢驗結果顯示,神經功能缺損情況、日常生活活動能力、生活質量、中醫療效評價、卒中并發癥和終點事件的歸一化權重分別為0.342 3、0.207 3、0.164 6、0.084 6、0.108 8和0.092 4;一致性指標CI=0.063 4,隨機一致性比例CR=0.051 1,二者均<0.1,表明該判斷矩陣具有良好的一致性(表4)。

此外,二、三級指標在歸一化權重的基礎上乘以其上級指標權重得到的組合權重即為最終權重。各級指標所得權重顯示:一級指標有效性、安全性和經濟性的權重分別為0.626 4、0.301 2和0.072 4;二級指標權重大于0.100 0的指標包括神經功能缺損情況、日常生活活動能力和生活質量指標;三級指標權重大于0.050 0的指標分別包括美國國立衛生研究院卒中量表(national institutes of health stroke scale,NIHSS)評分、改良Rankin量表(modified Rankin score,mRS)評分、改良Barthel指數、腦卒中專用生活質量量表(stroke-specific quality of life,SS-QoL)評分、中醫證候積分和谷丙轉氨酶(alanine aminotransferase,ALT)升高指標(表2)。
3 討論
本文報告了缺血性腦卒中中成藥綜合評價指標體系的構建方法和實施過程。通過系統文獻復習、Delphi專家咨詢、專題小組討論和現場專家共識,建立了有效性、安全性和經濟性3個維度下的缺血性腦卒中中成藥綜合評價指標體系,并采用AHP賦予各級指標權重,實現了綜合評價指標體系從定性到定量的轉化,有利于減少主觀判斷的偏差,確保評估指標體系構建方法的可靠性和科學性。
咨詢專家的選擇是Delphi法成敗的關鍵[22],本研究選取的專家來自全國東部、中部和西部9省(市),17家醫療機構和科研院所,專業涵蓋神經內科學、神經外科學、中醫腦病學、衛生經濟學評價和循證醫學等,專家代表性好;咨詢專家從事腦病學和方法學相關工作平均10年以上,絕大部分為博士學歷且具有高級職稱,保證了專家組具有較高的學術權威性。咨詢專家主要是臨床和方法學專家,未來的研究若能納入患者代表、政策決策者等其他利益相關群體,可能會進一步提高綜合評價指標體系的可推廣性。
專家的積極系數反映專家對研究關心合作的程度。Delphi專家咨詢法相關研究顯示,專家積極系數為63%~84%[23-24]。本研究兩輪函詢的專家積極系數分別為92.59%和96.00%,表明專家的積極性高,對調查的內容關心。本研究函詢專家的權威系數均大于0.7,說明專家的權威程度較高,結果相對可靠。經過兩輪函詢,變異系數和Kendall協調系數第二輪均優于第一輪,Kendall協調系數高于部分文獻報告的0.22和0.26[25],且差異有統計學意義(P<0.001),說明專家意見趨于一致,咨詢結果可信。AHP結果顯示,所有指標權重系數的一致性檢驗CR值均小于0.1,說明該綜合評價指標體系的設置符合邏輯,指標權重分配合理。
本研究從多個維度對藥品進行綜合評價,不僅考慮了西醫的臨床重要結局指標,也同時設置了中醫特色的“中醫療效評價”指標和“中醫證候積分”指標,這對于中成藥的療效評價具有重要意義。此外,為提高指標的適用性,經濟學評價分別考慮了臨床決策和醫療保險決策兩個不同的應用場景,以期滿足不同研究視角的評價需求。
從當前指標體系的權重設置來看,一級指標中有效性和安全性的權重值相對較高,分別為0.626 4和0.301 2,體現了在臨床診療中對上市后中成藥療效和用藥安全的重視。二級指標組合權重值較大的為神經功能缺損情況(0.214 4)、日常生活活動能力(0.129 9)和生活質量(0.103 1),均大于0.100 0。缺血性腦卒中是一種因動脈粥樣硬化或血栓栓塞導致缺血中心區域神經元發生不可逆壞死的心腦血管疾病[26-27],由于腦組織結構損傷和部分腦功能喪失,從而出現相應的神經系統功能缺損[4,27],嚴重影響患者的生活質量[2,28]。因此,在評估腦卒中中成藥有效性時,綜合考慮了患者的器官功能水平、個體活動能力和社會參與度,旨在全面評估腦卒中患者用藥后神經功能缺損情況、日常生活活動能力和生活質量。
中成藥作為傳統中醫藥理論與現代生產工藝相結合的產物,在評價中成藥的臨床療效時也應使用能突出中醫特色的評價指標。本課題組在構建缺血性腦卒中中成藥綜合評價指標體系時,特別考慮了這一要點,在兩輪Delphi專家咨詢和現場專家共識中,中醫療效評價指標得到咨詢專家的認可,指標體系中設置了相關三級指標“中醫證候積分”,權重值為0.053 0。值得注意的是,由于目前存在中醫證候分類不一、證候名稱應用不規范和證候診斷標準不一致的現象[29],給科學合理評價中成藥療效帶來了挑戰。未來需要繼續開展和規范中醫證候的相關研究,為中醫證候積分科學評價中醫藥干預的療效提供研究基礎。此外,國內學者采用混合研究方法制定了中成藥綜合評價指標體系[30],該研究從“安全、有效、經濟、應用、科學和標準”六個維度建立了中成藥綜合評價應重點考慮的條目。與該研究不同的是,本研究聚焦于腦卒中這一中醫藥優勢病種,指標體系的設置基于腦卒中的疾病特點和腦卒中中成藥的功效特點,因此制定的指標體系主要適用于缺血性腦卒中中成藥的綜合評價。
本研究構建的缺血性腦卒中中成藥綜合評價指標體系不僅考慮了西醫常用的重要指標,同時兼顧中醫治療的特點,突出中醫療效評價特色指標。缺血性腦卒中中成藥綜合評價指標體系的建立具有重要臨床應用價值:① 可從有效性、安全性和經濟性三個維度對缺血性腦卒中中成藥進行綜合評價,為上市中成藥的綜合評價和推薦提供基礎和依據;② 可為今后開展其他類藥品的綜合評價與推薦提供方法學示范;③ 還可指導該領域臨床試驗設計、系統評價開展和臨床實踐指南制訂等如何選擇研究結局指標。
總之,本研究從有效性、安全性和經濟性3個維度構建了缺血性腦卒中中成藥綜合評價指標體系,包括一級指標3個、二級指標15個、三級指標33個;同時采用AHP賦予各級指標權重。該評價體系充分考慮了臨床決策和醫保決策不同的應用場景,同時兼顧中醫特色指標,為綜合評價缺血性腦卒中中成藥的有效性、安全性和經濟性提供了基礎和依據。此外,該指標體系對腦卒中臨床試驗結局指標設計、系統評價開展、臨床實踐指南制定等研究結局指標的選擇均具有重要意義。