中醫藥具有獨特的理論體系和療效優勢,但因缺乏高質量的臨床證據而阻礙了其在更廣范圍內得到認同[1-2]。選擇合適的結局指標是臨床研究成功的關鍵之一。中醫藥臨床研究結局指標存在著不規范、不合理、不全面、同類目的研究結局指標選擇差異大等問題[3]。核心指標集(core outcome set,COS)是指特定疾病或健康領域的臨床研究必須測量和報告的、統一的、標準化的最小結局指標集合[4],建立中醫臨床研究核心結局指標集是解決上述結局指標問題的有效途徑[5]。2012年第一個中醫藥相關COS研究[6]在COMET網站注冊,2013年Zhang等[7]提出建立中醫藥領域COS的建議。此后,中醫藥領域核心結局指標集(core outcome set on traditional Chinese medicine,COS-TCM)研究數量日益增多。
既往有研究[8]基于COS研究注冊平臺COMET(core outcome measures in effectiveness trials)數據庫對COS-TCM研究的現狀進行了分析,發現目前COS-TCM研究存在中醫特色指標關注不足、核心指標集適用范圍不清、患者及公眾參與力度不充分等問題。但是,該研究主要關注注冊信息,鑒于注冊信息完整度不如已發表文獻,且可能與實際研究存在不一致的情況,此外也有一些COS-TCM研究并未進行注冊。因此,有必要總結分析有關COS研制方法的知識和趨勢,這將有助于我們獲取目前COS研究的熱點、可借鑒的流程、研制方法的改進和方法學進展等信息[9]。概況性評價是一種識別和整理研究證據的方法,能幫助研究者全面了解某一領域現有研究的數量、屬性及特征[10],有助于了解該領域研究現狀、明確研究進展及存在的問題。本研究擬采用概況性評價方法,基于已發表的COS-TCM研究,分析總結目前COS-TCM研究現狀以及可能存在的問題并提出可能的解決思路,以期為今后COS-TCM相關研究提供借鑒。
1 資料與方法
1.1 納入與排除標準
納入標準:COS-TCM研究方案、COS-TCM研究的中間環節文章(如系統評價、定性研究結果等)、COS-TCM研究結果。
排除標準:重復發表文章、COS-TCM研究方法學類文章。若期刊文章與學位論文有重復,優先納入期刊文章。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、PubMed、Web of Science、Embase和Cochrane Library數據庫搜集COS-TCM相關研究,檢索時限均從建庫至2023年4月18日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:核心指標集、核心指標、結局指標、COS、中醫、中藥、針灸、推拿、導引、針刺、艾灸等;英文檢索詞包括:core outcome set、core outcome sets、COS、 traditional Chinese medicine、Chinese medicine、TCM、acupuncture、moxibustion、massage等。
1.3 數據篩選與資料提取
由2位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:文獻基本特征(題目、作者、發表期刊、發表年份)、疾病類型、COS研究適用范圍、研制方法(① 系統評價:“PICO”納入標準、納入研究數量和結局指標數量;② 定性研究:樣本量、參與者、調查內容和數據收集方式;③ Delphi調查:納入結局指標數、最終結局指標數、研究目的、包含的利益相關群體、應答人數、調查輪次、評分量表、反饋形式等;④ 共識會議:參與者、共識定義、會議舉辦方式、投票評分方式、匿名情況;其他方法)、利益相關者、相關結局指標情況(指標域分類情況及依據、結局指標測量工具、中醫特色相關結局指標、最終COS結局指標數量)等。
1.4 統計分析
采用SPSS 18.0軟件進行描述性統計分析。對納入的COS-TCM相關研究特征進行歸類、累計、排序和列表,包括對其研制步驟、利益相關者、指標相關情況等進行頻數和構成比的計算和報告。
2 結果
2.1 納入研究的基本特征
初檢出相關文獻8 303篇,逐層篩選后,最終納入文獻42篇,涉及28項COS-TCM研究。42篇文獻中,14篇(33.33%)為研究方案,14篇(33.33%)為研制中間環節相關文章(其中,系統評價10篇,中醫證候COS結果1篇,完成原始指標池構建和部分共識過程3篇),另外14篇(33.33%)為COS-TCM研制結果。除2014年發表的1篇穩定型心絞痛方案的會議論文[11]外,其他文獻發表年份集中在2018—2023年。納入28項研究中,有14項研究已完成最終COS的發布,完整研究方案和最終結果發表的時間間隔為1~3年,納入研究的基本特征見表1。

2.2 COS-TCM研究情況
本研究將從COS-TCM研究的注冊與方案制定、確定COS-TCM的步驟、利益相關者、指標相關情況等方面描述和分析。
2.2.1 COS-TCM研究的注冊與方案制定情況
在COMET網站,經查重和篩選后得到98項COS-TCM研究的注冊信息,將納入的文獻與COMET網站COS-TCM研究注冊信息進行匹配后發現,1項納入研究未進行注冊。14項已發布最終COS的研究中,僅有4項研究發表了研究方案。因有2項研究[12-13]只發表了系統評價類論文,未能獲取更多的信息,故后面只描述分析26項已發表方案或結果的研究。
2.2.2 確定COS-TCM的步驟
納入分析的26項研究中,除1項研究[14]僅利用系統評價和統計分析方法構建COS外,其余研究都混合采用了多種研究方法。系統評價使用頻率最高(26項),其次是共識會議(25項)和Delphi調查(24項);其中有20項研究綜合運用了系統評價、定性研究、Delphi調查和共識會議。原始結局指標池構建方面,26項研究均采用了系統評價方法,其中20項研究還結合使用了定性研究方法;另外,有2項[15-16]包含了安全性指標的研究,計劃通過提取藥品說明書的方法獲得原始結局指標清單。
2.2.2.1 系統評價
在其系統評價的環節中,11項(11/26,42.31%)研究僅納入了文獻數據庫,2項(2/26,7.69%)研究[17-18]僅納入臨床試驗注冊信息,其余13項(50.00%)研究兩者均納入。所有系統評價均納入了隨機對照試驗。除1項研究[19]只檢索了中文數據庫外,其余研究均檢索了中、英文數據庫。13/26項(50.00%)研究的系統評價中,納入標準內容與所描述的COS-TCM應用范圍存在不一致的情況,主要體現在干預措施和應用場景上。干預措施方面,有2項研究[20-21]的系統評價納入了干預措施為任何類型的文獻,但應用范圍中的干預措施是中醫/中西醫相關;另1項研究[22]的系統評價僅納入口服中藥湯劑、中成藥或靜脈注射中藥制劑的研究,應用范圍的干預措施增加了針灸、推拿、中醫康復等中醫藥相關治療。應用場景方面,主要是COS應用場景的范圍大于系統評價納入的研究類型,如系統評價僅納入了隨機對照試驗,而COS應用范圍拓寬至所有臨床研究。
2.2.2.2 定性研究
定性研究的目的是為了獲取患者和臨床醫生關心的結局指標,以補充系統評價的結果,完善結局指標原始條目池。本研究納入的COS-TCM研究中,20項研究采用了定性研究,其中一半(10項)只使用了半結構化訪談。定性研究參與者數量范圍為30~452人。所有定性研究都納入了患者,其中10項研究同時納入臨床醫生和患者。對于臨床醫生,研究者多直接詢問或讓其填寫他們覺得重要的結局指標,個別研究咨詢了測量工具/時點和指標分類方式;對于患者,除了詢問他們關心的結果和疾病情況外,研究者還通過詢問確診后/治療帶來的不便和困擾、預期的治療效果等問題,以獲取患者關心的結局指標。
2.2.2.3 Delphi調查
24項COS-TCM研究報告了Delphi調查過程,方法學特征見表2。調查方式包括采用電子郵件、社交應用程序發送電子問卷和面對面填寫紙質問卷。調查指標(條目)數為57~218個;調查目的均為達成共識和提出反映小組共識的結果并生成條目,7項(29.17%)研究還對生成的條目進行了排名。納入研究均報告了參與調查的利益相關群體,邀請的參與者人數為25~223人,應答率在39%~100%之間。所有研究均事先確定了Delphi調查的次數,每輪調查時間為24小時~4周不等,但只有1項(4.17%)研究[23]報告了每輪Delphi調查之間的間隔時間。

2.2.2.4 共識會議
共23項研究報告了共識會議完整過程,13項(13/23,56.52%)研究的共識會議環節納入了患者。會議舉辦方式多樣,15項(15/23,65.21%)研究采取面對面會議方式,2項(8.70%)研究[17-18]采取了線上會議,2項(8.70%)研究[23-24]使用了在線問卷調查,1項(4.35%)研究[25]使用了視頻會議結合在線電子問卷,2項(8.70%)研究[26-27]未提及舉辦方式。會議參與者通過討論、投票、評分等方法達成共識,14項(14/23,60.90%)研究說明了匿名投票評分,其中8項研究[20,22,28-33]規定“如有任何意見沖突,通過名義小組法解決”。
2.2.2.5 共識定義
納入的26項COS-TCM研究中,20項研究事先確定了共識定義,其中12項研究的共識定義與Delphi調查采用同一標準。通過分析發現,納入COS-TCM的共識定義共12類(表3),其中14項研究按事先制定的原則將共識分為“對納入達成共識、對排除達成共識、未達成共識”三級。采用三級共識定義的14項研究中,5項研究[25,29,31,34-35]使用“70%/15%”的共識定義,6項研究[16,18,21,28,36-37]使用“70%/50%”的共識定義。5/20項研究[15,18,20,23-24]的共識會議采用了投票的方式規定共識標準,其中4項研究[15,18,23-24]選擇了“70%”為共識納入排除的界值。

2.2.3 COS-TCM納入的利益相關者情況
納入的26項COS-TCM研究中,臨床醫生(25項)是最常見的參與者,其次是方法學家(23項)和患者/照顧者(23項),見表1。利益相關者招募方面,除1項研究[18]使用社交平臺招募外,其他研究多通過醫院邀請患者參與研究。衛生專業人員招募方式較為多樣,Delphi調查環節中,4項研究[15-16,34,37]通過醫院招募專家,8項研究[15-16,18,21-22,29,31,35]還通過相關學會邀請專家參與,部分研究還通過網絡社交媒體、論文期刊、COS網站、大學循證醫學中心邀請專家群體參與。只有1項研究[17]納入了國外專家作為利益相關者群體。患者參與環節包括指導委員會、工作組、定性研究、Delphi調查、患者調查和共識會議,其中有20項研究患者參與了定性研究過程,11項研究中患者全程參與了原始結局指標池構建和達成共識的過程。15項研究對如何為患者/照顧者參與COS研究提供幫助進行了一些說明:9項研究提到了在開始前向患者解釋研究內容及目的,其中3項研究[15,21,28]還將提供書面材料供患者閱讀;8項研究[15-16,18,21,30-31,34,37]提出研究使用通俗易懂的語言為患者設計簡單的問卷,2項研究[26,34]為結局指標提供了定義和解釋;6項研究[15,18-19,26,28,31]采用面對面填寫問卷的方式,讓研究人員在患者填寫問卷期間提供解釋和幫助;2項研究[29,31]在正式開始前進行了試點以相應地修改問卷;1項研究[18]報告了在患者完成問卷后給予獎勵。
為了使患者更好地參與COS研究,部分研究對患者參與Delphi調查或共識會議的形式進行了調整:1項研究[16]將Delphi調查分為專家Delphi調查與患者Delphi調查,2項研究[15,18]將患者從Delphi調查分離,額外設置了患者調查;考慮到患者因專業知識缺乏對指標理解和評分較為困難,此3項研究將患者達成共識的方式從常見的評分改為投票。此外,1項研究[20]將共識會議分為患者共識會議和專家共識會議。
2.2.4 COS-TCM結局指標相關情況
① 指標域:指標域分類方法不一,其中有8項研究參考“COMET網站結局指標框架”[38],4項研究根據結局指標的功能屬性分類,6項研究參考了其他文獻及標準(PRO-CTCAE[39]、中國COS研究中心發布的COS研制技術規范[40]、COMET手冊[41]等),1項研究[42]的指標域分類通過研究小組討論及專家訪談制定,7項研究未提及指標域分類的參考依據。② 中醫特色結局指標:在已發布結果的14項COS-TCM研究中,4項研究[14,18-19,43]的最終核心指標包含了中醫特色結局指標(中醫證候積分、中醫證候、臨床癥狀積分、證候療效、中醫證候主證評分、中醫證候次證評分);3項研究[22,24-25]經專家討論后保留了中醫特色指標域,但暫無結局指標和測量工具推薦,需待后續更新;7項研究的最終COS未包含中醫特色結局指標。此外,3項研究方案[21,35-36]提出了利用系統評價、病歷回顧性研究、橫斷面調查、參考中醫古籍等方法構建中醫證候初步清單。③ 測量工具:在完成了最終COS制定的14項研究中,3項研究[18,24,30]為最終的COS推薦了測量工具/定義;1項研究[19]對測量工具的推薦未達成共識,但確定了測量時間點;3項研究[26-27,34]計劃在后續開展測量工具集的研究以推薦測量工具和時點;只有1項研究[20]將其作為一個過程進行,構建了核心結局指標測量工具集。此外,6項研究方案[15,21,29,32,35,37]也提出了推薦結局指標測量工具和時點的計劃,但其中1項研究[43]在最終成果構建時,因納入的大部分是客觀指標,因此除了推薦采用SF-36量表作為工具外,并未推薦其他結局指標的測量工具,且由于對每個結局指標測量時間研究的證據不足,因此未推薦結局指標測量時間。
3 討論
COS研制在中醫藥領域越來越受到重視,相關COS-TCM研究發表數量整體呈增長趨勢,方法上大致遵循相應的國際通用指南,但仍存在以下一些不足。具體表現在:
① COS-TCM研究的注冊信息不全或者未注冊:在匹配納入文獻與注冊信息時發現,存在研究注冊信息相對不夠詳細的情況。比如:本文納入的2項針灸COS相關研究[23,26]的注冊信息均未說明干預措施為中醫或者針灸相關。建議今后COS-TCM在研究注冊以及文章發表時,應注意提及COS-TCM研究的中醫藥信息,便于后續COS-TCM研究的檢索和應用。此外,納入的COS-TCM研究中有1項研究[14]未進行注冊也無方案發表,其注冊信息的缺失不利于研究質量評價人員對其透明度和報告質量進行評價,且容易引起同類COS的重復研究造成資源的浪費,也對其在臨床試驗中的應用造成一定的阻礙。
② 原始指標池構建時納入文獻范圍與最終COS范圍不一致:部分COS-TCM研究中系統評價的納入、排除標準與核心結局指標集應用范圍存在不一致,這些不一致可能會影響最終COS應用。
③ Delphi調查存在一些方法學缺陷:Delphi調查是國際COS研究使用頻率最高的方法,納入的COS-TCM研究存在部分細節報告不充分或未報告的情況,報告的實施方法也存在差異。納入分析的研究中,均反饋了每輪調查結果,但有些研究未報告具體的反饋形式。邀請的參與者數量極差較大且部分數量過多(25~223例),已完成的Delphi研究中最低應答率僅有39%[22],而每輪Delphi調查的時間最少的僅有24小時[17]。一些研究Delphi調查指標個數過多,有的甚至超過200個[43];此外,Delphi問卷的結局指標排序較少報道。有研究表明核心指標集中的Delphi調查實施的差異會影響參與者的體驗和共識結果的產生。過多的參與者、過長的清單[44]、難以理解的名詞、耗時的輪次[45]將導致參與者流失,降低應答率;調查輪次的時長和間隔時間、是否反饋上一輪參與者的答案[46]及不同的反饋方式[47]等均可能影響參與者評分的改變和不同利益相關群體之間的共識,進而影響最終COS。不同的評分量表(9分、7分、5分、3分)也會影響Delphi輪次中評分結果的比例[48],但哪種評分方式更具優勢尚無定論。本文中納入的COS-TCM研究均采用了9分法的待選答案,這表明對9分法有廣泛認可。問題的設置順序會影響參與者的評分,正式調查前的試點和條目的隨機化排序可以減少一些潛在的偏倚[49]。綜上所述,COS-TCM研究應詳細報告Delphi調查的細節,以便于COS研究者和COS使用者進行借鑒或評估。
④ 達成共識的定義不統一:COS-TCM達成共識的定義多樣,“對納入達成共識”、“對排除達成共識”、“未達成共識”的共識達成標準的分類最常見;指標評分結果中“關鍵”得分的閾值百分比多傾向選擇“70%”;Delphi調查中達成共識的利益相關群體選擇也有區別,比如“所有參與者”、“至少一個利益相關群體”。目前并無證據表明哪種共識定義更好,但研究者應首先在研究方案中予以明確規定,以避免后續因修改標準引起的偏倚。
⑤ 利益相關群體來源較單一,尤其是缺少國際代表:本次納入的研究患者參與率較高,88.46%的研究邀請了此利益相關群體,57.69%的研究報告了提高患者的參與度與完成度的措施。部分研究針對患者參與Delphi調查進行了一些改進,也表明了研究者對更好地促進患者參與的思考與重視。但存在利益相關者尤其是患者的招募方面,僅通過1~2家醫療機構招募,來源較為單一;對招募條件報告不充分,且部分研究在研制過程中未納入在方案或方法部分計劃招募的利益相關群體且未提供解釋說明,難以判斷納入的利益相關者的代表性。此外,COS-TCM參與者主要來自中國,在一定程度上影響我國中醫藥COS研究的國際認可度。
⑥ 缺乏中醫特色結局指標:發布的14項COS-TCM研究中,只有4項(28.57%)推薦了中醫特色結局指標,缺乏中醫相關結果影響了關鍵中醫特征的反映。造成COS-TCM中醫特色相關指標缺乏的原因可能涉及多方面:利益相關群體多樣,部分非中醫或無中醫相關背景的參與者對中醫特色指標不理解或者西醫臨床專家對此指標不認可;中醫特色結局指標缺乏證據支持以及中醫臨床試驗常選擇西醫指標等問題使得許多利益相關者在達成共識的過程中忽視了與中醫相關結果;中醫相關的癥狀指標與常見的疾病癥狀重疊而影響了共識過程中兩者的分辨[22];證候缺乏統一、公認的標準,其適用性和可接受性亟待提高[50];中醫證候量表日益成為證候轉化為臨床療效評價指標的載體,但其標準化、臨床應用、評價療效的反應度仍待研究[51];中醫證候指標只納入了相關癥狀,未提供如何評價的方法,仍需進一步探討其評價方式。構建一個科學的、標準化的中醫證候量表[34]、操作性好的中醫證候療效評價工具[24]以評估證候的影響可能是解決方案之一。
⑦ 未指定測量工具:COS-TCM解決的是“測什么”的問題,“如何測”和“何時測”的問題可在COS-TCM完成后應根據COSMIN指南為每個核心結局指標推薦一種測量工具,以促進結局指標報告統一的總體目標[52]。本文納入的已完成COS-TCM研究中,只有1項研究構建了核心結局指標測量工具集,今后的COS-TCM研究應該加強這一塊工作。
針對以上問題,我們提出以下可能的解決策略:① 重視COS-TCM的注冊以及方案的發表。尤其注冊時,要盡量詳細地描述相關信息。② 原始指標池構建時,除了采用傳統的基于定量研究文獻的系統評價,也可增加納入與結局指標相關的定性研究文獻進行系統評價[53],可確定更多需要考慮的結局指標。③ 盡管有研究顯示,通過患者訪談補充完善的結局指標對最終形成的COS似乎沒有影響[48],但仍應重視患者參與的定性研究。這能為后續共識過程提供幫助,如使用從定性訪談獲得的患者可理解的語言構建調查問卷及為共識會議中保留患者關心、報告的結局指標提供參考。④ 在Delphi調查中,方法學專家的參與能夠對COS-TCM研究的設計進行評估,并提出針對性建議,進一步保證了COS-TCM研制過程的規范化和科學性。⑤ 對于指標域分類方面,中醫藥臨床試驗核心指標集研制技術規范[40]推薦先參照COMET手冊[41]中推薦的12類指標類型進行歸類,再以指標功能屬性為依據將收集到的結局指標進一步分類整理成中醫病證、癥狀/體征、理化檢測、生活質量、遠期預后、經濟學評估和安全性事件7個指標域。⑥ 重視中醫藥相關結局指標的收集,在指標域分類時,可以特別地將中醫藥相關指標歸為一類。⑦ 重視COS-TCM結局指標測量工具集的制定,可以在COS-TCM方案制定時,同時制定COS-TCM結局指標測量工具集制定方案,并在形成COS-TCM之后,按照既定方案開展測量工具集制定工作。⑧ 利益相關群體選擇時,除了考慮國內相關專家,也可考慮國外相關領域專家。
本研究存在的局限性:首先,盡管本研究同時檢索COMET網站、文獻數據庫以及部分手工檢索,但不排除一些灰色文獻的遺漏。其次,在匯總COS-TCM的研制步驟、利益相關者、指標相關情況時,考慮到COS-TCM研究原則上需要按照方案進行,將只發表了方案的研究與已完成COS-TCM研究一起歸納分析,這不排除部分研究在研制過程中會對方案進行修改,這將導致本研究結果與實際情況有差異。
綜上所述:近年來COS相關研究領域受到多方面重視,除了制定各個疾病領域或干預措施相關COS,COS的研究方法、報告規范等也相繼有指南發布,比如為了提高COS研究的質量,COMET工作組發布了《核心指標集報告規范》(COS-STAR)[54]、《核心指標集研制規范》(COS-STAD)[55]、《核心指標集研究方案規范》(COS-STAP)[56]規范文件。在COS-TCM研究的初期,應遵循COS-STAP、COS-STAR、COS-STAD等規范,這有助于相關研究者在研究初期制定完善的研究方案,提高其完整性、透明度和研究質量,減少研究資源的浪費[57]。未來的COS-TCM研究需注意Delphi調查的科學性及細節報告,關注利益相關者的選擇和報告,探索提升COS-TCM中醫藥特色的新方法。同時,我們也建議今后在研究注冊以及結果發表時,應強調COS-TCM研究的中醫藥特色,比如在注冊標題、摘要、干預措施欄目等增加“中醫藥干預”的說明。
中醫藥具有獨特的理論體系和療效優勢,但因缺乏高質量的臨床證據而阻礙了其在更廣范圍內得到認同[1-2]。選擇合適的結局指標是臨床研究成功的關鍵之一。中醫藥臨床研究結局指標存在著不規范、不合理、不全面、同類目的研究結局指標選擇差異大等問題[3]。核心指標集(core outcome set,COS)是指特定疾病或健康領域的臨床研究必須測量和報告的、統一的、標準化的最小結局指標集合[4],建立中醫臨床研究核心結局指標集是解決上述結局指標問題的有效途徑[5]。2012年第一個中醫藥相關COS研究[6]在COMET網站注冊,2013年Zhang等[7]提出建立中醫藥領域COS的建議。此后,中醫藥領域核心結局指標集(core outcome set on traditional Chinese medicine,COS-TCM)研究數量日益增多。
既往有研究[8]基于COS研究注冊平臺COMET(core outcome measures in effectiveness trials)數據庫對COS-TCM研究的現狀進行了分析,發現目前COS-TCM研究存在中醫特色指標關注不足、核心指標集適用范圍不清、患者及公眾參與力度不充分等問題。但是,該研究主要關注注冊信息,鑒于注冊信息完整度不如已發表文獻,且可能與實際研究存在不一致的情況,此外也有一些COS-TCM研究并未進行注冊。因此,有必要總結分析有關COS研制方法的知識和趨勢,這將有助于我們獲取目前COS研究的熱點、可借鑒的流程、研制方法的改進和方法學進展等信息[9]。概況性評價是一種識別和整理研究證據的方法,能幫助研究者全面了解某一領域現有研究的數量、屬性及特征[10],有助于了解該領域研究現狀、明確研究進展及存在的問題。本研究擬采用概況性評價方法,基于已發表的COS-TCM研究,分析總結目前COS-TCM研究現狀以及可能存在的問題并提出可能的解決思路,以期為今后COS-TCM相關研究提供借鑒。
1 資料與方法
1.1 納入與排除標準
納入標準:COS-TCM研究方案、COS-TCM研究的中間環節文章(如系統評價、定性研究結果等)、COS-TCM研究結果。
排除標準:重復發表文章、COS-TCM研究方法學類文章。若期刊文章與學位論文有重復,優先納入期刊文章。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、VIP、PubMed、Web of Science、Embase和Cochrane Library數據庫搜集COS-TCM相關研究,檢索時限均從建庫至2023年4月18日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。檢索采取主題詞和自由詞相結合的方式。中文檢索詞包括:核心指標集、核心指標、結局指標、COS、中醫、中藥、針灸、推拿、導引、針刺、艾灸等;英文檢索詞包括:core outcome set、core outcome sets、COS、 traditional Chinese medicine、Chinese medicine、TCM、acupuncture、moxibustion、massage等。
1.3 數據篩選與資料提取
由2位評價員獨立篩選文獻、提取資料并交叉核對,如遇分歧,則咨詢第三方協助判斷,缺乏的資料盡量與作者聯系予以補充。文獻篩選時首先閱讀文題和摘要,在排除明顯不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:文獻基本特征(題目、作者、發表期刊、發表年份)、疾病類型、COS研究適用范圍、研制方法(① 系統評價:“PICO”納入標準、納入研究數量和結局指標數量;② 定性研究:樣本量、參與者、調查內容和數據收集方式;③ Delphi調查:納入結局指標數、最終結局指標數、研究目的、包含的利益相關群體、應答人數、調查輪次、評分量表、反饋形式等;④ 共識會議:參與者、共識定義、會議舉辦方式、投票評分方式、匿名情況;其他方法)、利益相關者、相關結局指標情況(指標域分類情況及依據、結局指標測量工具、中醫特色相關結局指標、最終COS結局指標數量)等。
1.4 統計分析
采用SPSS 18.0軟件進行描述性統計分析。對納入的COS-TCM相關研究特征進行歸類、累計、排序和列表,包括對其研制步驟、利益相關者、指標相關情況等進行頻數和構成比的計算和報告。
2 結果
2.1 納入研究的基本特征
初檢出相關文獻8 303篇,逐層篩選后,最終納入文獻42篇,涉及28項COS-TCM研究。42篇文獻中,14篇(33.33%)為研究方案,14篇(33.33%)為研制中間環節相關文章(其中,系統評價10篇,中醫證候COS結果1篇,完成原始指標池構建和部分共識過程3篇),另外14篇(33.33%)為COS-TCM研制結果。除2014年發表的1篇穩定型心絞痛方案的會議論文[11]外,其他文獻發表年份集中在2018—2023年。納入28項研究中,有14項研究已完成最終COS的發布,完整研究方案和最終結果發表的時間間隔為1~3年,納入研究的基本特征見表1。

2.2 COS-TCM研究情況
本研究將從COS-TCM研究的注冊與方案制定、確定COS-TCM的步驟、利益相關者、指標相關情況等方面描述和分析。
2.2.1 COS-TCM研究的注冊與方案制定情況
在COMET網站,經查重和篩選后得到98項COS-TCM研究的注冊信息,將納入的文獻與COMET網站COS-TCM研究注冊信息進行匹配后發現,1項納入研究未進行注冊。14項已發布最終COS的研究中,僅有4項研究發表了研究方案。因有2項研究[12-13]只發表了系統評價類論文,未能獲取更多的信息,故后面只描述分析26項已發表方案或結果的研究。
2.2.2 確定COS-TCM的步驟
納入分析的26項研究中,除1項研究[14]僅利用系統評價和統計分析方法構建COS外,其余研究都混合采用了多種研究方法。系統評價使用頻率最高(26項),其次是共識會議(25項)和Delphi調查(24項);其中有20項研究綜合運用了系統評價、定性研究、Delphi調查和共識會議。原始結局指標池構建方面,26項研究均采用了系統評價方法,其中20項研究還結合使用了定性研究方法;另外,有2項[15-16]包含了安全性指標的研究,計劃通過提取藥品說明書的方法獲得原始結局指標清單。
2.2.2.1 系統評價
在其系統評價的環節中,11項(11/26,42.31%)研究僅納入了文獻數據庫,2項(2/26,7.69%)研究[17-18]僅納入臨床試驗注冊信息,其余13項(50.00%)研究兩者均納入。所有系統評價均納入了隨機對照試驗。除1項研究[19]只檢索了中文數據庫外,其余研究均檢索了中、英文數據庫。13/26項(50.00%)研究的系統評價中,納入標準內容與所描述的COS-TCM應用范圍存在不一致的情況,主要體現在干預措施和應用場景上。干預措施方面,有2項研究[20-21]的系統評價納入了干預措施為任何類型的文獻,但應用范圍中的干預措施是中醫/中西醫相關;另1項研究[22]的系統評價僅納入口服中藥湯劑、中成藥或靜脈注射中藥制劑的研究,應用范圍的干預措施增加了針灸、推拿、中醫康復等中醫藥相關治療。應用場景方面,主要是COS應用場景的范圍大于系統評價納入的研究類型,如系統評價僅納入了隨機對照試驗,而COS應用范圍拓寬至所有臨床研究。
2.2.2.2 定性研究
定性研究的目的是為了獲取患者和臨床醫生關心的結局指標,以補充系統評價的結果,完善結局指標原始條目池。本研究納入的COS-TCM研究中,20項研究采用了定性研究,其中一半(10項)只使用了半結構化訪談。定性研究參與者數量范圍為30~452人。所有定性研究都納入了患者,其中10項研究同時納入臨床醫生和患者。對于臨床醫生,研究者多直接詢問或讓其填寫他們覺得重要的結局指標,個別研究咨詢了測量工具/時點和指標分類方式;對于患者,除了詢問他們關心的結果和疾病情況外,研究者還通過詢問確診后/治療帶來的不便和困擾、預期的治療效果等問題,以獲取患者關心的結局指標。
2.2.2.3 Delphi調查
24項COS-TCM研究報告了Delphi調查過程,方法學特征見表2。調查方式包括采用電子郵件、社交應用程序發送電子問卷和面對面填寫紙質問卷。調查指標(條目)數為57~218個;調查目的均為達成共識和提出反映小組共識的結果并生成條目,7項(29.17%)研究還對生成的條目進行了排名。納入研究均報告了參與調查的利益相關群體,邀請的參與者人數為25~223人,應答率在39%~100%之間。所有研究均事先確定了Delphi調查的次數,每輪調查時間為24小時~4周不等,但只有1項(4.17%)研究[23]報告了每輪Delphi調查之間的間隔時間。

2.2.2.4 共識會議
共23項研究報告了共識會議完整過程,13項(13/23,56.52%)研究的共識會議環節納入了患者。會議舉辦方式多樣,15項(15/23,65.21%)研究采取面對面會議方式,2項(8.70%)研究[17-18]采取了線上會議,2項(8.70%)研究[23-24]使用了在線問卷調查,1項(4.35%)研究[25]使用了視頻會議結合在線電子問卷,2項(8.70%)研究[26-27]未提及舉辦方式。會議參與者通過討論、投票、評分等方法達成共識,14項(14/23,60.90%)研究說明了匿名投票評分,其中8項研究[20,22,28-33]規定“如有任何意見沖突,通過名義小組法解決”。
2.2.2.5 共識定義
納入的26項COS-TCM研究中,20項研究事先確定了共識定義,其中12項研究的共識定義與Delphi調查采用同一標準。通過分析發現,納入COS-TCM的共識定義共12類(表3),其中14項研究按事先制定的原則將共識分為“對納入達成共識、對排除達成共識、未達成共識”三級。采用三級共識定義的14項研究中,5項研究[25,29,31,34-35]使用“70%/15%”的共識定義,6項研究[16,18,21,28,36-37]使用“70%/50%”的共識定義。5/20項研究[15,18,20,23-24]的共識會議采用了投票的方式規定共識標準,其中4項研究[15,18,23-24]選擇了“70%”為共識納入排除的界值。

2.2.3 COS-TCM納入的利益相關者情況
納入的26項COS-TCM研究中,臨床醫生(25項)是最常見的參與者,其次是方法學家(23項)和患者/照顧者(23項),見表1。利益相關者招募方面,除1項研究[18]使用社交平臺招募外,其他研究多通過醫院邀請患者參與研究。衛生專業人員招募方式較為多樣,Delphi調查環節中,4項研究[15-16,34,37]通過醫院招募專家,8項研究[15-16,18,21-22,29,31,35]還通過相關學會邀請專家參與,部分研究還通過網絡社交媒體、論文期刊、COS網站、大學循證醫學中心邀請專家群體參與。只有1項研究[17]納入了國外專家作為利益相關者群體。患者參與環節包括指導委員會、工作組、定性研究、Delphi調查、患者調查和共識會議,其中有20項研究患者參與了定性研究過程,11項研究中患者全程參與了原始結局指標池構建和達成共識的過程。15項研究對如何為患者/照顧者參與COS研究提供幫助進行了一些說明:9項研究提到了在開始前向患者解釋研究內容及目的,其中3項研究[15,21,28]還將提供書面材料供患者閱讀;8項研究[15-16,18,21,30-31,34,37]提出研究使用通俗易懂的語言為患者設計簡單的問卷,2項研究[26,34]為結局指標提供了定義和解釋;6項研究[15,18-19,26,28,31]采用面對面填寫問卷的方式,讓研究人員在患者填寫問卷期間提供解釋和幫助;2項研究[29,31]在正式開始前進行了試點以相應地修改問卷;1項研究[18]報告了在患者完成問卷后給予獎勵。
為了使患者更好地參與COS研究,部分研究對患者參與Delphi調查或共識會議的形式進行了調整:1項研究[16]將Delphi調查分為專家Delphi調查與患者Delphi調查,2項研究[15,18]將患者從Delphi調查分離,額外設置了患者調查;考慮到患者因專業知識缺乏對指標理解和評分較為困難,此3項研究將患者達成共識的方式從常見的評分改為投票。此外,1項研究[20]將共識會議分為患者共識會議和專家共識會議。
2.2.4 COS-TCM結局指標相關情況
① 指標域:指標域分類方法不一,其中有8項研究參考“COMET網站結局指標框架”[38],4項研究根據結局指標的功能屬性分類,6項研究參考了其他文獻及標準(PRO-CTCAE[39]、中國COS研究中心發布的COS研制技術規范[40]、COMET手冊[41]等),1項研究[42]的指標域分類通過研究小組討論及專家訪談制定,7項研究未提及指標域分類的參考依據。② 中醫特色結局指標:在已發布結果的14項COS-TCM研究中,4項研究[14,18-19,43]的最終核心指標包含了中醫特色結局指標(中醫證候積分、中醫證候、臨床癥狀積分、證候療效、中醫證候主證評分、中醫證候次證評分);3項研究[22,24-25]經專家討論后保留了中醫特色指標域,但暫無結局指標和測量工具推薦,需待后續更新;7項研究的最終COS未包含中醫特色結局指標。此外,3項研究方案[21,35-36]提出了利用系統評價、病歷回顧性研究、橫斷面調查、參考中醫古籍等方法構建中醫證候初步清單。③ 測量工具:在完成了最終COS制定的14項研究中,3項研究[18,24,30]為最終的COS推薦了測量工具/定義;1項研究[19]對測量工具的推薦未達成共識,但確定了測量時間點;3項研究[26-27,34]計劃在后續開展測量工具集的研究以推薦測量工具和時點;只有1項研究[20]將其作為一個過程進行,構建了核心結局指標測量工具集。此外,6項研究方案[15,21,29,32,35,37]也提出了推薦結局指標測量工具和時點的計劃,但其中1項研究[43]在最終成果構建時,因納入的大部分是客觀指標,因此除了推薦采用SF-36量表作為工具外,并未推薦其他結局指標的測量工具,且由于對每個結局指標測量時間研究的證據不足,因此未推薦結局指標測量時間。
3 討論
COS研制在中醫藥領域越來越受到重視,相關COS-TCM研究發表數量整體呈增長趨勢,方法上大致遵循相應的國際通用指南,但仍存在以下一些不足。具體表現在:
① COS-TCM研究的注冊信息不全或者未注冊:在匹配納入文獻與注冊信息時發現,存在研究注冊信息相對不夠詳細的情況。比如:本文納入的2項針灸COS相關研究[23,26]的注冊信息均未說明干預措施為中醫或者針灸相關。建議今后COS-TCM在研究注冊以及文章發表時,應注意提及COS-TCM研究的中醫藥信息,便于后續COS-TCM研究的檢索和應用。此外,納入的COS-TCM研究中有1項研究[14]未進行注冊也無方案發表,其注冊信息的缺失不利于研究質量評價人員對其透明度和報告質量進行評價,且容易引起同類COS的重復研究造成資源的浪費,也對其在臨床試驗中的應用造成一定的阻礙。
② 原始指標池構建時納入文獻范圍與最終COS范圍不一致:部分COS-TCM研究中系統評價的納入、排除標準與核心結局指標集應用范圍存在不一致,這些不一致可能會影響最終COS應用。
③ Delphi調查存在一些方法學缺陷:Delphi調查是國際COS研究使用頻率最高的方法,納入的COS-TCM研究存在部分細節報告不充分或未報告的情況,報告的實施方法也存在差異。納入分析的研究中,均反饋了每輪調查結果,但有些研究未報告具體的反饋形式。邀請的參與者數量極差較大且部分數量過多(25~223例),已完成的Delphi研究中最低應答率僅有39%[22],而每輪Delphi調查的時間最少的僅有24小時[17]。一些研究Delphi調查指標個數過多,有的甚至超過200個[43];此外,Delphi問卷的結局指標排序較少報道。有研究表明核心指標集中的Delphi調查實施的差異會影響參與者的體驗和共識結果的產生。過多的參與者、過長的清單[44]、難以理解的名詞、耗時的輪次[45]將導致參與者流失,降低應答率;調查輪次的時長和間隔時間、是否反饋上一輪參與者的答案[46]及不同的反饋方式[47]等均可能影響參與者評分的改變和不同利益相關群體之間的共識,進而影響最終COS。不同的評分量表(9分、7分、5分、3分)也會影響Delphi輪次中評分結果的比例[48],但哪種評分方式更具優勢尚無定論。本文中納入的COS-TCM研究均采用了9分法的待選答案,這表明對9分法有廣泛認可。問題的設置順序會影響參與者的評分,正式調查前的試點和條目的隨機化排序可以減少一些潛在的偏倚[49]。綜上所述,COS-TCM研究應詳細報告Delphi調查的細節,以便于COS研究者和COS使用者進行借鑒或評估。
④ 達成共識的定義不統一:COS-TCM達成共識的定義多樣,“對納入達成共識”、“對排除達成共識”、“未達成共識”的共識達成標準的分類最常見;指標評分結果中“關鍵”得分的閾值百分比多傾向選擇“70%”;Delphi調查中達成共識的利益相關群體選擇也有區別,比如“所有參與者”、“至少一個利益相關群體”。目前并無證據表明哪種共識定義更好,但研究者應首先在研究方案中予以明確規定,以避免后續因修改標準引起的偏倚。
⑤ 利益相關群體來源較單一,尤其是缺少國際代表:本次納入的研究患者參與率較高,88.46%的研究邀請了此利益相關群體,57.69%的研究報告了提高患者的參與度與完成度的措施。部分研究針對患者參與Delphi調查進行了一些改進,也表明了研究者對更好地促進患者參與的思考與重視。但存在利益相關者尤其是患者的招募方面,僅通過1~2家醫療機構招募,來源較為單一;對招募條件報告不充分,且部分研究在研制過程中未納入在方案或方法部分計劃招募的利益相關群體且未提供解釋說明,難以判斷納入的利益相關者的代表性。此外,COS-TCM參與者主要來自中國,在一定程度上影響我國中醫藥COS研究的國際認可度。
⑥ 缺乏中醫特色結局指標:發布的14項COS-TCM研究中,只有4項(28.57%)推薦了中醫特色結局指標,缺乏中醫相關結果影響了關鍵中醫特征的反映。造成COS-TCM中醫特色相關指標缺乏的原因可能涉及多方面:利益相關群體多樣,部分非中醫或無中醫相關背景的參與者對中醫特色指標不理解或者西醫臨床專家對此指標不認可;中醫特色結局指標缺乏證據支持以及中醫臨床試驗常選擇西醫指標等問題使得許多利益相關者在達成共識的過程中忽視了與中醫相關結果;中醫相關的癥狀指標與常見的疾病癥狀重疊而影響了共識過程中兩者的分辨[22];證候缺乏統一、公認的標準,其適用性和可接受性亟待提高[50];中醫證候量表日益成為證候轉化為臨床療效評價指標的載體,但其標準化、臨床應用、評價療效的反應度仍待研究[51];中醫證候指標只納入了相關癥狀,未提供如何評價的方法,仍需進一步探討其評價方式。構建一個科學的、標準化的中醫證候量表[34]、操作性好的中醫證候療效評價工具[24]以評估證候的影響可能是解決方案之一。
⑦ 未指定測量工具:COS-TCM解決的是“測什么”的問題,“如何測”和“何時測”的問題可在COS-TCM完成后應根據COSMIN指南為每個核心結局指標推薦一種測量工具,以促進結局指標報告統一的總體目標[52]。本文納入的已完成COS-TCM研究中,只有1項研究構建了核心結局指標測量工具集,今后的COS-TCM研究應該加強這一塊工作。
針對以上問題,我們提出以下可能的解決策略:① 重視COS-TCM的注冊以及方案的發表。尤其注冊時,要盡量詳細地描述相關信息。② 原始指標池構建時,除了采用傳統的基于定量研究文獻的系統評價,也可增加納入與結局指標相關的定性研究文獻進行系統評價[53],可確定更多需要考慮的結局指標。③ 盡管有研究顯示,通過患者訪談補充完善的結局指標對最終形成的COS似乎沒有影響[48],但仍應重視患者參與的定性研究。這能為后續共識過程提供幫助,如使用從定性訪談獲得的患者可理解的語言構建調查問卷及為共識會議中保留患者關心、報告的結局指標提供參考。④ 在Delphi調查中,方法學專家的參與能夠對COS-TCM研究的設計進行評估,并提出針對性建議,進一步保證了COS-TCM研制過程的規范化和科學性。⑤ 對于指標域分類方面,中醫藥臨床試驗核心指標集研制技術規范[40]推薦先參照COMET手冊[41]中推薦的12類指標類型進行歸類,再以指標功能屬性為依據將收集到的結局指標進一步分類整理成中醫病證、癥狀/體征、理化檢測、生活質量、遠期預后、經濟學評估和安全性事件7個指標域。⑥ 重視中醫藥相關結局指標的收集,在指標域分類時,可以特別地將中醫藥相關指標歸為一類。⑦ 重視COS-TCM結局指標測量工具集的制定,可以在COS-TCM方案制定時,同時制定COS-TCM結局指標測量工具集制定方案,并在形成COS-TCM之后,按照既定方案開展測量工具集制定工作。⑧ 利益相關群體選擇時,除了考慮國內相關專家,也可考慮國外相關領域專家。
本研究存在的局限性:首先,盡管本研究同時檢索COMET網站、文獻數據庫以及部分手工檢索,但不排除一些灰色文獻的遺漏。其次,在匯總COS-TCM的研制步驟、利益相關者、指標相關情況時,考慮到COS-TCM研究原則上需要按照方案進行,將只發表了方案的研究與已完成COS-TCM研究一起歸納分析,這不排除部分研究在研制過程中會對方案進行修改,這將導致本研究結果與實際情況有差異。
綜上所述:近年來COS相關研究領域受到多方面重視,除了制定各個疾病領域或干預措施相關COS,COS的研究方法、報告規范等也相繼有指南發布,比如為了提高COS研究的質量,COMET工作組發布了《核心指標集報告規范》(COS-STAR)[54]、《核心指標集研制規范》(COS-STAD)[55]、《核心指標集研究方案規范》(COS-STAP)[56]規范文件。在COS-TCM研究的初期,應遵循COS-STAP、COS-STAR、COS-STAD等規范,這有助于相關研究者在研究初期制定完善的研究方案,提高其完整性、透明度和研究質量,減少研究資源的浪費[57]。未來的COS-TCM研究需注意Delphi調查的科學性及細節報告,關注利益相關者的選擇和報告,探索提升COS-TCM中醫藥特色的新方法。同時,我們也建議今后在研究注冊以及結果發表時,應強調COS-TCM研究的中醫藥特色,比如在注冊標題、摘要、干預措施欄目等增加“中醫藥干預”的說明。