引用本文: 辛沂青, 陳澤, 吳云云, 劉宇晨, 陳輝煥, 唐純志, 陸麗明. 針刺治療干眼癥隨機對照試驗的報告質量評價. 中國循證醫學雜志, 2020, 20(10): 1199-1207. doi: 10.7507/1672-2531.202003044 復制
干眼癥是指各種原因引起與眼部不適相關的淚膜和眼表面異常的一種疾病,其病因可能是全身性疾病,例如干燥綜合征,也可是局部眼部病變導致的淚膜異常改變或淚液動力學異常改變[1]。干眼癥患者主訴為眼部異物感、畏光流淚、視力減退等,嚴重影響患者的生活工作及學習。全球干眼癥的發病率約為 5.5%~33.7%[2],其中歐美國家約為 11.0%~28.7%,亞洲其他國家約為 17%~34%[3],中國發病率約為 21%~30%[4]。當前干眼癥最常用的一線治療方式是使用人工淚液或通過配戴貼近臉部且包覆眼周的眼鏡以減少淚液蒸發,繼發性干眼病則可通過停用藥品和干預影響因素緩解病情。其藥物治療主要使用含有環孢素或類固醇成分的眼藥水[5],必要時聯合抗炎藥物,但效果不盡如人意。
針刺是目前治療干眼癥的方法之一。隨著中醫藥發展,大量關于針刺治療干眼癥的隨機對照試驗(randomized controlled trail,RCT)已經發表,然而相關 RCT 報告水平參差不齊,為后續相關研究造成一定不便。1996 年發表的 CONSORT 聲明[6],以促進研究人員對 RCT 報告質量做出評價和解釋為目的,為作者、同行評論員和編輯提供了改進 RCT 報告的指導,幫助他們明確具有潛在偏倚結果的報告,更新的最新版本為 CONSORT 聲明 2010。在 CONSORT 聲明 2010 基礎上開發的針刺臨床試驗干預措施報告標準(standards for reporting interventions in clinical trials of acupuncture,STRICTA)[7],可協助作者對針刺 RCT 進行完整報告,并協助審稿專家和讀者更好理解和評價針刺 RCT 報告內容。本文將結合以上兩種評價工具對針刺治療干眼癥 RCT 的完整性和透明度進行報告質量評價,以期為后續相關 RCT 報告提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
RCT。
1.1.2 研究對象
診斷明確的干眼癥患者。
1.1.3 干預措施
試驗組:以各種針刺方法及特種針法為主,包括針刺結合其他非藥物療法;對照組:非針刺治療手段,包括藥物治療、手術等。
1.1.4 結局指標
報告干眼癥癥狀改善等主、次要結局指標。
1.1.5 排除標準
① 治療組干預手段除針刺外,還包含藥物治療;② 以另一種針刺方法為對照的試驗;③ 重復發表的文獻,如用雙語種發表,僅納入中文版本;④ 無法獲取全文的文獻。
1.2 文獻檢索策略
計算機檢索 CNKI、VIP、CBM、WanFang Data、PubMed、EMbase 和 The Cochrane Library 數據庫,搜集國內外針刺治療干眼癥的 RCT,檢索時限均為建庫至 2020 年 2 月。同時檢索谷歌學術、百度學術等網站,以補充獲取相關文獻。中文檢索詞包括:干眼癥、干眼、針刺、針灸、針、干燥綜合征、隨機對照試驗等;英文檢索詞包括:dry eye syndromes,xerophthalmia,acupuncture,randomized controlled trails,RCT 等。以 PubMed 為例,具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先將檢索文獻題目導入 Note Express V3.X 查重后,閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:作者、發表年份、干預手段及 CONSORT 2010 聲明、STRICTA 標準條目相關信息。
1.4 納入研究的報告質量評價
CONSORT 2010 聲明評價條目分為文題摘要、引言、方法、結論、討論以及其他信息6 大部分,包括 24 項內容、37 個條目;STRICTA 評價條目是在 CONSORT 聲明的基礎上專門為針刺這一干預手段制定的評價工具,包含 6 大部分:針刺原理、針刺細節、治療方案、輔助干預措施、治療師背景以及對照或對照干預。兩種評價工具均以“報告”或“未報告”作為最終評價結果。部分條目具有“適用性”條件,條目適用評價時納入質量總體分析,不適用則可不于結論處做討論。如有報告條目為“是”,未報告條目為“否”。為保證評價一致性,由 2 名評價人員在正式評價之前進行兩輪預試驗,預評價周期 12 天。預評價結果顯示第一輪 CONSORT 評價 Kappa 值(K=0.46)及 STRICTA 評價Kappa 值(K=0.50)均較低,表明 2 名評價員對條目認知差異較大,將分歧交由第三方專家判斷;經培訓后,第二輪 CONSORT 評價 Kappa 值(K=0.80)及 STRICTA 評價 Kappa 值(K=0.85)為優良,表明不同研究者判斷的一致性良好,可以進行正式評價。對仍存在爭議的細節提交第三方裁決。
1.5 統計分析
運用 SPSS 25.0 軟件計算兩種評價工具預試驗一致性的 Kappa 值。運用 Excel 2019 計算納入 RCT 在 CONSORT 及 STRICTA 工具各領域得分及其報告率,包括中、英文獻各條目的百分比呈現、2010 年前后中、英文獻各條目報告率及對比、占樣本比例、條目總報告率。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 1 105 篇,經逐層篩選,最終納入 77 個 RCT[8-84],包括中文文獻 69 篇[8-76],英文文獻 8 篇[77-84]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本情況
納入的 77 個 RCT[8-84]中,發表時間從 2004 年~2019 年,發表國家涵蓋中國、韓國和瑞典。文獻發表數量總體隨時間而呈上升趨勢,說明近年來探討針刺治療干眼癥的相關研究的熱度逐漸上升,見圖 2。發表時間分析顯示 16 年間年發文量為 4.8 篇;69 篇中文文獻[8-76]中有 12 篇[8-19]發表于 2010 年以前,57 篇[20-76]發表于 2010 年(含)以后;8 篇[77-84]英文文獻中有 3 篇[82-84]發表于 2010 年以前,5 篇[77-83]發表于 2010 年(含)以后;2018 年是發表文獻較多的一年,共 13 篇,除 2005、2008 及 2011 年發文量較低(分別為 1、0、2)之外,其余年份年發文量在平均發表量上下浮動(表 1)。


2.3 CONSORT 評價結果
2010 年后發表的 57 篇中文文獻[20-76]所有條目平均報告率為 43.1%。條目 1a、6b、7a、7b、8a、8b、9、10、11a、11b、12b、13b、14b、15、17b、18、19、20,23、24、25 占中文文獻自身報告比例不足 50%。其中條目 6b、11b、17b、24 報告率為 0,分別屬于“方法學-結局指標”、“方法學-盲法”、“結果-結局和估計值”及“其他信息-試驗方案”這 4 部分;條目 10、12b、14b、18 僅 1 篇文獻報告,分別屬于“方法-實施”、“結果-招募受試者”及“結果-輔助分析”;條目 9“分配隱藏機制”僅有 2 篇文獻報告[47, 66],報告率僅為 3.5%;條目 1a、7a、7b、11a、12b、23 報告比例 5.3%,其余條目報告率介于 5.3%~38.6% 之間(表 2)。在報告率大于 50% 的條目中,條目 5“詳細描述各組干預措施的細節使他人能夠重復,包括它們實際上是在何時、何地實施的”、6a“完整而確切地說明預先設定的主要和次要結局指標,包括他們實際上是在何時、何地測評的”、16“納入分析的例數”、17a“各組每一項的主要和次要結局指標的結果,效應估計值及其精確性”報告率達 100% 為最高,其余條目報告率介于 64.9%~98.2% 之間(表 2)。

2010 年以后的 5 篇英文文獻[77-83]所有條目平均報告率為 66.5%。條目 3b、6b、7a、7b、14b、17b、19、24 報告率不足 50%。其中條目 3b“試驗開始后對試驗方法所做的重要改變,并說明原因”、6b“試驗開始后對結局指標是否存在任何更改,并說明原因”、7b“必要時,解釋中期分析或試驗中止原則”、14b“為什么試驗中斷或停止”、17b“對應二分類結局,建議同時提供相對效應值和絕對效應值”報告率為 0;其余條目的報告率介于 20%~40% 之間(表 2)。在報告率大于 50% 的條目中,1b、2a、2b、3a、4a、4b、6a、12a、14a、16、17a、22 報告率達 100%,其余條目報告率介于 60%~80% 之間。
英文文獻的平均報告率(66.5%)大于中文文獻(43.1%),其中差距較大的有條目 1a、3b、7a、8a、8b、9、10、11a、11b、12b、13b、15、18、23 及 25,上述條目英文文獻報告率與中文文獻報告率差值均大于 25%(表 2)。
2.4 STRICTA 評價結果
2010 年以后的 57 篇中文文獻[20-76]所有條目平均報告率為 63.5%。條目 1c、2a、4a、4b、5 報告率不足 50%,具體報告率分別為 22.8%、35.1%、35.1%、1.8%、1.8%;條目 4b“治療場所和相關信息”及條目 5“對參與研究的針灸師的描述”僅 1 篇文獻[57]報告;僅條目 1a 報告率 100%。
2010 年以后的 5 篇英文文獻[77-83]所有條目平均報告率為 69.4%。條目 1c“說明治療改變”、2a“每一受試對象每個治療單元用針的數目”、2g“針具類型”、4a“附加干預細節”、4b“治療場所及相關信息”、5“針灸師描述”報告率分別為 20%、40%、20%、20% 不足 50%;條目 1a、2b、2f、3a、3b、6a、6b 報告率達 100%,其余條目報告率介于 60%~80% 之間。中英文獻差異較大的條目主要是 2g“針具類型”、4b“治療場所和相關信息,包括對治療師的操作指南及給患者的信息和解釋”及條目 5“對參與研究的針灸師的描述”(表 3)。

3 討論
隨著中醫藥被越來越多的人所接受,眾多傳統治療方式、用藥的科學性和有效性得以通過現代研究予以驗證。其中,RCT 作為醫學研究療效評測的傳統金標準[85],其設計的科學性及試驗過程的嚴謹性和透明性是引導試驗結果最終向臨床決策轉化的關鍵。本研究根據 CONSORT 聲明和 STRICTA 標準主要針對 2010 年后發表的針刺治療干眼癥的國內外 RCT 進行報告質量評價,對比并探討納入 RCT 存在的報告問題,以便為后期針刺干預干眼癥 RCT 研究的開展提供一定參考。綜合最終評價結果,現主要存在以下問題。
3.1 按照 CONSORT 標準
中文文獻 CONSORT 條目的報告率低于英文文獻(分別為 41.4% 和 56.4%),拉低中文文獻報告率的條目主要集中在方法學、結果及其他信息三方面。其中在方法學部分的報告上缺失信息較多,對 RCT 的方法描述完整度較為欠缺。具體條目包括:3b“試驗開始后對試驗方法所作的重要改變及原因”、6b“試驗開始后對結局指標是否有任何更改及原因”、7a“如何確定樣本量”、7b“必要時,解釋中期分析和試驗中止原則”、9“分配隱藏機制”、10“隨機方法的實施”、11a“如果實施了盲法,分配干預措施之后對誰設盲以及如何實施”、11b“如有必要,描述干預措施的相似之處”、12b“附加分析的方法,諸如亞組分析和校正分析”。在以上方法學條目中,3b、6b 報告率較低主要是由于納入中文 RCT 普遍沒有發表 RCT 方案,無法比較方案和 RCT 實施中的差異。條目 7b、11b 為“必要時”報告條目,2010 年后 62 篇文獻僅 3 篇中文、3 篇英文文獻 RCT 符合其報告“必要”條件,其余文獻包括 2010 年之前發表的 15 篇文獻均不滿足必要報告條件。結合 3b、6b、7b 條目,說明在時間節點 2010 年前后,針刺治療干眼癥 RCT 仍未建立臨床試驗完整和透明化理念,對 RCT 方案和 RCT 分析方法仍缺乏全面認識。
本研究納入的文獻對方法學部分的試驗方法與結局指標方面大多僅簡單描述其核心內容,對于試驗初始階段的設計、試驗開始后對試驗方法與結局指標的更改等情況鮮見報告,使得讀者不能確定該研究中是否存在試驗方案與結局指標的更改以及對存在的更改是否如實報告等問題。在實際情況中,試驗開始后可能因課題經費、受試者招募等問題的出現進而需要調整檢查項目、干預措施、受試者合格標準,亦可能出現主次要結局指標的更改等情況。在今后的科研工作中,研究者應該如實報告此類問題,同時,嚴格遵守并報告臨床試驗注冊規范及執行情況亦能幫助研究者提高試驗設計的規范化程度及報告透明度。此外,與之關系較為密切的是 STRICTA 評分中條目 1c“說明何種治療發生了改變”,也呈低報告率,僅有 20% 的英文文獻和 22.8% 的中文文獻進行了報告。兩部分得分均較低說明了納入文獻都缺乏對試驗過程中重要數據、干預措施等數據改變的解釋性說明。雖然其原因可能是由于針刺干預手段的特殊性引起的,即針刺試驗過程較少有結局指標、干預措施的變化或較強副作用的出現。但上述條目仍在 RCT 的報告中有著重要作用,完整地對其報告能使讀者更加明確試驗的完整性、連貫性以及試驗數據的可靠性。
62 篇文獻整體上對于方法學中 7a、9、10、11a 四個條目報告率較低,英文文獻中該四個條目報告率均在 40% 以上。而中文文獻則低于 6%,表明中文文獻普遍缺乏“樣本量”、“分配隱藏機制”、“盲法”及對其兩者具體實施細節的描述。中文文獻在條目 7a(5.3%)、條目 9(3.5%)、條目 10(1.8%)及條目 11a(5.3%)上報告缺失頗多,導致其試驗質量受到質疑,故研究者在今后的研究中應該多加注意完善這些方面的匯報。
在其他信息方面,包含 2010 年以前發表的 69 篇中文文獻普遍缺乏試驗注冊信息及試驗方案獲取的相關信息,大部分中文文獻描述了試驗資金來源后沒有提供可追查源頭的途徑,部分文章僅在原文中說明注冊機構,但未提供臨床試驗注冊號;英文文獻中僅 1 篇韓國的研究提供了完整的試驗相關信息,其余 7 篇文章(5 篇來自中國)亦缺乏相關數據。推測該現象主要與試驗機構及文獻質量有關,大部分文獻的試驗機構為地級市醫院,少有省級、國家級試驗中心參與,其文章質量不高,因此對 RCT 流程把控要求較低,導致上述條目內容報告的缺失。目前國外優秀醫學雜志對于涉及人體的臨床試驗均要求提供臨床試驗注冊相關信息,國內近年來對臨床試驗的要求也逐漸完善,但在期刊發表時對于臨床試驗注冊方面仍缺乏強制性規范,國內的研究人員對于臨床試驗注冊的知曉度仍然較低[86]。
采用 CONSORT 2010 分別對 2010 年前后國內外發表的針刺治療干眼癥相關臨床研究進行評估,我們發現:2010 年以后英文文獻各條目平均報告率比 2010 年之前的文獻高出 26.8%,而中文文獻僅高出 5.9%。由此不難推斷,在 2010 年 CONSORT 標準更新后,英文文獻的報告規范化程度大幅提高,而中文文獻的規范化報告程度仍不明顯。這提示國內的研究者和科技期刊應該重視 CONSORT 標準等臨床試驗報告規范,并在科研設計、實施以及報告過程中合理運用。
3.2 按照 STRICTA 標準
中英文獻 STRICTA 報告率總體較為接近,中文平均報告率 61.9%,英文平均報告率 66.9%,兩者差別較 CONSORT 較小。結合 2010 年前發表文獻,在 STRICTA 標準更新后,中英文文獻各 STRICTA 標準條目平均報告率均有所提高,但兩者差距不明顯。表明中英文文獻報告中對于針刺干預手段的描述差距不大,相關原因可能是針灸的相關研究多由中文語境人群為主進行開展,相關操作規范也較為統一,因此在這方面中英文文獻報告均較規范。但 57 篇中文文獻普遍缺乏條目 4b“治療場所和相關信息,包括對治療師的操作指南、以及給患者的信息和解釋”及“對參與研究的針灸師的描述(資質或從業部門、從事針刺實踐時間、其它相關經歷)”;8 篇英文文獻中也僅有 2 篇進行了完整報告,均來自韓國。大部分文章在“試驗背景”部分僅報告了試驗實施的機構,但缺乏對具體環境、病人獲得的關于治療和對照干預措施相關信息的報告,因此得分較低。這可能是由于國內研究對針灸治療較為熟悉,往往忽略了其他相關細節的描述;國內的研究者對針灸治療的實施者缺乏具體報道,僅有部分文獻簡單描述操作者為同一醫師,僅有 1 篇中文文獻描述了針灸醫師的資質。而針灸作為一種依賴于人工操作的治療方式,在報道相關臨床治療時,應該對針灸師的專業、資質等情況進行更具體的描述,同時在設計臨床試驗的時候,研究者也應該充分考慮不同資質的針灸師對于試驗結果可能的影響。英文文獻普遍缺乏條目 2g“針具類型(直徑、長度和生產廠家或材質)”的描寫。值得注意的是,由于傳統針刺的效果主要通過穴位、手法等實現,而所選針具的直徑、長度等也會在一定程度上影響療效,因此有必要在報告針刺干預手段時清晰報告針具的型號、材質等相關信息,保證后續試驗的可重復性。
綜上所述,國內外針刺治療干眼癥 RCT 的報告質量普遍較低,亟需參照 CONSORT 聲明 2010 版和 STRICTA 2010 等標準進一步提高相關研究報告質量。
干眼癥是指各種原因引起與眼部不適相關的淚膜和眼表面異常的一種疾病,其病因可能是全身性疾病,例如干燥綜合征,也可是局部眼部病變導致的淚膜異常改變或淚液動力學異常改變[1]。干眼癥患者主訴為眼部異物感、畏光流淚、視力減退等,嚴重影響患者的生活工作及學習。全球干眼癥的發病率約為 5.5%~33.7%[2],其中歐美國家約為 11.0%~28.7%,亞洲其他國家約為 17%~34%[3],中國發病率約為 21%~30%[4]。當前干眼癥最常用的一線治療方式是使用人工淚液或通過配戴貼近臉部且包覆眼周的眼鏡以減少淚液蒸發,繼發性干眼病則可通過停用藥品和干預影響因素緩解病情。其藥物治療主要使用含有環孢素或類固醇成分的眼藥水[5],必要時聯合抗炎藥物,但效果不盡如人意。
針刺是目前治療干眼癥的方法之一。隨著中醫藥發展,大量關于針刺治療干眼癥的隨機對照試驗(randomized controlled trail,RCT)已經發表,然而相關 RCT 報告水平參差不齊,為后續相關研究造成一定不便。1996 年發表的 CONSORT 聲明[6],以促進研究人員對 RCT 報告質量做出評價和解釋為目的,為作者、同行評論員和編輯提供了改進 RCT 報告的指導,幫助他們明確具有潛在偏倚結果的報告,更新的最新版本為 CONSORT 聲明 2010。在 CONSORT 聲明 2010 基礎上開發的針刺臨床試驗干預措施報告標準(standards for reporting interventions in clinical trials of acupuncture,STRICTA)[7],可協助作者對針刺 RCT 進行完整報告,并協助審稿專家和讀者更好理解和評價針刺 RCT 報告內容。本文將結合以上兩種評價工具對針刺治療干眼癥 RCT 的完整性和透明度進行報告質量評價,以期為后續相關 RCT 報告提供參考。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究類型
RCT。
1.1.2 研究對象
診斷明確的干眼癥患者。
1.1.3 干預措施
試驗組:以各種針刺方法及特種針法為主,包括針刺結合其他非藥物療法;對照組:非針刺治療手段,包括藥物治療、手術等。
1.1.4 結局指標
報告干眼癥癥狀改善等主、次要結局指標。
1.1.5 排除標準
① 治療組干預手段除針刺外,還包含藥物治療;② 以另一種針刺方法為對照的試驗;③ 重復發表的文獻,如用雙語種發表,僅納入中文版本;④ 無法獲取全文的文獻。
1.2 文獻檢索策略
計算機檢索 CNKI、VIP、CBM、WanFang Data、PubMed、EMbase 和 The Cochrane Library 數據庫,搜集國內外針刺治療干眼癥的 RCT,檢索時限均為建庫至 2020 年 2 月。同時檢索谷歌學術、百度學術等網站,以補充獲取相關文獻。中文檢索詞包括:干眼癥、干眼、針刺、針灸、針、干燥綜合征、隨機對照試驗等;英文檢索詞包括:dry eye syndromes,xerophthalmia,acupuncture,randomized controlled trails,RCT 等。以 PubMed 為例,具體檢索策略見框 1。

1.3 文獻篩選和資料提取
由 2 名研究者獨立篩選文獻、提取資料并交叉核對。如有分歧,則通過討論或與第三方協商解決。文獻篩選時首先將檢索文獻題目導入 Note Express V3.X 查重后,閱讀文題,在排除明顯不相關的文獻后,進一步閱讀摘要和全文以確定是否納入。如有需要,通過郵件、電話聯系原始研究作者獲取未確定但對本研究非常重要的信息。資料提取內容包括:作者、發表年份、干預手段及 CONSORT 2010 聲明、STRICTA 標準條目相關信息。
1.4 納入研究的報告質量評價
CONSORT 2010 聲明評價條目分為文題摘要、引言、方法、結論、討論以及其他信息6 大部分,包括 24 項內容、37 個條目;STRICTA 評價條目是在 CONSORT 聲明的基礎上專門為針刺這一干預手段制定的評價工具,包含 6 大部分:針刺原理、針刺細節、治療方案、輔助干預措施、治療師背景以及對照或對照干預。兩種評價工具均以“報告”或“未報告”作為最終評價結果。部分條目具有“適用性”條件,條目適用評價時納入質量總體分析,不適用則可不于結論處做討論。如有報告條目為“是”,未報告條目為“否”。為保證評價一致性,由 2 名評價人員在正式評價之前進行兩輪預試驗,預評價周期 12 天。預評價結果顯示第一輪 CONSORT 評價 Kappa 值(K=0.46)及 STRICTA 評價Kappa 值(K=0.50)均較低,表明 2 名評價員對條目認知差異較大,將分歧交由第三方專家判斷;經培訓后,第二輪 CONSORT 評價 Kappa 值(K=0.80)及 STRICTA 評價 Kappa 值(K=0.85)為優良,表明不同研究者判斷的一致性良好,可以進行正式評價。對仍存在爭議的細節提交第三方裁決。
1.5 統計分析
運用 SPSS 25.0 軟件計算兩種評價工具預試驗一致性的 Kappa 值。運用 Excel 2019 計算納入 RCT 在 CONSORT 及 STRICTA 工具各領域得分及其報告率,包括中、英文獻各條目的百分比呈現、2010 年前后中、英文獻各條目報告率及對比、占樣本比例、條目總報告率。
2 結果
2.1 文獻篩選流程及結果
初檢共獲得相關文獻 1 105 篇,經逐層篩選,最終納入 77 個 RCT[8-84],包括中文文獻 69 篇[8-76],英文文獻 8 篇[77-84]。文獻篩選流程及結果見圖 1。

*所檢索的數據庫及檢出文獻數具體如下:CNKI(
2.2 納入研究的基本情況
納入的 77 個 RCT[8-84]中,發表時間從 2004 年~2019 年,發表國家涵蓋中國、韓國和瑞典。文獻發表數量總體隨時間而呈上升趨勢,說明近年來探討針刺治療干眼癥的相關研究的熱度逐漸上升,見圖 2。發表時間分析顯示 16 年間年發文量為 4.8 篇;69 篇中文文獻[8-76]中有 12 篇[8-19]發表于 2010 年以前,57 篇[20-76]發表于 2010 年(含)以后;8 篇[77-84]英文文獻中有 3 篇[82-84]發表于 2010 年以前,5 篇[77-83]發表于 2010 年(含)以后;2018 年是發表文獻較多的一年,共 13 篇,除 2005、2008 及 2011 年發文量較低(分別為 1、0、2)之外,其余年份年發文量在平均發表量上下浮動(表 1)。


2.3 CONSORT 評價結果
2010 年后發表的 57 篇中文文獻[20-76]所有條目平均報告率為 43.1%。條目 1a、6b、7a、7b、8a、8b、9、10、11a、11b、12b、13b、14b、15、17b、18、19、20,23、24、25 占中文文獻自身報告比例不足 50%。其中條目 6b、11b、17b、24 報告率為 0,分別屬于“方法學-結局指標”、“方法學-盲法”、“結果-結局和估計值”及“其他信息-試驗方案”這 4 部分;條目 10、12b、14b、18 僅 1 篇文獻報告,分別屬于“方法-實施”、“結果-招募受試者”及“結果-輔助分析”;條目 9“分配隱藏機制”僅有 2 篇文獻報告[47, 66],報告率僅為 3.5%;條目 1a、7a、7b、11a、12b、23 報告比例 5.3%,其余條目報告率介于 5.3%~38.6% 之間(表 2)。在報告率大于 50% 的條目中,條目 5“詳細描述各組干預措施的細節使他人能夠重復,包括它們實際上是在何時、何地實施的”、6a“完整而確切地說明預先設定的主要和次要結局指標,包括他們實際上是在何時、何地測評的”、16“納入分析的例數”、17a“各組每一項的主要和次要結局指標的結果,效應估計值及其精確性”報告率達 100% 為最高,其余條目報告率介于 64.9%~98.2% 之間(表 2)。

2010 年以后的 5 篇英文文獻[77-83]所有條目平均報告率為 66.5%。條目 3b、6b、7a、7b、14b、17b、19、24 報告率不足 50%。其中條目 3b“試驗開始后對試驗方法所做的重要改變,并說明原因”、6b“試驗開始后對結局指標是否存在任何更改,并說明原因”、7b“必要時,解釋中期分析或試驗中止原則”、14b“為什么試驗中斷或停止”、17b“對應二分類結局,建議同時提供相對效應值和絕對效應值”報告率為 0;其余條目的報告率介于 20%~40% 之間(表 2)。在報告率大于 50% 的條目中,1b、2a、2b、3a、4a、4b、6a、12a、14a、16、17a、22 報告率達 100%,其余條目報告率介于 60%~80% 之間。
英文文獻的平均報告率(66.5%)大于中文文獻(43.1%),其中差距較大的有條目 1a、3b、7a、8a、8b、9、10、11a、11b、12b、13b、15、18、23 及 25,上述條目英文文獻報告率與中文文獻報告率差值均大于 25%(表 2)。
2.4 STRICTA 評價結果
2010 年以后的 57 篇中文文獻[20-76]所有條目平均報告率為 63.5%。條目 1c、2a、4a、4b、5 報告率不足 50%,具體報告率分別為 22.8%、35.1%、35.1%、1.8%、1.8%;條目 4b“治療場所和相關信息”及條目 5“對參與研究的針灸師的描述”僅 1 篇文獻[57]報告;僅條目 1a 報告率 100%。
2010 年以后的 5 篇英文文獻[77-83]所有條目平均報告率為 69.4%。條目 1c“說明治療改變”、2a“每一受試對象每個治療單元用針的數目”、2g“針具類型”、4a“附加干預細節”、4b“治療場所及相關信息”、5“針灸師描述”報告率分別為 20%、40%、20%、20% 不足 50%;條目 1a、2b、2f、3a、3b、6a、6b 報告率達 100%,其余條目報告率介于 60%~80% 之間。中英文獻差異較大的條目主要是 2g“針具類型”、4b“治療場所和相關信息,包括對治療師的操作指南及給患者的信息和解釋”及條目 5“對參與研究的針灸師的描述”(表 3)。

3 討論
隨著中醫藥被越來越多的人所接受,眾多傳統治療方式、用藥的科學性和有效性得以通過現代研究予以驗證。其中,RCT 作為醫學研究療效評測的傳統金標準[85],其設計的科學性及試驗過程的嚴謹性和透明性是引導試驗結果最終向臨床決策轉化的關鍵。本研究根據 CONSORT 聲明和 STRICTA 標準主要針對 2010 年后發表的針刺治療干眼癥的國內外 RCT 進行報告質量評價,對比并探討納入 RCT 存在的報告問題,以便為后期針刺干預干眼癥 RCT 研究的開展提供一定參考。綜合最終評價結果,現主要存在以下問題。
3.1 按照 CONSORT 標準
中文文獻 CONSORT 條目的報告率低于英文文獻(分別為 41.4% 和 56.4%),拉低中文文獻報告率的條目主要集中在方法學、結果及其他信息三方面。其中在方法學部分的報告上缺失信息較多,對 RCT 的方法描述完整度較為欠缺。具體條目包括:3b“試驗開始后對試驗方法所作的重要改變及原因”、6b“試驗開始后對結局指標是否有任何更改及原因”、7a“如何確定樣本量”、7b“必要時,解釋中期分析和試驗中止原則”、9“分配隱藏機制”、10“隨機方法的實施”、11a“如果實施了盲法,分配干預措施之后對誰設盲以及如何實施”、11b“如有必要,描述干預措施的相似之處”、12b“附加分析的方法,諸如亞組分析和校正分析”。在以上方法學條目中,3b、6b 報告率較低主要是由于納入中文 RCT 普遍沒有發表 RCT 方案,無法比較方案和 RCT 實施中的差異。條目 7b、11b 為“必要時”報告條目,2010 年后 62 篇文獻僅 3 篇中文、3 篇英文文獻 RCT 符合其報告“必要”條件,其余文獻包括 2010 年之前發表的 15 篇文獻均不滿足必要報告條件。結合 3b、6b、7b 條目,說明在時間節點 2010 年前后,針刺治療干眼癥 RCT 仍未建立臨床試驗完整和透明化理念,對 RCT 方案和 RCT 分析方法仍缺乏全面認識。
本研究納入的文獻對方法學部分的試驗方法與結局指標方面大多僅簡單描述其核心內容,對于試驗初始階段的設計、試驗開始后對試驗方法與結局指標的更改等情況鮮見報告,使得讀者不能確定該研究中是否存在試驗方案與結局指標的更改以及對存在的更改是否如實報告等問題。在實際情況中,試驗開始后可能因課題經費、受試者招募等問題的出現進而需要調整檢查項目、干預措施、受試者合格標準,亦可能出現主次要結局指標的更改等情況。在今后的科研工作中,研究者應該如實報告此類問題,同時,嚴格遵守并報告臨床試驗注冊規范及執行情況亦能幫助研究者提高試驗設計的規范化程度及報告透明度。此外,與之關系較為密切的是 STRICTA 評分中條目 1c“說明何種治療發生了改變”,也呈低報告率,僅有 20% 的英文文獻和 22.8% 的中文文獻進行了報告。兩部分得分均較低說明了納入文獻都缺乏對試驗過程中重要數據、干預措施等數據改變的解釋性說明。雖然其原因可能是由于針刺干預手段的特殊性引起的,即針刺試驗過程較少有結局指標、干預措施的變化或較強副作用的出現。但上述條目仍在 RCT 的報告中有著重要作用,完整地對其報告能使讀者更加明確試驗的完整性、連貫性以及試驗數據的可靠性。
62 篇文獻整體上對于方法學中 7a、9、10、11a 四個條目報告率較低,英文文獻中該四個條目報告率均在 40% 以上。而中文文獻則低于 6%,表明中文文獻普遍缺乏“樣本量”、“分配隱藏機制”、“盲法”及對其兩者具體實施細節的描述。中文文獻在條目 7a(5.3%)、條目 9(3.5%)、條目 10(1.8%)及條目 11a(5.3%)上報告缺失頗多,導致其試驗質量受到質疑,故研究者在今后的研究中應該多加注意完善這些方面的匯報。
在其他信息方面,包含 2010 年以前發表的 69 篇中文文獻普遍缺乏試驗注冊信息及試驗方案獲取的相關信息,大部分中文文獻描述了試驗資金來源后沒有提供可追查源頭的途徑,部分文章僅在原文中說明注冊機構,但未提供臨床試驗注冊號;英文文獻中僅 1 篇韓國的研究提供了完整的試驗相關信息,其余 7 篇文章(5 篇來自中國)亦缺乏相關數據。推測該現象主要與試驗機構及文獻質量有關,大部分文獻的試驗機構為地級市醫院,少有省級、國家級試驗中心參與,其文章質量不高,因此對 RCT 流程把控要求較低,導致上述條目內容報告的缺失。目前國外優秀醫學雜志對于涉及人體的臨床試驗均要求提供臨床試驗注冊相關信息,國內近年來對臨床試驗的要求也逐漸完善,但在期刊發表時對于臨床試驗注冊方面仍缺乏強制性規范,國內的研究人員對于臨床試驗注冊的知曉度仍然較低[86]。
采用 CONSORT 2010 分別對 2010 年前后國內外發表的針刺治療干眼癥相關臨床研究進行評估,我們發現:2010 年以后英文文獻各條目平均報告率比 2010 年之前的文獻高出 26.8%,而中文文獻僅高出 5.9%。由此不難推斷,在 2010 年 CONSORT 標準更新后,英文文獻的報告規范化程度大幅提高,而中文文獻的規范化報告程度仍不明顯。這提示國內的研究者和科技期刊應該重視 CONSORT 標準等臨床試驗報告規范,并在科研設計、實施以及報告過程中合理運用。
3.2 按照 STRICTA 標準
中英文獻 STRICTA 報告率總體較為接近,中文平均報告率 61.9%,英文平均報告率 66.9%,兩者差別較 CONSORT 較小。結合 2010 年前發表文獻,在 STRICTA 標準更新后,中英文文獻各 STRICTA 標準條目平均報告率均有所提高,但兩者差距不明顯。表明中英文文獻報告中對于針刺干預手段的描述差距不大,相關原因可能是針灸的相關研究多由中文語境人群為主進行開展,相關操作規范也較為統一,因此在這方面中英文文獻報告均較規范。但 57 篇中文文獻普遍缺乏條目 4b“治療場所和相關信息,包括對治療師的操作指南、以及給患者的信息和解釋”及“對參與研究的針灸師的描述(資質或從業部門、從事針刺實踐時間、其它相關經歷)”;8 篇英文文獻中也僅有 2 篇進行了完整報告,均來自韓國。大部分文章在“試驗背景”部分僅報告了試驗實施的機構,但缺乏對具體環境、病人獲得的關于治療和對照干預措施相關信息的報告,因此得分較低。這可能是由于國內研究對針灸治療較為熟悉,往往忽略了其他相關細節的描述;國內的研究者對針灸治療的實施者缺乏具體報道,僅有部分文獻簡單描述操作者為同一醫師,僅有 1 篇中文文獻描述了針灸醫師的資質。而針灸作為一種依賴于人工操作的治療方式,在報道相關臨床治療時,應該對針灸師的專業、資質等情況進行更具體的描述,同時在設計臨床試驗的時候,研究者也應該充分考慮不同資質的針灸師對于試驗結果可能的影響。英文文獻普遍缺乏條目 2g“針具類型(直徑、長度和生產廠家或材質)”的描寫。值得注意的是,由于傳統針刺的效果主要通過穴位、手法等實現,而所選針具的直徑、長度等也會在一定程度上影響療效,因此有必要在報告針刺干預手段時清晰報告針具的型號、材質等相關信息,保證后續試驗的可重復性。
綜上所述,國內外針刺治療干眼癥 RCT 的報告質量普遍較低,亟需參照 CONSORT 聲明 2010 版和 STRICTA 2010 等標準進一步提高相關研究報告質量。