引用本文: 張明妍, 楊豐文, 李越, 劉玉, 趙夢瑜, 鄭文科, 張俊華. 《中國中西醫結合雜志》刊載中醫藥隨機對照試驗報告質量的研究. 中國循證醫學雜志, 2017, 17(3): 357-363. doi: 10.7507/1672-2531.201611085 復制
隨機對照試驗(RCT)是評價干預措施臨床作用的首選設計類型,但臨床試驗的價值不僅在研究設計的科學、合理、可行,也取決于研究過程的質量控制,還依賴于研究結果清晰、透明的報告。臨床試驗報告規范 CONSORT 工作組 Moher 教授介紹“整個醫學都有賴于臨床試驗報告的透明化”[1]。只有作者對研究的設計、實施和分析做出全面而準確的描述時,才能將研究結果客觀清晰的呈獻給讀者,才能成為供決策參考的證據。自 1996 年 CONSORT 聲明發布以來,對臨床研究的報告和質量提升起到了極大的推動作用。
李廷謙等[2]2005 年采用 CONSORT(2001 版)清單對《中國中西醫結合雜志》以往發表的 1 288 篇 RCT 研究進行了報告質量評價,結果發現不少問題:如隨機分配部分采用就診順序、出生日期等半隨機方式,分配隱藏、盲法采用率過低,部分診斷標準為自擬,忽視倫理要求等,這也突出反應了中醫藥臨床研究在方法學質量和研究報告當時的狀況。隨著循證醫學發展,臨床醫生及相關科研工作者更加重視臨床研究的方法學質量和規范報告。本研究以 CONSORT(2010 版)清單為工具,結合醫學倫理學要求,評價《中國中西醫結合雜志》2014 年全年刊登的 RCT,分析中醫藥臨床研究質量現況,并將其與 10 年前研究結果對比,分析 10 年來中醫藥 RCT 質量變化情況。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究設計 隨機對照臨床試驗。
1.1.2 干預措施 中醫藥相關療法,如中藥湯劑、中成藥、穴位治療(針刺、艾灸、埋線、電刺激、藥物敷貼或穴位注射等)、推拿按摩及中醫綜合療法等。疾病類型、對照措施及結局指標不做限制。
1.1.3 排除標準 無法提取數據的文獻,摘要等。
1.2 文獻檢索
計算機檢索 CNKI 數據庫,獲取《中國中西醫結合雜志》2014 年共 12 期文獻目錄和全文。檢索策略為“期刊-期刊導航-中國中西醫結合雜志-2014 年”。
1.3 資料提取與報告質量評價
由 2 名研究者逐篇閱讀文獻,篩選文獻,提取資料。如有分歧,經討論解決。按照事先制定的數據提取表提取資料,提取內容包括:納入研究的基本特征,如姓名、出版時間等;報告規范評價的指標。采用 CONSORT(2010 版)評價納入研究報告質量[3]。對研究倫理學相關內容進行評價,包括方案的倫理審批、患者知情同意和研究方案注冊 3 個條目。
1.4 統計分析
采用 SPSS 軟件對 2004 年與 2014 年符合條目要求的研究數量占各組總研究數量百分率的比值 RR 值進行統計分析。計數資料組間比較采用χ2 檢驗,檢驗水準為α=0.05。
2 結果
2.1 《中國中西醫結合雜志》2014 年刊登 RCT 的情況
2014 年《中國中西醫結合雜志》共刊登 317 篇論文,其中 80 篇為中醫藥 RCT,占發表論文總數的 25.24%。中醫臨床隨機對照試驗的干預措施主要為4類:中成藥、中藥湯劑、針灸和中醫綜合療法。80 篇 RCT 中中藥湯劑 33 篇,中成藥 34 篇,針灸 11 篇,中醫綜合療法 2 篇。文獻篩選流程及結果見圖 1。

2.2 CONSORT 2010 清單評價結果
采用 CONSORT 2010 清單評價納入 RCT 的報告質量,詳細結果見表 1。根據符合清單條目要求的研究數量及百分比,將報告質量分為高中低三級:80% 以上研究符合報告要求的屬于報告質量高;50%~80% 為中等報告質量;<50% 為報告質量低,其中<10% 屬于報告質量很低。

80 篇 RCT 中,報告質量高的條目有:摘要、受試者、隨機序列、知情同意;報告質量中等的條目有:引言、干預措施、危害、資助;其余條目報告質量較差。其中文題、試驗設計、結局指標、樣本量、隨機方法類型、分配隱藏、盲法、納入分析的例數、結局與估計值、推廣性、解釋、試驗注冊與試驗方案的條目報告質量很低(<10%)。
2.3 分類評價結果
根據清單各條目的類型和不同作用,將 25 個條目分為三類:規范性條目、方法學條目和提示性條目。對于提示性條目,如果研究不涉及相關內容,則無需報告,此類條目則不能評價報告情況的優劣。從方法學相關條目的報告情況,可以分析研究的方法學質量。而規范性條目主要反映了研究報告的清晰度和規范性。
2.3.1 規范性條目 ① 文題和摘要:文題是否標引為隨機臨床試驗,影響研究的檢索和識別。80 篇 RCT 中僅 8 篇可通過文題識別為隨機臨床試驗,提示中醫藥 RCT 研究報告題目還需要規范和重視。摘要多以目的、方法、結果、結論四段式結構組成,很少報告設計類型。② 試驗設計:2010 版 CONSORT 清單中增加對試驗設計的評價,評價顯示有 16 篇文獻描述了試驗設計類型,11 篇說明受試者分配入各組的比例,既報告設計類型又報告樣本分配比例的僅4篇。③ 受試者:研究多采用西醫診斷標準,忽視中醫診斷標準,33 篇(41.25%)無中醫診斷標準。④ 干預措施:57 個研究詳細描述各組干預措施的細節,包括時間和具體實施。但也存在問題:中藥方劑配伍缺乏具體劑量;西醫治療方法籠統、西藥有名稱無劑量,如 13 個 RCT 中只說明“常規治療”或“基礎治療”,但無具體方案。⑤ 結局指標:臨床研究對預先設定的主要和次要結局指標應該完整報告,并提供詳細的信息,如測量方法,測量時點等。納入研究中僅 9 篇報告充分,13 篇運用“治療前后”模糊介紹測量時點。此外,有 13 篇 RCT 中存在結局指標前后不一致情況,均未作變動說明。⑥ 樣本量:僅 6 個 RCT 描述如何確定樣本量,其余研究未交待樣本量確定依據。⑦ 流程圖:CONSORT 聲明極力推薦使用病例流程圖。納入的 80 篇研究全部以文字描述,沒有 1 個使用流程圖,此項內容報告需要加強。有 3 個研究報告了病例脫落和剔除信息,僅報告病例脫落的有 32 篇,有 1 篇報告了病例剔除,報告情況較差。⑧ 基線資料:為更好地評估組間均衡性,基線資料的報告很重要,但有 39 個研究未采用表格報告基線數據。⑨ 局限性、可推廣性、解釋:討論部分應該圍繞研究的不足、存在的偏倚及影響結果的其他因素進行描述,這對判斷該研究結果的價值非常重要。然而納入研究多從研究領域的機制理論方面討論,而非本研究的方法學及質量控制;多夸贊自己的研究,較少分析自身研究的局限性和不足,僅 16 篇有簡單描述樣本量少、研究時間較短等內容。可推廣性報告僅 1 篇,多數研究用“……證明療效較好,值得進一步推廣”一句話概括,沒有結合證據的內部真實性和可及性進行分析。結合當前其他研究證據對結果進行“解釋”也很重要,但僅有 2 篇文獻報告了相關信息。對納入研究討論部分的分析,發現研究者對這 3 個條目的理解存在偏差,需要相關培訓。⑩ 注冊:臨床試驗注冊并公開研究方案是臨床試驗透明化的重要環節,許多國際學術期刊拒絕沒有注冊的研究發表。但納入研究中沒有文章提供試驗注冊或方案獲取方式的信息,有些試驗可能已經注冊,但在文章中沒有報告。? 資助:超半數(54 項)的研究有資助,且多為縱向資金(50 項),一定程度上說明中醫藥 RCT 的質量已得到提高。
2.3.2 方法學條目 隨機序列的產生、分配隱藏方法與實施辦法、盲法及納入分析的病例等 5 個條目與研究的偏倚控制密切相關,其報告情況能夠反應出方法學實施的質量。① 納入的研究中,77 個研究(96%)報告了隨機序列的產生方法,其中 63 篇(82%)采用隨機數字表法,有 5 篇采用半隨機方法分組,如就診順序、日期單雙號等。隨機分配類型描述較少,5 篇提到運用分層隨機。② 對分配隱藏機制,僅 7 篇有報告,多采用不透光的密封信封方式。③ 有 3 篇對實施過程進行說明。這是普遍存在的問題,PubMed 收錄的全部隨機臨床試驗報告中只有 18% 報告了分配隱藏機制[4]。④ 納入研究中有 12 篇運用盲法,僅 3 篇描述了實施過程。在使用雙盲、安慰劑、模擬劑的研究中,有 9 個研究從組成、包裝、外觀、口味等方面描述干預措施的相似性。⑤ 有 36 個研究簡單報告了病例脫離或剔除,但僅有 8 個研究在數據分析時報告了減員情況及影響。對病例脫離原因分析和數據集的劃分還是薄弱環節。
2.3.3 提示性條目 3b、6b、7b、11b、14b、17b、18 與 24 共 8 個條目屬于提示性條目,通常帶“必要時”“如果”“是否有更改”等字樣。這些條目不報告不代表報告質量低。如納入文獻中無試驗方法改變的說明、無中期分析和中止的試驗、無試驗中斷或停止的報告,這些內容在多中心、大樣本、長時程的試驗中多會涉及,小樣本短期試驗可能不涉及。輔助分析、附加分析及校正分析也需要根據具體研究數據情況而定,不是必須報告內容。
2.4 RCTs 報告質量變化分析
2.4.1 報告質量變化 2005 年李廷謙教授團隊用 CONSORT 2001 清單對 1999 年到 2004 年《中國中西醫結合雜志》發表的 RCTs 進行了質量評價。以此為參照,本研究對比分析 RCT 報告質量的變化。結果見表 2。

因 CONSORT 清單的更新,2010 版與 2001 版在統計學方法、結果和估計值、基線資料及討論等條目有顯著不同,故僅對 14 個條目進行比較分析。根據表 2 數據顯示,除了流程圖一直沒有得到應用,其余 13 項結果較 10 年前均有顯著改善,差異具有統計學意義,說明中醫藥臨床 RCT 報告質量有了提升。主要變化有:① 結構式摘要使用增加了 54%,研究背景、目的闡釋的更加明確化;② 對受試者診斷標準報告有提升,研究者減少采用自擬標準,并且對納入、排除標準與診斷標準同樣重視,有助于提高受試者納入的一致性;③ 研究者開始重視樣本量計算的報告,但報告質量依然很低(<10%);④ 受試者招募和隨訪都有增加,其中隨訪記錄增加近 26%;⑤ 干預措施、療效評價指標已不再采用自擬標準,國際化學術認可增強。研究者重視廣泛性認同的主、次結局指標使用;⑥ 部分研究開始采用意向性分析(ITT),這是一項進步;⑦ 資助相關信息報告增加了 54%,且多為省級或國家科技資助項目。綜上,10 年來中醫藥 RCT 的報告質量已經取得了長足進步,但還有很大提升的空間。
2.4.2 方法學質量變化比較 與 10 年前研究相比,RCT 隨機、分配隱藏、盲法的報告質量顯著提高,其差異有統計學意義,結果見表 3。

2.4.3 倫理學執行情況比較 臨床研究對受試者權益的保護是重要的內容。方案的審批,患者知情同意的獲取以及研究方案注冊等條目反映倫理相關內容執行情況。從表 4 數據對比可以看出,中醫藥 RCTs 倫理審批從無到有,報告率達 25%;患者知情同意受到重視,91% 以上的 RCT 報告了受試者知情同意情況。但是,臨床研究注冊仍然被忽視,雖然 2004 年以后出臺了臨床試驗方案注冊的要求,CONSORT 2010 清單中增加了“試驗注冊”相關內容,但仍無研究提供試驗注冊和方案獲取方式等信息。

3 討論
循證醫學在中國的普及推廣對我國臨床研究尤其是中醫藥臨床研究產生了重大指導價值[5-7]。本研究結果表明:與 10 年前相比,《中國中西醫結合雜志》發表的中醫藥臨床隨機對照試驗報告質量、方法學質量與倫理學情況均取得了進步。與其他研究結果一致[8-12],本研究提示當前中醫藥 RCT 質量總體還不高,仍然較大的提升空間。這其中主要問題包括試驗設計、結局指標、樣本量、隨機化、盲法、流程圖、結局和估計值、試驗注冊部分報告不完整、不規范等。中醫藥研究領域 RCT 質量 10 年間雖有較大進步,但整體質量依然較低,主要原因可能有:研究者對臨床研究相關知識了解不夠,需要加強技術培訓;期刊對 CONSORT 清單的重視不夠,對發表文章的報告質量審查力度不夠。
使用 CONSORT 2010 清單評價 RCT 報告質量需要注意以下幾方面內容:首先,為保證對清單條目的正確理解和運用,需要對評價者進行培訓,并進行一致性檢驗,同時要實施 2 名以上評價員獨立評價,以減少主觀判斷帶來的偏倚。其次,根據清單條目屬性分類區別分析。CONSORT 2010 雖有 25 個主條目,但有的條目下面有子條目,共計37 個條目,大體分為三類:規范性條目、方法學條目及提示性條目。規范性條目是每個研究都應該報告的條目;方法學條目可用作評價方法學質量,能夠反應研究偏倚控制的情況;而提示性條目不是必要性條目,在研究中因具體情況而定,不報告不代表報告質量低,因此不能用作評價質量。第三,認真分析,做好備注。一個條目包含多項細節內容,大部分報告存在報告不完整等問題,這些不等同于未報告,需要詳細記錄,并分析相關原因。如 6a“完整而準確地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的”,某些研究可能說明主次結局指標但未說明時間或(與)方法,所以在用其評價 RCT 的報告質量時要認真分析每一條內容并詳細備注。
本研究存在一定的局限性。首先,納入 RCT 僅 80 個,代表性可能不夠。后續我們將增加期刊和年份,更全面的評價中醫藥隨機對照臨床試驗的發展狀況和存在問題。其次,由于十年前的調查研究以 CONSORT 2001 清單進行評價,本研究采用更新版 CONSORT 2010。由于兩個版本存在一定的變化,本研究無法將所有條目進行比較。第三,因有文章對相關信息的報告不完全或漏報,可能會影響評價員的判斷。
隨著循證醫學的發展,報告質量及方法學質量的提高能夠提升研究結果的實用性、可比性和透明度,從而使單個研究數據的價值得到充分利用,更好地為醫療衛生決策的制定起到輔助作用。CONSORT 系列報告規范,包括草藥、針灸擴展版發布[13-15],從出口把關,為提高中醫藥臨床試驗報告質量提供了參照和依據。然而,中醫藥臨床研究質量提升需要從多個環節下功夫,多處著力解決瓶頸問題。一方面,中文期刊雜志要修訂、完善稿約,加強對審稿規范的要求,同意對審稿人、編委進行相關技術和培訓。一方面,要對臨床研究者、醫生、醫學生加強培訓,傳播 RCT 方法學和報告相關技術要求,形成規范意識和質量意識。同時,充分發揮中國醫學循證醫學中心及各分中心的技術優勢,整合優勢資源,做好普及和培訓工作。隨著循證醫學臨床方法學的推廣,中醫藥臨床研究人員技能的提升,中醫藥臨床研究質量會大幅提升,為中醫藥臨床療效提供高質量證據。
隨機對照試驗(RCT)是評價干預措施臨床作用的首選設計類型,但臨床試驗的價值不僅在研究設計的科學、合理、可行,也取決于研究過程的質量控制,還依賴于研究結果清晰、透明的報告。臨床試驗報告規范 CONSORT 工作組 Moher 教授介紹“整個醫學都有賴于臨床試驗報告的透明化”[1]。只有作者對研究的設計、實施和分析做出全面而準確的描述時,才能將研究結果客觀清晰的呈獻給讀者,才能成為供決策參考的證據。自 1996 年 CONSORT 聲明發布以來,對臨床研究的報告和質量提升起到了極大的推動作用。
李廷謙等[2]2005 年采用 CONSORT(2001 版)清單對《中國中西醫結合雜志》以往發表的 1 288 篇 RCT 研究進行了報告質量評價,結果發現不少問題:如隨機分配部分采用就診順序、出生日期等半隨機方式,分配隱藏、盲法采用率過低,部分診斷標準為自擬,忽視倫理要求等,這也突出反應了中醫藥臨床研究在方法學質量和研究報告當時的狀況。隨著循證醫學發展,臨床醫生及相關科研工作者更加重視臨床研究的方法學質量和規范報告。本研究以 CONSORT(2010 版)清單為工具,結合醫學倫理學要求,評價《中國中西醫結合雜志》2014 年全年刊登的 RCT,分析中醫藥臨床研究質量現況,并將其與 10 年前研究結果對比,分析 10 年來中醫藥 RCT 質量變化情況。
1 資料與方法
1.1 納入與排除標準
1.1.1 研究設計 隨機對照臨床試驗。
1.1.2 干預措施 中醫藥相關療法,如中藥湯劑、中成藥、穴位治療(針刺、艾灸、埋線、電刺激、藥物敷貼或穴位注射等)、推拿按摩及中醫綜合療法等。疾病類型、對照措施及結局指標不做限制。
1.1.3 排除標準 無法提取數據的文獻,摘要等。
1.2 文獻檢索
計算機檢索 CNKI 數據庫,獲取《中國中西醫結合雜志》2014 年共 12 期文獻目錄和全文。檢索策略為“期刊-期刊導航-中國中西醫結合雜志-2014 年”。
1.3 資料提取與報告質量評價
由 2 名研究者逐篇閱讀文獻,篩選文獻,提取資料。如有分歧,經討論解決。按照事先制定的數據提取表提取資料,提取內容包括:納入研究的基本特征,如姓名、出版時間等;報告規范評價的指標。采用 CONSORT(2010 版)評價納入研究報告質量[3]。對研究倫理學相關內容進行評價,包括方案的倫理審批、患者知情同意和研究方案注冊 3 個條目。
1.4 統計分析
采用 SPSS 軟件對 2004 年與 2014 年符合條目要求的研究數量占各組總研究數量百分率的比值 RR 值進行統計分析。計數資料組間比較采用χ2 檢驗,檢驗水準為α=0.05。
2 結果
2.1 《中國中西醫結合雜志》2014 年刊登 RCT 的情況
2014 年《中國中西醫結合雜志》共刊登 317 篇論文,其中 80 篇為中醫藥 RCT,占發表論文總數的 25.24%。中醫臨床隨機對照試驗的干預措施主要為4類:中成藥、中藥湯劑、針灸和中醫綜合療法。80 篇 RCT 中中藥湯劑 33 篇,中成藥 34 篇,針灸 11 篇,中醫綜合療法 2 篇。文獻篩選流程及結果見圖 1。

2.2 CONSORT 2010 清單評價結果
采用 CONSORT 2010 清單評價納入 RCT 的報告質量,詳細結果見表 1。根據符合清單條目要求的研究數量及百分比,將報告質量分為高中低三級:80% 以上研究符合報告要求的屬于報告質量高;50%~80% 為中等報告質量;<50% 為報告質量低,其中<10% 屬于報告質量很低。

80 篇 RCT 中,報告質量高的條目有:摘要、受試者、隨機序列、知情同意;報告質量中等的條目有:引言、干預措施、危害、資助;其余條目報告質量較差。其中文題、試驗設計、結局指標、樣本量、隨機方法類型、分配隱藏、盲法、納入分析的例數、結局與估計值、推廣性、解釋、試驗注冊與試驗方案的條目報告質量很低(<10%)。
2.3 分類評價結果
根據清單各條目的類型和不同作用,將 25 個條目分為三類:規范性條目、方法學條目和提示性條目。對于提示性條目,如果研究不涉及相關內容,則無需報告,此類條目則不能評價報告情況的優劣。從方法學相關條目的報告情況,可以分析研究的方法學質量。而規范性條目主要反映了研究報告的清晰度和規范性。
2.3.1 規范性條目 ① 文題和摘要:文題是否標引為隨機臨床試驗,影響研究的檢索和識別。80 篇 RCT 中僅 8 篇可通過文題識別為隨機臨床試驗,提示中醫藥 RCT 研究報告題目還需要規范和重視。摘要多以目的、方法、結果、結論四段式結構組成,很少報告設計類型。② 試驗設計:2010 版 CONSORT 清單中增加對試驗設計的評價,評價顯示有 16 篇文獻描述了試驗設計類型,11 篇說明受試者分配入各組的比例,既報告設計類型又報告樣本分配比例的僅4篇。③ 受試者:研究多采用西醫診斷標準,忽視中醫診斷標準,33 篇(41.25%)無中醫診斷標準。④ 干預措施:57 個研究詳細描述各組干預措施的細節,包括時間和具體實施。但也存在問題:中藥方劑配伍缺乏具體劑量;西醫治療方法籠統、西藥有名稱無劑量,如 13 個 RCT 中只說明“常規治療”或“基礎治療”,但無具體方案。⑤ 結局指標:臨床研究對預先設定的主要和次要結局指標應該完整報告,并提供詳細的信息,如測量方法,測量時點等。納入研究中僅 9 篇報告充分,13 篇運用“治療前后”模糊介紹測量時點。此外,有 13 篇 RCT 中存在結局指標前后不一致情況,均未作變動說明。⑥ 樣本量:僅 6 個 RCT 描述如何確定樣本量,其余研究未交待樣本量確定依據。⑦ 流程圖:CONSORT 聲明極力推薦使用病例流程圖。納入的 80 篇研究全部以文字描述,沒有 1 個使用流程圖,此項內容報告需要加強。有 3 個研究報告了病例脫落和剔除信息,僅報告病例脫落的有 32 篇,有 1 篇報告了病例剔除,報告情況較差。⑧ 基線資料:為更好地評估組間均衡性,基線資料的報告很重要,但有 39 個研究未采用表格報告基線數據。⑨ 局限性、可推廣性、解釋:討論部分應該圍繞研究的不足、存在的偏倚及影響結果的其他因素進行描述,這對判斷該研究結果的價值非常重要。然而納入研究多從研究領域的機制理論方面討論,而非本研究的方法學及質量控制;多夸贊自己的研究,較少分析自身研究的局限性和不足,僅 16 篇有簡單描述樣本量少、研究時間較短等內容。可推廣性報告僅 1 篇,多數研究用“……證明療效較好,值得進一步推廣”一句話概括,沒有結合證據的內部真實性和可及性進行分析。結合當前其他研究證據對結果進行“解釋”也很重要,但僅有 2 篇文獻報告了相關信息。對納入研究討論部分的分析,發現研究者對這 3 個條目的理解存在偏差,需要相關培訓。⑩ 注冊:臨床試驗注冊并公開研究方案是臨床試驗透明化的重要環節,許多國際學術期刊拒絕沒有注冊的研究發表。但納入研究中沒有文章提供試驗注冊或方案獲取方式的信息,有些試驗可能已經注冊,但在文章中沒有報告。? 資助:超半數(54 項)的研究有資助,且多為縱向資金(50 項),一定程度上說明中醫藥 RCT 的質量已得到提高。
2.3.2 方法學條目 隨機序列的產生、分配隱藏方法與實施辦法、盲法及納入分析的病例等 5 個條目與研究的偏倚控制密切相關,其報告情況能夠反應出方法學實施的質量。① 納入的研究中,77 個研究(96%)報告了隨機序列的產生方法,其中 63 篇(82%)采用隨機數字表法,有 5 篇采用半隨機方法分組,如就診順序、日期單雙號等。隨機分配類型描述較少,5 篇提到運用分層隨機。② 對分配隱藏機制,僅 7 篇有報告,多采用不透光的密封信封方式。③ 有 3 篇對實施過程進行說明。這是普遍存在的問題,PubMed 收錄的全部隨機臨床試驗報告中只有 18% 報告了分配隱藏機制[4]。④ 納入研究中有 12 篇運用盲法,僅 3 篇描述了實施過程。在使用雙盲、安慰劑、模擬劑的研究中,有 9 個研究從組成、包裝、外觀、口味等方面描述干預措施的相似性。⑤ 有 36 個研究簡單報告了病例脫離或剔除,但僅有 8 個研究在數據分析時報告了減員情況及影響。對病例脫離原因分析和數據集的劃分還是薄弱環節。
2.3.3 提示性條目 3b、6b、7b、11b、14b、17b、18 與 24 共 8 個條目屬于提示性條目,通常帶“必要時”“如果”“是否有更改”等字樣。這些條目不報告不代表報告質量低。如納入文獻中無試驗方法改變的說明、無中期分析和中止的試驗、無試驗中斷或停止的報告,這些內容在多中心、大樣本、長時程的試驗中多會涉及,小樣本短期試驗可能不涉及。輔助分析、附加分析及校正分析也需要根據具體研究數據情況而定,不是必須報告內容。
2.4 RCTs 報告質量變化分析
2.4.1 報告質量變化 2005 年李廷謙教授團隊用 CONSORT 2001 清單對 1999 年到 2004 年《中國中西醫結合雜志》發表的 RCTs 進行了質量評價。以此為參照,本研究對比分析 RCT 報告質量的變化。結果見表 2。

因 CONSORT 清單的更新,2010 版與 2001 版在統計學方法、結果和估計值、基線資料及討論等條目有顯著不同,故僅對 14 個條目進行比較分析。根據表 2 數據顯示,除了流程圖一直沒有得到應用,其余 13 項結果較 10 年前均有顯著改善,差異具有統計學意義,說明中醫藥臨床 RCT 報告質量有了提升。主要變化有:① 結構式摘要使用增加了 54%,研究背景、目的闡釋的更加明確化;② 對受試者診斷標準報告有提升,研究者減少采用自擬標準,并且對納入、排除標準與診斷標準同樣重視,有助于提高受試者納入的一致性;③ 研究者開始重視樣本量計算的報告,但報告質量依然很低(<10%);④ 受試者招募和隨訪都有增加,其中隨訪記錄增加近 26%;⑤ 干預措施、療效評價指標已不再采用自擬標準,國際化學術認可增強。研究者重視廣泛性認同的主、次結局指標使用;⑥ 部分研究開始采用意向性分析(ITT),這是一項進步;⑦ 資助相關信息報告增加了 54%,且多為省級或國家科技資助項目。綜上,10 年來中醫藥 RCT 的報告質量已經取得了長足進步,但還有很大提升的空間。
2.4.2 方法學質量變化比較 與 10 年前研究相比,RCT 隨機、分配隱藏、盲法的報告質量顯著提高,其差異有統計學意義,結果見表 3。

2.4.3 倫理學執行情況比較 臨床研究對受試者權益的保護是重要的內容。方案的審批,患者知情同意的獲取以及研究方案注冊等條目反映倫理相關內容執行情況。從表 4 數據對比可以看出,中醫藥 RCTs 倫理審批從無到有,報告率達 25%;患者知情同意受到重視,91% 以上的 RCT 報告了受試者知情同意情況。但是,臨床研究注冊仍然被忽視,雖然 2004 年以后出臺了臨床試驗方案注冊的要求,CONSORT 2010 清單中增加了“試驗注冊”相關內容,但仍無研究提供試驗注冊和方案獲取方式等信息。

3 討論
循證醫學在中國的普及推廣對我國臨床研究尤其是中醫藥臨床研究產生了重大指導價值[5-7]。本研究結果表明:與 10 年前相比,《中國中西醫結合雜志》發表的中醫藥臨床隨機對照試驗報告質量、方法學質量與倫理學情況均取得了進步。與其他研究結果一致[8-12],本研究提示當前中醫藥 RCT 質量總體還不高,仍然較大的提升空間。這其中主要問題包括試驗設計、結局指標、樣本量、隨機化、盲法、流程圖、結局和估計值、試驗注冊部分報告不完整、不規范等。中醫藥研究領域 RCT 質量 10 年間雖有較大進步,但整體質量依然較低,主要原因可能有:研究者對臨床研究相關知識了解不夠,需要加強技術培訓;期刊對 CONSORT 清單的重視不夠,對發表文章的報告質量審查力度不夠。
使用 CONSORT 2010 清單評價 RCT 報告質量需要注意以下幾方面內容:首先,為保證對清單條目的正確理解和運用,需要對評價者進行培訓,并進行一致性檢驗,同時要實施 2 名以上評價員獨立評價,以減少主觀判斷帶來的偏倚。其次,根據清單條目屬性分類區別分析。CONSORT 2010 雖有 25 個主條目,但有的條目下面有子條目,共計37 個條目,大體分為三類:規范性條目、方法學條目及提示性條目。規范性條目是每個研究都應該報告的條目;方法學條目可用作評價方法學質量,能夠反應研究偏倚控制的情況;而提示性條目不是必要性條目,在研究中因具體情況而定,不報告不代表報告質量低,因此不能用作評價質量。第三,認真分析,做好備注。一個條目包含多項細節內容,大部分報告存在報告不完整等問題,這些不等同于未報告,需要詳細記錄,并分析相關原因。如 6a“完整而準確地說明預先設定的主要和次要結局指標,包括它們是在何時、如何測評的”,某些研究可能說明主次結局指標但未說明時間或(與)方法,所以在用其評價 RCT 的報告質量時要認真分析每一條內容并詳細備注。
本研究存在一定的局限性。首先,納入 RCT 僅 80 個,代表性可能不夠。后續我們將增加期刊和年份,更全面的評價中醫藥隨機對照臨床試驗的發展狀況和存在問題。其次,由于十年前的調查研究以 CONSORT 2001 清單進行評價,本研究采用更新版 CONSORT 2010。由于兩個版本存在一定的變化,本研究無法將所有條目進行比較。第三,因有文章對相關信息的報告不完全或漏報,可能會影響評價員的判斷。
隨著循證醫學的發展,報告質量及方法學質量的提高能夠提升研究結果的實用性、可比性和透明度,從而使單個研究數據的價值得到充分利用,更好地為醫療衛生決策的制定起到輔助作用。CONSORT 系列報告規范,包括草藥、針灸擴展版發布[13-15],從出口把關,為提高中醫藥臨床試驗報告質量提供了參照和依據。然而,中醫藥臨床研究質量提升需要從多個環節下功夫,多處著力解決瓶頸問題。一方面,中文期刊雜志要修訂、完善稿約,加強對審稿規范的要求,同意對審稿人、編委進行相關技術和培訓。一方面,要對臨床研究者、醫生、醫學生加強培訓,傳播 RCT 方法學和報告相關技術要求,形成規范意識和質量意識。同時,充分發揮中國醫學循證醫學中心及各分中心的技術優勢,整合優勢資源,做好普及和培訓工作。隨著循證醫學臨床方法學的推廣,中醫藥臨床研究人員技能的提升,中醫藥臨床研究質量會大幅提升,為中醫藥臨床療效提供高質量證據。