引用本文: 何莎, 張田, 孫偉, 邱智. 中國內地腦卒中治療多中心隨機對照試驗方法學質量現狀報告. 華西醫學, 2020, 35(6): 673-678. doi: 10.7507/1002-0179.202004491 復制
腦卒中是高致死率及高致殘率的疾病之一,急性期的恰當治療和恢復期的早期康復是降低腦卒中患者死亡或殘疾的重要環節[1]。隨機對照試驗(randomized controlled trial,RCT)一直是檢驗臨床治療療效的金標準[2]。自 1996 年中國引進與發展循證醫學以來,RCT 已廣泛應用于探索我國腦卒中傳統治療措施的療效,以及評估西方國家的療法是否適用于中國患者[3]。本研究筆者曾分析了 1996 年—2010 年發表的急性腦卒中 RCT 質量,研究表明雖然中國急性腦卒中治療措施的臨床試驗發表數量增長明顯,但僅有 0.3% 的 RCT 是正確做到有安慰劑對照及分組隱藏的高質量 RCT[4]。近 10 余年來,隨著中國神經病學學會及腦血管組分會制定的中國腦卒中預防和治療指南對腦卒中臨床診療實踐的指導,循證醫學治療(如卒中單元、抗凝、抗血小板、降脂、降壓等)已規范化應用于腦卒中的急性期治療[5-6],但促進卒中后的功能(如運動、言語、認知、吞咽功能等)恢復的康復治療,以及腦卒中二級預防教育等方面仍然缺乏高質量臨床實踐證據的指導。因此,有必要再次將腦卒中急性期和恢復期治療試驗質量的現狀進一步更新,特別聚焦有安慰劑對照和分組隱藏的多中心 RCT,旨在為未來制定腦卒中的臨床指南及臨床研究策略提供科學依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 研究類型:2000 年 1 月—2019 年 12 月國內外已發表的、在中國內地患者中研究的腦卒中治療措施,自述為多中心 RCT 的人體研究。② 研究對象:包括急性期和恢復期的腦梗死、腦出血或蛛網膜下腔出血患者。③ 干預措施與對照方法:A. 藥物/非藥物措施與安慰劑對照;B. 藥物/非藥物措施與空白對照(即無安慰劑,包括藥物/非藥物措施加其他治療/常規治療與單用其他治療/常規治療對照);C. 藥物/非藥物措施與有 A 級證據的活性措施對照。④ 結局指標:采用了下列指標之一:A. 病理(如實驗室或影像學指標);B. 病損(癥狀或體征);C. 殘疾/生活能力和殘障/生存質量。
1.1.2 排除標準
① 納入短暫性腦缺血發作等的二級預防研究或創傷性顱內出血研究;② 重復發表試驗以最早或最完善的報告為準。
1.2 檢索策略
檢索限于 2000 年 1 月—2019 年 12 月公開發表的中英文文獻。檢索的數據庫包括 PubMed(2000 年 1 月—2019 年 12 月)、Embase(2000 年 1 月—2019 年 12 月)、Cochrane 臨床試驗登記數據庫(Cochrane Central Registry of Controlled Trials,CENTRAL)(2019 第 12 期)、中國生物醫學文獻數據庫(China Biology Medicine disc,CBM)(2000 年 1 月—2019 年 12 月)、中國期刊全文數據庫(China National Knowledge Infrastructure,CNKI)(2000 年 1 月—2019 年 12 月)、萬方數據庫(2000 年 1 月—2019 年 12 月)、中國科技期刊全文數據庫(維普 VIP,2000 年 1 月—2019 年 12 月)。中文檢索關鍵詞包括“腦卒中”“隨機”“對照”“盲法”“多中心”,英文檢索關鍵詞為“stroke”“randomized controlled trial”“blind”“China OR Chinese”“multi-center”;詳細檢索策略發表在既往研究文獻[4]中;手工檢索相關資料及各論文參考文獻。參考 Cochrane 腦卒中組的檢索策略進行臨床試驗收集。
1.3 數據提取
2 名相互獨立的研究人員提取多中心 RCT 研究報告的基線特征和方法學特征:① 基線資料:包括研究的題目、發表日期、干預措施(西藥、中藥療法、康復療法、物理療法、手術療法、醫療管理、心理療法、藏藥治療)、樣本量(<100、100~499、500~999、≥1 000 例)、資金來源(國家、省級、市級、藥廠)、研究的卒中類型(缺血性、出血性、蛛網膜下腔出血);② 研究質量:采用 Cochrane 協作網偏倚風險評價標準評價納入 RCT 質量[7];③ 結局指標:參考 Wade 定義將判效指標按病理、病損、殘疾/生活能力和殘障/生存質量等 4 個水平進行分類,并記錄病死率和不良反應的報告率[8-9]。在該過程中若存在分歧,由 2 名研究人員協商討論,必要時咨詢第三方。本研究重點分析多中心臨床試驗數據。
1.4 統計學方法
使用 SPSS 21.0 軟件,計算有關項目頻率,樣本量及隨訪時間采用中位數及下、上四分位數描述。將納入的 20 年發表文獻分為 2000 年—2009 年和 2010 年—2019 年 2 個時間段,計量資料的組間比較采用 Mann-Whitney 秩和檢驗;計數資料的組間比較采用χ2檢驗或 Fisher 確切概率法。檢驗水準α=0.05。
2 結果
2.1 文獻篩選流程與結果
初步檢索得到 2 454 個報告,經過篩選及排除不符合納入標準或重復的文獻后,最終納入 90 篇文獻(圖 1)。

*具體包括:PubMed(
2.2 納入文獻基本特征
共納入腦卒中多中心治療 RCT 90 個,共包括病例 35 721 例。2000 年—2009 年發表多中心治療 RCT 39 個,2010 年—2019 年發表多中心治療 RCT 51 個;2010 年—2019 年發表的多中心 RCT 數量是 2000 年—2009 年發表數量的 1.31 倍;多中心 RCT 發表數量最多的一年為 2005 年(圖 2)。90 個多中心 RCT 樣本量為 18~2 710 例,中位數為 259 例,四分位數范圍為 141~424 例。有 26.7%(24/90)的多中心 RCT 報道了樣本量的計算。2000 年—2019 年多中心 RCT 基線特征見表 1。


2.3 方法學研究
2000 年—2009 年發表的多中心臨床研究在正確使用隨機方法、分組隱藏、盲法、報告使用意向性分析及隨訪時間方面與 2010 年—2019 年發表的多中心 RCT 比較差異無統計學意義(P>0.05),兩個時間段發表的臨床研究在報道失訪情況、明確報告主次要結局指標、不良反應報告方面差異有統計學意義(P<0.05)。見表 2。

2.4 結局指標
在 90 個多中心 RCT 中,22.2%(20/90)的試驗使用了病理水平指標,67.8%(61/90)的試驗使用了病損水平指標,63.3%(57/90)的試驗使用了殘疾/生活能力水平指標,41.1%(37/90)的試驗使用了殘障/生存質量水平指標,16.7%(15/90)的研究報道了死亡人數。71.1%(64/90)的研究報道了不良反應。
在 17 個多中心大樣本(樣本量≥500 例)RCT 中,僅有降纖酶[10-11]、人參皂甙-Rd [12]這 3 個雙盲安慰劑對照的臨床藥物研究主要結局指標采用了 3 個月殘疾/生活能力指標和殘障/生存質量判斷療效。降纖酶研究[10-11]為同一個研究方案,分別在 2000 年和 2005 年做了 2 次不同樣本量的試驗研究,其主要結局指標采用 Barthel 指數量表評價 3 個月患者殘疾/生活能力,次要結局指標采用中國卒中臨床神經功能缺損量表評價治療 15 d 時兩組患者神經功能恢復程度,依據病死率及不良反應評價降纖酶安全性;人參皂甙-Rd 臨床試驗[12]主要結局指標為治療 3 個月使用改良 Rankin 量表(modified Rankin scale,mRS)評價殘障/生存質量,次要結局指標為治療 15 d 采用美國國立衛生研究院腦卒中量表(National Institute of Health Stroke Scale,NIHSS)評價神經功能恢復程度,治療 3 個月采用 Barthel 指數評價殘疾/生活能力;降纖酶及人參皂甙-Rd 臨床研究均為陽性試驗結果。有 3 個大樣本(樣本量≥500 例)多中心非藥物臨床試驗正確使用隨機方法分組,充分實施分組隱藏以及盲法評估療效,它們分別是針灸治療研究[13]、手術去顱骨瓣術研究[14]以及腦卒中二級預防管理模式研究[15]。針灸治療研究[13]的主要結局指標包括隨訪 6 個月死亡/殘障率和死亡/遠期住院率,次要結局指標采用斯堪的納維亞腦卒中量表評價神經功能缺損變化,根據不良反應發生率評價針灸治療的安全性;針灸治療研究主要結局指標顯示試驗組及對照組在病死率差異無統計學意義,亞組分析顯示在接受≥10 次針刺治療后,日常生活依賴程度優于對照組。去骨瓣減壓術試驗[14]主要結局指標為 6 個月 mRS 評分,次要結局指標包括 6 個月和 12 個月的病死率以及 1 年后的 mRS 評分;去骨瓣減壓術試驗結果均為陽性試驗結果。腦卒中二級預防管理模式研究[15]主要結局指標為隨訪 6 個月和 12 個月堅持卒中二級預防患者的比例,次要結局指標包括隨訪 6 個月和 12 個月的血管事件發生率、全因死亡率、不良事件;試驗結果顯示試驗組服用他汀類藥物的依從性高,在其他的二級預防措施方面試驗組與對照組相比差異無統計學意義;兩組在血管事件發生率、全因死亡率、不良事件發生率方面差異無統計學意義。
3 討論
自 1996 年中國引進并發展循證醫學以來,在腦卒中治療領域,我國 RCT 發表數量每年均有明顯增長。然而,能為臨床實踐或指南制定提供可靠依據的高質量試驗一直是循證醫學方法學研究關注的重點。評價 RCT 是否可靠有多個國際評價指標,如 Corchran 腦卒中組 RCT 質量標準[7]、臨床試驗報告 Consort 標準等[16]。本研究作者所在的研究團隊自 1998 年來數次分析我國腦卒中 RCT 方法學質量[3-4, 8, 17],本次研究檢索了 2000 年—2019 年 20 年間我國內地發表的多中心 RCT,分為 2000 年—2009 和 2010 年—2019 年 2 個時間段作比較,20 年來發表的腦卒中多中心 RCT 數量呈平穩略有起伏的增長。雖然 2000 年—2009 年與 2010 年—2019 年發表的 RCT 在正確做到隨機分組、完善分組隱藏、盲法實施及報告使用意向性分析、隨訪時間 5 個方法學指標方面相比較,兩組差異無統計學意義,但數據顯示 2 個時間段均有 50% 以上的多中心 RCT 可以做到正確隨機分組及正確使用盲法對照;2010 年—2019 年發表的腦卒中多中心 RCT 在報告失訪情況、明確報告主次要結局指標及不良反應報告方面較前 10 年有改善及進步。這說明 20 年來我國多中心 RCT 方法學質量在逐步提高,但高質量臨床試驗仍然偏少。提高試驗質量的關鍵因素是做到真正的隨機分組,真正的隨機分組可以減少試驗入組時的選擇性偏倚。分組隱藏是指研究者和受試者均對受試者將被分在治療組或對照組不可預知,使用正確的分組隱藏方法如按順序編號的密封不透光的信封等方法是保障真正隨機分組的必要手段。藥物試驗采用中心控制的安慰劑對照可實現分組隱藏和盲法判斷療效。沒有安慰劑的藥物試驗雖可進行分組隱藏但可操作性差。非藥物試驗如針灸、外科手術等對受試者和醫生采用安慰劑和設盲常常十分困難,但采用分組隱藏和盲法判效是可行的。
本研究進一步發現,在 90 個腦卒中多中心 RCT 中,有 17 個大樣本(樣本量≥500 例)多中心 RCT,其中正確做到隨機分組、完善的分組隱藏、雙盲安慰劑對照,采用終點指標隨訪 3 個月或以上的藥物研究 3 個,采用盲法評估的非藥物研究 3 個。樣本量足夠大,才能有較大的可能性檢測出兩組之間臨床結果的重要差異(減少假陰性)[18]。我國臨床試驗的樣本量多數偏小,其結果的偶然性難以排除。希望未來更多的卒中研究能增大樣本量,但若大樣本研究太困難,也應在其他方面嚴格設計與實施,以便做高質量的系統評價來彌補樣本的問題。療效指標選擇及測定時間的長短等與患者的需求、價值觀,醫生的經驗,社會文化因素等有很大關系。療效結局指標雖然很重要,但需在真正隨機分組及盲法判效的前提下才能保證研究結果的真實性和可應用性。
本次腦卒中多中心 RCT 納入了腦卒中急性期及恢復期的臨床研究,除了西藥治療研究依舊占腦卒中治療的主流研究方向,但因為我國傳統療法如中藥和針灸等廣泛應用于中國各個地區腦卒中急性期及恢復期的治療,我國近半數的多中心臨床試驗致力于探討傳統中醫療效,但由于中醫陰陽辯治理論復雜,RCT 方法學設計混雜因素較多,高質量的中醫 RCT 較少,大多數研究結果尚不足以指導臨床研究。此外,我國在腦卒中后的功能(如言語、認知、吞咽功能等)康復治療、卒中標準化管理,以及卒中一級/二級預防教育等方面仍缺乏高質量臨床實踐證據指導[19]。腦卒中是高致殘率的疾病之一,目前越來越多的患者對腦卒中康復需求高,未來我國應該有更多的臨床研究聚焦腦卒中亞急性期康復干預治療,提高患者運動、言語功能,以及降低腦卒中后情緒障礙發生率[20]。
綜上,通過分析中國內地腦卒中治療多中心 RCT 的方法學質量和結局指標評估的現狀可知,我國在此領域全面符合國際標準[7, 16]的臨床試驗非常缺乏,我國腦卒中臨床試驗質量改善進步依舊緩慢。未來臨床試驗應充分重視藥物研究的安慰劑對照和非藥物試驗的分組隱藏及盲法判斷療效的實施。最好是多中心參與,在試驗實施中應保證有中心質量監控措施。政府、地區和醫院的決策者及醫生應聯合起來共同致力于探索能廣泛應用于腦卒中預防及治療,且經濟負擔合理的干預措施,并在全國范圍內提供更平衡的衛生資源和基于證據的腦卒中治療,同時對特定的疾病診治提供個體化的臨床實踐指導[1]。
腦卒中是高致死率及高致殘率的疾病之一,急性期的恰當治療和恢復期的早期康復是降低腦卒中患者死亡或殘疾的重要環節[1]。隨機對照試驗(randomized controlled trial,RCT)一直是檢驗臨床治療療效的金標準[2]。自 1996 年中國引進與發展循證醫學以來,RCT 已廣泛應用于探索我國腦卒中傳統治療措施的療效,以及評估西方國家的療法是否適用于中國患者[3]。本研究筆者曾分析了 1996 年—2010 年發表的急性腦卒中 RCT 質量,研究表明雖然中國急性腦卒中治療措施的臨床試驗發表數量增長明顯,但僅有 0.3% 的 RCT 是正確做到有安慰劑對照及分組隱藏的高質量 RCT[4]。近 10 余年來,隨著中國神經病學學會及腦血管組分會制定的中國腦卒中預防和治療指南對腦卒中臨床診療實踐的指導,循證醫學治療(如卒中單元、抗凝、抗血小板、降脂、降壓等)已規范化應用于腦卒中的急性期治療[5-6],但促進卒中后的功能(如運動、言語、認知、吞咽功能等)恢復的康復治療,以及腦卒中二級預防教育等方面仍然缺乏高質量臨床實踐證據的指導。因此,有必要再次將腦卒中急性期和恢復期治療試驗質量的現狀進一步更新,特別聚焦有安慰劑對照和分組隱藏的多中心 RCT,旨在為未來制定腦卒中的臨床指南及臨床研究策略提供科學依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
① 研究類型:2000 年 1 月—2019 年 12 月國內外已發表的、在中國內地患者中研究的腦卒中治療措施,自述為多中心 RCT 的人體研究。② 研究對象:包括急性期和恢復期的腦梗死、腦出血或蛛網膜下腔出血患者。③ 干預措施與對照方法:A. 藥物/非藥物措施與安慰劑對照;B. 藥物/非藥物措施與空白對照(即無安慰劑,包括藥物/非藥物措施加其他治療/常規治療與單用其他治療/常規治療對照);C. 藥物/非藥物措施與有 A 級證據的活性措施對照。④ 結局指標:采用了下列指標之一:A. 病理(如實驗室或影像學指標);B. 病損(癥狀或體征);C. 殘疾/生活能力和殘障/生存質量。
1.1.2 排除標準
① 納入短暫性腦缺血發作等的二級預防研究或創傷性顱內出血研究;② 重復發表試驗以最早或最完善的報告為準。
1.2 檢索策略
檢索限于 2000 年 1 月—2019 年 12 月公開發表的中英文文獻。檢索的數據庫包括 PubMed(2000 年 1 月—2019 年 12 月)、Embase(2000 年 1 月—2019 年 12 月)、Cochrane 臨床試驗登記數據庫(Cochrane Central Registry of Controlled Trials,CENTRAL)(2019 第 12 期)、中國生物醫學文獻數據庫(China Biology Medicine disc,CBM)(2000 年 1 月—2019 年 12 月)、中國期刊全文數據庫(China National Knowledge Infrastructure,CNKI)(2000 年 1 月—2019 年 12 月)、萬方數據庫(2000 年 1 月—2019 年 12 月)、中國科技期刊全文數據庫(維普 VIP,2000 年 1 月—2019 年 12 月)。中文檢索關鍵詞包括“腦卒中”“隨機”“對照”“盲法”“多中心”,英文檢索關鍵詞為“stroke”“randomized controlled trial”“blind”“China OR Chinese”“multi-center”;詳細檢索策略發表在既往研究文獻[4]中;手工檢索相關資料及各論文參考文獻。參考 Cochrane 腦卒中組的檢索策略進行臨床試驗收集。
1.3 數據提取
2 名相互獨立的研究人員提取多中心 RCT 研究報告的基線特征和方法學特征:① 基線資料:包括研究的題目、發表日期、干預措施(西藥、中藥療法、康復療法、物理療法、手術療法、醫療管理、心理療法、藏藥治療)、樣本量(<100、100~499、500~999、≥1 000 例)、資金來源(國家、省級、市級、藥廠)、研究的卒中類型(缺血性、出血性、蛛網膜下腔出血);② 研究質量:采用 Cochrane 協作網偏倚風險評價標準評價納入 RCT 質量[7];③ 結局指標:參考 Wade 定義將判效指標按病理、病損、殘疾/生活能力和殘障/生存質量等 4 個水平進行分類,并記錄病死率和不良反應的報告率[8-9]。在該過程中若存在分歧,由 2 名研究人員協商討論,必要時咨詢第三方。本研究重點分析多中心臨床試驗數據。
1.4 統計學方法
使用 SPSS 21.0 軟件,計算有關項目頻率,樣本量及隨訪時間采用中位數及下、上四分位數描述。將納入的 20 年發表文獻分為 2000 年—2009 年和 2010 年—2019 年 2 個時間段,計量資料的組間比較采用 Mann-Whitney 秩和檢驗;計數資料的組間比較采用χ2檢驗或 Fisher 確切概率法。檢驗水準α=0.05。
2 結果
2.1 文獻篩選流程與結果
初步檢索得到 2 454 個報告,經過篩選及排除不符合納入標準或重復的文獻后,最終納入 90 篇文獻(圖 1)。

*具體包括:PubMed(
2.2 納入文獻基本特征
共納入腦卒中多中心治療 RCT 90 個,共包括病例 35 721 例。2000 年—2009 年發表多中心治療 RCT 39 個,2010 年—2019 年發表多中心治療 RCT 51 個;2010 年—2019 年發表的多中心 RCT 數量是 2000 年—2009 年發表數量的 1.31 倍;多中心 RCT 發表數量最多的一年為 2005 年(圖 2)。90 個多中心 RCT 樣本量為 18~2 710 例,中位數為 259 例,四分位數范圍為 141~424 例。有 26.7%(24/90)的多中心 RCT 報道了樣本量的計算。2000 年—2019 年多中心 RCT 基線特征見表 1。


2.3 方法學研究
2000 年—2009 年發表的多中心臨床研究在正確使用隨機方法、分組隱藏、盲法、報告使用意向性分析及隨訪時間方面與 2010 年—2019 年發表的多中心 RCT 比較差異無統計學意義(P>0.05),兩個時間段發表的臨床研究在報道失訪情況、明確報告主次要結局指標、不良反應報告方面差異有統計學意義(P<0.05)。見表 2。

2.4 結局指標
在 90 個多中心 RCT 中,22.2%(20/90)的試驗使用了病理水平指標,67.8%(61/90)的試驗使用了病損水平指標,63.3%(57/90)的試驗使用了殘疾/生活能力水平指標,41.1%(37/90)的試驗使用了殘障/生存質量水平指標,16.7%(15/90)的研究報道了死亡人數。71.1%(64/90)的研究報道了不良反應。
在 17 個多中心大樣本(樣本量≥500 例)RCT 中,僅有降纖酶[10-11]、人參皂甙-Rd [12]這 3 個雙盲安慰劑對照的臨床藥物研究主要結局指標采用了 3 個月殘疾/生活能力指標和殘障/生存質量判斷療效。降纖酶研究[10-11]為同一個研究方案,分別在 2000 年和 2005 年做了 2 次不同樣本量的試驗研究,其主要結局指標采用 Barthel 指數量表評價 3 個月患者殘疾/生活能力,次要結局指標采用中國卒中臨床神經功能缺損量表評價治療 15 d 時兩組患者神經功能恢復程度,依據病死率及不良反應評價降纖酶安全性;人參皂甙-Rd 臨床試驗[12]主要結局指標為治療 3 個月使用改良 Rankin 量表(modified Rankin scale,mRS)評價殘障/生存質量,次要結局指標為治療 15 d 采用美國國立衛生研究院腦卒中量表(National Institute of Health Stroke Scale,NIHSS)評價神經功能恢復程度,治療 3 個月采用 Barthel 指數評價殘疾/生活能力;降纖酶及人參皂甙-Rd 臨床研究均為陽性試驗結果。有 3 個大樣本(樣本量≥500 例)多中心非藥物臨床試驗正確使用隨機方法分組,充分實施分組隱藏以及盲法評估療效,它們分別是針灸治療研究[13]、手術去顱骨瓣術研究[14]以及腦卒中二級預防管理模式研究[15]。針灸治療研究[13]的主要結局指標包括隨訪 6 個月死亡/殘障率和死亡/遠期住院率,次要結局指標采用斯堪的納維亞腦卒中量表評價神經功能缺損變化,根據不良反應發生率評價針灸治療的安全性;針灸治療研究主要結局指標顯示試驗組及對照組在病死率差異無統計學意義,亞組分析顯示在接受≥10 次針刺治療后,日常生活依賴程度優于對照組。去骨瓣減壓術試驗[14]主要結局指標為 6 個月 mRS 評分,次要結局指標包括 6 個月和 12 個月的病死率以及 1 年后的 mRS 評分;去骨瓣減壓術試驗結果均為陽性試驗結果。腦卒中二級預防管理模式研究[15]主要結局指標為隨訪 6 個月和 12 個月堅持卒中二級預防患者的比例,次要結局指標包括隨訪 6 個月和 12 個月的血管事件發生率、全因死亡率、不良事件;試驗結果顯示試驗組服用他汀類藥物的依從性高,在其他的二級預防措施方面試驗組與對照組相比差異無統計學意義;兩組在血管事件發生率、全因死亡率、不良事件發生率方面差異無統計學意義。
3 討論
自 1996 年中國引進并發展循證醫學以來,在腦卒中治療領域,我國 RCT 發表數量每年均有明顯增長。然而,能為臨床實踐或指南制定提供可靠依據的高質量試驗一直是循證醫學方法學研究關注的重點。評價 RCT 是否可靠有多個國際評價指標,如 Corchran 腦卒中組 RCT 質量標準[7]、臨床試驗報告 Consort 標準等[16]。本研究作者所在的研究團隊自 1998 年來數次分析我國腦卒中 RCT 方法學質量[3-4, 8, 17],本次研究檢索了 2000 年—2019 年 20 年間我國內地發表的多中心 RCT,分為 2000 年—2009 和 2010 年—2019 年 2 個時間段作比較,20 年來發表的腦卒中多中心 RCT 數量呈平穩略有起伏的增長。雖然 2000 年—2009 年與 2010 年—2019 年發表的 RCT 在正確做到隨機分組、完善分組隱藏、盲法實施及報告使用意向性分析、隨訪時間 5 個方法學指標方面相比較,兩組差異無統計學意義,但數據顯示 2 個時間段均有 50% 以上的多中心 RCT 可以做到正確隨機分組及正確使用盲法對照;2010 年—2019 年發表的腦卒中多中心 RCT 在報告失訪情況、明確報告主次要結局指標及不良反應報告方面較前 10 年有改善及進步。這說明 20 年來我國多中心 RCT 方法學質量在逐步提高,但高質量臨床試驗仍然偏少。提高試驗質量的關鍵因素是做到真正的隨機分組,真正的隨機分組可以減少試驗入組時的選擇性偏倚。分組隱藏是指研究者和受試者均對受試者將被分在治療組或對照組不可預知,使用正確的分組隱藏方法如按順序編號的密封不透光的信封等方法是保障真正隨機分組的必要手段。藥物試驗采用中心控制的安慰劑對照可實現分組隱藏和盲法判斷療效。沒有安慰劑的藥物試驗雖可進行分組隱藏但可操作性差。非藥物試驗如針灸、外科手術等對受試者和醫生采用安慰劑和設盲常常十分困難,但采用分組隱藏和盲法判效是可行的。
本研究進一步發現,在 90 個腦卒中多中心 RCT 中,有 17 個大樣本(樣本量≥500 例)多中心 RCT,其中正確做到隨機分組、完善的分組隱藏、雙盲安慰劑對照,采用終點指標隨訪 3 個月或以上的藥物研究 3 個,采用盲法評估的非藥物研究 3 個。樣本量足夠大,才能有較大的可能性檢測出兩組之間臨床結果的重要差異(減少假陰性)[18]。我國臨床試驗的樣本量多數偏小,其結果的偶然性難以排除。希望未來更多的卒中研究能增大樣本量,但若大樣本研究太困難,也應在其他方面嚴格設計與實施,以便做高質量的系統評價來彌補樣本的問題。療效指標選擇及測定時間的長短等與患者的需求、價值觀,醫生的經驗,社會文化因素等有很大關系。療效結局指標雖然很重要,但需在真正隨機分組及盲法判效的前提下才能保證研究結果的真實性和可應用性。
本次腦卒中多中心 RCT 納入了腦卒中急性期及恢復期的臨床研究,除了西藥治療研究依舊占腦卒中治療的主流研究方向,但因為我國傳統療法如中藥和針灸等廣泛應用于中國各個地區腦卒中急性期及恢復期的治療,我國近半數的多中心臨床試驗致力于探討傳統中醫療效,但由于中醫陰陽辯治理論復雜,RCT 方法學設計混雜因素較多,高質量的中醫 RCT 較少,大多數研究結果尚不足以指導臨床研究。此外,我國在腦卒中后的功能(如言語、認知、吞咽功能等)康復治療、卒中標準化管理,以及卒中一級/二級預防教育等方面仍缺乏高質量臨床實踐證據指導[19]。腦卒中是高致殘率的疾病之一,目前越來越多的患者對腦卒中康復需求高,未來我國應該有更多的臨床研究聚焦腦卒中亞急性期康復干預治療,提高患者運動、言語功能,以及降低腦卒中后情緒障礙發生率[20]。
綜上,通過分析中國內地腦卒中治療多中心 RCT 的方法學質量和結局指標評估的現狀可知,我國在此領域全面符合國際標準[7, 16]的臨床試驗非常缺乏,我國腦卒中臨床試驗質量改善進步依舊緩慢。未來臨床試驗應充分重視藥物研究的安慰劑對照和非藥物試驗的分組隱藏及盲法判斷療效的實施。最好是多中心參與,在試驗實施中應保證有中心質量監控措施。政府、地區和醫院的決策者及醫生應聯合起來共同致力于探索能廣泛應用于腦卒中預防及治療,且經濟負擔合理的干預措施,并在全國范圍內提供更平衡的衛生資源和基于證據的腦卒中治療,同時對特定的疾病診治提供個體化的臨床實踐指導[1]。