引用本文: 黃忠營, 孫衛強, 鄧宏勇, 賴佳琪, 劉少南, 楊麗虹, 郭新峰, 吳大嶸, 商洪才. 中醫隨機對照試驗元數據完整性的評價. 中國循證醫學雜志, 2021, 21(10): 1211-1218. doi: 10.7507/1672-2531.202106018 復制
隨機對照試驗(randomized controlled trial,RCT)是干預性措施療效比較的金標準[1],其在臨床實踐和研究中獲得了廣泛應用[2]。它為系統評價和 Meta 分析提供基礎,能夠最大程度地減少或避免偏倚[3]。有研究表明,目前 RCT 的報告質量受研究設計不當、報告不充分等原因影響[4],缺乏完整、透明的報告,導致讀者不能判斷結果的可靠性和有效性,也不能有效提取信息進行系統評價[5]。對 RCT 報告質量進行評價,可指導期刊同行評議,幫助開展科學的 Meta 分析,具有重要意義。然而,當前中醫藥 RCT 質量評價研究存在兩點局限:一是主要針對治療單一病種或特定中醫雜志期刊出版的文獻進行評價,且受制于文獻篩選和信息提取的高額成本,納入文獻數量有限、年份跨度小,得出的評價結果存在片面化、單一化問題;二是主要采用的報告質量評價工具是《臨床試驗報告的統一標準》[6](CONSORT 聲明)及其擴展版本 CONSORT-CHM[7, 8],其結構化程度較低,評價格式不盡相同,既不利于評價結果的一致性[9],也不利于提取數據的自動化/半自動化重用與處理[10]。
因此,本研究提出采用計算機描述的中醫藥 RCT 元數據接口規范及依據該規范定義的元數據完整性評價模型,并據此對已發表的中醫藥 RCT 數據完整性進行評價。以期更加客觀地反映我國中醫藥 RCT 研究數據報告狀況和存在問題,并對海量中醫藥 RCT 元數據在計算機系統中的自動化流動和應用提供借鑒。
1 元數據接口規范
元數據接口規范來源于“中醫藥優勢病種證據系統的智能化構建和應用示范”國家重點研發計劃,是由中醫臨床、方法學、信息技術和數據庫構建等方面專家聯合商定,針對中醫藥臨床研究特點制定的中醫藥 RCT 報告數據交互接口規范(http://tcm-meta.sjtu.edu.cn/doc/)。
該規范于 2020 年 3 月建立草案,經征求意見、修訂后定稿。參考 CONSORT-CHM 聲明,元數據接口規范對中醫藥 RCT 研究提出了更加詳細、明確的數據報告要求。規范中引入中醫證型概念,增加中醫診斷、中醫方劑、針灸穴位、中醫證候療效指標等信息,為中醫藥 RCT 的設計、實施和數據報告,以及數據的流動、應用、自動化客觀評價提供開放的統一標準。
元數據接口規范清單包括“文獻基本數據”、“編輯歷史”和“臨床試驗”三個方面共 111 個條目。每個條目定義計算機可識別的一個字段的名稱、必填性及相應提取內容的類型和格式。規范中必填字段對應的條目為關鍵條目,涵蓋中醫藥 RCT 的關鍵信息。“文獻基本數據”中包含文獻來源,研究項目資助等文獻元信息。“編輯歷史”包含文獻數據的創建和修改等信息,主要用于版本記錄和追蹤。“臨床試驗”描述一項臨床試驗的所有信息,包括“研究對象臨床資料”、“試驗設計”、“分組情況”、“干預措施”和“結局指標”五個部分共 80 個條目。其中“臨床資料”部分包含中西醫診斷與參考依據、病例總數、脫落例數、年齡、病程信息及納入與排除標準等;“試驗設計”描述隨機分配隱藏、盲法設計、試驗場所等信息;“分組情況”描述受試者在各組內的病例數、脫落例數、年齡、病程等信息;“干預措施”記錄各組實施的干預方法、治療頻率、療程等情況;“結局指標”規定臨床研究所采用的結局指標集合。對于不同的病種,規范定義了必須要關注的臨床結局指標。每一種結局指標都按照固定的格式記錄相應數據。
如圖 1 所示,規范清單條目整體呈樹狀結構,條目和部分間從屬情況清晰,并且可以依據試驗報告的分組數目、結局指標數靈活擴展,以最大程度詳細、全面地涵蓋試驗的報告信息。

2 中醫藥 RCT 元數據完整性客觀評價模型
評價模型設計目的是以元數據接口規范中列舉的條目清單為依據,對證據文獻中數據報告的完整性給予客觀評價。使用客觀評價模型,可避免不同系統評價者對同一篇 RCT 報告評價結果不一致的現象[11]。以客觀評價模型為基礎,可以實現對海量 RCT 數據報告的自動化評價,在構建 RCT 數據應用中進行數據完整性控制至關重要。
模型設定報告評價結果為分數制,0 分最低,滿分為 100 分,60 分為合格。依據元數據接口規范,涵蓋 RCT 報告關鍵信息的關鍵條目為影響報告數據完整性的決定性因素,因此關鍵條目報告不完整者判定為不合格文獻。由此研究者可通過文獻評分所在區間直觀判斷文獻關鍵條目完整性。在此基礎上,報告數據的評價結果取決于報告的非關鍵條目與結局指標的完善程度。
模型首先通過設立篩選規則來保證文獻滿足 RCT 與元數據接口規范的最基本要求。其次關注包含描述 RCT 的所有文獻關鍵條目的完整程度,確定文獻最終得分的區間。最后將非關鍵條目與結局指標的報告個數累計求和,通過分數映射調整至對應得分區間并計算最終得分。具體實現如下。
2.1 模型篩選規則
具有以下條件的報告不滿足元數據接口規范基本要求,模型不予評分。
2.1.1 文獻證據關鍵條目嚴重缺失
定義 1.關鍵條目嚴重缺失:
![]() |
其中 Cr 為待評分報告的關鍵條目個數,Td 為關鍵條目個數閾值,這里設置為 0.7,Nr 為總關鍵條目個數。
2.1.2 未報告有效結局指標
未報告有效的結局指標的文獻,模型不予評分。根據元數據接口規范,若文獻的該結局指標類型為離散型,研究者需報告所有試驗分組的事件例數;若結局指標類型為連續型,需要報告所有試驗分組的治療前后的均值和標準差。當滿足以上條件,即認為這是一條有效的結局指標。
2.2 非關鍵條目計分
根據元數據接口規范,模型統計文獻報告的非關鍵條目個數,將其線性映射至 0 至非關鍵條目的最高分配得分區間內:
![]() |
其中 ki 為該字段條目的指示變量,當文獻報告了該字段條目的結果時為 1,否則為 0。 為基礎部分的最高分配得分,這里設置為 40。
為元數據接口規范定義的非關鍵條目總個數,
為線性映射后的非關鍵條目得分
2.3 結局指標計分
文獻結局指標部分得分按照其有效報告個數計分。由于規范中不同病種的結局指標集合包含的數目不同,以及文獻數據完整性并非隨報告的結局指標報告個數線性提升,故本研究設計對數函數來實現結局指標個數較少時分數增長較快,指標個數較多時分數增速減緩,如公式(3)所示。
![]() |
其中 Som 為所求的結局指標得分,St 為滿分,Co 為報告的有效結局指標個數,Cot 為規范中定義的指標集合的總數目,根據病種在臨床研究所采用的結局指標集合個數確定(表 1)。

2.4 最終得分計算
定義 2.關鍵條目輕度缺失:
![]() |
除關鍵條目嚴重缺失的文獻不予評分外,通過線性映射實現關鍵條目完整的文獻最終得分在合格分數至滿分間,如公式(5)所示。關鍵條目輕度缺失文獻分數在 0 至合格分數之間,如公式(6)所示。
![]() |
![]() |
其中 Sq 為及格分數。
3 資料提取
3.1 納入與排除標準
3.1.1 納入標準
① 研究病種為 COPD、冠心病心絞痛、心衰、膝骨關節炎、糖尿病腎病、類風濕性關節炎、糖尿病、小兒腹瀉、肥胖和結直腸癌 10 個病種;② 任意一組干預措施為中醫或中西醫結合(包括中藥、針灸及其他中醫療法);③ 研究設計類型為 RCT。
3.1.2 排除標準
① 無全文,或是僅有摘要;② 非中英文文獻;③ 重復發表文獻保留數據最全、最新的資料。
3.2 文獻檢索策略
計算機檢索 CBM、WanFang Data、CNKI、PubMed、EMbase 和 The Cochrane Library 數據庫,搜集中醫干預治療以上 10 個病種的 RCT,檢索時間均由建庫至 2020 年 3 月。檢索式主要由病名、中醫干預措施及研究類型三類檢索詞進行邏輯組配。病名和中醫干預措施兩組檢索詞參照各研究病種的臨床研究情況分別制定。研究類型的中文檢索詞為“隨機”,英文采用麥克馬斯特大學推薦的 RCT 檢索過濾器(http://hiru.mcmaster.ca/hiru/HIRU_Hedges_MEDLINE_Strategies.aspx)。
3.3 文獻篩選和數據提取
計算機檢索所得文獻經過除重及題錄、摘要初篩后進行全文閱讀篩選及數據提取。各病種提取的數據包含文獻一般信息(包括但不限于受試者來源、例數、年齡、病程)、各組干預措施(包括但不限于干預、中藥組成、針灸穴位、療程)及結局指標,其中結局指標的選取通過臨床專科專家咨詢確定。
4 結果
4.1 納入文獻的基本情況
共納入 37 361 篇 RCT,發表時間和篇數見表 2,各病種納入篇數見表 3,發表的主要期刊和篇數見表 4。



4.2 元數據完整性統計結果
未通過篩選的報告數目為 6 743 篇(18.05%),其中 63 篇報告為關鍵條目嚴重缺失,其余報告皆因為缺乏有效結局指標報告而未納入評價[12]。各病種滿足關鍵條目完整的報告數目比例在 73%~97% 之間(圖 2),影響關鍵條目完整程度的條目主要為“中醫診斷”和“脫落例數”。中醫證候診斷及其評價是中醫藥臨床療效評價與西藥療效評價的根本區別[13],目前臨床研究主要采用西醫診斷標準,研究者可參考中醫藥領域國家及權威機構認定的行業標準、診療指南,來完善此方面的報告[14]。另外報告結果不僅應加強報告受試者的脫落數據,還應對脫落原因詳細描述,如違背研究方案、研究周期中斷、違背受試者主觀意愿等[15]。

“分組情況”部分,90% 以上報告將試驗分為試驗組和對照組共 2 組,分配 4 組及以上的占比低于 1%。如圖 3 所示,各試驗分組下,僅“病例數”條目報告率為 100%,其余條目信息均有缺失,其中“年齡標準差”和“病程標準差”報告率極低,分別為 9.24% 和 5.34%。從病種分布看,除類風濕性關節炎外,其余病種均在病程方面信息完整度較為欠缺。

“干預措施”部分,詳細描述各組干預細節的報告篇數不足 50%,中藥方劑配伍具體的劑量、劑型、治療頻率信息報告率較低(圖 4),具體表現在 RCT 對照組干預措施表述模糊,沒有說明具體干預方案。而干預措施是 RCT 報告重要組成部分,研究者對其盡可能詳細地對其報告,能夠增強試驗的完整性、一致性與可復現性。

“結局指標”方面,表 5 列舉各病種對應結局指標報告率高于 30% 的篇數與占比,圖 5 顯示了各病種報告結局指標個數的篇數占比情況,研究結果表明各病種實際平均報告結局指標數目與元數據接口規范定義的指標數目尚存在差距。關于不良事件,4 119 篇報道無不良事件,4 969 篇報道有不良事件,其余 RCT 均無報道。而不良反應通常會對 RCT 干預措施的可接受性及可用性產生影響[16]。近年來隨著中草藥臨床實踐的推廣,中藥不良反應受到國際和國內廣泛關注,中醫藥 RCT 的科學化、國際化與中醫藥臨床治療質量保障和水平提升都要求 RCT 建立臨床試驗全程透明化理念,對試驗結果詮釋充分,報道詳細、具體,對陰性結果的試驗也應鼓勵發表[15]。


4.3 元數據完整性客觀評價結果
經篩選后進行評分的報告篇數為 30 617 篇,其評分分布情況如圖 6 所示,平均得分 71.39 分。不合格(低于 60 分)報告有 6 245 篇,平均得分為 35.17±6.58 分;合格 RCT 有 24 372 篇,平均得分為 80.67±3.52;其中 80 分以上報告 13 717 篇,90 分以上報告僅 53 篇。圖 7 顯示了 2000~2020 年 RCT 得分隨年份的變化趨勢,RCT 平均得分由 2000 年的 68.25 分增至 2020 年的 74.19 分,中醫藥臨床 RCT 報告數據完整性有了顯著提升。


因為類似的研究較少,本文未將所提出的模型與評價結果和其他的研究工作進行對比。為驗證模型評分結果的準確性,本研究選擇報告數量最多的 27 種中醫藥期刊,并統計其合格文獻得分的平均值。另外邀請廣東省中醫院、上海中醫藥大學等機構的 19 位中醫藥循證醫學研究領域的專家依據經驗和主觀認知對這些中醫藥期刊所刊載 RCT 報告數據完整性水平進行評分(分值為 0~4 分)。兩種評分的相關性分析如圖 8 所示,擬合的直線相關系數為 0.790,顯示本研究提出的元數據完整性客觀評價模型的評分結果與專家意見的一致性較好。

5 討論
目前 RCT 數據的采集均在論文發表后進行,從大量文獻中人工提取元數據,成本較高且不可避免地會帶來一定的數據損失[17, 18]。在數據提取完成后,信息系統內存儲、編輯和跨信息系統中數據鏈接和數據流動過程也會影響數據的完整性[19, 20],例如,復制、粘貼會導致信息多余和不準確[21]、并引入額外的干擾信息[22]。完整性差與結構化程度低的數據阻礙了中醫學循證研究成果的交流與共享,不利于中醫藥循證研究的創新。
針對此現狀,我們倡議啟動“中醫藥臨床數據開放計劃(http://tcm-meta.sjtu.edu.cn/)”。計劃將本研究所提出的元數據規范與完整性評價模型付諸應用。平臺要求臨床研究的作者在提交論文的同時將數據提交至開放數據平臺,并由數據評審專家進行數據評審,保證作者錄入數據與稿件原文的一致性和準確性。論文發表時數據即可上線。研究者可通過申請數據權限,在開放平臺檢索并下載數據進行分析研究。整個過程不僅可保證數據完整與結構化的控制閉環,還可通過計算機輔助和作者介入有效降低數據采集成本[23]、有效縮短數據應用時間,進一步促進中醫藥 RCT 數據的開放與重用。
參與數據開放和共享,出版機構和相關研究者均可從中受益:出版機構可讓投稿的研究更規范、更具結構化,更易于被引用/重用,提升出版物的影響力和附加值;中醫藥相關研究者參與數據共享,使用共享數據;數據分析相關研究者能夠跨學科合作,催生創新成果的產出。開放和共享的數據源于研究者,服務于研究者,最終可以成為中醫藥相關研究者的共有資產。這需要中醫藥期刊出版機構、研究者、開發者的共同參與、努力和推廣,從而推動中醫藥循證研究的創新,為“中醫藥現代化”夯實數據基礎。
本研究存在一定的局限性:① 和其他的研究一樣,納入文獻對相關信息的報告不完全和漏報[24],這會對最終評價結果產生一定影響;② 本文中我們按照經驗對模型參數進行了設定,在應用時可能需要按照不同的應用場景對參數調整和優化,以體現該場景中對數據條目完整性的不同要求。
綜上,本研究提出符合中醫藥臨床特點的 RCT 元數據接口規范和數據完整性評價模型,兩者結合可對 RCT 報告數據完整性作出客觀判斷,避免因人工評價產生的主觀錯誤和偏倚,保證評價結果的一致性。其后本研究對提取的 37 361 篇中醫藥 RCT 文獻進行完整性評價并探討其存在的問題。評價結果表明當前中醫藥 RCT 數據報告總體數據完整性有較大提升空間。最后對目前 RCT 文獻報告條目結構化程度低、完整性差的問題提出解決思路和倡議。為引導試驗結果向臨床決策轉化,中醫藥 RCT 需要在保證試驗設計的科學性和實施的標準化基礎上,提高數據報告的完整性。本研究提出的元數據接口規范和評價模型可為提高中醫藥臨床試驗報告數據完整性提供參考和依據。
隨機對照試驗(randomized controlled trial,RCT)是干預性措施療效比較的金標準[1],其在臨床實踐和研究中獲得了廣泛應用[2]。它為系統評價和 Meta 分析提供基礎,能夠最大程度地減少或避免偏倚[3]。有研究表明,目前 RCT 的報告質量受研究設計不當、報告不充分等原因影響[4],缺乏完整、透明的報告,導致讀者不能判斷結果的可靠性和有效性,也不能有效提取信息進行系統評價[5]。對 RCT 報告質量進行評價,可指導期刊同行評議,幫助開展科學的 Meta 分析,具有重要意義。然而,當前中醫藥 RCT 質量評價研究存在兩點局限:一是主要針對治療單一病種或特定中醫雜志期刊出版的文獻進行評價,且受制于文獻篩選和信息提取的高額成本,納入文獻數量有限、年份跨度小,得出的評價結果存在片面化、單一化問題;二是主要采用的報告質量評價工具是《臨床試驗報告的統一標準》[6](CONSORT 聲明)及其擴展版本 CONSORT-CHM[7, 8],其結構化程度較低,評價格式不盡相同,既不利于評價結果的一致性[9],也不利于提取數據的自動化/半自動化重用與處理[10]。
因此,本研究提出采用計算機描述的中醫藥 RCT 元數據接口規范及依據該規范定義的元數據完整性評價模型,并據此對已發表的中醫藥 RCT 數據完整性進行評價。以期更加客觀地反映我國中醫藥 RCT 研究數據報告狀況和存在問題,并對海量中醫藥 RCT 元數據在計算機系統中的自動化流動和應用提供借鑒。
1 元數據接口規范
元數據接口規范來源于“中醫藥優勢病種證據系統的智能化構建和應用示范”國家重點研發計劃,是由中醫臨床、方法學、信息技術和數據庫構建等方面專家聯合商定,針對中醫藥臨床研究特點制定的中醫藥 RCT 報告數據交互接口規范(http://tcm-meta.sjtu.edu.cn/doc/)。
該規范于 2020 年 3 月建立草案,經征求意見、修訂后定稿。參考 CONSORT-CHM 聲明,元數據接口規范對中醫藥 RCT 研究提出了更加詳細、明確的數據報告要求。規范中引入中醫證型概念,增加中醫診斷、中醫方劑、針灸穴位、中醫證候療效指標等信息,為中醫藥 RCT 的設計、實施和數據報告,以及數據的流動、應用、自動化客觀評價提供開放的統一標準。
元數據接口規范清單包括“文獻基本數據”、“編輯歷史”和“臨床試驗”三個方面共 111 個條目。每個條目定義計算機可識別的一個字段的名稱、必填性及相應提取內容的類型和格式。規范中必填字段對應的條目為關鍵條目,涵蓋中醫藥 RCT 的關鍵信息。“文獻基本數據”中包含文獻來源,研究項目資助等文獻元信息。“編輯歷史”包含文獻數據的創建和修改等信息,主要用于版本記錄和追蹤。“臨床試驗”描述一項臨床試驗的所有信息,包括“研究對象臨床資料”、“試驗設計”、“分組情況”、“干預措施”和“結局指標”五個部分共 80 個條目。其中“臨床資料”部分包含中西醫診斷與參考依據、病例總數、脫落例數、年齡、病程信息及納入與排除標準等;“試驗設計”描述隨機分配隱藏、盲法設計、試驗場所等信息;“分組情況”描述受試者在各組內的病例數、脫落例數、年齡、病程等信息;“干預措施”記錄各組實施的干預方法、治療頻率、療程等情況;“結局指標”規定臨床研究所采用的結局指標集合。對于不同的病種,規范定義了必須要關注的臨床結局指標。每一種結局指標都按照固定的格式記錄相應數據。
如圖 1 所示,規范清單條目整體呈樹狀結構,條目和部分間從屬情況清晰,并且可以依據試驗報告的分組數目、結局指標數靈活擴展,以最大程度詳細、全面地涵蓋試驗的報告信息。

2 中醫藥 RCT 元數據完整性客觀評價模型
評價模型設計目的是以元數據接口規范中列舉的條目清單為依據,對證據文獻中數據報告的完整性給予客觀評價。使用客觀評價模型,可避免不同系統評價者對同一篇 RCT 報告評價結果不一致的現象[11]。以客觀評價模型為基礎,可以實現對海量 RCT 數據報告的自動化評價,在構建 RCT 數據應用中進行數據完整性控制至關重要。
模型設定報告評價結果為分數制,0 分最低,滿分為 100 分,60 分為合格。依據元數據接口規范,涵蓋 RCT 報告關鍵信息的關鍵條目為影響報告數據完整性的決定性因素,因此關鍵條目報告不完整者判定為不合格文獻。由此研究者可通過文獻評分所在區間直觀判斷文獻關鍵條目完整性。在此基礎上,報告數據的評價結果取決于報告的非關鍵條目與結局指標的完善程度。
模型首先通過設立篩選規則來保證文獻滿足 RCT 與元數據接口規范的最基本要求。其次關注包含描述 RCT 的所有文獻關鍵條目的完整程度,確定文獻最終得分的區間。最后將非關鍵條目與結局指標的報告個數累計求和,通過分數映射調整至對應得分區間并計算最終得分。具體實現如下。
2.1 模型篩選規則
具有以下條件的報告不滿足元數據接口規范基本要求,模型不予評分。
2.1.1 文獻證據關鍵條目嚴重缺失
定義 1.關鍵條目嚴重缺失:
![]() |
其中 Cr 為待評分報告的關鍵條目個數,Td 為關鍵條目個數閾值,這里設置為 0.7,Nr 為總關鍵條目個數。
2.1.2 未報告有效結局指標
未報告有效的結局指標的文獻,模型不予評分。根據元數據接口規范,若文獻的該結局指標類型為離散型,研究者需報告所有試驗分組的事件例數;若結局指標類型為連續型,需要報告所有試驗分組的治療前后的均值和標準差。當滿足以上條件,即認為這是一條有效的結局指標。
2.2 非關鍵條目計分
根據元數據接口規范,模型統計文獻報告的非關鍵條目個數,將其線性映射至 0 至非關鍵條目的最高分配得分區間內:
![]() |
其中 ki 為該字段條目的指示變量,當文獻報告了該字段條目的結果時為 1,否則為 0。 為基礎部分的最高分配得分,這里設置為 40。
為元數據接口規范定義的非關鍵條目總個數,
為線性映射后的非關鍵條目得分
2.3 結局指標計分
文獻結局指標部分得分按照其有效報告個數計分。由于規范中不同病種的結局指標集合包含的數目不同,以及文獻數據完整性并非隨報告的結局指標報告個數線性提升,故本研究設計對數函數來實現結局指標個數較少時分數增長較快,指標個數較多時分數增速減緩,如公式(3)所示。
![]() |
其中 Som 為所求的結局指標得分,St 為滿分,Co 為報告的有效結局指標個數,Cot 為規范中定義的指標集合的總數目,根據病種在臨床研究所采用的結局指標集合個數確定(表 1)。

2.4 最終得分計算
定義 2.關鍵條目輕度缺失:
![]() |
除關鍵條目嚴重缺失的文獻不予評分外,通過線性映射實現關鍵條目完整的文獻最終得分在合格分數至滿分間,如公式(5)所示。關鍵條目輕度缺失文獻分數在 0 至合格分數之間,如公式(6)所示。
![]() |
![]() |
其中 Sq 為及格分數。
3 資料提取
3.1 納入與排除標準
3.1.1 納入標準
① 研究病種為 COPD、冠心病心絞痛、心衰、膝骨關節炎、糖尿病腎病、類風濕性關節炎、糖尿病、小兒腹瀉、肥胖和結直腸癌 10 個病種;② 任意一組干預措施為中醫或中西醫結合(包括中藥、針灸及其他中醫療法);③ 研究設計類型為 RCT。
3.1.2 排除標準
① 無全文,或是僅有摘要;② 非中英文文獻;③ 重復發表文獻保留數據最全、最新的資料。
3.2 文獻檢索策略
計算機檢索 CBM、WanFang Data、CNKI、PubMed、EMbase 和 The Cochrane Library 數據庫,搜集中醫干預治療以上 10 個病種的 RCT,檢索時間均由建庫至 2020 年 3 月。檢索式主要由病名、中醫干預措施及研究類型三類檢索詞進行邏輯組配。病名和中醫干預措施兩組檢索詞參照各研究病種的臨床研究情況分別制定。研究類型的中文檢索詞為“隨機”,英文采用麥克馬斯特大學推薦的 RCT 檢索過濾器(http://hiru.mcmaster.ca/hiru/HIRU_Hedges_MEDLINE_Strategies.aspx)。
3.3 文獻篩選和數據提取
計算機檢索所得文獻經過除重及題錄、摘要初篩后進行全文閱讀篩選及數據提取。各病種提取的數據包含文獻一般信息(包括但不限于受試者來源、例數、年齡、病程)、各組干預措施(包括但不限于干預、中藥組成、針灸穴位、療程)及結局指標,其中結局指標的選取通過臨床專科專家咨詢確定。
4 結果
4.1 納入文獻的基本情況
共納入 37 361 篇 RCT,發表時間和篇數見表 2,各病種納入篇數見表 3,發表的主要期刊和篇數見表 4。



4.2 元數據完整性統計結果
未通過篩選的報告數目為 6 743 篇(18.05%),其中 63 篇報告為關鍵條目嚴重缺失,其余報告皆因為缺乏有效結局指標報告而未納入評價[12]。各病種滿足關鍵條目完整的報告數目比例在 73%~97% 之間(圖 2),影響關鍵條目完整程度的條目主要為“中醫診斷”和“脫落例數”。中醫證候診斷及其評價是中醫藥臨床療效評價與西藥療效評價的根本區別[13],目前臨床研究主要采用西醫診斷標準,研究者可參考中醫藥領域國家及權威機構認定的行業標準、診療指南,來完善此方面的報告[14]。另外報告結果不僅應加強報告受試者的脫落數據,還應對脫落原因詳細描述,如違背研究方案、研究周期中斷、違背受試者主觀意愿等[15]。

“分組情況”部分,90% 以上報告將試驗分為試驗組和對照組共 2 組,分配 4 組及以上的占比低于 1%。如圖 3 所示,各試驗分組下,僅“病例數”條目報告率為 100%,其余條目信息均有缺失,其中“年齡標準差”和“病程標準差”報告率極低,分別為 9.24% 和 5.34%。從病種分布看,除類風濕性關節炎外,其余病種均在病程方面信息完整度較為欠缺。

“干預措施”部分,詳細描述各組干預細節的報告篇數不足 50%,中藥方劑配伍具體的劑量、劑型、治療頻率信息報告率較低(圖 4),具體表現在 RCT 對照組干預措施表述模糊,沒有說明具體干預方案。而干預措施是 RCT 報告重要組成部分,研究者對其盡可能詳細地對其報告,能夠增強試驗的完整性、一致性與可復現性。

“結局指標”方面,表 5 列舉各病種對應結局指標報告率高于 30% 的篇數與占比,圖 5 顯示了各病種報告結局指標個數的篇數占比情況,研究結果表明各病種實際平均報告結局指標數目與元數據接口規范定義的指標數目尚存在差距。關于不良事件,4 119 篇報道無不良事件,4 969 篇報道有不良事件,其余 RCT 均無報道。而不良反應通常會對 RCT 干預措施的可接受性及可用性產生影響[16]。近年來隨著中草藥臨床實踐的推廣,中藥不良反應受到國際和國內廣泛關注,中醫藥 RCT 的科學化、國際化與中醫藥臨床治療質量保障和水平提升都要求 RCT 建立臨床試驗全程透明化理念,對試驗結果詮釋充分,報道詳細、具體,對陰性結果的試驗也應鼓勵發表[15]。


4.3 元數據完整性客觀評價結果
經篩選后進行評分的報告篇數為 30 617 篇,其評分分布情況如圖 6 所示,平均得分 71.39 分。不合格(低于 60 分)報告有 6 245 篇,平均得分為 35.17±6.58 分;合格 RCT 有 24 372 篇,平均得分為 80.67±3.52;其中 80 分以上報告 13 717 篇,90 分以上報告僅 53 篇。圖 7 顯示了 2000~2020 年 RCT 得分隨年份的變化趨勢,RCT 平均得分由 2000 年的 68.25 分增至 2020 年的 74.19 分,中醫藥臨床 RCT 報告數據完整性有了顯著提升。


因為類似的研究較少,本文未將所提出的模型與評價結果和其他的研究工作進行對比。為驗證模型評分結果的準確性,本研究選擇報告數量最多的 27 種中醫藥期刊,并統計其合格文獻得分的平均值。另外邀請廣東省中醫院、上海中醫藥大學等機構的 19 位中醫藥循證醫學研究領域的專家依據經驗和主觀認知對這些中醫藥期刊所刊載 RCT 報告數據完整性水平進行評分(分值為 0~4 分)。兩種評分的相關性分析如圖 8 所示,擬合的直線相關系數為 0.790,顯示本研究提出的元數據完整性客觀評價模型的評分結果與專家意見的一致性較好。

5 討論
目前 RCT 數據的采集均在論文發表后進行,從大量文獻中人工提取元數據,成本較高且不可避免地會帶來一定的數據損失[17, 18]。在數據提取完成后,信息系統內存儲、編輯和跨信息系統中數據鏈接和數據流動過程也會影響數據的完整性[19, 20],例如,復制、粘貼會導致信息多余和不準確[21]、并引入額外的干擾信息[22]。完整性差與結構化程度低的數據阻礙了中醫學循證研究成果的交流與共享,不利于中醫藥循證研究的創新。
針對此現狀,我們倡議啟動“中醫藥臨床數據開放計劃(http://tcm-meta.sjtu.edu.cn/)”。計劃將本研究所提出的元數據規范與完整性評價模型付諸應用。平臺要求臨床研究的作者在提交論文的同時將數據提交至開放數據平臺,并由數據評審專家進行數據評審,保證作者錄入數據與稿件原文的一致性和準確性。論文發表時數據即可上線。研究者可通過申請數據權限,在開放平臺檢索并下載數據進行分析研究。整個過程不僅可保證數據完整與結構化的控制閉環,還可通過計算機輔助和作者介入有效降低數據采集成本[23]、有效縮短數據應用時間,進一步促進中醫藥 RCT 數據的開放與重用。
參與數據開放和共享,出版機構和相關研究者均可從中受益:出版機構可讓投稿的研究更規范、更具結構化,更易于被引用/重用,提升出版物的影響力和附加值;中醫藥相關研究者參與數據共享,使用共享數據;數據分析相關研究者能夠跨學科合作,催生創新成果的產出。開放和共享的數據源于研究者,服務于研究者,最終可以成為中醫藥相關研究者的共有資產。這需要中醫藥期刊出版機構、研究者、開發者的共同參與、努力和推廣,從而推動中醫藥循證研究的創新,為“中醫藥現代化”夯實數據基礎。
本研究存在一定的局限性:① 和其他的研究一樣,納入文獻對相關信息的報告不完全和漏報[24],這會對最終評價結果產生一定影響;② 本文中我們按照經驗對模型參數進行了設定,在應用時可能需要按照不同的應用場景對參數調整和優化,以體現該場景中對數據條目完整性的不同要求。
綜上,本研究提出符合中醫藥臨床特點的 RCT 元數據接口規范和數據完整性評價模型,兩者結合可對 RCT 報告數據完整性作出客觀判斷,避免因人工評價產生的主觀錯誤和偏倚,保證評價結果的一致性。其后本研究對提取的 37 361 篇中醫藥 RCT 文獻進行完整性評價并探討其存在的問題。評價結果表明當前中醫藥 RCT 數據報告總體數據完整性有較大提升空間。最后對目前 RCT 文獻報告條目結構化程度低、完整性差的問題提出解決思路和倡議。為引導試驗結果向臨床決策轉化,中醫藥 RCT 需要在保證試驗設計的科學性和實施的標準化基礎上,提高數據報告的完整性。本研究提出的元數據接口規范和評價模型可為提高中醫藥臨床試驗報告數據完整性提供參考和依據。