• 電子科技大學生命科學與技術學院(成都 610051);
導出 下載 收藏 掃碼 引用

目的 基于深度學習算法 BERT 進行特征表示和文本分類,實現對隨機對照試驗(RCT)文獻的自動化偏倚風險評價。方法 計算機檢索 Cochrane 圖書館,收集 RCT 相關信息并獲取偏倚風險評價數據,據此構建文本分類所需數據集。采用 BERT 進行特征提取,構建文本分類模型,完成 7 類偏倚風險值(高、低)的評價。將原始數據集的 80% 作為訓練集,10% 作為測試集,10% 作為驗證集。采用準確率(P 值)、召回率(R 值)和 F1 值評價模型的性能,并將所得結果與傳統機器學習方法(結合 n-gram 與 TF-IDF 的特征工程方法和 LinearSVM 分類器)結果進行比較。結果 該模型在 7 類偏倚風險值評價任務上取得 78.5%~95.2% 的 F1 值,較傳統機器學習方法高 14.7%。在除“其它偏倚”外的其它 6 類偏倚描述句的提取任務上取得 85.7%~92.8% 的 F1 值,較機器學習方法高 18.2%。結論 基于 BERT 的自動化偏倚風險評價模型能夠實現對 RCT 文獻較高準確率的自動化偏倚風險評價,提高完成系統評價的效率和速度。

引用本文: 夏淵, 劉東峰, 張津馗, 李科. 基于 BERT 的自動化偏倚風險評價方法的研究. 中國循證醫學雜志, 2021, 21(2): 204-209. doi: 10.7507/1672-2531.202006177 復制

  • 上一篇

    健身氣功臨床試驗注冊特征和報告質量的評價
  • 下一篇

    利用 SAS 軟件中的 PROC MCMC 過程步實現二分類數據的貝葉斯 Meta 分析