受試者招募是影響臨床試驗進展和結果的關鍵環節,一般通過篩選標準(包括納入標準和排除標準)進行招募。篩選標準的語義類別研究可以優化臨床試驗設計和促進受試者自動篩選系統開發。本文通過學術測評的方式探究了利用人工智能技術對中文臨床試驗篩選標準語義類別的自動分類問題。本文收集了 38 341 條帶語義標注的中文篩選標準文本,并預先定義了 44 種語義類別。總共有 75 支隊伍報名參加測評,其中 27 支隊伍提交了結果。結果分析發現大部分參賽隊伍使用了混合模型,主流的方法是引入能提供豐富語義表示的預訓練語言模型,結合神經網絡模型,針對分類任務進行微調,最后進行模型集成提高最終性能。研究結果顯示,最佳系統的性能達到 0.81 的宏平均 F1 值,其主要是使用了基于預訓練語言模型——變換器雙向編碼表征模型(BERT)與模型融合的方法。結果錯誤分析顯示,從數據處理步驟來看,數據的預處理和后處理非常重要;從語料數量來看,數量較少類別的分類效果一般。通過本文研究,最終期望本文研究成果能為中文臨床試驗篩選標準短文本分類研究領域提供可供研究的數據集和最新結果。