張毅 1,2,3 , 秦小林 1,2 , 林遠 4 , 李勇明 4,5 , 王品 4 , 張祖偉 3 , 李小飛 3
  • 1. 中國科學院 成都計算機應用研究所(成都 610041);
  • 2. 中國科學院大學(北京 100049);
  • 3. 中電科技集團 重慶聲光電有限公司(重慶 401332);
  • 4. 重慶大學 微電子與通信工程學院(重慶 400044);
  • 5. 重慶市精神衛生中心(重慶 400020);
導出 下載 收藏 掃碼 引用

語音特征學習是精神病語音識別方法的核心和關鍵。深層特征學習可以自動提取語音特征,但受限于小樣本問題;傳統的特征提取(原始特征)避免小樣本問題影響,但嚴重依賴經驗且自適應不佳。為了解決這一問題,本文提出了一種深層內嵌混合稀疏堆棧自動編碼器流形集成算法。首先,基于先驗知識提取精神病語音特征,構造原始特征。其次,將原始特征內嵌入到稀疏堆棧自動編碼器(深度網絡)中,對隱藏層的輸出進行濾波,增強深層特征與原始特征的互補性。再次,設計 L1 正則化特征選擇機制,壓縮由深層特征和原始特征組成的混合特征集的維度。最后,設計了加權局部保持投影算法和集成學習機制,構造了流形投影分類器集成模型,進一步提高了小樣本下特征融合的分類穩定性。此外,本文首次設計了一個中大規模的精神病語音采集方案,收集并構建了一個大規模的中文精神病語音數據庫,用于精神病語音識別算法的驗證。實驗結果表明,該算法主要創新部分有效;與其他有代表性的算法相比具有更好的分類準確率,最大改善了 3.3%。綜上所述,本文提出了一種基于深層內嵌混合稀疏堆棧自動編碼器和流形集成的精神病語音識別方法,有效提高了精神病語音識別準確率。

引用本文: 張毅, 秦小林, 林遠, 李勇明, 王品, 張祖偉, 李小飛. 基于深層內嵌混合稀疏堆棧自動編碼器和流形集成的精神病語音識別方法. 生物醫學工程學雜志, 2021, 38(4): 655-662. doi: 10.7507/1001-5515.202010050 復制

  • 上一篇

    不同波長的光對鯉魚機器人運動行為影響的研究
  • 下一篇

    基于遞歸定量分析方法的孤獨癥兒童腦電信號特征提取與分類研究