• 太原理工大學 信息與計算機學院(太原 030024);
導出 下載 收藏 掃碼 引用

針對構音障礙語音識別率難以提升的問題,本文提出一種多尺度梅爾域特征圖譜提取算法。該算法采用經驗模態分解方法分解語音信號,分別對三個有效分量提取Fbank特征及其一階差分,從而構成能夠捕捉頻域細節信息的新特征圖譜。其次,由于單路神經網絡在訓練過程中,存在有效特征丟失及計算復雜度高的問題,本文提出一種語音識別網絡模型。最后,在公開UA-Speech數據集上進行訓練和解碼。實驗結果表明,本文方法的語音識別模型準確率達到了92.77%,因此,本文所提算法能有效提高構音障礙語音識別率。

引用本文: 趙建星, 薛珮蕓, 白靜, 師晨康, 袁博, 師同同. 一種用于構音障礙語音識別的多尺度特征提取算法. 生物醫學工程學雜志, 2023, 40(1): 44-50. doi: 10.7507/1001-5515.202205049 復制

  • 上一篇

    基于注意力機制與雙向門控循環單元的多導睡眠圖睡眠階段分期方法研究
  • 下一篇

    結合快速獨立成分分析算法和卷積神經網絡的胎兒心電信號提取與分析方法