• 廣西師范大學 電子工程學院, 桂林 541004;
導出 下載 收藏 掃碼 引用

本文通過分析嗓音的發音機制,提取正常與病態嗓音的傳統聲學參數[基頻、Mel倒譜系數(MFCC)、線性預測系數(LPCC)、頻率微擾、振幅微擾]與非線性動力學特征參數[熵(樣本熵、模糊熵、多尺度熵)、計盒維數、計維截距和Hurst參數],作為病態嗓音識別的特征矢量集。應用支持向量機(SVM)對/a/音的78例正常嗓音與73例病態嗓音和/i/音的78例正常嗓音與80例病態嗓音進行建模與識別。結果表明,相對于傳統的聲學特征參數,非線性特征參數能更好地區分正常與病態嗓音;實驗提取的所有參數中,除了多尺度熵,/a/音的正常與病態嗓音的識別率均高于/i/音,因此為了達到識別病態嗓音的目的,國內外相關研究大多采用/a/音數據;多尺度熵特征對/i/音的正常與病態嗓音的識別率較/a/音高,它或能為評價聲帶代償功能狀態的研究提供有益的啟發。

引用本文: 甘德英, 胡維平, 趙冰心. 傳統聲學特征和非線性特征用于病態嗓音的比較研究. 生物醫學工程學雜志, 2014, 31(5): 1149-1154. doi: 10.7507/1001-5515.20140217 復制

  • 上一篇

    眼底圖像增強及評價
  • 下一篇

    分形及其理論在醫學中的最新研究進展