肺實質的準確分割是計算機輔助影像學診斷肺部疾病的關鍵。隨著深度學習技術的發展,基于全卷積網絡的圖像分割模型取得了很好的效果,但對于邊緣模糊和肺實質密度不均勻的情形仍會誤分割。針對該問題,本文提出一種基于非局域注意力機制和多任務學習的胸部X線片圖像肺實質分割方法。首先,基于殘差連接的編-解碼卷積網絡提取肺實質多層級語義特征信息并預測肺實質邊界輪廓;其次,通過非局域注意力機制建立肺實質輪廓與全局語義特征信息之間的相關性并增強輪廓區域特征信息權重;再次,基于增強的特征信息進行多任務監督學習,實現肺實質的準確分割;最后,在JSRT和Montgomery公開數據集上驗證了本文方法的有效性和模型泛化能力,對比其他幾種代表性的分割模型,其Dice系數和準確性最大分別提高1.99%和2.27%。實驗結果表明,通過增強特征信息中邊界輪廓的注意力,能有效減少肺實質密度不均勻時的誤分割并提高模糊邊緣的分割精度。
近年來,采用腦電波進行癲癇發作檢測得到了學術界的廣泛關注,而用于癲癇發作檢測的腦電波數據存在數據采集困難、發作樣本少等問題,在訓練樣本量不足的情況下采用深度學習容易產生過擬合現象。為了解決此問題,本文以美國波士頓兒童醫院的癲癇腦電數據集為研究對象,將小波變換用于數據增強,通過設置不同的小波變換尺度因子來生成相應的數據,達到成倍增加訓練樣本的目的;另外,在模型設計方面,本文結合深度學習、集成學習和遷移學習等方法,提出在訓練樣本量不足的情況下針對特定癲癇患者的具有較高檢測準確率的癲癇檢測方法。在測試中,本文分析了以小波變換尺度因子為2、4、8時的癲癇發作檢測實驗結果,在小波尺度因子為8時,平均準確率、平均敏感度、平均特異性分別為95.47%、93.89%和96.48%;另外,通過與近期相關文獻進行對比,驗證了本文方法具有一定的優越性。本研究結果可為癲癇檢測的臨床應用提供借鑒。
語音特征學習是精神病語音識別方法的核心和關鍵。深層特征學習可以自動提取語音特征,但受限于小樣本問題;傳統的特征提取(原始特征)避免小樣本問題影響,但嚴重依賴經驗且自適應不佳。為了解決這一問題,本文提出了一種深層內嵌混合稀疏堆棧自動編碼器流形集成算法。首先,基于先驗知識提取精神病語音特征,構造原始特征。其次,將原始特征內嵌入到稀疏堆棧自動編碼器(深度網絡)中,對隱藏層的輸出進行濾波,增強深層特征與原始特征的互補性。再次,設計 L1 正則化特征選擇機制,壓縮由深層特征和原始特征組成的混合特征集的維度。最后,設計了加權局部保持投影算法和集成學習機制,構造了流形投影分類器集成模型,進一步提高了小樣本下特征融合的分類穩定性。此外,本文首次設計了一個中大規模的精神病語音采集方案,收集并構建了一個大規模的中文精神病語音數據庫,用于精神病語音識別算法的驗證。實驗結果表明,該算法主要創新部分有效;與其他有代表性的算法相比具有更好的分類準確率,最大改善了 3.3%。綜上所述,本文提出了一種基于深層內嵌混合稀疏堆棧自動編碼器和流形集成的精神病語音識別方法,有效提高了精神病語音識別準確率。