醫學三維掃描體數據和二維圖像配準在臨床診斷、手術規劃等領域應用廣泛,特別是在手術導航時,三維掃描體數據和二維圖像的結合既需要保證配準的精度,又要達到手術中即時應用的要求。本文提出一種混合幾何和圖像密度特征構成的相似度度量函數,對術前CT和術中X線圖像進行快速的2D-3D 配準,其實現方便、計算量小,同時計算精度可以滿足正常的需要。另外,整個計算過程非常適合高度并行的數值計算,通過采用基于CUDA的硬件加速算法,能夠達到手術中即時應用的要求。
語音特征學習是精神病語音識別方法的核心和關鍵。深層特征學習可以自動提取語音特征,但受限于小樣本問題;傳統的特征提取(原始特征)避免小樣本問題影響,但嚴重依賴經驗且自適應不佳。為了解決這一問題,本文提出了一種深層內嵌混合稀疏堆棧自動編碼器流形集成算法。首先,基于先驗知識提取精神病語音特征,構造原始特征。其次,將原始特征內嵌入到稀疏堆棧自動編碼器(深度網絡)中,對隱藏層的輸出進行濾波,增強深層特征與原始特征的互補性。再次,設計 L1 正則化特征選擇機制,壓縮由深層特征和原始特征組成的混合特征集的維度。最后,設計了加權局部保持投影算法和集成學習機制,構造了流形投影分類器集成模型,進一步提高了小樣本下特征融合的分類穩定性。此外,本文首次設計了一個中大規模的精神病語音采集方案,收集并構建了一個大規模的中文精神病語音數據庫,用于精神病語音識別算法的驗證。實驗結果表明,該算法主要創新部分有效;與其他有代表性的算法相比具有更好的分類準確率,最大改善了 3.3%。綜上所述,本文提出了一種基于深層內嵌混合稀疏堆棧自動編碼器和流形集成的精神病語音識別方法,有效提高了精神病語音識別準確率。