崔穎 1,2 , 徐澤龍 2 , 李建中 1,3
  • 1. 黑龍江大學 電子工程學院(哈爾濱 150080);
  • 2. 哈爾濱醫科大學 生物信息科學與技術學院(哈爾濱 150081);
  • 3. 哈爾濱工業大學 計算機科學與技術學院(哈爾濱 150001);
導出 下載 收藏 掃碼 引用

本文基于 Z 曲線(z-curve)理論和位置權重矩陣(PWM)提出一種構建核小體 DNA 序列的模型。該模型將核小體 DNA 序列集轉換成三維空間坐標,通過計算該序列集的位置權重矩陣獲得相似性權重得分,將兩者整合得到綜合序列特征模型(CSeqFM),并分別計算候選核小體序列和連接序列到模型 CSeqFM 的歐氏距離作為特征集,投入到支持向量機(SVM)中訓練和檢驗,通過十折交叉驗證進行性能評估。結果顯示,酵母核小體定位的敏感性、特異性、準確率和 Matthews 相關系數(MCC)分別為 97.1%、96.9%、94.2% 和 0.89,受試者操作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)達到 0.980 1。與其他相關 Z 曲線方法比較,CSeqFM 方法在各項評估指標中均表現出優勢,具有更好的識別效果。同時,將 CSeqFM 方法推廣到線蟲、人類和果蠅的核小體定位識別中,AUC 均高于 0.90,與 iNuc-STNC 和 iNuc-PseKNC 方法比較,CSeqFM 方法也表現出較好的穩定性和有效性,進一步表明該方法具有較好的可靠性和識別效能。

引用本文: 崔穎, 徐澤龍, 李建中. 基于綜合 DNA 序列特征的支持向量機方法識別核小體定位. 生物醫學工程學雜志, 2020, 37(3): 496-501. doi: 10.7507/1001-5515.201911064 復制

  • 上一篇

    基于心外膜標測的心房易顫性評估
  • 下一篇

    基于穩態視覺誘發電位的腦控輪椅室內模擬訓練系統