• 燕山大學 電氣工程學院, 秦皇島 066004;
導出 下載 收藏 掃碼 引用

針對MicroRNA(miRNA)靶基因樣本數據不平衡導致陽性樣本預測準確率低和整體分類效果不佳的問題,提出一種基于欠采樣技術的集成學習算法——支持向量機(SVM)-嵌入下采樣和權重平滑(IUSW)集成學習算法。算法采用SVM作為基學習算法,以AdaBoost為集成框架,迭代過程中嵌入基于聚類的欠采樣以降低陰陽樣本數據分布不平衡程度,同時在自適應樣本權重調整過程中,以樣本權重平滑機制剔除陰性樣本中的異常點以避免過學習,最終以帶權重的投票機制組合多個弱分類器預測結果作為miRNA集成分類器的預測結果。實驗表明,在不平衡數據集上SVM-IUSW算法和其他算法相比,不但有效提高了陽性靶標的預測準確率和整體分類效果,還增強了miRNA靶標分類器的泛化能力。

引用本文: 陳志茹, 洪文學. 嵌入欠采樣技術的支持向量機集成分類算法的MicroRNA靶標預測. 生物醫學工程學雜志, 2016, (1): 72-77. doi: 10.7507/1001-5515.20160014 復制