李建華 1 , 李哲人 1 , 康雁 1 , 李嶺 1,2
  • 1. 東北大學 中荷生物醫學與信息工程學院, 沈陽 110819;
  • 2. 四川大學 生物治療國家重點實驗室, 成都 610041;
導出 下載 收藏 掃碼 引用

在線孟德爾人類遺傳數據庫(OMIM)是描述人類遺傳病及其相關基因的知識庫,其詞條包括疾病的臨床特征、基因連鎖分析、染色體定位以及動物模型等,是研究疾病與基因關系的重要依據。疾病表型的相似性可能提示分子之間的相互作用。進行表型比對將有助于預測疾病候選基因以及分析分子之間的關系。OMIM數據庫采用文本描述疾病表型,并不適用于計算機分析。對OMIM數據進行標準化對于大規模比對和分析疾病的表型數據、建立表型與基因的對應關系具有重要的意義。研究者近期通過引入標準的醫學語言系統,采用文本挖掘中的詞頻-逆文檔頻率技術以及用于文檔分類的余弦定理方法,結合基因本體論及其比對方法,推動了OMIM數據挖掘的快速發展。本文總結了近年來OMIM數據標準化、表型相似性度量及數據挖掘研究的主要成果,并對其發展趨勢進行了預測。

引用本文: 李建華, 李哲人, 康雁, 李嶺. 在線孟德爾人類遺傳數據庫數據挖掘的研究進展. 生物醫學工程學雜志, 2014, 31(6): 1400-1404. doi: 10.7507/1001-5515.20140265 復制

  • 上一篇

    乳腺X線成像系統自動曝光控制研究進展
  • 下一篇

    碳纖維增強聚醚醚酮復合材料生物摩擦學研究進展