编号
zgly0000762983
文献类型
期刊论文
文献题名
基于频繁子树挖掘的DNA重复序列识别方法
作者单位
南京林业大学信息技术学院
母体文献
微电子学与计算机
年卷期
2011,28(9)
页码
193-196,201
年份
2011
分类号
TP311
关键词
DNA序列
重复体识别
频繁子树挖掘
文摘内容
提出了一种基于频繁子树挖掘策略说我DNA重复序列识别方法.绕开了传统的序列比对方式,将序列按照后缀树结构方式进行组织,再对后缀树形式做了约减改进,使其更加适合子树挖掘操作,最后利用频繁子树挖掘的方法对其进行学习.算法可以直接识别出满足设定阈值的重复序列,避免了由短重复体拼接所造成的时间浪费,设计的"二次识别技术"使得算法对模糊重复体也有着很好的识别效果,提高了识别完整度.实验证明: 算法在识别效率性能方面较升,尤其当识别较长重复体时,优势体现的更为明显,同时在识别完整度方面也高度可比.