针叶树是裸子植物中最大和分布最广的一支,具有重要的生态意义和经济价值。但针叶树庞大的基因组中含有大量重复序列,特别是转座子,阻碍了对其序列资源的挖掘。针对这一问题,我院林业所、林木遗传育种国家重点实验室珍贵树种遗传改良课题组以三种已完成基因组测序的针叶树为研究对象,成功构建了针叶树转座子数据库ConTEdb。这是该研究组继杨柳科植物转座子数据库构建后的又一新的重大突破。
该项研究综合采用多种算法,从欧洲云杉(Piceaabies)、白云杉(Piceaglauca)和火炬松(Pinustaeda)基因组中分别鉴定出41907、179518和191998种转座子,并分类至2574、5561和2998个转座子家族中。转座子拷贝数分析结果表明,数据库的假阳性率在1%以下。ConTEdb中的所有信息均可免费获取,同时数据库中整合了Blast、HMMER等研究工具,方便用户使用。
转座因子(Transposable Element, TE)又称转座子(transposon)是一类可在基因组不同位置间移动的序列,广泛存在于真核生物基因组中。转座因子在染色体结构、基因组大小、基因组重排、新基因生成和基因表达调控等方面扮演着重要的角色,同时由于转座因子序列的重复性,它们对基因组测序、组装和注释也是巨大的挑战。因此,全基因组范围内精确地鉴定、分类和注释转座因子就变得尤为重要。
研究论文“ConTEdb: a comprehensive database of transposable elements in conifers”已在DATABASE杂志上发表(doi.org/10.1093/database/bay131)。博士研究生易飞为第一作者,王军辉研究员和欧阳芳群博士为共同通讯作者。研究工作得到“十三五”国家重点研发计划项目(2017YFD0600606-09)资助。(林业所 林木遗传育种国家重点实验室)
链接:http://genedenovoweb.ticp.net:81/conTEdb/index.php