编号 zgly0001567981
文献类型 期刊论文
文献题名 基于高通量测序的极小种群野生植物长梗杜鹃转录组分析
作者 李太强 刘雄芳 万友名 李正红 起国海 李钰莹 刘秀贤 和锐 马艳 马宏
作者单位 中国林业科学研究院资源昆虫研究所
母体文献 植物研究
年卷期 2017年06期
年份 2017
分类号 S685.21
关键词 长梗杜鹃 转录组 Unigene 功能注释 编码序列 转录因子 单核苷酸多态性
文摘内容 为加强特有濒危植物长梗杜鹃资源的评价、保护和鉴定工作,及为今后遗传育种和改善其农艺性状提供有益参考。本研究采用新一代高通量测序平台Illumina Hi Seq 4000对其转录组测序,得到的数据过滤后进行de novo组装并聚类去冗余,获得74 092个Unigenes,平均长度、N50、Q20、Q30以及GC含量分别为938 nt、1 616 nt、98.22%、95.20%和43.24%,其中1 Kb以上的Unigenes有23 879条。通过与七大功能数据库比对,分别有39 876(NR:53.82%)、38 065(NT:51.38%)、27 384(Swissprot:36.96%)、16 099(COG:21.73%)、30 401(KEGG:41.03%)、17 518(GO:23.64%)以及29 676(Interpro:40.05%)条Unigenes获得功能注释。长梗杜鹃转录组中的Unigenes根据GO功能大致可分为生物学过程、细胞组分和分子功能3大类56亚类,其中执行生物学过程的基因最多,占41.53%;与COG数据库比对,根据其功能大致可分为25类;以KEGG数据库为参考,可归为6个代谢通路大类、32类代谢途径,并发掘出176条与人类疾病相关的Unigenes,包括内分泌及代谢疾病(167条)和抗药性(9条)。根据注释结果共检测出39 418个CDS,未注释上的Unigenes使用ESTScan预测后获得3 194个CDS。同时,预出到1 488个编码TF的Unigenes,以及检测到57 927个SNP多态位点。该转录组分析为今后长梗杜鹃乃至杜鹃属植物功能基因挖掘与利用、基因克隆、抗性机理分析、遗传资源分类和进化、分子标记开发以及分子辅助育种等研究提供了基础数据和重要参考。