编号 zgly0001571026
文献类型 期刊论文
文献题名 基于随机森林算法和SRAP分子标记的桂花品种鉴定方法
作者 邱帅 沈柏春 李婷婷 郭娟 王霁 孙丽娜 陈徐平 胡绍庆
作者单位 杭州市园林绿化股份有限公司 浙江省林业科学研究院 浙江理工大学
母体文献 林业科学
年卷期 2018年01期
年份 2018
分类号 S685.13
关键词 桂花 品种鉴定 分类模型 SRAP分子标记 随机森林算法
文摘内容 【目的】为了解决桂花品种难以鉴定以及苗木生产和园林应用中品种混杂、以次充好和常规DNA指纹图谱无法很好地应用于品种鉴定的问题,提出一种基于随机森林算法和SRAP分子标记的桂花品种鉴定方法,以实现桂花品种简便、快速和准确的鉴定。【方法】以45个桂花品种或变异类型为材料,提取DNA,使用90对SRAP引物进行PCR扩增,以毛细管电泳技术采集扩增信息,筛选出多态性强、扩增结果稳定的引物,计算单对引物的多态信息含量(PIC)、带型数、有效带型数、分辨能力(D)、带型分布的卡方值(χ2)和无法区分的样品对数(x)。筛选出能够完全区分所有品种的引物对组合位点数据作为训练集,用于构建基于随机森林算法的分类模型,并根据模型的泛化能力和分类效果选择最优的分类模型。【结果】筛选出10对SRAP引物,平均PIC为0.26,平均带型数为33.9,平均有效带型数为26.6,平均D为0.97,平均χ2为21.07,平均x为28.2。构建了8个分类模型rf1-rf8,每个分类模型均含有2对SRAP引物。所有分类模型都能完全区分所有桂花品种,模型的袋外数据(OOB)误差估计在0.004 4~0.013 9之间,rf5和rf3泛化能力最强,rf8最弱。rf1分类效果最优,rf3、rf4、rf5和rf7其次,rf2、rf6和rf8最差。【结论】分类模型rf1、rf3、rf4、rf5和rf7的分类能力最佳,所用SRAP引物对分别为me1/em3+me9/em6、me4/em5+me9/em6、me4/em8+me9/em6、me6/em9+me9/em6和me5/em5+me9/em6。除引物对的分辨能力外,所选引物对之间的相关性也显著影响模型的分类能力,相关性越弱,模型的分类能力越强。本研究提出的基于随机森林算法和SRAP分子标记的桂花品种鉴定方法,能够实现桂花品种简便、快速、准确的鉴定,满足桂花苗木生产、推广应用和种质资源保护对于品种鉴定的要求。