数据资源: 中文期刊论文

基于随机森林算法和SRAP分子标记的桂花品种鉴定方法



编号 zgly0001571026

文献类型 期刊论文

文献题名 基于随机森林算法和SRAP分子标记的桂花品种鉴定方法

作者 邱帅  沈柏春  李婷婷  郭娟  王霁  孙丽娜  陈徐平  胡绍庆 

作者单位 杭州市园林绿化股份有限公司  浙江省林业科学研究院  浙江理工大学 

母体文献 林业科学 

年卷期 2018年01期

年份 2018 

分类号 S685.13 

关键词 桂花  品种鉴定  分类模型  SRAP分子标记  随机森林算法 

文摘内容 【目的】为了解决桂花品种难以鉴定以及苗木生产和园林应用中品种混杂、以次充好和常规DNA指纹图谱无法很好地应用于品种鉴定的问题,提出一种基于随机森林算法和SRAP分子标记的桂花品种鉴定方法,以实现桂花品种简便、快速和准确的鉴定。【方法】以45个桂花品种或变异类型为材料,提取DNA,使用90对SRAP引物进行PCR扩增,以毛细管电泳技术采集扩增信息,筛选出多态性强、扩增结果稳定的引物,计算单对引物的多态信息含量(PIC)、带型数、有效带型数、分辨能力(D)、带型分布的卡方值(χ2)和无法区分的样品对数(x)。筛选出能够完全区分所有品种的引物对组合位点数据作为训练集,用于构建基于随机森林算法的分类模型,并根据模型的泛化能力和分类效果选择最优的分类模型。【结果】筛选出10对SRAP引物,平均PIC为0.26,平均带型数为33.9,平均有效带型数为26.6,平均D为0.97,平均χ2为21.07,平均x为28.2。构建了8个分类模型rf1-rf8,每个分类模型均含有2对SRAP引物。所有分类模型都能完全区分所有桂花品种,模型的袋外数据(OOB)误差估计在0.004 4~0.013 9之间,rf5和rf3泛化能力最强,rf8最弱。rf1分类效果最优,rf3、rf4、rf5和rf7其次,rf2、rf6和rf8最差。【结论】分类模型rf1、rf3、rf4、rf5和rf7的分类能力最佳,所用SRAP引物对分别为me1/em3+me9/em6、me4/em5+me9/em6、me4/em8+me9/em6、me6/em9+me9/em6和me5/em5+me9/em6。除引物对的分辨能力外,所选引物对之间的相关性也显著影响模型的分类能力,相关性越弱,模型的分类能力越强。本研究提出的基于随机森林算法和SRAP分子标记的桂花品种鉴定方法,能够实现桂花品种简便、快速、准确的鉴定,满足桂花苗木生产、推广应用和种质资源保护对于品种鉴定的要求。

相关图谱

扫描二维码