数据资源: 中文期刊论文

基于机器学习方法的拟南芥基因组DNA复制时间预测研究



编号 zgly0001727611

文献类型 期刊论文

文献题名 基于机器学习方法的拟南芥基因组DNA复制时间预测研究

作者 李椰  李东维  李昭宏  杨若林 

作者单位 西北农林科技大学生命科学学院 

母体文献 西北农林科技大学学报:自然科学版 

年卷期 2021,49(4)

页码 133-141

年份 2021 

分类号 Q78 

关键词 拟南芥  DNA复制时间  表观遗传修饰特征  机器学习 

文摘内容 [目的]基于机器学习方法,构建拟南芥基因组DNA复制时间分类器,探究与复制时间相关的表观遗传修饰,为进一步研究DNA复制时间的表观遗传调控机制提供参考。[方法]收集拟南芥全基因组的DNA复制时间数据和多种DNA表观遗传修饰特征(ChIP-Seq)数据,以及染色质开放状态(DNase-Seq)数据,先通过t-SNE初步对DNA表观遗传修饰特征数据降维来衡量DNA复制早晚的可预测性,并利用皮尔逊相关系数计算了多种DNA表观遗传特征与DNA复制时间信号两两之间的相关性,再通过构建随机森林、多类别逻辑回归和支持向量机3种分类器对DNA复制时间进行建模分析,以十折交叉验证和ROC曲线下的面积(AUC)为衡量指标,用80%的数据建模,20%的数据对模型效果进行验证。[结果]3种分类器对DNA复制时间都具有良好的预测能力,平均AUC均达0.8以上。DNA复制早期信号与RNA聚合酶Ⅱ结合信号以及染色质开放状态信号等呈正相关,而复制晚期信号则与其呈负相关。其中H3.1、H3.3、H2AW、H4K16ac、H3K36me3、H3K4me3均可能与DNA复制时间存在密切关系。[结论]拟南芥基因组DNA复制时间可以通过表观遗传修饰进行准确预测,其中对DNA复制晚期的预测最为准确;并发现了与DNA复制时间关系密切的组蛋白变体及表观遗传修饰。

相关图谱

扫描二维码