基于机器学习方法的拟南芥基因组DNA复制时间预测研究

Journal of Northwest A&F University(Natural Science Edition)(2021)

引用 0|浏览0
暂无评分
摘要
[目的]基于机器学习方法,构建拟南芥基因组DNA复制时间分类器,探究与复制时间相关的表观遗传修饰,为进一步研究DNA复制时间的表观遗传调控机制提供参考.[方法]收集拟南芥全基因组的DNA复制时间数据和多种DNA表观遗传修饰特征(ChIP-Seq)数据,以及染色质开放状态(DNase-Seq)数据,先通过t-SNE初步对DNA表观遗传修饰特征数据降维来衡量DNA复制早晚的可预测性,并利用皮尔逊相关系数计算了多种DNA表观遗传特征与DNA复制时间信号两两之间的相关性,再通过构建随机森林、多类别逻辑回归和支持向量机3种分类器对DNA复制时间进行建模分析,以十折交叉验证和ROC曲线下的面积(AUC)为衡量指标,用80%的数据建模,20%的数据对模型效果进行验证.[结果]3种分类器对DNA复制时间都具有良好的预测能力,平均AUC均达0.8以上.DNA复制早期信号与RNA聚合酶Ⅱ结合信号以及染色质开放状态信号等呈正相关,而复制晚期信号则与其呈负相关.其中H3.1、H3.3、H2AW、H4K16ac、H3K36me3、H3K4me3均可能与DNA复制时间存在密切关系.[结论]拟南芥基因组DNA复制时间可以通过表观遗传修饰进行准确预测,其中对DNA复制晚期的预测最为准确;并发现了与DNA复制时间关系密切的组蛋白变体及表观遗传修饰.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要