利用人类全基因组亚硫酸氢盐测序数据检测CNVs的研究

Yi chuan = Hereditas(2023)

引用 0|浏览10
暂无评分
摘要
DNA甲基化异常可能导致拷贝数变异(copy number variants,CNVs)的发生,而CNVs的发生又可能改变DNA甲基化水平.全基因组亚硫酸氢盐测序(whole genome bisulfite sequencing,WGBS)技术能够获得DNA水平的测序数据,具有挖掘CNVs的潜力和优势,但利用WGBS数据挖掘CNVs的效果尚不清楚.本研究选取了5款检测CNVs不同策略的软件(BreakDancer、cn.mops、CNVnator、DELLY、Pindel),基于人类的真实(2.62 billion reads)和模拟(12.35 billion reads)测序数据,进行150次CNVs检测,评估CNVs检出数量、精确率、召回率、相对检出能力、内存占用和运行时间等指标,旨在讨论利用WGBS数据检测CNVs的最佳方案.基于真实WGBS数据,Pindel检出缺失型和重复型CNVs的数量最多,CNVnator对缺失型CNVs的检测精确率最高,cn.mops对重复型CNVs的检测精确率最高,Pindel对缺失型CNVs的召回率最高,cn.mops对重复型CNVs的召回率最高.基于模拟WGBS数据,BreakDancer检出缺失型CNVs数量最多,cn.mops检出重复型CNVs数量最多,CNVnator对缺失型和重复型CNVs的检测精确率和召回率均为最高.与全基因组测序数据相比,CNVnator在真实和模拟WGBS数据中检出CNVs的能力与之相当.此外,DELLY和BreakDancer的内存占用峰值和CPU运行时间最小,CNVnator的内存占用峰值和CPU运行时间最大.结果表明,利用WGBS数据检测CNVs具有可行性,使用CNVnator和cn.mops在WGBS数据上检测CNVs的准确率较高,这些工作为利用WGBS数据深入研究CNVs和DNA甲基化之间的相互关系提供一定的参考和帮助.
更多
查看译文
关键词
copy number variation,software evaluation,whole genome bisulfite sequencing
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要