哈医大张岩课题组《NAR》发表BS-Seq数据分析新方法

【字体: 时间:2013年06月03日 来源:哈尔滨医科大学

编辑推荐:

  近期,哈尔滨医科大学生物信息科学与技术学院张岩教授领导的计算表观遗传课题组的研究论文《CpG_MPs: identification of CpG methylation patterns of genomic regions from high-throughput bisulfite sequencing data》被著名科学杂志《Nucleic Acids Research》发表。

  

近期,哈尔滨医科大学生物信息科学与技术学院张岩教授领导的计算表观遗传课题组的研究论文《CpG_MPs: identification of CpG  methylation patterns of genomic regions from high-throughput bisulfite sequencing data》被著名科学杂志《Nucleic Acids Research》发表。

该研究主要关注于DNA甲基化研究的瓶颈之一——基于测序的重亚硫酸盐转换法BS-seq技术检测的数千万个单碱基通量的DNA甲基化位点数据的处理和分析。该研究开发了系统处理和分析BS-seq技术测定DNA甲基化数据的新方法CpG_MPs。它包括四个主要模块:I)BS-seq 数据标准化;II)单样本上基因组范围内甲基化和非甲基化区域的识别;III)成对样本或多样本间保守和差异甲基化区域识别和 V)序列特征挖据分析和可视化。 CpG_MPs克服传统算法依赖窗口大小和窗口滑动的大小等阈值的影响,且能识别出长度较短的甲基化和非甲基化区域。进一步基于识别出来的基因组上不同甲基化模式的基因组区域,采用组合算法和信息熵评估相结合的新算法来识别多样本间差异或特异的甲基化区域,它可以有效地避免传统的统计检验方法难以应用多于3个样本的高通量的DNA 甲基化数据中识别功能区域及依赖于预先定义的基因组区域等缺点。基于Java构架开发了界面友好的可视化软件便于生物学家和生物信息学家方便快捷的使用(http://bioinfo.hrbmu.edu.cn/CpG_MPs)。

该工作主要由课题组青年教师苏建忠博士和硕士生严海丹合作完成,是张岩教授所带领的计算表观遗传课题组继哺乳动物基因组功能CpG岛预测方法CpG_MI、基于信息熵识别差异甲基化区域的方法QDMR之后开发的又一高通量表观遗传数据分析工具。这一系列的计算表观遗传学研究方法和工具在DNA甲基化数据处理和分析中具有很强的实用性。

张岩教授于日本新泻大学获得计算生物学博士学位。2006年归国以来一直致力于计算表观遗传学和生物信息学的研究,特别是高通量表观遗传数据的处理,储存和特征挖据等工作,在计算表观遗传学及表观基因组学研究领域已与国际前沿接轨,课题组系列成果包括人类组蛋白修饰数据库(HHMD)(2011),疾病甲基化数据库(DiseaseMeth)(2012)、哺乳动物基因组功能CpG岛预测方法CpG_MI(2010)、基于信息熵识别差异甲基化区域的方法QDMR(2011)以及最新发表的识别基因组范围内不同甲基化模式的算法CpG_MPs(2013),这些研究成果发表,得到了国际上业内专家的认可。

原文摘要:

CpG_MPs: identification of CpG methylation patterns of genomic regions from high-throughput bisulfite sequencing data

High-throughput bisulfite sequencing is widely used to measure cytosine methylation at single-base resolution in eukaryotes. It permits systems-level analysis of genomic methylation patterns associated with gene expression and chromatin structure. However, methods for large-scale identification of methylation patterns from bisulfite sequencing are lacking. We developed a comprehensive tool, CpG_MPs, for identification and analysis of the methylation patterns of genomic regions from bisulfite sequencing data. CpG_MPs first normalizes bisulfite sequencing reads into methylation level of CpGs. Then it identifies unmethylated and methylated regions using the methylation status of neighboring CpGs by hotspot extension algorithm without knowledge of pre-defined regions. Furthermore, the conservatively and differentially methylated regions across paired or multiple samples (cells or tissues) are identified by combining a combinatorial algorithm with Shannon entropy. CpG_MPs identified large amounts of genomic regions with different methylation patterns across five human bisulfite sequencing data during cellular differentiation. Different sequence features and significantly cell-specific methylation patterns were observed. These potentially functional regions form candidate regions for functional analysis of DNA methylation during cellular differentiation. CpG_MPs is the first user-friendly tool for identifying methylation patterns of genomic regions from bisulfite sequencing data, permitting further investigation of the biological functions of genome-scale methylation patterns.

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号