-
生物通官微
陪你抓住生命科技
跳动的脉搏
计宏凯博士《PNAS》详解ChIP-seq技术应用
【字体: 大 中 小 】 时间:2013年04月11日 来源:生物通
编辑推荐:
来自约翰霍普金斯大学,中科院北京基因组研究所等处的研究人员发表了题为“Differential principal component analysis of ChIP-seq”的文章,针对目前ChIP-seq技术数据处理的问题,指出dPCA方法为有效分析大量ChIP测序数据提供了一种独特的工具,可以用于研究不同生物条件下基因调控的动态变化。
生物通报道:来自约翰霍普金斯大学,中科院北京基因组研究所等处的研究人员发表了题为“Differential principal component analysis of ChIP-seq”的文章,针对目前ChIP-seq技术数据处理的问题,指出dPCA方法为有效分析大量ChIP测序数据提供了一种独特的工具,可以用于研究不同生物条件下基因调控的动态变化。相关成果公布在PNAS杂志在线版上。
文章的通讯作者和第一作者为约翰霍普金斯大学的计宏凯博士,计宏凯博士早年毕业于清华大学,后于哈佛大学获得博士学位,现于约翰霍普金斯大学执教。
将染色质免疫共沉淀技术(ChIP)与下一代高通量测序技术相结合的染色质免疫共沉淀测序(ChIP-seq),已成为功能基因组学、特别是基因表达调控领域研究的关键技术。这一技术主要包括几个基本的步骤:将蛋白交联到染色质上,剪切蛋白,用特异的抗体沉淀目的蛋白及相关DNA,以及纯化相关DNA片段等。ChIP通常会生成数毫微克到数百毫微克的DNA,它们是环绕转录因子结合位点或组蛋白标记位点的75- 到300-bp的片段。高通量测序往往会生成数以百万计的来自ChIP-DNA片段5′末端的25- 到75-bp的序列(short reads)。
ChIP-seq实验带来的海量数据向生物信息学研究人员提出了新的挑战,目前此领域数据处理技术的发展大大滞后于实验技术进步,在这篇文章中,研究人员采用主微分分析(principal differential analysis,dPCA),解析多重ChIP-seq数据,从中发现了两种生物条件下不同的蛋白-DNA相互作用。
研究人员指出dPCA方法能将无监控模式发现,降维(dimension reduction),以及统计推断整合成一个单一框架,利用少量主成分元件简要概况两种条件下主要多蛋白协同差分模式。并且对于每个模式,dPCA也能通过与复制样品中变化条件之间的差异,检测并优先考虑差异基因位点。
这种方法为有效分析大量ChIP测序数据提供了一种独特的工具,可以用于研究不同生物条件下基因调控的动态变化,研究人员指出,dPCA可以用于分析转录因子结合位点处和启动子的不同染色质模式,以及等位基因特异性蛋白-DNA之间的相互作用。
关于ChIP数据处理的其它问题,南开大学的一些研究人员特别进行了解析,明日生物通将详细介绍这篇文章。(生物通:张迪)
原文摘要:
Differential principal component analysis of ChIP-seq
We propose differential principal component analysis (dPCA) for analyzing multiple ChIP- sequencing datasets to identify differential protein–DNA interactions between two biological conditions. dPCA integrates unsupervised pattern discovery, dimension reduction, and statistical inference into a single framework. It uses a small number of principal components to summarize concisely the major multiprotein synergistic differential patterns between the two conditions. For each pattern, it detects and prioritizes differential genomic loci by comparing the between-condition differences with the within-condition variation among replicate samples. dPCA provides a unique tool for efficiently analyzing large amounts of ChIP-sequencing data to study dynamic changes of gene regulation across different biological conditions. We demonstrate this approach through analyses of differential chromatin patterns at transcription factor binding sites and promoters as well as allele-specific protein–DNA interactions.