-
生物通官微
陪你抓住生命科技
跳动的脉搏
Nature子刊:从RNA中读取DNA信息的新技术
【字体: 大 中 小 】 时间:2012年04月09日 来源:生物通
编辑推荐:
来自美国西奈山医学院的研究人员近日来发了一种可从非DNA资源例如RNA中获取足量DNA信息的新方法,可清楚鉴别出储存在大型研究数据库中的个体生物学信息。相关研究论文发表在4月8日的《自然遗传学》(Nature Genetics)杂志上。
生物通报道 来自美国西奈山医学院的研究人员近日来发了一种可从非DNA资源例如RNA中获取足量DNA信息的新方法,可清楚鉴别出储存在大型研究数据库中的个体生物学信息。相关研究论文发表在4月8日的《自然遗传学》(Nature Genetics)杂志上。
DNA中包含着每个活细胞发育和功能所需的遗传指令。RNA充当信使在细胞中传递遗传信使,确保组织正常功能所需的大多数细胞过程能够被执行。
由于长期以来被视作是个体唯一的遗传指纹,迄今为止访问DNA信息数据库仍受到限制和保护。然而目前有大量的RNA数据却通过美国和欧洲的多个数据库对公众开放。这些数据库包含着来自世界各地成千上万基因组研究的数据。
在新研究中,西奈山医学院基因与多尺度生物学研究所主任、遗传学和基因组学系主任、基因组学教授Eric E. Schadt和西奈山医学院遗传学副教授Ke Hao博士开发出了一项新技术,借助于这项技术可以从RNA数据中推断出个人的DNA信息。当前大部分的DNA和RNA研究都是以DNA序列为起点,寻找群体中个体间表达模式与DNA改变之间的关联。新研究是首次从RNA水平来描述DNA序列。
在这篇文章中,Schadt、Ke Hao以及华盛顿大学生物统计学系的Sangsoon Woo博士对来自378名欧美捐赠者的肝脏的RNA和DNA,以及来自同一群体580名接受胃分流术者的肝脏和脂肪组织的RNA和DNA进行了分析。作者发现多个基因的RNA水平与年龄、性别、体重和诸如糖尿病、心脏病等疾病的其他风险因子相关,此外,它们还与许多情况下个体独特的DNA改变相关。
研究人员采用一种算法将基因表达模式与基因组中1000个单DNA碱基位点的变异对应起来。这是首次运用整合生物学检测多层面的DNA和RNA数据由此更好地了解RNA的指定层面。
Schadt 说:“DNA与RNA的关系就像是一组管弦乐队和它正在演奏的乐曲。DNA(管弦乐队)不发生改变,然而RNA的表达方式(乐曲品质)却对应外界因素发生改变。新技术通过聆听乐曲,推导出在管弦乐队中有哪种乐器,通过样本追溯RNA和调控的基因来解析发育的过程。”
Schadt 说:“通过观测特定组织中的RNA水平,我们可以推断出标记个体的独特基因型条码,通过这种途径将个体与获得的DNA样本对应起来。这一信息的潜在用途具有重要意义:不仅可以从RNA中推论出基因型条码,且还可根据某些组织的RNA水平来了解个体如年龄、性别以及疾病的特征,以及阿尔茨海默氏症和癌症等疾病的发病风险。”
(生物通:何嫱)
生物通推荐原文摘要:
Bayesian method to predict individual SNP genotypes from gene expression data
RNA profiling can be used to capture the expression patterns of many genes that are associated with expression quantitative trait loci (eQTLs). Employing published putative cis eQTLs, we developed a Bayesian approach to predict SNP genotypes that is based only on RNA expression data. We show that predicted genotypes can accurately and uniquely identify individuals in large populations. When inferring genotypes from an expression data set using eQTLs of the same tissue type (but from an independent cohort), we were able to resolve 99% of the identities of individuals in the cohort at Padjusted ≤ 1 × 10−5. When eQTLs derived from one tissue were used to predict genotypes using expression data from a different tissue, the identities of 90% of the study subjects could be resolved at Padjusted ≤ 1 × 10−5. We discuss the implications of deriving genotypic information from RNA data deposited in the public domain.