-
生物通官微
陪你抓住生命科技
跳动的脉搏
Cell:研究复杂蛋白质组的新方法
【字体: 大 中 小 】 时间:2010年10月14日 来源:生物通
编辑推荐:
来自英国和日本的研究人员开发出一种分析蛋白质组功能关系的新方法-MCCP。这种方法的优势在于,它能够确定一个不能纯化的复杂细胞器中的蛋白组成,并结合遗传学和蛋白质组学来研究全部染色体中的复合物。机器学习的使用揭开了蛋白之间的功能关系。
生物通报道,来自英国爱丁堡大学Wellcome Trust细胞生物学中心、牛津大学和日本国立遗传学研究员的研究人员开发出一种方法,简化了有丝分裂染色体组分的鉴定和功能分类。这种定性兼定量的实验方案可应用于复杂的蛋白数据组,以鉴定出功能关系,并指导未来的蛋白质组学研究。文章发表在9月3日的《Cell》杂志上。
尽管研究了很多年,但有丝分裂染色体结构及组成仍然未能清楚地鉴定。苏格兰的William C. Earnshaw和Juri Rappsilber以及日本的Tatsuo Fukagawa联合了他们三个实验室的优势和资源,创建出多分类组合蛋白质组学(multiclassifier combinatorial proteomics,MCCP)方法,这是一种分析蛋白质组功能关系的统计方法。利用Earnshaw实验室在染色体研究上的丰富经验,研究小组采用Rappsilber 实验室使用的SILAC及质谱成像技术,通过与野生型和突变染色体的比较,收集了6个不同分类的数据,获得了大约4000个有丝分裂染色体相关蛋白的清单。
通过一种机器学习方法-Random Forest(RF)整合这些分类,他们在完整染色体的背景下揭开了蛋白复合物之间的功能关系,并找到约560个未鉴定的蛋白,值得进一步研究。Random Forest分析将染色体蛋白与非染色体蛋白和目标蛋白分开。Earnshaw表示:“它能让你在有缺失值的情况下继续工作,这一点很关键。如果蛋白被一个或另一个分类漏掉—这种情况是可能的—计算不会中断。”RF分析所产生的数据预测出新的目标蛋白,并充当未来染色体蛋白质组研究的路标。
(图片来自Cell)
实际上,在34个GFP标记的预测染色体蛋白中,30个是染色体的,包括13个与着丝粒相关。而在16个GFP标记的预测非染色体蛋白中,14个被证实是非染色体的。
这种方法的优势在于,它能够确定一个不能纯化的复杂细胞器中的蛋白组成,并结合遗传学和蛋白质组学来研究全部染色体中的复合物。机器学习的使用揭开了蛋白之间的功能关系。
尽管他们只研究了染色体蛋白,但Earnshaw强调这个MCCP方法很灵活,可用于研究任何的蛋白质。“你任何时候都能用,如果你有一个复杂的数据组,其中一些是真的,另一些可能是污染或不是真的,我们的方法能帮你分类。”(生物通 薄荷)
原文摘要:
The Protein Composition of Mitotic Chromosomes Determined Using Multiclassifier Combinatorial Proteomics
Cell, Volume 142, Issue 5, 810-821, 3 September 2010