-
生物通官微
陪你抓住生命科技
跳动的脉搏
BioArray 访谈:哈佛大学的Charles Lee 谈微阵列技术在细胞遗传学应用中的现状与未来
【字体: 大 中 小 】 时间:2009年09月10日 来源:罗氏
编辑推荐:
在近十年的大部分时间里,Dr. Charles Lee设在波士顿的实验室一直专注于利用最新的分子细胞遗传学技术来研究脊椎动物的基因组结构,以此加深对人类疾病的了解……
新闻通讯: 《BioArray News》 Justin Petrone 撰文
姓名:Dr. Charles Lee 职位:哈佛癌症研究中心细胞遗传学主任;哈佛医学院副教授;麻省理工学院和哈佛大学Broad研究院准教员;布里格姆妇女医院临床细胞遗传学家; |
背景:
2002年,通过美国医学遗传学委员会的临床细胞遗传学认证;
1998-2001年,在哈佛医学院攻读博士后学位;
1996-1998年,在英国剑桥大学攻读博士后学位;
1996年,获得加拿大阿尔伯塔大学遗传学博士学位;
1990年,获得阿尔伯塔大学遗传学学士学位。
在近十年的大部分时间里,Dr. Charles Lee设在波士顿的实验室一直专注于利用最新的分子细胞遗传学技术来研究脊椎动物的基因组结构,以此加深对人类疾病的了解。
Dr. Charles Lee目前从事的研究主要涉及三个部分:将分子细胞遗传学工具用于模式生物的开发及应用;基因组结构变异;以及癌症生物标记的识别与特征化。
Dr. Charles Lee 还是基因组结构变异识别与解释方面的权威,他积极投身于目前正在进行的1000 基因组计划,还加入了基因组结构变异联合会,利用自身在细胞遗传学上的丰富经验,以及微阵列和第二代测序等技术,帮助更好地探索人基因组结构变异。
为了解细胞遗传学界目前对这些最新技术的运用情况,《BioArray News》在上周采访了Dr. Charles Lee。以下是采访记录。
________________________________________
您何以会成为一名细胞遗传学家?
我曾在阿尔伯塔大学攻读遗传学本科学位,我很喜欢这门科学,因为我发现攻读遗传学更多地需要理解概念和解决问题,而不是对事实的死记硬背。在我大四的时候,我在C.C. Lin的带领下参与了一个研究项目,Lin既是阿尔伯塔大学附属医院的细胞遗传学主任,同时还是一个热点研究实验室的负责人。我对像他这样能成功地兼顾治疗与研究的人很敬仰。我对研究的热情就是这样慢慢培养起来的,我发现自己很擅长显微镜检查,当看到染色体显色时我就很有成就感,这比单纯地观察凝胶中的谱带有趣多了,而且我能积极利用最新的细胞遗传学技术,这都让我很有满足感。
在此之后,我开始从事两项博士后研究,一项为基础研究,另一项涉及临床细胞遗传学。我的第一个博士后研究是与英国剑桥大学的 Malcolm Ferguson-Smith 一同进行的。他是世界知名的细胞遗传学家,致力于研究尖端的分子细胞遗传学技术,包括光谱核型分析、Rx-FISH、染色体流式分拣与涂染,以及性别判定和产前诊断方面的研究。而我的临床细胞遗传学培训是与哈佛医学院的Cynthia Morton一同进行的。现在,我已成为美国医学遗传学委员会的认证会员,平时我有20%的时间在布里格姆妇女医院提供临床细胞遗传学方面的服务,此外我在BWH/哈佛医学院负责一家23人的研究室,我把剩余80%的时间都花在那里。对我来说,这一时间分配是最为平衡的。
您最初在阿尔伯塔大学,后来又到剑桥大学从事研究时,当时可供您利用的技术有哪些?
在阿尔伯塔大学时我们做了大量的 G带染色体分析,那时刚开始在采用特定基因座的染色体涂染探针的原位杂交中使用荧光技术。后来我到了剑桥大学,那里的实验室使用了许多先进的分子细胞遗传学技术,包括光谱核型分析、染色体流式分拣、跨物种染色体涂染和纤维FISH。当时阵列技术还未进入实验室,因为首个阵列 CGH 论文直到1997年才公布与世。
您从何时开始接触微阵列技术?
2003年,我在哈佛医学院刚从讲师升任助理教授,并设立了我自己的研究实验室,能够从事基于阵列的比较基因杂交实验。但在那时,我们还远远未在aCGH 领域占据领先地位。那时在该领域走在前列的是加州大学旧金山分校的 Dan Pinkel 和Joe Gray、英国桑格中心的Nigel Carter 、荷兰内梅亨大学的 Joris Veltman 等人。正是这些举足轻重的人物在不久后的将来让所有的细胞遗传学家都能利用aCGH 技术进行研究或临床诊断。
您最早使用的是哪种类型的阵列平台?
那时所用的阵列主要是基于BAC的阵列,含有约150 K碱基的插入 DNA。一开始我们也考虑过自己开发阵列,但我的实验室刚起步不久,显然没有足够的人力和财力这么做。于是有人向我引见了一家新成立的名为Spectral Genomics的公司,他们生产供aCGH 实验所用的BAC阵列。我先试用了他们的小鼠BAC阵列,发现他们有许多BAC克隆图谱都是错误的。在约1/3的克隆中,不仅染色体基因图有误,甚至还将不同的非同源染色体列入了图谱。当我把我们的FISH 验证实验结果给他们看后,他们请我担任该公司的无薪顾问。这是了解阵列生产详情和解决aCGH实验疑难问题的大好机会。
其发展情况如何?
之后,我们从有效分辨率约为3 Mb、每个阵列约含1000个克隆的Spectral Genomics小鼠阵列转而使用有效分辨率相近、每个阵列约含1000个克隆的Spectral Genomics人阵列。如你所知,现在我们已将每个阵列约1000个克隆提升至每个阵列约200多万个寡核苷酸。
随后,我们又转向了每个阵列约含3000个克隆的Spectral Genomics人阵列,对于人基因组得失的有效分辨率约为1 Mb。这个时候,曾参与我的首个博士后研究的John Iafrate 开始着手测试用于临床细胞遗传学诊断的阵列。作为一名优秀的科学家,他率先进行了阵列对照实验。其中一项对照实验是对两位健康的正常人的基因组DNA进行比较。根据我们在遗传学课程和人基因组项目中得到的数据,健康的正常人的[基因组]相似性达到99.9%,其差别主要在SNP上。由于此类阵列平台无法检测出SNP,我们原本预期在这些对照实验中将看到“平坦线路”概貌。但在对39位无血缘关系的健康的正常人经过测试后,结果显示每位测试对象都出现了大规模的基因得失,这显然让我们大吃一惊。接着,我们与多伦多病童医院的Stephen Scherer 联手将这些结果整理到一个数据库中,也就是现在的基因变异数据库。我们把研究成果写成论文,并将原稿投给了英国《自然遗传学》杂志。这篇论文于2004年8月1日在网上公布。在我们的论文发表一周后,由冷泉港实验室的Jonathan Sebat 和Michael Wigler 率领的研究团队撰写的另一份论文也刊登在了美国《科学》杂志上,他们的研究结果与我们是一致的。这些基因得失— 现称为拷贝数变异(CNV)— 是目前已知的人基因组结构变异中的最大组成部分,且成为了人遗传学研究中一个令人振奋的领域。CNV还能在临床aCGH 诊断法的准确解释中给出直接的提示。
您现在使用哪些技术组合?
我们几乎已不再使用基于BAC的阵列了。主要是因为寡核苷酸阵列在质量和分辨率上都有了实质性的改善。凭此,甚至有可能开发出结合多张载片数据的自定义阵列集。例如,我们组建的基因组结构变异联合会— 负责人是Stephen Scherer、Matthew Hurles、Chris Tyler-Smith、Sanger中心的Nigel Carter和我— 已构建并使用了一个分布于20张载片的含4200万个寡核苷酸探针的NimbleGen 微阵列芯片,以500bp的有效分辨率深入了解个人基因组的CNV。我们还与首尔国立大学的教授Jeong-Sun Seo合作,开发出一个分布于24张载片的含2400万个寡核苷酸探针的阵列集,在人身上获得相似的CNV检测有效分辨率。我们实验室还有一些工作是开发模式生物的 CNV谱图,为完成这一任务,我们专门针对黑猩猩、猕猴和鼠构建了自定义阵列。
现在您是否仍在使用FISH和一些较老的技术?
我们依然在做大量的FISH。原因是任何技术都有其局限性,包括aCGH,所以我认为FISH和aCGH可以成为互补的技术。对阵列CGH来说,其主要的局限是无法在染色体重排上获得平衡。虽然可以检测到基因得失,但举例来说,会在患有畸形和发育迟滞的儿童身上检测到额外的染色体物质。你不知道这些额外的染色体物质是否在同一个染色体位点上呈串连排列,或额外的染色体物质是否位于其他染色体区域内,甚至是在另一个非同源染色体上。在临床环境下,当询问一位带有额外染色体物质的儿童的父母时,串联重复和非串联重复这两种情况所表示的含义可能截然不同。对这名儿童的染色体进行FISH研究能提供额外物质的染色体位点的信息,而对其父母的FISH研究可能显示出平衡的染色体重排,与这一重排相关的是,其他带有额外染色体物质的儿童的复发风险有所增加。
刚才我们谈了CGH,那么,您对基于SNP 的平台有何看法?
如你所知,aCGH一词是在为两个DNA样本贴标时用到的,其中一个是测试DNA样本,另一个是正常的参考DNA样本,两者所用的荧光染料不同,并将已标记的DNA共杂交到单个阵列上。SNP阵列是基因分型阵列,最初是专门用来检测单个核苷酸替代,而不是基因组得失的。现在,Affymetrix 和 Illumina 已经采用了新的SNP 阵列设计,包括新增了专门检测拷贝数变化的探针。一般情况下,它们能通过杂交信号强度变化和识别明显SNP纯合性的延长来推断出拷贝数的变化。由于只将一个已标记的基因组杂交到每个SNP阵列中,在将实际得到的数据与参考数据集进行比较后,可获得一部分已推断的CNV。
新设计的SNP阵列的一大优点是能在单个平台上获得SNP和CNV数据。对于基因组相关性研究来说,这意味着能减少DNA输入以及试剂、人工和成本, 而通常的SNP阵列检测和aCGH 测定需要分开进行。不过,此类SNP阵列也有一些需要引起科学家们关注的重要局限性。举例来说,Affymetrix 6.0 芯片一般用来检测大小约为30 kb 或更大的常见CNV。此类芯片不太可能检测出罕见CNV,特别是当其大小低于30 kb时。同样地,Illumina 660W 平台也不是用来检测罕见CNV的,即使作为其靶向的较小型常见CNV,该平台的检测有效性也只有约63%— 这可能是对许多CNV靶区域缺乏足够的信息探针所致。Illumina 近来还新增了另一种新的SNP微珠阵列设计— Omni 阵列。可惜的是,由于这一产品刚推出不久,我们还无法对这一阵列的CNV检测能力做出评估。如今市面上的CNV检测商用平台品种繁多,很有必要对所有的阵列平台做逐一比较— 这正是基因组结构变异联合会目前正在着手做的。
看起来每个实验室所用的技术组合都有所不同。能否请您谈一下,目前学术界是如何解决不同实验室在同一实验上结果不一致的问题?
我前面已经提过,应当对不同的技术进行一项公正且全面的比较研究,以评估每种平台可检测与无法检测的具体方面。我认为,对于大规模的基因组失衡,大部分平台都能检测出来。解释上可能出现的偏差主要存在于较小的基因组上,特别是当这些基因组被嵌入或靠近带有片段重复或其他重复性元素的复杂基因组区域时。
在临床诊断中,对阵列平台实施标准化将很有帮助。现有的标准化机构— 细胞遗传学阵列国际标准化联合会由埃默里大学的David Ledbetter 和Christa Lese Martin负责,他们的目标是对体质细胞遗传,最终对围产期细胞遗传病例做出准确的解释。该联合会正在尝试设立相关的最低要求,比如,此类临床细胞遗传学诊断阵列应当检测出哪些靶区域,应获得的最低有效分辨率是多少。该团体还力争让所有的成员都能共享阵列数据,帮助对拷贝数变化做出准确的解释。这样的话,每位细胞遗传学家就能根据自己的意愿选择适合的平台,只要其阵列满足ISCA设立的最低要求即可。至于癌症细胞遗传学目前所用的阵列,现在美国杜兰大学的Marilyn Li正在带头设立一个癌症细胞遗传学阵列联合会。
您怎样在从事日常科研工作的同时,密切关注全世界层出不穷的最新基因组结构变异信息?
如果我没理解错的话,你的意思是指,随着正常人拷贝数变异信息资料的日益增多,我们是如何实施转化型研究或临床研究项目的。这无疑是个持续的挑战。过去五年来,基因组变异数据库将已公布的健康正常人的CNV检测数据都收编到目录中。当然,所有的CNV项目在检测中都出现了一定程度的假阳性率,比例在5%-20%甚至更高,而这一信息不可避免地被错误地列入了正常变异中。对于临床细胞遗传学家来说,我们参考基因组变异数据库中的信息,对病人的CGH阵列结果中出现的基因组失衡的致病性做出解释。简单地说,在健康的正常人身上出现的基因组失衡不太可能在临床识别的病人身上成为病原。但我们知道基因组变异数据库中存在假阳性数据,所以不能仅根据这些标准来解释某位病人的基因组失衡。令人庆幸的是,我们还可以结合数十年来细胞遗传学家们在全基因组重排上一直使用的标准。举例来说,如果在某位病人身上发现染色体重排,同时其健康的双亲中有一方也存在这一情况,那么就不太可能视之为病原。当然这也有例外。比如,当病人出现染色体缺失,其健康的母亲的缺失情况看起来与之一样时,但病人的染色体缺失显露出隐性突变 — 其母亲则没有这一突变,那么两者的表型效应也有很大差别。
显然,所有的临床细胞遗传学家在解释阵列CGH结果时都必须格外小心,充分利用现有的所有临床数据和网上数据库中的数据,如基因组变异数据库和DECIPHER,以及基因组失衡的内容,同时与遗传学顾问紧密合作,帮助他们告知病人,阵列CGH解释虽然不是绝对正确的,但是根据我们所获得的大量相关信息做出的。虽然我不想这么说,但有时候,在解释基因组失衡上是有点小技巧的。我想,随着时间的推移,我们获得的基因型及相应的表型数据将越来越多,结果解释也将变得越来越容易和准确。当然了,在进行产前阵列CGH测试时应格外谨慎,应将此类测定结合其他现有信息一同使用,如超声检查结果和家族史等等。
在采用阵列技术的这些年里,您在诊断率上的改善程度如何?
在过去,对发育迟缓和畸形患者的基因测试的黄金标准是G带核型,其中有高达98%的病例都为正常核型。而现在采用 aCGH测试后,在同样的病例中,能检测出18%的反常结果病例。这代表了检出率的显著提升,促使欧洲许多临床实验室和北美的部分实验室开始将aCGH测试作为首要的测试方法,优于G带核型。采取这一策略能帮助临床实验室节省大量时间和资源。
有趣的是,有些人认为,使用分辨率更高的阵列能持续提高临床实验室对反常结果的检出率。但根据现有数据来看,这一假设似乎并不成立。因为当我们利用较高分辨率的阵列时,我们可能将检测出更多的良性 CNV,而不是更明显的致病基因组失衡。
您认为阵列技术在今后几年里将如何发展?
除基因组失衡外,片段单亲双体— 即两种等位基因仅衍生自单亲的基因组区域,有时也会成为临床基因致病性。比如,新生儿患有Prader-Willi综合征的比率约为1/25000,且可能是由父系遗传基因组序列在15q11-q13染色体区的缺失造成的。据我推测,还有其他许多遗传疾病也是由特定的片段单亲基因组区所导致的。与染色体缺失相关的此类区域可用aCGH检测到。如果单亲基因组区域为二染体,或存在于两个拷贝中,那么aCGH将无法检测出畸变。但SNP阵列就能做到。所以我预计,能检测出基因组失衡的SNP阵列或能获得SNP信息的 aCGH平台将更多地在临床中得到应用。
您怎样看待新一代测序工具?它们对您目前的工作是否有任何影响?
当然有影响。在我们的研究实验室里,约有1/4正在进行的项目会用到某种新一代DNA测序。我不认为新一代测序很快会在临床上取代基于阵列的各种技术,但随着DNA测序率的持续下降,与外显子组测序、甚至全基因组测序有关的研究项目日益涌现。
目前,我们的研究实验室已参与了1000基因组计划。我们的实验室专属于其中的基因组结构变异分析团体。我们和其他几个团体一起,主要采用较短的、约105 bp的配对序列读数,设法准确地解释经测序的每个人的基因组结构变异。尽管我们在开发和验证许多不同的计算机算法上取得了显著的进展,但依然任重道远。看起来识别基因组结构变异要比识别SNP困难得多。
您参与了众多的科研项目。目前您主要从事的是哪方面的研究?
目前在我们的实验室进行的研究中,有3/4 与某种形式的结构变异识别或特征化有关,包括人类与模式生物。有人劝我少接一些项目,将精力专注于少数几个最重要且有潜在影响的项目。但实际上要做到这一点不太容易。在人类与模式生物的基因组结构变异上仍有许多未知的信息— 比如这些变种处于哪个位点上,它们的基因组影响如何,随后这些变种又会生成哪些表型,包括疾病易感性等,我对充分利用有限的时间和现有资源来揭示这些答案充满了兴趣。看到我热情高涨的样子,一些同事开玩笑说,他们认为我也患有轻度的多动症。我想他们是对的。
您利用哪类生物信息学工具来应对这些研究问题?
直到最近,我们一直非常依赖于各家阵列生产公司推出的软件。我们也会使用其它独立平台分析算法开发公司的软件产品,比如BioDiscovery的Nexus程序。但在去年,我们幸运地请到 Ryan Mills加盟我们的研究团队,他是一位资深的生物信息学家,也是卓越的团队领导者,在分析新一代DNA测序数据和识别基因变异上颇有研究。他为我们的研究团队注入了无法估量的价值。我无法想象,如果缺少优秀的生物信息学家,任何基因组研究或临床实验室将如何运作下去。我知道临床细胞遗传学家在北美很稀缺,但我估计,如今对生物信息学家的需求更为旺盛。
从整个细胞遗传学研究界来看,您认为是否只有顶尖的实验室才会采用阵列技术?
如果在两年前,确实只有顶尖的实验室才会使用。但这一情况在发生改变。虽然不是很清楚确切数字,但据我估计,本国至少有20家甚至更多的实验室现以某种形式采用了阵列CGH技术。作为美国人类遗传学协会程序委员会的成员,我发现今年有关aCGH的研究摘要比往年多出许多。我们的会员即将在夏威夷聚首,交流和分享彼此的科研成果,这无疑是件让人振奋的事 — 原因之一是,现在aCGH已经不再是一流实验室的专利,而得到了广泛的普及。让细胞遗传学家热血沸腾的时刻终于到了。
罗氏诊断产品(上海)有限公司
罗氏应用科学部
订货热线:800-820-3361 400-820-3361 技术服务热线:800-820-0577
上海市淮海中路1045号 北京分公司 广州分公司
淮海国际12楼 北京市东长安街1号东方广场 广州市环市东路403号
Tel: 021-2412 1000 东方经贸城中二办公楼609室 广州国际电子大厦25楼
Fax: 021-2412 1081 Tel: 010-8515 4100 Tel: 020-8713 2600
邮编: 200031 Fax: 010-8515 4188 Fax: 020-8713 2700
邮箱:china.as@roche.com 邮编: 100738 邮编: 510095