基于同源序列比对的二代测序技术优化CYP21A2变异检测及其在21-羟化酶缺乏症中的应用研究

【字体: 时间:2025年09月18日 来源:Risk Management and Healthcare Policy 2

编辑推荐:

  本研究开发了一种创新的同源序列分析(HSA)算法,结合二代测序(NGS)技术,显著提升了CYP21A2基因变异检测的准确性与效率。该研究通过计算同源区域测序读段比例,成功识别单核苷酸变异(SNV)、插入/缺失(Indel)、拷贝数变异(CNV)及基因融合事件,阳性预测值(PPV)达96.26%。这一方法突破了传统诊断技术(如MLPA和LR-PCR)在高同源区域分析中的局限性,为先天性肾上腺皮质增生症(CAH)的精准基因诊断提供了高效、低成本的解决方案,并具备拓展至其他同源基因家族(如HBA1/HBA2、SMN1/SMN2)应用的潜力。

  

引言

先天性肾上腺皮质增生症(CAH)是一种常染色体隐性遗传病,其中95%的病例由21-羟化酶缺乏症(21-OHD)引起,其致病基因为CYP21A2。该基因编码的细胞色素P450c21(CYP21)在糖皮质激素合成中催化17-羟孕酮(17-OHP)转化为11-脱氧皮质醇。酶活性缺失会导致17-OHP堆积和雄激素过量,临床表现为女性男性化、男性假性性早熟等。全球发病率约为1/10,000至1/2,000,中国浙江省报道为0.38/10,000。

CYP21A2位于RCCX模块中,其假基因CYP21A1P与之具有98%的同源性,但携带15个失活突变。这种高同源性导致常规测序分析中易出现错配和误判,尤其是拷贝数变异(CNV)和基因转换事件的检测。传统方法如MLPA和LR-PCR虽能部分解决这一问题,但通量低、成本高,且无法适应大规模筛查需求。二代测序(NGS)技术的引入虽提升了检测效率,但仍受限于同源区域的比对错误。

材料与方法

研究纳入2022年4月至2023年2月宁波大学妇女儿童医院的100例参与者,包括16例21-OHD患者和84例CYP21A2突变携带者。所有样本均经临床和遗传学确认,并获伦理委员会批准(2021-ky-036)。

基因组DNA通过QIAamp? DNA Blood Mini Kit提取,构建文库后使用Twist Human Core Exome Multiplex Hybridization Kit进行全外显子测序(WES),并在Illumina NovaSeq平台上测序。原始数据经bcl2fastq2转换后,使用BWA比对至hg19参考基因组,GATK4进行变异检测,ANNOVAR进行注释。CNV分析采用内部工具CNVexon,基于区域覆盖深度计算拷贝数变化。

核心创新点为同源序列比对(HSA)算法的开发。该算法通过计算基因与假基因的测序读段比例(G2P)及其自然对数(Misalignment Index, MI),识别同源区域的错配现象。基因特异性核苷酸(GSN)位点用于区分真基因与假基因序列。MI基线在正常条件下为0(G2P=1),但会因CNV或基因转换而调整(例如单拷贝缺失时MI=-0.69)。算法通过511例健康人群的数据校准了各外显子的MI阈值,特别针对exon 8-10的高转换频率进行了优化。

所有变异均遵循ACMG/AMP指南分类,并通过LR-PCR、Sanger测序或MLPA验证。LR-PCR使用EmeraldAmp? MAX HS PCR Master Mix,MLPA采用MRC Holland的P050-C1探针组合,数据通过Coffalyser.net分析。

结果

共检测到107个致病或可能致病变异(PLPV),包括93个SNV/Indel、6个CNV和8个CYP21A2-CYP21A1P融合突变。HSA算法的总体阳性预测值(PPV)为96.26%(103/107验证一致)。

小变异中以无义突变最常见(66.67%),其中exon 8的c.955C>T(p.Gln319*)占98.39%;错义突变(30.11%)主要集中在exon 7和8,如c.518T>A(p.Ile173Asn)和c.844G>T(p.Val282Leu);内含子区域如c.293-13C>G和c.292+1G>A也被检出。HSA成功识别了51个假阳性和5个假阴性位点,并经实验验证。例如,c.955C>T在exon 8因假基因同源区误比导致假阳性,而c.518T>A和c.1069C>T则因误比至假基因而漏检。

CNV均为 exon 缺失,其中5例为全部10个exon缺失,1例为exon 1-6缺失。MI基线在CNV存在时发生偏移(如单拷贝缺失时MI=-0.69),MLPA结果与HSA预测完全一致。

8例融合突变涉及exon 1-3、2-3、6、4-7和4-8区域。例如,样本9、97、86中exon 1-3的MI异常提示基因转换,MLPA显示CYP21A1P拷贝数增加而CYP21A2降低;exon 6融合经LR-PCR验证发现4个GSN位点突变(c.[705T>C;710T>A;713T>A;719T>A]);exon 4-8融合则通过LR-PCR检测到6个GSN位点杂合突变。这些结果证实了HSA在复杂重组事件中的检测能力。

讨论

基因重复进化导致的高同源区域(如CYP21A2/CYP21A1P)是NGS数据分析的难点,传统比对工具(如BLAST)难以避免误比。HSA算法通过读段深度比较和MI计算,有效区分了真变异与假基因干扰,提升了CAH的诊断准确性。

本研究验证了HSA在SNV、CNV和融合突变检测中的可靠性,尤其解决了常见突变(如c.955C>T)的假阳性问题。该方法较商业工具(如Illumina Dragen CYP21A2 caller)更具成本效益,且适用于外显子测序数据,利于临床推广。此外,HSA的策略可拓展至其他同源基因家族(如HBA1/HBA2、SMN1/SMN2),但需针对特定GSN位点和基线进行校准。

当前CAH诊断依赖17-OHP检测(GC-MS/LC-MS/MS),但存在假阳性高、无法识别非经典病例等问题。NGS结合HSA提供了基因分型的金标准,有助于明确基因型-表型关联、指导治疗和遗传咨询。例如,酶活性低于1%会导致盐浪费型危机,而1-2%活性则需警惕应激性肾上腺危象。

局限性

本研究仅针对阳性样本验证了HSA的准确性,未评估阴性预测值(NPV)或大规模人群性能。算法仍依赖人工阈值设定,未来需开发自动化工具。此外,HSA在其他同源基因的应用需进一步验证和校准。

结论

HSA算法通过同源区域读段深度分析,显著提升了CYP21A2变异的检测精度,克服了NGS在高同源区域的局限。该方法为CAH的精准诊断提供了高效、经济的解决方案,并具备潜力应用于其他复杂基因组区域的突变筛查,推动出生缺陷的三级预防。

缩写说明

CAH(先天性肾上腺皮质增生症)、21-OHD(21-羟化酶缺乏症)、NGS(二代测序)、HSA(同源序列比对)、SNV(单核苷酸变异)、CNV(拷贝数变异)、MLPA(多重连接依赖探针扩增)、LR-PCR(长片段PCR)、GSN(基因特异性核苷酸)、MI(错配指数)、G2P(基因与假基因比率)。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号