中国黄牛染色体级别基因组揭示适应性进化与免疫机制

《DNA Research》:The chromosome-level genome of Chinese indicine cattle breed provides insights into bovine adaptation and immunity

【字体: 时间:2025年11月29日 来源:DNA Research 2.9

编辑推荐:

  本研究针对现有牛参考基因组对印牛亚种代表性不足的问题,通过PacBio HiFi和Hi-C技术构建了大别山牛染色体级别基因组(contig N50 90.92 Mb)。该组装填补了262个缺口,端粒序列覆盖25条染色体,BUSCO完整度达96.3%。研究发现TRPC4、CFDP2等基因家族扩张与热耐受相关,LTR反转录转座子分析揭示近期转座活性。该基因组为牛科动物进化研究和抗逆育种提供了重要资源。

  
在基因组学研究领域,牛作为重要家畜物种一直缺乏高质量的印牛亚种参考基因组。现有参考基因组ARS-UCD1.2基于欧洲荷斯坦牛构建,对适应热带地区的印牛亚种存在代表性不足的问题。这种参考偏差导致在分析印牛特有的抗病性、耐热性等重要性状时产生误差。中国大别山牛作为典型的印牛地方品种,以其卓越的耐热性、抗蜱虫特性而闻名,是研究牛适应性进化的理想模型。
为了突破这一技术瓶颈,中国农业科学院动物科学技术学院葛飞等研究人员在《DNA Research》上发表了题为"The chromosome-level genome of Chinese indicine cattle breed provides insights into bovine adaptation and immunity"的研究论文。该研究采用第三代测序技术,成功构建了染色体级别的大别山牛基因组图谱,为牛科动物进化研究和育种实践提供了重要资源。
研究团队采用PacBio HiFi长读长测序技术,结合Hi-C染色体构象捕获技术,成功获得了81.08 Gb的测序数据。通过hifiasm组装器进行基因组组装,经过去冗余和质控过滤后,最终获得2.91 Gb的基因组序列,contig N50达到90.92 Mb,显著优于现有参考基因组。Hi-C数据进一步将contig锚定到30条假染色体上,填补了262个基因组缺口,使得20条染色体实现完全无缺口组装。
基因组质量评估显示,该组装覆盖了95.14%的预估基因组大小,仅包含18个未定位scaffold,远少于ARS-UCD1.2的2180个。端粒序列分析发现25条染色体末端都存在完整的端粒重复序列,总长度达235.18 Kb。BUSCO评估显示基因组完整度达到96.3%,CCS reads回比率高达99.96%,质量值(QV)分别为47.02(短读长)和68.67(CCS数据),证明组装具有高度的准确性和完整性。
基因注释方面,研究人员通过整合从头预测、同源比对和转录组数据,共预测到26,392个蛋白质编码基因,其中86.1%的基因得到同源蛋白支持,73.19%有转录本证据。功能注释覆盖NR、SwissProt、eggNOG等多个数据库,同时还鉴定了970个microRNA、3,738个tRNA等非编码RNA。
重复序列分析显示,转座元件占基因组的52.90%,其中长末端重复序列(LTR)的插入时间分布呈现典型的"L型"曲线,表明近期转座活性较高。与荷斯坦牛的比较发现,Gypsy家族在荷斯坦牛系中约0.25百万年前出现特异性扩张,这可能是品种分化的遗传基础之一。
进化分析基于牛科9个物种的单拷贝同源基因,构建的系统发育树显示牛属、野牛属和水牛属的共同祖先约在1270万年前分化。大别山牛与瘤牛(Nelore)的分化时间约为160万年前,早于主要印牛- Taurus牛分化事件,这可能反映了中国南方印牛复杂的杂交历史。
基因家族分析发现大别山牛特有209个基因,主要富集在病毒感染的KEGG通路,如酒精性肝病(bta04936)、COVID-19(bta05171)等。GO分析显示这些基因参与"自然杀伤细胞活化"、"T细胞活化"等免疫过程。基因家族扩张收缩分析发现720个基因家族发生扩张,涉及胰高血糖素信号通路(bta04922)和Hippo信号通路(bta04390)。正选择基因分析鉴定到151个基因,可能与适应性进化相关。
选择信号分析基于30头大别山牛的全基因组重测序数据,共鉴定55,376,741个SNP,外显子区SNP比例较ARS-UCD1.2参考基因组提升一倍。群体遗传分析显示南方和北方牛种存在明显遗传分化。FST和XP-CLR分析发现31个候选基因,其中CFDP2基因在多种分析中均被鉴定为选择信号,该基因在多个染色体上存在同源拷贝,可能与转座子插入或基因复制事件有关。
研究人员重点探讨了与热耐受性相关的分子机制。瞬时受体电位(TRPC)基因家族的扩张可能增强脑内温度感知和体温调节能力。扩张的CACNA1和KCNN1基因分别参与钙离子和钾离子通道调控,这些离子与钙调蛋白(CALM)结合形成全钙调蛋白复合物,通过蛋白激酶调控体温。细胞内钙离子浓度变化还能激活CHRM3乙酰胆碱受体,调节腺苷酸环化酶(ADCY)活性,影响三羧酸循环(TCA)和ATP产生。核糖体蛋白家族成员如PS6和PDE3B的扩张可能增强蛋白质翻译能力,满足高温环境下的代谢需求。
该研究构建的高质量大别山牛基因组不仅填补了印牛亚种参考基因组的空白,还为理解牛科动物适应性进化提供了新视角。基因家族扩张和选择信号分析揭示了与热耐受性和免疫应答相关的关键基因和通路,为抗逆育种提供了分子靶点。与牛基因组变异数据库(BGVD)的交叉验证进一步支持了研究结果的可靠性。未来通过对更多个体进行高质量测序,将有助于构建品种特异性泛基因组,全面解析结构变异,推动基因组育种的发展。
这项研究标志着牛参考基因组研究的重要进展,为建立全面的牛泛基因组参考迈出了关键一步,将促进变异检测、品种分类和多样性生物学研究的发展。大别山牛基因组的发布为探索牛免疫机制、揭示热应激适应的遗传基础提供了宝贵资源,对应对气候变化背景下的畜牧业可持续发展具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号