一项针对德国荷斯坦奶牛的11项健康特征和22项体型特征的大规模多性状元分析

《Journal of Dairy Science》:A large-scale multitrait meta-analysis of 11 health and 22 conformation traits in German Holstein cows

【字体: 时间:2025年11月23日 来源:Journal of Dairy Science 4.4

编辑推荐:

  乳品牛养殖中多性状协同选择需考虑遗传关联。本研究基于180,217头德国荷斯坦牛的全基因组序列数据,对11个性状(感染性蹄病、酮症等)和22个体型性状(体深、蹄角等)进行多性状元分析,结合功能注释和基因集富集分析,发现3,422个全基因组显著关联位点,涉及84个基因。通过LD pruning和FAETH评分筛选出高功能潜力变异,揭示遗传共现现象(如PI3K-Akt信号通路在体型和健康性状中共富集)。遗传参数分析显示健康性状间遗传相关性强(如蹄病相关系数达0.69),而体型与健康性状间相关较弱(平均0.12)。研究证实多性状元分析能有效整合低遗传力性状的遗传信号,为基因组选择提供新标记。

  在现代奶牛养殖业中,多个性状通常被纳入育种目标中,以最大化经济价值。遗传相关性这一现象既可能增强也可能阻碍选择响应,因此在多性状选择方案中必须考虑其影响。为了研究德国奶牛育种目标中包含的性状的遗传结构,本研究对11个健康性状和22个体型性状进行了多性状元分析,样本数量从100,809到180,217头德国荷斯坦奶牛。随后,对每对性状之间的全局遗传相关性进行了估计。通过多性状元分析,总共识别了58,454个全基因组显著的变异位点。在高连锁不平衡(LD)的区域中,这些变异位点被修剪并使用外部的功能和进化信息进行功能注释,从而优先考虑那些最可能影响性状的变异位点。研究发现了一些已知和新的区域,从而产生了一组新型的共享候选标记,可以被纳入多性状基因组预测中,以提高其可靠性。

### 研究背景与意义

多性状选择在奶牛育种中变得越来越普遍,包括生产、体型、健康、繁殖力和寿命等性状。这些性状的权重通常根据其在育种目标中的经济重要性进行调整。为实现这一目标,已经开发了多种方法和软件。多性状方法在选择低遗传力(h2)性状和难以或成本高昂测量的性状时特别有用,因为在这些情况下,常使用指示性状。遗传相关性在多性状选择方案中是一个重要的因素,它可能对性状选择产生有利或不利的影响,因此必须被纳入考虑。

体型性状,或称类型性状,历史上在奶牛选择中扮演着重要角色,代表动物的外部外观。这些性状的记录通常基于测量结果和与品种标准的比较。随着时间的推移,这些性状开始被用作奶牛育种中其他性状的指标,因为它们可以通过简单且低成本的方式记录。例如,与身体相关的体型性状可以指示繁殖力和代谢紊乱,乳腺相关的体型性状可用于寿命预测,而蹄和腿相关的体型性状可以作为蹄病的指标。近年来,直接健康性状,如蹄和蹄部疾病,变得越来越重要,但它们通常难以记录且遗传力较低。

全基因组关联研究(GWAS)已经揭示了数千种与经济性状相关的关联,但只有少数因果变异得到了确认。因此,元分析可以用来增加样本量和统计功效,以识别性状相关的位点。多性状元分析可以进一步揭示不同性状之间共享的常见、通常为多效的位点。具有遗传相关性的性状通常共享数量性状位点(QTLs),同时分析这些性状可以更容易地识别这些QTLs。鉴于一个潜在的因果变异可能已经在大样本数据集中,拥有一个大型数据集对于发现新的性状相关位点变得至关重要。一旦识别,这些变异位点可以被纳入SNP芯片中用于基因组评估,因为添加预先选择的序列变异已被证明可以提高基因组预测的可靠性。

### 研究方法

本研究旨在识别具有高因果潜力的变异位点,这些变异位点在德国奶牛育种目标中包含的性状之间共享。为此,首先使用了100,809到180,217头德国荷斯坦奶牛的插补全基因组序列数据,这些数据用于对11个健康性状和22个体型性状进行单性状GWAS。随后,对GWAS的汇总统计信息进行了多性状元分析,结合了不同的性状复合体,接着进行了连锁不平衡(LD)修剪和功能注释。最后,估计了33对性状的性状遗传力和遗传相关性。

### 研究结果

在健康性状的单性状GWAS中,每个性状分别识别了33、1,036、554、98、0、2,027、2、2,888、2,281、2,931和0个全基因组显著的变异位点。随后,对11个健康性状进行了多性状元分析,共发现了3,422个全基因组显著的标记,分布在染色体BTA1、BTA6、BTA14、BTA15、BTA19、BTA24和BTA29上。其中,BTA6上发现了最多的显著关联,共计2,809个。这些显著的变异位点主要分布在84个基因附近。多性状元分析的λ值为1.092,FDR为0.001%。多性状元分析的曼哈顿图如图1所示。

对于体型性状,多性状元分析发现了超过62,000个全基因组显著的变异位点,其中6,221个为角性(ANG),5,408个为体深(BDE),5,036个为胸宽(CWI),4,901个为乳用类型(DT),78个为蹄角(FAN),5,315个为前乳头长度(FTL),4,047个为前乳头位置(FTP),4,406个为前乳腺附着(FUA),1,953个为后膝质量(HQ),47个为运动能力(LOC),6个为总体体型评分(OCS),164个为总体蹄腿评分(OFL),3,292个为总体乳腺评分(OUS),2个为后腿集合后视(RLR),0个为后腿集合侧视(RLS),956个为后乳头位置(RTP),603个为后乳腺高度(RUH),4,523个为后背宽度(RWI),7,792个为体型(STA),3,975个为乳腺深度(UDE),以及1,885个为乳腺支持(USU)。在这些分析中,没有发现单性状GWAS汇总统计信息的基因组膨胀(λ = 1)。

多性状元分析中,6个与身体相关的性状(ANG、BDE、CWI、RAN、RWI和STA)的遗传力较低到中等,范围从0.22(BDE)到0.37(STA)。蹄和腿相关的性状(FAN、HQ、LOC、RLR和RLS)的遗传力较低,范围从0.08(LOC)到0.13(RLS)。乳头和乳腺相关的性状(FTL、FTP、FUA、UDE、RUH、RTP和USU)的遗传力较低到中等,范围从0.15(USU)到0.30(UDE)。与评分相关的性状(DT、OCS、OFL和OUS)的遗传力中等且相似,范围从0.26(OCS)到0.29(DT)。对22个体型性状的遗传力估计标准误差,四舍五入到小数点后三位,范围从0.005到0.007。

在健康性状中,观察到的遗传力相关性大多为正,尤其是在同一性状组内,例如在蹄和蹄部疾病组内。所有相关性均为正,除了SCS与其他性状的相关性。SCS与所有性状均表现出非常弱且负的相关性,但与MAS之间存在强负相关(?0.66)。这可能是因为SCS和MAS的表达尺度不同,较高的SCS值与较低的繁殖价值(RBV)值相关,意味着较高的SCS值可能与较高的乳房炎发生率相关。在健康性状组之间,所有相关性均为正,除了SCS,它与所有10个性状均表现出负相关,但相关性较弱。

对于体型性状,相关性估计显示,BDE和CWI之间的相关性与Oliveira Junior等人的研究结果一致。其他相关性如STA和FAN、ANG和RTP、ANG和FAN、BDE和RLR、BDE和FUA等,也与Xue等人的研究结果相似。然而,某些性状对之间的相关性方向有所不同,例如ANG和CWI在本研究中表现出强烈的负相关,而在Xue等人的研究中则表现出中等正相关。在一项关于中国荷斯坦奶牛体型性状的研究中,相关性方向几乎与本研究相同,仅在RAN和RWI之间存在差异。本研究中,RAN和RWI的相关性为0.02,而在Li等人的研究中为?0.024。FAN和RLS之间观察到非常强的负相关(?0.74),这可能是由于适度的蹄角被认为对育种有利。FTP和RTP之间也观察到强烈的正相关(0.72),因为育种中更接近的前乳头通常会导致更接近的后乳头。此外,FUA和OUS(0.94)以及FUA和UDE(0.75)之间也表现出强烈的正相关,这与Němcová等人的研究结果一致。LOC和OFL(0.96)以及LOC和RLR(0.85)之间也表现出强烈的正相关。Wiggans等人建议RLR可以用于改善运动能力,因为运动能力与蹄腿评分有联系。这些发现表明,对于某些性状对,测量两种性状可能是不必要的。同一性状复合体内的性状,如OFL和RLR(0.79)、OUS和RUH(0.73)、OUS和UDE(0.92)之间表现出强烈的正相关。

健康和体型性状之间的遗传相关性范围从非常弱到弱,如Hu等人所观察到的。最强的相关性出现在CU和LOC(0.30)、DP和LOC(0.30)以及DP和HQ(0.30)之间,而最弱的相关性出现在USU和MAS(?0.002)之间。这表明在某些情况下,直接健康性状可能比体型性状更适合作为指标性状。

### 功能注释与基因集合富集分析

通过多性状元分析识别的全基因组显著变异位点随后被修剪以去除连锁不平衡,留下约420个健康性状、约3,400个与身体相关的性状、约320个与腿部相关的性状、约3,360个与乳头和乳腺相关的性状,以及约1,100个与评分相关的性状。此外,这些修剪后的全基因组显著变异位点被注释为FAETH评分,以识别那些可能提高基因组预测准确性的变异位点。最终,得到了一份全基因组显著、LD修剪且功能注释的变异位点列表,分别有128个健康性状、709个与身体相关的体型性状、73个与腿部相关的体型性状、736个与乳头和乳腺相关的体型性状,以及307个与评分相关的体型性状。这些变异位点主要位于非编码区域,但其中一些是编码变异,如rs208325660,它位于RNF214基因中,该基因是乳制品生产的一个候选基因。此外,该变异位点之前在乳糖浓度的GWAS和SCS的贝叶斯精细映射研究中被识别。

基因集合富集分析揭示了多种与健康性状相关的富集通路,包括感染性疾病和免疫系统(IFNGR2、IFNAR2、CXCL8、SEPTIN11)、细胞生长和死亡、发育和再生(IFNGR2、IFNAR2)、脂质代谢(PAFAH1B2)、内分泌和代谢疾病(CXCL8)以及消化系统(SLC4A4)等。其中,大多数基因在我们的单性状GWAS中已被识别,如BTA1上的IFNAR2、CXCL8和SEPTIN11,这些基因与蹄和蹄部疾病相关。多性状元分析还识别了BTA1上的一个大区域,该区域之前与Nellore奶牛的角性相关。在单性状GWAS中,已经识别了多个与CU、DDM和DP相关的角性位点。此外,还发现了两个新的基因(ATP5PO和IFNGR2),这些基因尚未被报道与这些性状相关。

对于乳腺相关的体型性状,富集了8条通路,涉及11个基因。其中,AMPK信号通路已知调节乳制品合成,涉及10个基因。一些基因如GYS2和PIK3R1,已被报道为乳制品生产的重要候选基因。PI3K-Akt信号通路涉及细胞生长、存活和增殖,被16个基因富集。其中,NR4A1、GYS2和PIK3R1已被报道与乳制品产量和/或成分相关。Hippo信号通路,参与细胞生长和增殖,并在调节器官大小中起核心作用,被9个基因富集。其中,MOB1B和STK3已被报道与乳制品生产相关。甲状腺激素(TH)信号通路,TH也参与泌乳调节,被7个基因富集。其中,CREB5、RASSF6和NCOA1是乳腺体型性状的已知候选基因。

对于与蹄和腿相关的体型性状,富集了18条通路,涉及10个基因。其中,Rap1信号通路参与骨吸收,相关基因包括FGF6、FGF23和PDGFB,这些基因都与骨调节过程相关。相同的基因也被识别为钙信号通路,这对骨代谢至关重要。另一个富集的通路是JAK-STAT信号通路,参与骨重塑。相关基因包括PDGFB和CCND2,后者是体型和后背相关性状的已知候选基因。其他已知的基因包括GALNT8,用于Nordic Red奶牛的蹄和腿疾病,以及VWF用于蹄角。未被CattleQTLdb报道的基因包括TAX1BP1、TIGAR、NTF3、FGF6、FGF23、PDGFB和RPS6KB1。以前的研究表明,NTF3缺陷的小鼠表现出严重的肢体运动缺陷。成纤维细胞生长因子6(FGF6)在许多物种中是保守的,对肌肉生成和肌肉再生起关键作用。

对于与身体相关的体型性状,富集了38条通路,涉及超过50个基因。这些通路通常与细胞生长和增殖相关,如Hippo、PI3K-Akt、Rap1和Ras信号通路。这些通路可能表明身体体型在牛中的整体作用。此外,还富集了与内分泌、消化和神经系统相关的通路。例如,胰腺分泌通路被SLC4A4富集,该基因是角性的已知候选基因。一些基因如CCND2在BTA5上被富集,该基因在不同牛品种的大规模元分析中被识别为体型的候选基因。胰岛素样生长因子2(IGF2)是生长和发育的关键调节因子,与PI3K-Akt信号通路、激素信号通路、MAPK信号通路和Ras信号通路相关。BMP5是牛中许多体型性状的已知候选基因,包括体深、乳用类型和体型。本研究中,该基因与Hippo信号通路和TGF-β信号通路相关。潜在的功能新基因可能包括BTA20上的FGF18,它调节多种组织的增殖,包括骨骼肌,以及BTA5上的FGF6,它对骨骼肌发育很重要。

### 讨论

多性状元分析在识别显著关联方面比单性状GWAS具有更高的功效,特别是在遗传相关性较高的性状之间。本研究的结果支持这一观点。例如,对评分相关的性状进行多性状元分析,发现的关联较少,而对身体相关的性状进行多性状元分析,发现的关联较多。这表明,多性状元分析在低遗传力性状中尤其有用,例如蹄和蹄部疾病。在之前的单性状GWAS研究中,这些性状的关联较少,尽管样本量较大。然而,多性状元分析揭示了这些性状的大量关联,这可能表明因果变异具有多效性,并且在多性状元分析中更容易被检测到。此外,一些新的基因如ATP5PO和IFNGR2在多性状元分析中被发现,而它们尚未被报道与这些性状相关。

对于乳腺相关的体型性状,发现了一些新的基因,如TAX1BP1、TIGAR、NTF3、FGF6、FGF23、PDGFB和RPS6KB1。这些基因在之前的研究中未被报道与这些性状相关。然而,一些已知的基因如GYS2、PIK3R1、NR4A1和CCND2被发现与乳制品产量和成分相关。Hippo信号通路的富集可能表明其在调节器官大小中的作用,而PI3K-Akt信号通路可能在细胞生长和增殖中起关键作用。此外,胰腺分泌通路的富集可能表明其在调节体型和乳腺性状中的作用。

### 结论

通过多性状元分析和功能注释,本研究识别了不同性状之间的共享变异位点,这些位点可以被纳入多性状基因组评估中。分析遗传参数表明,健康性状之间存在正向遗传相关性,但体型和健康性状之间的相关性主要较弱。复杂性状的遗传结构,尤其是遗传力较低的健康性状,尚未完全阐明,多性状分析可能提供新的见解。这些发现为未来的研究提供了方向,并强调了多性状元分析在育种方案中的重要性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号