用于对基因组预测结果进行降维和拆分的标量方法,以及简单回归的相关特性,这些方法将用于后续的组合预测和验证过程

《Journal of Dairy Science》:Scalar methods to deregress and split genomic predictions, and associated behavior of simple regressions, for later use in combined prediction and validations

【字体: 时间:2025年11月23日 来源:Journal of Dairy Science 4.4

编辑推荐:

  本文推导了奶牛遗传评估中分离“部分”与“整体”信息的标量去回归方法,提出四种等价的数学表达式,并验证了其可逆性。方法通过分析早期和晚期信息的可靠性差异,构建了去回归 proofs 和 equivalent record contributions,解决了现有方法中 reversibility 属性缺失的问题。案例研究表明,该方法能有效整合国内外信息并验证遗传评估的准确性,且与矩阵去回归结果一致。

  在现代畜牧业中,特别是奶牛育种领域,遗传评估和基因组评估的结合为提升遗传信息的准确性和利用国际数据提供了新的可能。然而,随着技术的进步,对这些评估方法的拆分与验证变得愈发重要。本研究通过详细分析和推导,探讨了如何将遗传评估中的“整体”信息与“部分”信息拆分为等效的去回归证明(DRP)和等效记录贡献(ERC),从而实现信息的独立利用和验证。这些方法不仅有助于进一步提高评估的准确性,也为不同来源的数据整合和验证提供了理论依据。

### 遗传评估的拆分与去回归

遗传评估通常涉及对个体的基因型和表型数据的综合分析,以生成估计的育种值(EBV)及其可靠性。然而,有时需要将评估结果拆分为多个部分,例如“早期”与“晚期”信息、“家系”与“基因组”信息,或者“国内”与“国外”信息,以便于特定用途,如加入国际数据或验证基因组评估的准确性。这种拆分过程被称为“去回归”,其核心在于通过数学推导,将遗传评估结果转化为“等效记录贡献”和“去回归证明”,以确保在重新组合时能够恢复原始的评估结果。

研究中提出的几种去回归方法,如通过选择指数、信息变化、等效记录数和去回归证明结合等,均以不同角度展示了如何实现这一拆分目标。其中,**[3]和[4]** 方法不仅能够保持评估的可逆性,还能确保在使用这些拆分后的信息时,得到与原始评估相同的EBV和可靠性。相比之下,**[7]** 方法虽然在某些情况下表现良好,但并未完全满足可逆性要求,因此在实际应用中可能需要更精确的矩阵方法。

去回归的核心思想是将遗传评估中的信息分解为独立的部分,并通过适当的权重进行组合。例如,**[5]** 方法通过对“整体”与“部分”信息之间的差异进行加权平均,生成“去回归证明”,同时通过等效记录贡献的计算,确保重新组合时能恢复原始的评估结果。这种方法不仅适用于家系模型,也适用于基因组模型,从而使得信息的拆分更加灵活和广泛。

### 去回归证明的性质

去回归证明(DRP)具有一定的数学性质,例如其值不会因添加常数而改变,这表明DRP可以独立于其他因素进行分析。此外,DRP的可靠性由“整体”和“部分”信息之间的差异决定,而其权重则通过等效记录贡献(ERC)进行计算。这些性质使得DRP在遗传评估和验证中具有独特的优势,能够有效反映遗传趋势和信息的独立性。

### 验证与权重计算

在验证基因组评估时,通常使用去回归证明与早期预测值进行回归分析,以评估是否存在偏差。研究中提出了一个更精确的权重计算方法,该方法基于等效记录贡献和可靠性之间的关系,能够更准确地反映信息的独立性。然而,目前常用的权重方法,如**Rel_diff**,在某些极端情况下可能会导致权重过大,从而影响验证结果的稳定性。

通过实际案例分析,研究发现**[4]** 和 **[7]** 方法在大多数情况下表现相似,且在实际应用中能够提供可靠的评估结果。例如,在使用**[4]** 方法时,通过拆分信息并重新组合,能够恢复原始的EBV和可靠性。而在使用**[7]** 方法时,虽然可能在某些情况下略显不足,但其在验证中表现良好,尤其是在没有矩阵方法的情况下,能够提供足够的信息独立性。

### 信息拆分的实际应用

研究通过具体案例展示了信息拆分的实际应用。例如,在奶牛的SCS(奶牛泌乳期评分)评估中,通过拆分不同时间段的数据,可以生成独立的去回归证明和等效记录贡献。这种方法不仅有助于验证评估的准确性,还能帮助分析遗传趋势的变化。在另一个案例中,通过拆分不同年份的基因组评估数据,可以生成独立的DRP和ERC,从而验证评估方法的稳定性。

### 对现有方法的比较与改进

现有的一些去回归方法,如**VanRaden and Sullivan (2010)** 提出的方法,虽然在实际应用中表现良好,但其数学推导并不完全满足可逆性要求。研究中提出的**[3]** 和 **[4]** 方法则更接近理论上的正确性,能够确保在重新组合时恢复原始的评估结果。此外,研究还指出,一些现有方法可能在某些情况下表现不佳,例如在处理高可靠性数据时,可能导致权重过大或评估结果偏差。

### 结论

本研究通过详细的数学推导和实际案例分析,展示了如何通过简单的标量方法实现遗传评估信息的拆分与验证。这些方法不仅有助于理解现有技术的原理,也为未来更精确的去回归方法提供了理论支持。尽管标量方法在某些情况下可能不如矩阵方法精确,但在实际应用中,它们仍然具有重要的价值,特别是在处理大规模数据和简化计算流程方面。通过合理使用这些方法,可以更好地利用遗传评估中的信息,提高育种效率和准确性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号