基于仿真的推断方法在近亲标记-重捕研究中的应用:对小种群和非随机交配现象的启示

【字体: 时间:2025年11月26日 来源:Environmetrics 1.7

编辑推荐:

  小型种群中近亲标记重捕法(CKMR)的近似贝叶斯计算(ABC)应用及性能分析。通过模拟研究,比较了伪似然方法与ABC在单样本、多年度及非随机交配结构下的表现,发现ABC在提高区间覆盖精度和模型适应性方面具有优势,但可能导致种群数量估计的偏差。以加拿大驯鹿数据为例验证了ABC方法的有效性,并讨论了其在野生动物管理中的应用潜力。

  
近亲标记重捕法(Close-kin Mark-Recapture, CKMR)作为估计野生动物种群数量和生存率的重要工具,近年来在渔业、哺乳动物及鱼类保护中应用广泛。然而,传统方法多依赖伪似然模型,这在小型种群或复杂繁殖结构中存在显著局限性。本研究通过系列模拟实验和实际数据验证,提出基于近似贝叶斯计算(Approximate Bayesian Computation, ABC)的模拟方法,旨在解决传统CKMR在小型种群中的低效问题,并探索多参数联合估计的可能性。

### 一、研究背景与问题提出
传统CKMR方法通过计算个体间的亲缘关系频率(如母子对、半同胞对)来推断种群规模。其核心假设是亲缘关系匹配服从二项分布,即每个可能的亲缘配对独立发生。然而,这一假设在小型种群中面临两大挑战:一是种群规模有限导致样本间依赖性增强,二是非随机繁殖结构(如单配制)产生的全同胞-全同胞配对(Full Thiatic Pairs, FTPs)难以与半同胞配对(Half-Sibling Pairs, HSPs)区分。传统伪似然方法在处理这些复杂情况时,常导致估计偏差和置信区间覆盖不足。

### 二、研究方法与创新点
#### 1. 模拟方法设计
研究通过三个层次递进的模拟实验,系统评估不同方法的性能:
- **单次采样场景**:模拟固定繁殖率(每雌产1或2仔)的小型封闭种群,比较超几何分布、Chapman校正和ABC方法。
- **多年度趋势分析**:构建年龄结构 Leslie 矩阵模型,模拟包含生存率( juvenile:0.8, adult:0.85)和繁殖率(成年雌性平均4仔/年)的动态种群,评估多参数联合估计的可行性。
- **单配制繁殖结构**:以北美驯鹿为模型,模拟包含全同胞-全同胞配对(FTP)和半同胞配对(HSPs)的复杂亲缘关系网络,验证ABC方法在非随机繁殖结构中的适用性。

#### 2. ABC方法改进
针对传统ABC方法的局限性,提出三种算法优化:
- **精确拒绝法(ABC-exact)**:严格匹配观测到的亲缘配对数量,适用于单参数场景。
- **分位数拒绝法(ABC-quant05)**:保留与观测值最接近的5%样本,通过核密度估计计算后验分布。
- **局部线性回归法(ABC-quant05-reg)**:在分位数拒绝法基础上,利用观测数据与模拟数据的线性回归关系调整后验分布,提升估计精度。

#### 3. 性能评估指标
- **相对偏差(RelBias)**:估计值与真实值的百分比差异。
- **置信区间覆盖度(Cover90)**:90%置信区间包含真实值的比例。
- **均方根误差(RMSE)**:衡量估计值与真实值的离散程度。

### 三、模拟实验结果分析
#### 1. 单次采样场景
- **超几何模型**:在理想情况下(每雌1仔,无死亡),MLE估计存在轻微负偏差(1%),但Chapman校正后偏差消除。
- **伪似然方法**:二项分布模型在每雌2仔场景下偏差达4%,置信区间偏宽30%-50%。
- **ABC方法**:ABC-exact后验分布与超几何模型高度吻合(覆盖度92%),而ABC-quant05通过扩大拒绝阈值(如允许±5%偏差),将覆盖度提升至88%,但估计方差增加15%-20%。引入局部线性回归后,RMSE降低至原方法的1/3。

#### 2. 多年度趋势分析
- **种群增长率(Lambda)**:ABC方法(尤其神经网络模型)覆盖度达89%,显著优于伪似然方法(78%)。
- **成年雌性数量(N_breed)**:传统方法(Chapman)在稳定种群中表现优异,但ABC方法在波动种群中偏差降低至2%,置信区间更接近真实值。

#### 3. 单配制繁殖结构
- **全同胞-全同胞配对(FTP)**:传统方法因无法区分FTP与HSPs导致估计偏保守(低估10%-15%),而ABC方法通过模拟繁殖配对网络,将FTP识别准确率提升至92%。
- **存活率估计**:ABC后验中,幼年存活率(σ_juv)与成年存活率(σ_adult)呈负相关,反映小型种群中资源竞争导致的生存权衡。

### 四、实际案例验证——加拿大驯鹿种群
#### 1. 数据来源
- **采样方案**:冬季采集粪便样本,检测母子关系(2006-2015年,每年20份样本)。
- **传统方法**:Merriell等(2024)采用伪似然方法,得到雌性数量范围:200-350(95% CI),而同期CMR方法(捕获重捕)估计为180-260。

#### 2. ABC方法应用
- **参数设置**:初始种群规模(N0)范围100-500,幼年存活率(σ_juv)0.6-0.95,采用动态 Leslie 矩阵模拟种群结构。
- **结果对比**:
- **种群规模**:ABC后验中位数(280)与CMR(260)接近,但伪似然方法高估30%(355)。
- **趋势分析**:ABC模型显示种群在2010年后显著下降(λ=0.92 vs 0.98),而伪似然方法因忽略死亡事件,低估下降趋势(λ=0.95 vs 0.92)。

#### 3. 方法局限性
- **模型依赖性**:若真实繁殖率与模拟值偏差>20%,ABC方法估计标准差扩大40%。
- **计算成本**:单次ABC模拟需24,000次IBM迭代,耗时约8小时(使用12核CPU)。

### 五、理论贡献与实践启示
#### 1. 方法论创新
- **混合似然框架**:将传统伪似然(二项分布)与ABC结合,允许同时估计亲缘概率和生存率。
- **动态后验调整**:通过核密度回归,自动校正因模型简化导致的偏差。

#### 2. 应用建议
- **小型种群**:优先选择ABC方法,特别当存在单配制繁殖时,建议结合核苷酸多样性分析区分FTP与HSPs。
- **多年度数据**:ABC可同时估计种群增长率和存活率,误差较传统方法降低50%-70%。
- **计算优化**:采用GPU加速(如Fagard-Jenkin等,2024),将模拟速度提升100倍以上。

#### 3. 潜在改进方向
- **自适应先验**:根据数据量动态调整先验范围,减少人为设定偏差。
- **时空异质性建模**:引入空间结构(如亲缘关系地理聚类)和时变参数(如气候变化影响生存率)。
- **贝叶斯优化**:替代固定分位数阈值,自动选择最优拒绝概率。

### 六、讨论与展望
#### 1. 方法适用性
ABC方法在以下场景表现优异:
- 样本量受限(如渔获物DNA检测)。
- 存在复杂亲缘关系(如单配制动物)。
- 需联合估计多个参数(如种群趋势+存活率)。

#### 2. 潜在风险
- **过度拟合**:若先验设定过窄(如N0<100),ABC可能陷入局部极值。
- **计算不可行性**:多参数联合估计(如同时建模5种亲缘类型和3种生存率)需百万级模拟次数。

#### 3. 应用前景
- **濒危物种保护**:结合卫星追踪数据,实时评估种群恢复进度。
- **渔业管理**:处理多年度渔业数据中的混配问题。
- **疾病监测**:利用亲缘关系追踪疾病传播路径。

### 七、结论
本研究证实ABC方法在小型种群中具有显著优势:
1. **估计精度**:ABC后验中位数与真实值偏差<3%,优于伪似然方法的10%-15%。
2. **置信区间**:ABC的90%置信区间覆盖度达85%-95%,传统方法仅60%-75%。
3. **模型扩展性**:支持非随机繁殖、年龄结构异质性和多参数联合估计。

建议研究者根据数据特点选择方法:
- **单次采样、简单繁殖结构**:使用Chapman校正的伪似然方法。
- **多年度数据、复杂亲缘关系**:采用ABC方法,并优先验证模型假设(如存活率稳定性)。

未来研究可结合深度学习(如Transformer模型)优化多参数后验估计,或开发基于变分推断的加速算法。此外,探索ABC与最大似然方法的混合框架,或能进一步提升小样本场景下的估计效率。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号