越南湄公河三角洲地区登革热预测与控制:一种创新的区级集成模型方法
【字体:
大
中
小
】
时间:2025年10月01日
来源:PLOS Pathogens 4.9
编辑推荐:
本研究开发了一种区级集成模型,通过整合气象、社会人口学、预防和流行病学数据,实现了对越南湄公河三角洲地区登革热发病率和暴发的1–3个月提前预测。该模型采用概率预测方法,结合时空模型、监督PCA和半机械hhh4框架,显著提升了预测准确性(评估期3个月预测准确率达69%),为地方公共卫生系统提供了关键预警时间,支持资源分配、干预规划和社区参与,有效应对城市化、全球化和气候变化带来的登革热暴发风险。
登革热是一种由埃及伊蚊和白纹伊蚊传播的虫媒病毒性疾病,已成为全球公共卫生的重大威胁,尤其在热带和亚热带地区流行。目前,登革热在超过125个国家呈地方性流行,其全球发病率在2000至2019年间增长了十倍,报告病例数超过500万,2023年达到650万例。2024年前九个月,全球经历了前所未有的登革热激增,报告病例超过1300万。由于检测模式的限制,登革热的实际报告率可能被低估,据估计2021年全球实际病例数达到5900万。登革热的全球传播主要受城市化、全球化带来的人口流动性增加以及气候变化的影响。2013年,登革热的全球经济成本估计为89亿美元。
大多数登革热病例表现为亚临床或非特异性发热性疾病,伴有流感样症状,但2–5%的有症状病例会进展为重症登革热,这是一种危及生命的疾病,伴随出血和休克。治疗以支持性为主,包括根据病情严重程度进行口服或液体替代治疗。历史上,媒介控制和防止蚊虫叮咬是登革热预防和控制的主要方法。新型媒介控制方法,包括释放不育、转基因或沃尔巴克氏体感染蚊虫,已被开发但尚未广泛应用。三种不同的四价减毒病毒疫苗,针对登革热的四种血清型,已在随机对照试验中显示出效力,其中两种已获得许可,但由于多种挑战,疫苗尚未被广泛使用。
越南是登革热的高发国家,尽管其年发病率往往呈周期性变化。2023年,越南报告的登革热病例数为36.9万,位居全球第二,而根据漏报调整后的2021年实际病例数估计为110万。越南的湄公河三角洲地区(Mekong Delta Region, MDR)受影响尤为严重,2000–2016年间,越南40–50%的报告病例发生在该地区。越南登革热发病的驱动因素包括城市化、环境温度和水文气象变量。2013年,登革热在越南的经济成本估计为9400万美元。越南当前的登革热预防和控制策略,如卫生部2014年9月19日第3711/QD-BYT号决定所述,主要依赖于媒介控制,例如昆虫学监测、社区动员消除孳生地和杀虫剂喷洒。然而,这些干预措施往往是反应性的,仅在病例报告后实施,可能为时已晚,无法预先减轻登革热暴发的影响。
大量研究致力于开发预测登革热发病率和暴发的模型,这些模型可用于建立早期预警系统,以实现主动干预。研究人员最近开发了一种概率登革热模型集成,用于在越南的省级(最大地理和行政单位)提前1–6个月预测登革热发病率。尽管该方法为改进登革热监测和规划预防性干预提供了宝贵工具,但其关键局限性在于预测是在省级进行的,这可能不足以支持地方行动。在越南,登革热预防和控制措施是在区级实施的,MDR的一个典型省份包含7至15个区,因此有必要改进模型,以提供更符合登革热控制计划行政和操作现实的区级预测。
本研究旨在评估一系列互补的概率模型在MDR区级预测登革热发病率1–3个月提前期的性能,整合了气象、流行病学、社会人口学和预防干预数据。为了增强预测的准确性和稳健性,我们将五个模型集成到一个集成模型中。在未来的工作中,我们计划将集成模型纳入用户友好的软件中,用于早期预警系统,协助各区主动实施干预措施以减轻登革热暴发。
我们的研究呈现了三个新颖之处:首先,我们为112个区生成概率预测,与越南卫生部实施媒介控制措施的操作规模一致;其次,通过将表现最佳的层次模型、半机械(hhh4)模型和监督PCA模型结合成集成模型,我们在不同的气候和人口背景下实现了更高的准确性和校准;第三,我们的区级1–3个月提前期预测可用于随机化主动干预试验(例如,仅在高风险区进行有针对性的幼虫控制或社区教育),从而改善资源分配并在真实世界条件下评估干预措施的效果。这项工作可以使越南的登革热预防工作更加主动。
这些分析的目标是生成和评估区级登革热病例和暴发的概率预测,提前1–3个月,并将这些模型中最好的部分组合成一个集成模型。我们评估了三种不同的建模方法——层次时空贝叶斯模型、半机械时空(hhh4)模型和机器学习监督主成分分析回归——每种方法都使用了不同的变量集。数据分为三个时期:初始集涵盖2004–2011年,2012–2016年用于时间序列交叉验证,2017–2022年用于评估集成模型的样本外性能。
使用滚动方案,整个2004–2016数据集参与交叉验证:2004–2011形成初始窗口,从2012年1月起,我们每月逐步扩大训练集,始终保留接下来的三个月进行测试。模型仅拟合到指定日期(例如2012年1月)的数据,一旦拟合,它进行三个预测:提前一个月(2012年2月)、提前两个月(2012年3月)和提前三个月(2012年4月)。我们将每个预测与实际值进行比较,并记录CRPS、偏差和扩散度。接下来,我们将拟合窗口扩展到2004年1月至2012年2月,并保留2012年3月至5月进行测试。我们再次拟合,预测这三个月。从2012年1月到2016年12月每月重复此过程,使我们能够使用2004–2016的完整记录。这种滚动方法模拟了实时预测,并为2012–2016年的每个月提供了样本外评估。
我们从越南卫生部获得了MDR每个区(n=134)的详细月度登革热数据,涵盖2004年9月至2022年12月。登革热病例通过电子传染病系统在24小时内报告,记录为疑似或确诊。通过将报告数据与医院记录进行比较来维持监测质量。大多数病例为疑似,通过诊断测试确认的有限。
研究期间行政区划发生了变化,最近一次调整在2015年。为保持一致性,研究期间发生边界变化的区被合并,数据集减少到114个区。两个没有相邻边界的区被排除,最终分析了112个区。
气象数据来自两个数据集:ERA5-Land再分析数据库和地面气象站。这些数据集分别作为预测模型的输入。
ERA5-Land再分析数据集由欧洲中期天气预报中心开发,提供高分辨率(约10公里)的全球覆盖,专门针对陆地气象和水文数据,特别适用于地形和气候多变的地区。收集了2004年9月至2022年12月的日最低、最高和平均温度、相对湿度和累积降雨量。为确保兼容性,ERA5-Land数据被裁剪以与MDR每个区的行政边界对齐。对于较小或边界未完全重叠ERA5网格单元的区,应用最近邻插值,将最近的ERA5网格单元值分配给这些区。
地面数据包括MDR及周边的18个气象站。这些数据来自越南气象水文局,记录日最低、最高和平均温度、相对湿度和累积降雨量。由于气象站数量相对区级需求有限,应用克里金插值来估计区特定气候条件。克里金是一种地统计技术,广泛用于气候科学,通过考虑气候变量的空间相关性来预测未采样位置的值。该方法使用半变异函数模拟空间方差和相关性,产生准确的预测和不确定性度量,特别适用于数据稀疏的地区。
因此,为每个区生成了两个独立的气象数据集(即再分析和气象站),包括每个感兴趣变量的每日时间序列。作为登革热预测模型中的协变量,日温度和湿度数据被聚合为月平均值,降雨数据被聚合为月累积值。
我们从两个来源(ERA5和当地气象站)获取气象变量,并测试了每个模型的性能。由于这两个来源提供了相似的结果,我们在论文中报告了ERA5的结果,因为它更简单且易于访问。
其他数据,包括社会人口因素(例如城市化、人口密度)和预防措施/昆虫学指数(例如喷洒、孳生地消除运动、培训、布雷图指数),经过测试但未显著增强预测性能,因此被排除在最终模型之外。这些变量的进一步解释可在S1文本的表A和B中找到。
在我们的研究中,我们首先检查了所有候选预测变量之间的关系,然后决定包含哪些变量。基于生物学和流行病学证据以及当地专家的咨询,我们选择了气象变量(温度、湿度、降水)、社会人口变量(人口密度、城市化)和昆虫学/预防措施变量(布雷图指数、幼虫计数),因为每个变量已知会影响登革热传播。然后,我们遵循“集成”策略,测试了每一个符合我们共线性标准的协变量组合。在2012–2016交叉验证期间,这意味着拟合72个不同的模型,每个模型具有不同的气象、社会人口、昆虫学和滞后病例预测变量组合。未提高预测性能的协变量未包含在我们最终集成的前五个模型中。例如,尽管我们最初考虑了城市化率、人口密度、布雷图指数和主动喷洒计数,但这些变量均未进入我们的前五个模型。由于每个子集都是独立测试的, consistently出现在高排名模型中的预测变量可以被认为对预测准确性更重要。
当考虑在模型中一起测试的变量集时,我们计算了月度数据上每对候选协变量的Spearman等级相关性。几乎所有 pairwise相关性都低于0.70,但少数超过0.80:平均风速与最大风速(ρ≈0.98)、平均与最小(ρ≈0.98)、最大与最小(ρ≈0.95);平均湿度与最小湿度(ρ≈0.95);降水与湿度(ρ≈0.85)。因此,我们排除了每对中ρ>0.80的一个变量。结果,被排除的风速或湿度度量,以及最高或最低温度,均未出现在我们表现最佳的模型中。
为登革热定义流行阈值并不简单,关于设定阈值的适当方法几乎没有共识。因此,我们评估了几种可能的暴发定义。
- 1.平均值+2标准差:使用每个区前五年同月的平均值和标准差计算。如果在此期间发生暴发,则排除,并使用更早年份的数据以提高阈值敏感性。病例数高于此阈值的月份被认为发生暴发。
- 2.95th百分位数使用所有可用年份同月和同区的数据确定95%阈值。病例数高于此阈值的月份被认为发生暴发。
- 3.Poisson:一个具有Poisson似然的广义线性模型基于每个区的月度数据预测流行。模型的模拟考虑了参数不确定性和观测不确定性,这些模拟的97.5th百分位数作为流行阈值。观测病例高于此阈值的月份信号暴发。
- 4.基于发病率的固定阈值:月阈值设定在固定水平:20、50、100、150、200或300例/10万人口。
- 1.层次贝叶斯时空模型。这些模型测试了不同协变量的滞后,包括气象变量(例如温度、降水)、社会人口变量(例如城市化、收入)和预防措施/昆虫学指数(例如主动喷洒、通讯或培训、布雷图指数)。模型还包括1–3个滞后观测月登革热病例和具有不同结构的时空随机效应,以解释不同的相关性来源并确保准确的统计推断(即,自回归相关项在各区独立建模、空间随机效应、时空随机效应)。这项工作建立在Colón-González为越南省级月度数据开发的方法之上,有一些简化。首先,我们使用了气象变量和观测月登革热病例变量,滞后最大预测视野量(例如,对于预测最多未来3个月的模型,观测病例和气象变量的最小滞后为3个月)——这避免了在模型中递归使用气象变量预测的需要。协变量和随机效应结构有许多可能的组合,导致评估了60个模型。为确保彻底探索潜在协变量,我们为不同的协变量集测试了至少每个协变量类型(气象、社会人口、预防措施/昆虫学指标、月登革热病例)的一个代表性协变量。为解决某些变量之间的高相关性,我们避免了在同一模型中包含高度相关的变量。
- 2.hhh4模型。这些半机械时空模型解释了基线发病率、自相关和空间传播的变化。这三个组成部分中的每一个都作为协变量的函数建模。地方性和流行性组成部分使用3个月滞后的温度、降水和累积发病率作为协变量。空间传播组成部分假设相邻区之间的相关性遵循幂律结构。每个组成部分使用随机效应建模,允许效应按区变化。这些模型使用R中surveillance包的hhh4函数拟合。
- 3.监督(“Y-aware”)主成分回归,将每个区月登革热病例的时间序列建模为所有区滞后(用主成分概括)的函数,以及季节性和同区气象变量的滞后。生成一个滞后、标准化对数发病率的矩阵,包括所有区3-5个月的滞后。我们首先为每个协变量拟合单变量回归,并根据效应估计缩放变量;这有效地为与结果更相关的变量提供了更多权重。然后我们使用这些重新缩放的协变量进行主成分分析(PCA)。基于方差图,前10个主成分用于回归模型,以及调和项以捕捉季节性、自回归相关随机截距和滞后温度与降雨。这些模型使用R中的INLA包为每个区单独拟合。
考虑不同的协变量组合和随机效应结构,使用时间序列交叉验证评估了72个模型的性能,包括60个层次贝叶斯时空模型、9个hhh4模型和3个PCA模型,跨越60个预测期(即月)从2012年1月至2016年12月。
这72个模型中的每一个都通过时间序列交叉验证进行评估,通过每月向前移动训练期结束时间。应用几种预测性能度量来评估1–3个月预测视野的预测性能。使用连续排名概率评分(CRPS)、偏差和扩散度来评估登革热发病率预测的准确性,使用Brier评分来评估登革热暴发预测的准确性。CRPS越低,预测越准确,值为0表示完美预测;CRPS没有上限。偏差值范围从-1到1,得分为零反映无偏差。Brier评分范围从0到1,较低值表示更准确的暴发分类。我们评估了在其他三个指标上表现最佳的前五个模型的扩散度(即预测分布的宽度)。扩散度得分接近0是可取的,表明分布狭窄(即尖锐),预测较差则具有较高的扩散度得分。我们使用R中的scoringutils包计算这四个指标。
基于使用此时间序列交叉验证方法的模型性能,我们将最佳模型的一个子集组合成集成预测。模型选择基于三个标准。首先,我们评估了模型按区表现的情况,并使用层次聚类来识别在区之间表现相似的模型集。我们确保集成中包含每个这些聚类的至少一个代表。这种聚类方法确保每种“类型”的模型只有一个代表,防止集成中的不平衡。其次,如果多个模型在CRPS方面表现相似,我们偏好具有较少协变量和更简单随机效应结构的模型。最后,为包含建模方法的多样性,我们确保来自三种方法(贝叶斯时空、hhh4、PCA)的至少一个模型。此过程导致五个模型被纳入最终集成。五个模型的权重基于CRPS得分确定,并在时间和区之间保持恒定。
为创建集成模型,我们首先生成来自最终集成中五个模型每个的预测登革热病例分布的10,000个样本。然后我们通过比较样本预测与观测登革热病例计算时间序列交叉验证期间五个模型每个的CRPS。接下来,我们使用(1/CRPS2)/sum(1/CRPS2)确定每个模型的权重。然后从五个个体模型每个的预测分布中取样,取样比例与权重成比例。计算所得分布的2.5th、50th和97.5th百分位数。
开发了一个基本参考模型来估计每个区的平均月登革热发病率,没有协变量、滞后发病率或时空相关性。让Y_{i,t}表示区i在时间t的登革热病例,其中i=1,...,N是区的总数,t=1,...,T是时间步长(月)。模型假设观测病例的Poisson似然,并定义为:
Y{i,t} \sim \text{Poisson}(\lambda{i,t})
\log(\lambda{i,t}) = \log(P{i,y}) + \alpha + u_i + v_t + w_{m(t)}
P{i,y}是区i在年y的人口,作为偏移量包含以按人口调整病例数。模型包含全局截距\alpha,u_i假设不同区的月平均病例数是随机且不相关的。此外,模型包括w{m(t)}日历月的循环随机游走,以确保捕捉季节性趋势,同时允许这些趋势按区变化。根据早期研究,我们使用连续排名概率技能评分(CRPSS)来量化模型预测性能相对于此参考模型的改进。它定义为
\text{CRPSS} = 1 - \frac{\text{CRPS}{\text{model}}}{\text{CRPS}{\text{ref}}}
正CRPSS表示性能优于参考,CRPSS为1表示完美模型。CRPSS接近零表示无改进,负CRPSS表示模型表现不如参考。
分析中使用的所有代码均用R版本4.2.2编写,可在Github.com/e-dengue/dengue_District_HPC获取。
MDR在温度、湿度和降水方面表现出显著的季节性,旱季从12月到4月,雨季从5月到11月。2004年至2022年间,MDR报告了648,219例登革热病例。发病率具有季节性,最高率出现在6月至11月的雨季。发病率在各年之间差异很大,从2007年的45,384例高点到2014年的5,866例低点。Tan An是年平均发病率最高的区,为472例/10万人口,而Go Quao年平均发病率最低,为54例/10万人口。登革热病例的最大数量记录于2022年8月(n=7572),而最小数量记录于2021年12月(n=286)。
我们获得了每个区的每日气象数据,包括平均温度、相对湿度、风速和总降水,以及2004年至2022年的登革热病例数,确认没有缺失月份。气象数据表现出精确的季节性节律,年中雨季的急剧降雨峰值,温和的温度和湿度波动,以及可预测的风速周期,这些都反映了登革热病例的坚定季节性峰值。高登革热病例数与降雨量一致,突出了局部异质性。这一基础探索确认了数据完整性和季节性,验证了我们使用这些协变量而不需要插值。
我们总共测试了72个模型,代表了广泛的模型结构和协变量。我们开发了一个集成模型,包含了五个表现最佳的个体模型,包括三个层次贝叶斯时空模型、一个hhh4模型和一个PCA模型。集成模型表现出比任何72个个体模型更低的CRPS(3.2),表明与任何个体模型相比概率预测更准确。在72个个体模型中,时空模型3和时空模型2表现出最低的CRPS,值分别为3.38和3.99。相比之下,季节性参考模型具有最高的CRPS 12.2,与所有72个个体模型相比,反映了最低的预测准确性。在集成中包含的五个模型中,hhh4模型显示出最低的偏差0.13,其次是时空模型3,偏差为0.23。尽管集成模型与基线模型相比具有更低的偏差,但其偏差度量并未优于其五个组成个体模型。
所有模型的性能往往随着预测视野从1个月增加到3个月而下降,CRPSS减少且扩散度随着提前时间增加而增加,尽管偏差在时间视野之间往往一致。集成模型预测性能随着时间视野增加而下降的趋势进一步说明,该图显示了集成预测均值及其95%预测区间与观测登革热病例的比较。例如,在2012年登革热波期间,提前3个月的预测(蓝实线)低估了暴发的规模,而当我们接近实际日期(提前2个月和1个月预测)时,预测变得更加准确,提前1个月的预测(橙实线)最接近跟踪观测病例且不确定性区间变窄。尽管如此,尽管提前3个月的预测准确性较低,这些长期预测在暴发实际发生之前很早就提供了病例上升的早期指示,使公共卫生官员有时间准备。例如,对于2012年6月至9月期间,提前3个月的预测在暴发完全发生之前就开始显示登革热病例的上升趋势。五个模型每个的预测空间分布以及观测病例可以在S2文本的图A-E中找到。
使用Brier评分评估了集成模型分类暴发和非暴发时期的能力,并使用了四种不同的暴发阈值定义——平均值+2标准差、95th百分位数、Poisson阈值和基于发病率的固定阈值,如方法中所述。每个阈值都涉及权衡,选择使用哪个应与监测系统的计划目标一致。例如,高固定阈值将具有低敏感性,意味着检测到的暴发更少。然而,这也减少了假阳性的可能性。使用设置在50例/10万人口的严格暴发阈值实现了最高分类准确性,其次是95th百分位数阈值,然后是平均值加两个标准差阈值。准确性在夏季月份病例数较高时通常更高。基于平均值+2标准差阈值过去五年(排除高流行年)的暴发与概率集成模型预测的空间比较图可以在S2文本的图F-I中找到。
除了使用Brier评分,集成模型分类暴发的准确性可以通过比较暴发的预测概率与不同预测概率区间内暴发的频率来评估。如果点沿对角线对齐,这表明模型校准良好。通常,模型在较低预测概率下低估了暴发风险,而在较高预测概率下高估了风险。准确性因使用的阈值而异,固定阈值通常显示更好的校准。
为探索地理异质性准确性,我们计算了每个区在我们主要暴发阈值模型(平均值+2标准差)下的Brier评分,并绘制了这些值。区级Brier评分范围从约0.05到0.22。西南区,特别是沿柬埔寨边境的区(例如An Giang、Kien Giang)表现出较高的Brier值(0.15–0.22),表明暴发预测准确性较低。相比之下,中央三角洲区如Hau Giang和Vinh Long往往具有较低的Brier评分(<0.08),表明这些地区的预测更可靠。少数沿海区(例如Bac Lieu、Soc Trang)显示中间Brier值(0.10–0.15)。Brier评分的空间模式表明局部因素可能影响预测准确性。西南边境地区较高的Brier评分可能源于更大的环境异质性(例如波动的降雨模式和跨境人员流动),以及病例报告的可变完整性。相反,中央省份较低的Brier评分可能反映了更稳定的气候条件和更一致的监测系统。此外,按区或按月加权CRPS并未改善结果。
我们评估了集成模型及其五个个体模型组件和基线模型在2017–2022样本外评估期间的性能。我们发现分类准确性(较高的Brier评分)低于交叉验证期间,但对于1、2和3个月视野仍然具有合理的准确性。模型在所有指标上的相对性能与交叉验证期间所见相似,集成模型获得最低的Brier评分。作为集成模型样本外预测性能的一个例子,图F显示模型捕捉了整体季节性动态;然而,2019年和2022年存在明显的错位。
2022年,在COVID-19后恢复阶段,集成模型难以准确预测登革热暴发。如Fig 6所见,2022年某些时期观测病例的急剧增加与模型的预测不匹配,或者模型预测仅与观测病例同步增加。由于这些错位,预测流行的准确性受到损害,在不同阈值和年份之间观察到显著变化。例如,整体准确性在各年之间波动很大,2017年(77%)和2018年(73%)达到最高性能,随后2019年下降(65%)。尽管2020年(72%)和2021年(71%)略有恢复,但2022年准确性再次下降(56%)。这些不一致突出了在平衡暴发检测和最小化误报方面的持续挑战,特别是在将模型应用于具有不同暴发动态的 distinct年份组时。
在这项研究中,我们证明了概率模型集成可以预测登革热暴发,提前1–3个月,特别是在越南MDR地区的区级。通过组合个体时空、半机械(hhh4)和监督PCA模型,我们的集成优于个体模型。集成模型的优势在于其能够整合集成中包含的五个个体模型的关键特征,例如通过自回归相关的时间平滑、区级随机效应、气象因素(即温度和降水)以及来自不同时期的滞后病例。生成概率预测的能力可以增强决策,用于主动的公共卫生干预,为有针对性的登革热控制措施提供及时的早期预警。
贝叶斯时空模型和hhh4框架已经代表了成熟的时间序列预测方法。贝叶斯时空模型在流行病学概率预测方面有着悠久的历史,并且它们反复证明了自己在传染病计数方面的价值。我们专注于这些流行病学基础的概率方法,包括滞后发病率和基于PCA的模型,因为它们产生完整的预测分布。此外,我们的集成在每个预测期、区和视野上 consistently提供强大可靠的性能。虽然单个模型可能在少数区月组合中表现优于其他模型,但没有一个模型在所有60个预测、112个区和三个提前期中始终保持领先。通过根据准确性对每个模型进行加权(给予较低CRPS的模型更多权重),集成平衡了互补优势:一些模型在正常季节提供更准确的短期预测,其他模型更好地应对异常降雨,或捕捉相邻区域之间的空间联系。在样本外测试(2017–2022)中,集成的95%预测区间 consistently比任何个体组件更窄且校准更好,导致更少的误报和漏报暴发,符合卫生团队在资源有限时的需求。即使在具有非典型季节性或COVID-19后报告变化的年份,集成仍然是最稳健的早期预警工具,平滑了导致单个模型失败的 under-或 over-predictions。
最近的登革热预测工作采用了各种方法,从单模型方法(如ARIMA和机械SIR模型)到省级的机器学习和超级集成框架,但往往缺乏概率不确定性量化和可接受的空间分辨率。例如,Colón-González等人构建了一个季节性模型的超级集成来预测越南省级登革热,实现了相对于参考模型的适度CRPSS增益,但未建模区级数据。Shi及其同事在新加坡使用提前三个月的时间序列模型支持早期预警,证明了实时预测的效用,同时也报告了在扩展到更细行政单位时更宽的预测区间。相比之下,我们的区级集成独特地结合了贝叶斯时空、半机械和监督PCA方法,产生中位数CRPS为3.2,显著低于省级研究中通常看到的超过4的CRPS,并且 consistently更窄、更好校准的95%预测区间。通过整合互补优势(局部自回归、空间平滑、滞后协变量)和按CRPS加权模型,我们既提高了概率准确性,又将预测与部署公共卫生行动的规模对齐。此外,我们包含了残差与拟合(后验均值)的图。所有集成模型表现出围绕零的残差聚类,表明预测是无偏的。
集成模型的性能因地理位置、预测视野和一年中的月份而异。我们的分析证明了模型在预测
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号