日本川崎市气象变量与流感发病率的时间序列数据集:支持环境流行病学研究的11年每日监测数据

《BMC Research Notes》:Time-series datasets of meteorological variables and influenza incidence in Kawasaki City, Japan

【字体: 时间:2025年10月28日 来源:BMC Research Notes 1.7

编辑推荐:

  本数据论文为解决气象因素对流感传播影响在病毒类型、性别和年龄等关键亚组中研究不足,以及长期每日时间序列数据稀缺的问题,研究人员整理了日本川崎市约11年(2014年3月至2025年4月)的每日流感病例(按病毒类型A/B、性别、年龄分层)和多种气象变量(温度、湿度、风速等)的时间序列数据集。该资源旨在促进应用分布式滞后非线性模型(DLNM)进行时间序列回归分析,为揭示气象因素与流感发病的短期关联、制定公共卫生政策提供重要数据支持,并助力科研与教学。

  
流感,作为一种常见的呼吸道传染病,其传播动态受到多种环境因素的影响,其中气象条件扮演着关键角色。尽管已有大量研究探讨了温度、湿度等单个气象变量对流感传播的影响,但这些影响在病毒类型(如A型或B型流感)、性别以及不同年龄人群等关键亚组中是否存在差异,相关研究仍然匮乏。此外,能够支持精细时间序列分析的长时期、高分辨率(如每日)数据资源异常有限,这限制了对气象因素与流感发病之间复杂暴露-滞后-响应关系的深入探索。为了弥补这些研究空白,一项发表在《BMC Research Notes》的数据论文应运而生,它提供了一个精心整理的宝贵数据集,旨在助力科研人员更清晰地描绘气象与流感之间的短期关联图谱。
为了构建这一研究基础,研究人员以日本神奈川县的川崎市为研究区域,系统收集了从2014年3月到2025年4月约11年间的每日时间序列数据。数据的核心来源于两大方面:首先是流感病例数据,这些数据源自川崎市传染病监测系统,该系统自2014年3月起依法要求全市所有医疗机构每日报告通过快速诊断试剂盒检测出的流感病例。在此期间,累计记录了309,759例流感病例。尤为重要的是,这些病例数据进行了多维度分层,包括按病毒类型(A型和B型)、性别(男性和女性)以及详细的年龄组(例如0-5个月、6-11个月、1岁至9岁按单一年龄分层,以及10-14岁、15-19岁、20-29岁等以10岁为间隔的年龄组)。其次是气象数据,研究人员从日本气象厅在川崎市设立的单一监测站获取了每日的气象变量,包括平均温度、最低温度、最高温度(单位:°C)、相对湿度(%)、风速(m s-1)、降雨量(mm)、日照时数(小时)以及水汽压(hPa)。此外,数据集还包含了报告日期、年、月、日等时间标识符,以便于进行时间序列分析。所有的数据管理工作均使用R软件(版本4.2.0)完成。
本研究主要基于观察性数据收集与整理,关键技术方法包括:利用日本川崎市法定传染病监测系统获取长达11年的每日分层流感发病率数据;从日本气象局单一监测站同步收集多种每日气象变量;使用R语言进行数据整合与管理,为后续应用时间序列回归模型(如分布式滞后非线性模型DLNM)分析气象暴露与流感发病的短期关联和滞后效应奠定基础。
数据描述
本研究构建的数据集涵盖了日本川崎市从2014年3月至2025年4月约11年间的每日时间序列数据。流感病例数据来源于该市的法定传染病监测系统,确保了数据的连续性和完整性。气象数据则来自当地气象监测站的权威记录。数据集不仅提供了总的流感病例数,还按病毒类型、性别和年龄进行了精细分层,这为深入分析不同亚群对气象因素的敏感性差异提供了可能。同时,包含的多种气象变量为多因素分析创造了条件。
局限性
作者也坦诚地指出了该数据集存在的几点局限性。首先,数据的地理范围仅限于川崎市,其结论的外推性(能否适用于其他城市或国家)有待验证。其次,虽然包含了多种气象变量,但缺乏空气污染物数据,如细颗粒物(PM2.5)和臭氧(O3),而这些污染物已被证明可能影响流感传播。第三,部分气象数据存在缺失(约占43.7%的观测日),这可能对时间序列分析的估计结果引入偏差。第四,气象暴露是在城市层面而非个体层面测量的,这种测量误差可能会减弱统计分析的效力。第五,数据集中的日期是病例报告日期,而非感染、发病或诊断日期,存在一定的时间滞后。最后,也是至关重要的一点,数据集的时间范围覆盖了COVID-19大流行期。在此期间,非药物干预措施(如学校停课、口罩使用)、人们行为改变、医疗系统压力等因素都可能显著影响流感的传播动态和报告强度。尽管模型中引入了年度指标以控制宏观年度变化,但许多潜在混杂因素在更精细的时间尺度上波动且未被测量,因此对于大流行期间的分析结果需谨慎解读。
综上所述,这项研究提供的数据库是一个宝贵的资源,它通过提供长期、分层、多变量的每日时间序列数据,为深入探索气象因素与流感发病之间的复杂关系,特别是在不同亚组人群中的差异,奠定了坚实的数据基础。该数据库不仅有助于研究人员应用如分布式滞后非线性模型(DLNM)等先进统计方法揭示暴露-滞后-响应关系,从而为公共卫生策略制定提供科学依据,识别脆弱人群,还能作为教学和比较研究的基准工具,推动环境流行病学在传染病领域的应用和发展。尽管存在地理局限性、缺少污染物数据以及COVID-19大流行带来的混杂等挑战,但这一精心整理的数据库无疑将显著促进对气象条件如何影响流感传播的科学理解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号