全国性过敏原芯片挑战:开放数据库驱动机器学习预测过敏性疾病新纪元
【字体:
大
中
小
】
时间:2025年09月30日
来源:Journal of Allergy and Clinical Immunology 11.2
编辑推荐:
本研究针对过敏原芯片技术临床解读难题,构建了覆盖11家法国大学医院、含4271例患者70万条特异性IgE数据的全国性开放数据库。通过国际机器学习竞赛开发出F-score达0.786的过敏预测算法,为过敏原芯片的数据驱动解读提供了可扩展框架。
在过敏性疾病精准医疗快速发展的今天,过敏原芯片技术(Allergen chip)作为革命性的检测手段,能够同时分析数百种过敏原,为患者绘制出全面的致敏(sensitization)图谱。然而,这种高通量技术产生的海量数据需要深厚的专业知识和经验才能转化为临床有用的结论,成为限制其广泛应用的主要瓶颈。面对这一挑战,由法国波尔多大学医院免疫学与免疫遗传学实验室Guillaume Martinroche、Amir Guemari等领衔的研究团队开展了一项开创性研究,成功构建了全国性的开放过敏数据库,并借助机器学习(ML)技术开发出高效的过敏预测算法,相关成果发表在《Journal of Allergy and Clinical Immunology》上。
为了推动机器学习在过敏原芯片临床解读中的应用,研究团队实施了一项规模宏大的回顾性研究。他们首先通过项目联盟确定了20个临床变量和5个人口统计学因素,随后从法国11家大学医院收集了2014年至2023年间的过敏原芯片IgE数据及相关信息。经过系统处理,数据集标注了确诊的过敏情况、严重程度分级以及与芯片数据相关的致敏原识别信息。这个精心构建的数据集随后被提交到国际 crowdsourced机器学习竞赛中,吸引了全球292名数据科学家参与,共提交了3,135种算法方案。
研究团队收集了4,271名患者的数据,构建了一个包含超过70万个特异性IgE数据点的庞大数据库。分析显示,3,579名患者(84%)存在致敏现象,其中2,236人(53%)被确诊患有过敏性疾病,1,076人被排除过敏诊断,其余959人缺乏明确的过敏诊断标签。机器学习竞赛产生了令人瞩目的成果,最佳算法的F分数达到了0.780至0.786的高水平。竞赛结束后,该数据库作为开源资源向科学界公开,为后续研究提供了宝贵资源。
研究采用多中心回顾性数据收集方法,整合11家法国大学医院的临床资源。关键技术包括:过敏原芯片技术进行高通量特异性IgE检测;机器学习算法开发通过国际 crowdsourced竞赛平台实施;数据标准化处理确保多中心数据的一致性;临床变量与实验室数据的系统整合方法。
过敏原芯片技术虽然能提供全面的致敏信息,但其临床转化需要专业解读能力,这在日常实践中存在显著困难。
研究旨在通过建立全国性开放的过敏原芯片数据库,结合人口统计学和临床信息,并利用国际 crowdsourced机器学习竞赛开发预测性过敏分类算法。
项目联盟定义了20个临床变量和5个人口统计学因素,回顾性收集了11家法国大学医院2014-2023年间的过敏原芯片IgE数据。数据集经过处理,标注了确诊过敏、严重程度分级和致敏原识别信息,随后提交至数据挑战赛。
研究共收集4,271名患者数据,包含超过70万条特异性IgE数据点。3,579名患者(84%)存在致敏,2,236人(53%)确诊过敏,1,076人排除过敏诊断。机器学习竞赛吸引292名数据科学家,提交3,135种算法,最高F分数达0.780-0.786。数据库随后开源共享。
研究成功建立了全国性开放过敏数据库,支持预测算法开发。这种可扩展的框架整合了临床数据与机器学习技术,为过敏学家数据驱动地使用和解读过敏原芯片铺平了道路。
这项研究的真正价值在于它构建了一个可持续扩展的框架,将临床数据与先进机器学习技术有机结合。通过 crowdsourced竞赛模式,研究团队成功汇聚全球智慧,开发出高性能的过敏预测算法。开源数据库的建立不仅促进了科学共享,更为未来研究提供了坚实基础。这种创新方法为过敏原芯片技术的临床推广应用提供了有效路径,使过敏学家能够更加数据驱动地进行芯片使用和结果解读,最终推动过敏性疾病诊断和治疗向精准化、个性化方向发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号