
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多图注意力网络的联合信息抽取方法研究——动态语义交互与实例聚焦的创新模型
【字体: 大 中 小 】 时间:2025年08月17日 来源:Expert Systems with Applications 7.5
编辑推荐:
本文推荐:该研究提出多图注意力网络(MGAN),通过类别交互组件(CIC)和实例交互组件(IIC)解决联合信息抽取(IE)中语义交互复杂和负样本过多的问题。模型在ACE2005等6个数据集上实现SOTA性能,创新性地采用动态注意力机制捕捉标签依赖关系(K×N×N矩阵),显著提升命名实体识别(NER)、关系抽取(RE)等任务的联合建模能力。
Highlight
本研究提出多图注意力网络(MGAN),通过动态建模语义交互显著提升联合信息抽取性能。模型创新性地采用并行边(token-based multigraph)结构,支持同时识别"renee tab"作为攻击者(Attacker)和目标(Target)等多重语义角色。
Related Work
传统信息抽取(IE)采用流水线处理NER、RE等子任务,存在误差累积问题。现有图方法中,基于跨度(span-based)的图面临节点爆炸问题,而基于token的图忽视语义交互。MGAN通过多图结构统一编码句子语义,解决跨度重叠和参数复用难题。
Approach
模型架构包含两大核心:
类别交互组件(CIC):构建动态注意力机制学习标签依赖,例如PER-SOC关系暗示实体类型应为PER
实例交互组件(IIC):通过权重调整聚焦关键实例,如"fight"事件中优先关注"wife"而非"ozzy"作为论元
Datasets
在ACE2005、ERE-EN和GENIA数据集验证:
• ACE2005:包含实体/关系/事件的英汉双语标注
• 实验采用OneIE和DyGIE++的数据处理脚本,确保对比实验一致性
Analysis of Representation Method
与异构图(HetGraph)对比实验显示:
• MGAN的F1值提升3.2-5.7%
• 多图结构对重叠跨度识别准确率提高18.6%
• 实例注意力机制使正样本召回率提升9.4%
Conclusion
MGAN通过多图框架实现四大突破:
统一编码K×N×N维语义结构
CIC模块捕获标签共现模式
IIC模块解决论元多重角色问题
在攻击(Attack)等复杂事件中展现显著优势
生物通微信公众号
知名企业招聘