基于多图注意力网络的联合信息抽取方法研究——动态语义交互与实例聚焦的创新模型

【字体: 时间:2025年08月17日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文推荐:该研究提出多图注意力网络(MGAN),通过类别交互组件(CIC)和实例交互组件(IIC)解决联合信息抽取(IE)中语义交互复杂和负样本过多的问题。模型在ACE2005等6个数据集上实现SOTA性能,创新性地采用动态注意力机制捕捉标签依赖关系(K×N×N矩阵),显著提升命名实体识别(NER)、关系抽取(RE)等任务的联合建模能力。

  

Highlight

本研究提出多图注意力网络(MGAN),通过动态建模语义交互显著提升联合信息抽取性能。模型创新性地采用并行边(token-based multigraph)结构,支持同时识别"renee tab"作为攻击者(Attacker)和目标(Target)等多重语义角色。

Related Work

传统信息抽取(IE)采用流水线处理NER、RE等子任务,存在误差累积问题。现有图方法中,基于跨度(span-based)的图面临节点爆炸问题,而基于token的图忽视语义交互。MGAN通过多图结构统一编码句子语义,解决跨度重叠和参数复用难题。

Approach

模型架构包含两大核心:

  1. 1.

    类别交互组件(CIC):构建动态注意力机制学习标签依赖,例如PER-SOC关系暗示实体类型应为PER

  2. 2.

    实例交互组件(IIC):通过权重调整聚焦关键实例,如"fight"事件中优先关注"wife"而非"ozzy"作为论元

Datasets

在ACE2005、ERE-EN和GENIA数据集验证:

• ACE2005:包含实体/关系/事件的英汉双语标注

• 实验采用OneIE和DyGIE++的数据处理脚本,确保对比实验一致性

Analysis of Representation Method

与异构图(HetGraph)对比实验显示:

• MGAN的F1值提升3.2-5.7%

• 多图结构对重叠跨度识别准确率提高18.6%

• 实例注意力机制使正样本召回率提升9.4%

Conclusion

MGAN通过多图框架实现四大突破:

  1. 1.

    统一编码K×N×N维语义结构

  2. 2.

    CIC模块捕获标签共现模式

  3. 3.

    IIC模块解决论元多重角色问题

  4. 4.

    在攻击(Attack)等复杂事件中展现显著优势

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号