基于多图注意力网络的联合信息抽取方法研究——动态语义交互与实例聚焦的创新模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月17日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　本文推荐：该研究提出多图注意力网络(MGAN)，通过类别交互组件(CIC)和实例交互组件(IIC)解决联合信息抽取(IE)中语义交互复杂和负样本过多的问题。模型在ACE2005等6个数据集上实现SOTA性能，创新性地采用动态注意力机制捕捉标签依赖关系(K×N×N矩阵)，显著提升命名实体识别(NER)、关系抽取(RE)等任务的联合建模能力。

Highlight

本研究提出多图注意力网络(MGAN)，通过动态建模语义交互显著提升联合信息抽取性能。模型创新性地采用并行边(token-based multigraph)结构，支持同时识别"renee tab"作为攻击者(Attacker)和目标(Target)等多重语义角色。

Related Work

传统信息抽取(IE)采用流水线处理NER、RE等子任务，存在误差累积问题。现有图方法中，基于跨度(span-based)的图面临节点爆炸问题，而基于token的图忽视语义交互。MGAN通过多图结构统一编码句子语义，解决跨度重叠和参数复用难题。

Approach

模型架构包含两大核心：

1.
类别交互组件(CIC)：构建动态注意力机制学习标签依赖，例如PER-SOC关系暗示实体类型应为PER
2.
实例交互组件(IIC)：通过权重调整聚焦关键实例，如"fight"事件中优先关注"wife"而非"ozzy"作为论元

Datasets

在ACE2005、ERE-EN和GENIA数据集验证：

• ACE2005：包含实体/关系/事件的英汉双语标注

• 实验采用OneIE和DyGIE++的数据处理脚本，确保对比实验一致性

Analysis of Representation Method

与异构图(HetGraph)对比实验显示：

• MGAN的F1值提升3.2-5.7%

• 多图结构对重叠跨度识别准确率提高18.6%

• 实例注意力机制使正样本召回率提升9.4%

Conclusion

MGAN通过多图框架实现四大突破：

1.
统一编码K×N×N维语义结构
2.
CIC模块捕获标签共现模式
3.
IIC模块解决论元多重角色问题
4.
在攻击(Attack)等复杂事件中展现显著优势

热点排行

新闻专题

联系信箱：

粤ICP备09063491号