【大语言模型】ACL2024论文-28 TTM-RE: 增强记忆的文档级关系抽取

server/2024/12/23 9:45:11/

【大语言模型】ACL2024论文-28 TTM-RE: 增强记忆的文档级关系抽取


目录

文章目录

    • 目录
      • 文章信息
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 创新点
      • 算法模型
      • 实验效果
      • 推荐阅读指数:★★★★☆
    • 后记


文章信息

TTM-RE: 增强记忆的文档级关系抽取
在这里插入图片描述

摘要

本文提出了TTM-RE,一种新颖的方法,它通过集成可训练的记忆模块(Token Turing Machine)和鲁棒的损失函数来解决文档级关系抽取问题。这种方法特别针对大规模、噪声多的训练数据,通过实验表明,TTM-RE在ReDocRED基准数据集上实现了最先进的性能,绝对F1分数提高了超过3%。
在这里插入图片描述

研究背景

文档级关系抽取的目标是在文档中识别并分类两个实体之间的关系。以往的方法在利用大规模、不同噪声水平的训练数据方面效果不佳。例如,在ReDocRED基准数据集中,使用大规模、低质量的远程监督训练数据训练出的状态最先进的方法,通常并不比仅使用小型、高质量的人工标注训练数据训练出的方法表现得更好。

问题与挑战

文档级关系抽取面临的挑战包括标签不平衡、文档中可能的实体对组合数量呈二次方增长等。此外,如何有效利用大规模的远程标注数据也是一个挑战。

如何解决

TTM-RE通过引入Token Turing Machine(TTM)记忆模块和针对正-未标记设置的噪声鲁棒损失函数来解决上述问题。TTM能够存储和处理输入实体,输出记忆增强的实体表示,用于关系分类。

创新点

  1. 提出了TTM-RE,首个记忆增强的文档级关系抽取模型。
  2. 通过结合伪实体,显著提升了下游关系分类性能。
  3. 在极端未标记设置下,TTM-RE的性能超过了之前的最佳方法。

算法模型

TTM-RE的核心是Token Turing Machine(TTM),它包含一个可训练的记忆模块。记忆模块处理输入实体,并输出到关系分类器。模型还采用了噪声鲁棒损失函数(SSR-PU),适用于正-未标记学习设置。
在这里插入图片描述

实验效果

  • 在ReDocRED数据集上,TTM-RE实现了最先进的性能,F1分数提高了超过3%。
  • 在ChemDisGene数据集上,TTM-RE在生物医学领域也表现出色,F1分数提高了5%。
  • 在极端未标记设置下,TTM-RE的F1分数比之前的最佳方法提高了12%。
    在这里插入图片描述

推荐阅读指数:★★★★☆


后记

如果您对我的博客内容感兴趣,欢迎三连击(点赞,关注和评论),我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型深度学习计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术


http://www.ppmy.cn/server/152458.html

相关文章

面向对象编程:原理、实践与应用

面向对象编程:原理、实践与应用 一、编程范式的演进 (一)从面向过程到面向对象 编程领域的发展见证了编程范式的不断演进,其中面向过程编程和面向对象编程是两种具有重要影响力的范式。面向过程编程以其直观的步骤执行逻辑&…

JDBC 入门教程

Java Database Connectivity (JDBC) 是 Java 平台提供的一种与各种数据库连接的方式和规范。通过 JDBC,开发者可以在 Java 平台上完成数据库的查询、更新和操作。本文将详细认识 JDBC 的基础概念,并通过实战例子介绍其使用方法。 1. JDBC 概念 JDBC 接口…

qt 类中的run线程

在Qt中,QThread类的run()方法是线程的执行入口,它是由QThread内部自动调用的,而不是用户直接调用。 详细解释: QThread类: QThread是Qt的线程类,提供了用于多线程操作的接口。我们可以创建QThread对象并将…

文心一言对接FreeSWITCH实现大模型呼叫中心

文心一言对接FreeSWITCH实现大模型呼叫中心 作者:开源大模型智能呼叫中心FreeIPCC,Github:https://github.com/lihaiya/freeipcc 随着人工智能技术的快速发展,特别是大规模语言模型(LLM)的应用&#xff0…

Chromium GN目标指南 - 查看GN目标(三)

引言 在前面的文章中,我们介绍了 Chromium 构建系统中的 GN 的基本概念、目录结构和常用工具,并通过构建一个简单的 Demo 学习了如何编写和使用 executable 目标。在本篇文章中,我们将学习如何查看和挑选合适的 GN 目标,以便于我…

sql server索引优化语句

第一步 建一个测试表 --create table TestUsers --( -- Id int primary key identity(1,1), -- Username varchar(30) not null, -- Password varchar(10) not null, -- CreateDateTime datetime not null --)第二步 插入100w数据 大概1分钟执行时间 ----插入数据…

面试小札:Java后端闪电五连鞭_8

1. Kafka消息模型及其组成部分 - 消息(Message):是Kafka中最基本的数据单元。消息包含一个键(key)、一个值(value)和一个时间戳(timestamp)。键可以用于对消息进行分区等…

基于鲲鹏服务器的打砖块小游戏部署

案例介绍 鲲鹏服务器是基于鲲鹏处理器的新一代数据中心服务器,适用于大数据、分布式存储、高性能计算和数据库等应用。鲲鹏服务器具有高性能、低功耗、灵活的扩展能力,适合大数据分析、软件定义存储、Web等应用场景。 本案例将指导开发者如何在鲲鹏服务…