【大语言模型】ACL2024论文-28 TTM-RE: 增强记忆的文档级关系抽取

embedded/2024/12/23 2:29:50/

【大语言模型】ACL2024论文-28 TTM-RE: 增强记忆的文档级关系抽取


目录

文章目录

    • 目录
      • 文章信息
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 创新点
      • 算法模型
      • 实验效果
      • 推荐阅读指数:★★★★☆
    • 后记


文章信息

TTM-RE: 增强记忆的文档级关系抽取
在这里插入图片描述

摘要

本文提出了TTM-RE,一种新颖的方法,它通过集成可训练的记忆模块(Token Turing Machine)和鲁棒的损失函数来解决文档级关系抽取问题。这种方法特别针对大规模、噪声多的训练数据,通过实验表明,TTM-RE在ReDocRED基准数据集上实现了最先进的性能,绝对F1分数提高了超过3%。
在这里插入图片描述

研究背景

文档级关系抽取的目标是在文档中识别并分类两个实体之间的关系。以往的方法在利用大规模、不同噪声水平的训练数据方面效果不佳。例如,在ReDocRED基准数据集中,使用大规模、低质量的远程监督训练数据训练出的状态最先进的方法,通常并不比仅使用小型、高质量的人工标注训练数据训练出的方法表现得更好。

问题与挑战

文档级关系抽取面临的挑战包括标签不平衡、文档中可能的实体对组合数量呈二次方增长等。此外,如何有效利用大规模的远程标注数据也是一个挑战。

如何解决

TTM-RE通过引入Token Turing Machine(TTM)记忆模块和针对正-未标记设置的噪声鲁棒损失函数来解决上述问题。TTM能够存储和处理输入实体,输出记忆增强的实体表示,用于关系分类。

创新点

  1. 提出了TTM-RE,首个记忆增强的文档级关系抽取模型。
  2. 通过结合伪实体,显著提升了下游关系分类性能。
  3. 在极端未标记设置下,TTM-RE的性能超过了之前的最佳方法。

算法模型

TTM-RE的核心是Token Turing Machine(TTM),它包含一个可训练的记忆模块。记忆模块处理输入实体,并输出到关系分类器。模型还采用了噪声鲁棒损失函数(SSR-PU),适用于正-未标记学习设置。
在这里插入图片描述

实验效果

  • 在ReDocRED数据集上,TTM-RE实现了最先进的性能,F1分数提高了超过3%。
  • 在ChemDisGene数据集上,TTM-RE在生物医学领域也表现出色,F1分数提高了5%。
  • 在极端未标记设置下,TTM-RE的F1分数比之前的最佳方法提高了12%。
    在这里插入图片描述

推荐阅读指数:★★★★☆


后记

如果您对我的博客内容感兴趣,欢迎三连击(点赞,关注和评论),我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型深度学习计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术


http://www.ppmy.cn/embedded/147958.html

相关文章

ESP8266 WiFi模块入门:搭建网络与测试实践

在物联网(IoT)应用中,设备联网是核心功能之一。而ESP8266串口WiFi ESP-01模块是一款低成本、功能强大的UART-WiFi透传模块,广泛应用于智能家居、工业控制等领域。本篇文章将从基础出发,讲解如何使用ESP8266模块进行WiF…

【教程】apache设置禁止通过IP访问,只能域名访问

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~ 目录 背景说明 效果演示 配置步骤 背景说明 暴露IP容易被扫描,而且会被DDOS等攻击。而域名则由于经过了DNS解析,可以很方便的…

【自动化】Python SeleniumUtil 工具 开启开发者模式 自动安装油猴用户脚本等

【自动化】Python SeleniumUtil 工具 【Python】使用Selenium 操作浏览器 自动化测试 记录-CSDN博客文章浏览阅读58次。文章浏览阅读42次。【附件】Selenium chromedriver 驱动及浏览器下载。【附件】Selenium chromedriver 驱动及浏览器下载-CSDN博客。3.安装Chrome浏览器驱动…

宏任务和微任务

但是事件循环中并非只维护着一个队列,事实上是有两个队列: 宏任务队列(macrotask queue):ajax、setTimeout、setInterval、DOM监听、UI Rendering等 微任务队列(microtask queue):Promise的then回调、Mutation Observer APl、queu…

类似于GitHub的平台

当然有类似于GitHub的平台,这些平台提供了类似的代码托管、版本控制、协作开发等功能。以下是不少于20个的类似GitHub的平台: GitLab: 自托管的Git存储库管理工具,提供代码托管、版本控制、问题跟踪、CI/CD等功能。支持自建部署&a…

opencv # Sobel算子、Laplacian算子、Canny边缘检测、findContours、drawContours绘制轮廓、外接矩形

一、Sobel算子 案例图片 cv2.Sobel(src, ddepth, dx, dy, ksize3, scale1, delta0, borderTypeNone) 功能:用于计算图像梯度(gradient)的函数 参数: src: 输入图像,它应该是灰度图像。 ddepth: 输出图像的所需深度&am…

Linux驱动开发应用层 2 点亮一个LED

目录 先来聊聊sysfs sysfs的具备的优势 LED在哪里? 先来聊聊sysfs 我们下面首先简单聊一下sysfs。他很重要的原因是因为我们跟底下的设备打交道,就是可以透过我们的sysfs来操作我们底层的设备, sysfs是Linux内核中的一个虚拟文件系统&…

流存储Fluss:迈向湖流一体架构

本文整理自阿里云高级开发工程师,Flink Committer 罗宇侠老师在 Flink Forward Asia 2024上海站分论坛流批一体(二)中的分享,内容主要分为以下四个部分: 一、湖流割裂的现状和挑战 二、Fluss 湖流一体架构 三、湖流一体…