【大语言模型】ACL2024论文-26 在支持数据存在的情况下进行框架构建:以美国经济新闻为例研究

ops/2024/12/17 3:00:26/

【大语言模型】ACL2024论文-26 在支持数据存在的情况下进行框架构建:以美国经济新闻为例研究


目录

文章目录

  • 【大语言模型】ACL2024论文-26 在支持数据存在的情况下进行框架构建:以美国经济新闻为例研究
    • 目录
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 创新点
      • 算法模型
      • 实验效果
      • 推荐阅读指数:★★★★☆
    • 后记


在支持数据存在的情况下进行框架构建:以美国经济新闻为例研究
在这里插入图片描述
https://arxiv.org/pdf/2402.14224

摘要

本文提出了一个计算框架,用于分析在存在支持数据的情况下的新闻编辑选择。研究聚焦于经济新闻,因为经济指标的报道提供了一个相对简单的方法来确定不同出版物的选择和框架。通过这些指标的值,我们可以了解经济的实际状况,以及出版物如何选择报道它。研究定义了框架预测作为一系列相互依赖的任务。在文章层面,我们学习识别对经济总体状况的报道立场。然后,对于文章中报告的每个数值量,我们学习识别它是否对应于经济指标,以及它是以积极还是消极的方式被报道。通过跟踪2015年至2023年间六家美国出版商的头条文章,我们进行了分析。
在这里插入图片描述

研究背景

主流媒体在选择报道内容和报道方式上有很大的自由度。这些选择对人们的认知和随后的行为有实际影响。然而,缺乏客观的衡量标准来评估编辑选择,使得这一领域的研究变得特别困难。本文认为,在一些具有新闻价值的主题中,客观的衡量标准确实存在,形式就是支持数据,并提出了一个计算框架来分析这种设置下的编辑选择。

问题与挑战

  1. 编辑选择的客观衡量:大多数选择和框架决策缺乏客观衡量标准。
  2. 经济新闻的框架分析:如何准确识别经济新闻中的主题是如何被呈现的。
  3. 数据驱动的新闻分析:如何利用大量的经济数据来理解和预测新闻报道的趋势。

如何解决

研究者提出了一个计算框架,通过定义框架预测为一系列相互依赖的任务来解决上述问题。在文章层面,识别对经济总体状况的报道立场;对于文章中报告的每个数值量,识别它是否对应于经济指标,以及它的报道极性。此外,研究者收集了2015年至2023年间六家美国主要新闻媒体的头条文章,并为这些文章提供了高质量的框架组成部分注释。

创新点

  1. 框架预测的分解:将经济框架分解为一系列相互依赖的任务,以更细致地捕捉框架的细微差别。
  2. 计算框架的应用:将计算框架应用于美国经济新闻,以自动识别文章如何被描绘,哪些指标被用来支持这种观点,以及这些指标是如何被呈现的。
  3. 低监督设置下的自动化方法:提出了在低监督设置下检测每个提出的框架组成部分的自动化方法。

算法模型

研究者采用了统计关系学习(SRL)方法,特别是概率软逻辑(PSL),来模拟框架预测的联合分布。通过定义文章层面和数量层面的先验概率,以及它们之间的依赖关系,模型能够利用有限的标注数据进行有效的预测。此外,研究者还利用预训练的语言模型(如RoBERTa)和领域自适应预训练(DAPT)来增强模型的先验概率。

实验效果

实验部分,研究者在5折交叉验证的基础上,对模型进行了评估。结果显示,领域自适应预训练(DAPT)对于数量层面的预测特别有帮助,但对文章层面的预测提升不大。关系模型在大多数情况下都能提升性能,尤其是在数量层面。此外,研究者还展示了如何使用框架来跟踪不同新闻媒体对特定经济指标的报道选择和框架变化。

推荐阅读指数:★★★★☆


后记

如果您对我的博客内容感兴趣,欢迎三连击 ( **点赞、收藏和关注 **)和留下您的评论,我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型深度学习和计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术


http://www.ppmy.cn/ops/142524.html

相关文章

工业大数据分析算法实战-day05

文章目录 day05分而治之中的MARS算法神经网络逼近能力解释 day05 今天是第5天,昨日从统计分析开始利用统计学的知识判断当前样本的分布以及估计总体的参数和假设检验的情况,以及介绍了线性回归算法的相关优化点,但是毕竟线性回归是线性划分的…

Nginx 缓存那些事儿:原理、配置和最佳实践

Nginx 缓存那些事儿:原理、配置和最佳实践 在当今的互联网世界,网站的访问量和数据处理量不断攀升,如何确保用户能够快速、稳定地访问我们的网站,已经成为每个运维工程师面临的挑战。幸运的是,Nginx 作为一款高性能的…

phpSpider如何实现登录态保持的数据爬取

在使用 PHP 实现一个名为 phpSpider 的爬虫程序时,如果需要保持登录态以进行数据爬取,通常需要模拟用户登录过程,并在后续请求中携带登录后产生的认证信息(如 Cookies、Session ID 或 Token)。以下是一个实现登录态保持…

第二部分:进阶主题 12 . 用户管理 --[MySQL轻松入门教程]

第二部分:进阶主题 12 . 用户管理 --[MySQL轻松入门教程] MySQL 用户管理涉及到创建用户、授予和撤销权限、修改密码以及删除用户等操作。以下是一些常用的 MySQL 用户管理命令: 创建用户 下面是两个创建 MySQL 用户的示例,包括授予用户权…

Python Segmentation fault错误定位办法

1. 说明 Python3执行某一个程序时,报Segmentation fault (core dumped)错,但没有告知到底哪里出错,无法查问题,这时就需要一个库faulthandler来帮助分析。 2. 安装faulthandler faulthandler在Python3.3之后成为标准库&#xf…

题目 2780: 奇偶数判断

题目 2780: 奇偶数判断 时间限制: 2s 内存限制: 192MB 提交: 11198 解决: 6848 题目描述 给定一个整数,判断该数是奇数还是偶数。 输入格式 输入仅一行,一个大于零的正整数n。 输出格式 输出仅一行,如果n是奇数,输出odd&#xff1…

EXCEL的各种图形,统计图形

目录 0 EXCEL的各种图形,统计图形 1 统计图形 / 直方图 / 其实叫 频度图 hist最合适(用原始数据直接作图) 1.1 什么是频度图 1.2 如何创建频度图,一般是只选中1列数据(1个数组) 1.3 如何修改频度图的宽度 1.4 hist图的一个特…

【Java】链接数据库简介

JDBC基本原理 JDBC 提供了一套通用的接口,允许 Java 程序与不同类型的数据库进行交互。 JDBC 是 Java 提供的一种用于与数据库通信的 API(应用程序编程接口),定义了 Java 程序如何与数据库进行连接、执行查询、操作数据等。JDBC…