文本摘要简介

server/2024/9/25 23:13:39/

        文本摘要是从一段长文本中提取出最重要的信息,并生成一个简短而有意义的摘要。这个过程可以分为两种主要方法:         

        抽取式摘要(Extractive Summarization):从原文中直接提取出关键句子或段落,组成摘要。这种方法不会改变原文的内容,只是选择了最能代表文章主题的部分。

  • 无监督:Lead,Centroid,Cluster,TextRank
  • 有监督:R2N2,NeuralSum,SummaRuNNer,BertSum

        生成式摘要(Abstractive Summarization):这种方法通过理解原文内容,然后用自己的语言生成一个简短的总结。生成式摘要可能包含与原文不同的词语或句子结构,但它依然能够传达原文的核心信息。

        Seq2seq经典架构:优点——不限于原文自由生成摘要、摘要展示了文本的关键信息;缺点——容易产生重复
        PGN(Pointer-Generator Network)架构:使用生成概率进行取舍,要么从词汇表生成一个单词,要么从原文本复制一个单词,相对减少了摘要重复问题

  评估方法:

  • BLEU(Bilingual evaluation understudy):主要计算精确度
  • ROUGE(Recall-Oriented Understudy for Gisting Evaluation:基于召回率,评价标准——ROUGE-N和ROUGE-L

http://www.ppmy.cn/server/101567.html

相关文章

vue里组件化引入svg图标的方式

配置好后可以轻松从iconfont导入svg图标或者任意svg图标。 参考:https://blog.csdn.net/weixin_39729729/article/details/137348970 https://blog.csdn.net/CMDN123456/article/details/139854354 官网https://www.iconfont.cn/help/detail?spma313x.help_detai…

代理服务器在HTTP请求中的应用:Ruby实例

摘要 在现代互联网架构中,代理服务器是不可或缺的组件,它提供了访问控制、数据加密、缓存和匿名访问等多种功能。本文将介绍代理服务器的基本概念,并以Ruby编程语言为例,展示如何在HTTP请求中使用代理服务器,包括设置…

Vue3 的福音框架:Arco Design

前言 随着前端技术的发展,Vue3 作为现代 JavaScript 框架的佼佼者,凭借其优雅的设计和卓越的性能赢得了众多开发者的喜爱。然而,仅仅拥有一个强大的框架是不够的,选择一个合适的 UI 组件库同样至关重要。在众多的 Vue UI 组件库中…

学懂C++(三十四):深入详解 C++ 高级多线程编程技术中的并发设计模式

引言 在现代软件开发中,多线程编程已成为提升性能和响应能力的重要手段。设计模式为解决并发问题提供了有效的解决方案。本文将探讨常见的并发设计模式,包括生产者-消费者模式、读者-写者模式、单例模式、帧-工作者模式以及Future-Task模式,并…

【stm32项目】多功能智能家居室内灯光控制系统设计与实现(完整工程资料源码)

多功能智能家居室内灯光控制系统设计与实现 目录: 目录: 前言: 一、项目背景与目标 二、国内外研究现状: 2.1 国内研究现状: 2.2 国外研究现状: 2.3 发展趋势 三、硬件电路设计 3.1 总体概述 3.2 硬件连接总…

【操作系统】什么是进程?什么是线程?两者有什么区别(面试常考!!!)

什么是进程/任务(Process/Task) 当我们打开我们的电脑的任务管理器就可以看到我们的电脑正在执行的进程。 每个应用程序运行于现代操作系统之上时,操作系统会提供一种抽象,好像系统上只有这个程序在运行,所有的硬件资…

【人工智能】【深度学习】 Python中进行数据归一化处理

‌归一化处理 归一化处理是一种数据预处理技术,旨在将数据调整到特定的范围内,通常是或[-1,1],以简化后续的数据处理和分析工作。以下是关于归一化处理的一些核心要点:‌1 目的:提高模型的收敛速度:归一化可以缩小数据范围,使得梯度下降等优化算法能够更快地收敛到最优…

自然语言处理(NLP)--数据增强

自然语言处理(NLP)中的数据增强旨在通过对文本数据进行各种变换,生成更多样化的训练样本,从而提高模型的泛化能力。与计算机视觉中的数据增强不同,NLP中的数据增强需要在保证语义一致性的前提下对文本进行改造。这种技…