碎片笔记|可训练非自回归解码策略

news/2024/10/25 1:31:02/

前言:前段时间在和学长的一次讨论中听他偶然提到一句可训练的解码策略,觉得很新鲜,于是便有了这篇文章。本文大致讲述一下可训练解码策略的发展历程及几个经典工作的思路。(本文初稿写于2023年3月16日)

常规的解码策略一般指自回归式解码策略,主要包括:贪婪搜索、集束搜索、top-k以及top-p采样,其主要思想是参照已生成的信息逐个生成文本,由于不是本文重点,这里不展开介绍,详细内容参见本篇博客。

目录

  • 解码策略优化方向
    • 风格转换
    • 解码速度
      • 非自回归解码策略


解码策略优化方向

解码策略的优化方向有很多,比如风格转换、解码速度、提高丰富性等,下面就根据解码策略的优化方向为分类依据对现有工作展开介绍。

风格转换

一个精心设计的解码策略也可以当作是可控文本生成的一种方法。比如控制生成文本的风格、情绪等信息。

解码速度

注意阐明是对哪种解码策略进行改进

Speeding Up Neural Machine Translation Decoding by Shrinking Run-time Vocabulary (ACL, 2017)
主要思想:通过在测试阶段缩减词表提高解码速率

Noisy Parallel Approximate Decoding for Conditional Recurrent Language Model (2016 arXiv) 纽约大学(Kyunghyun Cho)
主要思想:Noisy Parallel Approximate Decoding

非自回归解码策略

通过并行生成文本,提高解码速度。最大特点就是并行,也是因为并行,解码速度大大提升。(重点关注文中是以什么代价换取的速率提升)

Trainable Greedy Decoding for Neural Machine Translation (EMNLP, 2017) 香港大学 纽约大学(Kyunghyun Cho)
主要思想:使用强化学习的方法设计一个可训练贪婪解码策略

A Stable and Effective Learning Strategy for Trainable Greedy Decoding (ACL, 2018) 香港中文大学;纽约大学(Kyunghyun Cho)
主要思想:在几乎不增加计算开销的前提下,将集束搜索功能发挥到最大

Retrieving Sequential Information for Non-Autoregressive Neural Machine Translation (ACL, 2019) 中科院
主要思想:在纯非自回归模型和自回归模型之间取一个折中,添加一个序列信息模块


参考资料

  1. 神经机器翻译的训练改进和解码提速_测试_DataFunTalk_InfoQ精选文章
  2. 可控自然文本生成(报告-译) - 知乎 (zhihu.com)
  3. Controllable Neural Text Generation | Lil’Log (lilianweng.github.io)
  4. 2020 ICLR THE CURIOUS CASE OF NEURAL TEXT DeGENERATION
  5. How to generate text: using different decoding methods for language generation with Transformers (huggingface.co)

http://www.ppmy.cn/news/1076055.html

相关文章

国际站腾讯云容器镜像服务介绍!!

腾讯云容器镜像服务: 腾讯云的容器镜像服务Tencent Cloud Container Registry(TCR)旨在为开发者和企业供给高效、安全的容器镜像办理和存储平台,以处理容器镜像的保管、分发和办理问题。容器镜像是一种轻量级、可移植的软件包&…

Linux socket网络编程实战(tcp)实现双方聊天

在上节已经系统介绍了大致的流程和相关的API,这节就开始写代码! 回顾上节的流程: 创建一个NET文件夹 来存放网络编程相关的代码: tcp服务端代码初步实现--上 这部分先实现服务器的连接部分的代码并进行验证 server1.c&#xff…

使用 python 源码搭建 conda 环境

今天需要使用 python 2.6.8 的环境,发现 conda 设置成清华源后,没有旧版本了。所以打算从官网上下载一份 python 进行安装, 结果发现,conda 不能直接安装离线包(也可能我没找到方法),经过一番尝…

关闭浏览器的跨域校验

首发博客地址 问题描述 当你访问资源失败,并遇到以下类似提示时: Access to script at 资源路径 from origin null has been blocked by CORS policy: Cross origin requests are only supported for protocol schemes: http, data, isolated-app, chrom…

《信息系统项目管理师教程(第4版)》第15章 项目风险管理 知识点汇总

文章只对常见考点进行整理,有关项目风险管理的完整知识还请参照教程。 风险基础知识 1、风险的属性 随机性相对性可变性 2.风险的分类 按后果分:纯粹风险、投机风险,纯粹风险和 投机风险在一定条件下可以互相转化 按可预测性分&#xff…

第八周第四天学习总结

测试linux基础并复习基础命令

洛朗展式求留数方法计算超越函数f(x)=e^(cosx)的定积分

https://math.stackexchange.com/questions/2468863/what-is-the-integral-of-e-cos-x https://tieba.baidu.com/p/6881253594 例子 https://www.zhihu.com/question/441124046/answer/1697123609?utm_id0

41、springboot 整合 FreeMarker 模版技术

springboot 整合 FreeMarker 模版技术 ★ 整合FreeMarker的自动配置: FreeMarkerAutoConfiguration:负责整合Spring容器和获取FreeMarkerProperties加载的配置信息。FreeMarkerServletWebConfiguration/FreeMarkerReactiveWebConfiguration&#xff1a…