[论文笔记]Poly-encoder

news/2024/11/29 10:46:25/

引言

本文是Poly-encoder1的阅读笔记,论文题目为基于预训练模型的快速准确多句评分模型。

也是本系列第一篇基于Transformer架构的模型,对于进行句子对之间比较的任务,有两种常用的途经:Cross-encoder在句子对上进行交互完全自注意力;Bi-encoder单独地编码不同的句子。前者通常表现更好,但实际中太慢。

本篇工作提出了一种新的Transformer架构,Ploy-encoder,学习了全局而不是标记级自注意特征。Poly-encoder比Cross-encoder快,比Bi-encoder好。

总体介绍

对于句子对比较任务来说,有两种常用的途径:Cross-encoder和Bi-encoder。

Cross-encoder基于给定的输入句子和标签句子(组成一个句子对,将它们拼接在一起作为输入)进行交叉自注意,通常能获得较高的准确率,但速度较慢。

而Bi-encoder单独地对句子对中的句子进行自注意,分别得到句子编码。由于这种独立性,Bi-encoder可以对候选句子进行缓存,从而在推理时只需要计算输入句子的编码表示即可,大大加快推理速度。但是表现没有Cross-encoder好。

本文作者提出了一种新的Transformer结构,Poly-encoder,学习全局级而不是单词级的自注意特征。

Poly-encoder比Cross-encoder快,同时比Bi-encoder更准确。

相关工作

作者称Bi-encoder的方法为单独映射输入和候


http://www.ppmy.cn/news/1141021.html

相关文章

回顾Softing 2023工博之旅精彩瞬间

2023年9月23日,为期5天的第23届中国国际工业博览会(CIIF)于上海国家会展中心圆满落幕。Softing作为PROFIBUS创始人之一,德国工业4.0的领军企业之一,在本次展会上向大家呈现了众多工业自动化及IT网络方面的领先产品及方…

几道web题目

总结几道国庆写的web题目 [ACTF2020 新生赛]Include1 点进去发现就一个flag.php,源代码和抓包都没拿到好东西 结合题目猜是文件包含,构建payload ?filephp://filter/readconvert.base64-encode/resourceflag.php 得到base64编码过的flag,解码即可 此题…

【数据恢复篇】记一次Winhex镜像还原(恢复)到磁盘测试记录

【数据恢复篇】记一次Winhex镜像还原(恢复)到磁盘测试记录 镜像恢复到磁盘,怎么操作?会不会对磁盘有影响,是恢复到空磁盘?还是恢复到有数据的磁盘也可以?有数据的盘磁盘空间很多,恢…

LeetCode算法心得——有序三元组中的最大值 II (简单的动规思想)

大家好,我是晴天学长,枚举+简单的动态规划思想,需要的小伙伴可以关注支持一下哦!后续会继续更新的。 1) .有序三元组中的最大值 II 有序三元组中的最大值 II 给你一个下标从 0 开始的整数数组 nums 。 请你从所有满足 …

SwiftUI Spacer() onTapGesture 无法触发

问题:点击这个黑色区域不会 print,黑色区域看上去刚好是 Spacer() 占据的区域 解决办法:不使用 onTapGesture,用 Button 包裹一下 Code: import SwiftUIstruct TestTap: View {var body: some View {NavigationStack {List {Sect…

洗地机哪个好?2023最好用的洗地机

随着科技的进步,洗地机已成为家庭清洁的好帮手,不仅能减少体力消耗,还能有更加出色的清洁表现,不过面对鱼龙混杂的洗地机市场,如果不了解洗地机很容易买错,今天笔者教大家快速随了解市场主流洗地机的配置信…

parameterType后面报红

第一种 :parameterType后面报红,点击file——settings 第二种:写全类名

语义分割笔记(三):通过opencv对mask图片来画分割对象的外接椭圆

文章目录 mask图像介绍步骤代码 mask图像介绍 根据 mask 图像来画分割对象的外接椭圆是一种常见的图像分割任务。Mask 图像通常是一个二值图像,其中包含了感兴趣对象的像素。通常情况下,白色像素表示对象,黑色像素表示背景。 步骤 以下是一…