Bring Your Data!Self- supervised Evolution of Large Language Models

news/2024/11/20 7:32:18/

Bring Your Data!Self- supervised Evolution of Large Language Models

  • Introduction
  • Method
  • 参考

Introduction

这篇论文提出了一种自监督的评估方式来衡量大型语言模型的能力和局限性。常规的基于数据集的评估方式存在一些缺点:

  1. 需要不断新建数据集。
  2. 存在数据集和模型训练数据交叉的问题,影响评估结果。
  3. 难以评估模型在实际部署中的表现。为了弥补这些缺点,论文提出了自监督评估方法。

主要思想是:对输入文本做一些简单的转换(如添加否定词、颠倒词序等),然后比较原始文本和转换文本模型的输出(或概率分布),通过模型对这些转换的不变性或敏感度来评估它的能力。

Method

在这里插入图片描述

自监督评估的主要思想是:

基于输入文本做某种简单的转换,形成一对原始文本和变换后的文本,将这对文本送入模型,分析模型对这种转换的不变性或敏感度,将多个这样的文本对的数据聚合,形成一个总体上的不变性或敏感度分数。

具体过程:

  1. 对数据集(如维基百科)构建输入文本x和变换后的文本x’对。
  2. 将这对文本送入模型f,获取模型输出(可以是概率分布、困惑值、文本等)。
  3. 根据输出f(x)和f(x’)使用一个相似度度量M量化它们的相似性。
  4. 将相似度度量在整个数据集上聚合,使用聚合函数A计算最终的不变性/敏感度分数。
    在这里插入图片描述

论文提出了以下变换来评估模型:

  1. 添加否定词,测量模型对否定句子模型分布的变化,来反应模型的世界知识。

  2. 添加有毒引发词,分析模型生成的文本来测量模型对有毒文本的敏感度。

  3. 替换一些上下文句子,测量模型对最后一句话的概率分布变化,来反应模型对长距离上下文的敏感度。

  4. 颠倒词序,测量模型对概率分布的变化来反应模型对词序的敏感度。

  5. 将输入文本拆分后重新组合,测量模型对这样的分词变化的鲁棒性。

参考

https://arxiv.org/pdf/2306.13651.pdf


http://www.ppmy.cn/news/911854.html

相关文章

2023-07-15力扣今日四题

链接: 1377. T 秒后青蛙的位置 题意: 一个n节点无向树,遍号1到n,青蛙从顶点1开始**(第0秒在顶点1)** 每过一秒: 青蛙等概率跳到该节点的子节点,如果该节点没有子节点则原地不动…

(转)经典面试题

1. 有一个整数数组,请求出两两之差绝对值最小的值。记住,只要得出最小值即可,不需要求出是哪两个数。(Microsoft) 方法1:两两作差求绝对值,并取最小,O( n2 )。 方法2&#x…

华为安全 HCIP722笔记

1、USG6000V软件逻辑架构分为三个平面:管理、控制、数据转发。 USG6000的反病毒库的升级方式:本地升级、在线升级。 在线升级分为:定时升级、立即升级。 回退:如果升级特征库后出现异常情况,可以使用版本回退功能将特…

三角形内角和是180°?不对!外角和才规律——张景中院士用实例启迪科学理论思想,附张景中院士简历(公号“外角和思想”下载PDF)

三角形内角和是180?不对!外角和才规律——张景中院士用实例启迪科学理论思想,附张景中院士简历(公号“外角和思想”下载PDF) 秦陇纪 科学Sciences 今天 科学Sciences导读:张景中院士谈几何,三角形内角和是180?不对!外角和才规律——张景中院士用实例启

SQL基础应用

SQL基础应用一 1.内置命令功能介绍 2.字符集、数据类型 3.数据定义语言DDL、数据操作语言DML 1.mysql内置的功能 1.1.连接数据库 -u 登录用户名 -p 登录密码 -S socket位置 -h 登录IP -P 登录端口 -e 不进入mysql内部执行mysql命令 < 重定向输入 重定向输出 mysql -u roo…

咱们的课程里,有微信的这种菜单示例吗?---酷课堂iOS交流群问答整理(201810期)

酷课堂iOS交流群 我们是一个什么样的组织&#xff1a; 酷课堂iOS交流群&#xff0c;聚集了一群热爱技术、有趣、有料&#xff0c;平均Q龄在10年以上的“老司机”&#xff0c;他们遍布在全国/球各地&#xff0c;有知名企业iOS工程师、高校大学生、自由职业者……如果你也是这样…

创新发明与专利实务的尔雅答案

学习通app创新发明与专利实务章节测验答案 专利制度的历史(一) 1 【单选题】在第一次工业革命中,蒸汽机发明专利的拥有者瓦特,通过()来行使自己的专利权。D A、授权他制造的蒸汽机 B、销售蒸汽机 C、卖出专利权 D、租赁蒸汽机 2【多选题】1624年,关于英国实施《垄断法…

2022年Github学生包白嫖!

前言&#xff1a; 喜报喜报&#xff01;我申请到Github学生包拉&#xff01;不过有点可惜&#xff0c;是小号的&#xff08; [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ubj4z9Qz-1656427805931)(https://img.pighog.repl.co/2022/06/image-202…