RoNID:通过生成可靠标签与聚类友好型表征来实现新意图的发现

embedded/2024/9/20 4:02:19/ 标签: 人工智能, 自然语言处理

论文地址:https://arxiv.org/abs/2404.08977

原文地址:intents-are-not-going-away-ronid-is-a-new-intent-discovery-framework

2024 年 4 月 26 日

Robust New Intent Discovery(RoNID)框架致力于在开放域场景中识别已知意图并合理推断新意图组。

问题

传统的聊天机器人系统严重依赖意图。意图完全基于预先定义的(通常是经过深思熟虑的)假设,即用户想要进行的对话。

因此,传统意图的能力有限,只能识别预定义和受限的意图类别。解决聊天机器人这一问题的尝试包括域外检测和知识库回退,这些方法最近已演变成 RAG 方法。

新的用户意图不断从面向客户的实施中出现,这些新意图通常来自向组织引入的新产品和服务。或者系统故障、产品缺陷或产品或服务上线问题等等。

这些新的意图需要动态地发现和聚集。 RoNiD 旨在创建一个框架,其中通过弱监督包括 RLHF,在该框架中识别新意图并确认伪标签。

介绍

该研究的重点是建立可靠的伪标签并获得聚类友好的判别表示。

使用的两个模型是:

  1. 可靠的伪标签生成模块
  2. 聚类友好的表示学习模块。

文本描述了一个名为 RoNID 的过程,它生成可靠的合成标签和聚类友好的表示。

简单来说,这意味着 RoNID 创建准确的标签并以更易于理解的方式组织数据。这是通过两个主要步骤完成的:

标签生成

RoNID通过解决特定问题为数据分配准确的标签;这有助于为进一步分析提供明确的指导。

表征学习

RoNID 组织数据,以便相似的项目被分组在一起(聚类紧凑性),而不同的组被很好地分开(聚类间分离)。此步骤可以更轻松地查看数据中的模式和差异。

通过重复这些步骤,RoNID 创建了一个具有准确标签和组织良好的数据的可靠模型。测试表明,该方法大大优于以前的技术,在各种基准测试中将结果提高了 1 到 4 个点。

意图与对话

准确理解和识别用户意图对于下游面向任务的对话系统非常重要,它直接影响用户体验。如果意图识别不正确,则呈现给用户的对话流与用户的意图不匹配。

随后,用户试图从一个流程转移到另一个流程;如果没有计划好这种转移,用户会感到更加沮丧。

Out-Of-Domain

上面的场景(a)展示了已知意图和新意图是如何被分组的。而场景(b)展示了RoNID方法,其中已知意图和新的/未知的意图是基于可靠的伪标签和聚类表征被分离的。

NID

半监督 NID 通常采用 k-means 算法进行伪标签分配并学习判别意图特征。

RoNID 框架通过在一个步骤中解决特定问题来获得可靠的伪标签,在另一个步骤中,它通过组合不同类型的损失来学习以一种易于理解的方式组织数据。

最后

在这项研究中,研究人员引入了针对 NID 问题的 EM-optimised RoNID 框架。它由两个主要部分组成:可靠的伪标签生成模块和聚类友好的表示学习模块。

伪标签生成模块通过解决特定问题分配精确的伪标签来确保准确的监督。表示学习模块通过关注簇内和簇间差异来提高表示的质量。这有助于区分已知意图和新意图。

他们的实验表明 RoNID 是有效的,并且比以前最先进的方法表现得更好。

RoNID 使用迭代方法通过创建可靠的伪标签并将数据组织到集群中来提高模型性能。

该方法包括三个主要步骤:

  1. 首先,使用标记和未标记数据预训练特征提取器,以实现更好的知识迁移。
  2. 然后,通过解决特定问题来提高伪标签的准确性。
  3. 最后,引入簇内和簇间对比学习,为已知和新颖的意图创建不同的表示簇。

为了给表示学习模块提供高质量的监督信号,该研究提出生成可靠的伪标签来指导模型训练,从而将无监督训练样本转化为伪监督样本。


http://www.ppmy.cn/embedded/29141.html

相关文章

【数据结构】:链表的带环问题

🎁个人主页:我们的五年 🔍系列专栏:数据结构 🌷追光的人,终会万丈光芒 前言: 链表的带环问题在链表中是一类比较难的问题,它对我们的思维有一个比较高的要求,但是这一类…

Android 修改Camera的最大变焦倍数

文章目录 一、前摄后摄都修改二、只修改前摄或后摄 由于项目的摄像头在预览时如果放大太多倍(比如放大4倍或者8倍)会出现模糊的情况,所以我们需要做出限制,修改Camera的最大变焦倍数。(以下示例为Android13 MTK平台) 一、前摄后摄…

计算机系统的多级层次结构

计算机系统的层次结构 计算机系统最底部的两个底层结构 那我们上一篇文章所举的例子来看:(ps:如果还没有看请查收~各个硬件的工作原理-CSDN博客) 第一条指令是二进制机器指令,它被分为了9个微指令 如下图: 由于传统的机器只能识别二进制指令,而这种指令用来编程是非常不方便的…

几个程序员必备的面试技巧

程序员必备的面试技巧 面试对于程序员来说是一个非常重要的环节,下面是一些面试技巧: 准备充分:了解公司和职位要求,准备回答常见的技术问题和行为面试问题。 展示项目经验:准备讲解自己在项目中的角色和贡献&#x…

C++奇迹之旅:C++内存管理的机制初篇

文章目录 📝C/C内存分布🌠 C语言中动态内存管理方式🌉C内存管理方式 🌠new/delete操作内置类型🌉C与C链表构建对比 🚩总结 📝C/C内存分布 这是C/C中程序内存区域划分图: 数据段&am…

复杂prompt组成

chatGpt像一个具有海量知识的婴儿,了解的知识足够多,但是还不够足够智能。为了能够让gpt能精准回复,一是将问题尽可能描述清楚,帮助gpt理解问题,二是给出一些有效的筛选条件,帮助gpt去从海量知识中筛选可能…

Python版本管理工具-pyenv

Pyenv是一个Python版本管理工具。 Pyenv允许用户在同一台机器上安装多个版本的Python,并能够轻松切换使用这些版本。 一、安装 Mac下直接使用Homebrew安装 # 更新 Homebrew 的软件列表 brew update # 安装pyenv brew install pyenv# 验证是否安装成功 pyenv -v# …

spring bean的生命周期你了解么

Spring Bean的生命周期是指在Spring容器中创建、初始化、使用和销毁Bean实例的整个过程。理解Spring Bean的生命周期对于开发者来说非常重要,因为它涉及到在不同的生命周期阶段执行自定义逻辑的机会。下面是关于Spring Bean生命周期的详细解释,包括各个阶…

【设计模式】之模板方法模式

系列文章目录 【设计模式】之策略模式 【设计模式】之责任链模式 文章目录 系列文章目录 前言 一、什么是模板方法模式 定义 角色 二、为什么要使用模板方法模式 优点 缺点 三、案例 普通案例 模拟Servlet过程案例 总结 前言 今天给大家介绍23种设计模式中的模板方法模式&a…

LeetCode-网络延迟时间(Dijkstra算法)

每日一题 今天刷到一道有关的图的题,需要求单源最短路径,因此使用Dijkstra算法。 题目要求 有 n 个网络节点,标记为 1 到 n。 给你一个列表 times,表示信号经过 有向 边的传递时间。 times[i] (ui, vi, wi),其中 …

抖音小店运营实战班,全新升级 从零到进阶精通 分享月销百万小店核心秘密

课程内容: 1 2024抖音电商发展趋势及抖店运营策略(直播2024 0412).mp4 2 1-1抖音小店入驻流程(直播2024 04 12),mp4 3 1-2个体店铺VS企业店铺有什么区别(直播20240412).mp4 4 1-3抖音小店店铺搭建(直播2024 04 12).mp4 5 2-1-如何避免违禁词(附违禁词大全)(直播…

纯血鸿蒙APP实战开发——评论组件案例实现

介绍 评论组件在目前市面上的短视频app中是一种很常见的场景,本案例使用全局状态保留能力弹窗来实现评论组件。点击评论按钮弹出评论组件,点击空白处隐藏该组件,再次点击评论按钮则会恢复上一次浏览的组件状态。 效果图预览 使用说明 点击…

vue2实现面包屑功能

目录 1. store/index.js 2. router/index.js 3. Header.vue 在Vue 2中实现面包屑导航是一种常见的前端实践,它可以帮助用户了解当前页面在网站结构中的位置,并快速导航到上一级或根目录。以下是使用Vue 2实现面包屑导航的基本步骤: 1. store/index.js state中定义一个面…

YOLOv8 是一个相对较新的目标检测算法

YOLOv8 是一个相对较新的目标检测算法,它尚未有官方的代码发布时(截至当前知识截止日期),但基于 YOLO 系列的演进和常见的注意力机制(如 SE(Squeeze-and-Excitation)注意力)&#xf…

sklearn和torch计算的r2 score不一样

检查一下函数参数的位置,预测值和真实值位置不一样,可以参考函数定义 torch_r2score torch_r2(pred, y) sklearn_r2score r2_score(y, pred) https://pytorch.org/torcheval/main/generated/torcheval.metrics.functional.r2_score.html Parameters: …

Linux开发板 FTP 服务器移植与搭建

VSFTPD(Very Secure FTP Daemon)是一个安全、稳定且快速的FTP服务器软件,广泛用于Unix和Linux操作系统。它以其轻量级、高效和易于配置而受到赞誉。VSFTPD不仅支持标准的FTP命令和操作,还提供了额外的安全特性,如匿名F…

springcloud自定义全局异常

自行创建一个实体类 /*** 全局异常处理类**/ ControllerAdvice public class GlobalExceptionHandler {ExceptionHandler(Exception.class) ResponseBody public Result error(Exception e){e.printStackTrace(); return Result.fail();}/*** 自定义异常处理方法* param e * re…

RDD编程初级实践

参考链接 spark入门实战系列--8MLlib spark 实战_mob6454cc68310b的技术博客_51CTO博客https://blog.51cto.com/u_16099212/7454034 Spark和Hadoop的安装-CSDN博客https://blog.csdn.net/weixin_64066303/article/details/138021948?spm1001.2014.3001.5501 1. spark-shell…

vue查询数据里面指定的数据

vue查询数据里面指定的数据 可以通过find函数进行查找, 以下是find函数的用法: this.meal_tables.find(item > item.price 10)查询的结果是复合条件的数据 注意: this.meal_tables为一个对象数组 meal_tables: []

Macs Fan Control Pro for mac激活版:macOS 平台的风扇控制软件

Macs Fan Control Pro是一款用于 macOS 平台的风扇控制软件,它允许用户监控和调整 Mac 电脑的风扇转速。以下是该软件的一些特点和功能: Macs Fan Control Pro for mac激活版下载 风扇监控:Macs Fan Control Pro 提供实时的风扇转速监控&…