Textual Dataset Distillation via Language Model Embedding

ops/2024/12/28 12:30:17/

Method

在这里插入图片描述
将数据集丢入embedding模型,丢入embedding前可以加入prompt加强效果,然后获取k-means聚类的中心向量来作为需要的蒸馏embeddings,然后使用vec2text模型还原成原始文本。

Result

在这里插入图片描述

Q:

这里有一点不清楚:

  1. 聚类中心的embedding是怎么转换成原来的文本的,如果是不同的embedding模型,那各自的representation space不同,怎么通过一个vec2text model还原。

http://www.ppmy.cn/ops/144762.html

相关文章

MFC 文档模板 每个文档模板需要实例化吧

文档模板的实例化 在MFC(Microsoft Foundation Classes)应用程序中,文档模板通常是需要实例化的。文档模板类(CDocTemplate)主要有两种派生类用于不同的文档 - 视图架构场景:CSingleDocTemplate&#xff08…

uniapp 自定义图标03

插入工程,修改名称文件内容 编译运行

【C++决策和状态管理】从状态模式,有限状态机,行为树到决策树(一):从电梯出发的状态模式State Pattern

前言 (题外话)nav2系列教材,yolov11部署,系统迁移教程我会放到年后一起更新,最近年末手头事情多,还请大家多多谅解。回顾我们整个学习历程,我们已经学习了很多C的代码特性,也学习了很多ROS2的跨…

分布式系统架构4:容错设计模式

这是小卷对分布式系统架构学习的第4篇文章,虽然知道大家都不喜欢看纯技术文章,写了也没多少阅读量,但是为了个人要成长,小卷最近每天都会更新分布式的文章 1.概念 容错策略,指的是“面对故障,我们该做些什…

什么,不用 Tomcat 也能运行 Java web?

在 Java web 开发领域,传统的 Tomcat 服务器一直占据着重要地位。但如今,Blade 框架的出现为我们提供了一种全新的开发体验,它无需依赖 Tomcat 便可运行 Java web 应用。 一、Blade 框架简介 是一款轻量级且高性能的 Java web 框架。其设计理…

ArcGIS Pro 3.4新功能2:Spatial Analyst新特性,密度、距离、水文、太阳能、表面、区域分析

Spatial Analyst 扩展模块在 ArcGIS Pro 3.4 中引入了新功能和增强功能。此版本为您提供了用于表面和区域分析的新工具以及改进的密度和距离分析功能,多种用于水文分析的工具性能的提高,一些新的太阳能分析功能。 目录 1.密度分析 2.距离分析 3.水文…

websocket 局域网 webrtc 一对一 多对多 视频通话 的示例

基本介绍 WebRTC(Web Real-Time Communications)是一项实时通讯技术,它允许网络应用或者站点,在不借助中间媒介的情况下,建立浏览器之间点对点(Peer-to-Peer)的连接,实现视频流和&am…

汉塔上网行为管理 ping.php 远程命令执行漏洞复现(附脚本)

0x01 产品描述: 上海汉塔网络科技有限公司多年来一直专注于网络应用的软件开发,在网络安全、网络协议分析、网络数据流控制等领域有着丰富的经验和雄厚的技术实力。同时,公司积累了丰富的数据通信及网络安全产品研发、生产、销售及服务经验,是行业领先的新一代信息安全产品…