【NeurIPS 2024】LLM-ESR:用大语言模型破解序列推荐的长尾难题

ops/2025/3/17 15:53:31/
标题期刊年份关键词
LLM-ESR: Large Language Models Enhancement for Long-tailed Sequential RecommendationNeurIPS2024Large Language Models, Sequential Recommendation, Long-tailed

📚研究背景

在电商和社交媒体的世界里,序列推荐系统(Sequential Recommendation Systems, SRS)就像一个贴心的购物助手,它通过分析用户的历史行为来预测他们接下来可能感兴趣的商品。🛍️ 但现实很骨感,大多数用户只和少数商品打过交道,而大部分商品也鲜少被问津,这就形成了所谓的“长尾问题”。这对于推荐系统来说,简直就是一场“灾难”,因为它不仅影响用户体验,还让商家的长尾商品失去了曝光的机会。😱

🧩相关工作

其实,之前的研究者们也尝试过解决这个问题。有的通过分析热门和长尾商品的共现模式来丰富长尾商品的表示,有的则通过数据增强来为长尾用户增加伪交互。不过,这些方法要么会引发“跷跷板效应”,要么因为用户相似度不准确而引入噪声。😩

🎯LLM-ESR的创新

LLM-ESR它提出了一个全新的框架,用LLM的语义嵌入来增强传统的SRS,而且完全不用担心LLM带来的额外推理负担。🧠

  • 双视图建模框架:它同时从语义视角和协同视角建模用户偏好语义视角利用LLM的语义嵌入来捕捉长尾物品的特征,而协同视角则保留了传统SRS对热门物品的推荐能力👀

  • 检索增强自蒸馏:对于长尾用户,LLM-ESR通过检索与目标用户语义相似的用户,并利用他们的交互信息来增强目标用户的偏好表示,就像是给长尾用户“借”了一些有用的信息。🔍

🎯 LLM-ESR的核心方法

LLM-ESR的核心思想是利用大语言模型(LLM)的语义能力来增强传统的序列推荐系统,同时避免引入额外的推理负担。它通过以下两大模块实现:

💡 1. 双视图建模框架(Dual-view Modeling Framework)

这个框架的核心是同时从语义视角协同视角建模用户偏好:

  • 语义视角(Semantic View):通过LLM对物品的属性(如标题、品牌、描述等)进行编码,生成语义嵌入。这些嵌入能够捕捉物品的语义信息,从而更好地推荐长尾物品。📝

  • 协同视角(Collaborative View):利用传统的协同过滤方法,通过用户的历史交互数据学习物品的嵌入。这部分专注于热门物品的推荐能力。📈

双视图融合:通过跨注意力机制(Cross-Attention)将语义嵌入和协同嵌入进行融合,让模型同时学习到语义信息和用户行为模式。这样既能利用LLM的强大语义理解能力,又能保留传统SRS对热门物品的推荐优势。🔗

💡 2. 检索增强自蒸馏(Retrieval-Augmented Self-Distillation)

对于长尾用户,由于他们的交互记录较少,模型很难准确捕捉到他们的偏好。LLM-ESR通过以下步骤解决这个问题:

  • 检索相似用户利用LLM生成的用户语义嵌入,检索与目标用户语义相似的其他用户。🔍

  • 自蒸馏:将这些相似用户的交互信息作为“指导信号”,通过自蒸馏(Self-Distillation)的方式增强目标用户的偏好表示。这相当于“借”来了相似用户的信息,帮助模型更好地理解长尾用户的偏好。🔋

🔬实验

作者在Yelp、Amazon Fashion和Amazon Beauty这三个真实世界的数据集上进行了测试,结果表明LLM-ESR在所有指标上都超越了现有的基线方法,尤其是对长尾用户和长尾物品的推荐效果提升显著。📈


http://www.ppmy.cn/ops/166539.html

相关文章

笔记:代码随想录算法训练营day48:739. 每日温度\496.下一个更大元素 I\503.下一个更大元素II

学习资料:代码随想录 单调栈适合找左边或右边比当前大或小的元素 739. 每日温度 力扣题目链接 大致意思为用栈存储当前值以及比当前的小的值,但后遇到比当前值大的值的时候再计算 非常巧妙的是,最后需要等于0的时候,正好后面没有比当下大的数的那个数的位置的result保留为0…

SQL Server查询优化

最常用,最有效的数据库优化方式 查询语句层面 避免全表扫描 使用索引:确保查询条件中的字段有索引。例如,查询语句 SELECT * FROM users WHERE age > 20,若 age 字段有索引,数据库会利用索引快速定位符合条件的记…

【前缀和的力量:高效解决子数组和矩阵问题的秘笈】—— 蓝桥杯高频热点题型知识点

文章目录 前缀和:【模板】前缀和【模板】二维前缀和寻找数组的中心下标除自身以外的数组的乘积和为K的子数组和可被K整除的数组连续数组矩阵区域和 前缀和: 前缀和(Prefix Sum)是一种常用的算法技巧,用于快速计算数组…

嵌入式裸机设计--MCU常用裸机架构有哪些?

为什么是裸机设计 792125321入群学习更高效! 在MCU(微控制器单元)裸机开发中,我们常见的架构设计主要围绕如何高效管理资源和任务调度。认识这些开发方式,对我们开发一个小型项目来说及有好处! 下面介绍…

生成对抗网络——pytorch与paddle实现生成对抗网络

生成对抗网络——pytorch与paddle实现生成对抗网络 本文将深入探讨生成对抗网络的理论基础,并通过PyTorch和PaddlePaddle两个深度学习框架来展示如何实现生成对抗网络模型。我们将首先介绍生成对抗网络的基本概念,这些理论基础是理解和实现生成对抗网络…

批量压缩与优化 Excel 文档,减少 Excel 文档大小

当我们在 Excel 文档中插入图片资源的时候,如果我们插入的是原图,可能会导致 Excel 变得非常的大。这非常不利于我们传输或者共享。那么当我们的 Excel 文件非常大的时候,我们就需要对文档做一些压缩或者优化的处理。那有没有什么方法可以实现…

【网络协议】应用层协议HTTPS

文章目录 为什么引入HTTPS?基本概念加密的基本过程对称加密非对称加密中间人攻击证书 为什么引入HTTPS? 由于HTTP协议在网络传输中是明文传输的,那么当传输一些机密的文件或着对钱的操作时,就会有泄密的风险,从而引入…

mybatis注册一个自定义拦截器,拦截器用于自动填充字段

MetaObject 通过反射机制访问 parameter 对象的类对象(Class 对象),为什么要修改类对象的属性值,类对象里都没有属性值,属性值在实例对象里呀,实例对象的属性值操作不需要反射呀? 场景&#xff…