文献分享: ConstBERT固定数目向量编码文档

ops/2025/3/6 22:13:54/

😂图放这了,大道至简的 idea \text{idea} idea不愧是 ECIR \text{ECIR} ECIR

image-20250305212409686

👉原论文

1. ConstBERT \textbf{1. ConstBERT} 1. ConstBERT的原理

1️⃣模型的改进点:相较于 ColBERT \text{ColBERT} ColBERT为每个 Token \text{Token} Token生成一个向量, ConstBERT \text{ConstBERT} ConstBERT只为段落生成固定 C C C个向量

  1. 嵌入阶段:为查询 Q Q Q和段落 P P P的每个 Token \text{Token} Token都生成一个 d d d维向量,是为 { q 1 , … , q N } \{q_{1},\ldots,q_{N}\} {q1,,qN} { p 1 , … , p M } \{p_{1},\ldots,p_{M}\} {p1,,pM}
  2. 线性变换:拼接所有段落单向量为 [ p 1 , ⋯ , p M ] ∈ R d M \left[p_{1},\cdots,p_{M}\right]\text{∈}\mathbb{R}^{dM} [p1,,pM]RdM,进行 W ∈ R M k × C k \mathbf{W}\text{∈}\mathbb{R}^{Mk\text{×}Ck} WRMk×Ck投影得 [ δ 1 , ⋯ , δ C ] = W T [ p 1 , ⋯ , p M ] ∈ R d C \left[\delta_{1},\cdots, \delta_{C}\right]\text{=}\mathbf{W}^{T}\left[p_{1},\cdots,p_{M}\right]\text{∈}\mathbb{R}^{dC} [δ1,,δC]=WT[p1,,pM]RdC
  3. 后期交互:同 ColBERT \text{ColBERT} ColBERT,为每个 q i q_i qi找到与其内积最大的 MaxSim ( q i , δ ) = δ p i \text{MaxSim}(q_i,\delta)\text{=}\delta_{p_i} MaxSim(qi,δ)=δpi,最后将所有 MaxSim \text{MaxSim} MaxSim相加得到相似度评分

2️⃣改进的动机:为何非要固定数目的段落向量

  1. 存储效率上:设定 C < M C\text{<}M C<M后,能降低段落嵌入所占的空间
  2. 计算效率上:设定 C < M C\text{<}M C<M后,将原有 O ( M N ) O(MN) O(MN)的查询复杂度降为了 O ( C N ) O(CN) O(CN)
  3. 系统级优化:使得内存对齐,规避了变长文档表示导致内存碎片化,从而降低了 Cache Miss \text{Cache Miss} Cache Miss

2. ConstBERT \textbf{2. ConstBERT} 2. ConstBERT的实验结果

1️⃣效果:当 C = 32 C\text{=}32 C=32时,在 MsMarco/BEIR \text{MsMarco/BEIR} MsMarco/BEIR等数据集上,查询效果与 ColBERT \text{ColBERT} ColBERT相当(用 MRR@10/nDCG@10 \text{MRR@10/nDCG@10} MRR@10/nDCG@10衡量)

2️⃣效率:相比 ColBERT \text{ColBERT} ColBERT对段落的存储空间需求减少了一半多,端到端检索响应速度也显著加快


http://www.ppmy.cn/ops/163707.html

相关文章

PHP:动态网站开发的强大工具

在当今的互联网行业中&#xff0c;PHP&#xff08;Hypertext Preprocessor&#xff0c;超文本预处理器&#xff09;作为一种开源的服务器端脚本语言&#xff0c;已经在网站开发领域占据了举足轻重的地位。无论是个人博客、企业官网还是大型电子商务平台&#xff0c;PHP都以其高…

Vue.js 监听属性

Vue.js 监听属性 引言 在Vue.js框架中,监听属性(Watchers)是一种强大的功能,它允许开发者对数据的变化进行响应,从而实现数据的自动更新和复杂逻辑的处理。本文将详细介绍Vue.js监听属性的概念、使用方法以及在实际开发中的应用。 监听属性的概念 监听属性是Vue.js框架…

JavaWeb XML

1、定义 EXtension markup language XML&#xff1a;可扩展自定义标记语言 2、XML的存在意义和用法 XML存在约束&#xff0c;可以自定义但也存在书写规则&#xff0c;一般不需要逐行书写。 我们使用XML&#xff0c;只需要基于第三方应用程序和已提供框架的配置文件进行修改…

C# OnnxRuntime部署DAMO-YOLO香烟检测

目录 说明 效果 模型信息 项目 代码 下载 参考 说明 效果 模型信息 Model Properties ------------------------- --------------------------------------------------------------- Inputs ------------------------- name&#xff1a;input tensor&#xff1a;Floa…

DeepSeek 全套资料pdf合集免费下载(持续更新)

有很多朋友都关注DeepSeek相关使用的教程资料&#xff0c;本站也一直持续分享DeepSeek 学习相关的pdf资料&#xff0c;由于比较零散&#xff0c;这篇文章主要就是做一个汇总&#xff0c;并且持续更新&#xff0c;让大家可以及时获取下载最新的相关DeepSeek的资料。 持续更新地…

以影像技术重构智能座舱体验,开启驾乘互动新纪元

在汽车智能化浪潮席卷全球的今天&#xff0c;座舱体验早已突破传统驾驶功能的边界&#xff0c;成为车企竞争的核心赛道。美摄科技凭借其在图像处理与AI算法领域的深厚积累&#xff0c;推出全链路智能汽车图像及视频处理方案&#xff0c;以创新技术重新定义车载影像系统&#xf…

C# is

类型检查模式匹配&#xff08;Pattern Matching&#xff09;模式匹配的类型模式与 as 的区别性能注意事项总结 在 C#中&#xff0c; is 关键字有多种用途&#xff0c;主要用于 类型检查和 模式匹配。以下是 is 关键字的主要用法&#xff1a; 类型检查 is 关键字可以用来检…

3.激活函数:神经网络中的非线性驱动器——大模型开发深度学习理论基础

激活函数在神经网络中扮演着至关重要的角色&#xff0c;它为模型引入非线性因素&#xff0c;使得网络能够拟合复杂的数据分布&#xff0c;从而实现高效的特征提取与预测。本文将从实际开发角度出发&#xff0c;介绍激活函数的基本概念、常见激活函数&#xff08;如 ReLU、GELU、…