模型意识对比学习:摆脱训练中的一致性-容忍度困境

server/2024/11/13 15:46:46/

论文出处:

ICML2023

Model-Aware Contrastive Learning: Towards Escaping Uniformity-Tolerance Dilemma in Training

什么是uniformity-tolerance困境?

温度参数 τ 的设置会影响模型性能

  • 如果 τ 太小,模型会对训练不足的阶段施加过大的惩罚,导致难以区分潜在阳性样本,虽然模型的均匀性会变好但是容忍性会下降
  • 如果 τ 太大,有助于探索语义结构,对潜在阳性样本的容忍度增加,但是均匀性会下降

体现在公式上:负样本xj上的惩罚权重分布为Pij,fi和gj​是样本的特征表示,K是正样本的数量,τ是温度参数,此公式表明,对于每个负样本,其惩罚权重取决于它与某个正样本之间的相似度(由特征表示的点积计算得出),并且所有负样本的惩罚权重之和归一化

显然,它有温度系数控制

  • 随着温度系数减小,整个式子形状会变得更加尖锐,这意味着较小的温度会对高相似区域造成较大的惩罚,这促进嵌入的均匀性,但对潜在正样本的容忍性减小
  • 随着温度系数增大,式子形状更平坦,倾向与给所有负样本相同大小惩罚,优化过程对LPs的容忍性更强,而对均匀性的关注较少

简单来说,这个困境意味着如果我们太注重让嵌入空间保持一致(即每个样本的表示都相似),可能会牺牲掉区分不同类别的能力;而如果我们太注重区分不同类别,又可能使得嵌入空间不够一致。

怎么解决uniformity-tolerance困境?

采用MACL模型,根据模型在训练过程的对齐程度来动态调整温度参数


http://www.ppmy.cn/server/100128.html

相关文章

网络协议 十一 ARP,RARP,icmp,websocket,webservice,HTTPDNS,FTP,邮件相关的协议, SMTP,POP,IMAP

ARP 已知IP 求 MAC 的过程 RARP 已知MAC 求 IP 的过程,已被DHCP取代 ICMP websocket 协议,html5中提出的前端使用协议 webservice 技术,已过时 HTTPDNS 之前我们要获得 某一个域名的 IP ,要通过DNS协议 去 运营商的ISP 查询&…

金融同业业务

信用拆借(Interbank Lending) 信用拆借(Interbank Lending)是指银行之间相互借贷资金的行为,是金融市场中重要的一部分。 定义和机制 1.定义:信用拆借是指银行或者其他金融机构之间在短期内相互借贷资金&a…

修改ubuntu的终端显示语言为英文,界面保持为中文

修改ubuntu的终端显示语言为英文,界面保持为中文 sudo nano /etc/default/locale LANGzh_CN.UTF-8nano ~/.bashrc 在文件未尾加入下列两行 export LANGen_US.UTF-8 export LANGUAGEen在终端执行 source ~/.bashrc之后提示语言就变成英文了

LVS详解

一、概念简述 1.1LVS概念简述 1.1.1 LVS LVS(Linux Virtual Server)即Linux虚拟服务器,是由章文嵩博士主导的开源负载均衡项目,目前LVS已经被集成到Linux内核模块中。LVS基于内核网络层工作,有着超强的并发处理能力&…

《投资的原理》阅读笔记三——你想接飞刀吗?

《投资的原理》第五章是《PE>60的市场里,谁都会做投资》。作者在这章里想说的事情我是比较认可的。2015年上半年大牛市的时候我刚好在玩雪球,很多球友都是大神,但是到了下半年才知道究竟多少人在裸泳。但是作者的题目有些问题,…

k8s—ingress应用

一、ingress和ingress-controller ingress对象: 指的是k8s中的⼀个api对象/资源对象,⼀般⽤yaml配置。作⽤是定义请求如何转发到service的规则,可以理解为配置模板。 ingress-controller: 具体实现反向代理及负载均衡的程序&…

ajax part4

图片上传 <!DOCTYPE html> <lang"en"><head>cmeta charset"UTF-8><meta http-equiv"X-UA-Compatibleb content" IEedge"><meta name"viewportR content" wiclthdevic6-widths initial-scalel. 0"&…

【LeetCode】234. 回文链表

回文链表 题目描述&#xff1a; 给你一个单链表的头节点 head &#xff0c;请你判断该链表是否为回文链表。如果是&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 示例 1&#xff1a; 输入&#xff1a;head [1,2,2,1] 输出&#xff1a;true示例 2&#…