对比损失(Contrastive Loss)详解

devtools/2024/10/20 15:57:23/

对比损失(Contrastive Loss)详解

对比损失(Contrastive Loss)是一种常见的度量学习损失函数,它通过学习样本对之间的相似性和差异性,使得相似样本对在特征空间中的距离更小,而不相似样本对的距离更大。这种方法广泛应用于人脸识别、图像检索等任务中。

核心思想

对比损失的基本思想是,通过构建一对样本 ( (x_i, x_j) ),如果这对样本来自同一类(即正样本对),模型应该使得它们在特征空间中的距离更小;而对于不同类别的样本(即负样本对),模型则应该使得它们在特征空间中的距离尽量大。

数学公式

假设:

  • ( f ) 表示神经网络模型,用于提取样本的特征表示。
  • ( y ) 表示标签,( y = 1 ) 表示样本对 ( (x_i, x_j) ) 是同一类别(正样本对),( y = 0 ) 表示不同类别(负样本对)。
  • ( D(f(x_i), f(x_j)) ) 表示样本 ( x_i ) 和 ( x_j ) 在特征空间中的距离,通常使用欧几里得距离。

对比损失的公式定义为:

对比损失公式

L c o n t r a s t i v e = y ⋅ D ( f ( x i ) , f ( x j ) ) 2 + ( 1 − y ) ⋅ max ⁡ ( 0 , m − D ( f ( x i ) , f ( x j ) ) ) 2 L_{contrastive} = y \cdot D(f(x_i), f(x_j))^2 + (1 - y) \cdot \max(0, m - D(f(x_i), f(x_j)))^2 Lcontrastive=yD(f(xi),f(x


http://www.ppmy.cn/devtools/127325.html

相关文章

[LeetCode] 542. 01矩阵

题目描述: 给定一个由 0 和 1 组成的矩阵 mat ,请输出一个大小相同的矩阵,其中每一个格子是 mat 中对应位置元素到最近的 0 的距离。 两个相邻元素间的距离为 1 。 示例 1: 输入:mat [[0,0,0],[0,1,0],[0,0,0]] 输出…

自动机器学习(AutoML)

utoML是PAI的提供的自动寻找超参组合的机器学习增强型服务。您在训练模型时,如果超参组合复杂度过高,需大量训练资源和手工调试工作,可以使用AutoML来节省模型调参时间,提升模型调优效率和模型质量。 基础概念 超参数:…

openpnp - 底部相机视觉识别CvPipeLine的参数bug修正

文章目录 openpnp - 底部相机视觉识别的CvPipeLine的参数bug概述笔记openpnp的视觉识别参数的错误原因备注END openpnp - 底部相机视觉识别的CvPipeLine的参数bug 概述 底部相机抓起一个SOD323的元件,进行视觉识别。 识别出的矩形错了,是一个很长的长方…

【网络协议】TCP协议常用机制——延迟应答、捎带应答、面向字节流、异常处理,保姆级详解,建议收藏

💐个人主页:初晴~ 📚相关专栏:计算机网络那些事 前几篇文章,博主带大家梳理了一下TCP协议的几个核心机制,比如保证可靠性的 确认应答、超时重传 机制,和提高传输效率的 滑动窗口及其相关优化机…

观察者模式的思考

观察者模式由来 观察者模式(Observer Pattern)是一种行为型设计模式,它的起源可以追溯到20世纪90年代初,由设计模式四人帮(Erich Gamma, Richard Helm, Ralph Johnson 和 John Vlissides)在其著作《设计模…

rel-例行性工作

1,at命令 /etc/at.allow,写在该文件的人可以使用at命令 /etc/at.deny,黑名单 两个文件如果都不存在,只有root能使用 使用方法 at 命令格式: at [参数] [时间] 实例 建立一个3分钟后给所有用户发送 hahaha 2&#x…

Vue.js 学习总结(10)—— Vue 前端项目性能优化常用技巧

1. 使用路由懒加载 在 Vue.js 应用中,路由懒加载可以延迟加载路由组件直到它们被需要时才加载,从而减少应用的初始加载时间。示例代码: // router/index.js import { createRouter, createWebHistory } from vue-router;const Home () >…

AIGC技术的学习 系列二

文章目录 前言一、AIGC是什么?1.1. 基本概念1.2机器学习分类二、 语言模型2.1. 基于统计的语言模型。2.2. 基于神经网络的语言模型。2.3. 基于预训练机制的的语言模型/大语言模型三、读入数据3.1. 不得不说的Transformer3.2. 影响力3.3. 根据人类反馈的强化学习3.4. 生成式AI3…