数据集标签数量不均衡如何设计loss均衡数量

devtools/2024/10/18 7:48:27/

数据集标签数量不均衡如何设计loss均衡数量

1. 思路出发点：

对于哪些数量分布比值较少的标签提供更多的loss注意力比重，如何提高训练注意力比重，也就是说，让模型的梯度更多的倾向于有利于数据标签分布较少的数据训练，对于loss来说就是扩大这个标签的loss

2.公式

在这里插入图片描述
这里面PI就是疾病的分布，它实际上对于log函数，PI的取值是0-1，之和为1，也就是对于数据集小的标签来说，负值越大，在logits里面对于与实际target的差距也就越大，对于loss来说也就越需要进行优化。

3. 注意这个logits是分类之前也就是sigmoid(使用多标签分类任务)之前使用的

http://www.ppmy.cn/devtools/36393.html

视频剪辑图文实例：一键操作，轻松实现视频批量片头片尾减时

视频剪辑是现代媒体制作中不可或缺的一环，而批量处理视频更是许多专业人士和爱好者的常见需求。在剪辑过程中，调整视频的片头片尾时长可以显著提升视频的质量和观感。本文将通过图文实例的方式，向您展示如何一键操作，轻松实现视频…

Linux-04

账号管理添加账号 useradd 选项用户名 useradd -m dai删除帐号 userdel 选项用户名 userdel -r dai修改帐号 usermod 选项用户名usermod -d /home/user dai （修改位置）切换帐号 su username su dai退出账号 exit $表示普通用户 #表示超级用户&#…

墨刀原型工具-小白入门篇

1.引言作为一个小白，要怎么在短时间内快速学会原型设计？ “时间紧，任务重”，如何在短时间内理解、掌握一个原型设计工具的使用？据同事们的推荐，选择了入手“墨刀”这个软件！ 2.软件介绍墨…

鸿蒙内核源码分析(时间管理篇) | 谁是内核基本时间单位

时间概念太重要了，在鸿蒙内核又是如何管理和使用时间的呢? 时间管理以系统时钟 g_sysClock 为基础，给应用程序提供所有和时间有关的服务。用户以秒、毫秒为单位计时.操作系统以Tick为单位计时，这个认识很重要. 每秒的tick大小很大程度上决…

TiDB数据库使用tiup 缩容遇到的tikv处于下线中状态无法转为tombstone状态

官方的缩容文档 https://docs.pingcap.com/zh/tidb/stable/scale-tidb-using-tiup 论坛地址 https://tidb.net/ 问题：使用tiup 缩容遇到的tikv处于下线中状态无法转为tombstone状态解决方法 1.缩容 tiup cluster scale-in --node 10.0.1.5:20160 2.查看 tiup…