【深度学习】3.损失函数的作用

devtools/2025/1/23 0:09:58/

损失函数的作用

image-20250120004225939

  • 假设把猫这张图片分成四个像素点,分别为:56、231、24、2(实际应该是三维的,因为还有颜色通道的维度,这里简化成二维)。

  • 像素点拿到以后,进行三分类,粉红色为第一组W1,绿色为第二组W2,灰色为第三组W3,即cat,dog,ship。对应权重W的三行四列矩阵,三代表三类,四代表每个类别有四个像素点。

  • 通过得分函数计算得分。(实际就是矩阵运算)

  • 结果保存于 f ( x ; W , b ) f(x;W,b) f(x;W,b)矩阵,可以得出不同类权重W对于此四个像素值计算的结果大小不同。

  • 这里暂时对大小无定义。

对W的其中一行说明,如第二行:1.5、1.3、2.1、0.0,其中2.1最大,也就是说明2.1这个位置对应的像素点即第三个像素点24对判断此图属于dog类最重要。0.0最小,说明第四个像素点2对判断这张图是dog不太重要。

对于第一行的负值(-0.5)来说,正值起到促进作用,故负值起到抑制作用。

那W矩阵是如何得到的?

W矩阵是优化而来的。一开始可以随机产生一个3×4的矩阵,其中元素都是随机值,上述就是随机值的例子。但我们不难发现,猫是负的分,狗和船是正的分,明明是一只猫,但得到的结果却是负分,继而错误的将图片判断为狗了。产生这种现象的原因不是x的问题,因为x属于输入数据,因此W存在问题,需要变化。

可以得出,神经网络在整个的生命周期当中实际上就是在做一件事:什么样的W能更适合于咱们的数据去做当前这个任务

因此,在得到随机W之后,需要通过优化不断改善W,就和不断学习一样。W作为决策很重要,b仅仅是微调。

image-20250120011358751


那上面这个W有多不好?

image-20250120011752637

损失函数既能做分类,也能做回归,做的事情很多,唯一的区别就是损失函数如何定义的。因此做不同任务就是损失函数不同而已。

image-20250120011907926

对于如上图例子,第一张图片car的得分最高,将猫的图片错误的判断成了车,因此做的不好。

怎么办?

image-20250120012653074

通过上述损失函数可以将好的测试变成接近于0的数值。

  • 第二列车的值最大判断的是正确的,因此通过计算得到0。
  • 第三列青蛙的判断为负值,就很离谱,因此损失函数计算出的值也很大。

http://www.ppmy.cn/devtools/152726.html

相关文章

kafka学习笔记2 —— 筑梦之路

KRaft模式 Kafka的KRaft模式是一种新的元数据管理方式,旨在去除对ZooKeeper的依赖,使Kafka成为一个完全自包含的系统。在Kafka的传统模式下,元数据管理依赖于ZooKeeper,这增加了部署和运维的复杂性。为了解决这个问题,…

人类大脑与大规模神经网络的对比及未来展望

引言 随着人工智能(AI)技术的迅猛发展,研究人员不断尝试构建更加复杂和强大的模型,以期实现与人类大脑相媲美的智能水平。本文将探讨当前大规模神经网络(LLM, Large Language Models)的发展现状&#xff0…

vue md5加密

在Vue中使用MD5加密&#xff0c;你可以使用第三方库如crypto-js。首先&#xff0c;你需要安装这个库&#xff1a; npm install crypto-js --save然后&#xff0c;在你的Vue组件中引入crypto-js并使用其MD5功能&#xff1a; <template><div><input v-model&quo…

二、vue智能Ai对话(高仿通义千问)流式进阶版

1、安装依赖、启动 // 安装依赖 npm install // 启动服务 node server.js 2、浏览器运行html 3、流式进阶版视频地址&#xff1a;流式进阶版视频 4、各位如有需要&#xff0c;请下载源码包。

微信小程序的中医信息资源管理系统

微信小程序的中医信息资源管理系统是一个集中医知识传播、养生资源管理、在线咨询与个人信息管理等功能于一体的综合性平台。 一、系统背景与意义 中医作为中国传统医学的重要组成部分&#xff0c;具有悠久的历史和丰富的理论体系。随着现代科技的发展&#xff0c;将中医与互…

PDF文件提取开源工具调研总结

概述 PDF是一种日常工作中广泛使用的跨平台文档格式&#xff0c;常常包含丰富的内容&#xff1a;包括文本、图表、表格、公式、图像。在现代信息处理工作流中发挥了重要的作用&#xff0c;尤其是RAG项目中&#xff0c;通过将非结构化数据转化为结构化和可访问的信息&#xff0…

网络编程-网络原理HTTP初识

文章目录 TCP/IP五层协议栈关于自定义协议常见自定义协议引入行文本格式XML格式JSONprotobuf HTTP原理非自定义的应用层协议HTTP的发展HTTP的传输模式HTTP协议中的代理模式和抓包工具 TCP/IP五层协议栈 具体的内容, 我们之前的网络初始里面有, 其实就是先前的计算机的发明者把…

使用vue-next-admin框架后台修改动态路由

vue-next-admin框架是一个基于 Vue 3 和 Vite 构建的后台管理系统框架。它采用了最新的前端技术栈&#xff0c;旨在提供一个高效、灵活、现代化的管理后台解决方案。该框架主要用于构建功能丰富且易于定制的管理后台应用&#xff0c;适合各种中大型项目。 其主要特点包括&am…