【machine learning-七-线性回归之成本函数】

news/2024/11/14 13:59:16/

监督学习之cost function

  • 成本函数
    • 权重、偏置
    • 如何实现拟合数据
      • 成本函数是如何寻找出来w和b,使成本函数值最小化?

回归>线性回归中,我们说到评估模型训练中好坏的一个方法,是用成本函数来衡量,下面来详细介绍一下

成本函数

权重、偏置

回归>线性回归( https://blog.csdn.net/zishuijing_dd/article/details/142131936?spm=1001.2014.3001.5501)一节中,我们要实现的线性模型就是要找出输入x和y的映射关系,这种映射关系可以被表示为y = wx + b,其中需要被确定的两个值,w被称做权重,b被称做偏置。
在这里插入图片描述
假设样本数据和拟合的直线如下图:
在这里插入图片描述
那么w实际是斜率,b就是截距。样本中的数据用(x(i),y(i))表示,样本中的y值是真实值,通常用y_label标记,而拟合的y = wx + b 线性模型,输入x(i)计算得出的y_predict 被称为预测值。
训练的目标就是让y_predict更接近于y_label,也就是称为更拟合

如何实现拟合数据

方法就是使用成本函数,这是一种评估y_predict和y_label的差值(误差)的方法,通常用的成本函数是样本数据误差的平方和,也就是(y_predict-y_label)2的和,当然为了防止误差无限变大,我们使用均值,也就是再除上样本个数,整体的公式如下:
在这里插入图片描述
注意一下,这个除了2倍的样本数,主要是为了后面计算简单,y_predict是函数f(w,b)的输出,所以公式最终成了上述样式。
这个误差计算方式就叫做均方误差成本函数。
所以实际上我们训练函数的目标就是,寻找合适的w和b让这个成本函数的值更小

不同的应用经常会选用不同的成本函数,但是平方误差几乎是回归>线性回归的必选,在很多应用上的效果都不错。

成本函数是如何寻找出来w和b,使成本函数值最小化?

为了简化计算,以下面情况为例:
假设样本数据为(1,1),(2,2),(3,3)
偏置b 为0
我们的回归函数就是关于输入x的一个函数,所以它的横轴是x,如下图所示:
在这里插入图片描述
当w取不同值的时候,我们来计算成本函数:
注意一点J是关于w的函数,当w 为1的时候,按照公式计算成本函数J:
在这里插入图片描述
通过计算,我们知道当w为1的时候,成本函数的结果为0
然后我们依次计算w为0.5,1.5等的时候,成本函数的结果,然后可视化画出成本函数的线:

在这里插入图片描述
10412c9d14268716fdea40.png)

通过对成本函数的观察,我们会找到一些w,使得成本函数尽量的小。这些w就是最终的w。
至此我们就找到了合适的w,当然b也是同样的方式。


http://www.ppmy.cn/news/1528100.html

相关文章

【MySQL】MySQL和Workbench版本兼容问题

1、安装MySQL WorkBench 最新版本下载:https://dev.mysql.com/downloads/workbench/ 历史版本下载:https://downloads.mysql.com/archives/workbench/ 2、问题描述 本人在Windows下安装了一个旧版本的MySQL(5.1),同…

Google Gemini 与 OpenAI 激烈竞赛:语音 AI 与未来智能体的技术演进

引言 最近,人工智能领域频频传出令人震惊的消息,尤其是在Google Gemini 和OpenAI两大巨头的竞争中,语音AI和未来智能体的技术发展更是成为焦点。视频中的相关报道提到,Google已经将其最新的语音助手Google Gemini Alive推广给更多…

鸿萌数据恢复服务:Synology Hybrid RAID 的容错、优势和数据恢复

天津鸿萌科贸发展有限公司从事数据安全服务二十余年,致力于为各领域客户提供专业的数据恢复、数据备份解决方案与服务,并针对企业面临的数据安全风险,提供专业的相关数据安全培训。 同时,公司是群晖 Synology 网络存储设备的授权代…

大数据新视界 --大数据大厂之 Cassandra 分布式数据库:高可用数据存储的新选择

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

获取zabbix API 监控数据shell脚本,自动日常巡检服务器信息、并发送指定群组

一,前言 有zabbix监控,也并不是时刻盯着数据,所以想着,每天固定某个时刻,自动发送服务器数据到指定群组,给其他人更直观的数据。 数据就可以从zabbix API获取。参考官方API文档:https://www.z…

reader-lm:小模型 html转markdown

参考: https://huggingface.co/jinaai/reader-lm-0.5b 在线demo: https://colab.research.google.com/drive/1wXWyj5hOxEHY6WeHbOwEzYAC0WB1I5uA#scrollTo0mG9ISzHOuKK 输入网址:https://www.galaxy-geely.com/E5 结果: 代码…

repo sync 提示输入密码 git@git.xxx.com password

异常现象 一直提示输入密码 djqhuali-virtual-machine:~/mokar/test/project_test$ repo sync gitgit.huali-tec.coms password: Permission denied, please try again. gitgit.huali-tec.coms password:1:前置条件 在使用repo sync之前,请确保 .xml…

Oracle数据库中的Oracle Label Security是什么

Oracle Label Security(OLS)是Oracle数据库中的一个强大特性,它提供了基于标签的行级安全性控制。通过OLS,组织可以实施细粒度的数据访问控制,确保用户只能访问他们被授权的数据。 Oracle Label Security的工作原理 …