李宏毅机器学习笔记(1)—机器学习基本概念+深度学习基本概念

ops/2025/4/1 4:15:26/

在这里插入图片描述

机器学习基本概念

1、获取模型

步骤

1.1、假定未知函数

带未知参数的函数
在这里插入图片描述

1.2、定义损失函数

真实值:label
在这里插入图片描述
MAE
MSE
几率分布,cross-entropy?
在这里插入图片描述

1.3、优化

  • 单独考虑一个参数
    让损失函数最小,找导数为零的点
    单独考虑w,w0是随机选取的一个数
    斜率为负,左高右低,提高w,反之则反
    埃塔:调整步伐,学习速率,自己设定的(即hyperparameters)
    在这里插入图片描述
  • 考虑两个参数
    在这里插入图片描述
    在这里插入图片描述

2、验证模型

预测未来数据
在这里插入图片描述

3、模型调整

观察真实资料,周期性的,每隔七天就特别低,这个模型显示只能预测一天,我们应该看一个周期七天的的数据,可能模型更精准,因此要调整模型,考虑七天的数据
在这里插入图片描述
在这里插入图片描述

线性回归模型太简单了,需要一个复杂的模型模拟预测,线性模型存在Model Bias
在这里插入图片描述
引入threshold
在这里插入图片描述
Piecewise LInear Curve线段组成
在这里插入图片描述
如果是连续的曲线,逼近
在这里插入图片描述
因此,假设X和Y关系复杂,那么我们假定一个带有未知数的函数,这个函数表示一堆蓝色的函数(Hard SIgmoid)加上一个常数。这个蓝色函数公式如何写?直接写不容易,可以用曲线逼近,用sigmoid函数(即S形的函数)
在这里插入图片描述
调整b和w,可以获得不同形状的函数,来逼近蓝色函数
在这里插入图片描述
在这里插入图片描述
逼近模拟后获取新模型,之前使用单个特征值(x),接下来过渡到使用多个feature(x)

在这里插入图片描述
直观方式,考虑3个特征,j=1,2,3;i:一个i代表一个蓝色函数/sigmoid函数。wij表示第i个sigmoid函数在第j个特征处的权重
在这里插入图片描述
转换成矩阵
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用向量矩阵表示防治法,则转换成如下
在这里插入图片描述
接下来,找未知参数,重新定义一下符号,x:feature;未知参数:w,b,cT,b,把这些拼起来,编程一个长向量
在这里插入图片描述
至此,完成了机器学习第一步:函数定义
在这里插入图片描述
接下来进行第2步,求损失函数
在这里插入图片描述
最后,优化,找一组set使误差最小,对每个一未知的参数计算微分
在这里插入图片描述
在这里插入图片描述
取部分资料进行计算,再用下一个资料算gradient,再更新参数,每次参数更新叫做update,所有batch看过后叫epoch
在这里插入图片描述
区别update和epoch,batch size也是hyperparams
在这里插入图片描述

  • ReLU函数
    hard sigmoid vs soft sigmoid
    在这里插入图片描述
    换成relu函数
    在这里插入图片描述
    在这里插入图片描述
    接下来,继续改模型,反复求a,多做几次的sigmoid或relu运算
    在这里插入图片描述
    一层的意思是,通过一次ReLU运算
    在这里插入图片描述
    在这里插入图片描述
    除夕,机器不知道
    测试了几个模型,还不知道一个好名字,
    在这里插入图片描述
    神经网络,80,90年代已经出现,很多layer就叫deep,神经网络越叠越深
    在这里插入图片描述
    在这里插入图片描述
    反复用ReLu或sigmoid函数,为什么不变胖,而是变深
    在这里插入图片描述
    overfitting(过拟合):在训练资料好,在测试资料上不好在这里插入图片描述
    为了预测未来的资料,应该选3层还是4层,选模型问题
    在这里插入图片描述
    在这里插入图片描述

http://www.ppmy.cn/ops/170781.html

相关文章

【stm32--HAL库DMA+USART+空闲中断不定长收发数据】

串口通信-Hal库实现不定长度收发,DMAUSART DMA串口STM32CUBEMX配置(工程创建)基础配置时钟配置工程配置 代码编写现象 DMA 在正式配置之前,我们先来一起简单了解一下DMA。DMA(Direct Memory Access,直接内…

BS4 案例实战 小案例

BS4 案例分析 实现步骤: 1.了解HTML和网页结构 2.安装和导入相关依赖库 3.发送http请求获取网页内容 4.解析HTML网页内容 5.定位内容和提取数据 6.保存抓取的数据 - coding: UTF-8 import os import timeimport requestsfrom bs4 import BeautifulSoupfrom openpyxl i…

Unity UGUI - 六大基础组件

目录 一、Canvas上 1. Canvas:复制渲染子UI控件 2. ✨Canvas Scaler✨:画布分辨率自适应 3. Graphics Raycaster:射线事件响应 4. ✨Rect Transform✨:UI位置锚点对齐 二、Event System上 5. Event System 6. Standalone …

turtle的九个使用

一 import turtle as t color [red,green,blue,orange,pink] for i in range(len(color)):t.penup()t.goto(-20070*i,0)t.pendown()t.pencolor(color[i])t.circle(50, steps 5) t.done()二 #在____________上补充代码 #不要修改其他代码import random as r import turtle a…

[特殊字符] Hyperlane:Rust 高性能 Web 框架的终极选择 [特殊字符]

🔥 Hyperlane:Rust高性能Web框架的终极选择 🔥 📈 性能封神:32万QPS碾压群雄 在1000并发压测中,Hyperlane以307,568.90 req/s的恐怖QPS稳居Rust生态第一,甚至超越Tokio框架!开启Kee…

解锁SEO的未来:从量子搜索到情感共鸣的技术探索

搜索引擎优化(SEO)作为数字营销的基石,正在迈向一个充满想象力的新纪元。2025年,随着量子计算的初步商用、情感AI的崛起以及用户体验的深度个性化,SEO不再仅仅是关键词和链接的游戏,而是技术与人性交织的艺…

Unix/Linux 系统下的文件权限

文件权限 drwxr-xr-x 是一个常见的 Unix/Linux 文件系统中的权限表示法,用于描述文件或目录的访问权限。它由 10 个字符组成,每个字符的位置和含义如下: 第一个字符:文件类型 d 表示目录 (directory)表示普通文件 (regular file)l…

AWS云安全全面详解:从基础防护到高级威胁应对

随着企业加速向云端迁移,AWS作为全球最大的云服务提供商之一,其安全性成为用户首要关注的问题。本文将深入剖析AWS云安全架构,从基础防护到高级威胁应对,帮助您构建全方位的云安全防线。 一、AWS安全责任共担模型 在深入探讨AWS具体安全措施前,首先需要理解AWS的安全责任…