B站吴恩达机器学习笔记

news/2025/2/1 6:09:38/

机器学习视频地址:

4.5 线性回归中的梯度下降_哔哩哔哩_bilibili

损失函数学习地址:

损失函数选择

选凸函数的话,会收敛到全局最小值。证明凸函数用Hessian矩阵。凸函数定义:两点连线比线上所有点都大。

batch理解:

  • 机器学习中,指的是用于一次模型更新的所有样本的集合。当使用批处理进行训练时,每次更新模型参数是基于整个批处理内的所有样本计算得到的梯度。
  • batch设置为2的话,数据集6张图片,第一次1 2第二次3 4第三次5 6

梯度下降法学习地址:

numpy学习地址:

Python之Numpy详细教程_python numpy-CSDN博客

numpy常用函数:


np.array([1,2,3])np.array(
[1,2],
[2,3],
[3,4])
//reshape(-1, 1) 是一种便捷的方式来将任何一维数组转换为列向量,其中 -1 告诉 NumPy 自动计算合适的尺寸以匹配另一维度的大小(在这里是指定的 1)
//reshape(-1, x)可以理解为得到(?,x)的数组
np.array([1, 2, 3]).reshape(-1, 1)
//做点积操作
np.dot(w,x)

特征归一化处理:

归一化方法学习地址:

Min-Max 归一化:通过线性变换将数据映射到[0, 1]区间内。

Z-score 标准化(Standardization):这种方法将原始数据转换为均值为0、标准差为1的数据分布,即标准正态分布。

L2 正则化(也称为向量归一化):对于每个样本,将其特征向量除以其L2范数,使得每个样本的特征向量长度为1。这在文本分类等需要处理高维度稀疏数据的任务中非常有用。

Batch Normalization:不同于上述针对输入数据的归一化方法,Batch Normalization是在神经网络内部使用的一种技术,通常应用于隐藏层的输出上。它通过对每一批次的小批量数据进行归一化,保持输入到每一层的分布稳定,从而加速训练过程,并允许使用更高的学习率。

Layer Normalization:与Batch Normalization不同,Layer Normalization是基于单个训练样本而不是批次来计算均值和方差,因此不受批次大小的影响,特别适合于循环神经网络(RNN)或需要在线学习的场景。

梯度下降中如何选择\alpha

正常情况下会是这样,如果误差越来越大说明学习率大了。

停止条件:

1.看图达到最小。2.判断收敛(数分那种收敛判定)。

如何选择:

这两种说明学习率太大或者程序有bug。

常用技巧就是将学习率设置的很小。

通常来说:0.001 0.003  0.01 0.03  0.1  0.3 1 ...经常尝试扩大三倍取值。


http://www.ppmy.cn/news/1568353.html

相关文章

【面试】【详解】计算机网络(TCP 三次握手,四次挥手)

一、计算机网络详解 (一)计算机网络概述 定义:计算机网络是通过传输介质将多台计算机连接起来,以实现数据通信和资源共享的系统。 功能: (1) 数据通信:实现不同设备之间的数据传输。 (2) 资源共享&#…

电子电气架构 --- 在智能座舱基础上定义人机交互

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 简单,单纯,喜欢独处,独来独往,不易合同频过着接地气的生活…

MySQL(高级特性篇) 13 章——事务基础知识

一、数据库事务概述 事务是数据库区别于文件系统的重要特性之一 (1)存储引擎支持情况 SHOW ENGINES命令来查看当前MySQL支持的存储引擎都有哪些,以及这些存储引擎是否支持事务能看出在MySQL中,只有InnoDB是支持事务的 &#x…

RabbitMQ 匿名队列详解

在小组代码 Review 时,讨论到了 RabbitMQ 的匿名队列,于是去网上查了下关于匿名队列的内容,并记录下来。 匿名队列是一种特殊的临时队列,在消息传递过程中有着独特的用途,匿名队列也被称为临时队列,它没有…

Java CAS操作

通过前面的学习认识到了CPU缓存,Java内存模型,以及线程安全的原子、可见、顺序三大特性。本文则重点认识CAS操作,这是Java并发编程常见的一个操作,AbstractQueuedSynchronizer基于此操作提供了丰富的同步器和各种锁。 目录 CAS&am…

从新手到高手的蜕变:MySQL 视图进阶全攻略

一、视图是什么 视图是一种虚拟表,它并非像普通表那样实际存储数据,而是基于 SQL 查询语句定义的。视图是从一个或多个基表(实际存在的物理表)或其他视图中导出的结果集。可以将其视为一个预定义的查询,当执行针对视图…

Python 之 Excel 表格常用操作

示例文件 test.xlsx 将各个表单拆分成单独的 Excel 文件 import os.pathimport openpyxl import pandasdef handle_excel(file_path):dirname os.path.dirname(file_path)basename os.path.basename(file_path).split(".")[0]wb openpyxl.load_workbook(file_pat…

游戏开发领域 - 游戏引擎 UE 与 Unity

游戏引擎 游戏引擎是用于开发电子游戏的软件框架,它提供图形渲染、物理模拟、音频处理、动画系统、脚本编写等功能,帮助开发者高效创建电子游戏 但是,游戏引擎也不仅限于游戏开发,还广泛应用于其他领域,例如&#xff…