机器学习之数学基础:线性代数、微积分、概率论 | PyTorch 深度学习实战

ops/2025/2/6 22:31:42/

前一篇文章,使用线性回归模型逼近目标模型 | PyTorch 深度学习实战

本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started

本篇文章内容来自于 强化学习必修课:引领人工智能新时代【梗直哥瞿炜】

线性代数微积分概率论

  • 线性代数
    • 单位向量
    • 向量的内积
    • 向量的外积
    • 矩阵的乘法
    • 矩阵的内积和哈达玛积(Hadamard product)
    • 矩阵乘法的性质
  • 微积分
    • 微分
    • 偏导数
    • 梯度
    • 链式法则
  • 概率论
    • 事件
    • 随机变量与概率分布
    • 概率密度
    • 联合概率和条件概率
    • 贝叶斯定理
    • 极大似然估计

线性代数

单位向量

在这里插入图片描述

向量的内积

在这里插入图片描述

向量的外积

在这里插入图片描述

矩阵的乘法

在这里插入图片描述

矩阵的内积和哈达玛积(Hadamard product)

在这里插入图片描述

矩阵乘法的性质

在这里插入图片描述

微积分

微分

微分是指函数的局部变化的一种线性描述,自变量的微分记作 d x dx dx ,函数 y = f ( x ) y=f(x) y=f(x) 的微分记作 d y = d f ( x ) = f ′ ( x ) d x dy=df(x)=f'(x)dx dy=df(x)=f(x)dx

在这里插入图片描述

导数是微分的比值 f ′ ( x ) = d f ( x ) d x f'(x)=\frac{df(x)}{dx} f(x)=dxdf(x),导数表示变化率,微分表示变化量。

偏导数

  • 偏导数指的是多元函数在某一点处关于某一变量的导数
  • 通常用符号 ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} xf(x,y) 来表示多元函数 z = f(x,y) 关于 x 的偏导数

在这里插入图片描述

梯度

在这里插入图片描述

梯度下降算法的一个主要问题,就是没有考虑到变量和变量之间的相互影响,而是每维依靠自己的变化去调节。

链式法则

![[../assets/media/screenshot_20250205150802.png]]

在这里插入图片描述

概率论

事件

在这里插入图片描述

随机变量与概率分布

在这里插入图片描述

概率密度

在这里插入图片描述

联合概率和条件概率

在这里插入图片描述

贝叶斯定理

在这里插入图片描述

极大似然估计

在这里插入图片描述

在这里插入图片描述

理解极大似然估计,是重点。


http://www.ppmy.cn/ops/156266.html

相关文章

Mac M1 ComfyUI 中 AnyText插件安装问题汇总?

Q1:NameError: name ‘PreTrainedTokenizer’ is not defined ? 该项目最近更新日期为2024年12月,该时间段的transformers 版本由PyPI 上的 transformers 页面 可知为4.47.1. A1: transformers 版本不满足要求,必须降级transformors &#…

网络安全--边界安全

现在人们生活依赖互联网程度越来越高,网络安全也逐步进入人们日常视野,信用卡信息泄漏、开房记录被查询、商业机密泄漏等等;无不牵动着一个人、一个公司、甚至一个国家的神经。随着技术的发展,网络边界变得也越来越复杂&#xff0…

【Redis】主从模式,哨兵,集群

主从复制 单点问题: 在分布式系统中,如果某个服务器程序,只有一个节点(也就是一个物理服务器)来部署这个服务器程序的话,那么可能会出现以下问题: 1.可用性问题:如果这个机器挂了…

php的使用及 phpstorm环境部署

php语法 环境搭建:在小皮中新建网站,注意先填写域名再点击选择根目录。 成功创建网站后,打开发现forbidden,因为新建的网站里是空的,需要新建index.php文件----> 在Phpstorm中左上角打开文件,打开那个文…

4 Hadoop 面试真题

4 Hadoop 面试真题 1. Apache Hadoop 3.0.02. HDFS 3.x 数据存储新特性-纠删码Hadoop面试真题 1. Apache Hadoop 3.0.0 Apache Hadoop 3.0.0在以前的主要发行版本(hadoop-2.x)上进行了许多重大改进。 最低要求的Java版本从Java 7增加到Java 8 现在&…

一表总结 Java 的3种设计模式与6大设计原则

设计模式通常分为三大类:创建型、结构型和行为型。 创建型模式:主要用于解决对象创建问题结构型模式:主要用于解决对象组合问题行为型模式:主要用于解决对象之间的交互问题 创建型模式 创建型模式关注于对象的创建机制&#xf…

JVM01_概述、跨平台原理、分类、三大商业虚拟机

①. 什么是JVM? ①. JVM 是 java虚拟机,是用来执行java字节码(二进制的形式)的虚拟计算机 ②. jvm是运行在操作系统之上的,与硬件没有任何关系 ②. Java的跨平台及原理 ①. 跨平台:由Java编写的程序可以在不同的操作系统上运行&am…

嵌入式八股文面试题(一)C语言部分

1. 变量/函数的声明和定义的区别? (1)变量 定义不仅告知编译器变量的类型和名字,还会分配内存空间。 int x 10; // 定义并初始化x int x; //同样是定义 声明只是告诉编译器变量的名字和类型,但并不为它分配内存空间…