【机器学习-基础知识】统计和贝叶斯推断

devtools/2025/3/17 16:52:46/

1. 概率论基本概念回顾

1. 概率分布

定义: 概率分布(Probability Distribution)指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。

  • 对于离散型随机变量,使用概率质量函数来描述。
  • 对于连续型随机变量,使用概率密度函数来描述。

举例说明: 投掷一颗六面骰子,每个面上的数字(1到6)都有相同的概率(1/6)出现,这就是一个简单的概率分布例子。

2. 概率函数

定义: 概率函数(Probability Function)是指在离散型随机变量的情况下,给定一个随机变量的值时,计算该值发生的概率的函数。

公式: 对于离散型随机变量 X X X,其概率函数通常表示为 P ( X = x ) P(X=x) P(X=x),即随机变量 X X X 取某个特定值 x x x 的概率。

举例说明: 抛一枚公平的硬币,令 X X X 表示出现正面的情况,则 P ( X = 正面 ) = 0.5 P(X=\text{正面})=0.5 P(X=正面)=0.5

3. 概率分布函数(累积分布函数)

定义: 概率分布函数(Cumulative Distribution Function, CDF),也称作累积分布函数,是一个函数,它给出随机变量小于或等于某个值的概率。

公式: 对于任意实数 a a a,CDF F ( a ) = P ( X ≤ a ) F(a) = P(X \leq a) F(a)=P(Xa)

举例说明: X X X 为一个均匀分布在 [ 0 , 1 ] [0,1] [0,1] 区间上的随机变量,则 F ( x ) F(x) F(x) 对于 0 ≤ x ≤ 1 0 \leq x \leq 1 0x1 x x x,即 F ( x ) = x F(x) = x F(x)=x

在这里插入图片描述

4. 概率密度函数

定义: 概率密度函数(Probability Density Function, PDF)适用于连续型随机变量,用来描述连续型随机变量落在某个确定值附近的概率密度大小。

公式: 对于连续型随机变量 X X X,其PDF记为 f ( x ) f(x) f(x),满足条件:
∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x)dx = 1 f(x)dx=1
并且对于任意两个实数 a a a b b b ( a < b a < b a<b),随机变量 X X X 落在区间 [ a , b ] [a, b] [a,b] 内的概率由下面积分给出:
P ( a < X ≤ b ) = ∫ a b f ( x ) d x P(a < X \leq b) = \int_{a}^{b} f(x) dx P(a<Xb)=abf(x)dx

2. 统计和贝叶斯

贝叶斯公式

定义: 贝叶斯公式(Bayes’ Theorem)是一种计算条件概率的方法,它允许我们通过已知的某些条件下的事件发生的概率来更新对另一些条件下该事件发生概率的估计。

公式:
P ( A ∣ B ) = P ( B ∣ A ) ⋅ P ( A ) P ( B ) P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)
其中,

  • P ( A ∣ B ) P(A|B) P(AB) 是在事件 B 发生的情况下事件 A 发生的概率,称为后验概率
  • P ( B ∣ A ) P(B|A) P(BA) 是在事件 A 发生的情况下事件 B 发生的概率,称为后验概率
  • P ( A ) P(A) P(A) P ( B ) P(B) P(B) 分别是事件 A 和事件 B 的边际概率(无条件概率) P ( A ) P(A) P(A) 也被称为先验概率

全概率公式

定义: 全概率公式(Law of Total Probability)提供了一种方法,用于计算一个复杂事件的概率,特别是当这个事件可以被分解为几个互斥但又完全覆盖样本空间的子事件时。

公式:
如果 B 1 , B 2 , . . . , B n B_1, B_2, ..., B_n B1,B2,...,Bn 是一组互斥且穷尽的事件(即它们之间没有交集,但并集覆盖了整个样本空间),则对于任意事件 A,有
P ( A ) = ∑ i = 1 n P ( A ∣ B i ) ⋅ P ( B i ) P(A) = \sum_{i=1}^{n} P(A|B_i) \cdot P(B_i) P(A)=i=1nP(ABi)P(Bi</


http://www.ppmy.cn/devtools/167874.html

相关文章

电路原理(电容 集成电路NE555)

电容 1.特性&#xff1a;充放电&#xff0c;隔直流&#xff0c;通交流 2.电容是通过聚集正负电荷来存储电能的 3.电容充放电过程可等效为导通回路 4.多电容并联可以把容量叠加&#xff0c;但是多电容串联就不会&#xff0c;只会叠加电容的耐压值。 6.电容充放电时相当于通路&a…

【SpringBoot】最佳实践——JWT结合Redis实现双Token无感刷新

JWT概览 JWT概念 JWT是全称是JSON WEB TOKEN&#xff0c;是一个开放标准&#xff0c;用于将各方数据信息作为JSON格式进行对象传递&#xff0c;可以对数据进行可选的数字加密&#xff0c;可使用RSA或ECDSA进行公钥/私钥签名。JWT最常见的使用场景就是缓存当前用户登录信息&am…

数学建模 第一节

目录​​​​​​ 前言 一 优化模型的类型 二 线性规划1 线性规划2 三 0-1规划 总结 前言 数学建模主要是将问题转化为模型&#xff0c;然后再以编程的形式输出出来 算法都知道&#xff0c;数学建模也需要用到算法&#xff0c;但是不是主要以编程形式展示&#xff0c;而是…

【后端】【django drf】Django DRF API 编写规范(程序设计规则)

Django DRF API 编写规范&#xff08;程序设计规则&#xff09; 为了确保 Django DRF 代码的可维护性、可扩展性和高质量&#xff0c;API 设计不仅要符合 RESTful 规范&#xff0c;还需要遵循一定的程序设计规则。以下是一些关键的编写规范&#xff0c;以保证代码的清晰性、可…

DeepSeek R1 与 ktransformers:结合苹果 M4 Mac 的 LLM 推理深度分析

引言 大型语言模型&#xff08;LLM&#xff09;的快速发展为人工智能领域带来了革命性变化。DeepSeek R1 和 ktransformers 代表了软件层面的最新突破&#xff0c;而苹果在 2025 年 3 月 12 日发布的 M4 Mac 系列则提供了硬件支持。本文将深入分析这些技术的交汇点&#xff0c…

Git版本控制系统详解

文章目录 一、Git简介二、Git的基本原理三、Git的安装与配置安装配置 四、Git常用指令详解1. git init2. git clone3. git add4. git commit5. git status6. git diff7. git log8. git branch9. git checkout10. git merge11. git pull12. git push 五、Git的进阶用法1. 远程仓…

animes 和 css对比

Anime.js 并不是纯粹的 CSS 动画库&#xff0c;而是一个基于 JavaScript 的动画库。它可以通过操作 DOM 元素的属性&#xff08;如 style、transform、opacity 等&#xff09;来实现动画效果。虽然 Anime.js 的某些功能与 CSS 动画类似&#xff0c;但它的工作原理和功能范围与 …

HTTPS 证书相关

通常涉及到政府机构或官方组织的网站&#xff0c;这类网站对安全性和可信度要求较高&#xff0c;因此在选择 HTTPS 证书时需要特别注意。以下是适合的证书类型&#xff1a; 1. OV&#xff08;Organization Validation&#xff09;证书 适用场景&#xff1a;适用于需要验证组织…