概率论公式整理

news/2024/11/17 11:03:52/

1 概率

  • 古典概型和几何概型
    • 古典概型(有限等可能)
    • 几何概型(无限等可能)
  • 条件概率

P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B) = \frac{P(AB)}{P(B)} P(AB)=P(B)P(AB)

  • 全概率公式

P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B) = \sum \limits_{i = 1}^n P(A_i)P(B|A_i) P(B)=i=1nP(Ai)P(BAi)

  • 贝叶斯公式:根据先验概率计算后验概率

P ( H ∣ E ) = P ( H ) P ( E ∣ H ) P ( E ) P ( B i ∣ A ) = P ( B i ) P ( A ∣ B i ) ∑ i P ( B i ) P ( A ∣ B i ) P ( H i ∣ E 1 E 2 ⋯ E m ) = P ( E 1 ∣ H i ) P ( E 2 ∣ H i ) ⋯ P ( E m ∣ H i ) P ( H i ) ∑ j = 1 n P ( E 1 ∣ H j ) P ( E 2 ∣ H j ) ⋯ P ( E m ∣ H j ) P ( H j ) P(H|E) = \frac{P(H)P(E|H)}{P(E)} \\ P(B_i | A) = \frac{P(B_i)P(A|B_i)}{\sum_i P(B_i) P(A|B_i)} \\ P(H_i | E_1E_2 \cdots E_m) = \frac{P(E_1|H_i)P(E_2|H_i) \cdots P(E_m|H_i)P(H_i)}{\sum \limits_{j = 1}^n P(E_1|H_j)P(E_2|H_j) \cdots P(E_m|H_j)P(H_j)} P(HE)=P(E)P(H)P(EH)P(BiA)=iP(Bi)P(ABi)P(Bi)P(ABi)P(HiE1E2Em)=j=1nP(E1Hj)P(E2Hj)P(EmHj)P(Hj)P(E1Hi)P(E2Hi)P(EmHi)P(Hi)

  • 先验概率和后验概率
    • 先验概率:事情未发生,根据以往数据分析得到的概率
    • 后验概率:事情已发生,这件事情发生的原因是由某个因素引起的概率。 P ( B i ∣ A ) P(B_i|A) P(BiA) B i B_i Bi 为某个因素, A A A 为已经发生的结果

2 离散随机变量及分布

X X X 的概率分布函数:

  • 两点分布(01分布) X ∼ B ( 1 , p ) X \thicksim B(1, p) XB(1,p)

P ( X = 0 ) = 1 − p P ( X = 1 ) = p p ∈ ( 0 , 1 ) P(X = 0) = 1 - p \\ P(X = 1) = p \\ p \in (0,1) P(X=0)=1pP(X=1)=pp(0,1)

  • 二项分布(伯努利分布) X ∼ B ( n , p ) X \thicksim B(n, p) XB(n,p)

P ( X = k ) = C n k p k ( 1 − p ) n − k p ∈ ( 0 , 1 ) , k = 0 , 1 , 2 , ⋯ , n P(X = k) = C_n^k p^k (1 - p)^{n - k} \hspace{1em} p \in (0,1), k = 0,1,2,\cdots, n P(X=k)=Cnkpk(1p)nkp(0,1),k=0,1,2,,n

  • 泊松分布 X ∼ P ( λ ) X \thicksim P(\lambda) XP(λ)

P ( X = k ) = λ k e − λ k ! λ > 0 , k = 0 , 1 , 2 , ⋯ P(X = k) = \frac{\lambda ^ k e ^{- \lambda}}{k!} \hspace{1em} \lambda \gt 0, k = 0,1,2,\cdots P(X=k)=k!λkeλλ>0,k=0,1,2,

  • 几何分布 X ∼ G ( p ) X \thicksim G(p) XG(p)

P ( X = k ) = ( 1 − p ) k − 1 p p ∈ ( 0 , 1 ) , k = 1 , 2 , ⋯ P(X = k) = (1 - p) ^ {k - 1} p \hspace{1em} p \in (0, 1), k = 1, 2, \cdots P(X=k)=(1p)k1pp(0,1),k=1,2,

  • 超几何分布 X ∼ h ( n , N , M ) X \thicksim h(n, N, M) Xh(n,N,M)

N N N个产品, M M M个次品,从中无放回随机抽取 n n n个,不合格数 X X X服从超几何分布
P ( X = k ) = C N − M n − k C M k C N n P(X = k) = \frac{C_{N - M} ^ {n - k}C_M^k}{C_N ^ n} P(X=k)=CNnCNMnkCMk

联合分布函数:二维随机变量 ( X , Y ) (X, Y) (X,Y) 的分布函数。

边缘概率函数:从联合分布函数得到只关于一个变量的概率分布,而不再考虑另一变量的影响,相当于降维操作

条件概率函数:在一个已知变量发生的情况下,考虑另一个变量的概率分布函数

3 连续随机变量及分布

概率密度函数:连续型随机变量 X X X 的分布函数为 F ( x ) F(x) F(x) ,若存在一个非负的函数 f ( x ) f(x) f(x) ,使得对任意 x x x 有:
F ( x ) = ∫ − ∞ x f ( t ) d t F(x) = \int _{-\infin} ^x f(t) dt F(x)=xf(t)dt
则称 f ( x ) f(x) f(x) X X X 的概率密度函数

联合概率密度:二维随机变量的概率密度函数

边缘分布函数:二维随机变量关于某一维变量的概率密度分布,化为关于这一维变量的积分函数

  • 均匀分布 X ∼ U ( a , b ) X \thicksim U(a, b) XU(a,b)

f ( x ) = { 1 b − a , a ≤ x ≤ b 0 , 其他 f(x) = \begin{cases} \frac{1}{b - a}, & a \le x \le b \\ 0, &其他 \end{cases} f(x)={ba1,0,axb其他

  • 指数分布 X ∼ E ( λ ) X \thicksim E(\lambda) XE(λ)

f ( x ) = { λ e − λ x , x > 0 0 , 其他 f(x) = \begin{cases} \lambda e ^{-\lambda x}, & x \gt 0 \\ 0, &其他 \end{cases} f(x)={λeλx,0,x>0其他

  • 正态分布(高斯分布) X ∼ N ( μ , σ 2 ) X \thicksim N(\mu, \sigma ^ 2) XN(μ,σ2)

f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2 \pi} \sigma} \huge{e} ^ {\large{- \frac{(x - \mu) ^ 2}{2 \sigma ^ 2}}} f(x)=2π σ1e2σ2(xμ)2

标准正态分布 X ∼ N ( 0 , 1 ) X \thicksim N(0, 1) XN(0,1)

4 随机变量数字特征

  • 数学期望

离散分布的数学期望:

  1. 两点分布 p p p

  2. 二项分布 n p np np

  3. 泊松分布 λ \lambda λ

  4. 几何分布 1 p \frac{1}{p} p1

连续分布的数学期望:
E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x E(X) = \int _{-\infin}^{+ \infin} xf(x) dx E(X)=+xf(x)dx

  1. 均匀分布 a + b 2 \frac{a + b}{2} 2a+b
  2. 指数分布 1 λ \frac{1}{\lambda} λ1
  3. 正态分布 μ \mu μ
  • 方差

D ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − E 2 ( X ) D(X) = E[(X - E(X))^2] = E(X^2) - E^2(X) D(X)=E[(XE(X))2]=E(X2)E2(X)

  • 协方差

C o v ( X , Y ) = E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] = E [ X Y ] − E [ X ] E [ Y ] Cov(X, Y) = E[(X - E[X])(Y - E[Y])] = E[XY] - E[X]E[Y] Cov(X,Y)=E[(XE[X])(YE[Y])]=E[XY]E[X]E[Y]

从数值来看,协方差的数值越大,两个变量同向程度也就越大。反之亦然。

两个集合X和Y的协方差计算公式为:
Cov ( X , Y ) = 1 n ∑ i = 1 n ( x i − x ˉ ) ( y i − y ˉ ) \text{Cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y}) Cov(X,Y)=n1i=1n(xixˉ)(yiyˉ)

  • 相关系数

ρ X Y = C o v ( X , Y ) D ( X ) D ( Y ) \rho_{_{XY}} = \frac{Cov(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}} ρXY=D(X) D(Y) Cov(X,Y)

相关系数等于0,不相关,相互独立

  • 独立、互斥、相关(线性相关)

5 大数定理和中心极限定理

  • 大数定理

样本数量很大的时候,样本均值和数学期望充分接近,也就是说当我们大量重复某一相同的实验的时候,其最后的实验结果可能会稳定在某一数值附近。

伯努利大数定律: f n ( A ) f_n(A) fn(A) 为事件 A A A 出现的频率, p p p 是事件A每次实验中发生的概率
l i m n → ∞ P { ∣ f n ( A ) − p ∣ < ε } = 1 \mathop{lim} \limits _{n \rightarrow \infin} P \{ |f_n(A) - p| \lt \varepsilon \} = 1 nlimP{fn(A)p<ε}=1
还有切比雪夫大数定律,马尔科夫大数定律

  • 中心极限定理

大量( n → ∞ n \to \infin n)、独立、同分布的随机变量之和,近似服从于一维正态分布。

随机变量之和的标准化变量为
η = ∑ i = 1 n x i − n μ n σ \eta = \frac{\sum \limits _{i = 1} ^{n} x_i - n \mu}{\sqrt{n} \sigma} η=n σi=1nxinμ

均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2的独立同分布的随机变量序列 x 1 , x 2 , ⋯ , x n x_1, x_2, \cdots, x_n x1,x2,,xn,只要 n n n足够大,就有
∑ i = 1 n x i − n μ n σ ∼ 近似 N ( 0 , 1 ) \frac{\sum \limits _{i = 1} ^{n} x_i - n \mu}{\sqrt{n} \sigma} \stackrel{近似}{\thicksim} N(0, 1) n σi=1nxinμ近似N(0,1)

6 参数估计

极大似然估计要求所有采样都是独立同分布的

就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值!

求最大似然估计量 θ ^ \hat \theta θ^ 步骤:

  1. 写出似然函数,似然函数越大越好

L = ∏ i = 1 n f ( x i ) L = \prod \limits _{i = 1} ^n f(x_i) L=i=1nf(xi)

  1. 对似然函数取对数,整理

  2. 求导数,让导数等于0

  3. 解似然方程


http://www.ppmy.cn/news/1547708.html

相关文章

DAHL:利用由跨越 29 个类别的 8,573 个问题组成的基准数据集,评估大型语言模型在生物医学领域长篇回答的事实准确性。

2024-11-14&#xff0c;由首尔国立大学创建的DAHL数据集&#xff0c;为评估大型语言模型&#xff08;LLMs&#xff09;在生物医学领域长文本生成中的幻觉问题提供了一个重要的工具&#xff0c;这对于提高模型的准确性和可靠性具有重要意义。 数据集地址&#xff1a;DAHL|生物医…

C++__day1

1、思维导图 2、如果登录失败&#xff0c;提示用户登录失败信息&#xff0c;并且提示错误几次&#xff0c;且重新输入&#xff1b;如果输入错误三次&#xff0c;则退出系统 #include <iostream> using namespace std;int main() {string id , pswd;string user"admi…

java集合—List的底层结构和源码分析

Java集合框架中的List接口是一个有序的集合&#xff0c;它可以存储重复的元素。List接口的底层结构可以有多种实现&#xff0c;常见的有ArrayList和LinkedList。 ArrayList的底层结构&#xff1a; ArrayList是基于数组实现的&#xff0c;其内部使用一个Object类型的数组来存储…

动态规划 之 子序列系列 算法专题

一. 最长递增子序列 最长递增子序列 状态表示 dp[i] 表示以i位置为结尾, 最长的递增子序列状态转移方程 1.如果以i位置为开头 那么长度为1 2.如果以i位置结尾, 由于不知道从前面哪一个位置取子序列, 所以要定义一个j(0 < j < i - 1), 找到以j位置结尾的所有子序列中, 最…

AndroidStudio-Activity的生命周期

一、Avtivity的启动和结束 从当前页面跳到新页面&#xff0c;跳转代码如下&#xff1a; startActivity(new Intent(源页面.this&#xff0c;目标页面.class))&#xff1b; 从当前页面回到上一个页面&#xff0c;相当于关闭当前页面&#xff0c;返回代码如下&#xff1a; finis…

【视频讲解】Python深度神经网络DNNs-K-Means(K-均值)聚类方法在MNIST等数据可视化对比分析...

全文链接&#xff1a;https://tecdat.cn/?p38289 分析师&#xff1a;Cucu Sun 近年来&#xff0c;由于诸如自动编码器等深度神经网络&#xff08;DNN&#xff09;的高表示能力&#xff0c;深度聚类方法发展迅速。其核心思想是表示学习和聚类可以相互促进&#xff1a;好的表示会…

thinkphp 连表查询

在ThinkPHP中&#xff0c;可以使用Query类的join方法来进行连表查询。连表查询可以用于在查询结果中包含多个表的数据&#xff0c;以便获取更丰富的信息。 以下是一个简单的例子&#xff0c;假设有两个表user和order&#xff0c;我们想要查询用户的订单信息&#xff1a; $use…

sqlsever 分布式存储查询

当数据存储在不同的服务器上的时候怎么取出来进行正常管连呢?比如你有 A 和B 两个服务器 里面存有两个表 分别是 A_TABLE、B_TABLE 其中 他们的关联关系是 ID 互相关联 1.创建链接服务器如果在B数据库要访问A数据库 那么 就在B数据库创建 -- 创建链接服务器 EXEC sp_addlink…