概率分布是对自然界现象的一种数学描述。它提供了一种量化随机事件结果不确定性的方法,使我们能够更深入地理解和分析自然界中的各种随机现象。在自然界中,许多事件的结果是不确定的,如天气变化、生物种群的波动、物理粒子的运动等。这些事件的结果往往受到多种因素的影响,难以准确预测。然而,通过引入概率分布,我们可以对这些事件的结果进行概率性的描述,从而揭示其内在的规律和特性。自然界的现象那么多,因此才有了各种各样的概率分布。
正态分布(也称为高斯分布)是由德国数学家卡尔·弗里德里希·高斯在研究天文学中的误差分布时提出的。而高斯函数通常指的是正态分布的概率密度函数,它是描述正态分布特性的一个数学表达式。因此,可以明确地说,是先有正态分布的概念,然后才有了描述这一分布的高斯函数。
从历史的角度来看,对于类似正态分布的思想和概念的研究,是在高斯之前就开始了。
-
雅各布·伯努利(Jakob Bernoulli)在1713年的著作《猜度术》(Ars Conjectandi)中探讨了二项式分布,并且提出了大数定律的一个版本,这是中心极限定理的基础之一。
-
阿贝尔拉尔·棣莫弗(Abraham de Moivre)在1733年的工作中提出了中心极限定理的一个早期版本,即当样本容量足够大时,二项式分布可以近似于正态分布。他还计算了正态分布的积分,并且用它来估计二项分布的累积概率。
-
皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace)在1810年的工作中进一步发展了中心极限定理,并且将其推广到了更广泛的分布。
-
卡尔·弗里德里希·高斯(Carl Friedrich Gauss)在1809年的工作中描述了高斯误差函数,并推广了正态分布,尤其是在最小二乘法中的应用。他的工作强调了这种分布在线性回归分析中的作用。
正态分布之所以被称为高斯分布,是因为德国数学家卡尔·弗里德里希·高斯在研究测量误差时首次对其进行了详细的描述和应用。高斯的工作不仅揭示了误差分布的特性,还使得这种分布在统计学和自然科学中得到了广泛的应用。由于高斯在正态分布研究方面的杰出贡献,人们后来便将这种分布命名为高斯分布,以纪念他的伟大成就。
对于一个连续型随机变量 X X X,其概率密度函数(Probability Density Function, PDF)为 f ( x ) f(x) f(x),随机变量 X X X落在区间 [ a , b ] [a, b] [a,b]内的概率 P ( a ≤ X ≤ b ) P(a ≤ X ≤ b) P(a≤X≤b)通过计算该区间内概率密度函数的积分来计算:
P ( a ≤ X ≤ b ) = ∫ a b f ( x ) d x P(a \leq X \leq b) = \int_{a}^{b} f(x) \, dx P(a≤X≤b)=∫abf(x)dx
这里的积分表示的是在区间 [ a , b ] [a, b] [a,b]上概率密度函数 f ( x ) f(x) f(x)与 x x x轴所围成的区域的面积。这个面积给出了随机变量 X X X在这个区间内取值的概率。
需要注意的是,概率密度函数 f ( x ) f(x) f(x)本身并不是概率,而是描述了概率分布的密度。只有当对概率密度函数进行积分时,得到的结果才是概率值。
对于所有的连续型随机变量,其概率密度函数在整个实数范围内的积分总是等于1,即:
∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x) \, dx = 1 ∫−∞∞f(x)dx=1
这是因为随机变量取值范围内的所有可能性加起来的概率总和必须为100%,即必然会发生某一个取值。
高斯函数常出现在图像处理领域中
- 高斯滤波器是图像处理中的一种平滑操作,用于去除图像噪声或降低图像细节。
- 高斯函数作为频谱分析中的窗函数,用于减少频率泄漏。
- 在计算机视觉中,尺度空间表示通常基于高斯核构建。
- 正态分布是最常见的连续概率分布之一,广泛应用于各种统计分析中。
– 在贝叶斯分类器中,当假定类条件下的特征服从高斯分布时,可以简化计算过程。
– 在高斯混合模型(GMM)中,通过组合多个高斯分布来建模复杂的数据分布。
1、2、3作为函数直接用,4作为分布用。