【分布族谱】正态分布和对数正态分布的关系

news/2024/11/14 17:39:44/

文章目录

    • 正态分布
    • 对数正态分布的推导
    • 测试

正态分布

正态分布,最早由棣莫弗在二项分布的渐近公式中得到,而真正奠定其地位的,应是高斯对测量误差的研究,故而又称Gauss分布。。测量是人类定量认识自然界的基础,测量误差的普遍性,使得正态分布拥有广泛的应用场景,或许正因如此,正太分布在分布族谱图中居于核心的位置。

正态分布 N ( μ , σ ) N(\mu, \sigma) N(μ,σ)受到期望 μ \mu μ和方差KaTeX parse error: Undefined control sequence: \simga at position 1: \̲s̲i̲m̲g̲a̲^2的调控,其概率密度函数为

1 2 π σ 2 exp ⁡ [ − ( x − μ ) 2 2 σ 2 ] \frac{1}{\sqrt{2\pi\sigma^2}}\exp[-\frac{(x-\mu)^2}{2\sigma^2}] 2πσ2 1exp[2σ2(xμ)2]

μ = 0 \mu=0 μ=0 σ = 1 \sigma=1 σ=1时,为标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),对应概率分布函数为 Φ ( x ) = 1 2 π exp ⁡ [ − x 2 2 ] \Phi(x)=\frac{1}{\sqrt{2\pi}}\exp[-\frac{x^2}{2}] Φ(x)=2π 1exp[2x2],形状如下,

在这里插入图片描述

scipy.stats中,分别封装了正态分布类norm和标准正态分布类halfnorm

对数正态分布的推导

log X
norm
lognorm

假设 Z Z Z满足标准正态分布 Z ∼ N ( 0 , 1 ) Z\sim N(0,1) ZN(0,1),则随机变量 X = a Z X=a^Z X=aZ符合对数正态分布。

根据定义,可以很方便地推导出对数正态分布的概率密度函数,由于 z = log ⁡ a x z=\log_ax z=logax,则

f X ( x ) = d P ( X ⩽ x ) d x = d P ( log ⁡ a X ⩽ log ⁡ a x ) d x = d Φ ( log ⁡ a x ) d x = 1 x ln ⁡ a d Φ ( z ) d z \begin{aligned} f_X(x)&=\frac{\text dP(X\leqslant x)}{\text dx}=\frac{\text dP(\log_a X\leqslant\log_a x)}{\text dx}\\ &=\frac{\text d\Phi(\log_a x)}{\text dx}=\frac{1}{x\ln a}\frac{\text d\Phi(z)}{\text dz} \end{aligned} fX(x)=dxdP(Xx)=dxdP(logaXlogax)=dxdΦ(logax)=xlna1dzdΦ(z)

s = ln ⁡ a s=\ln a s=lna,可得到

f ( x , s ) = 1 s x 2 π exp ⁡ ( − ln ⁡ 2 x 2 s 2 ) f(x,s)=\frac{1}{sx\sqrt{2\pi}}\exp(-\frac{\ln^2 x}{2s^2}) f(x,s)=sx2π 1exp(2s2ln2x)

测试

scipy.stat中,lognorm为对数正态分布类,下面对正态分布和对数正态分布做一个简单的映射。

import numpy as np
import scipy.stats as ss
import matplotlib.pyplot as plt
r = ss.norm.rvs(size=10000)
re = 1.2 ** r               # 这些数值将符合a=1.2的对数正态分布plt.hist(re, density=True, bins=100, alpha=0.8)rv = ss.lognorm(np.log(1.2))
st, ed = rv.interval(0.995)
xs = np.linspace(st, ed, 200)
plt.plot(xs, rv.pdf(xs))
plt.show()

效果如下

在这里插入图片描述


http://www.ppmy.cn/news/69998.html

相关文章

SaleSmartly聊天机器人如何帮助您的电商业务

从基于规则的机器人到虚拟助手,聊天机器人正在成为网络交互的标准。越来越多的企业正在使用它们来吸引客户、改善客户服务并增强用户体验。现在有非常多的软件也提供聊天机器人的帮助,比如SaleSmartly(ss客服),本文以它…

如何提高跨职能团队的绩效和成果

在50年代,当计算机仍被视为复杂的计算器时,西北互助人寿保险公司就计算机对未来业务的影响进行了研究。有趣的是,该公司的首席执行官为这项研究设立了一个不同寻常的团队——由来自多个部门的员工组成,每个人都看到了计算机在保险…

计网笔记 数据链路层 (1-2) 封装成帧、差错控制、流量控制与可靠传输、停止等待协议、后退N帧协议(GBN)、选择重传协议(SR)

文章目录 前言在这里插入图片描述 零、数据链路层基本概念一、功能0、数据链路层功能概述1、封装成帧和透明传输1.1封装成帧1.2 透明传输1.3组帧方法 2、数据链路层的差错控制2.0差错从何而来2.1位错(比特错,1变成0,0变成1)2.2帧错…

记一次靶场搭建与渗透测试

渗透目标 通过Windows7打入工作组环境,穿透两层内网拿到DC(域控制器)权限 环境搭建 环境搭建 网络拓扑 虚拟机网络配置 渗透测试 永恒之蓝外网打点 nmap -sS 192.168.2.0/24扫描外网存活主机,发现两台主机192.168.2.128和192…

7.机器学习诊断法

怎样评估机器学习算法的性能? 利用机器学习诊断法来评估机器学习算法的性能。诊断法是一种测试法,通过这种测试能够了解算法在哪里出了问题,这也能够告诉我们要想改进一种算法的效果、什么样的尝试才是有意义的。 7.1 评估假设 评价算法学…

0702可分类变量的微分方程-微分方程

文章目录 1 一阶微分方程变形2 可分离变量的微分方程2.1 定义2.2 解法 3 例题结语 1 一阶微分方程变形 本节至第四节我们学习的都是一阶微分方程 ​ y ′ f ( x , y ) y^{}f(x,y) y′f(x,y) (2-1) 一阶微分方程对称形式 p ( x , y ) d x Q ( x , …

每日算法(第三期)

2023年5月17日 先回顾一下昨天的算法题,及答案 题目:寻找两个有序数组的中位数 给定两个大小分别为 m 和 n 的有序数组 nums1 和 nums2。请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m n))。 你可以假设 nums1 和 num…

SpringBoot整合MyBatis-Plus实现增删改查

简介 MyBatis-Plus (opens new window)的增强工具,在 MyBatis 的基础上只做增强不做改变,为简化开发、提高效率而生。 特性 无侵入:只做增强不做改变,引入它不会对现有工程产生影响,如丝般顺滑损耗小:启…