4.累积分布函数CDF

news/2024/11/16 10:38:35/

累积分布函数CDF

  • 1. CDF(cumulative distribution function)
  • 2.累积分布函数(CDF)的使用
  • 3. 累积分布函数的特点
  • 4. PDF (probability density function)
  • 5. 例子

1. CDF(cumulative distribution function)

从数学上来说,对于连续型随机变量,累积分布函数(Cumulative Distribution Function, 简称CDF)是概率分布函数的积分。
累积分布函数就是 分布函数 。

对于一维数据的可视化,直方图(Histogram)与核密度估计(Kernel Density Estimates)可以很好的表示各个数据值的概率分布,但在表示数据累积分布上这两种方法就无能为力了。

数据的累积分布,也即小于等于当前数据值的所有数据的概率分布,对于表示数据点在某个区间内出现的概率有很大的帮助。

在这里插入图片描述

2.累积分布函数(CDF)的使用

以-4到4之间分布的10000个数据点为例,绘制成直方图与核密度估计是这样的:

在这里插入图片描述
在这里插入图片描述
这两张图可以很好的表示-4到4之间任意数据值的概率大小,但是在回答下面几个问题的时候就比较困难了:

  • 所有大于2的数据点在总数据集中所占比例约有多大?

  • 所有大于1.3而小于2的数据点在总数据集中所占比例是多少?

在上述例子中,数据集大致遵循正态分布,因此从直方图或核密度估计的结果中推测这两个问题的答案还是可能的;但是对于不规则的概率分布曲线来说,这样做就基本上行不通了。回答上述问题的通用方法是绘制累积分布函数图:
在这里插入图片描述
根据这张累积分布函数图,可以很方便地回答之前的两个问题:

  • CDF中横轴上的2对应的Y值约为0.98,因此所有大于2的数据点所占比例约为2%。

  • CDF中横轴上的1.3对应的Y值约为0.75,因此所有介于1.3和2之间的数据点所占比例约为23% (0.98-0.75)。

3. 累积分布函数的特点

与直方图、核密度估计相比,累积分布函数存在以下几个特点:

  • 累积分布函数是X轴单调递增函数。

  • 累积分布函数更加平滑,图像中噪音更小。

  • 累积分布函数没有引入带宽等外部概念,因此不会丢失任何数据信息。对于给定的数据集,累积分布函数是唯一的。

  • 所有的CDF中,在x趋近最小值时,CDF趋近于0,当x趋近最大值时,CDF趋近与1(100%)

4. PDF (probability density function)

PDF:连续型随机变量的概率密度函数是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

概率密度函数,描述可能性的变化情况,比如正态分布密度函数,给定一个值, 判断这个值在该正态分布中所在的位置后, 获得其他数据高于该值或低于该值的比例。

CDF:能完整描述一个实数随机变量x的概率分布,是概率密度函数的积分。随机变量小于或者等于某个数值的概率P(X<=x)即:F(x) = P(X<=x)。

可使用 CDF 确定取自总体的随机观测值将小于或等于特定值的概率。还可以使用此信息来确定观测值将大于特定值或介于两个值之间的概率。

对于所有实数x,CDF(cumulative distribution function),与概率密度函数PDF(probability density function)相对。任何一个CDF,是一个不减函数,累积和为1。累计分段概率值就是所有比给定x小的数在数据集中所占的比例。任意特定点处的填充x的 CDF 等于 PDF 曲线下直至该点左侧阴影面积。

5. 例子

import pandas as pd
import matplotlib.pyplot as plt
import numpy as npdata = []
data = pd.read_csv("D:\\dataset.csv", header=None)
print(data)
denominator = len(data[0])  # 分母数量
Data = pd.Series(data[0])  # 将数据转换为Series利用分组频数计算
Fre = Data.value_counts()
Fre_sort = Fre.sort_index(axis=0, ascending=True)
Fre_df = Fre_sort.reset_index()  # 将Series数据转换为DataFrame
Fre_df[0] = Fre_df[0] / denominator  # 转换成概率
Fre_df.columns = ['Rds', 'Fre']
Fre_df['cumsum'] = np.cumsum(Fre_df['Fre'])
plot = plt.figure()
ax1 = plot.add_subplot(1, 1, 1)
ax1.plot(Fre_df['Rds'], Fre_df['cumsum'])
ax1.set_title("CDF")
ax1.set_xlabel("Rds")
ax1.set_ylabel("P")
ax1.set_xlim(0.1, 0.5)
plt.show()

在这里插入图片描述

概率分布函数(累积概率函数),概率密度函数

Python中概率累计分布函数(CDF)分析


http://www.ppmy.cn/news/1003923.html

相关文章

19 | 分类模型评估指标

文章目录 Python分类模型评估指标准确率(Accuracy)精确率(Precision)召回率(Recall)F1值(F1 Score)混淆矩阵(Confusion Matrix)ROC曲线和AUC值1. 准备数据集2. 初始化并训练逻辑回归模型3. 获取预测概率并计算ROC曲线和AUC值4. 绘制ROC曲线5. 整合代码结论Python分类…

Spring和其IOC和DI

spring是干什么的&#xff1f; Spring 是一个开源的Java应用程序框架&#xff0c;最初由Rod Johnson在2003年创建。Spring 的初衷是为了简化企业级Java应用程序的开发&#xff0c;并提供一种灵活、可扩展、易于测试和维护的编程模型。 先来看看Spring 框架诞生的初衷&#xff…

selenium 和 chromedriver 使用的一些总结

1 selenium 下载地址 selenium PyPIhttps://pypi.org/project/selenium/ 2 chromedriver 下载地址 &#xff0c;可以下载最新版的 chromedriver ChromeDriver - WebDriver for Chrome - Downloadshttps://chromedriver.chromium.org/downloadsChrome for Testing availabi…

如何使用 ChatGPT 规划家居装修

你正在计划家庭装修项目&#xff0c;但不确定从哪里开始&#xff1f;ChatGPT 随时为你提供帮助。从集思广益的设计理念到估算成本&#xff0c;ChatGPT 可以简化你的家居装修规划流程。在本文中&#xff0c;我们将讨论如何使用 ChatGPT 有效地规划家居装修&#xff0c;以便你的项…

tinkerCAD案例:33. 在 Tinkercad 中使用标尺工具

在 Tinkercad 中使用标尺工具 Using the Ruler Tool in Tinkercad 在 Tinkercad 中使用标尺工具 Introduction: Using the Ruler Tool in Tinkercad 简介&#xff1a;在 Tinkercad 中使用标尺工具 For those that may not know Tinkercad is a web based 3D modeling tool.…

flask服务生成证书文件,采用https访问,开启用户密码验证

openssl req -x509 -newkey rsa:4096 -nodes -out cert.pem -keyout key.pem -days 3072开启用户密码验证 auth.verify_password def verify_password(username, password):if username abcdefg and password 1234546:return usernameapp.route(/post_request, methods[POST…

RISC-V基础之函数调用(四)非叶函数调用(包含实例)

叶函数是指不调用其他函数&#xff0c;也不改变任何非易失性寄存器的函数2。叶函数通常是一些简单的操作&#xff0c;如数学运算或逻辑判断。叶函数的特点是可以通过模拟返回来展开&#xff0c;即不需要保存或恢复寄存器的状态。 非叶函数是指调用其他函数或改变非易失性寄存器…

微服务---介绍

目录 1.微服务架构5个核心问题 2.微服务架构实现方案 3.微服务架构更多的是架构思想 4.学习微服务的意义 5.微服务架构一般采用 6.服务器有三种类型 1.微服务架构5个核心问题 &#xff08;解决这些问题都是依托于中间件&#xff0c;学微服务也是学这些中间件&#xff09;…