【数据分析】数据的离中趋势之一 - 极差、分位距、平均差

devtools/2024/9/25 19:14:17/

一、极差

  • 未分组或单项分组的数据:极差=最大值 - 最小值
  • 已分组数据:极差=最大组的上限 - 最下组的下限
  • 实际应用中,极差可用于检查产品质量的稳定性和进行质量控制。
  • 正常生产条件下,极差在一定范围内波动,如出现不正常情况,极差就会超出一定范围。由此监察产品质量。

二、分位距

  • 常用分位距有:四分位距、八分位距、十分位距等
  • 四分位距 = 第三个四分位数 - 第一个四分位数
import numpy as np
from scipy.stats import iqr
import pandas as pddata = np.array([2, 3, 4, 5, 4, 5, 4, 5, 6, 7, 6, 7, 6, 7, 7, 8, 9, 9])# numpy
Q1 = np.percentile(data, 25)
Q3 = np.percentile(data, 75)IQR = Q3 - Q1
print(f'使用 numpy 计算分位距(IQR):{IQR}')# scipy
IQR = iqr(data, rng=[25, 75], scale=1.0)
print(f'使用 scipy 计算分位距(IQR):{IQR}')# pandas
df = pd.DataFrame({'Value': [2, 3, 4, 5, 4, 5, 4, 5, 6, 7, 6, 7, 6, 7, 7, 8, 9, 9]})
Q1 = df['Value'].quantile(0.25)
Q3 = df['Value'].quantile(0.75)
IQR = Q3 - Q1
print(f"使用 pandas 计算分位距(IQR):{IQR}")

输出: 

>>> 使用 numpy 计算分位距(IQR):2.75
>>> 使用 scipy 计算分位距(IQR):2.75
>>> 使用 pandas 计算分位距(IQR):2.75

三、平均差

  • 数据组中各数据值与其算术平均数离差绝对值的算数平均数,常用符号“M.D”表示

下图是甲乙两组工人日产量的平均差计算过程:

甲    组乙    组
日产量离差离差绝对值日产量离差离差绝对值
xx - 平均数| x - 平均数 |xx - 平均数| x - 平均数 |
4-12127-99
7-9912-44
11-5514-22
14-2214-22
14-2215-11
16001711
17111711
24881933
25992044
2812122599
合计----60合计----36
  • 甲组平均差 = 甲组离差绝对值的平均值 = 60 / 10 = 6 (件)
  • 乙组平均差 = 乙组离差绝对值的平均值 = 36 / 10 = 3.6 (件)
import numpy as npgroup_a = np.array([4, 7, 11, 14, 14, 16, 17, 24, 25, 28])
group_b = np.array([7, 12, 14, 14, 15, 17, 17, 19, 20, 25])mean_a = np.mean(group_a)
abs_a = np.abs(group_a - mean_a)
mad_a = np.mean(abs_a)print(f'甲组的平均差(MAD):{mad_a}')mean_b = np.mean(group_b)
abs_b = np.abs(group_b - mean_b)
mad_b = np.mean(abs_b)print(f'乙组的平均差(MAD):{mad_b}')

输出:

>>> 甲组的平均差(MAD):6.0
>>> 乙组的平均差(MAD):3.6


http://www.ppmy.cn/devtools/98669.html

相关文章

nodemon学习(一)简介、安装、配置、使用

nodemon用来监视node.js应用程序中的任何更改并自动重启服务,非常适合用在开发环境中。以前,我们开发一个node后端服务时,每次更改文件,均需重启一下,服务才能生效。这使我们的开发效率降低了很多。nodemon的出现,可以…

招聘|头部云厂商招 PG 核心骨干 DBA【上海】

我们的招聘专区又回来了!🏃 Bytebase 作为先进的数据库 DevOps 团队协同工具 🔧,用户群里汇聚了 💗 业界优秀的 DBA,SRE,运维的同学们 🌟。 上周用户群里有小伙伴发招聘信息 &…

Redhat8 搭建Zabbix6(二)优化

前端优化 取消URL后缀 默认URL为: http://serverip/zabbix 修改URL为:http://serverip ##修改路径 nano /etc/httpd/conf/httpd.conf#DocumentRoot "/var/www/html" DocumentRoot "/usr/share/zabbix"##重启web与zabbixserver服务 systemctl restart http…

目标检测多模态大模型实践:貌似是全网唯一Shikra的部署和测试教程,内含各种踩坑以及demo代码

原文: Shikra: Unleashing Multimodal LLM’s Referential Dialogue Magic 代码: https://github.com/shikras/shikra 模型: https://huggingface.co/shikras/shikra-7b-delta-v1 https://huggingface.co/shikras/shikra7b-delta-v1-0708 第一…

uniapp微信小程序 分享功能

uniapp https://zh.uniapp.dcloud.io/api/plugins/share.html#onshareappmessage export default {onShareAppMessage(res) {if (res.from button) {// 来自页面内分享按钮console.log(res.target)}return {title: 自定义分享标题,path: /pages/test/test?id123}} }需要再真机…

第六章 设置和其他常见活动 - 编辑 IRIS 凭证集

文章目录 第六章 设置和其他常见活动 - 编辑 IRIS 凭证集编辑 IRIS 凭证集 通过编程方式检索凭证集检索存储的凭证集 第六章 设置和其他常见活动 - 编辑 IRIS 凭证集 编辑 IRIS 凭证集 创建 IRIS 凭证集后,可以按如下方式编辑它: 在管理门户中&#x…

数采网关面临的安全挑战

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github:codetoys,所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的,可以在任何平台上使用。 数采网关作为物联网的基础设施…

数学建模学习

数学建模 层次分析法层次分析法上机matlab速学算数平均法求权重特征法求权重 模糊综合评价一级模糊综合评价评语集带有评价色彩型评语集不带有评价色彩型 多级模糊综合评价总结 模糊综合评价上机熵权法(客观总结 熵权法上机TOPSIS(客观)法一&…