方差与标准差的解释

devtools/2024/9/22 10:56:42/

前言

文中记录了我在学习过程中,针对数据的离散程度所做的一些评价,主要涉及到方差和标准差,下面举了一个简单的例子。在统计学中,方差和标准差是用于衡量一组数据离散程度的重要指标。


一、方差

方差是每个样本值与全体样本值的平均数之差的平方值的平均数。
数学表达式为:若一组数据 x 1 , x 2 , … , x N x_1, x_2, \ldots, x_N x1,x2,,xN,其平均数为 x ˉ \bar{x} xˉ,则方差 S 2 S^2 S2的计算公式为:

S 2 = 1 n ∑ i = 1 n ( x i − x ‾ ) 2 S^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \overline{x})^2 S2=n1i=1n(xix)2

例如,有数据 2, 4, 6, 8, 10,其平均数为 6。则方差计算如下:

( 2 − 6 ) 2 + ( 4 − 6 ) 2 + ( 6 − 6 ) 2 + ( 8 − 6 ) 2 + ( 10 − 6 ) 2 = 16 + 4 + 0 + 4 + 16 = 40 \begin{align*} &(2 - 6)^2 + (4 - 6)^2 + (6 - 6)^2 + (8 - 6)^2 + (10 - 6)^2 \\ =& 16 + 4 + 0 + 4 + 16 \\ =& 40 \end{align*} ==(26)2+(46)2+(66)2+(86)2+(106)216+4+0+4+1640

方差为: S 2 = 40 5 = 8 S^2 = \frac{40}{5} = 8 S2=540=8

方差越大,表明这组数据的离散程度越大,数据分布越分散;方差越小,表明数据越集中,离散程度越小。

二、标准差

标准差则是方差的算术平方根。

其计算公式为:
S = 1 n ∑ i = 1 n ( x i − x ‾ ) 2 S = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \overline{x})^2} S=n1i=1n(xix)2

以上面的数据为例,标准差为: S = 8 ≈ 2.83 S = \sqrt{8} \approx 2.83 S=8 2.83

标准差的单位与原始数据相同,这使得它可以直接用于比较不同单位的数据集的离散程度。

标准差越大,说明数据的离散程度越高,即数据波动越大;标准差越小,说明数据的离散程度越低,即数据波动越小。

总结

  • 无论是方差还是标准差,均对异常值比较敏感,会使得某一均方差的值非常大,影响最终的结果,所以需要先对异常值进行处理。

  • 若是判断多组数据均分布在直线的两侧,也可以根据点到直线的距离,计算标准差,判断哪一组数据更接近直线。


http://www.ppmy.cn/devtools/86453.html

相关文章

自学网络安全,从小白到大神的破茧之路!

在当今数字化高速发展的时代,网络安全已经成为了至关重要的领域。无论是个人的隐私保护,还是企业、国家的关键信息资产维护,都离不开网络安全的有力保障。出于对这一领域的浓厚兴趣以及对未来职业发展的清晰规划,我毅然决然地踏上…

不同行情下算法的具体使用!

上一篇我们说到了不同公司算法交易的区分,有朋友提出了不同的行情下的算法交易应该怎么使用,小编今天就带大家了解下!当然具体实际状况百出,这种可以实际为准(韭菜修养全拼实际探讨交流)! 我们在…

Nacos 2.x 新增 grpc 端口,Nginx 需要配置TCP端口转发的注意事项

Nacos 2.x 开始,最大的变化就是端口。在默认主端口 8848 之外又新增了三个端口,新增端口是在配置的主端口 server.port 的基础上,进行一定偏移量自动生成。 8848(主端口,默认8848)web页面端口及相关http接口…

开始尝试从0写一个项目--前端(三)

器材管理板块 添加器材管理导航 src\views\home\Home.vue src\router\index.js src\views\equipment\Equipment.vue <template><div>hello!</div></template> 测试 搜索导航分页查询 src\views\equipment\Equipment.vue <template><div&…

【数据结构初阶】千字文章带你征服 “ 双向链表 ”(附源码)

hi&#xff0c;bro&#xff01;又见面啦 目录 前言&#xff1a; 一、链表的分类 二、双向链表 1、 概念与结构 2、 双向链表的实现 2.1 定义双向链表的结构 2.2 初始化 2.3 尾插 2.4 头插 2.5 打印 2.6 尾删 2.7 头删 2.8 查找 2.9 在pos结点之后插入…

EEtrade:区块链是什么

区块链&#xff0c;这个近年来频繁出现在我们视野中的术语&#xff0c;已经从一个技术小众圈的词汇&#xff0c;逐渐演变为全球关注的焦点。从比特币的诞生&#xff0c;到如今在金融、供应链、物联网等领域的广泛应用&#xff0c;区块链技术正在深刻地改变着我们的生活。那么&a…

循环神经网络LSTM

循环神经网络LSTM LSTM模型单元 LSTM与RNN两个神经网络运行方式相同&#xff0c;但单元结构不同 LSTM的单元结构较RNN复杂一些&#xff0c;因此运行时间较长&#xff0c;但性能比较好 如下&#xff0c;就是LSTM神经网络的一个单元 LSTM单元中包含四个交互的层&#xff0c;即…

R语言 爬取数据+简单清洗

小小练习。见代码注释 # 加载必要的包 library(rvest) library(dplyr) library(tidyr)# 指定网页URL url <- "https://research.un.org/en/unmembers/scmembers"# 读取网页内容 webpage <- read_html(url)# 提取所有表格节点 table_nodes <- html_nodes(web…