Z-Score标准化

news/2025/2/9 3:00:50/

一、说明:

Z-Score标准化是数据处理的一种常用方法。通过它能够将不同量级的数据转化为统一量度的Z-Score分值进行比较。提高了数据可比性,削弱了数据解释性。

二、公式:

在这里插入图片描述

1、总体数据的均值(μ)

2、总体数据的标准差(σ)

3、个体的观测值(x)

三、Z-Score的优缺点

优点:
1、简单,容易计算,凭借最简单的数学公式就能够计算出Z-Score并进行比较。

2、Z-Score能够应用于数值型的数据,并且不受数据量级的影响,因为它本身的作用就是消除量级给分析带来的不便。

缺点:
1、首先,估算Z-Score需要总体的平均值与方差,这一值在真实的分析与挖掘中很难得到,大多数情况下是用样本的均值与标准差替代。

2、其次,Z-Score对于数据的分布有一定的要求,正态分布是最有利于Z-Score计算的。

3、最后,Z-Score消除了数据具有的实际意义,A的Z-Score与B的Z-Score与他们各自的分数不再有关系,因此Z-Score的结果只能用于比较数据间的结果,数据的真实意义还需要还原原值。

四、Z-Score标准化python代码实现

import math
def get_average(data):  #求数组平均数return sum(data) / len(data)
def get_variance(data):#求数组方差average = get_average(data)return sum([(x - average) ** 2 for x in data]) / len(data)
def get_standard_deviation(data): #求数组标准差variance = get_variance(data)return math.sqrt(variance)
def get_z_score(data): #求数组的z-score归一化最后的结果avg = get_average(data)stan = get_standard_deviation(data)scores = [(i-avg)/stan for i in data]return scores

五、实际应用Python实现

def get_z_score(df):return (df['Duration'] - df['Duration'].mean())/df['Duration'].std()

在这里插入图片描述


http://www.ppmy.cn/news/885812.html

相关文章

css笔记 z-index

z-index定义 z-index是相对比较常用的一个语法了 首先先来了解一下z-index的定义把 z-index 属性指定一个元素的堆叠顺序。 拥有更高堆叠顺序的元素总是会处于堆叠顺序较低的元素的前面。 层叠上下文 stack context了解 在讲解z-index咱们先要了解一下层叠上下文(…

MATLAB实现离散系统Z域分析

一、实验目的 1. 学习和掌握离散系统频率特性. (1) 离散系统的幅度特性与相频特性. (2)离散系统频率特性的对称性与周期性. 2.认识离散系统频率特性与系统参数之间关系.…

Z语言实现基本原理

原文作者: TKT2016 (知乎, github) 计算机编程发展已经有几十年了,编程的难度也越来越小,会编程的人也越来越多。但是现在的编程还是非常难,需要专门学习很长时间才能掌握。我的目标是创造出更简单更容易掌握的语言,所以我开发出…

matlab画收敛域,第二章习题与答案1.求以下序列的z变换并画出零极点图和收敛域.doc...

第二章习题与答案1.求以下序列的z变换并画出零极点图和收敛域,因果序列z变换收敛域,z变换零极点图,z变换的零极点图,z变换的极点,z变换的零点和极点,z变换的零极点分布图,z变换极点,z变换零极点,z变换的收敛域 第二章习题与答案 求以下序列的z变换并画出零极点图和收敛域。 分…

qt+zint实现打印一维条形码

1.需求 需要将小票号打印成条形码,退换货时通过扫描枪直接扫描不用人工输入进行退货和换货,加快速度 2.实现 这里通过zint生成条形码图片,通过qt将图片绘制到打印纸上实现,也可以直接在打印纸上进行绘制线条,因人而…

z-buffer算法

画家算法的缺点:深度排序计算量大,排序后还需要计算相邻面才能确保在深度优先级表中前者在前,后者在后。若遇到多边形相交或多边形循环重叠的情形,还必须分割多边形。 z-buffer算法可以避免以上复杂的运算。 帧缓冲区&#xff1a…

linux 批量解压.7z脚本

7z 这样做会降低速度,但是好处是可以不用每次输入命令,可以干别的,但是如果中间解压出现问题,可能会有问题,必须全部解压完成以后,才能成功解压。不然一个都不能解压好。 # 这样会在当前文件夹下新建一个…

HTML5的z-index层次

z-index:默认值为0,最大为99,数字越大,离你的眼睛眼近 示例 : 上面都是不同的z-index可以见得大的会覆盖小的。