一篇文章告诉你标准化和归一化的区别?

news/2024/11/23 23:02:22/
一篇文章告诉你标准化和归一化的区别?

2019-02-28 17:12:39 融融网融融网阅读量:484

一篇文章告诉你标准化和归一化的区别?

进一步推进企业的标准化工作,使之发展水平适应经济全球化下市场竞争的要求,促进企业综合实力的提升是标准化建设的目标。很多人认为标准化理解为归一化,然而是有区别的,下面告诉你不同之处:

(一)归一化

特点

对不同特征维度的伸缩变换的目的是使各个特征维度对目标函数的影响权重是一致的,即使得那些扁平分布的数据伸缩变换成类圆形。这也就改变了原始数据的一个分布。

好处

1 提高迭代求解的收敛速度

2 提高迭代求解的精度

(二)标准化

特点

对不同特征维度的伸缩变换的目的是使得不同度量之间的特征具有可比性。同时不改变原始数据的分布。

好处

1 使得不同度量之间的特征具有可比性,对目标函数的影响体现在几何分布上,而不是数值上

2 不改变原始数据的分布

举例

根据人的身高和体重预测人的健康指数

假设有如下原始样本数据是四维的(当然一般不会有这么无聊的数据)

一篇文章告诉你标准化和归一化的区别?

一篇文章告诉你标准化和归一化的区别?

从上面两个坐标图可以看出,样本在数据值上的分布差距是不一样的,但是其几何距离是一致的。而标准化就是一种对样本数据在不同维度上进行一个伸缩变化(而不改变数据的几何距离),也就是不改变原始数据的信息(分布)。这样的好处就是在进行特征提取时,忽略掉不同特征之间的一个度量,而保留样本在各个维度上的信息(分布)。

一篇文章告诉你标准化和归一化的区别?

从采用大单位的身高和体重这两个特征来看,如果采用标准化,不改变样本在这两个维度上的分布,则左图还是会保持二维分布的一个扁平性;而采用归一化则会在不同维度上对数据进行不同的伸缩变化(归一区间,会改变数据的原始距离,分布,信息),使得其呈类圆形。虽然这样样本会失去原始的信息,但这防止了归一化前直接对原始数据进行梯度下降类似的优化算法时最终解被数值大的特征所主导。归一化之后,各个特征对目标函数的影响权重是一致的。这样的好处是在提高迭代求解的精度。

了解标准化的真正含义,做好企业的标准化工作,是发展水平适应经济全球化下市场竞争的要求,也是促进企业综合实力的提升。搞好标准化,不仅能确保产品质量,还有利于降低产品成本,促进产品多样化发展,加速产品更新换代,提高企业的信誉。


http://www.ppmy.cn/news/605427.html

相关文章

k8s核心组件详细介绍教程(配超详细实例演示)

本文实验环境基于上篇文章手把手从零开始搭建k8s集群超详细教程本文根据B站课程云原生Java架构师的第一课K8sDockerKubeSphereDevOps学习总结而来 k8s核心组件介绍1. Namespace2. Pod1. pod相关命令2. 实例——创建一个包含redis容器的pod3. Deployments1. 多副本2. 扩缩容3. 自…

非参数估计:核密度估计KDE

非参数估计:核密度估计KDE 非参数估计:核密度估计KDE from:http://blog.csdn.net/pipisorry/article/details/53635895核密度估计Kernel Density Estimation(KDE)概述 密度估计的问题 由给定样本集合求解随机变量的分布密度函数问题是概率统…

LeetCode简单题之找出数组中的所有 K 近邻下标

题目 给你一个下标从 0 开始的整数数组 nums 和两个整数 key 和 k 。K 近邻下标 是 nums 中的一个下标 i &#xff0c;并满足至少存在一个下标 j 使得 |i - j| < k 且 nums[j] key 。 以列表形式返回按 递增顺序 排序的所有 K 近邻下标。 示例 1&#xff1a; 输入&#xf…

回归算法 - 线性回归求解 θ(最大似然估计求解)

回顾线性回归的公式&#xff1a;θ是系数&#xff0c;X是特征&#xff0c;h(x) 是预测值。 h(x) θ0 θ1x1 θ2x2 … θnxn h(x) Σ θixi&#xff08; i0~n &#xff09; h(x) θTX [θ1,θ2,θ3,…,θn] * [x1,x2,x3,…,xn]T 最终要求是计算出θ的值&#xff0c;并选…

LeetCode简单题之将数组划分成相等数对

题目 给你一个整数数组 nums &#xff0c;它包含 2 * n 个整数。 你需要将 nums 划分成 n 个数对&#xff0c;满足&#xff1a; 每个元素 只属于一个 数对。 同一数对中的元素 相等 。 如果可以将 nums 划分成 n 个数对&#xff0c;请你返回 true &#xff0c;否则返回 false …

硬核科普:到底啥是云原生?

本文主要根据课程 什么是云原生&#xff1f;_哔哩哔哩_bilibili 总结而来&#xff0c;其他参考文章如下&#xff1a; 《云原生人才计划之Kubernetes 技术图谱》发布&#xff01; - 知乎 (zhihu.com)kubernetes-阿里云与CNCF联合推出的云原生技术公开课_哔哩哔哩_bilibili什么是…

LeetCode简单题之统计包含给定前缀的字符串

题目 给你一个字符串数组 words 和一个字符串 pref 。 返回 words 中以 pref 作为 前缀 的字符串的数目。 字符串 s 的 前缀 就是 s 的任一前导连续字符串。 示例 1&#xff1a; 输入&#xff1a;words [“pay”,“attention”,“practice”,“attend”], pref “at” 输出&…

8.1 PowerBI系列之DAX函数专题-进阶-解决列排序对计算的影响

需求 下列矩阵中&#xff0c;在月份列不按照原始数据的month_no排列时&#xff0c;能正确计算销售额占比&#xff0c;但是当月份按照month_no排序时就会出错&#xff0c;需要解决这个问题。 实现 month % divide([amount],calculate([amount],all(date[month desc]))) //排…