数据分析及应用:如何分析基于绝对中位差的异常值检测问题?

ops/2024/9/23 6:37:15/

目录

0 场景描述

1 数据准备 

2 问题分析

 abs(rn - (cnt+1)/2) < 1

3 小结


0 场景描述

数据集中可能存在异常的值。值存在异常有多种原因:

  • (1)可能是数据收集方式有问题,比如记录值的仪表存在误差;
  • (2)可能是数据输入错误导致的;
  • (3)还可能是因为数据生成时环境出现异常,这意味着数据点是正确的,但应谨慎根据数据得出任何结论。

鉴于此,我们想检测出异常数据。一种检测异常数据的常用方法是,计算数据的标准偏差,并将超过3 倍标准偏差(或其他类似距离)的数据点视为异常数据。

在统计学中,我们把这种检测异常值的方式称为 中位数绝对偏差(Median Absolute Deviation,MAD) 的方法,可以用来识别异常值并将其排除在外。MAD是一种基于中位数的离散度量,它可以帮助识别数据集中的异常值。

公式如下: 


http://www.ppmy.cn/ops/105014.html

相关文章

​数字IC设计基本概念之多时钟设计​

当设计中使用了多个时钟时&#xff0c;这些时钟域之间的关系可能是synchronous、asynchronous或者exclusive的。如下所示&#xff1a; Synchronous&#xff1a; Asynchronous&#xff1a; Exclusive&#xff1a; 需要人为地指定设计中时钟之间的关系&#xff0c;EDA工具才能正…

国产游戏崛起:以《黑神话:悟空》为镜的未来展望

国产游戏崛起&#xff1a;以《黑神话&#xff1a;悟空》为镜&#xff0c;挑战、机遇与IT技术的未来展望 在这个数字化时代&#xff0c;国产游戏行业如同破晓的曙光&#xff0c;照亮了全球游戏市场的天际。其中&#xff0c;《黑神话&#xff1a;悟空》以其惊艳的画面、深邃的文…

【问题分析】关于SF侧Launcher层级的分析【Android15】

一般来说&#xff0c;SF侧的Layer层级和WMS侧WindowContainer侧的层级是一一对应的&#xff0c;但是对Launcher来说&#xff0c;则略有不同&#xff0c;这点之前我在打印SF信息的时候&#xff0c;也有注意过&#xff0c;但是没有去仔细思考过为什么会这样&#xff0c;直到这次分…

规控面试复盘

目录 前言 一、京东方 1、CPP和C的区别是什么? 2、讲一下的ROS的话题通信 二、Momenta(泊车部门实习面试) 1、MPC的预测时间步是多少? 2、MPC的代价函数考虑的是什么? 三、九识 1、智能指针有哪些优缺点? 优点: 缺点: 2、Protobuf的数据传输效率为什么更高…

ContentProvider 数据供给方

作用 ContentProvider使用数据库模型的基本表格来提供需要共享的数据 表格每一行表示一条记录&#xff08;都包含"_ID"字段&#xff09;&#xff0c;每一列表示该类型的数据 URI 作用 资源的唯一标识符——提供数据位置 组成 scheme: 一般 "content:/"…

JVM:堆空间概述

目录标题 堆的核心概述内存细分堆空间大小的设置 堆的核心概述 1.一个JVM实例只存在一个堆内存&#xff0c;堆也是Java内存管理的核心区域 2.Java堆区在JVM启动的时候即被创建&#xff0c;其空间大小也就确定了&#xff0c;是JVM管理的最大的一块内存空间&#xff0c;堆内存的空…

Selenium分布式测试和操作监听

前言 在使用selenium进行自动化测试时&#xff0c;测试过程中会不断的打开关闭浏览器&#xff0c;测试时需要单独使用一台设备进行测试。还有就是一台设备的执行效果也不是很高&#xff0c;针对这些问题&#xff0c;来介绍一下Selenium Grid的使用方法。本篇文章介绍使用docke…

element el-dialog 滚动条问题

elementUI在打开dialog的时&#xff0c;页面右侧会出现滚动条&#xff0c;或是页面宽度会缩小&#xff0c;当关闭dialog后又恢复原样&#xff0c;控制台检查后发现当打开dialog时&#xff0c;body元素会有classel-popup-parent--hidden的类名&#xff0c;关闭dialog后el-popup-…