[数据分析] 探索性数据分析 EDA

ops/2024/12/16 10:22:40/

数据分析

数据分析的思维模式或者目的:

  • 描述性分析:使用统计方法(如均值、中位数、众数、方差等)来描述数据的特征,总结和组织数据,以提供对数据集的清晰理解
  • 预测性分析:使用历史数据来建立模型,如回归分析、时间序列分析和机器学习算法,以预测未来事件。
  • 指导性分析:不仅预测结果,还建议最佳的行动方案,通常涉及优化和模拟

数据分析采用的方法:

  • 描述性数据分析:提供对数据的直观理解
  • 探索性数据分析:自由形式的分析,发现数据中的模式和结构
  • 验证性数据分析:验证或反驳特定的假设

探索性数据分析EDA(Exploratory Data Analysis)

定义:EDA是一种在尽量少的先验假设下,通过数据可视化分析数据集,探索数据结构和规律的数据分析方法

目的:

  • 帮助理解数据的基本特征
  • 发现数据中的重要特征和变量
  • 揭示数据中的意外模式或异常值
  • 识别并处理数据中的缺失值、异常值和错误,为后续分析做准备
  • 为业务决策提供初步的支持

基本步骤:

  • 数据加载与清洗:从不同的数据源加载数据,并进行数据清理,包括处理缺失值、重复数据或异常值
  • 描述性统计分析:计算数据集的统计信息,如均值、中位数、分位数等,以获得数据的总体轮廓
  • 数据可视化:通过直方图、箱型图、散点图等图形化手段,探索数据的分布和变量间的关系
  • 特征间相关性分析:分析不同变量之间的相关性,可以使用散点图矩阵或相关矩阵等工具

    工具:
  • numpy
  • pandas
  • matplotlib
  • seaborn

http://www.ppmy.cn/ops/142351.html

相关文章

开展新闻营销分为策划期、实施期、优化期三个重要阶段

也许有人会问:什么是新闻营销呢?这是一个在当今商业营销领域备受关注的概念。在信息爆炸的时代,企业都在绞尽脑汁寻找各种有效的营销方式来提升自己的品牌知名度、产品销量等,新闻营销便是其中一种重要的手段。 我们可以将“新闻营…

SpringBoot【八】mybatis-plus条件构造器使用手册!

一、前言🔥 环境说明:Windows10 Idea2021.3.2 Jdk1.8 SpringBoot 2.3.1.RELEASE 经过上一期的mybatis-plus 入门教学,想必大家对它不是非常陌生了吧,这期呢,我主要是围绕以下几点展开,重点给大家介绍 里…

网络通信技术

网络通信技术 IP路由基础 什么是路由 路由是指导报文转发的路径信息,通过路由可以确认转发IP报文的路径。路由设备是依据路由转发报文到目的网段的网络设备,最常见的路由设备:路由器。路由设备维护着一张路由表,保存着路由信息。路由的功能 路径选择数据转发、数据过滤维…

react-dnd 拖拽事件与输入框的文本选中冲突

问题描述 当我们使用拖拽库的时候,往往会遇到拖拽的一个元素他的子孙元素有输入框类型的dom节点,当拖拽的事件绑定在该元素身上时候,发现子孙的输入框不能进行文本选中了,会按住鼠标去选中文本的时候会触发拖拽 实际的效果&…

Vue路由管理面试题目VueRouter

路由守卫的概念和用法 路由守卫是 Vue Router 提供的一种机制,用于在路由跳转前后执行某些操作。常见的路由守卫包括全局守卫、路由独享守卫和组件内守卫。 全局守卫:作用于全局,每次路由跳转都会触发。 beforeEach:在路由即将改…

注意力机制+时空特征融合!组合模型集成学习预测!LSTM-Attention-Adaboost多变量时序预测

注意力机制时空特征融合!组合模型集成学习预测!LSTM-Attention-Adaboost多变量时序预测 目录 注意力机制时空特征融合!组合模型集成学习预测!LSTM-Attention-Adaboost多变量时序预测效果一览基本介绍程序设计参考资料 效果一览 基…

什么是纯虚函数?什么是抽象类?纯虚函数和抽象类在面向对象编程中的意义是什么?

纯虚函数 纯虚函数是一个在基类中声明但不实现的虚函数。它的声明方式是在函数声明的末尾添加 0。这意味着这个函数没有提供具体的实现,任何继承这个基类的派生类都必须提供这个函数的实现,否则它们也会变成抽象类,无法实例化。 示例&#…

金融科技创新安全通用规范——业务连续性

范围 本文件规定了金融科技创新的基本安全要求,包括交易安全、服务质量、业务连续性、算法安全、架构安全、数据安全、网络安全、内控管理等。 本文件适用于从事金融服务创新的持牌金融机构,也适用于从事相关业务系统、算力存储、算法模型等科技产品研发的科技公司以及安全评…