一.数据分析
1.什么是数据分析?
2.数据分析的分类
数据分析【描述性、探索性、验证性’】
3.数据分析的三大作用
(1)现状分析、(2)原因分析、(3)预测分析。
二.数据收集
一般数据来源于四种方式:
- 1)内部数据:如公司的数据库;
- 2)第三方统计数据:如专业的调研机构的统计年鉴或报告、市场调查;
- 3)编写网页爬虫,去收集互联网上的数据;
三.数据预处理
数据处理主要包括以下:
- (1)数据清洗:如异常值、重复值等的处理,缺失值的处理
- (2)数据转化:如将男女,转化为01
- (3)数据抽取:特征的选择()
- (4)数据合并:几项数据的汇总成一项特定的数据项
- (5)数据计算
-
数据分析
- 在这个部分需要了解基本的数据分析方法、数据挖掘算法,了解不同方法适用的场景和适合的问题。
-
1)常用的数据分析工具,掌握Excel的数据透视表,就能解决大多数的问题。需要的话,可以再有针对性的学习SPSS、R等工具。
2)数据挖掘是一种高级的数据分析方法,侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
四、.数据展现
一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
一般能用图说明问题的就不用表格,能用表说明问题的就不用文字。
图表制作的五个步骤:
1、确定要表达主题
2、确定哪种图表最适合
3、选择数据制作图表
4、检查是否真实反映数据
5、检查是否表达观点