数据分析
1、概念
广义的数据分析包括狭义数据分析和数据挖掘。
狭义的数据分析是指根据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用,得到一个特征统计量结果的过程。
数据挖掘则是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,通过应用聚类、分类、回归和关联规则等技术,挖掘潜在价值的过程。
~~**拆分合 ! 比较 ! 预测!**~~
- - 2、流程
需求–数据获取–预处理–分析建模–模型评价优化–部署
需求:看目的
数据获取:内部历史数据+python爬虫获取
数据预处理:合并、清洗数据、变换、标准化
分析建模:对比、分组、交叉、回归、聚类、分类、关联规则…
模型评价+优化:指标评价
部署:应用实际的过程
- 3、了解数据分析应用场景
客户分析 | 根据客户的需求、职业、经济、兴趣等,使用统计分析法和预测验证法,分析客户的忠诚度、注意力、收益等特征,提高销售效率 |
营销分析 | 分析竞争产品、自家产品成本和售价、销售渠道、广告和促销,实现最大利润化 |
社交媒体分析 | 用户的特征,比如,发表的内容、访问频率和内容、与其他用户的互动行为,进而推送合适的广告 |
网络安全 | 新型的病毒防御系统可使用数据分析技术,建立潜在攻击识别分析模型,监测大量网络活动数据和相应的访问行为,识别可能进行入侵的可疑模式,做到未雨绸缪。 |
设备管理 | 通过物联网技术能够收集和分析设备上的数据流,包括连续用电、零部件温度、环境湿度和污染物颗粒等无数潜在特征,建立设备管理模型,从而预测设备故障,合理安排预防性的维护,以确保设备正常作业,降低因设备故障带来的安全风险。 |
欺诈行为检测 | 各大金融机构,电信部门可利用用户基本信息,用户交易信息,用户通话短信信息等数据,识别可能发生的潜在欺诈交易,做到提前预防未雨绸缪。 |
数据无非就是通过拆分合比等数据统计方法,再结合实际分析来挖掘潜在信息,要了解数据本身的大量性、不完全、有噪声、模糊性、随机性等性质,深入了解数据所处的场景是数据挖掘的第一步