「大数据分析」图形可视化,如何选择大数据可视化图形?

embedded/2024/10/21 13:30:30/

​图形可视化技术,在大数据分析中,是一个非常重要的关键部分。我们前期通过数据获取,数据处理,数据分析,得出结果,这些过程都是比较抽象的。如果是非数据分析专业人员,很难清楚我们这些工作,到底做了些什么事情。即使是专业人员,在不清楚项目,不了解业务规则,不熟悉技术细节的情况下。要搞清楚我们的大数据分析,这一系列过程,也是比较困难的。

我们在数据处理和分析完成后,一般来说,都需要形成结论报告。怎样让大数据分析项目的利益相关方,读懂我们的结论报告,知道报告中蕴含的知识内容和有价值的数据分析点,这就需要通过可视化技术,来传达我们的大数据分析结论。

平时在交流和沟通的过程中,我们都清楚,文字很容易产生歧义。交流和沟通不畅,大部分原因,都是由于双方的理解有差异,也就是会产生歧义和分歧。如果歧义和分歧达到不可调和的地步,那就会让交流和沟通陷入僵局,甚至可能适得其反。

俗话说,一图抵千言。图像是通过视觉来传达信息的,人们往往更相信自己的眼睛,相信自己看到的东西。通过图形可视化技术,来向我们的大数据分析项目的利益相关方,传递我们的分析结论报告的关键点。这可以让专业人员和非专业人员,都能够清楚明了的理解我们做了些什么,分析出了些什么有用的知识点,或者是有价值的内容。

这是一个事半功倍的要点,值得我们好好的研究和学习一下大数据可视化的技术。本篇文章,我们就来探讨一下,怎么选择合适的大数据可视化图形。

大数据可视化图形的选择,需要根据数据的性能和状态来进行。我们可以从数据的四个维度,来对可视化图形进行分类,以便我们选择合适的图形。

先来看下面的图形选择决策树。

我们分析处理完成后,需要展示的数据,可以分为四个维度:序列,描述,构成,比较。对应的图形,在上图中做出了详尽的描述。

序列部分,主要是连续型数据,也就是对连续型数据进行绘图展示。连续型数据,是一系列不间断的数据,比如我们每天的订单数据,在一个月的范围内,就是连续的数据集。

这个部分,折线图和柱图比较重要。折线图可以展示数据的趋势,柱图可以展示数据的大小情况。

描述部分,是对多个变量数据,产生关联和关系的,图形化展示。

这个部分,散点图特别重要。我们在观察两个变量,是否相关,是否存在关系,是否存在线性和非线性的趋势,都需要通过散点图来展示。散点图是我们分析变量之间关系的重要图形,也是我们回归分析的起点。

气泡图的话,只是把散点图,加入了大小的维度,可以展示两个变量,数据点之间关系大小的图形。

直方图,可以对数据的分布进行展示。比如说,质量控制中的正态分布,就需要通过直方图进行图形化展示。

构成部分,更多的是对数据结构进行展示。比如说饼图的数据百分比,占比的展示。堆积图的数据累积结构的展示。

比较部分的话,则是对多个数据,进行分类比较展示。这个部分比较重要的图形是柱图。通过柱图,我们可以比较单个变量,在不同时期的大小。也可以比较多个变量,在不同时期的间隔中,单个时期的比较图形化展示。

介于大数据分析可视化技术的重要性,我们会用一系列文章,并且通过模拟数据和实际数据对比的展示,让大家学会大数据可视化的作图过程。

友情提示:

1.以上内容均为本人原创,且无偿分享。

2.如果觉得有用,请关注、点赞、收藏、转发,这将是我持续创作的动力。

3.如果有数据分析方面的难点和问题,请私信,或评论区留言。我会答疑解惑,并选取部分案例,在后续作品中呈现。


http://www.ppmy.cn/embedded/108369.html

相关文章

图文解析保姆级教程: IDEA里面创建SpringBoot工程、SpringBoot项目的运行和测试、实现浏览器返回字符串

文章目录 一、创建SpringBoot工程(需要联网)二、 定义请求处理类三、运行测试 此教程摘选自我的笔记:黑马JavaWeb开发笔记13——Springboot入门(创建、运行&测试项目)、Http协议(请求&响应协议&…

finalshell 4.5.x在m1mac闪退

使用过程中会出现突然闪退,尤其在定位生产打开一堆窗口的情况下,绝绝子 闪退崩溃日志: Thread 116 Crashed:: Java: pool-4-thread-28 0 libsystem_kernel.dylib 0x18e926600 __pthread_kill 8 1 libsystem_pthread.dyl…

【Dash】feffery_antd_componenet 中的 AntdSpace

一、feffery_antd_componenet 中的 AntdSpace feffery_antd_components(简称fac)中的AntdSpace组件是一个基于Ant Design的Dash第三方组件,它用于在水平或垂直方向上放置多个元素,并提供元素之间的间距。以下是AntdSpace组件的一…

C++常见异常汇总(二): undefined reference to

文章目录 1、undefined reference to A2、undefined reference to vtable2.1 模版函数定义方案1: 定义与实现均一起定义在头文件中2.2 模版函数定义方案2: 定义的同一个文件中,显示声明具体类型 3、multiple definition of 1、undefined refe…

Docker配置Redis持久化

场景 使用Docker拉取的Redis,从docker中启动redis容器,默认是没有配置文件的 持久化 RDB:按照一定的时间间隔定时以快照的形式保存,也可主动触发AOF:以记录日志的方式进行保存Redis持久化方式,目前有RDB…

云手机怎样简化海外社媒平台运营

随着越来越多的卖家希望拓展海外市场,运营TikTok、Facebook等社交媒体平台已经成为吸引流量和促进销售的重要手段。然而,在管理海外社媒账号的过程中,许多人会面临网络连接的问题。这时,使用一款高效便捷的云手机工具就显得尤为便…

CocosCreator中使用protobuf

(前提) 工欲善其事,必先利其器. 要想在CocosCreator中使用protobuf,我们首先要安装NodeJs.安装教程可参考Node.js安装及环境配置详细教程_nodejs安装及环境配置-CSDN博客,已经很详细了.NodeJs自带npm, 我们要用npm下载protobufjs.可能你会问npm是什么? npm是NodeJs自带的包管理…

机器学习(西瓜书)第 5 章 神经网络

5.1 神经网络模型 什么是神经网络? “简单单元”:神经元模型 神经网络中最基本的成分是神经元(neuron)模型,即上述定义中的“简单单元”.在生物神经网络中,每个神经元与其他神经元相连,当它“兴奋”时,就会向相连的神…