转载请标记本文出处
软件:tableau、pycharm、关系型数据库:MySQL
数据大量分析考虑电脑性能的情况。
文章目录
- 前言
- 一、爬虫是什么?
- 二、使用tableau数据可视化
- 1.引入数据
- 1.1 制作直方图-各地区酒店数量条形图
- 1.2 各地区酒店均价
- 1.3 价格等级堆积柱形图
- 2.分析数据
- 总结
前言
仅供学习参考
一、爬虫是什么?
爬虫是一个自动提取网页的程序。
爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。
二、使用tableau数据可视化
1.引入数据
将execl表格中的数据导入到tableau,当然,有人肯定会说我用sql不可以吗?直接count * from 酒店数据表 group by 地区/城市。通过分组统计,简单数据还可以级联查询,但制作出来的表是我们再MySQL中用命令行输出的。故本文提出用tableau来实现,当然有一些也可以用execl来实现。
1.1 制作直方图-各地区酒店数量条形图
重要的事情放前面,所以,我们选择降序来处理。
同时,建议将数据的值显示出来。
同时,我们通过交换行列,让数据显示的更清晰。
上面这个试图我们发现,有部分数据并没有完全显示出来,是因为我们没有选择整个视图。将“标准”改为“整个视图”。
1.2 各地区酒店均价
由此可以看出,中西区的酒店平均价格偏高,可能多一些五星级的酒店,而其他地区的酒店均价都在一定区间浮动。元朗区这些地方的酒店比较便宜。
1.3 价格等级堆积柱形图
由图中我们可以看出,香港🏨🏩酒店的价格等级的堆积图,油尖旺地区价格等级为C的比较多,中西区酒店价格等级为A的比较多,而湾仔ABC三种价格等级的酒店都比较平均。
2.分析数据
数据预处理的话,tableau还是比较弱的。还是采用Python或R来预处理会更佳!
可以看出香港油尖旺地区价格等级为C的酒店比较多,同时,也可以发现油尖旺酒店数量比较多。
总结
以上就是今天要讲的内容,本文仅仅简单介绍了tableau的使用,而tableau提供了大量能使我们快速便捷地处理数据的工具和方法。