Seaborn是一个使用Python语言编程,绘制各种统计图形的Python第三方库。Seaborn可以使用Python语言中的Pandas处理数据,基于matplotlib实现的,高级绘图环境。
Seaborn库简介
Seaborn能够帮助你,更好的探索和理解你的数据。其绘图功能,包含对整个数据集的dataframe数据集和array数组进行操作。并且在内部,执行必要的语义映射和统计聚合,以生成信息丰富的各式各样的图形。
Seaborn是面向数据集的,声明性的API,使你能够关注图形的不同元素,意味着什么,而不是如何绘制它们的细节。
正因为Seaborn的这些优点,使用Seaborn绘制图形,相对于matplotlib基础库来说,更加高效,便捷,简易,对专业和非专业数据分析人员,都非常友好。
使用Seaborn库的过程
要使用Seaborn,有以下步骤,我们通过一个实际的例子,以及实际的数据集,来进行讲解。
首先,导入和设置Seaborn库。按照惯例,用简写的sns表示。
这里,我们通过set_theme函数,为Seaborn设置默认主题。
其次,加载数据集。
我们这里使用Seaborn官方自带的,实际环境中收集到的数据集tips。
注意,这里的tips数据集,是一个真实的数据集。在Seaborn中,通过load_dataset函数,把这个数据集,从Seaborn官方网站上,加载到我们的Python编程语言中,也可以说是加载到我们的计算机内存中,形成tips变量以供使用。
数据加载完成后,我们可以看看tips数据集,有哪些列,以及每个列的数据类型是什么。
最后,使用relplot函数绘制图形。
这里,需要解释一下relplot函数的各个参数,分别代表什么。
data是数据集,也就是说,设置绘图使用的数据集为tips。
x和y,分别是生成图形的x轴(横轴)和y轴(纵轴)。
col,这里设置为time列,表示使用time列,把数据分成两部分,Lunch一部分,Dinner一部分,分别绘制两幅图形,显示在一副图中。注意这里的time列,只有Lunch和Dinner两部分数据,属于二分变量,也可以算是二分离散型变量。
hue,设置为smoker列,表示把途中的数据点,分为吸烟和不吸烟两部分,分别用圆点和叉叉表示。
size,设置为size列,表示代表吸烟者和不吸烟者的圆点和叉叉的大小,用size列的数据表示。
图形理解和解释
Seaborn中的tips数据集,是为了研究,在午餐和晚餐的时候,影响结账客人给小费的因素。
从图中我们可以看出,午餐时间,吃饭的总消费和给小费的金额,具有线性关系。吸烟者和不吸烟者,都具有这样的关系。而晚餐时间,线性关系不明显,数据比较分散。
我们通过查看图形,可以得出结论。
1、午餐时间,客人的消费金额和给的小费,具有正向的线性关系。也就是说,消费越多,给的小费也就越多。吸烟者和不吸烟者都具有这种关系。
2、晚餐时间,不吸烟者的消费金额和给的小费,具有正向的线性关系。而吸烟者则没有这样的关系。所以,晚餐时间,我们更应该服务好不吸烟者,这样就可以得到更多的小费。
以上就是本篇文章的全部内容。
友情提示:
1.以上内容均为本人原创,且无偿分享。
2.如果觉得有用,请关注、点赞、收藏、转发。
3.如果有数据分析方面的难点和问题,请私信,或评论区留言。
4.我会答疑解惑,并选取部分案例,在后续作品中呈现。