目录
- 1.seaborn 概括
- 2.Seaborn的调色板
- 3.单变量绘图分析
- 4.回归分析绘图
- 5.分类图绘制
- 6.FacetGrid使用
- 7.Heatmap
1.seaborn 概括
seaborn库是一个用于数据可视化的Python库,它建立在matplotlib之上,可以让你轻松地创建各种美观的图表和图形。
在seaborn中,set()函数是一个非常常见的函数,它可以用来设置不同的seaborn图表的外观。具体来说,set()函数接受一系列的参数,用于设置不同的绘图风格,包括:
- style:绘图样式,取值为{darkgrid, whitegrid, dark, white, ticks},分别表示黑色网格、白色网格、黑色、白色和刻度线
- palette:调色板,用于调整颜色,可以使用任何Matplotlib调色板名称,比如{deep, muted, bright, pastel, dark, colorblind}等
- font_scale:大小,用于调整字体的大小
- rc:设置matplotlib参数,用于更加细致的控制绘图
5种主题风格
- darkgrid
- whitegrid
- dark
- white
- ticks
2.Seaborn的调色板
3.单变量绘图分析
sns.distplot() 是 seaborn 库提供的一个函数,用于绘制数据分布的概率密度函数,并在绘图中添加一条核密度估计曲线和直方图。它的常用参数如下:
-
a : 需要绘制的数据序列,可以是一个 Series、DataFrame 或者一组列表、数组等等。如果是 DataFrame 的话,可以通过指定 column 参数来选择绘图的某一列数据。
-
bins : 直方图的条数,默认是 10。
-
kde : 是否显示核密度估计曲线,默认是 True。
-
hist : 是否显示直方图,默认是 True。
-
rug : 在 x 轴上显示观测点的位置,默认是 False。
-
color : 绘图的颜色,默认是蓝色。
-
label : 标记图例的文本。
-
ax : 绘制图形的坐标轴。
sns.distplot() 函数的返回结果是一张 matplotlib 的图形对象,可以通过 matplotlib 的相关函数来对其进行进一步的装饰和修改。
np.random.gamma(shape, scale=None, size=None) 是 numpy 库提供的一个生成 Gamma 分布随机数的函数。这个分布可以用来描述一些连续随机变量的分布,例如,一些物质的放射性污染或者探测器的统计误差等等。 -
shape :一个正实数,作为分布的形状参数。这里的 “形状” 指的是 Gamma 分布中的α值。
-
scale :一个正实数,默认值是 1。这里的 “尺度” 指的是 Gamma 分布中的β值,通过调整β值可以对潜在的数量/强度进行标准化。
-
size :确定生成的随机数的形状,可以是一个整数,表示生成的数据有多少个;也可以是一个元组,表示生成的数据的形状。
sns.jointplot(x,y,data=None,kind=‘scatter’,color=None,size=None,ratio=5,space=0.2,dropna=True) 是 seaborn 库提供的一个函数,用于绘制两个变量之间的关系,并同时显示它们的一维分布。
sns.jointplot() 函数会根据 kind 参数的不同,绘制出不同类型的图形,例如: -
kind=‘scatter’ 时,绘制散点图。同时显示 x,y 轴各自的一维分布和散点图。
-
kind=‘hex’ 时,绘制 hexbin 图。同时显示 x,y 轴各自的一维分布和 hexbin 图。
-
kind=‘kde’ 时,绘制密度图。同时显示 x,y 轴各自的一维分布和二维密度图。
-
kind=‘reg’ 时,绘制回归曲线上的拟合结果。同时显示 x,y 轴各自的一维分布和回归曲线。
-
kind=‘resid’ 时,绘制回归模型的残差图。同时显示 x,y 轴各自的一维分布和回归残差图。
4.回归分析绘图
regplot函数的常用参数如下:
-
x:指定分析数据集中放在横轴的变量名。
-
y:指定分析数据集中放在纵轴的变量名。
-
data:指定用来绘图的数据集。
-
scatter : 是否绘制散点图,默认为True。
-
fit_reg:是否拟合回归模型并绘制回归线,默认为True。
-
ci:置信区间,用于绘制回归线置信区间,默认95%。
-
order:回归多项式次数,用于拟合线性回归模型,默认为1,即线性模型。
-
x_estimator:在概率密度图上使用的x轴值的中心估计值函数,主要用于产生一个更加平滑的线条,比如kdeplot。
-
x_bins:用于绘制直方图或者拟合连续变量的估计器的bin的位置。高于scatterplot。
-
logistic:是否对拟合模型进行逻辑转换,默认为False。
-
lowess:当使用scatterplot且fit_reg设置为True时,是否应用locally-weighted polynomial regression进行去噪,默认为False。
5.分类图绘制
6.FacetGrid使用
7.Heatmap