seaborn
关系图
首先导入库函数:
1 | import numpy as np |
scatterplot散点图
1、参数
散点图是利用散点来描述两个变量的联合分布,scatterplot 适用于变量都是数字的情况。在后面的Categorical plots(分类图)\中,我们将会看到使用散点图可视化*分类数据*的专门工具
1 | #scatterplot参数 |
2、样例
1 | # 使用seaborn的数据 |
1 | sns.scatterplot(x='total_bill',y='tip',hue='day',style='time',size='size',data=tips) |
lineplot线图
1、参数
1 | seaborn.lineplot(x=None, y=None, hue=None, size=None, style=None, |
2、样例
1 | fmri = sns.load_dataset('fmri') |
1 | sns.lineplot(x="timepoint", y="signal",hue="event", style="event", |
replot关系图
1、参数
1 | seaborn.relplot(x=None, y=None, hue=None, size=None, style=None, |
相当于lineplot和scatterplot的归约
,可以通过kind参数
指定画什么图形,参数解释如下:
- kind: 默认是’scatter’,也可以选择kind=‘line’
- sizes: List、dict或tuple,可选,说白了就是图片大小,注意和size区分;
- col、row: col指定列的分组变量,row指定行的分组变量
2、样例
1 | tips = sns.load_dataset("tips") |
1 | sns.relplot(x="total_bill", y="tip", hue="time", size="size", |
Categorical plots分类图
Categorical plots(分类图) 具体可以分为下main三种类型,11种图形:
- Categorical scatterplots(分类散点图)
- stripplot(分布散点图)
- swarmplot(分布密度散点图)
- Categorical distribution plots(分类分布图)
- boxplot(箱型图)
- violinplot(小提琴图)
- violinplot+stripplot(小提琴图+分布散点图)
- violinplot+swarmplot(小提琴图+分布密度散点图)
- boxplot+stripplot(箱线图+分布散点图)
- Categorical estimate plots(分类估计图)
- barplot(条形图)
- countplot(计数图)
- piontplot(点图)
- catplot()
Categorical scatterplots分类散点图
stripplot分布散点图
stripplot(分布散点图) 就是其中一个变量是分类变量的scatterplot(散点图)
。stripplot(分布散点图)一般并不单独绘制,它常常与boxplot和violinplot联合起来绘制,作为这两种图的补充。
1、参数
1 | seaborn.stripplot(x=None, y=None, hue=None, data=None, order=None, |
- order:用order参数进行筛选分类类别,例如:order=[‘sun’,‘sat’];
- jitter:抖动项,表示抖动程度,可以是float,或者True。如果不抖动的话,那么散点就会呈现一条直线了,并不利于可视化
- dodge:重叠区域是否分开,当使用hue时,将其设置为True,将沿着分类轴将不同色调级别的条带分开。
- orient:“v” | “h”,vertical(垂直) 和 horizontal(水平)的意思;
2、样例
1 | tips = sns.load_dataset("tips") |
1 | sns.stripplot(x="day", y="total_bill", hue="smoker",data=tips, |
swarmplot分布密度散点图
这个函数类似于stripplot()
,但是对点进行了调整(只沿着分类轴),使每个点都不会重叠
。这更好地表示了值的密度分布,但显然,不适用大量观测的可视化。使用方法与strippplot相似
Categorical distribution plots分类分布图
boxplot箱型图
1、参数
boxplot(箱型图) 就是描述变量关于不同类别的分布情况。框显示数据集的四分位数,线显示分布的其余部分,它能显示出一组数据的最大值、最小值、中位数及上下四分位数,使用四分位数范围函数的方法可以确定“离群值”的点。具体用法如下:
1 | seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, |
- saturation:饱和度,可设置为1;
- width:float,控制箱型图的宽度大小;
- fliersize:float,用于指示离群值观察的标记大小;
- whis:可理解为异常值的上限IQR比例;
2、样例
1 | sns.boxplot(x="day", y="total_bill", data=tips) |
1 | sns.boxplot(x="day", y="total_bill", hue="time",data=tips, |