可视化报告 第1篇
任何一个绘图函数都有很多参数,如折线图函数 ()
坐标值(x,y)是最少必备参数,如果我们想让图表展示的图表效果更惊艳,就也得学习一下后面的参数。
先看线条的宽度和颜色:
线条宽度变宽,并且变成红色。
可视化报告 第2篇
一张图是由画布、图表以及图表元素组成。
读到这里,对数据可视化就有大致印象了。
依照代码实现逻辑,应该是先有画布,再有图表,具备这两者就能生成一张最简单的图,而要让这张图传递更丰富的信息,则需要添加图表元素。
可视化报告 第3篇
散点图又叫 X-Y 图,将所有的连续数据以点的形式展现在坐标系上。
可比较直观地观察变量 x 与变量 y 之间的相关性。
适合变量之间存在密切关系,但是这些关系又不像数学或物理公式那样能够精确表达的。
在观察散点图的时候,还有一个概念需要我们理解 —— 离群点。
当变量间存在某种线性关系时,大部分的数据点会表现出 “报团取暖”,相对密集的形态,但总有几个不合群的,“高冷” 的数据点离集群较远,我们可以称这些点为离群点或异常点。
观察散点图步骤:
散点图函数:(x, y, data, hue, size, style, kind)
可以看到,大部分数据点都比较集中,且身高越高,相应的体重也会越大,身高和体重应该是正相关关系。
student_info 数据集其实数据还有分类(男、女),我们可以分开显示。
男生和女生用不同的颜色标记了出来。从整体上看,该数据集中的男生身高还是普遍高于女生的。
我们还可以让数据展示的更显著,参数 size 可以让表示体重的点,随体重增大而增大。
我们发现,学生数据的分类,不仅有性别,还有班级。
使用 style = 班级,这样不同班级点的不同形状区分数据,1班是圆、2班是方形。
关系图,除了散点图,还有折线图。
折线图也可以反映数据间的关系,只不过它一般使用时间维度作为 X 轴,数值维度作为 Y 轴。
当我们想要了解某一维度在时间上的规律或者趋势时,用折线图是个比较不错的选择。
relplot() 函数也是可以画出折线图的,基本的折线图只需要在必选参数的基础上,只要写成 kind=‘line’ 即可。
折线图函数:(x, y, data, kind=‘line’)
这也是 Seaborn 的一大优势,想要画某一大类下面的不同图形时,只需要调用这一大类的函数,少量修改其中的参数即可。
可视化报告 第4篇
根据 Seaborn 的划分,Distribution 类别^v^有四种图形:直方图、核密度估计图、经验累积分布图和轴须图,它们都可以用来表示定量数据的分布情况。
. 人的眼睛对颜色比对形状更敏感,因此,在做可视化时,我们可以优先考虑使用颜色来区分不同的数据。
直方图是描述性统计中很常见的一种图形,它牵涉到统计学中的频数这一概念。
频数,又称 “次数”。指变量值中代表某种特征的数值出现的次数。
在直方图中,我们会把连续数据进行分组,而后统计每个分组内数据的数量(即频数),接着,在平面直角坐标系中用 X 轴标记出每个分组的端点,用 Y 轴表示频数,这样,在坐标系中生成的每个矩形的高就代表了对应分组的频数。
如果从形状来看的话,直方图与柱状图会非常类似。
虽然相似,但从上面的对比图中也可以看出,柱状图的方块之间有间隔,然而直方图各个方块之间没有间隔,紧密相连(当然也有例外情况。在某个分布数据的频数极少或没有时,会出现断点,比如上图直方图中的最右侧方块)。
但它们两个最大的区别还是在数据类型上,柱状图用于画出定性数据(分类数据)的某些特征,直方图则是用于展示定量数据的分布情况。
我们还可以通过直方图来观察数据分布的大体形状,比如:数据分布是否对称,是右偏还是左偏等。
如果数据分布大体对称的话,图形会呈现出中间高,两边低,左右近似对称的特点,就像上图中间所示形状一样。
如果数据的 众数 < 中位数 < 平均数,那么分布大体就会呈现出右偏分布的情况,形状上类似上图左侧部分。
如果数据的 众数 > 中位数 > 平均数,那么分布大体就会呈现出左偏分布的情况,形状上类似上图右侧部分。
画直方图的函数:(x, data, hue, kind=‘hist’) 。
这里,借用一下泰坦尼克号乘客的数据。
根据图形显示,蓝色代表男性,橙色代表女性,图形中的灰色部分是颜色重合造成的。总体来看,男乘客的数量是要高于女乘客的,尤其是在青壮年(20 岁-40 岁)群体中,这一差异非常明显。
直方图一般用来统计连续数据分组后,每个组对应的频数,可以从形状上判断数据分布的大体形状,比如:数据分布是否对称,是右偏还是左偏等。
核密度估计图:(kind=‘kde’)
经验累积分布图:(kind=‘ecdf’)
可视化报告 第5篇
以上是图表(线条)样式,另一个是数据标记点样式,需要用到的参数是 marker、markerfacecolor 和 markersize。
我们选择数据标记点的形状为圆(marker=‘o’);大小为 10(markersize=10);填充颜色为白色(markerfacecolor=‘w’)。
查看全文
false