数据可视化 | 数据可视化的基本流程总结

Aidan075
• 阅读 1225

↑ 关注 + 星标 ~ 有趣的不像个技术号

每晚九点,我们准时相约 数据可视化 | 数据可视化的基本流程总结

数据可视化 | 数据可视化的基本流程总结

我们要的不是数据,而是数据告诉我们的事实。大多数人面临这样一个挑战:我们认识到数据可视化的必要性,但缺乏数据可视化方面的专业技能。部分原因可以归结于,数据可视化只是数据分析过程中的一个环节,数据分析师可能将精力花在获取数据、清洗整理数据、分析数据、建立模型,但在最终的展示沟通上力不从心。

数据可视化 | 数据可视化的基本流程总结

这也是“写代码的干不过做PPT”的部分原因。实际上,只要掌握了可视化的技能,我们的工作就更容易受到leader的认可。

可视化工具包括但不限于,Tableau,Excel,PowerBI,Python,R

可视化之前:探索性分析与解释性分析

二者之间有很重要的区别:探索性分析指理解数据并找出值得分析或分享给他人的精华。这就好比,在牡蛎中寻找珍珠,可能打开一百个牡蛎(尝试很多种方法)才最终找到两颗珍珠。而解释性分析,我们迫切希望能够言之有物,讲好某个故事--专注于两颗珍珠。

大多数时候我们汇报工作就是要做好解释性分析的工作。

可视化过程

一个完整的数据可视化过程,主要包括以下4个步骤:

确定数据可视化的主题
提炼可视化主题的数据
根据数据关系确定图表
进行可视化布局及设计

数据可视化 | 数据可视化的基本流程总结

图片来自:木东居士

可视化元素由3部分组成:可视化空间+标记+视觉通道

可视化空间

数据可视化的显示空间,通常是二维。三维物体的可视化,通过图形绘制技术,解决了在二维平面显示的问题,如3D环形图、3D地图等。

标记

标记,是数据属性到可视化几何图形元素的映射,用来代表数据属性的归类。

根据空间自由度的差别,标记可以分为点、线、面、体,分别具有零自由度、一维、二维、三维自由度。如我们常见的散点图、折线图、矩形树图、三维柱状图,分别采用了点、线、面、体这四种不同类型的标记。

视觉通道

数据属性的值到标记的视觉呈现参数的映射,叫做视觉通道,通常用于展示数据属性的定量信息。

常用的视觉通道包括:标记的位置、大小(长度、面积、体积...)、形状(三角形、圆、立方体...)、方向、颜色(色调、饱和度、亮度、透明度...)等。

确定图表

数据之间的相互关系,决定了可采用的图表类型。常见的数据关系和图表类型的对应关系如下图所示:

数据可视化 | 数据可视化的基本流程总结

图片来自:木东居士

在以后的专栏中,我们将逐步分享上述图片中出现的各图形应用案例及注意事项。接下来,我们结合具体案例来讲述数据可视化的魅力

表格

使用表格时,需要记住的一点是:让设计融入背景,让数据占据核心地位。不要让厚重的边框和阴影与数据争夺受众的注意力。相反,要使用空格来区分表格中的元素。

数据可视化 | 数据可视化的基本流程总结

左表,框线过多容易扰乱阅读者的注意力,反之,三线表简洁干练,通常是论文及出版物表格样式的首选。

热力图

热力图是用表格的形式可视化数据的一种方法,在显示数据的地方(数据之外)利用着色的单元格传递数据相对大小的信息。

数据可视化 | 数据可视化的基本流程总结

热力图绘制(excel2010版):选中数据--开始--样式--条件格式(你可以根据需要选择合适的条件格式)。

折线图

我们通常可以借助折现图理解趋势,比如,时间序列的每年降雨量(每日将与量之和);在某些情况下,折线图中的线可能代表一个综合的统计数据,比如平均值或预测的点估计。如果你还想展示范围(或者置信区间),可以直接在图上进行可视化。

源数据:

数据可视化 | 数据可视化的基本流程总结

数据可视化 | 数据可视化的基本流程总结

左图是多指标折线图,右图在折线图中展示范围内的平均值。

绘制右图时:先绘制avg--max折线图,然后右键“更改图表类型”,选择“面积图”;

右键“选择数据”,添加min折线图;最后选中“min折现图”,右键“设置数据系列格式”,选择“纯色填充--白色”。

数据可视化 | 数据可视化的基本流程总结

本文转转自微信公众号凹凸数据原创https://mp.weixin.qq.com/s/aXKvHeSKTxXq_y219G8YFw,可扫描二维码进行关注: 数据可视化 | 数据可视化的基本流程总结 如有侵权,请联系删除。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表(关于日期时间时分秒显示不出来)
在使用皕杰报表设计器时,数据据里面是日期型,但当你web预览时候,发现有日期时间类型的数据时分秒显示不出来,只有年月日能显示出来,时分秒显示为0:00:00。1.可以使用tochar解决,数据集用selecttochar(flowdate,"yyyyMMddHH:mm:ss")fromtablename2.也可以把数据库日期类型date改成timestamp
Aidan075 Aidan075
3年前
1年前的小五都用 Python 来做什么?
↑点击上方“凹凸数据” 关注星标 每天更新,干货不断  (多图预警)注:这是小五一年前在知乎的回答,当时还只有凹凸数读一个公众号,所以很多图片都会带有数读或者知乎的水印。作为一个菜鸟数据分析师,只会sqlpython业余时间写写文章:用python爬取数据→数据清洗→数据分析→数据可视化词云镇楼20190730回来看,前面
Wesley13 Wesley13
3年前
6个顶级动态数据可视化工具
作为一名数据分析师,一提到动态数据可视化就会感到莫名兴奋,我认为数据可视化有两个非常重要的部分:一个是动态,一个是数据可视化。要使数据分析真正有价值和有洞察力,就需要高质量的动态可视化工具。市场上有很多产品,特点和价格各不相同,本文列出了一些广泛认可的工具,我们来一起了解一下数据动态可视化制作工具。一、数据动态可视化制作工具——Smartbi可视化B
Stella981 Stella981
3年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
【Python学习教程】常用的8个Python数据可视化库!
Python是一门非常优秀的编程语言,被广泛的应用于各个领域,它不仅简单、易懂、语法清晰,还拥有各种各样的库,让我们的工作更高效、更便捷。今天为大家分享8个Python库,有了它们之后,数据可视化超轻松,快来学习一下吧。  数据可视化是展示数据、理解数据的有效手段,常用的Python数据可视化库如下:  1.Matplotlib第一个Python可视化库
Vitess全局唯一ID生成的实现方案 | 京东云技术团队
为了标识一段数据,通常我们会为其指定一个唯一id,比如利用MySQL数据库中的自增主键。但是当数据量非常大时,仅靠数据库的自增主键是远远不够的,并且对于分布式数据库只依赖MySQL的自增id无法满足全局唯一的需求。因此,产生了多种解决方案,如UUID,Sn
Python进阶者 Python进阶者
9个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这