早期的数据小魔方用户大概都知道,我最初也是从学习Excel起步的,只是学习的深入了之后,才开开慢慢的迁移到R语言。
我往R语言转型并不代表自己开始放弃Excel或者觉得Excel不适合做可视化,只是想体验一下Excel外围的可视化世界是什么样子的,毕竟在这个大行业内,还活跃着太多可视化领域的佼佼者,譬如 PowerBI、Tableau等。
当然,这些软件各有特点,但是在要划分一个类别的话,我觉得可以划分为三类:
Excel(以及寄生于Excel平台的各种辅助软件dashboard、Think-cell-chart)
桌面端可视化工具(以Tableau、PowerBI等)
编程工具。(以R语言、Python以及各种js开源可视化库)
但若要继续对其进行简化分类的话,我觉得其实可以分为两类:
Excel家族;
非Excel家族。
也许这里的分类大家会觉得摸不着头脑,我的理由是,数据可视化很重要的一步即是对原始业务数据结构的理解,而在Excel的图表库中,微软所设计的图形库是基于二维表的。(因为Excel自由灵活的表结构不限制变量类型,不识别因子变量(即用于构造模型或者用于图形映射))。
也许以上解释并不能令你满意,这里我只强调一点,同样制作一个多分类的柱形图(或者条形图),假若你获取的原始数据是三个字段,一个门店名称,一个季度标签,一个销售额,那么这种数据结构你是无法对其进行图表化呈现的,你需要借助Excel的数据透视功能,对其进行维度交叉透析,进而使用汇总表(二维表)进行多分类图表构建。
以上就是Excel中图表构建原理的大致过程,而除Excel之外的数据可视化产品,基本上都是使用一维表结构(长数据)来构建可视化图形的。其中因子变量(即通常意义上的分类变量)充当着至关重要的作用。
这也是用惯了Excel的小伙伴儿,如果想要迁移到其他可视化工具上,迈出的第一步往往无比艰难(也不能一概而论,假如你经常使用Excel的数据透视表功能,并且对数据库有所了解,对于数据的长宽转换应该早就烂熟于心了,这道坎不会困扰你太久)。
二维表有二维表的好处,即所见即所得,因为二表已经具备一定的图形化特征,而不单单是表了,但是二维表作图在效率上有着天然的劣势,即你会淡化对数据数据结构的理解,会被Excel的这种作图理念所吞噬,进而被绑架。(纯属个人愚见)
又扯远了,今天的主角仍然是Excel,我使用自己学习以来的案例来说明,Excel仍然是一款不折不扣的优秀可视化工具。
学习的第一步当然是模仿,所以才有了这些积淀很久的案例:
模仿可以快速提升你的“图感”,然后你会更大胆的去挑战高难度动作:
等有了足够的经验和技巧积累,尝试着自己找案例去做:
实习是很好的锻炼机会,可能你不需要做高难度高复杂度的工作,但是你能学到如何平衡技能与实际业务数据,融合并凝练细节。
Excel的强大远不止于此,如果你能习得名称管理器、开发工具与高级查询函数,那么制作动态仪表盘是分分钟的事儿,再将平时里积淀的优秀版式、配色方案等融入其中,那么你的工作价值一定会呈指数级增长。
欢迎关注魔方学院QQ群:
本文分享自微信公众号 - 数据小魔方(datamofang)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。