Excel图表和数据分析

Stella981
• 阅读 516

十年前写的,从今天看起来之前的想法还是比较幼稚的。

从理论指导角度,数据分析可以划分为基于统计学的和基于数据挖掘的数据分析方法,很显然基于统计学的相对容易理解一些,而数据挖掘对高等数学要求会高一些,相信毕业十几年的同学很可能连A*X**2+B*X+C=0都快忘记了,甚至我不确定等小孩上了初中能不能教的了他数学。

从分析的出发点看,数据分析可以划分为基于业务驱动的和基于纯数学驱动的数据分析,业务驱动是建立在对业务理解的基础上,有些经验论的色彩,大多情况下是验证自己的想法,或者更方便找出业务问题和业绩;而基于纯数学驱动基本上都是通过某些挖掘算法找出数字之间的规律,然后把这种规律翻译成业务,理论上是非常可行的,但实际工作中鲜有成功案例。大多数情况下是把两者结合到一起,即通过拍脑袋的方式定义数据的输入和输出,而挖掘算法只是为了证明一下自己的决策有多高明。

从分析的输出上,数据分析可以以图表、文字、表格、业务推导过程或者一系列高深的数学公式的方式呈现,显而易见图表给人的印象是最深刻的,表格次之,文字效果最差,最后是那些没人看得懂的过程或公式;Excel的优势恰恰就是表格和图表。

从分析工具而言,包括了入门级的Excel、最近红的发紫的R语言,专业统计软件工具SPSS,最强大的SAS,很显然绝大多数人只会Excel,不过Excel也有很多的自带的数据分析库,并且Excel的应用商店云化后的力量不可小觑,未来是否有能力与专业的统计软件数据挖掘工具相媲美还很难说,而且Excel的一个巨大的优势在于其庞大的客户群。

从图表的角度,Excel比不上那些专业的BI工具,从统计角度,Excel比不了那些专业的统计软件;但Excel提供的功能对于我们这些非专业人士已经足够了,通过透视表做一些多维分析,通过应用商店找一些炫的图表,通过插件做一些简单的数据分析,通过VBA和不厌其烦的调试也可以做一些”专业“的图表,这也是我们的目的。

Excel提供的图表种类包括柱形图、折线图、饼图、条形图、面积图、XY(散点图)、股价图、曲面图、雷达图、组合,实际上最常用的是柱形图、折线图、饼图、条形图、组合图;较常用的是面积图、雷达图和XY(散点图);基本不用的是股价图、曲面图。

关于图表类型的选择,互联网上的大拿们说的已经够多了,在此提及有凑字数的嫌疑,不过还是要强调一点,图表类型的选择明智与否与你对业务数据的理解和你的分析思路密切相关,如果选择了不恰当的图表,恰恰表示你还没做好数据分析的准备工作。

最后附上两张图表的基本类型和选择的中英文版本。

Excel图表和数据分析

Excel图表和数据分析

本文分享自微信公众号 - 追梦IT人(baoqiangwang2020)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Wesley13 Wesley13
3年前
java将前端的json数组字符串转换为列表
记录下在前端通过ajax提交了一个json数组的字符串,在后端如何转换为列表。前端数据转化与请求varcontracts{id:'1',name:'yanggb合同1'},{id:'2',name:'yanggb合同2'},{id:'3',name:'yang
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
5个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Easter79 Easter79
3年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
11个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这