搜索
大数据中国 首页 行业资讯 峰会活动 查看内容
养成数据思维,数据分析工具get起来
2018-4-25 10:54 |来自: 数据分析工具| 查看: 5503| 评论: 0


    大家下午好,相信小伙伴们已经在课前听说过了,我们这次的系列课与数据可视化分析紧密相关,这次系列课一共分成三节,分别是思维养成与工具掌握,分析与预测方法应用,以及实际案例解决。希望大家听完我们的课程后,对数据分析会有更深的理解。

第一堂课:养成数据思维,分析工具get起来
     我们都知道数据分析在各行各业均有应用需求,尤其在每年每月固定的汇报内容里必然少不了统计分析。但不同统计人员做出的成果常常大相径庭,有的让人一目了然,有的让人云里雾里,比如这几个常出现的问题,在座各位同学可以看看自己是否也出现过相似的问题:

1、拿来一堆华丽丽没重点的报表。虽然符合审美了,却失去了其本身作为分析报告的意义。
2、花样百出,但每张图都图不达意。图表类型丰富有趣,但图表内容不忍直视
3、报告繁杂冗长,逻辑思维混乱不堪。这点就不用多说了,因果关系分析混乱,分析结论之间紧密性极差,都是不能容忍的。
4、报告册子得论斤算。传统纸质报告通常是以一叠或一本的形式出现的,其实里面许多内容是重复的,比如每月的月报,使用格式、表现形式基本上是一致的,但由于纸质报告的固定性,导致每月都要重新制作报告,这是很浪费人力物力的。
    所以,为了解决这些问题,我们开展了第一堂课:加强数据思维逻辑、学会使用分析工具。只有把数据分析用好了、用合适了,才能真正解决这些问题。

课程简介
    我们这次课简单分成两部分:一个是学习思维养成的方法,主要以方法分享为主;另一个是分析工具的使用方法,会结合分析工具做实际操练。

一、养成数据思维的方法


    首先我们来了解下思维养成的一些方法,我总结了几个关键词:细心、严谨、敏感、素养、习惯。
    其中,细心、严谨、敏感,是基本的一个数据态度,做数据分析的人基本上都要求具备这几点;至于素养与习惯,我个人认为不停地通过各种途径提升数据素养,并保持良好的习惯,都是养成数据思维所必须的。
    接下来我们看一下养成数据思维具体的几个方法:

1、管理好基础数据,数据分析里数据是基础,管理好基础数据、把控好数据质量,养成数据及时入库的习惯,能尽可能地为数据分析打好基础
2、当拿到一份报告时,要尝试使用一些可参考值来检验报告合理性:
     举个例子,我拿到一份报告,报告中说总销售额达到三百多万,月均销售额为三万多,这个结论明显就是错误的,月均三万多,一年也才12个月,最后得到的总销售额怎么可能达到三百多万呢?
3、看拿到一份报告时,还要考虑其前提条件与使用意义,比如数据来源是否可靠、指标计算规则是否与要求一致(不同企业的计算规则并不完全一致),等等。

可视化展示注意点
    这里我们提两个日常工作中比较实用的:可视化展示与分析报告展示。这两个是我们平时做分析汇报时比较常采用的方式。
    首先是可视化展示注意点,这里我们先上一张图,通过图来简单了解一下:

    这张报表上下对称,上面跟下面的内容是一样的,只是展现形式不同。
1、Y轴间距不可随意调
    我们看下最左边这块内容--月度销售趋势图,明显两个都是折线图,唯一的区别就是波动幅度不同,这个是看报表时人们最容易忽略的一点--Y轴轴间距不同。上面那张折线图Y轴起始点并非零,对应的波动非常剧烈,容易误导别人;那么再看下面那张折线图,Y轴起始点从零开始,能相对客观地反映出销售收入的波动趋势与波动范围。
    其实这两个图没有严格意义上的谁对错,只是看图表作用而已。比如上面那张图,将展现侧重点放在了销售波动上,适用于较特定的商家,比如销售范围长期固定在一个区间内的,对他们来说会更在意销售的波动趋势而非范围。相应的,下面那张图则是相对客观地传达了销售状态信息,适用于较大范围的销售分析。
2、选图表要从目的出发
    我们再看中间这两张图,分别是面积图和折线图,希望反馈的信息是区域销售对比。那这两张图的主要区别在哪呢?
其实做分析的人都知道,两张图较大的区别是信息强化上有所不同的。针对面积图,第一眼看过去给人的一个信息点是序列本身的面积,即序列本身的一个趋势变化;而折线图不同,由于折线图只有一条线,因此强化出的信息点就会是线变化趋势,尤其当需要对比两到三条折线变化时,使用折线图会自动强化序列趋势差异。在这种情况下,序列的变化差异就会一览无遗,因此当需要做对比分析时,我们通常会选择折线图。
3、图表展现要直观
    最后我们再来看下右侧的两张饼图,上面是常规饼图,下面是玫瑰图,它们之间比较大的区别其实一眼就看到了,常规饼图主要以饼大小来表现销售占比;玫瑰图主要以饼大小和半径长短来表现销售占比。
在我们这个案例中,上海、陕西、广州、深圳是销售占比差别相当的,在这种情况下,如果选择常规饼图则不能很好地体现这几个地区谁高谁低,此时则建议使用半径图,通过饼半径的长短可快速判断各个区域谁高谁低。
同时这里还隐含了一个信息点,就是做占比、成分分析时要注意尽量将图表按一定逻辑顺序排序,如从大到小或从小到大排序,这样会更有利于人们读图。
    现在我们可以回到前面看一下可视化展示的几个注意点,相信解读了图表后再来看这几个要点,大家会更加容易理解。

分析报告展示注意点
    接下来是分析报告展示注意点,同样直接上图:

    这是一个三段式的分析报告,有标题、描述、图表,分析报告需要注意的点其实也不是很多,你把它当做议论文来写就可以了,有论点、论据、论证,告诉别人你的分析结果、分析依据、分析过程即可。
    在展现上值得注意的是,分析报告需要有较强的逻辑性,相关内容要摆放在一起;并且分析报告如果整个都是纯文字,其实是比较难让人快速抓到重点或理解的,因此要求要有很强的可读性,建议尽量图表化。

    那么这里呢我们就不回到前面一个个讲解注意点了,因为刚刚我们讲的那几个内容其实已经把重点都包含进去了,至于细节,同学们可以课后再好好消化。

二、分析工具与数据模板
    现在我们再介绍一个实用的思维养成方法--掌握一门分析工具。这也是我们要讲第二部分内容。其实数据分析工具的使用也是思维养成的方法之一,两者之间是相互影响的关系,更清晰的逻辑会让工具使用效果更好,工具掌握的越熟练,则有利于使用者本身的逻辑养成。
    既然讲到数据分析工具,自然是以使用为主,这里就要引出数据模板的概念。前面我们提到传统纸质报告沉重、重复,非常不利于使用,那么数据模板便是一个比较好的解决方案,简单来说,数据模板可以是一个简洁、可重复使用的报告。
    为了更了解数据模板是什么,我们来看一下它所具有的特征:

1、可重复使用,同样一份报告可多次循环使用,比较适合企业日报、月报、年报等格式较为固定的内容,只需往数据模板中套用数据,即可随时查看各时期数据报告
2、傻瓜式操作,可通过鼠标点击上传数据、筛选不同时间维度查看相应历史数据,不需要人为地做一些其他过多的操作
3、共享式报告,通过在线形式与多人分享可视化报告,手机平板、随时随地可看

三、数据模板设计技巧
那么,如果你想学习制作这种高效率的分析报告,需要掌握哪些技巧呢?难不难掌握呢?现在我们就来通过分析工具实际操练一下:

    图中这7个技巧是我们本次课程分析的几个主要内容,只要掌握了这几个技巧,制作自己的数据模板基本上是没问题了。这里就不一个个念了,大家可以自己先看看,待会儿我们操作的时候会一个个演示。

上传数据源
    首先我们上传数据源,有了数据才能做分析,相信大家都能理解。
    为了让大家了解下我们做的是什么,先打开给大家看下。这个Excel里有很多个工作表,我们本次课使用第一个工作表,它是一个店铺的日销售数据,维度有时间、区域、门店、品类等,指标有收入、成本、毛利等,那么我们直接来操作一下。
第一步,打开分析工具并登陆

第二步,上传数据源

日期处理
    对于日期,通常我们会有一些衍生出的需求,比如查看每年、每月的数据情况,这里需要通过一列日期序列来生成年、月等维度,这种情况我们就需要做日期处理。

    在分析工具的基础上做日期处理还是比较容易的,选中数据源并编辑视图,在编辑界面设定好日期列即可,此时系统则自动根据日期列解析生成了年、季度、月等时间维度,我们只要返回报表页面新建报表并使用即可。

图表处理
    我们的第二个小技巧是图表处理,要做分析报告,首先要有合适的统计图表。

    这里我们选择顶部工具栏的“添加图表”,选中合适的图表并添加到展示区中。之后在左侧数据集构建器中添加汇总值、维度值,即可通过图表展示数据情况了。

计算同期
    那么第三个技巧--计算同期,比如说同比环比,也是现代企业分析需求较强的一个内容。

    计算同期在这个分析工具里还是比较容易实现的,选中汇总值“收入”,点选择其对应功能“同期-同期比率、同期差值”即可,系统会自动计算同比与同比差值。

自动排名与TOP10
    第四个技巧是希望了解数据的排名与TOP值,这也是分析中比较常用的一个内容。

    比如说我想看所有门店里,哪个收入高哪个收入低,我们可以点中汇总值“收入”,给它做排名与排序。在此基础上,我想单独筛出排名前十的门店,可以选择维度“门店”并选择功能TOP10来达到效果。

最新评论

关闭

站长推荐上一条 /1 下一条

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-5-2 22:52 , Processed in 0.054275 second(s), 24 queries .