零基础入门数据分析(如何从零开始学习数据分析)

零基础入门数据分析(如何从零开始学习数据分析)(1)

有一位朋友最近向我吐槽,他提交了一份11月数据报告给领导,报告里面放了很多图,也摆了很多数据,结果被骂了,觉得很委屈。我帮他分析后发现他撞到了一个数据分析误区:应该分析哪些内容?

其实,有很多伙伴与我的这位朋友一样,做数据分析时,经常会有这样的误区。数据分析不是为分析而分析,应该是围绕你的分析目的而进行分析。

目前现有的数据分析师大多是统计学、计算机、数学等专业出身,他们大多缺乏从事营销、管理方面的工作经验,对业务的理解相对较浅,对数据的分析偏重于数据分析方法的使用,如回归分析、相关分析等,缺乏业务知识,最终导致分析结果偏离实际。这些问题对于从事市场、销售、运营的非数据分析师也是存在的。今天我们来说说菜鸟如何做数据分析。

*本文内容来源:《谁说菜鸟不会数据分析》,文末有福利。

一、 数据分析的作用

数据分析在企业的日常经营分析中主要有三大作用

零基础入门数据分析(如何从零开始学习数据分析)(2)

1、现状分析

简单来说就是告诉你过去发生了什么,具体体现在:

第一,告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明企业整体运营是好了还是坏了,好的程度如何,坏的程度又到哪里。

第二,告诉你企业各项业务的构成,让你了解企业各项业务的发展及变动情况,对企业运营状态有更深入的了解。

现状分析一般通过日常通报来完成,如日报、周报、月报等形式。

2、原因分析

简单来说就是告诉你某一现状为什么发生。

经过第一阶段的现状分析,我们对企业的运营情况有了基本了解,但不知道运营情况具体好在哪里,差在哪里,是什么原因引起的。这时就需要开展原因分析,以进一步确定业务变动的具体原因。例如2012年2月运营收入环比下降5%,是什么原因导致的呢?是各项业务收入都出现下降,还是个别业务收入下降引起的?是个地区业务收入都出现下降,还是个别地区业务收入下降引起的?这就需要我们开展原因分析,进一步确定收入下降的具体原因,对运营策略做出调整与优化。

原因分析一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。

3、预测分析

简单来说就是告诉你将来会发生什么。

在了解企业运营现状后,有时还需要对企业未来发展趋势作出预测,为制定企业运营目标及策略提供有效的参与决策依据,以保证企业的可持续健康发展。

预测分析一般通过专题分析来完成,通过在制定企业季度、年度等计划时进行,其开展的频率没有现状分析及原因分析高。

二、数据分析是什么?

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。

在统计学领域,有些学者将数据分析划分为描述性数据分析、探索性数据分析以及验证性数据分析。其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于验证已有假设的真伪证明。

从另一个角度看,描述性数据分析属于初级数据分析,常见的分析方法有对比分析法、平均分析法、交叉分析法等。而探索性数据分析以及验证性数据分析属于高级数据分析,常见的分析方法有相关分析、因子分析、回归分析等。

三、数据分析的步骤

数据分析过程主要包括6个既相对独立又互有联系的阶段。它们是:明确分析目的和思路、数据收集、数据处理、数据分析、数据展现、报告撰写等6步。

零基础入门数据分析(如何从零开始学习数据分析)(3)

1、明确分析目的和思路

做任何事都要有个目标,数据分析也不例外。在开展数据分析之前,要想想为什么要开展数据分析?通过这次数据分析我要解决什么问题?当分析目标明确后,我们就要梳理分析思路,并搭建分析框架,把分析目标分解成若干个不同的分析要点,即如何开展数据分析,需要从哪几个角度来进行分析。

只有明确了分析目的,分析框架才能跟着确定下来,最后还要确保分析框架的体系化,使结果具有说服力。体系化也就是逻辑化,简单来说就是先分析什么,后分析什么,使得各个分析点之间具有逻辑联系。一般是以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,这样才能确保数据分析维度的完整性,分析结果的有效性及正确性。

营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等,而管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等。这些都是经典的营销、管理方面的理论,需要在工作中不断实践应用,你才能体会其强大的作用。例如以PEST分析理论为指导,搭建的互联网行业PEST分析框架。

2、数据收集

数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供了素材和依据。这里所说的数据包括第一手数据与第二手数据,第一手数据主要指可直接获取的数据,第二手数据主要指经过加工整理后得到的数据。一般数据来源主要有以下几种方式:

(1)数据库

每个公司都有自己的业务数据库,存放从公司成立以来产生的相关业务数据。这个业务数据库就是一个庞大的数据资源,需要有效地利用起来。

(2)公开出版物

可以用于收集数据的公开出版物包括《中国统计年鉴》《中国社会统计年鉴》《中国人口统计年鉴》《世界经济年鉴》《世界发展报告》等统计年鉴或报告。

(3)互联网

随着互联网的发展,网络上发布的数据越来越多,特别是搜索引擎可以帮助我们快速找到所需要的数据,例如国家及地方统计局网站、行业组织网站、政府机构网站、传媒媒体网站、大型综合门户网站等上面都可能有我们需要的数据。

(4)市场调查

进行数据分析时,需要了解用户的想法与需求,但是通过以上三种方式获得此类数据会比较困难,因此可以尝试使用市场调查的方法收集用户的想法和需求数据。

3、数据处理

数据处理是指对收集到的数据进行加工整理,形成适合数据分析的样式,它是数据分析前必不可少的阶段。数据处理的基本目的是从大量的、杂乱无章、难以理解的数据中,抽取并推导出对解决问题与价值、有意义的数据。

数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。一般拿到手的数据都需要进行一定的处理才能用于后续的数据分析工作,即使再“干净”的原始数据也需要先进行一定的处理才能使用。

4、数据分析

数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值信息,形成有效结论的过程。

在确定数据分析思路的阶段,数据分析师应当为需要分析的内容确定适合的数据分析方法,等到真正进入进行数据分析阶段时,就能够驾驭数据,从容地进行分析和研究了。

由于数据分析多是通过软件来完成。这就要求数据分析师不仅要掌握各种数据分析方法,还要熟悉主流数据分析软件的操作。一般的数据分析我们可以通过Excel完成,而高级的数据分析就要采用专业的分析软件进行了,如数据分析工具SPSS Statistics,DataHunter等。

5、数据展现

一般情况下,数据是通过表格和图形的方式来呈现的,我们常说用图表说话就是这个意思。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等,当然可以对这些图表进一步整理加工,使之变为我们所需要的图形,例如金字塔图、矩阵图、漏斗图、帕累托图等。

大多数情况下,人们更愿意接受图形这种数据展现方式,因为它能更加有效、直观地传递出分析师所要表达的观点。记住,在一般情况下,能用图说明问题的就不用表格,能用表格说明问题就不用文字。

6、报告撰写

数据分析报告是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,供决策者参考。一份好的数据分析报告需要有如下3点要求:

(1)好的分析框架:首先需要有一个好的分析框架,并且图文并茂、层次明晰,能够让阅读者一目了然。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。

(2)明确的结论:没有明确结论的分析称不上分析,同时也失去了报告的意义,因为我们最初就是为寻找或者求证一个结论才进行分析的,所以千万不要舍本求末。

(3)建议或解决方案:作为决策者,需要的不仅仅是找出问题,更重要的是建议或解决方法,以便他们在决策时作参考。所以,数据分析师不仅需要掌握数据分析方法,而且还要了解和熟悉业务,这样才能根据发现的业务问题,提出具有可行性的建议或解决方案。

四、常见数据分析方法

1、对比分析法

(1)定义

是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。对比分析法的特点是:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少?

(2)分类

对比分析法可分为静态比较和动态比较两类

静态比较是在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较、也叫横向比较,简称横比

动态比较是在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比

这两种方法既课单独使用,也可结合使用。进行对比分析时,可以单独使用总量指标、相对指标或平均指标,也可将它们结合起来进行对比。比较的结果可用相对数表示,如百分数、倍数等指标。

(3)实践运用

a)与目标对比:实际完成值与目标进行对比,属于横比;

b)不同时期对比:选择不同时期的指标数值作为对比标准,属于纵比;

c)同级部门、单位、地区对比:与同级部门、单位、地区进行对比,属于横比;

d)行业内对比:与行业中的标杆企业、竞争对比或行业的平均水平进行对比,属于横比

e)活动效果比:对某项营销活动开展前后进行对比,属纵比。同时,我们还可以对活动的开展状况进行分组对比,这属于横比。

(4)注意事项

指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量;对比的对象要有可比性;对比的指标类型必须一致。无论绝对数指标、相对数指标、平均数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。

2、分组分析法

(1)定义

作数据分析不仅要对总体的数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。这种方法是根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。

(2)目的

分组的目的就是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用各种数据分析方法来解构内在的数量关系,因此分组法必须与对比法结合运用。

(3)步骤

a)确定组数

这个可以由数据分析师决定,根据数据本身的特点(数据的大小)来判断确定。由于分组的目的之一是为了观察数据分布的特征。因此确定的组数应适中。如果组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律

b)确定各组的组距

组距是一个组的最大值与最小值只差,可根据全部数据的最大值和最小值及所分的组数来确定,及组距=(最大值—最小值)/组数

c)根据组距大小,对数据进行分组整理,划归至相应组内。

3、结构分析法

结构分析法是指被分析总体内的各部分与总体之间进行对比的分析方法,即总体内各部分占总体的比例,属于相对指标。一般某部分的比例越大,说明其重要程度越高,对总体影响越大。

结构相对指标(比例)=(总体某部分的数值/总体总量)*100%

市场占有率=(某种商品销售量/该种商品销售总量)*100%

市场占有率是分析企业在行业中竞争状况的重要指标,也是衡量企业运营状况的综合经济指标。市场占有率高,表明企业运营状况好,竞争能力强,在市场上占据有利地位;反之,则表明企业运营状态差,竞争能力弱,在市场上处于不利地位。

4、平均分析法

平均分析法就是运用计算平均数的方法来反应总体在一定时间、地点条件下某一数量特征的一般水平。平均指标法的主要作用有两点:

(1)利用平均指标对比同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,比用总量指标对比更具有说服力

(2)利用平均指标对比某些现象在不同历史时期的变化,更能说明其发展趋势和规律。

算术平均数=总体各单位数值的综合/总体单位个数

算术平均数是非常重要的基础指标。平均数是综合指标,它的特点是将总体内各单位的数量差异抽象化,它只能代表总体的一般水平,掩盖了在平均数后各单位的差异。

5、交叉分析法

交叉分析法通常用于分析两个变量(字段)之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量值成为不同变量的交叉结点,形成交叉表,从而分析交叉表中变量之间的关系。交叉表当然也有也有二维以上的,维度越多,交叉表就越复杂,所以在选择几个维度的时候需要根据分析的目的决定。

6、综合评价分析法

综合评价分析法是将多个指标转化为一个能够反映综合情况的指标来进行分析评价。主要有5个步骤:

(1)确定综合评价指标体系,即包含哪些指标,是综合评价的基础和依据

(2)收集数据,并对不同计量单位的指标数据进行标准化处理

(3)确定指标体系中各指标的权重,以保证评价的科学性

(4)对经处理后的指标再进行汇总计算出综合评价指数或综合评价分值

(5)根据评价指标或分值对参评单位进行排序,并由此得出结论

零基础入门数据分析(如何从零开始学习数据分析)(4)

7、杜邦分析法

杜邦分析法是由美国杜邦公司创造并最先采用的一种综合分析方法,又称杜邦财务分析体系,简称杜邦体系。它是利用各主要财务指标间的内在联系,对企业财务状况及经济效益进行综合分析评价的方法。

杜邦分析体系的特点是,将若干个用以评价企业经营效率和财务状况的比率按其内在联系有机结合起来,形成一个完整的指标体系,并最终通过权益收益率来综合反映。杜邦分析采用的金字塔形结构,使财务比率分析的层次更清晰、条理更突出,简洁明了地表达了各财务指标之间的关系。

零基础入门数据分析(如何从零开始学习数据分析)(5)

8、漏斗分析法

漏斗图分析法是一个适合业务流程比较规范、周期比较长、各流程环节涉及复杂业务过程比较多的管理分析工具。例如漏斗图用于网站中某些关键路径的转化率的分析,不仅能显示用户从进入网站到实现购买的最终转化率,同时还可以展示整个关键路径中每一步的转化率。

单一的漏斗图无法评价网站某个关键流程中个步骤转化率的好坏。我们可以利用之前介绍的对比分析法,对同一环节优化前后的效果进行对比分析,或对同一环节不同细分用户群的转化率作比较,或对同行业类似产品的转化率进行对比,等等。

9、矩阵关联分析法

矩阵分析法是指根据事物(产品、服务等)的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也成为矩阵关联分析法,简称矩阵分析法。

矩阵关联分析法在解决问题和资源分配时,为决策者提供重要参考依据。先解决主要矛盾,再解决次要矛盾,有利于提高工作效率,将资源分配到最能产生绩效的部门、工作中,有利于决策者进行资源优化配置。

零基础入门数据分析(如何从零开始学习数据分析)(6)

10、高级数据分析法

零基础入门数据分析(如何从零开始学习数据分析)(7)

五、数据分析师的职业要求

1、懂业务

从事数据分析工作的前提就是需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的实用价值。

2、懂管理

懂管理,一方面是搭建数据分析框架的要求;另一方面的作用是针对数据分析结论提出有指导意义的分析建议,如果没有管理理论的支撑,就难以确保分析建议的有效性。

3、懂分析

懂分析是指掌握数据分析的基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效地开展数据分析。

基本的分析方法有:对比分析、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。

高级的分析方法有:相关分析法、回归分析法、聚类分析法、判断分析法、主成分分析法、因子分析法、对应分析法、时间序列等。

4、懂工具

懂工具是指掌握数据分析相关的常用工具。数据分析工具就是实现数据分析方法理论的工具,面对越来越庞大的数据,依靠计算器进行分析是不现实的,必须利用强大的数据分析工具完成数据分析工作。

5、懂设计

懂设计是指运用图表有效表达数据分析师的分析观点,使分析结果一目了然。图表的设计是门大学问,如图形的选择、版式的设计、颜色的搭配等,都需要掌握一定的设计原则。

六、数据分析师的基本素质

1、态度严谨负责

数据分析师可以说是企业的医生,他们通过对企业运营数据的分析,为企业寻找症结及潜在问题。一名合格的数据分析师,应具有严谨负责的态度,保持中立立场,客观评价企业在发展过程中存在的问题,为决策层提供有效的参考依据。

2、好奇心强烈

在数据分析师的脑子里,应该充满着无数个“为什么”:为什么是这样的结果,为什么不是那样的结果,导致这个结果的原因是什么,为什么结果不是预期的那样等等,只有这样才有突破点。

这一系列问题都要在进行数据分析时提出来,并且通过数据分析,给自己一个满意的答案。越是优秀的数据分析师,好奇心越不容易满足,回答了一个问题,又会抛出一个新的问题,继续研究下去。

3、逻辑思维清晰

从事数据分析时所面对的商业问题都是较为复杂的,我们要思考错综复杂的成因,分析所面对的各种复杂的环境因素,并在问题的若干发展可能性中选择一个最优的方向。这就需要我们对事实有足够的了解,同时也需要我们能真正理清问题的整体以及局部的结构,在深度思考后,理清结构中相互的逻辑关系,只有这样才能真正客观地、科学地找到商业问题的答案。

4、擅长模仿学习

在做数据分析时,有自己的想法固然重要,但是“前车之鉴”也是非常有必要学习的,它能帮助数据分析师迅速地成长。因此,模仿学习是快速提高学习成果的有效方法。成功的模仿需要领会他人方法的精髓,理解其分析原理,透过表面达到实质。

5、勇于创新

创新是一个优秀数据分析师应具备的精神,只有不断的创新,才能提高自己的分析水平,使自己站在更高的角度来分析问题,为整个研究领域乃至社会带来更多的价值。

七、小结

1.数据分析在企业的日常经营分析中主要有三大作用:现状分析、原因分析、预测分析;

2.数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用;

3.数据分析过程主要包括:明确分析目的和思路、数据收集、数据处理、数据分析、数据展现、报告撰写等6步;

4.数据分析方法有:对比分析法、分组分析法、结构分析法、平均分析法、交叉分析法、综合评价分析法、杜邦分析法、漏斗分析法、矩阵关联分析法、高级分析法;

5.数据分析师的职业要求需要懂业务、懂管理、懂分析、懂工具、懂设计。还需要具备负责严谨的态度、强烈的好奇心、清晰的逻辑思维、学习模仿和创新。

DataHunter,让你爱(AI)上看数据

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页