数据分析九大知识点(数据分析之前知道这)

编辑导语:在进行数据分析前,需要耗费不少的时间在数据的清洗过程中。那么,有什么方法可以提高数据清洗的效率?作者通过总结自己的工作经历,分享了在数据分析之前你需要了解的7件事情,希望对你有所启发。

数据分析九大知识点(数据分析之前知道这)(1)

写在前面

在进行数据分析之前,常常需要耗费大量的心力在对数据的清洗过程,比如,需要针对缺失数据、重复数据或错误数据等等进行预处理。还有很多小伙伴,在没想好想要获取哪些数据来验证何种假设的情况下,就贸然开展采集工作。这些都是在进入数据分析环节前,非常重要但很容易被忽略的问题。

如前美国首席数据科学家 DJ Patil 所说:“不过分的说:任何数据项目中 80% 的工作都在采集清理数据。”

为了更好的避免这类问题的出现,在开展数据分析之前,需要围绕在“问题的具体化描述”、“确立假设”中进行深入的剖析,这个时期的“慢即是快”。如果无法正确地定义问题、合理地拆解问题、抓住关键问题,后续的环节都是徒劳。

所以,正确的问题是指引你找到可靠解决的路标,而高质量的数据是数据分析的基石。我依据实际工作中的经历,梳理了数据分析前你要知道的 7 件事,希望对你有所启发。

以下,Enjoy~

通过本文,你可以了解:

  1. 5W1H 让问题具体化
  2. 将商业思考拆解成可量化的数字
  3. 从假设出发采集数据
  4. 什么是第一、二、三方数据?
  5. 哪些是可以直接利用的数据?
  6. 结构化和非结构化数据有什么不同?
  7. 你采集的是好数据吗?
一、5W1H 让问题具体化,清晰需要采集什么数据

在所有的研究工作开始之前,厘清目标问题是什么,这是整个研究的核心。运用 5W1H (who -谁、when-时间、where-地点、what-什么事、why-为什么发生、how-如何发生),针对问题进行提问,有助于把问题具体化。

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页