大数据到底是什么该怎么定义(大数据到底是什么)

大数据到底是什么该怎么定义(大数据到底是什么)(1)

当今社会,大数据的概念炒的很火。不少条友也对这个话题很感兴趣。因为我目前是大数据专业的老师,应邀请简单讲讲大数据。本文图片全部来自厦门大学林子雨老师大数据系列教材所配套的课件。文字都是基于本人自己的思考完成。

首先要谈的是,数据是什么?我的回答是,定量描述。大数据呢?用传统方法难以在可接受的时间内处理完毕的数据集合。

说到这里,有人会想,大数据就是很多很多数据呗。多,所以处理慢。以上理解比较片面。大数据要符合四个特点。首先,数据量大;然后,更新很快;还有形式多样,或者说形式不固定;最后是价值大但是价值密度低。这些特点都满足才算大数据。

大数据到底是什么该怎么定义(大数据到底是什么)(2)

接下来开始举例子了。都是随便想的,不一定全对。

首先来几个反例。身份证信息是不是大数据?需要回答上述四个问题。身份证数据量大不大?全国十几亿份,很大。更新快不快?每天有新增,算快,但是,形式多样吗?不是,每个人身份证都是统一的一些内容,无非是姓名,年龄,住址,证号等。价值大没错,但价值密度低就不是了,每个身份证都是很重要的信息。总之四个条件只满足两个,不是大数据。

正面的例子。说两个吧,一个高大上的,一个接地气的。

首先,卫星遥感数据(可理解为卫星拍摄的对地数码照片)是不是大数据?还是四个特点来验证。数据量大不大?天上有非常多卫星,就说中国的也特别多。每个卫星不断对地拍照,数据量很大。更新快不快?每围着轨道转一圈,照片又更新一圈,更新快。形式多样吗?每个卫星照片的分辨率等方面并不一致。数据形式多样。价值当然很大,但价值密度低。比如某些应用中,只有捕捉到某受关心的现象的照片才有价值。说得具体一点,如果用卫星照片检测无人区森林火灾,可能几年的照片都没用,但报告起火的那张照片价值很大。综上所述,卫星遥感数据是大数据。

再来一个生活中的例子。超市购物是日常的活动。把所有的购物数据保存下来是大数据吗?开始验证。数据量大不大?非常大。更新快不快?不停有新增数据,更新很快。形式多样吗?虽然仅仅是购物数据,但每个人买的数量相差很大。有人数据就一项,有人一百项。价值方面,单独个别购物记录意义不大。全部记录的集合则蕴含着商机。比如,可以发现哪些产品畅销,哪些产品组合受欢迎等等。

总之,大数据可以很高端,也可能就在我们身边。技术的不断升级使得数据的获取和存储越来越廉价。既然数据唾手可得,为什么不好好利用呢。通过数据直接揭示规律,开展研究,是这个大数据时代的红利。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页