大数据显示黄色的什么意思(大数据简介)

大数据是什么?

这个时代彷佛人人都在谈论大数据,那么到底什么是大数据?大数据到底玄乎在哪里?根本上还是得从大数据的概念以及来历来进行阐述。说到底,大数据(Big-Data)的本质还是数据,只不过其侧重在“大”这个特征上。

数据是描述与记录人们生活与生产活动的某种表达系统的实例,例如符号系统表示,语言系统表示等。我们对获得的数据进行处理与分析以获得一些信息,这些信息可以用来解释现在以及预测未来。例如我们通过分析每年的降雨量和A粮食产量的关系,可以通过当年降雨量预测当年A粮食的产量。

我们处理各种各样的数据,无非是企图通过数据更好地了解这个世界。例如,以前我们对于一个人的描述可能是这样:

刘明明,23岁,爱好篮球、读书、音乐,北京工作。

出于收集信息的成本以及隐私的考虑,以前关于一个人的信息的可能是很有限的。而在大数据的情况下则不一样了,我们的衣食住行无时无刻不被移动互联网监视着。我们可以获得刘明明一年的行动情况,通过这些数据我们知道他经常去篮球馆;通过刘明明的购物记录知道他经常在网上购书,由此知道他喜欢读书,甚至偏好什么类型的书都能知道。说的不好听点,刘明明一天天的生活日常都被记录下来,那么我们还不知道刘明明是怎么样的一个人吗?所以说,大数据其实就是我们能收集更多的关于某个人或事的方方面面的数据,而不是通过抽样的结果去推测,那么对于他的描述也就更加准确了。

大数据特点

大数据的“大”的概念体现在个方面:数据量大(Volume)、数据类型多样化(Variety)、单位价值密度低(Value)、速度快(Velocity),总结为4V。

1. Volume

数据量大是针对传统的数据而言,当数据体量达到TB(一般普通笔记本的硬盘容量为1TB)、PB(1PB = 1024TB)级别,传统的单机的储存与计算能力已不足以应付这种规模数据的计算与分析了。一方面随着人们观测与记录能力的增强,许多数据都可以被人类所收集,导致数据的爆炸增长;另一方面,随着信息与人员流动(移动互联网与交通的发展)的加剧,人们生产数据的能力也呈现出爆炸式的增长。这些方面都导致数据体量的增大,促进了大数据的到来。移动互联网的存在使得这些数据的获取成本降低,为大数据时代的来临提供了基础,同时云计算技术的兴起使得大数据的处理变得可行。

2. Variety

人们可以进行分析的数据类型也呈现多样化,传统的数据分析主要局限于数值数据的分析。近些年来,移动互联网的发展,带来了图片、图像、音频、视频、日志位置信息等一系列新型的数据类型。有别于传统的结构化的数据,非结构化或者半结构的数据分析起来要复杂的多,且占了现今数据的绝大部分。

3. Value

大数据的数据量很大,其中包含了很多无用或者说是我们不关心的数据,从而导致其蕴含的单位价值很低。比如一段120分钟的视频,我们可能只需要其中10几秒的信息。

4. Velocity

速度方面主要涉及到数据的增长速度和处理速度。近些年,移动互联网的发展导致大量数据的产生,数据的增长速度块,同时对数据的处理速度的要求也越来越高,大数据的“实时分析”也成为热门话题。

大数据带来的转变

(1)认知模式的改变

人类科学研究活动的方式发生了转变。最早的“试验科学范式”,即人们通过各种各样的试验来总结自然科学规律;然后发展到通过模型和推理为特征的“理论科学范式”;接着是近些年大量运用的以模拟仿真为特征的“计算科学范式”。随着大数据时代的到来,未来向着“数据密集型科学发现范式”发展,人们通过大量的数据直接挖掘出信息而不用进行模型的分析与推导。

(2)研究主体的变化

未来的研究主体更多的是基于数据驱动的,而不是基于知识驱动的。以往的研究我们趋向于从已有的数据中获取我们所需要的共识的知识,然后基于这些知识去预测未来。而以数据驱动的则直接通过大数据找到具有相似特征的数据的行为。

(3)数据分析侧重点的变化

原先我们对总体的研究是通过采样进行的,我们研究样本的行为来预测总体的特征。而现在我们几乎拥有了所有的数据,我们直接对总体进行分析,分析的结果要更准确。过去的分析我们总是希望找出事务中的因果关系,而大数据分析时我们只需要知道相关关系,即我们只需要知道存在这种关系,至于为什么是这种关系我们并不需要关心。


END

用秃的发亮的头做你的太阳

希望有一天如果会变成必然

云披霞,月出山,鸟归巢

大数据显示黄色的什么意思(大数据简介)(1)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页