对信息进行数据分析(信息论模型合理配置资源)

这是《给年轻人的跨学科工具箱》第十五篇笔记,如果觉得不错,可以去B站购买所长的课程。

上一篇文章人类学模型——为什么是智人胜出?主要介绍了人类进化史中,智人得以从众多人类中胜出的原因是想象与共识。然后从进化心理学的角度解释了为什么男性会更加专注,为什么我们热爱吃甜食。以及介绍了一个新概念,文化人类学中的模因,以及人类另一种延续的方式。


本篇文章主要介绍包括以下内容:

  1. 人类最重要的三条公式
  2. 信息熵
  3. 霍夫曼编码
  4. 帧间压缩算法
  5. 互信息、冗余度

阅读本篇文章可以回答不限于以下问题:

  • 如何合理地分配资源?
  • 如何有效地去除冗余度?
  • 如何做到一年读上百本书?
  • 如何高效地学习?
  • 如何画脑图?

三条重要公式

张首晟教授认为对人类来讲,有三条最重要的公式:

  • 第一条,描述的是物质和能量的关系
  • 第二条,香农的信息熵公式,描述的是信息如何量化。
  • 第三条,是海森堡测不准原理,描述的是科学 的边界

对信息进行数据分析(信息论模型合理配置资源)(1)

E=mc^2

对信息进行数据分析(信息论模型合理配置资源)(2)

宇宙最重要的两个概念,能量和信息。之所以没有物质,是因为由上图可知,能量和物质是相通的。之所以会有第三条公式,是因为他是量子力学的范畴,是告诉我们科学的边界在哪里,无论科学怎么发展,我们都无法测算基本粒子的状态,因为我们观察粒子这件事情,本身就会改变他的行为。

由于我们观察粒子,会需要一个光子打在粒子身上,但这个行为会改变基本粒子的行进轨迹,因为他会吸收光子的动量,而瞬间改变自己的状态,也就是说,我们的观察改变了客观世界。

因此第三条公式给我们的启发是,这个世界,没有绝对客观的存在,人类观察世界的方式和角度和这个世界对待我们的方式和方法,会从物理学的层面影响彼此,我们观察到的东西实际上是客观世界和主管想象之间的结合体

信息熵

能量守恒,但信息不守恒。信息可以复制和分享,并不存在你分享他人,你的信息就会变少。因此人类之间分享知识,是一件可以为这个世界创造纯粹增量的事情。

信息是怎么衡量的?

可以用质量衡量物质,信息量衡量信息。要理解信息量,需要理解信息熵的概念。

信息熵是描述一个东西的不确定程度的量。通俗点理解,就是搞清楚一件事情的难度。

比如你去买一印着图案的娃娃,他的信息熵为0,因为盒子上的图案,就是娃娃的样子。但若去开一个盲盒,信息熵就陡然增大。影响信息熵的三个因素

  1. 可能出现的娃娃款式越大,信息熵就越大
  2. 在娃娃款式数量不变的情况下,如果每一款出现大概率是一样的,这个时候信息熵最大
  3. 如果其中某一个款式,出现的概率很大,那么信息熵就会大大降低。
信息量

信息量,就是把信息熵消除掉的信息所需要的能量,基本单位为比特

对信息进行数据分析(信息论模型合理配置资源)(3)

比如,同事问你中午吃什么,你说随便,这个时候信息熵最大,因为具有无限可能,但如果说不吃辣,信息熵就会降低,如果指定某一家的时候,信息熵降为0。

不做选择,随波逐流,或者平均分配注意力,就会增加整个系统的无序性,如何聪明地分配我们的资源和注意力,这就要讲到信息论里面另外一个模型:霍夫曼编码。

如果我们可以把较短的编码分配给高频出现的词汇,把较长的编码分配给低频出现的词汇,这样编码效率最高。

比如电报的摩尔斯密码,是由点和线两种符号组成,他将最简单的代码,分配给了最高配的字幕。

对信息进行数据分析(信息论模型合理配置资源)(4)

由此可见,为了提高效率,我们应该把生活中最重要的资源,分配给人生中最高配出现的场景

与之类似的有一个广为人知的概念--奥卡姆剃刀:无需必要,勿增实体。结合起来,得出一个结论,即大刀阔斧地做减法,围绕关键领域饱和配置资源。其实很多IT人员就是这样,熟知的标配都是黑色背包和格子衫,他们不会在衣服上花精力和资源,但是其经常使用的电脑和手机等电子产品,往往都是买的最好的。

帧间压缩算法

视频需要压缩才能方便传输,如果一个高清电影,不压缩的话,大概占据空间为11198GB。这种处理方式即是帧间压缩算法,它包含着一种哲理,通过关注信息增量,而不是关注信息存量,来极大地提升效率。

对信息进行数据分析(信息论模型合理配置资源)(5)

如上图,每个格子代表一帧,观察会发现,里面存在很多重复信息,只有右手在变化,其他完全一样。所以,只需要对第一个图整体处理,后面的只关注右手的变化即可。

所以,如果我们关注变化,忽略重复,可以使我们的学习效率提升N倍。

有的人一年可以读上百本书,怎么做到的呢?他们的关键原则基本是,不平均用力。读越基础,越深刻,越偏理论的书,花的时间越大,读表层肤浅的书花的时间就越少。这其实就是霍夫曼编码的原理,因为基础的知识,在很多不同的书里面都会存在,是高频场景,需要配置大量资源。因此,提高读书效率,只需要,集中精力夯实基础知识,然后只关注新知识的增量。

比如,如果你对阅读过,脑科学——高效学习的秘密,对大脑的功能分区有一个完整的知识框架,你会发现,对其他书籍里面,相关的章节你阅读速度会非常快,而其他人,可能这个部分是最难读的。

其实生活中,做任何事情,起步的时候先花时间把基本练扎实是最重要的,因为基本功越扎实,后面不断前进,就可以只关注增量。

互信息

两件事情的互信息越大,表面他们之间的相关性越强。需要注意的是,相关性不等于因果性。

人类的本能会去寻求因果,但是在这个世界上,大部分事物之间的联系都是相关联系,比如一些短视频平台推送视频,都是会给客户打个性化标签,比如宝妈,学生党等,这些标签就是互信息,不能说你打开了一个军事视频,就说明你是一个军事迷。

很多成功人士在分享经验的时候,也都混淆了相关和因果。很多人说,当年之所以做这个事情,是因为我觉得XXXX。这个说法通常都是错的,因为生活错综复杂,记忆却是主观的,这个在文章认知心理学--高效学习中有讲过。再加上,当人类要向其他人表达的时候,会自发地美化自己。

比如过去三十年,很多成功企业家说自己能成功,都是自己有魄力有能力有毅力,但这只是相关关系,不是因果关系。他们发展是赶上了中国本身整体的高发展红利。

信息等价、冗余度

高互信息的一个极端情况,就是信息等价。知道了A事件发生的信息,就等于知道了B事件。很多演讲之所以让人觉得无趣,就是因为有很多信息等价,给人一种废话连篇的感觉,比如,今天天气真好,风和日丽,阳光明媚。

冗余度,如果废话多,那就是添加了很多冗余度。冗余度在计算机和工程学里面也会出现。简单的可以解释为,资源的重复度。计算机里面,就是增加备份来保证系统更加安全可靠的工作。

所以冗余度并不是一个贬义词,如果冗余度非常低,其实也增加了信息被接受的难度。

当代年轻人,从出生就接受了大量的信息,所以相比上一代,对冗余度的接受越来越低,所以会出现YYDS等精简词汇出现。那如何有效地去除冗余度呢?--画分析框架。

脑图是一种偷懒的分析框架,它默认结构知识金字塔结构,但语言表达结构多种多样,比如递进,循环,四象限等。

一般画脑图分为三步:

  1. 先把关键概念零散地列出来
  2. 寻找概念之间的关联,进行分类和链接,拿到信息等价的概念
  3. 回忆脑中已经建立的思维模型,进行套用和矫正,形成一个属于这一次阅读内容的新的分析框架

本篇文章主要介绍信息论相关的模型,并通过介绍证件压缩算法和霍夫曼编码的原理,引申出提高读书效率,只需要,集中精力夯实基础知识,然后只关注新知识的增量。生活中,做任何事情,起步的时候先花时间把基本练扎实是最重要的,因为基本功越扎实,后面不断前进,就可以只关注增量。并通过去除冗余度的原理,介绍了画脑图的方法。

下一篇《营销学重要模型》,不见不散。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页