模糊信息熵与信息熵的区别:信息的本质和熵增原理
所谓信息,通俗的理解就是消息、讯息、资讯。这样的理解没有问题,但对我们探寻信息的本质没有多大帮助。不过如果我们想要找一个关于信息的标准定义,会发现几乎是不可能的。可以说,目前国际上并没有对信息是什么有标准和公认的定义。我们可以先参考几个比较权威的定义:
《韦氏字典》(美国):信息是用以通信的事实,是在观察中得到的数据、新闻和知识。
信息论创始人香侬(C.E.Sannon美国贝尔实验室的数学家)认为:"信息是不确定量的减少","信息是用来消除随机不确定性的东西"。
对信息论作出特殊贡献的美国数学家维纳(N·Wiener)说过:"信息就是我们在适应外部世界和控制外部世界中,同外部世界进行交换的内容的名称"。
麦克卢汉的观点:"媒介就是信息。"
美国Whatis权威网站定义:信息的含义与接收方上下文有关。一些信息可以被转化成数据,并传递到下一个接受者。
法国物理学家布里渊(L·Brillouin)认为:"信息是原材料,知识是思维对信息的加工的产物。"
《Fortran 程序设计》(谭浩强):简单地说,信息是表现事物特征的一种普遍形式,这种形式应当是能够被人类和动物感觉器官(或仪器)所接受的。确切地说,信息是客观存在的一切事物通过物质载体所发生的消息、情报、指令、数据、信号中所包含的一切可传递和交换的知识内容。
还有人认为:信息是事物运动的状态和方式,也就是事物内部结构和外部联系的状态和方式。
我们可以发现,对信息的定义可谓五花八门,从不同的角度出发就可以得到自己的定义。如果我们想要探寻信息的本质含义,以上的定义中,除了信息论创始人香侬的定义外,其它大多数定义都没有什么帮助。
但是香侬的定义不是很好理解,什么叫做“不确定量的减少”?“用来消除随机不确定性的东西”是个什么概念?要理解这些问题的实质,我们必须首先明白“信息”这个词在香侬的信息论中是个怎样的概念。
在信息论中,一条信息,包含有一定大小的信息量,信息量的单位叫“比特”。一本五十万字的中文书,信息量约为250万比特。把这样一本书转成电子文档,并经过压缩处理,保存在电脑里,就是一个约为350KB的文件。信息量越大,所占用的电脑硬盘资源就越大。然而,所谓的信息量又是一个什么概念呢?我们用一个例子来说明这个问题。
在世界杯的比赛中,进入决赛阶段的32支球队,理论上谁都有可能问鼎冠军,假如我错过了看世界杯,赛后我问一个知道比赛结果的观众“哪支球队是冠军”? 他不愿意直接告诉我, 而要让我猜,并且我每猜一次,他要收一元钱才肯告诉我是否猜对了,那么我需要付给他多少钱才能知道谁是冠军呢? 我可以把球队编上号,从 1 到 32号, 然后提问:“冠军的球队在 1-16 号中吗?” 假如他告诉我猜对了,我会接着问:“冠军在 1-8 号中吗?” 假如他告诉我猜错了, 我自然知道冠军队在 9-16 号中。 这样只需要五次, 我就能知道哪支球队是冠军。所以,谁是世界杯冠军这条消息的信息量只值五块钱。用香侬的说法就是,得到答案所需的信息量是五比特。当我所做的判定越多,猜对准确答案的可能性越大,同时对“谁是冠军”这个问题的不确定性越少。因此,香侬说信息是“不确定量的减少”,是“用来消除随机不确定性的东西”。
我们发现,所谓“比特”,就是我们判定或分别的次数,而信息量,就是我们需要判定或分别次数的多少。对于计算机的二进制系统来说,作出一次“0”或者“1”的判定,就是一个比特的信息量。反映在电路上,有时是电路“开”、“关”的区别,有时是电压高低或有无的不同状态,有时可以是三极管的通断。这些判定,本质上来说都是两种不同状态的区别或分别。因此,我们可以说,信息的本质就是分别。没有分别,就无所谓信息,而需要分别和判定的次数越多,则表示信息量越大。
信息的本质是分别,而佛家说现象世界就是我们因一念无明,产生分别执著而生成。现象世界因分别而有,现象世界的本质不就是“信息世界”吗?正是如此,现象世界是由我们的分别执著心而起,其本质上没有任何实在性,就像我们所作的一个梦,梦里的世界看起来与现实世界一样真实,我们一样可以感受到快乐和痛苦,但我们知道,梦里的世界本质是空,完全是我们自心的显现。同样的,现象世界也是我们真如自性的显现,其本质和我们的梦境一样,是完全的“空”。仅仅是因为我们自己的虚妄分别,现象世界才得以生成,现象世界其实就是我们无明分别而成的“信息世界”。正因为现象世界这种“信息”的本质,我们完全可以从信息的角度来描述整个现象世界。
我们可以尝试从佛学的角度来理解著名的熵增原理。
物理学上有三种熵。克劳修斯最早从热力学的角度论述了熵增原理,即,一个孤立系统的熵总是增加的。克劳修斯熵是热力学的概念,因此克劳修斯的熵增原理可以表述为:在一个绝热系统中,热量总是自发的从高温物体传导到低温物体。后来波耳兹曼从统计学的角度重新定义了熵,从统计学角度,熵增原理则可以表述为:在一个孤立系统中,系统总是自发的向可能性更大的方向发展。或者说,系统发展的趋势总是由有序向无序转化。这种表述也很好理解,一件精美的瓷器,做起来很费工夫,可以要破坏它却是轻而易举。一间房子,如果没有人居住和维护,很容易破败。世间的一切现象都符合这种自发的由有序向无序转化的趋势。
第三种熵就是香侬所提出的信息熵,信息熵的含义比前两种熵的含义更广。从信息熵可以推导出波耳兹曼熵,从波耳兹曼熵又可以推导出克劳修斯熵。因此,我们只需对更本质的信息熵进行探讨,另两种熵只不过是信息熵的一般表述而已。
熵增原理在信息学里的表述叫做最大信息熵原理。此原理的通俗表述是:任何一种现象,在非主观的情况下,总是倾向于朝不确定性最大的方向发展。或者说,一般情况下,现象的发生和变化总是朝可能性最大的方向发展。举个例子,我们掷骰子,得到一点还是六点的机会应该是均等的,都是1/6,掷的次数越多,点数越会按这样的概率发生。假如我们发现,随着掷骰子次数的增加,得到六点的概率大增,比如增加到1/2,我们说,这违反了最大信息熵原理。因为根据最大信息熵原理,掷骰子所得的点数应该朝不确定性最大的方向,也就是1/6的概率发展,而不是往1/2的概率的方向发展。由此我们可以判定有人作弊。
前面我们说过,信息在本质上就是分别,信息量越大,表示分别或者判定的次数越大。根据最大信息熵原理,任何现象总是朝向不确定性最大的方向,也就是信息量最大的方向发展。那么,为什么会是这样?最大信息熵原理的本质原因是什么?
从佛家的角度来看,这点非常好理解。现象世界本来就是因无明分别所成,现象世界存在的根本前提就是我们自己的分别念。我们自己察觉不到在深层次的分别——生灭,但现象世界正是由这种细微的分别识所形成的幻象。只要我们还有现象世界的幻象,就说明我们的分别识还在不停的分别之中。因此,无止尽的分别就是这个现象世界形成的必然原因,现象世界也必然因此带有因不断的分别而导致的某种属性。不断的分别,从信息学的角度看,就是信息量不断的增加,反映在现象界,就是现象总是朝不确定性最大的方向发展,这就是最大信息熵原理,也是熵增原理的根本原因。
最大信息熵原理是比物理学熵增原理更基本的原理,实际上,许多物理过程都可以从信息的角度加以描述,而这根本的原因就在于我们这个现象世界本质就是一个“全息的世界”。
选自《科学论道》,待续。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com