书城科普读物日新月异的信息科学(科普知识大博览)
26250700000002

第2章 信息的基本概念(1)

任何一门科学都有自己的基本概念,准确把握基本概念是驾驭一门科学的基础。信息科学的基本概念是信息。信息既是信息科学的出发点,又是它的过程,也是它的归宿。信息科学的出发点是认识信息的本质;它的过程是要阐明信息的全程运动规律;它的归宿是利用信息来解决各种实际的问题,达到各种具体的目的。对信息概念的理解越准确,对信息的利用就会越深刻,信息科学的作用就会发挥得越充分。

信息的定义什么是信息信息者,"音信消息"也。据《新词源》考证,远在一千多年前,我国唐代诗人李中在他的诗《暮春怀故人》中就使用了"信息"一词:"梦断美人沉信息,目穿长路倚楼台"。其中的"信息"就是消息的同义词。同样,在西方的早期文献著作中,信息(Information)和消息(Message)也是互相通用的。

美国数学家、控制论奠基人维纳(Wiener)在1948年出版的《控制论:动物与机器中的通信与控制问题》(1948)一书中指出:"信息就是信息,不是物质,也不是能量"。虽然维纳在这里没有正面回答"信息是什么?",他却利用排他法明确地告诉人们:信息不是物质和能量。这是对信息本质的最具原则性和最为深刻的宣示,也是把"信息、物质、能量"放在同样地位上等量齐观的最早科学论断。

另一美国学者、信息论创始人仙农(Claude.E.Shannon)在《贝尔系统技术杂志》发表了题为"通信的数学理论"的论文(1948)。它以概率论为工具,阐述了通信工程的基本理论问题,给出计算信源信息量和信道容量的方法,得到了一组表征信息传递重要关系的编码定理。虽然文中没有直接阐述信息的定义,但是,他在计算信息量的时候却明确地把信息量定义为随机不定性减少的程度,表明他把信息理解为"用来减少随机不定性的东西"。这里的随机不定性是指由于随机因素所造成的不肯定性,数值上用概率熵来计量。

法裔美国科学家布里渊(Brillouin)在他的名著《科学与信息论》一书中指出,信息就是负熵,并且还创造了一个新词"Negentropy"来表示负熵的概念(1956)。利用这个概念,布里渊成功地驱除了名噪一时的麦克斯韦妖。维纳在1950年出版的《控制论与社会》一书中也曾经指出:正如熵是无组织程度的度量一样,消息集合所包含的信息就是组织程度的度量;事实上,完全可以将消息所包含的信息解释为负熵。

.Tribes等人在1971年9月的《科学的美国人》杂志上发表了题为"能量与信息"的论文(1971),指出:"概率是对知识状态的一种数值编码。某人对一个特定问题的知识状态可以用这样的方法表示,即对这个问题的种种想得出来的答案各分配一定的概率;如果他对这个问题完全了解,他就能对所有这些可能的答案(除了其中一个之外)赋予概率零,而剩下的那个则赋予概率1。既然可以把知识状态编码成这样的概率分布,我们就可以给信息下一个定义:信息就是使概率分布发生变动的东西"。这个定义看上去和仙农的定义很不一样,实质却完全相同。这里需要指出的是,用概率分布来表示知识状态并没有考虑知识的效用或价值。

控制论的另一位奠基人,英国生物学家W.R.Ashby在《控制论导引》一书中对信息提出了另一种理解。他首先引入了一个"变异度"的概念:任何一个集合所包含的元素数目的以2为底的对数就称为这个集合的变异度(也可以把集合的元素数目直接定义为它的变异度)。然后,他就把变异度当做信息的概念来使用(1956)。不难证明,变异度实际上是均匀概率分布条件下的仙农熵。基于变异度的概念后来还发展出一些新的说法,其中意大利学者G.Longo在1975年出版的《信息论:新的趋势与未决问题》(1975)一书序言中就曾经指出:"信息是反映事物的形式、关系和差别的东西,它包含在事物的差异之中,而不在事物本身。"事实上,半个多世纪以来,科学文献中所提出过的信息定义数以百计,呈现一片繁荣兴旺而又扑朔迷离的景象。

如此众多的信息定义,胜似"盲人摸象"。其实,这是由于不同的作者从不同的角度在不同的条件下对信息进行考察的结果。为了避免"以偏概全",在定义信息的时候必须十分注意定义的约束条件。为了得到科学合理的认识,应当根据不同的条件,区分不同的层次来给出信息的定义,同时根据约束条件的增减,使信息的定义随之进退。

可以认为,没有任何约束条件的层次是最高层次,因而也是最普遍适用的层次,通常称为"本体论层次"。如果在此基础上引入一个约束条件,最高层次的定义就退变为次高层次的定义,其适用范围就比最高层次定义的范围要窄。引入的约束条件越多,定义的层次就越低,适用的范围就越窄。于是,根据引入的条件的不同,就可以给出不同层次和不同适用范围的信息定义,这些信息定义的系列就构成信息定义的自恰体系。

最典型的情况是,在本体论层次信息定义中引入一个特殊约束——必须有主体(人、生物或机器系统)的存在,且须从主体的立场出发来定义信息。在这个条件下,本体论层次信息定义就转化为认识论层次信息定义。

在本体论层次上,信息的存在不以主体的存在与否为转移。因此,在这个层次上就可以认为:地球上出现人类以前,信息就已经存在了,只是没有人去感知和利用而已。但是在认识论层次上则可以认为:没有主体就没有认识论层次的信息;因此在人类出现之前不存在(以人类为观察主体的)认识论层次信息。可见,讨论的条件不同,信息的层次不同,它的定义也就不同。颇为有趣的是,这两个看似矛盾的结论之间并不互相矛盾,因为它们的定义条件各不相同,且可以随着条件的增减而互相转化。

当然,还可以根据需要引入更多其他的条件,得到其他相应层次的信息定义,从而把前述各种定义排成有序的系列。由于篇幅所限,这里只能对两个最基本也最重要的层次——本体论层次和认识论层次——来讨论信息的定义。

本体论层次的信息定义:某个事物的本体论层次信息是该事物的运动状态及其变化方式的自我表述。

定义中所说的"事物"泛指一切可能的研究对象,包括外部世界的物质客体,也包括主观世界的精神现象;"运动"泛指一切意义上的变化,包括机械运动、物理运动、化学运动、生物运动、思维运动和社会运动等;"运动状态"是指事物运动在空间上所展示的性状和形态;"运动状态的变化方式"是指事物运动状态随时间而变化的过程样式。

宇宙间一切事物都在运动,都有一定的运动状态和状态改变的方式,也就是说,一切事物都在产生信息。这是信息(在本体论层次上)的绝对性和普遍性。而一切不同的事物都具有不同的运动状态和状态变化方式,这又是本体论层次上信息的相对性和特殊性。这是最广义的信息概念,是无条件的信息概念。

任何事物都具有一定的内部结构,同时也与一定的环境相联系,正是这种内部结构和外部联系两者综合作用,决定了事物的具体运动状态和状态变化方式。因此,可以把上述本体论层次的信息定义叙述得更为具体:本体论层次的信息,就是事物的运动状态及其变化方式(的自我表述),也是事物的内部结构与外部联系的状态及其变化方式(的自我表述)。

所以,为了获得一个事物的信息,就要同时了解这个事物的内部结构的状态及其变化方式和它的外部联系的状态及其变化方式。了解了它的内部结构和外部联系的状态及其变化方式,也就完全了解了它的运动的状态及其变化方式。

本体论信息定义"事物运动状态及其变化方式的自我表述"中强调了事物的"自我"表述。这就是说,本体论信息是一种客观的存在,不以主体的存在为转移,无论有没有主体,或者无论是否被某种主体感知,都丝毫不影响它的"自我表述"。这是本体论信息的一个非常重要的特征。

认识论层次信息定义:主体关于某事物的认识论层次信息是指主体所感知(或所表述)的关于该事物的运动状态及其变化方式,包括这种状态或方式的形式、含义和效用。

对比本体论层次与认识论层次信息定义可以发现,它们之间有着本质的联系,这表现在两者所关心的都是"事物的运动状态及其变化方式"。但是,另一方面,它们之间又有原则的区别,这表现在两者的出发点完全不同:前者从"事物"本身的立场出发,就"事"论事;后者是从"主体"的立场出发,就"主体"而论事。之所以有这样的区别,关键在于约束条件:引入主体这一条件,本体论层次信息定义就转化为认识论层次信息定义;取消主体这一条件,认识论层次信息定义就转化为本体论层次信息定义。

由于引入主体这一条件,认识论层次的信息概念就具有了比本体论层次的信息概念丰富得多的内涵。这是因为,首先,作为认识的主体,他具有感觉能力,能够感知事物运动状态及其变化方式的外在形式;其次,他也具有理解能力,能够理解事物运动状态及其变化方式的内在含义;再者,他还具有目的性,因而能够判断事物运动状态及其变化方式对其目的而言的价值。而且,对于正常的人类主体来说,事物的运动状态及其变化方式的外在形式、内在含义和效用价值这三者之间是相互依存、不可分割的。因此,在认识论层次上来研究信息问题的时候,"事物的运动状态及其变化方式"就不像在本体论层次上那样简单了,它必须同时考虑到形式、含义和效用三个方面的因素。

事实上,人们只有在感知了事物运动状态及其变化的形式、理解了它的含义、判明了它的价值,才算真正掌握了这个事物的认识论层次信息,才能做出正确的判断和决策。通常把这样同时考虑事物运动状态及其变化方式的外在形式、内在含义和效用价值的认识论层次信息称为"全信息",而把仅仅计及其中的形式因素的信息部分称为"语法信息",把计及其中的含义因素的信息部分称为"语义信息",把计及其中的效用因素的信息部分称为"语用信息"。换言之,认识论层次的信息乃是同时计及语法信息、语义信息和语用信息的全信息。

本体论层次信息定义和认识论层次信息定义是最基本的信息定义。如果在认识论层次信息定义基础上再引入某种新的约束条件,那么,认识论层次信息定义将转化为更低层次的信息定义;引入的约束条件越多,定义的层次就越低;由此就形成了信息定义的体系。

有了这个定义体系,现在流行的那些有关信息的种种说法就都可以在这个定义体系的相应层次上找到自己适当的位置。

人们研究信息科学,总是希望利用信息为人类(主体)服务。因此,与主体相联系的认识论层次信息将受到特别的关注。鉴于认识论层次信息概念的重要性,这里有必要对语法信息、语义信息和语用信息的概念及关系再做一些说明。读者不难由图1进一步理解语法、语义和语用的概念及其联系。

图1全信息的图示图中状态(图中的中间下圆)和状态变化方式(图中的中间上圆)的形式化关系是抽象的语法信息;这种形式化关系与它的相应客体(图中的左圆)相关联则将给抽象的语法信息赋予具体的含义,因而产生语义信息;而语法语义(图中整个中间和左边)与主体(图中右圆)的关联则将表现这样的语法和语义信息对主体的目的而言所具有的效用或价值,从而形成语用信息。

应当注意的是,研究语义信息要以语法信息为基础,因为"含义"是针对具体的状态和具体的状态变化方式来说的。同样,研究语用信息要以语义信息和语法信息为基础,因为"效用"是针对具体的状态及其变化方式所具有的含义来说的。在这个意义上,基于语法信息和语义信息的语用信息(称为"综合语用信息")具有"全信息"的含义。

在语法、语义和语用信息三者之间,语法信息是最简单、最基本的层次,语用信息则是最复杂、最实用的层次,语义信息介于其中。在信息理论发展的初期,人们故意排除语义信息和语用信息的因素,先从语法信息入手来解决问题,这既是迫不得已的事情,同时又是明智的选择。但不能总是停留在语法信息这个相对简单的层次,而应当继续深入地研究并解决语义信息和语用信息的问题。因为语法信息只能解决通信工程这样一类问题(只关心传递的波形而不关心波形的含义和价值),而凡是有智能、有"目的"的系统,都必然要涉及到语义信息和语用信息的问题。信息科学技术要有效地扩展人类信息器官的功能(特别是要扩展全部信息功能的有机整体——智力功能),就不能不利用包括语法信息、语义信息和语用信息在内的全信息。

仙农信息论或统计通信理论是基于概率型语法信息的信息理论,而本书所定义的信息科学则是基于"全信息"的信息理论。这是现代信息科学与传统信息理论之间的一个重要区别。读者在以后的章节将会看到,正是由于引入了全信息的概念和理论,原先各自独立发展的识别论、通信论、控制论、决策论、优化论和智能论等才得以统一在信息科学的有机体系之中。因此,对于信息科学来说,"全信息"是一个十分重要的概念,全信息及其理论是整个信息科学理论大厦的基石。

不过,这里有必要申明,虽然如上所说"全信息"的概念及其理论对于信息科学的研究具有特别基本和特别重要的意义,但是考虑到文字叙述上的简便,在以下的讨论中,如果不会引起读者的误解,都会把"全信息"简称为"信息"。只有在那些容易引起读者误解的地方,或者在那些需要特别强调的地方,才使用"全信息"的表述。这里也请读者有所警惕:在后面的讨论中遇到"信息"这个词汇的时候,就要想一想,它究竟指的是"全信息"还是经典意义的信息(仙农信息还要指出,由于引入了主体,引入了认识主体与客体事物之间的关系,认识论层次信息还衍生出另一组有用的概念,这就是实在信息、先验信息和实得信息的概念。

具体来说,某个事物的"实在信息"是指这个事物本身实际所具有的信息,它是事物本身所固有的一个特征量,只取决于事物本身的运动状态及其变化方式,而与认识主体的因素没有关系。

主体关于某事物的"先验信息",是指主体在观察该事物之前已经具有的关于该事物的信息。它既与事物本身的运动状态及其变化方式有关,也与主体的主观因素有关。