信息的定义、测量度和存储格式初探

2002.10.07-20

  关于“信息”的定义,有资料说,已近四十种。

  我在《三元论》一文中,也下过如下定义:

  自然物质 有形,独立于信息。作为一元取数,为一。具有分子原子结构,分解后可以在门捷列夫的《化学元素周期表》中找到相应的位置,遵守质能守恒定理,可以进行可控实验。
  信  息 无形,独立于物质。作为一元取数,为一。包含人类(及动植物)的精神、意识、思维;(磁、电等作用力或能量)场、数、规律、印迹(烙印、影响)等,能在不同的物质(介质)中复制、加工、传播。
  智慧产物 介于自然物质与信息间,为二者的非自然组合体。作为一元取数,时而大于一、时而小于一。如蜂房、金字塔、UFO、因特网等。
  查《辞源》(商务印书馆·1989年7月第1版):
【信息】消息。唐·李中《碧云集》中《暮春怀故人》诗:“梦断美人沉信息,目穿长路倚楼台。”
  查《辞海》(上海辞书出版社·1990年12月第1版:
【信息】①音讯;消息。李中《暮春怀故人》诗:“梦断美人沉信息,目穿长路倚楼台。”②通信系统传输和处理的对象,泛指消息和信号的具体内容和意义。通常须通过处理和分析来提取。信息和物质、能量被称为构成系统的三大要素。信息的量值与信息的随机性有关,如在接收端无法预估消息或信号中所蕴含的内容或意义,即预估的可能性越小,信息量就越大。
  两者均将“信息”界定为:音讯、消息、信号的具体内容和意义。今天,我想换一个角度来谈这个问题。仿《说文解字》的方式,我将“信”分解为“人言”两字,“息”则分解为“自心”;于是,“信息”一词,可以进一步解释为:尽管听人所言,还须经自心体会。

  看电视《漂亮妈妈》,有一个情节很有意思。小聋儿郑大的父亲因车祸丧生,郑大不知道“死”是怎么一回事、同时也不会说“死”字,妈妈便用活虾烧熟作解释,妈妈教郑大说:“爸爸死了”,郑大却学着说:“爸爸红了”。《新华字典》(商务印书馆·1998年修订版)是这样定义“死”的:“①生物失去生命,跟‘活’相反……”和“盲人摸象”相类似,对“活虾烧熟”一事,妈妈看到的是“由活到死”这一过程,郑大看到的却是壳“由青到红”的转变。信息的传递,与物的传递不同。如果这时,妈妈将一个苹果交给郑大,妈妈手中空了,郑大可以完完整整地获得同一个苹果。信息的传递,受方得到的却是“经自心体会”新东西,而发出信息的一方并没有失去它。即,它不能象苹果那样完整地进行递交,小郑大不能直接从妈妈那里象接到苹果一样获得有关“死”的全部信息

  此外,获得信息必须依赖“自心体会”,即“见仁见智”、“盲人摸象,各有所得”。苹果落地,牛顿获得的不仅仅是苹果的色、香、味,而是对“落地原因”的深入思考。小郑大因为没有“死亡”的知识积累(知熵),无法具体理解“死”,以“活虾烧熟”作比,也许小郑大的知识积累(知熵)中,“红了”还有“可以吃、味道鲜”成分呢。苹果的香甜、熟虾的鲜美、父子的亲情,一时间都和“红了”建立起联系。如果妈妈将“活虾”甩死后再教,也许更容易确切地传递“死亡”的信息。生活中,我们的不少认识误区、“有色眼睛”、潜意识等,就是这样从小开始积累形成的。

【六根】《新华词典》商务印书馆1980.8版
  佛教名词。佛教以人身之眼、耳、鼻、舌、身、意为六根。根是“能生”的意思,由眼、耳等对于色、声等能生起感觉,故称为根。
【八识】《辞海》上海辞书出版社1989版
  (梵 Astau Vijnana )大乘佛教唯识宗把内在的心识分为八类:①眼识;②耳识;③鼻识;④舌识;⑤身识;⑥意识;⑦末那识(意为“意”);⑧阿赖耶识(意为“藏识”)。前五识相当于感觉,以外界的色、声、香、味、触为对象;第六意识相当于综合感觉所形成的知觉、思维等,以整个世界(诸法)为对象;第七末那识,是第六识的根源,它的作用是经常把第八识当作实我的自我意识;第八阿赖耶识,是世界一切的精神本原,它包含着一切现象的“种子”(即潜能)。认为整个现象世界即由八识的作用而存在和变化。
  我们接着讨论信息的测量维数,这是拙文《多媒体与六根、八识》涉及过的一个老话题。我们,包括盲人、聋哑人,都可以凭借自身的五官和手感(触)等来识别苹果、梨,这是 5 种不同的检测量。看见“苹果”两字而想到苹果,与实际看到苹果完全不同,这是和刚才提到的“色、声、香、味、触”不同的感觉。“意识”是第 6 个检测量。

  牛顿见苹果落地,想到自由落体而推出万有引力。万有引力,除了可以“意识”到,还可以通过种种实验方式测量到,它是宇宙万物存在或相互关系的一种信息,比如太空行走的宇航员因失重而飘飘然、苹果成熟而下落。这是“和苹果相关的”第 7 个信息检测量。

  支撑移动通讯、广播电视的电磁波;往来各大洋的舰船,船体受地磁力的极化作用而成为大磁钢,因此需要定期消磁;此外,宇宙背景噪音,也是一种电磁波。这些电磁波在大量地传递各种信息,但是仅凭我们自身的器官是不能感受出来的,比如强电磁场作用下的作物生长与常规条件有所不同。这是第 8 个信息检测量。

  通常,我们所知的四维时空,这里依然同时存在着,于是信息检测量增加到 12 个。比如,苹果的大小(质量三维),隔年的苹果不会同时留在一棵树上(时间一维),等等。苹果无论青熟程度如何,它们的色、香、味乃至手感各不相同。熟透的苹果如果不及时采摘,受万有引力的作用,还会自行脱落。手机、电视和广播的电磁波、地球磁场、宇宙背景噪音可以穿过苹果园、水果商场,可以被各种电器设备有效接收,自然也可以同时作用于每一个苹果。水经磁化处理后,可用于保健。经磁化作用后的苹果,是否还和原来一样?还有,经电脑显示器的电子辐射以及手机等的电磁场作用后,我们的身体是否更健康?众所周知,川贝和浙贝,都是贝母;因产地不同,药效大不相同。因为,对于中药材而言,中医师讲究使用“道地药材”,主要着眼点是产地环境对药性的影响(参见拙文:《不可思议》)。目前,太空船里进行的植物种子处理、人类的太空分娩试验等科学试验,就是考察在地球引力场、宇宙磁场明显变化状态下对地球生命的影响。

  除此之外,是否还有其他信息检测量?我认为会有。俗话说:“耳听为虚,眼见为实”,对未知事物,我们习惯上往往会认为“不存在”,一如《老子》的“天下万物生于有,有生于无”传统说法。其实,这是一个极大的误区。比如,蝙蝠的超声波导航,超声波金属探伤、人体检查,医学 X 光透视,红外摄影,等等,以前不知道,现在却扩大了我们对信息的认识领域。这些,尽管仍然在上述 12 维信息检测量中,由于频率不同,它们所捕获的信息与我们五官获得的不尽相同。对地震前兆信息,动物如老鼠、蛇,它们单凭自己的五官而并不凭借“智慧产物”,却比我们人类要敏感得多。这些信息,并不因为我们不能获得而不存在。庄子观鱼,鱼也观庄子,鱼乐、庄子也乐;庄子、鱼再一起来观天,两者获得的信息会一样吗?镭的放射性,直接发现的,不是居里夫人而是感光胶卷!五官帮助我们认识了环境,但有局限。人类借助“智慧产物”超越了五官,认识领域拓宽了,但局限和误区依然存在。知识积累(知熵)是我们对未知事物认识的基础,同时也可能引导我们进入误区。人类对自身的认识,远少于对环境的认识;然而对环境的认识,已经完整了吗?未必。在那浩瀚的未知领域内,无论是人类自身还是宇宙环境,我深信,一定还有其他的信息检测量存在着,似乎永远不会穷尽。

  接着探讨这 12 个信息检测量的单位值问题。这些测量单位,有的单一,有的复杂;有的已有定义,有的没有明确。比如某一建筑,占地面积、高度,可以通过实测获得;它的建造年月,有记载可查。这是该建筑的时空四维描述。它的座落经纬度、海拔高度,可以确定引力场、地磁场强度。建筑声学,可以具体测定它的每一具体部位的声响效果。这 7 个量是单一的、已有定义的。该建筑的装潢色彩,可以具体检测出。这 1 个量是复杂的、已有定义的。建筑风格,乃至风水格局等,也可以具体描述。这 1 个量,属意识思维的,复杂而没有具体量值。气味、滋味、手感 3 个量,应该可以测量,因复杂而没有明确。确定被测信息量的单位值,寻找“异质同构”(请参见拙文《说“象”》)的事物,应用诸如“非电量的电测法”制作各类传感器,具体获取这 12 个信息的量值,再进行数模或模数转换等,那么,真正的“多媒体电脑”便可应运而生!

  提及“电脑”,就有一个信息数据的存储格式问题。人脑存贮信息,既具体又模糊,并且还有联想!这时,我便想起少儿时代住过的老房子,和上面讲到的 12 个信息量值一样,它们可以同时一一浮现在我的眼前,有的我能描述,有的难以描述,自然还有记忆遗忘、记错等问题。也有当时确实难以确定的,比如隔墙就是菜市场的豆腐加工厂,每天清晨随风弥散过来的热豆饼气味,实在是说不清、道不明。此外,伴随房子激起的种种回忆中,还有我和邻居章奶奶韩伯伯相处的种种往事。但是,对邻居房屋的印象却十分模糊。

  如果我们现在有了这 12 类信息传感器,并且将它们同时安装在一台“多媒体电脑机器人”上,同时让这台“电脑机器人”和我一样,也“生活”到那个环境中去,那么,这 12 个信息传感器所产生的信息数据或文件,应该是运用“模糊数学”进行“模式识别”的,并且还可以随时加以修改和补充。

  按目前的计算机存贮形式,这 12 类传感器所获取的信息都应该有自己的数据库文件,随着时间的延伸而不断积累。库和库之间,一一对应,可以互相查找。维数越多,信息越具体;反之,越宏观。比如“滋味”一库,酸甜苦辣无味俱全;顺序、逆序查找,一生所尝,都在其中;随之而来不免感慨万千。当“回味”(意识)到“苹果”时,便只有“香甜”或“清脆、涩”(伏苹)等滋味,以及引入相关的水果滋味。进一步,我回忆起 1970 年代在四川万县时,所吃的水果和广柑酒。

  计算机中,数据库文件,无论是物理结构还是逻辑结构,文件数据要求明确,丁是丁卯是卯,非驴非马就不行。并且,库和库,是相对独立的。和电脑不同,人脑输入的信息数据,似乎是模糊的,这不仅是它的量值不曾象国际公制中定义“米”的单位一样,而输入人脑的信息数据更象是一个橡皮圈,它可松可紧。依我的设想,每个库好象一个圆台,上、下底的半径差就是该信息量的松、紧范围;12 个圆台叠起来正好组成一个圆锥体,它们绕着同一个轴心,可以自由地高速正、反向旋转。好象密码锁一样,在某一瞬间,12 个圆台上的某一点恰好构成一直线,于是一个具体的“信息”就被锁定了:它可以是以往的某一“事件”,也可以是未来的某一“设想”。此外,库内的信息,可以随着个人的阅历增加而不断得到改变、充实(知熵)。用它,我认为可以解释梦、精神病等,以及科学发现和发明的机制。

  如果安装了 12 类信息传感器的“多媒体电脑机器人”,同时有一个圆锥体密码锁式数据库的话,那么便可以大大压缩目前计算机数据存贮方式所需要的物理空间。

  以上,是我对信息的定义、测量度和存储格式所进行的初步探索,其他人的想法又会怎样呢?

------------------------------------------------------------------
方先生,好! 据我所知,到上个世纪80年代中叶关于信息的定义便有134种,请见Schrader, A. M. (1986). The domain of information science: problems in conceptualization and in consensus-building. Information Services & Use 6, pp. 169-205.供参考。 刘钢