信息科学的过去、现在与未来
2018-04-01 12:33:32
  • 0
  • 0
  • 0

来源:战略前沿技术

来自:后现代科技技术

作者:姜璐

一、信息与人们长期相关

信息是古老的概念之一,与人们生活长期相关,是人们相互交流的工具。历史上结绳记事就是在文字创造之前,古代人们传递信息最早的形式之一。语言的产生是人类文明发展的主要标志,语言是一种信息,而且是复杂的信息:古代的遗迹也为我们研究当时的文化、社会、

经济提供了可靠的信息。可以说人类是通过了解自然的信息来了解认识自然,通过了解社会信息(挖掘历史遗迹,学习历史文献,了解民间传说等)来了解人类社会的过去。人们的生活离不开信息。

虽然人们与信息长期打交道,但人们只关心具体的、单独的信息,特别是只关心信息的内容,通过信息的内容人们从事使用信息的工作。人们每天在制造信息,但从来不从整体上关心信息,也未能从更基础的方面认识信息。

社会的发展,使人们与信息的关系越来越密切,人们对信息的认识也越来越深入,越来越全面。电磁波的发现使复杂信息的传递,可以通过更简单的工具来实现,这就为研究信息最简单的形式之一——信号的传递性质提供了可能。第二次世界大战虽然给人类带来了巨大的灾难,但它也极大地激发了人们研究科学的积极性,提出了对发展科学的要求,促进了科学的发展。战争期间的电报技术、编码技术、解码技术,使人们对电报信号——这种具体的信息载体有了更深刻、更全面的认识,人们己不再关心电报信号(电磁波〉的能量等,更多的是关心它的"一、·",两种形式,进而由它组成的整体所反映的内容。二次大战以后,申农在总结战争期间技术的基础上,从电报所产生的作用方面,对它进行总结,提出信息论。

二、对申农信息论的分析

申农提出的信息论,是信息科学发展历史上的里程碑,申农以电报信号为对象,总结、归纳了信息的作用是去掉人们认识的不确定性,并从数学上用定量的形式,对最简单情况下的不确定性进行了描述,在此基础上给出了信息在去掉不确定性上所遵从的规律,建立了信息论。总结起来,申农的信息论以电报信号为基础,利用概率论数学工具,从信息作用的角度对信息进行了分析。

也正因为如此,它使我们对信息的研究走到了侧重在信息作用的方向上。当人们再来研究比较复杂的信息时,发现信息的作用多种多样,而且信息的作用主要在于与人们对客观世界的认识密切相关,这就使信息科学研究一开始就与主体、与过程联系在一起。

在科学研究的历史中,人们为了建立描写客观世界状态的量,经常想方设法去掉主观的、去掉与具体过程有关的部分。为了避免信息与过程联系过于紧密的缺憾,人们模仿做功、传热与能量的关系,建立信息娟的概念。信息娟用来描述在信息传输过程开始,系统所拥有的不确定性:也即是人们在未得到信息时,对系统不确定性的认识。人们把信息定义为在传递过程中,人们对系统认识的不确定性的减少。若通过信息传递,人们对系统的认识没有了不确定性,完全确定了,则在传递过程后,人们得到的信息就等于系统的信息婿。这样的定义使

信息熵成为客观量,信息本身可大可小,它与过程、与信息的接收者有关,可以由此来分析人们接受到的信息量与过程的关系:但实际上,信息熵的概念并未离开信息作用,人们仍然需要通过信息的作用来认识信息、认识信息熵。

信息的作用在于使人们去掉不确定性,这样的信息定义与人的主观认识紧密联系在一起,而后由于信息概念的广泛应用,信息的作用不仅与信息本身有关,而且还与接收体(人)有关。而且越复杂的信息,它的作用与人的主观联系越紧密。音乐通过各种乐器奏出了不同频率的声音,使人们获得信息,信息的作用影响了人们的感受,有的乐曲使人激昂奋进,有的乐曲使人舒适幸福,也有的乐曲使人伤感凄凉。而且对不同的人,在不同的时刻对音乐(信息)的感受也不一样。这就使信息成为一个非常复杂的物理量。以后,人们以信息作用为基础,进一步发展信息概念,将与信源、信道、信宿相联系的,能够去掉不确定性的称为信息。为此人们提出了更复杂的信息定义,例如钱学森院士就把信息定义为:“从信源发出的,经过信道传输,被信宿接收能去掉信宿某种不确定性的东西。”这样把信息本身又同信源、信道、信宿联系在一起。这一定义只是申农信息定义的扩充。由于它包含了信息与信宿之间的作用,因此它反映了信息作用的复杂性,带来了信息的主观色彩,带来了信息的多值性。此定义虽然扩大了信息的范围,使它可以包括语言、图像等现代通常所讲的各种信息,但它更加强调了过程、强调了主观的认识。这就使得人们更难从事定量的分析,无法计量、无法计算,无法给出诸如申农信息论一样的数学理论框架。

三、信息的定义

人类认识客观世界的过程是对客观世界的事物不断进行分类、总结、提炼的过程,找出它们之间的联系与区别,总结它们的演化规律。我们从信息与物质(质量)、能量三者的比较来认识信息。通过对物质、能量、信息的认识过程的分析,得到启发。

“物质是标志客观实在的哲学范畴,这种客观存在是人通过感觉感知的,它不依赖于我们的感觉而存在,为我们的感觉所复写、摄影、反映。”质量、能量、信息全是物质(哲学范畴)的属性,但是信息是比质量、能量更普遍的一个物理量。认识物质属性要通过运动变化来认识,也即在一变化过程中来认识。

首先我们简单回顾一下人类对质量与能量的认识。它们是紧密联系在一起的,是反映客观世界的两个物理量,反映不同的性质。质量是物质惯性大小的量度,最初是作为物质多少的量度;能量是物质运动的一种量度。物理学研究问题的办法之一是寻找守恒率。通过实验,研究在什么条件下,它们是不变的。人们发现了物质不灭定律:即物质不能无中生有,也不能随意产生,它只能从一种形式转变成另一种形式,并且在转变的过程中物质的量不变。同样,人们也发现了能量守恒与转换定律:即物质所具有的能量不能无中生有,也不能随意消失,它的总量是不变的:它只能从一种形式转变成另一种形式。进一步,爱因斯坦发现并提出了质能关系定律。它告诉我们在物质的变化过程中,质量和能量彼此有密切关系,当物体的质量发生变化△m时,其所具有的能量也发生变化△E,且有△E=△mc2,把能量变化与物质质量的变化联系起来。通常在简单运动形式中,能量、质量是决定系统性质较好的变量。

鉴于申农信息论中信息定义依赖人的主观性,考虑到信息与质量、能量均可作为物质某种性质的物理量,我们提出:信息可以定义为对物质认识的一种量度。在物质(事物)运动变化过程中,不改变的那些性质,可以被称为信息,信患是对这一类物理量或这一类性质的总称。

例如,在声音的传播过程中,随着声音的传播,由于空气阻力,声音具有的能量会不断减少,而频率是不变的。我们可以把声音的频率作为声音(声波)的信息,而不能把声音的能量作为信息。声音频率作为语言的基础,也是我们理解语言这种现在最常见的信息的出发点。在各种媒体上书写的符号在传递过程中一般是不会改变的,它同样是最常见的信息之一,它又是文字信息的基础。人的性别在人的一生中一般是不会改变的,而身高、体重在不断变化,对人来讲,性别可以作为识别人的一种信息。当然人的指纹在人的一生中也是不变的,同样可以作为识别人的一种信息;DNA也可以作为识别人的一种信息。

在研究信息定义时,一种常见的观点是维纳的定义,他说:什么是信息?信息就是信息,既不是物质也不是能量。维纳的定义在强调对信息需要深入研究上是有益的,定义表明信息是与质量、能量平行的、还未研究的、新的物质的性质。但是采用穷举法进行定义,又无法说清所有可能性时,是不合适的。因为我们同样可以说。信息不是热量,不是温度……还可以举出很多。在我们提出信息作为物质的一种属性的观点时,很容易想像,物质有多种属性,信息只是一种属性,因此仅谈信息不是什么,显然是不够的。

申农只研究了一种具体的信息,他把无线电码作为信息无疑是正确的。因为在无线电波传输过程中,电码是不变的。然而由于电码作为信息,不仅在传输过程中不改变,而且在人们收到电码时,电码也不改变:电码对人有作用,去掉了人们认识的不确定性。申农进一步挖掘在传输过程中电码的不变性,引申出人们收到电码,相当于在未传输来电码之前,人们如果存在认识的不确定性,在得到电码以后去掉不确定性这一事实,运用数学上概率论的理论,建立了电码信息理论。这一理论的基础在于把信息定义局限在“信息的作用”上,并未对

信息本身进行分析,由于申农理论的深刻全面,而且可以解决电码传输中的大量实际问题,使后人将信息定义锁定在申农定义之上。

20世纪末电子网络技术的发展,人们把大量图形、文字、声音等信息资料数字化成计算机可以操作的信号(·、一〉。这就用0、1字符串描述了绝大多数信息,使我们就有可能从最简单形式的信息来研究问题。

另一方面,生物、化学,以及控制论等一大批原来以物理学的牛顿定律(满足线性定律、叠加原理)、能量守恒及转换定律为基础的学科,目前研究的对象更加复杂,它们不再满足原来的叠加原理了,人们不能采用还原论的方式进行逐一分解,并且研究。现在已成为热点的非线性科学、系统科学对这方面的研究提供了新的思路,能量在这些学科中的作用正在减弱,对这些现象的认识需要从信息来了解。生物控制论已经超出了原来经典控制论中主要强调能量的局限,即输入信号能量变化,输出也变化〈正反馈或负反馈)。实际上,原来控制信号非常简单,人们不注意其信息特点,只关心其能量大小:现在则不然,信息对系统演化的作用非常明显。另外化学反应、生物生长繁殖也不能局限在对能量守'恒的研究,原来的化合分解反应、吸热放热反应、光合作用等理论,多数已成为这些学科中的经典。现在人们更关心化学大分子的结构、特种酶的催化作用、生长中如何维持物质中的蛋白质的各种结构,以及它们如何在繁殖中保持下来等。化学信息论、生物信息论应运而生。特别是生物信息论在人们完成了基因图谱,进而讨论蛋白质组学,制作各类蛋白质图谱的时候,迫切需要对信息有进一步的了解。

经济学的发展本来就与信息密切相关,各种交易市场的买卖,以及生产的发展全靠市场上信息的调节和影响。如何把申农的电报信号、日常生活中所讲的消息、语言等所反映的信息,以及化学大分子结构、生物遗传、经济发展所依赖的信息统一起来,将成为21世纪研究的热点,而且一定会有所突破。

四、学科的基本特性

信息涉及到各个学科,而且越来越重要,可以说现在几乎没有一个学科前沿的发展不涉及信息,这类似于18世纪科学研究中无不涉及能量一样。信息科学的研究,除了在定义上会有突破外,还有几个问题需要注意。

1.信息的度量

信息是过程量。人们通过过程认识事物,但事物过程千万种,一个量仅与过程联系则无法认识它。在能量的讨论中,热量、做功与过程有关,最后找到仅与状态有关的能量:找出能量、做功、传热三者之间的关系——热力学第一定律,使能量脱离过程,成为客观对象状态的变量,才得以真正认识它。

人们局限在信息对人的作用,使信息带有主观性。同一信息对不同的人作用不同,这是信息与人的关系,不是信息的性质。要认识信息必须将信息客观化。

由于在传输过程中,不变的物理量可以作为信息,实际上不变的东西很多,故对各个不变的部分,都可以定义信息。质量作为惯性的量度,其量值可以通过惯性的大小来量度。能量作为运动的量度,其量值可以通过运动的大小来量度。将申农信息定义推广,从信息作用的角度来度量信息存在困难,因为信息作用很多,无法提出一般方法。具体到一类信息,比如对于电码信患,不确定性大小容易计量,可以从去掉不确定性的多少来量度。更多的信息不存在与不确定性的直接紧密的联系,无法将申农的度量方法进行推广。可以设想,即使想方设法找到了普遍的去掉了不确定性的度量办法,对很多信息也无法度量,因为不确定性的数量无法认定,某一种声音的频率是一信息,但由于声音的频率是连续分布的,我们无法确定共有多少种不确定性,同时我们也无法比较600Hz的频率与1000Hz的频率,哪个带来的信息更多。

2.信息理论研究

人们在物质的相互作用中认识物理量,建立其遵从的理论。信息在传输的过程中,它是不变的,信宿感知到信息,就是感知到这一不变量的具体数值。由于在传输过程中没变化,信源所具有的信息仍然不变,而且这个不变的量可以被多个信宿所感知。从这个意义上来讲,信息应是个状态变量,在传输过程中不发生变化,不论这个信息是如何产生的,如何进行控制均不改变这种属性。声音的频率在传递过程中不发生变化,频率可以作为信息。我们收到一个信息,原对象所具有的信息并未减少,可以认为整体上信息的分布发生变化,一般不说

信息增加了,或减少了。从与能量比较来看信息量是不守恒的,它不因被信宿所感受而减少,也与如何产生没有关系。

信息使人们换一种思路研究问题,它是对多个具有不变性质的物理量统一的称谓,它的性质、理论也应是对多个物理量性质的综合。系统科学认为信息与可以作为信息的具体物理量不在一个层次。

尽管信息从定义、度量到性质,还未全弄清楚,但是它的应用领域十分广泛。生物的繁殖和进化、语言、文字全都离不开信息。对由多个变量描述的复杂系统进行刻圃,都广泛地使用信息。

3.信息与信息的作用

正像能量有多种形式一样,信息的具体形式更多。按照我们给出的定义,物质各种不变的性质都可以作为信息。

前面我们已经指出,要区分信息与信息的作用两个概念。信息的作用涉及主观的内容,特别是与我们人类密切相关的信息,如文字、书报、广播、图像等,其作用更是离不开人的感觉、知觉。生物遗传信息不涉及主观,它是生物繁殖的控制因子。生物繁殖可以由生物控制论研究生物信息(即基因的组分、形状等),来控制着蛋白质的形成。新蛋白质的合成要有自身能量、物质的变化,但新蛋白质的质量增加时,由基因控制的蛋白质的构成是不变的、相互关系是不变的。我们可以由复制来说明这一点。

五、研究方向

21世纪信息科学必然会有很大的发展。根据我们的理解,把一些不太成熟的看法提供给读者参考。首先要弄清楚信息的基本概念。我们已经提出了一个定义,这将是研究的第一步。学术界对定义可能还会有不同的看法,这需要研究。有了定义还需要研究它的性质。

普适性及具体内容。由于信息涉及多个学科,因此不论从概念上来讲,还是从学科的基本性质、理论框架上来讲,它都要有普适性,要适用于所涉及的所有学科。同时它要能具体化,具体到每一个学科,信息都必须有具体的内容、含义。

研究信息我们认为应该从最基本、最简单的问题出发,要从简单信息向复杂信息发展。声音内容含义所涉及的信息要从声音频率的信息性质分析起。我们认为从物理学最简单信息的讨论开始,将会有助于对问题的理解。在声音传播过程中,声强与能量联系,要变化;音调(频率)不变化,频率可以作为信息来研究,这也是我们通常所说语言信息内容的基础。

对于复杂系统运动,也可以从中抽出规律性的东西作为信息,它可能不是原来物理量的简单组合。在超导现象的研究中,人们提出两个电子组成库柏对在超导中是不变的,可以将其作为信息,实际存在的是电子,库柏对只是分析电子运动时提出的概念。

从信息的具体性质归纳信息的一般普适的性质。各类系统、各种运动变化中的具体信息的性质以及它们之间的转化、作用等研究是必要的。只有对具体问题研究清楚了,总结归纳才容易,才能够逐步得出更为普遍的东西。我们提出了信息不守恒的说法,即在传播过程中,信息不改变。物质信息在传播过程中,对外界有作用,而这种作用并不改变原物质的该性质,仍保持它原有的信息。物质的信息可以对多个客体作用,这些都是它不守恒的含义。信息的这一基本特征使我们能进行信息复制、信息加工等应用。

我们认为,信息是一类物理性质的总称。为什么要把信息概念抽象、总结、归纳出来?为什么把物理量区分为信息和非信息,它的意义何在。这些也都有待于研究。

二次世界大战期间通信信息的大量使用,最终总结出申农信息论。现在生物学、经济学等多个学科大量使用信息:特别是计算机的发展,使信息的使用、复制规范化、简单化;网络的出现,使得由计算机处理过的信息更便于发挥作用,这些都将大大推进信息在应用上的研究,并将取得成果。我们相信在信息技术这样迅速发展的时代,人类一定会在信息科学基础研究层次有所突破。

我们希望人们研究我们提出来的在传输过程中不变的物理量可以作为信息的新提法,也期待着人们修正它,提出更准确的信息概念。我们相信信息科学的基础研究在21世纪必将取得丰硕的成果,信息技术将更加深入各门学科。19世纪、20世纪是能量概念发挥作用的时代。21世纪,信息将成为更加基本的概念,而且将必然推动科学技术的进一步发展。

信息已经成为使用非常广泛的一个名词。21世纪,一方面信息在不同学科中的应用将十分广泛,会更加深入,比如在地理信息系统、生物信息、经济信息,对文字、数据的处理技术等。另一方面不同学科对信息大量深入的研究,将有助于建立统一规范的信息科学。同时,各应用学科也迫切需要构建完整的信息科学理论,以便更好地应用。可能和需要的双重推动,将会使规范的信息科学尽快建立起来。

本文是对目前信息科学难题的分析,更是我们通过思考,从信息定义开始给出解决的方向,进一步的发展还有赖于科学技术的全面进步,以及大批有朝气的青年科学工作者的努力。

 
最新文章
相关阅读