第一章 中文信息处理简介
1.1 中文信息处理的意义
信息一词,其内涵宽泛,延外无限,至今尚未公认的一统的定义。就广义而言,举凡来自人类的生存环境与与生存环境有关的天体宇宙,地球上的山川河流、矿物等各方面的自然现象、一切生物(包括人)的生态(包括死亡后存留的遗骸)现象、人类的社会现象(政治、经济、军事、文化、商业、科学技术及工农业生产、生活活动)所产生的各种状态和消息都含有信息。所以,信息的含意丰富,而且可以有数据、文字、声音、图形、图像等多种多样的表现形式,称之为信息的多元化表示。用计算机处理多元化信息,属于信息处理技术的范畴。
信息是客观存在,若根据需要去正确地利用信息,信息就会产生相应的价值。要使信息产生广泛的社会价值就需要传递。传递和保存信息都需要处理技术。在电信技术发明以前,人们只能用人工通信,或者用其他简单的方式或各种约定来传递信息。电子通信技术的发展,从电话电报开始,直到传真、电视,从有线通信发展到无线通信,直到微波、光纤通信、卫星通信,信息的传递速率大大提高。20世纪40年代发明了电子计算机,用于处理数值运算。由于信息之多、信息之复杂,且要求处理信息快而准确,所以对信息进行的加工处理必然离不开计算机技术,信息处理这一术语就自然而然地隐含了计算机技术。随着软件技术的发展进步,“数据”逐渐用以表示广义的信息,从而发展了数据应用的应用技术。利用计算机处理数据信息,除了作信息传输外,主要是对信息某种规律或作某种意义的加工,使它适应某种特定目标的需要。例如,气象预报的信息处理就是结合信息传感技术,对采集到的原始数据按照所设计的数学模型进行处理,得出的结果用作气象预报的资料。因此,用计算机处理或加工信息扩大了信息的利用范围,使信息的利用价值大大提高。计算机信息技术日益成为现代社会的科技进步、经济发展、人类文明进程所不可缺少的东西。它和物质、能源一起被视为现代人类社会生存和发展的三大要素,形成了蒸蒸日上的信息产业。
应用计算机处理多元化信息、属信息处理技术范畴。一方面,微型机及其相关产品的普及应用为信息处理技术的实用化提供了基础。另一方面,软件技术飞速发展,不仅使数据和文字信息处理技术更加完善,而且开拓了信息处理技术的更新应用领域,比如模式识别、语音识别及语音合成、自然语言处理、语言的翻译等技术领域。计算机指纹识别技术在刑侦破案、取代锁和钥匙、作为存取财物的有效凭证等方面得到了应用。
计算机还具有利用数据通信技术实现的计算机网络通信功能。传统的信息处理是局限于信息的存储与检索,是狭义的信息处理;传统的通信技术是以传输模拟信号为主,只须完成信息的传输或转移。经计算机存储和处理的信息可以在两台或多台计算机或数据处理设备之间、两地或多地之间互相传输,更加增强了信息处理技术的效能,扩展了信息处理技术和通信技术的内容,使信息处理技术和通信技术结合起来,形成了广义的信息处理技术,即兼有信息处理与信息传输功能的计算机网络通信技术。