办公自动化1(1 / 1)

高效管理 肖胜萍 5186 字 1个月前

20世纪70年代美国麻省理工学院教授M.C.Zisman为了初露端倪的办公自动化下了如下定义:办公自动化就是将计算机技术、通信技术、系统科学及行为科学应用于传统的数据处理难以处理的数量庞大且结构不明确的、包括非数值型信息的办公事务处理的一项综合技术。

20世纪80年代中期,我国制定了办公自动化的发展目标及远景规划,同时,国务院电子振兴办公自动化专家会议对办公自动化作了如下定义:办公自动化是利用先进的科学技术,不断使人的办公业务活动物化于人以外的各种设备中,并由这些设备与办公室人员构成服务于某种目标的人一机信息处理系统。其目的是尽可能充分地利用信息资源,提高生产率、工作效率和质量,辅助决策并争取更好的效果,以达到既定(即经济、政治、军事或其他方面的)目标。一个比较完整的办公自动化系统应包括信息采集、信息加工、信息传输、信息保存这四个基本环节。核心任务是为各领域各层次的办公人员提供所需运用的信息。

日本人工智能专家渡部和先生对办公自动化的概念作了富有哲理性的解释,他指出,凡能够清楚地设定其指标的业务属于工场型的事务,将来应由办公室机器人来处理。办公自动化的长远目标是改善人们在办公室中的工作效率,使办公室的工作人性化。这意味着在这样的办公室系统中,人的活动集中于办公业务的核心部分,而这些活动是无论科学多么发达都不能完全由机器所取代的。这样,人的精力将只用于创造性的智力活动,办公自动化将对智能型业务提供强有力的支持,办公室将真正成为智力活动的场所。

办公自动化对于科技型中小企业尤为重要。一般说来,办公自动化分为个人办公自动与群体办公自动化:

·个人办公自动化

个人办公自动化主要指支持个人办公的计算机应用技术,这些技术包括文字处理、数据处理、电子报表处理、多媒体技术等内容。

(1)数据处理技术。从应用软件的角度来看,在一般办公室环境下,数据处理是通过数据库软件、电子报表软件以及应用数据库软件建立的各类管理信息系统或其他应用程序来实现的。它们包括了对办公中所需信息的存储、计算、查询、汇总、制表、编排等内容。

(2)文字处理技术。文字处理是指应用计算机完成文字工作,其核心部件是文字处理软件。文字处理技术具有文字的输入、编辑排版以及存储打印等基本功能。

(3)语音处理技术。指计算机对人的语言声音的处理,从应用角度来看,主要包括语音合成和语音识别技术。

(4)图形图像处理技术。就办公室环境的计算机应用而言,是指包括图形(像)的生成(绘制)、编辑和修改,图形(像)与文字的混合排版、定位与输出等。汉字的自动识别技术也可以被看作一种对图形的智能化处理技术。

·群体办公的自动化

(1)群体办公的自动化概念。群体办公的自动化是支持群体间动态办公的综合自动化系统,为区别传统意义上的办公自动化系统,特指针对越来越频繁出现的跨单位、跨专业和超地理界限的信息交流和业务交汇的协同化自动办公的技术和系统。其极端形式是不以行政的或地理的界限为基础的动态的电信社会单位,社会信息化进程正越来越多地创建出各种大大小小的电信单位。不论其组织形式如何,协同交互的电子办公能力是新时代环境下组织生存和发展的技术基础。

(2)支撑群体办公的自动化技术的特征。支撑群体办公的自动化技术的特征主要是网络化与智能化。

网络化( Internet/lntranet)是指系统从一开始就是建立在网络上、依靠网络和网络信息的支持而运转,信息系统支持组织的动态变化和任何形式的协同交互业务。

智能化( Intelligence)是指这项自动化技术需要有人工智能和多媒体等技术的支持,它实施知识管理的组织机制,能够挖掘隐性知识,揭示信息的价值和意义,达到组织内知识共享的目的,使之成为组织运用信息进行创造性智能活动的技术基础。

2.办公自动化技术与设备

·文字处理技术

(1)中文平台

数字化中文文字处理的基础是中文平台,中文平台是基于Intel 80X86(包括奔腾)体系结构的、分别以英文DOS、Windows和UNIX为基础的,以外挂式方式实现的中文处理基准台面和支撑环境。

中文平台包括以下部分:

——外挂接口,即在原西文操作系统外部所做的一个独立的中文处理模块,通过某种方式挂接在西方操作系统上,使原西文操作系统增加了中文处理功能。这个中文处理模块可被撤除,且撤除后西文操作系统完全恢复原有功能。

——中文处理驱动程序,包括中文显示驱动程序、中文输入法驱动程序(键盘输入、语音输入、扫描输入等方式),打印驱动程序和字型驱动程序等。

——中文处理辅助功能,可包括中文时间日期格式处理、中西文字符合标点符号个数的统计、中文字符多种方式的排序、中文字词校对等常用功能或实用工具,这些辅助工具是可选的。

——系统信息,有关系统所处的中文或西文状态、正在使用的或可用的输入法及打印驱动程序、已装入的字型等反映系统状态和资源情况的信息,这些信息常常是应用程序运行时需要设置和查询的。

(2)汉字信息处理技术

在中文平台的支持下,计算机系统才能够处理汉字信息。汉字的信息化是通过汉字属性的信息化实现的。信息化后的汉字属性特征构成汉字的代码体系,中文平台就是通过对汉字代码体系的转换最终实现汉字处理的。

汉字信息处理技术是汉字文字处理技术的基础,它体现在对汉字属性的处理过程中。汉字的属性包括汉字的字量、字频、字形、字音、字义等,对这些属性的信息化处理贯穿在汉字信息处理流程的各个阶段以及相关的技术考虑中。

在中文电脑中,选用或配备多少个汉字由所有的汉字编码字符集标准来决定。国家标准GB2312-80基本集共收录汉字6763个,其中常用字(一集字库)3755个,次常用字(二集字库)3008个。此外,国家标准的两个辅助集收录了稀用字和罕用字共16000余个。

上述汉字编码字符集中汉字的选用是建立在汉字使用频率统计的基础上。例如国标一集字库3755个汉字在通用文献中的使用频率是99.9%,加上二集字库一共6763个汉字的使用频率覆盖了通用文献应用的99. 99%。两个辅助集中的汉字的使用频率在万分之一以下。不过汉字的使用频率受时空的限制,在不同的时代背景下具有显著差异,在不同的专业领域中差异也很大。

在汉字信息处理中,汉字的字形通过被分解为部件、笔画、位点等层次最终被数字化了。汉字字形的分解方式是汉字的输入与输出技术,以及汉字字模生成的基础。

汉字的字音是汉字输入、排序的基础。此外,是汉语拼音的自动识别与合成技术中处理的对象。汉语是一种单音节语言,在汉字中同音现象十分突出。最多一音达120~130个字。在传统的社会生活中,由于语言环境和上下文的客观因素,同音现象产生的矛盾并不突出,但是在计算机技术的应用与发展中,对同音字的处理是技术难度很大的问题,但目前智能化的同音字、词处理已经取得了突破性的进展,成为实用化的技术。

语言的表现形式是“音”,其潜在内容是“义”,文字的表现形式是“形”,其潜在内容是“音”和“义”。每一个汉字都是多义的,对于语义歧义的处理是中文语音自动处理、机器翻译、自然语言理解等方面计算机人工智能技术发展的关键。

汉字代码体系由汉字输入码、汉字机内码、汉字字形码和汉字国标交换码等构成。

汉字代码中的汉字输入码是用于在计算机键盘上输入汉字的编码方法所产生的代码;汉字机内码是计算机内部处理汉字时使用的代码,类似于给每个汉字的一个序号;汉字字形码是汉字字形的数字化表示法所产生的代码;汉字国标交换码是我国制定的汉字信息交换标准中为每个汉字所规定的代码。

计算机处理汉字的过程实际上就是一个对汉字代码进行转换的过程,即汉字信息处理流程。

汉字代码转换的具体过程是,人在键盘上敲人汉字的输入码,由计算机将其转换为汉字机内码供计算机处理,在处理的过程中和结束后,将机内码转换为字形码以便在显示器上显示或者在打印机上打印;在不同的汉字信息系统,例如大陆与台湾或日本等使用的汉字系统之间的信息交换过程中使用汉字交换码作为通信转换的工具。

(3)汉字输入技术

汉字输入技术类型包括键盘输入技术、自动输入技术两大类。键盘输入技术指以键盘为工具,使用各种编码方法输入汉字的技术。自动输入技术包括以汉字的图形扫描自动识别和汉语语音的自动识别等方法输入汉字的技术。

汉字键盘输入编码方案的类型大体上可分为拼音码、拼形码、音形码、流水码等,它们属于以汉字的不同属性为主要取码特征的编码方法。

用户对编码的评价和选择包括两个层面的考虑:技术指标和人文标准。技术指标主要是平均码长、重码率、输入速度、学习成本、易用性等;人文标准则反映了职业、文化、年龄、地域、习惯等多方面的因素。

汉字键盘输入编码方案已经经历了一个蓬勃发展的过程,目前其发展趋势的主要特征是:

——规范化:形码的规范化已经有了一定的基础,国家语言文字工作委员会与新闻出版署联合发布的汉字部件规范、汉语通用字笔顺规范,已在1998年5月1日付诸实行,最有影响的一批形码如五笔、郑码等均依据规范进行了调整。

——词语化:无论是拼音码还是拼形码,都出现了以词语而不是单字为主要处理对象的趋势,这样的好处是加快输入速度,同时使计算机的智能功能有了更多的发挥空间。

——智能化:音码的智能化,主要建立在拼音的连续序列输入方式上,人可以自如地输入不论单字还是词的拼音序列,由计算机根据智能理解自动分词、自动挑选同音字词自记忆所用搭配。形码的智能化主要体现在字词的上下文自动关联的处理上。它们共同的目的是使人的干预趋于最少,而使计算机承担更多的选择性任务,从而加快输入速度,使人一机之间建立某种沟通,就如同人与人之间随着时间的推移而建立某种理解和默契一样。

——辅助功能多样化:提供动态的联想、近义、反义词汇及资料、素材等帮助录入甚至构思和写作的辅助、支持功能。

(4)文字处理软件的主要功能

文字处理软件的主要功能包括:

——基本编辑功能。完成大部分文字编辑工作。

——验证工具。通过提供基本字典和用户字典、词库等工具,实现诸如拼写、语法、文档格式等多种检查功能。

——函件合并。对文字与表格文档之间的数据读取、拼接等功能。

——版面编排。包括多栏目设计、图表图形输入编辑、模板与样式的预览、缩放剪辑等功能。

——样式设计。自动样式和用户自己编辑样式的功能。

——字体/打印机支持。丰富的字体显示及打印能力。

——输入/输出口。支持输入/出各种不同格式文本的能力,包括不同程序的文本文件和不同媒体文件。

——联网能力。在网上多用户协同参与文档制作、修订、批注等操作的能力。

——宏功能。能充分支持与字处理软件动态交换数据和处理过程的宏语言。

——帮助文档。提供全面并易于理解的使用说明和联机帮助以及多途径的帮助指南工具。

——易学/易用性。菜单以及功能键易于掌握,提供诸如“向导”等工具帮助以实现较复杂的功能。对熟练用户提供快捷键和丰富的可定制选项,以适应用户特性和提高使用速度。

——检索工具。可写出各章节内容要点、目次索引、修订工具、文件修订的历史记录等。

出错处理。能及时发现错误,并能快速退回原处重新编辑,还能恢复已删除或已完成的操作,提醒用户避免出错。

(5)校对软件

校对软件的作用是自动校对中文、英文或中英文混排文件内的中文、英文和标点错误并可提出修改意见。

校对软件的技术原理是以词库为基础,采用良好的词切分技术,避免句子内词切分的二义性,对切分后的词汇判断其是否存在、词汇间的语法搭配是否合理,在此判断后,系统给出错误提示。

校对软件应具备纠错功能,即对以下错误进行提示或纠错意见:形似错字、词;音似错字;同音错词;别字;叠字;词组丢字;词组搭配不当;重句重段;重要领导姓名、称谓错误等。还应能够检查年、月、日,全角、半角英文,以及检查语法、数字、章节等。

(6)排版印刷系统

办公自动化系统中实用的排版印刷系统包括:

桌面型印刷系统。也称之为轻印刷系统,是指在办公室中使用的小型电子印刷系统。一般具有文字与图形图像的输入、编辑处理和制版与印刷输出三个部分组成。其核心部分是一台或几台具有文字、图像处理功能的计算机系统,其输出精度即分辨率要求目前一般在每英寸700点左右或更高。制版和印刷用的是激光印字机或小型胶印机等。

在不同级别的办公室系统中,印刷系统的硬件配置、软件功能也可能是各不相同的,但从办公系统的要求来看其共性是:对文件的形成和编辑处理需具有较高的速度;要保证文件的大容量存储;有丰富的文件编辑功能;有较丰富的文字字体字号;具有一定的图形图像处理能力;具有中等以上的输出精度;充分利用办公局域网中的通信能力,共享轻印刷系统的软件与硬件资源,以减少开销和提高效率。此外,还应具有合适的性能价格比、噪音小、无污染、占地面积小、方便易用和稳定性高的特点。

精密型激光照排系统。精密型激光照排系统指计算机与激光照像设备相连接而组成的精密型汉字编辑排版系统。一般用于书籍、报刊等正式出版物的编辑、排版。

·数据处理技术

(1)数据库管理系统软件

数据,指编码后的信息,广义而言,对所有数字化了的信息,例如数值、文字、图形图像、声音、视频、动画等各种信息对象类型的计算机处理都可统称为数据处理。在办公室环境下,数据处理常专指各类事务信息管理、报表统计、账目计算、信息查询检索和资料管理等方面的计算机处理的应用。其主要特点是计算机对大量结构性较强、业务程序较明确的信息(数字和文字)进行处理。一般说来,数据处理包括数据的收集、存储、分类、排序、比较、检索、计算、编排、输出、传递等基本环节。

数据库是计算机存储器中合理组织、相互关联的数据的集合。这些数据具有冗余度小、数据的存储独立于使用它的程序,具有可共享性等特点。

在数据库中存储的大量数据与管理这些数据的专用软件系统及相应的硬件设备构成一个完整的系统,称为数据库系统。其中,管理数据库系统的专用系统,即实现数据库的定义、建立、管理、维护功能的软件包就是数据库管理系统。

数据库中存储的是经统一定义、规范化的记录性文献,或称库文件。数据库的检索查询依赖于库文件的格式与组织。一般而言,数据库的检索可分为关键字检索、逻辑条件表达式检索以及主题检索等。关键字检索根据用户给出的某一关键字的值,即可找出满足其要求的记录。逻辑条件表达式检索根据记录中关键字之间的逻辑关系,通过逻辑运算,即逻辑与、或、非的组合运算,查找符合条件的记录。逻辑条件表达式检索能提供对所查找文献的较丰富的信息,在查准率方面大大强于单一关键字检索。主题检索能提供有关文献内容的深层检索,但在文献的前处理方面的技术要求和投入成本都较高。

(2)全文检索系统软件

信息检索可分为两大类:一类是受控词汇的检索,即数据库的检索,这种检索必须进行对文献的著录标引等前期处理工作,所需人力和时间的投入极高;另一类就是全文检索,这是一种非受控词汇的检索,其优点是无需对文献进行著录标引等前期处理。具体而言,计算机文本无需作任何数据库文件结构设计、主题标引和格式修改,因而避免了二次加工的人力和时间的大量投入。全文检索系统可以检索一切存在于计算机中的文本,可实现大容量大范围全文快速检索,可实现任意字、词逻辑组合检索,可实现中、西文混合检索,可实现文本标题、日期、文件名综合检索,可实现屏幕捕捉、逐步逼近、模糊检索。

全文检索系统软件具有以下基本功能:可按字、词检索;可按日期查询;可按记录名查询;可按逻辑组合查询检索;可从屏幕捕捉字词查询检索等方式和途径找到所需的信息。

(3)数据库管理系统开发工具软件

由于以数据库系统软件开发的大量管理信息系统在本质上具有共性,这使得在技术上以计算机标准化和模块化的自动编程来代替大量简单、重复和繁琐的手工编程成为可能。即由人一机交互的、由人给出设计要求和具体参数,由生成工具软件完成编程的工作方式取代了传统手工为主的编程劳动。其优势是提高了工作效率,缩短了开发周期,免除了程序的反复调试过程,简化了系统的维护。特别有意义的是使得业务和管理人员可以方便地开发出符合自己需要的系统,而不必在计算机编程方面有很专业的知识和投入很大的精力。这一类工具软件的出现,摆脱了长期以来在计算机应用领域存在的开发与应用脱节的困境,解决了影响和制约计算机应用的瓶颈问题,为信息化进程起到了有力的推动作用。

数据库管理系统的开发工具的功能主要在于:实现管理信息系统的自动编程,数据录入维护与设计票据录入维护、数据查询与票据查询、数据统计与统计图形、数据汇总、公式计算、数据合并与数据删除、图像维护与图像查询、各种报表打印、文件输入与输出(各种文件与FoxPro的转换与共享)、辅助功能(代码、备份、加密、日志等)、网络数据库管理(集中或分布式)。

数据库管理系统开发工具应用的基本过程包括以下步骤:建立或复制数据库结构、确定录入方式;建立系统的总菜单和各级子菜单结构;选择和建立各功能模块、生成应用程序;确定和建立各打印输出格式及内容等。

自动编程工具软件虽然可以快速建立一个管理信息系统,但是,应指出的是,要想建立一个好的管理信息系统并不容易,需建立在对管理业务和数据库系统两方面的理解的基础之上,特别是能否对管理业务的信息化建立深刻理解是管理信息系统建设成败的关键,同时还需要进行周密细致的管理系统分析。此外,不可忽视的另一点是需要对传统管理系统进行信息化的改造。

(4)数据仓库软件系统

数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的和不同时间的数据集合。

所谓面向主题的数据库是经过科学规划和设计而建立起来的具有共享性和一致性的数据环境。其特点是面向组织的目标主题,而不是按用户试图建立的面向一般应用项目业务,其数据结构和存储方式独立于职能区域和业务过程。

与传统的面向文献型的数据库处理技术不同,数据仓库是对于分散在不同的系统、不同的应用程序中,具有不同格式的数据的获取、相互关联和解释的并以单位或专业为对象的数据库综合性处理技术,它允许用户访问综合的面向对象存储的大量历史数据,可把若干不同来源中取得的数据统一到一个易于使用的参考数据库中,可为用户提供专业化的信息和指导,它形成了对象综合性决策支持系统的核心。它可根据不同类型的业务信息(决策人员必知的)组织来自众多应用的基于时间的信息;可包括种类繁多的信息以满足不同用户的不同需求;还可包括单一类型的信息,以满足某一特定用户群的特殊需求。

数据仓库由若干层逻辑结构组成,从传统数据库及数据文件中获取原始数据后按辅助决策的主题要求形成当前基本数据层;在基本层的基础上按综合决策要求形成综合数据层;随着时间的推移,由时间控制机制将当前基本层转为历史数据层。

数据仓库系统由数据仓库、仓库管理和分析工具组成。其中仓库管理负责对确定的数据需求进行数据的建模、抽取、清理和转换,最后确定数据仓库的物理存储结构。分析工具是用于实现决策支持功能的各种工具。

数据集市是一种具有特定作用的数据仓库工具。它具有规模小、面向特定应用和特定部门、开发和维护方便、易于升级等种种优点,因而被广泛应用。

数据仓库开发需要一个过程。数据仓库不是一种现成的产品,而是需要业务部门和技术部门协同进行再开发才能实际应用的产品。其开发的具体过程如下:

——系统规划。确定工程目标及计划。包括数据范围、来源、技术设备、人员培训及工程进度等。

——建立技术环境。确定所需软件和硬件资源,包括开发平台、开发工具、网络通信环境和服务水平目标等。

——确定主题与数据建模。根据决策需求确定主题、选择数据源、设计数据逻辑结构。

——设计数据仓库中的数据。根据用户需求确定,设计数据仓库的物理结构。

——设计数据转换程序。即对数据的抽取、清理、格式化、综合和装载等过程的设计与编码。

——管理元数据。即定义、表示数据的意义和协同各组成部分之间的关系。

——开发决策分析工具。开发面向用户的决策工具,包括优化查询工具、统计分析工具、多维数据分析工具以及数据采掘工具等。

——管理数据仓库。对数据仓库本身的质量检测、维护、数据更新等工作。

(5)电子报表软件

电子报表是由工作簿、工作表和单元格构成的数据动态管理软件系统。其中,单元格是数据处理的最小单位,其位置由列和行标识。单元格构成工作表,一个典型的工作表有256行×16384行,是一个相当大的区域,用户可在工作表中选择多个独立或相关的小工作区域,必要时由系统对其进行联系、汇总等处理。若干个工作表组成一个工作簿,就如同一本书由若干页构成一样,可在工作簿中翻页查看各工作表并对其进行增、删和前后调整。一个工作簿是一个独立的计算机文件。

电子报表软件的功能包括:可在单元格中填人、整理和存储数据,可通过系统提供的功能强大丰富的函数及自建的公式对工作表进行运算,还可以使用数据透视功能根据用户的要求对工作表进行方便、灵活的汇总处理。数据透视表功能可以生成手工情况下要花很多功夫作很麻烦的处理才能完成的复杂的汇总表,经过简单操作就可生成具有相关的地图和统计图形的图文并茂的图表。此外,电子报表还可以与数据库及其他软件交换和共享数据。

·多媒体实用技术

(1)多媒体微机

信息的表现形式多种多样,如文字、图形、声音、动画、活动影像等。不同的信息表现形式称为不同的信息媒体。多媒体计算机技术是指计算机交互式综合处理各种媒体信息,并将各种信息建立逻辑连接,集成为一个系统并具有交互处理能力。能同时捕捉、处理、存储和展示多个不同类型信息媒体的微型计算机称为多媒体微机(MPC)。

多媒体微机一般配置只读光盘CD-ROM以存储多媒体信息。CD-ROM根据传输数据的速率不同需配置各种倍速的驱动器。此外,还需配置声卡以实现数字信号与声波的相互转换,以便播放和录制音响数据。配置解压缩装置用来还原图像信息,这样才可以在多媒体微机上看到图像。其中图像处理是多媒体微机处理能力的关键。图像处理能力由下述概念体现:像素,是构成图像的最小单位;分辨率,是每桢能显示的像素,例如VGA标准显示器的分辨率为640×480,SVGA为1024×768;颜色,计算机能显示的颜色。这些性能集中体现在彩色显示卡的指标上,例如,总线类型的显示卡(VESA/PCI,数据传输位数32/64位)分辨率(640×480、1024×768)存储器容量(2M以上)标识了它的图像处理能力和显示速度(每秒能显示的桢数)。此外,压缩(不存储图像的每一位原始信息而是存储图像的变化规律信息的存储方法,在显示时需要用解压缩软件恢复原始图像)与解压方式也是图像处理的重要内容。

多媒体微机的发展有赖于以下技术设备的市场产品的发展,即在性能与价格比方面的不断优化:传递多种信息媒体的输入输出技术与设备、处理多媒体信息所要求的高速度技术软件、海量存储技术、数据压缩与还原技术、多媒体编辑技术等。

可视计算机环境指提供视频、语音的同步传输及应用共享的计算机通信环境。它基于计算机强大的多媒体功能和通信网络的基础上。

(2)汉字识别技术与产品

模式识别就是将事件和过程进行分类和鉴别的技术。它把一种要研究的对象根据某些特征进行识别并分类。例如,要识别写在卡片上的数码字,判断它是0、1、2……9中的哪个数字,就将数码字图像分成十类的问题。计算机应用的发展,可以把不同的对象图像化或模式化,例如汉字、心电图与地震波等波形图、遥感遥测照片等等。模式识别技术使得计算机能执行某种类似于专家水平的任务或者进行某种智能化的活动。

汉字识别技术是一种文字自动输入方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息,也可使用联机手写方式识别写在手写板上的汉字,然后利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储在文本文件中。它是一种快捷、省力的文字输入方式,是在有大容量文字录入的场合可采用的方法。它可缩短录入时间,减轻劳动强度,提高录入的正确率,提高工作效率。具有以下实用产品:

——联机手写体汉字识别系统(手写板)。适用于不愿或不便使用键盘输入汉字的计算机操作者。除了用手写笔写汉字外,还能签名、绘图、保留手迹和代替鼠标。手写方式不会打断思维,基本不用停下来选择候选字,可以连续书写,识别后的字显示在屏幕上,每分钟达30~50字,适合普通人使用。它还具有自学功能,对于特定用户能不断提高识别率。

——脱机汉字文本自动识别( OCR: Optical CharacterRecognition)。可分为印刷体文稿识别和手写体文稿识别。对印刷体文稿的识别系统,目前先进的产品,识别速度在每秒35~40字以上,扫描仪扫描线在每英寸300线以上,字迹清晰的铅印或胶印文本的识别率可达99%,对工整的手写体文稿识别率可达90%,一般工整程度可达80%。智能化的OCR系统具有自学功能,可以不断适应用户的写法习惯,只要用户的笔迹变化不大,经学习一段时间以后,可识别较潦草的字迹。