您现在的位置: 岳西风采 >> 科普频道 >> 电信网络 >> 多媒体 >> 资料正文 提示:双击屏幕自动滚动
【资料正文】
手写数字识别的原理及应用
 作者:佚名  来源:中国科普  更新:2007-3-7 20:14:45 选择语言:繁體


内容提要:
在整个OCR领域中,最为困难的就是脱机手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。
本文关键字:多媒体,手写识别,数字识别
  一、引言

  手写数字识别是“光学字符识别技术”(简称OCR)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。

  在整个OCR领域中,最为困难的就是脱机手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。

  二、研究的实际背景

  字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字、英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。这几年来我国开始大力推广的“三金”工程在很大程度上要依赖数据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促进这一事业的进展。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。

  三、研究的理论意义

  手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:

  1、阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关,这样就为各国、各地区的研究工作者提供了一个施展才智的大舞台。在这一领域大家可以探讨,比较各种研究方法。

  2、由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。这方面最明显的例子就是人工神经网络,相当一部分的人工神经网络模型都以手写数字识别作为具体的实验平台,验证理论的有效性,评价各种方法的优缺点。

  3、尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。

  4、手写数字的识别方法很容易推广到其它一些相关问题,一个直接的应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。

  四、基于手写数字识别的典型应用

  手写数字识别有着极为广泛的应用前景,这也正是它受到世界各国的研究工作者重视的一个主要原因。下面我们将介绍基于手写数字识别的应用系统的特殊要求,以及一些以手写数字识别技术为基础的典型应用。

  (一) 手写数字识别在大规模数据统计中的应用

  在大规模的数据统计(如:行业年鉴、人口普查等)中,需要输入大量的数据,以前完全要手工输入,则需要耗费大量的人力和物力。近年来在这类工作中采用OCR技术已成为一种趋势。 

  因为在这种应用中,数据的录入是集中组织的,所以往往可以通过专门设计表格和对书写施加限制以便于机器的自动识别。目前国内的大多数实用系统都要求用户按指定规范在方格内填写。另外,这些系统往往采用合适的用户界面对识别结果做全面的检查,最终保证结果正确无误。可以看出,这是一类相对容易的应用,对识别核心算法的要求比较低,是目前国内很多单位应用开发的热点。

  (二) 手写数字识别在财务、税务、金融领域中的应用

  财务、税务、金融是手写数字识别大有可为的又一领域。随着我国经济的迅速发展,每天等待处理的财务、税务报表、支票、付款单等越来越多。如果能把它们用计算机自动处理,无疑可以节约大量的时间、金钱和劳力。与上面提到的统计报表处理相比,在这个领域的应用难度更大,原因有:1、对识别的精度要求更高;2、处理的表格往往不止一种,一个系统应能智能地同时处理若干种表格;3、由于处理贯穿于整个日常工作之中,书写应尽量按一般习惯(如:不对书写者的写法做限定,书写时允许写连续的字串,而不是在固定的方格内书写),这样对识别及预处理的核心算法要求也提高了。

  (三) 手写数字识别在邮件分拣中的应用

  随着人们生活水平的提高,经济活动的发展,通信联系的需求使信函的互换量大幅度增加,我国函件业务量也在不断增长,预计到2000年,一些大城市的中心邮局每天处理量将高达几百万件,业务量的急剧上升使得邮件的分拣自动化成为大势所趋。在邮件的自动分拣中,手写数字识别(OCR)往往与光学条码识别、人工辅助识别等手段相结合,完成邮政编码的阅读。目前使用量最大的OVCS分拣机的性能指标:OCR拒分率30%,OCR分拣差错率1.1%。

  五、手写数字识别技术展望

  随着国家信息化进程的加快,手写数字识别的应用需求将越来越广泛,因此应当加强这方面的研究工作。作者认为,应用系统的性能的关键与瓶颈仍然在于手写数字识别核心算法性能上,最终目标是研究零误识率和低拒识率的高速识别算法。此外,尽早建立反映中国人书写习惯的、具有国家标准性质的手写数字样本库也是当务之急。
发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
  • 上一份资料:

  • 下一份资料:
  • 相 关 文 章
    数字照相机
    检测技术
    语音输入与识别技术
    联机手写汉字识别系统
    印刷体汉字识别系统
    脱机手写汉字识别
    手写字识别技术
    前景看好的笔绘板
    便捷无比的触摸屏
    时代的新宠——鼠标
    专 题 栏 目
    最 新 热 门
    推荐资料 认识地球资源卫星
    普通资料 多媒体信息有什么特征
    普通资料 什么是ISDN
    普通资料 量子光学之父和精密光谱学…
    普通资料 使戏剧回到它的基本原素
    普通资料 幽门螺杆菌:引发胃炎和消…
    普通资料 打开绿色化学之门:烯烃复…
    普通资料 人类扶贫天使:孟加拉乡村…
    普通资料 宇宙大爆炸绝非神话
    普通资料 文化冲突和融合中的新的象…
    最 新 推 荐
    推荐资料 认识地球资源卫星
    推荐资料 定义"可持续发展"
    推荐资料 北极熊
    推荐资料 北极狐狸
    推荐资料 无线通信趣事
    推荐资料 漫话各国的“国石”
    推荐资料 生命的遗传物质是DNA
    推荐资料 地球科学新时空观
    推荐资料 夜宿穹庐
    推荐资料 最大的咸水湖──浓墨重彩…
    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    岳西风采版权与免责声明:
    一、凡本网注明“岳西风采”的所有作品,版权均属于岳西风采,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:岳西风采”。违反上述声明者,本网将追究其相关法律责任。
    二、凡本网注明“来源:XXX(非岳西风采)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
    三、如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。
    ※联系方式:网站管理员 QQ:489567068 MSN:wangge9#msn.com  E-mail: wangge9#gmail.com(发信时请把#换成@)
    设为首页 | 加入收藏 | 使用条款 | 已获授权列表 | 网站公告 | 注册邮箱 | 登录邮箱| 岳西地图 | 岳西网址导航 | 网址简洁版 | 网站地图
    皖ICP备06010134号