摘要
模式识别的研究成果在文本分类、语音识别、图像识别、视频识别、信息检索、医学图像分析与数据挖掘等领域得到了广泛的应用。字符识别是模式识别研究的重要内容,印刷体文字识别在国内外经过多年的研究并取得了应用性很好的成果,但手写字母识别具有大量的随意性和笔画的不规则性,对手写字母识别具有更大的难度。随着研究的深入和大量的技术引入,研究人员对手写体字母识别提出了很多种解决方案,产生了多种识别算法。所有研究提出的这些方法和相应的算法,都是在特定条件下可行,并且各有其优缺点,至今还没有发展成统一的、有效的可应用于手写字母识别的模式识别模型。集成神经网络之所以能够成为如今就手写字母识别研究方面研究的核心,是因为其能大幅度地提高系统在泛化方面的能力。
在参考相关文献之后,本文重点研究 BP(Back Propagation)神经网络算法和遗传算法相结合的方式来实现手写字母识别。识别系统有学习与识别两大板块,其中学习部分是由 7 个 BP 神经网络学习训练所组成的,自适应训练是按照选定的参考数值进行训练,计算出输出的误差,再按照输出的误差选择计算局部最优的神经网络算法或者选择全局最优的遗传算法,充分发挥人工神经网络算法局部寻优的计算能力和利用遗传算法全局寻优的计算能力。识别部分包括由特征提取模块和神经网络识别模块构成。字母识别只是通过网络的前馈计算得出最终的识别结果;数字识别是直接网络的前馈计算得到最终的识别结果,没有运用更为复杂的算法。
利用 VC++编程实现遗传神经网络算法并结合对字母识别的实验,手写字母识别测试平均识别正确率为 71.92%,识别结果比较令人满意的。实验结果表明,遗传神经网络既能完成特征提取又能完成分类功能,经过足够多的原始样本训练后的遗传神经网络,其容错性和识别性比较好。
关键词:手写字母识别,BP 神经网络,遗传神经网络
ABSTRACT
Research of pattern recognition has been widely used in text classification, speech recognition, image recognition, video recognition, information retrieval, medical image analysis and data mining etc.. Character recognition is an important content in the research of pattern recognition, the printed character recognition at home and abroad after years of research and have made use of very good results, the production of a number of companies out of the character recognition of appropriate equipment put on the market, has brought great convenience to the text entry. Irregular handwritten character recognition has a large number of random and stroke, is more difficult for handwritten character recognition, handwritten character recognition is also a big challenge to researchers is very exciting, is a research hotspot in recent years. With the introduction of the in-depth study and a large number of technology, researchers handwritten letter recognition proposed many solutions, produced a variety of recognition algorithm. At present, there are a variety of character recognition methods,such as the identification of template method is applicable to printed text; statistical decision method is a statistical classification method of pattern, cannot reflect the fine structure pattern; syntactic structure is pattern recognition using pattern and sub pattern of hierarchical tree structure information completed, anti interference the ability is too weak. All of these methods and the corresponding algorithm, are under certain conditions is feasible, and each has its advantages and disadvantages, still did not develop into a unified, efficient and can be used for the handwritten pattern recognition letters recognition model. Integrated neural networks have become the core now handwritten character recognition research, because it can greatly improve the ability of generalization of the system in the.
On the handwritten letter recognition at present is the use of genetic algorithm,which is also based on the genetic algorithm in order to improve the recognition ability of BP (Back Propagation) neural network algorithm, and this article is through the study of relevant information to analyze the both the effect of use. Recognition system two plate learning and recognition, in which the learning part is composed of 7 BP neural network learning and training the composition, adaptive training is training according to the reference values of selected, calculating the output error, then according to the output error calculation of local optimal neural genetic algorithm network or global optimum, give full play to the role of computing ability of artificial neural algorithm of local search and genetic algorithm for global optimization. Recognition component includes a feature extraction module and recognition module, used to identify the letters just through the network to forward calculation obtains the final recognition results. For the feedforward direct network digital identification calculation to get the final recognition results, without the use of more complex algorithm.
The realization of genetic neural network algorithm and the combination of letter recognition experiment with VC++ programming, handwritten letter recognition test average recognition rate of 71.92%, the recognition results are quite satisfactory. The results show that: there is a direct relationship between recognition and handwritten letter specification, when handwritten letter is standardized, good recognition effect.
Key Words: handwritten letter recognition, numerical optimization of BP neural network, genetic neural network
经过 30 多年的研究,光学字符识别技术使陷入困境的文档数字化迎来了管理上的飞跃。OCR(Optical Character Recognition,光学字符识别)是对报刊、书籍、文稿以及其他印刷品等文本资料经过扫描设备转换为图像,再根据设计好的文字识别算法对图像进行灰度化、二值化处理,然后再提取字符相应特征,取得可被计算机应用软件进行编辑处理的文字信息。在这之后研究人员不断努力,又研究出了基本原理大致相同的图像字符识别技术和智能字符识别技术,简称为 ICR(intelligent character recognition,人工智能文字识别)技术,这一技术应用领域包括气象测预、来自卫星传回图片解释、产品质检、文字识别、声音识别、分析医学检测中的图像、人体指纹的识别等[1]
许多方面,在各行业应用前景广阔,许多研究机构和业界厂商投入了很大的力量来研究这一技术,国外的知名企业有 IBM 公司、东芝公司等,国内如清华紫光、文通等厂商都一直在从事这一技术的研究工作。随着 OCR 技术的发展和成熟,办公文档等印刷品的管理就不再会因数据处理困难而产生困惑了。在企业实现数据资料的信息化管理中,利用 OCR 技术实现办公文档等印刷品的管理可以节省人力物力,减少了大量的成本和损耗。
通过电子计算机这种高科技去自动地识别人们手写的字母,这就是我们所说的手写英文字符识别,同时,它也是上述 OCR 技术的应用之一;目前,手写字母识别存在一个很大的难关:对脱机式手写字母的辨别。近年来通过人们的研究和努力,结合现代计算机技术深入研究了脱机识别手写数字、字母、汉字技术并取得了应用性的成果,推动了文字识别技术的进步和发展。手写字母识别是在手写数字识别研究的基础上被提出并应用于很多地方,在对手写字母识别的研究过程中,研究人员发现了很多对于其今后的发展有利的成果,它能够使手写字母输入在一定的情形下变得可能实现。在模式识别这个研究范围之内,手写体识别是最难以攻克的,但是如果对手写体识别的研究取得了一定的进展,就会促进其发展与效益的增长。
针对手写字母识别这一研究方向,经过多个领域的专家和学者的不断努力,提出了多种解决方法,经过实验和实践取得了各自特定要求下的研究成果。在手写字母识别系统中,特定要求包括手写的正规程度,要求对手写字母的字体有较多限制,最常见的限制是训练样本和测试样本要由同一个人来书写;此外还包括规范化字符书写要求或字符书写位置、选用的笔、选用的纸张都有要求,如识别账表文字就要求字符书写用规定的字型。目前真正的没有限制的手写字母识别还有待进一步的研究和提高。
手写字符识别技术涉及多个学科理论的相关技术,如人工智能、模糊数学、形式语言、数字图像处理和自动机、组合类数学;在理论上有统计理论与信息论;另外与其他方面的学科也有联系,包括语言文字学、心理学以及生物学等,这就说明手写字符识别技术聚集了很多学科的知识[2-5]。模式(Pattern)是指对现实生活中感官感知的外界信息或从生产实践中的直接经验进行归类和抽象后提取出来信息,把同类模式归在一起的集合称为模式类,例如我们知道的文字、图片信息、语言、声音和景物信息等。对模式的研究就是寻找解决某一类问题的方法,而且会得到解决问题的最佳办法。
通过计算机这种工具来实现对事物进行自动辨别,这就是我们所说的模式识别(Pattern Recognition),基于研究的基础上制造出模仿人识别事物的机器系统来自动进行事物分类和事物描述,模仿人对客观事物进行区分并处理各类不同信息。
在二十世纪二十年代,模式识别第一次被人们提出,最初的模式识别仅限于在文字、车牌号、图像等方面进行识别,其主要的职能是使机器能具备自动分类与辨别。而后随着对模式识别深入地认识与研究,发现模式识别同样可以应用到计算机中,由此使得智能系统高速发展。
手写字符识识别是模式识别方法论在对书写的文字符号按相似的程度,正确地归入某一类别。例如,手写字母“G”时,书写字体因人而异会得到多种书写字体,但它们都是同一个字母的不同写法,熟悉英文的人从未见过的某种写法的“G”,也能正确地将其归属于字母“G”类。与上述理论相同,尽管当我们去看一个人时,会因为观看角度的不同就会导致看到的效果不同,然而我们仅需要知道人的身份,就可以把观看到的所有统称为这个人的脸部特征。研究过程中用特定的符号给每个类命名,模式识别就可以看成是用符号来表示采集到对象的时间和空间分布的信息。
模式是对客观各类事物分类、抽象,并对其重要的属性进行抽取,加以结构的描述或者定量描述所生成的表达式。是我们从观测事物是否相同或是否相似所获得的时间分布信息和空间分布信息的集合[6]。采用计算机等机器代替人或动物进行模式识别,信息要经过取样和量化之后输入计算机,在计算机内用向量(即数组)来表示模式,用数组中元素来表示时空分布的信息,达到标识客观对象的目的。在模式识别领域中,模式的数字特征可用矢量形式描述,也可以使用句法结构表示成字符串,也可用图、语义网络、框架结构等描述。
手写字母识别系统功能实现:
手写字母识别系统开发
二值化后的图片
锐化后与去噪后的图片
锐化后的图片
BP 网络训练结果
数字型字符识别
英文大写字母识别
英文小写字母识别
目 录
第一章 绪 论
1.1 引言
1.2 模式和模式识别
1.2.1 模式
1.2.2 模式的描述方法
1.2.3 模式识别系统
1.2.4 模式识别的应用
1.3 图像模式识别
1.3.1 图像模式识别原理
1.3.2 图像模式识别过程
1.3.3 图像模式识别方法
1.3.4 图像识别的应用
1.4 手写字母识别
1.4.1 手写文字识别简介
1.4.2 手写文字识别系统
1.4.3 手写字母识别的方法
1.4.4 手写字母识别研究的目标和意义
1.4.5 手写字母识别研究的现状
1.5 研究内容
第二章 遗传神经网络算法研究
2.1 遗传算法
2.1.1 遗传算法的基本原理
2.1.2 遗传算法特点
2.2 人工神经网络
2.2.1 BP 神经网络组成
2.2.2 BP 神经网络的基本原理
2.2.3 BP 神经网络算法
2.3 本章小结
第三章 手写字母识别系统设计
3.1 系统总体结构设计
3.2 系统工作流程设计
3.3 手写字母图像的预处理模块设计
3.3.1 二值化处理
3.3.2 平滑去噪
3.3.4 字符分割
3.3.5 图像的归一化
3.3.6 书写的倾斜矫正
3.3.7 图像的重新排列
3.3.8 图像的细化
3.4 手写体字母的特征提取方案
3.4.1 实验数据特征集
3.4.2 提取压缩特征
3.4.3 傅里叶变换特征的提取
3.4.4 提取特征边缘
3.4.5 基元特征的提取
3.4.6 提取矩特征
3.5 手写体字母的特征提取设计
3.5.1 确定分类器设计中的参数
3.5.2 特征提取设计
3.5.3 特征选择设计
3.5.4 优化特征空间设计
3.5.5 判别函数设计
3.6 本章小结
第四章 训练与识别设计
4.1 遗传神经网络结构设计
4.2 训练模块设计
4.2.1 训练集设计
4.2.2 测试集设计
4.2.3 评价原则设计
4.2.4 训练算法设计
4.3 识别模块设计
4.4 本章总结
第五章 手写体字母识别系统的实现
5.1 构造位图处理类
5.1.1 位图基本格式
5.1.2 WinSDK 中的 BMP 相关函数
5.1.3 构造 CDib 类
5.2 图像预处理实现
5.2.1 派生 Mydiblib 类
5.2.2 图像二值化的算法实现
5.2.3 图像锐化和去噪的实现
5.2.4 图像细化的实现
5.2.5 图像特征提取实现
5.3 训练的实现
5.3.1 BpNet 类的定义
5.3.2 训练算法实现
5.3.3 训练实验结果
5.4 字符识别的实现
5.4.1 字母图像的绘制
5.4.2 手字母识别实验结果
5.5 手字母识别系统的识别率分析
5.6 本章总结
第六章 总结
致谢
参考文献
(如您需要查看本篇毕业设计全文,请您联系客服索取)