全文总字数:2614字
1. 研究目的与意义
研究目的及意义
传统文字输入方法是基于键盘输入的,这种方法虽然简单便捷,但输入效率低下,难以应付当前海量的信息输入。目前,光学字符识别技术是汉字识别的一大主流技术,它成功地将纸面文字转换成计算机可识别的文字并可以对其进行编码和进一步处理。这种技术已经广泛地应用于各种领域,如中文资料库的建立,大型商场商品的信息录入,邮电部门邮件地址的自动识别,银行支票金额的自动识别,将ocr系统和语言合成系统结合起来,可以应用到自动阅读机和盲人阅读机中去。
模式识别信息熵理论告诉我们,只要我们能从字符图像中提取与字符类别密切相关的字符特征,使此字符特征与字符类别有充分高的互信息熵,就可能获得足够高识别性能的识别系统。从而我们可以选取那些互信息熵,就可能获得足够高识别性能的识别系统。从而我们可以选取那些互信息熵较高的特征,来获得较高质量的汉字识别率,因此,为了提高光学识别技术水平,研究手写体识别具有很重要的意义。
2. 国内外研究现状分析
早期的模式识别研究着重在数学方法上。20世纪50年代末,f.罗森布拉特提出了一种简化的模拟人脑进行识别的数学模型感知器,初步实现了通过给定类别的各个样本对识别系统进行训练,使系统在学习完毕后具有对其他未知类别的模式进行正确分类的能力。1957年,周绍康提出用统计决策理论方法求解模式识别问题,促进了从50年代末开始的模式识别研究工作的迅速发展。1962年,r.纳拉西曼提出了一种基于基元关系的句法识别方法。付京孙在笮的理论及应用两方^行了系统的卓有成效的研究,并于1974年出版了一本专著《句法模式识别及其应用》。1982年和1984年,j.荷甫菲尔德发表了两篇重要论文,深刻揭示出人工神经元,网路所具有的联想存储和计算能力,进一步推动了模式识别的研究工作,短短几年在很多应用方面就取得了显著成果,从而形成了模式识别的人工神经元网络方法的新的学科方向。
模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别,称为模式信息。模式识别所分类的类别数目由特定的识别问题决定。有时,开始时无法得知实际的类别数,需要识别系统反复观测被识别对象以后确定。模式识别与统计学、心理学、语言学`计算机科学 、生物学、控制论等都有关系。它与 人工智能 、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。
上世纪八十年代,顾小凤先生进入文字识别研究领域,在北大率领课题组开展脱机手写体汉字识别技术的研究,1990年成果通过当时机电部组织的鉴定,技术水平居国内领先地位。同年顾小凤先生率领课题组开展联机手写体汉字识别技术的研究,此后承担了863项目联机手写汉字识别技术的研究,并在后来的评测中获得好成绩。1995年,联机手写汉字识别技术研制成功并向市场推出了联机手写汉字识别产品--方正如意笔,该产品的部分技术在当时居国内领先水平。遗憾的是,联机手写识别技术的研究和方正如意笔这款产品由于种种原因,随着顾小凤先生的离休而未能继续,这也成为顾小凤先生始终留存心底的一个遗憾。
3. 研究的基本内容与计划
2月1 日~ 3月1日:资料查阅,阅读文献。
3月2日~4月2日:算法分析与设计,完成各个算法的程序代码。
4月3日~5月3日:实验比较分析
4. 研究创新点
对已有算法实现、新算法的提出,以及两者的比对。算法的比对要求在图像数据集上进行,典型的图像集包括人脸,手写体,地形图像等。所得的结论应基于具体、明确的实验结果的分析和验证。实验的结果应由图形和表相结合的形式呈现,验证应包括精度,计算代价,参数分析等.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。