1. 研究目的与意义
内容 数字验证码主要是通过验证码中的字符变化、噪声干扰、颜色变化等技术,增强验证码的健壮性,从而使其不易被计算机程序自动识别。
论文主要研究验证码反向识别的主要方法以及系统实现,对所生成的验证码按照去噪二值化切分识别的流程实现数字验证码的识别过程。
识别过程中所用到的样本集,主要是通过代码运行生成的验证码,有手动编写验证码、使用captcha库生成的验证码两种类型,代表当前市场上广泛应用的验证码类型。
2. 文献综述
1、前言验证码(captcha),也称为全自动区分计算机和人类的图灵测试,是目前大多数网站所使用的通行方式。
一般验证码测试是判断访问网站的用户输入一张扭曲变形(夹杂噪声)的图片中所蕴藏信息(数字、字母或公式等)的正确性。
这种被人们称为反向图灵测试的captcha中对图像进行复杂处理,是为了避免光学字符识别(简称为ocr)一类电脑程序进行自动识别所包含的信息而破坏网站的安全,在医疗、军事、教育、金融等较敏感领域有较为广泛的应用,其核心即验证码的识别。
3. 设计方案和技术路线
设计方案验证码识别系统设计主要是包括验证码生成模块和验证码识别模块两部分。
其中验证码识别模块分为验证码图片的信息生成与信息存储,验证码识别模块分为图片去噪、二值化、分割、与识别四部分。
整个系统识别过程是通过程序验证码的获取去噪图像的灰度化处理图像分割识别。
4. 工作计划
2022年2月16日2022年3月1日:查阅并收集相关的资料,撰写论文提纲;2022年3月2日2022年3月10日:进行需求分析,撰写论文相应写需求部分;2022年3月11日2022年3月20日:进行概要设计,撰写论文相应设计部分内容;2022年3月21日2022年4月1日:完成数据库搭建;2022年4月2日2022年4月10日:对系统的界面进行构思,完成系统界面的制作;2022年4月11日2022年4月30日:完成业务逻辑层的实现;2022年5月1日2022年5月20日:完成论文初稿,再进行系统集成和测试;2022年5月21日2022年6月1日:对论文进行修改完善并最终定稿,预答辩
5. 难点与创新点
1、内容创新选择日常生活中常见的验证码作为研究对象,一方面巧妙避免了对研究内容的陌生迷茫,另一方面对常用的这一验证工具本身的神秘性产生极大探求兴趣,由此在接下来的实践中可以达到持久的高效率状态。
2、形式创新了解生成验证码的方法来了解反向识别的具体过程,一正一反更深入理解理论原理;其次,学习如何通过优化算法来对图像的高效精确处理;最后采用系统形式来展现验证码的识别的过程。
3、数据准备创新在整个过程中所用得到的数据(即验证码图片),是通过编写的程序来自动生成,并且通过在生成时保存验证码的内容可以检测识别结果的准确性,以此作为算法的最终测评标准,提高正确率与可信度。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。