1. 研究目的与意义
图像识别是从给定图像中提取有意义的信息(例如图像内容)的过程。
在图像识别中, 必须对给定图像中的主要内容进行分类, 因此它不涉及确定所识别内容的位置和姿势。
术语图像识别是为借助算法和机器学习概念识别某些动物, 物体, 人或其他目标对象的计算机技术引入的。
2. 课题关键问题和重难点
课题需要完成两个基本内容:1、图像识别问题,包括对象识别、主题识别等识别问题,并能够理解识别问题的基本方法,有哪些因素造成困难的问题;2、Pytorch工具的使用,理解框架的基本原理和开发方法,并能运用框架表达图像识别模型、学习和测试要求成果和相应的技术指标:1、针对选定的具体图像识别问题,确定使用的数据集,采用的识别模型;2、分析给定数据集识别问题的特点,确定和比较相关的识别模型,并给出采用某个模型的原因分析。
3、对比不同模型识别的质量区别,给出分析的原因4、完成识别系统的构建和原型展示课题采用的基础材料:https://pytorch.org/的官方网站,内容包括框架的原理,示例和识别问题的实现方法,包括数据集
3. 国内外研究现状(文献综述)
早期的传统图像识别主要是人工进行图像预处理从而获取图像底层特征,然后进行特征描述最后通过模式匹配来识别。
lowe d.g于1999年提出sift即尺度不变特征变换(scale-invariant feature transform)算法来生成特征向量描述,并于2004年完善总结。
但由于本身的高复杂度导致出现特征检测和匹配速度慢的问题。
4. 研究方案
本课题要求开发一个基于Pytorch的图像识别处理系统,采用Pytorch框架工具,针对具体的图像识别问题,如手写数字识别问题,确定数据集,利用Pytorch框架搭建一个简单的手写数字识别模型、学习和测试。
对比各个模型识别的质量区别,给出分析的原因,最终完成识别系统的构建和原型展示。
5. 工作计划
准备工作:(1)文档3000汉字的英文翻译并附原文;开题报告一份,总字数不少于3000汉字;毕业设计报告(论文)一份,字数不少于10000汉字,符合规范化格式要求。
(2)实物成果1、针对选定的具体图像识别问题,确定使用的数据集,采用的识别模型;2、分析给定数据集识别问题的特点,确定和比较相关的识别模型,并给出采用某个模型的原因分析。
3、对比不同模型识别的质量区别,给出分析的原因4、完成识别系统的构建和原型展示第1周:接受任务书,完成识别问题的理解,按要求查找相关资料;第2周:阅读相关资料,理解识别方法;第3周:翻译相关英文资料,提出拟完成本课题的方案,写出相关开题报告一份;第4-5周:学习使用pytorch框架工具;第6-7周:完成模型选择;第8-9周:实现、学习和测试;第10周:进行各个模型的对比分析,判断;第11周:进行毕业设计说明书写作,接收验收成果,接受答辩资格审查;第12周:评阅教师评阅论文;第13周:准备参加答辩。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。