基于CNN的场景图像数值提取系统的研发开题报告

 2022-01-11 19:04:33

全文总字数:5003字

1. 研究目的与意义(文献综述)

现今,人们在网络交流时,图像和音频,文字一样频繁出现。如何从图片中提取到人们所需要的信息,这个问题已经被人们所关注。然而对于机器而言,图像只是一堆数据而已,如何让机器识别出图像中的文本,得益于人工智能,这个问题得到了解决。

机器学习的研究由于大数据以及计算性能提升重新变得火热起来。2006年,加拿大多伦多大学教授杰弗里·辛顿以及他的学生鲁斯兰·萨拉赫丁诺夫正式提出了深度学习的概念。2012年,杰弗里·辛顿领导的小组采用深度学习模型alexnet,在imagenet图像识别比赛中一举夺冠。2014年,facebook基于深度学习技术的deepface项目,在人脸识别方面的准确率已经能达到97%以上,跟人类识别的准确率几乎没有差别。深度学习也已经广泛引用到了图像文本提取中。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

本文研究的主要目标为:识别图像中的数据并按照设备分类,之后保存为txt/csv文件。

本文研究的基本内容为:

(1)在学习图像处理、机器学习及深度学习知识基础上,对所给定的图像进行分析,确定适合的信息分类及场景。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1)2020/1/13—2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;

(2)2020/3/1—2020/3/31:确定设计方案,配置环境,实现对图像文字提取的原型,并进一步开发;

(3) 2020/4/1—2020/4/30:完成程序设计与开发、系统测试,并进一步完善整个系统;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]卢未来. 面向图像的场景文字识别技术研究[d].辽宁工业大学,2018.

[2]万萌. 基于深度学习的自然场景文字检测与识别方法研究[d].广东工业大学,2019.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。