1. 研究目的与意义、国内外研究现状(文献综述)
近年来,随着互联网的使用人数呈逐年递增的趋势,世界各国人民的日常生活也越来越离不开互联网这一工具。
目前我们正处在数据信息时代,人们往往需要从众多信息中找寻并处理对自己有用处的数据,加之新一轮科技革命和产业变革的深入发展,如何通过人工智能技术并利用互联网这个平台来代替我们处理数据成为了一个需要探索与开发的课题。
为此,在2016年8月,国务院就在《“十三五”国家科技创新规划》中提出:要将人工智能作为新一代信息技术发展的主要方向。
2. 研究的基本内容和问题
研究内容:
本课题根据手写数学计算式符号的特点,结合深度学习的理论知识,同时考虑目前有关公式识别算法存在的局限性,在python环境下着手研究以下内容:
(1)图像预处理方式的选择,以减少图像的噪声,便于后续识别;
3. 研究的方法与方案
(1)从网络上收集多种手写数字、手写字符图像,组成训练和测试的数据集,用于训练模型以及评测模型。
(2)通过图像处理方式(如灰度化、二值化、字符切割等)对手写图像进行预处理,主要目的是把图片中的字符切割出来,同时避免无关变量对字符识别的影响。
(3)获得单个的数字、字符、公式符号后,使用深度学习方法,训练一个卷积神经网络,对字符和公式符号进行识别和分类,获取其语义信息。
4. 研究创新点
[1]彭玉南. 多特征融合的数学公式字符识别技术研究[d].华中师范大学,2016.
[2]张文君. 基于编码器—解码器的联机手写数学公式识别方法研究[d].华中师范大学,2019.
[3]王琳琳. 基于bpl数据增强的手写公式识别[d].哈尔滨工业大学,2018.
5. 研究计划与进展
(1)2021年2月18日—2021年3月7日:阅读相关文献,熟悉课题内容,制定毕业设计方案,并撰写毕业设计开题报告。
(2)2021年3月7日—2021年3月14日:查阅资料熟悉python操作方法,了解该环境下可使用到的算法资源库。
(3)2021年3月15日—2021年3月21日:寻找合适的数据集,制作展示界面。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。