1. 研究目的与意义
随着信息技术的发展,机器学习及人工智能的应用需求越来越广泛。数字识别作为模式识别领域的传统课题,是多数模式识别课题都会遇得到基本问题。而手写数字识别在报表,账单,支票,邮政编码等许多应用场合中,还难以完全被印刷体替代而且要求对其很高的识别率,因此研究手写数字识别具有重要的现实意义。
2. 研究内容和预期目标
要求根据mnist数据集中的六万张有标注的手写数字图像文件(训练样本)编写有监督学习算法,实现手写数字文件的自动识别。并且努力提高数字识别的精确度。
主要内容包括:
实现单个手写数字的鲁棒识别计算相应算法的准确率、查全率、查准率、f1等性能指标,并对不同方法进行评价分析;
3. 研究的方法与步骤
首先选择几种典型的有监督学习算法(如随即森林、神经网路、支持向量机等)实现单个手写数字的鲁棒识别,用Python或Matlab或Java等高级语言编程实现;其次计算相应算法的准确率、查全率、查准率、F1等性能指标,然后对不同方法进行评价分析;最后,进行模型推广,实现多个手写数字的鲁棒识别。
4. 参考文献
[1]周志华,机器学习,北京:清华大学出版社,2016年1月
[2]robert tibshirani, jerome friedman著,范明,柴玉梅,咎红英等译,统计学习基础-数据挖掘、推理与预测,北京:电子工业出版社,2004
[3]华校专、王正林,python大战机器学习-数据科学家的第一个小目标,北京:电子工业出版社,2017年3月
5. 计划与进度安排
(1)2022年11月 -- 2022年12月30日,与辅导老师见面,领取任务书
(2)2022年2月25日 -- 2022年3月10日,完成开题报告书
(3)2022年3月11日 -- 2022年4月 1日,收集资料,开展研究,形成写作初稿
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。