1. 研究目的与意义
在信息化程度不断提高的现在,尤其是移动设备的普及程度爆炸式的增长,许多信息的承载形式都从纸质向电子转移。
电子文档转化为纸质文档可以通过打印机进行,但是纸质文档电子化却必须需要人员手动进行,操作机械且乏味。
现有的市面上的表单同步技术大多依赖于智能笔或者预先的配置,这些衍生产品不够便捷,且需要搭配设备和定制化的纸质表单才能进行,便捷度提升了部分但是成本也因此变得更高。
2. 课题关键问题和重难点
根据输入输出设计以及技术实现,总结出若干关键问题:(1)表单识别:表单的识别依赖ocr,调度市面上的ocr势必会得到不同的解析结果,对每一种解析都要设计其方案。
如果要自主实现ocr,将面临极高的开发成本和大量的样本分析、机器学习过程。
(2)算法设计优化:ocr的识别精度会直接影响到表单生成的准确度,如何对解析结果和解析过程的算法进行设计和优化将会是此课题的主攻方向。
3. 国内外研究现状(文献综述)
相关文献均提供了设计文字识别ocr的抽象流程。
归纳后得到如下:图像采集、图像灰度处理、图像二值化处理、透视变换图像校正再进行ocr处理...ocr内步骤如下。
[1] 服务器在接收到用户的发出的照片请求后,首先对图片进行灰度转化,将彩色的图像进行灰度处理,对每个像素点进行颜色的rgb值(0~255之间)的转换,同时对转化后的rgb值的三个分量进行yuv颜色模型求解,再全部储存在对应的矩阵中。
4. 研究方案
设计方案按照调研结果参考,可行性高而且有案例可循,经过多种文献比对,得到了大体接近的结果。
以此为核心进行市场为导向的拓展设计,专注于考虑系统的完备。
且现有行业上的辅助技术较为成熟,只要具备开发素养实现效率较高。
5. 工作计划
第一阶段 准备阶段2022年12月10日前 完成符合专业的选题,并与指导老师沟通,然后确定选题后提交毕设统。
2022年12月17日前 完成课题分配。
2022年1月7日前 完成下达的任务书。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。