面向边缘计算的轻量级自然场景文字识别模型研究开题报告

 2021-12-20 20:42:55

全文总字数:4877字

1. 研究目的与意义(文献综述)

研究目的在于实践验证自然场景文字检测和识别模型在嵌入式系统使用的可行性。结合现有的轻量级神经网络模型和端到端自然场景文字检测识别模型,在不失准确性的前提下,在嵌入式系统实现实时文字检测和识别。

研究的意义在于解决自然场景文字检测识别在嵌入式系统的部署,在现实生活中充分发挥已有模型结构的优势。近年来,国内外许多学者都在自然场景文字检测识别领域提出了自己的见解,同时实现了许多高准确率的模型。通常在文字检测部分,他们都会首先应用一个Backbone网络,用于学习图像整体的颜色、纹理等特征。如Liao et al.[3]和Busta et al.[6]用到了VGG16,Lyu et al.[4]和Liu et al.[9]用到了ResNet-50[10]。这些网络结构的应用使得整体模型的参数体量变得非常庞大,对运行系统的算力要求也极度提高。相信轻量级神经网络模型,如MobileNet[7]、ShuffleNet[8]等的应用可以极大程度上帮助自然场景文字检测识别走出实验室,真正进入人们的生活。

2. 研究的基本内容与方案

(1) 轻量级模型方案

端到端文字检测识别模型的特点之一就是可以共享feature map,这一特点使得文字检测工作几乎是无消耗的。feature map的获取可以使用mobilenet或shufflenet的思路,在[8][7]中,作者分别都在imagenet和ms coco目标检测任务中验证了他们模型的可行性。所以有理由相信,对他们模型进行一定修改(如去除最后的fc层,减小stride以获得大尺寸featuremap)后是可以在文字检测识别模型中代替一般backbone网络的功能,大幅降低模型整体计算量。

(2) roi预测方案

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1) 2020/1/13—2020/2/28:明确选题,查阅相关文献,外文翻译和撰写开题报告;

(2) 2020/3/1—2020/4/30:系统架构,系统设计与开发(或算法研究与设计)、系统测试、分析、比较与完善;

(3) 2020/5/1—2020/5/25:撰写论文初稿;修改论文,定稿并提交论文评审;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 张平. 基于深度学习的自然场景文本定位与识别研究[d]. 西安电子科技大学, 2018.

[2] 谢锋明. 自然场景文字检测与识别的研究[d]. 上海交通大学, 2018.

[3] liaom, shi b, bai x, et al. textboxes: a fast text detector with a single deepneural network[c]//thirty-first aaai conference on artificial intelligence.2017.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。