1. 研究目的与意义
近年来,随着互联网电商平台的快速发展,网络消费成了物流行业的主要推动力,促进了物流行业的快速发展。根据统计数据,“十二五期间”,国内快递业务量连续5年保持50%左右的高速增长,短时期内完成从小到大的历史性跨越。2014年,全国快递业务总量达到139.6亿件,已跃居世界第一。国家邮政局发布的《邮政业发展“十三五”规划》预计,2020年快递业务量将达到700亿,业务收入接近8000亿元。2018-2020快递业务量复合增长率为19.5%,业务收入复合增长率为15.4%,不断增长的业务量将给末端带来了极大的配送压力。数据显示,我国劳动年龄人口数量连续五年下降,潜在从业人员持续减少。物流从业人员中,快递员人数超过50%,最近几年已出现的快递员供给不足现象,在未来很长的一段时间将更加严重。劳动人口增速为负,快递从业人员缺口大,未来三年,全国快递日均配送量将由1.14亿件上升至2亿件,按照目前的配送效率计算,三年后快递员的缺口将在100万人左右。目前仅少数大型分拣中心利用条码扫描实现自动化分拣,但国内仍有大多数的中小型分拣中心依然依靠人工人工录入地址信息与条码对应的方式配合信息管理系统进行分拣,给快递业务全面实现自动化带来了阻碍。尤其在双“11”时期快递爆仓,时常出现暴力分拣的情况。对于快递公司而言,由于分拣任务量大,招聘拣员困难。这些问题的主要原因就是快递业务没有统一整合信息数据实现信息化管理,使得人工成本和工作效率的能耗居高不下。因此,近几年自动化程度高、高效率适于国内中小型快递企业自动分拣系统成为研究热点。美国和日本发展快递自动识别系统已经有数十年,对于快递单据录入环节的研究,由于美日两国的文字以及书写习惯的差异,与手写中文字体的识别难度存在很大不同。由于当时的电脑运算能力有限,在硬件方面受到极大地限制,快递分拣系统仅可实现对快递单据上面的区号识别,进而将分拣机推向商品化。随着国内互联网电商平台的不断发展发展,分拣需求日益增加,国内也对分拣系统展开了深入的研究。最初国内的物流行业使用手写普通快递单。由于手写体汉字的形态各异,千变万化使得脱机手写体汉字相当困难,需要通过采集大量文字样本信息进行训练,特征提取和存储。因此一直制约着物流自动分拣系统的发展。但随着深度学习、神经网络算法等技术的发展,快递单据自动识别算法的识别率大幅提高,使得手写文字识别发展相对成熟。2016 年,刘经拓设计了一种条形码识别的装置,通过识别条形码下方字符的方式识别条形码,避免了条形码宽度计算方法需要严格要求图像质量的限制,对于图像采集质量不佳的情况提高了条形码识别的识别率[1]。同年,王昆等人设计了一套基于条形码识别技术自动控制系统,可自动识别出顺丰单据上 Code128-C 编码的运单号码,进而尝试实现自动分拣[2]。目前,国内仅少数快递公司的大型运转中心采用全自动化分拣,需要人工逐一分辨,导致快递业务仍处于半自动化状态,尤其在中小型物流分拣中心,目前仍靠人工录入地址信息、扫描进行分拣。基于上述背景,本课题主要研究基于机器视觉的自动化识别,提高效率,实现自动化,相信对快递物流行业提高有一个重要有利支撑。对企业来说能够更好地节约人力和成本,提高快递行业工作效率,解决用工荒的问题,对个人来说,也能享受机器化自动识别分拣的益处,更快更好地拿到自己的快递。
2. 研究内容和预期目标
研究内容:
为实现快递包裹根据系统自动识别到的地址信息进行分拣,研究内容主要有:
(1)获得高质量快递单图像,对图像进行初步的图像预处理,消除文本定位之前的干扰信息,并且对图像进行位置矫正,避免图像倾斜。
3. 研究的方法与步骤
在获得图像系统采集到的图像后,首先将采集到的快递单据图像通过 otsu 算法进行二值化,然后利用 radon 变换算子纠正倾斜的快递单据图,并通过 canny 边缘检测算子将图像中的快递单据图像提取出来,随后对快递单据进行版面分析[3-4],接着用空间投影法对图像进行初步分割,然后利用归一化积相关系数匹配法来完成条形码区域的定位,最后对条形码进行识别,完成快递单的检测与识别。
首先,要做的是对快递单图像的二值化处理,这一步骤主要在matlab环境下进行, 通过利用matlab软件中的灰度图像二值化变换函数来对快递单图像进行二值化处理,并输出处理后的二值化图像供后续过程使用。
第二,在文本图像扫描输入的过程中,扫描图像或多或少会出现某种程度的倾斜,图像倾斜会给以后的检测识别带来困难。为了避免这样的情况,可以通过软件方法对图像进行矫正,采用radon变换的方法[5]对倾斜角的检测正是文本图像倾斜校正的关键。
4. 参考文献
[1] 刘经拓. 一种条形码识别方法和装置, cn102799850b[p]. 2016.
[2] 王昆,刘晓山. 基于条形码识别的物流包裹自动分拣系统设计[j].洛阳理工学院学报(自然科学版), 2016, 26(2):66-70.
[3]魏传义,陈勤,张旻. 基于投影的文本图像版面分割算法研究[j].现代计算机, 2016(10):33-38.
5. 计划与进度安排
(1)2月24日— 3月8日:收集资料,了解课题,制定课题总体研究方案,完成开题报告。
(3)3月21日~4月30日:(2)3月9日— 3月16日:熟悉并掌握图像二值化,了解otsu法(最大类间方差法)相关内容,灰度直方图等内容。查阅资料熟悉matlab使用方法,了解该环境下的课题中使用到的基本图像处理算法。
(3)3月17日— 4月13日:编写课题中需要的matlab程序,实现相应的图像处理结果,
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。