1. 研究目的与意义(文献综述)
随着计算机技术和信号处理理论的发展,如何利用计算机对图像、信号进行类似于人类视觉感知机理的信息处理,通过机器学习模型和大量训练数据,学习更有用的特征,提升计算机对复杂图像的分类和识别的准确性,成为当前模式识别领域和机器学习领域的一个热门的研究问题。近年来深度学习理论和信号的稀疏表示方法受到了广泛关注,深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。稀疏表示是传统信号表示方法(如傅里叶变换、小波变换等)的扩展。在过去的几年里稀疏表示已经成功应用于图像处理、模式识别等领域。
目前国内外对深度学习的研究应用发展很快。2014年香港中文大学deepid项目采用基于卷积神经网络的学习方法,在户外人脸识别(labeledfacesinthewild,lfw)数据库上的人脸识别正确率达97.45%,略低于人类识别正确率97.5%。facebook的deepface项目在户外人脸识别数据库上的人脸识别的正确率达到97.35%。之后,香港中文大学的deepid2项目将识别率提高到了99.15%,超过目前所有领先的深度学习和非深度学习算法在lfw数据库上的识别率以及人类在该数据库的识别率。可见深度学习算法在复杂图像识别中的应用,尤其是大规模数据集下的应用取得突破性的进展。稀疏表示以其鲁棒性好、泛化能力和抗干扰能力强等优势,成为近年来图像处理领域研究的热点。近年来借助于机器学习技术,稀疏表示不仅在图像降噪、修复及超分辨率处理等经典低层图像处理问题上表现出了良好的性能,在很多模式识别问题上也表现出优越的性能。将稀疏表示引入到图像分类中它能表示出图像的本质特征、提高分类的准确率,同时用少量样本来表示原始图像,大大减少了计算量。
研究表明,单一的深度学习方法在图像分类和识别中往往不能带来最好的效果,通常融合其他方法或多种方法,能带来更高的精确率。因此基于深度学习和稀疏表示的图像分类与识别的研究应运而生,根据深度学习理论建立多隐层稀疏自编码器模型,先通过无监督学习逐层初始化参数,再进行有监督的学习去微调整个网络,最后再附加上一个线性分类器,对测试的样本集进行分类和识别,最终提升分类和预测的准确性,具有极大的研究价值和广阔的应用前景。
2. 研究的基本内容与方案
2.1研究的基本内容
(1)稀疏自编码器
目前主流的无监督学习模型是稀疏自编码器,它包含输入层、隐藏层和输出层。稀疏自编码器先对输入数据进行编码,同时给隐藏层加入稀疏性限制,以获得数据的稀疏表征;然后解码隐藏层表征并重构输入,使输出尽可能等于输入,其重构误差最小。
3. 研究计划与安排
1~3周:相关文献资料,明确研究方向,确定研究内容,完成开题报告;
4~6周:掌握深度学习及稀疏表示的原理及特点;
7~9周:采用稀疏表示对图像进行特征描述,基于深度学习对图像进行分类和识别;
4. 参考文献(12篇以上)
[1]rafaelc.gonzalez,richarde.woods著,阮秋琦等译,数字图像处理(第二版,北京:电子工业出版社,2007.
[2]suny,wangx,tangx.deeplearningfacerepresentationfrompredicting10,000classes[c]//proceedingsoftheieeeconferenceoncomputervisionandpatternrecognition.2014:1891-1898.
[3]suny,cheny,wangx,etal.deeplearningfacerepresentationbyjointidentification-verification[c]//advancesinneuralinformationprocessingsystems.2014:1988-1996.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。