1. 研究目的与意义(文献综述)
2012年,微软首席科学家邓力和俞栋将前馈神经网络ffdnn(feed forward deep neural network)引入到声学模型建模中,将之前使用gmm计算的输出概率替换为ffdnn的输出概率,引领了dnn-hmm混合系统的风潮。
2017年, google以机器学习为背景的语音识别系统已经获得英文领域95%的字准确率,此结果逼近人类语音识别的准确率。从近几年google在各类会议上的文章可以看出,google尝试采用多种方法将deep cnn模型融合,如batch normalization (bn),network-in-network(nin),convolutional lstm (convlstm)方法的融合。
2018年,科大讯飞提出深度全序列卷积神经网络(dfcnn),dfcnn 使用大量的卷积直接对整句语音信号进行建模,主要借鉴了图像识别的网络配置,每个卷积层使用小卷积核,并在多个卷积层之后再加上池化层,通过累积非常多卷积池化层对,从而可以看到更多的历史信息。
2. 研究的基本内容与方案
2.1研究的基本内容
(1)分析今年来几种主流的语音识别模型的模型构成、技术原理
3. 研究计划与安排
序号 | 日期 | 任务 |
1 | 2020/1/13-2020/2/28 | 阅读参考文献,了解相关概念、原理及方法; 结合论文题目进行需求分析,形成思想路线,撰写开题报告。 |
2 | 2020/3/1-2020/4/30 | 学习语音识别技术所涉及到的各个步骤及相应的算法并实现和比较,研究它们的优缺点。 |
3 | 2020/5/1-2020/5/25 | 撰写和修改毕业论文。 |
4 | 2020/5/26-2020/6/6 | 准备答辩所需材料,进行论文答辩。 |
4. 参考文献(12篇以上)
1. 戴礼荣, 张仕良, 黄智颖. 基于深度学习的语音识别技术现状与展望[j]. 数据采集与处理, 2017(2).
2. 王山海, 景新幸, 杨海燕. 基于深度学习神经网络的孤立词语音识别的研究[j]. 计算机应用研究, 2015(08):55-57 64.
3. 马畅骏. 语音识别技术在智能家居中的应用现状浅析[j]. 科技传播, 2018(2).
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。