1. 研究目的与意义
人们的情感,一般都可以通过语音的变化来识别。
语音情感识别在信号处理和人工智能等领域具有重要意义。
而且,如果在信息科学世界中考虑了信号中的情感信息,相应的就可以增加人工智能的智能化、拟人化,尽可能的消除人和机器之间的障碍。
2. 课题关键问题和重难点
1.在实现参数分析方法软件部分中遇到了较大的问题,由于对gmm方法的不熟练,从而对参数分析方法的学习有较大的困难,在老师的帮助以及查阅相关资料后解决了这一问题2.在实验应用中,往往得不到大量充分的训练数据对模型参数进行训练。
由于训练数据的不充分,gmm模型的协方差矩阵的一些分量可能会很小,这些很小的值对模型参数的似然度函数影响很大,严重影响系统的性能。
为了避免小的值对系统性能的影响,一种方法是在em算法的迭代计算中,对协方差的值设置一个门限值,在训练过程中令协方差的值不小于设定的门限值,否则用设置的门限值代替。
3. 国内外研究现状(文献综述)
gmm是目前为止相比较而言比较流行的一种模型,而且属于参数法概率密度函数估计。
gmm在模式识别、数据深挖、分析计算等领域都被长时间使用。
gmm的模型[4]混合高斯分布模型是只有一个状态的模型,在这个状态里具有多个高斯分布函数。
4. 研究方案
本课题将会基于高斯混合模型的说话人情绪识别方法的研究,并对这个模型进行分析。
1、建立语音情感数据库情感语音库是情绪识别研究的基础,一个完备的、规模合理的、反映真实情感的语音数据库,对日后的研究具有非常重要的意义。
目前国际上已知的可以为情感研究所使用的数据库较少。
5. 工作计划
2022-2022-1学期:第15-16周:完成选题,查阅相关中英文资料,进行相关技术的学习;第17周:与导师沟通进行课题总体规划;第18周:导师下发毕业设计(论文)任务书,学生根据导师的要求进行外文翻译,列出开题报告大纲;第19周:搭建开发环境,撰写开题报告。
2022-2022-2学期:第1-2周:进行课题的需求分析,提交开题报告;第3-4周:根据需求分析设计并建立数据库;第5-6周:完成基于高斯混合模型的说话人情绪识别方法的相关学习;第7-8周:对基于高斯混合模型的说话人情绪识别方法的调试与功能实现;提交毕业设计论文提纲给指导老师审阅;第9-11周:完成基于高斯混合模型的说话人情绪识别功能测试;完成毕业论文初稿;第12周:在教师的指导下对撰写的论文进行修改,提交论文终稿及合格的论文检测报告、毕业设计(论文)资料装袋;第13-14周:筹备毕业答辩相关事宜,制作参加毕业答辩的演示课件。
参加毕业答辩,并提交全部文档和成果材料。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。