1. 研究目的与意义
音事件识别作为智能语音信号处理的核心技术,其算法处于信号处理的前端,能够让人识别出当前的听觉场景,自适应地调用相应的处理程序,实现针对不同场景声信号的个性化处理。
本质上讲,说话人情绪识别属于环境声识别问题,主要包括两个方面:特征提取和分类。
特征提取是对声信号进行维数约减,提取出能代表原始信号的数据;而分类是指通过一定方法编码声特征,并与模板数据库进行比对以确定声信号所属类别。
2. 课题关键问题和重难点
1.语音信号的端点检测与特征提取。
这是语音识别的预处理过程,是语音识别系统前端处理中两个关键的组成部分。
它们设计的好坏在很大程度上决定一个语音识别系统的性能好坏。
3. 国内外研究现状(文献综述)
三、文献综述说话人识别作为一种声纹识别技术,在模式识别应用发展迅猛的今天有着无可限量的前景,它与其他利用个人生物特征的识别方式相比,有着操作便捷、设备低廉的优势,因此近几年来,对说话人识别的研究引起了人们的广泛关注。
目前,说话人识别常用的模型是高斯背景混合模型,该模型是根据通用背景模型训练得到,相比较于其它模型鲁棒性较好,但是其计算量大,识别效果也不尽如人意,随后很多人在此模型的基础上进行了改进。
近年来,稀疏表示算法在信号处理领域有着惊人的表现,而且已经在图像的识别、处理、分离等方面取得了很好的处理效果。
4. 研究方案
1.收集不同人各种情绪的语音数据组成一个语音数据库来实验使用。
2.选择基音频率、差分基音频率、共振峰、线性预测倒谱系数、差分线性预测倒谱系数以及能量等的混合特征参数作为声纹识别的特征矢量集,用向量机模型算法来实现。
3.使用语音数据库作为基础,利用高斯分布模型构建一个状态网络,将每类特征的分布视为多个高斯分布的加权和,最后加权和概率最大的类别即为分类结果。
5. 工作计划
第一周:查找文献资料,对基于支持向量机(SVM)模型的说话人情绪识别技术有个大体的了解;第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、基于支持向量机(SVM)模型的说话人情绪识别技术等;第三周:制定研究计划,写开题报告;第四周:学习程序语言以及编程方法;第五周:练习编程;第六周:实现参数分析方法软件部分;第七周:实现基于SVM法的说话人情绪识别软件部分;第八周:实现基于SVM法的说话人情绪识别方法软件部分;第九周:实现系统软件联调的主要功能;第十周:实现软件的可视化界面;第十一周:程序修改和完善,结果分析;第十二周:写论文以及准备答辩;第十三周:写论文以及准备答辩;第十四周:验收程序,进行毕业设计答辩;
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。