全文总字数:2090字
1. 研究目的与意义
语音信号的分类近年来被广泛应用,尤其是在各类音乐软件中对音乐风格的分类,使得软件可以根据用户的搜索记录,自动推算出用户的音乐偏好,以便于实现精准高效的推送,极大地提升了用户体验。
在语音信号分类过程中,语音特征信号识别占据着极其重要的地位。
由于语音的多样性与不确定性,采用传统方式进行的大规模语音特征信号识别速度慢,精确度不高。
2. 国内外研究现状分析
1952年诞生在贝尔实验室的世界上第一个语音识别系统一audry系统,这个系统当时只能识别十个英文数字,是通过数字在发音过程中的元音共振峰来进行识别的,这开创了人类语音识别的开端。
英国的denes和fry研制出了一个能够识别个辅音和个元音的识别器,他们采用了模式匹配器和谱分析仪。
同年成功利用计算机通过语音控制打字机,首次依靠语音旳统计信息来建立数据模板库。
3. 研究的基本内容与计划
本文将建立bp神经网络模型并对语音特征信号进行分类训练,最终对多类语音特征信号进行准确识别分类。
首先用bp神经网络对四类不同风格的音乐进行分类学习,如古筝、民谣、摇滚、流行,每段音乐用倒谱系数法提取500组24维语音特征信号,共2000组,其中随机抽取1500组用于神经网络的训练,500组用于最终的测试。
在每组信号中添加一维标识符,用于区分四类音乐,例如标识符为1,则输出为[1 0 0 0},若标识符为2,输出为[0 1 0 0],以此类推。
4. 研究创新点
BP神经网络具有良好的抽象分类能力,在对复杂的语音分类上,BP神经网络相对于传统的分类方式,速度快,识别率高。
MATLAB具有强大的矩阵运算能力,在MATLAB中训练神经网络可以极大地加快训练速度,更好地对语音进行分类识别
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。