1. 研究目的与意义(文献综述)
语音是人的自然属性之一,由于发音器官的生理差异以及后天所形成的发音习惯的行为差异,不同说话人的语音具有鲜明的个人特征,这使得通过分析语音信号来识别说话人成为可能。说话人确认属于说话人识别中的一类,通过提取说话人语音中的个人特征来确认一个人的身份。说话人识别所使用的语音是人体所固有的生物特征,不容易被冒充或窃取,可以随时使用,并且可以利用电话网络实现远距离服务,相对于传统的密码、钥匙等身份识别方法更安全、更有效、更可靠,因此具有广泛的应用领域,越来越受到人们的重视。
自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能听懂人类的语言并能按人的口头命令来行动呢,从而实现人机的语言交流。随着科学技术的不断发展,语音识别技术的出现,使人类的这一理想得以实现,语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与合成技术的结合,使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
我国的语音识别研究一直紧跟国际水平,国家也很重视。国内中科院的自动化所、声学所以及清华大学等科研机构和高校都在从事语音识别领域的研究和开发。国家863智能计算机专家组为语音识别技术研究专门立项,并取得了高水平的科研成果。我国中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,其准确率和系统、均可达90%以上。国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。
2. 研究的基本内容与方案
特定人语音识别有很多种,比如dtw,hmm、vq等,每种方法适用于不同的语音识别,与文本有关的的识别主要采用vq。而hmm主要在非特定人语音识别中使用。所以本次设计采用的是dtw方法,dtw虽然运算量比较大,但是技术上比较简单,识别率也比较高。其中的失真度可用欧式距离或对数似然比距离。决策方法可用最近邻准则。本设计主要围绕着matlab平台进行语音信号的录制及预处理,提取特征参数,建立两种模块,一组为参考模块,一组为测试模块,然后通过dtw算法进行匹配,算出匹配结果。主要通过用户开发界面直观地呈现出来。动态时间弯折 ( dynamici time waprin g , d t w ) 是把时间 归正和距离测度计算结合起来的一种非线性归正技术。如果直接用特征矢量序列的模式来进行相似性的比较, 其效果不可能是最佳的。需要对特征参数序列重新进行时间的对准,采用 d t w 方法可以有效地解决这个问题。动态时间规整算法是要寻找一条通过各个交叉点的从起始点到终止点的最佳路径 , 使得该路径上所有交叉点的帧失真度总和( 总失真 ) 达到最小。dtw算法与hmm算法在相同的环境条件下,识别效果相差不大,但hmm算法要复杂的多,这主要体现在hmm算法在训练阶段需要提供大量的语音数据,通过反复计算才能得到模型参数,而dtw算法的训练中几乎不需要额外的计算。在特定人语音识别中,dtw算法得到广泛的应用。下图为语音识别系统的总体框架。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需掌握的知识范围,完成开题报告。
第4-11周:查阅相关文献资料,着手开始各个部分程序的编写调试
第12-14周:完成并修改毕业论文。
4. 参考文献(12篇以上)
、张雪英等.《数字语音处理及matlab仿真》.电子工业出版社.2010.7.
2、胡航.《现代语音信号处理》.电子工业出版社.2014.7.
3、周建新.《matlab从入门到精通》.人民邮电出版社.2012.6.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。