1. 研究目的与意义
从人们学会制造和使用机器以来,就一直有个想法,那就是让机器能够听懂人们的语言并且执行相对应的指令,从而实现人与机器间的交流互动。20世纪以来,随着科技的不断进步,语音识别技术[1]开始逐渐出现在人们的视线之中。
语音识别是一门交叉学科,涉及领域颇多,如信号处理,概率模型,机器学习等等。近几十年来,语音识别技术发展迅速,服务于电器、通讯、医疗等诸多领域。如文献[2]介绍了人工智能养老机器人,通过深度卷积神经网络(deep convolution neural network,dcnn)完成老人的语音识别,并运用算法形成语音控制智能家居的多样化解决方案,满足不同老人的定制化需求。又像文献[3]介绍的医技报告交互系统,通过关键词分析匹配相对应的医学术语,提高了医生出具报告的效率,减少了临床等候时间,为医生和患者都提供了方便。
追溯语音识别系统的发展史,第一个语音识别系统来自20世纪50年代,由贝尔实验室研究出的能识别十个英文数字的实验系统。到了60年代,出现了关键的技术:语音信号线性预测编码(lpc)技术[4]和动态时间规整(dtw)技术[5]。这些技术有效地解决了语音信号的特征提取和不等长匹配问题,在语音识别方面取得了实质性的进展。这阶段的语音识别主要基于模板匹配原理,局限在特定人、小词汇表的孤立词识别,实现了基于lpc和dtw技术的特定人孤立词语音识别;同时也提出了矢量量化(wq)和隐马尔可夫模型(hmm)理论[6]。
2. 研究内容和预期目标
主要研究内容:
本课题主要研究如何通过对梅尔频率倒谱系数mfcc进行语音信号的时频特征提取,并利用隐马尔可夫模型hmm来完成对简单语音信号的识别。
3. 研究的方法与步骤
研究方法和步骤:
(1)参考主要文献并对mfcc和hmm进行了解学习,明白其原理和实现过程。
(2)熟悉matlab的安装和调试,学习matlab语言在mfcc和hmm基本实现,对录制的音源样本进行处理。
4. 参考文献
[1]于大海, 孙建民. 浅谈语音识别技术的应用和发展[j]. 科技传播, 2009, 000(009):22-23.
[2]赵彦,孙俊,时凯欣.n-pod多品牌智能家居语音控制设备的设计与实现[j/ol].电气传动:1-8[2021-03-17].
[3]宓林晖,袁骏毅,潘常青,沈晓冬.基于智能语音识别技术的医技报告交互系统的设计与应用[j].中国医疗设备,2021,36(02):92-95.
5. 计划与进度安排
3.1-3.19:充分查阅相关资料,撰写并修改完成开题报告;
3.20-4.9:研究语音信号识别的主要技术原理,选择合适的特征提取算法和识别算法进行深入研究;
4.10-5.21:设计实验方案,并通过合适的实验平台实现简单的语音信号识别,并对实验过程中出现的问题进行改进和调整;
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。