1. 研究目的与意义(文献综述)
语音识别的研究可以追溯到20世纪50年代,最早att贝尔实验室的audry系统可以识别十个英文数字,我国的语音识别研究也起步于上世纪五十年代,2002年中科院及其所属模式科技公司发布了“天语”中文语音系列产品结束了中文语音产品由外国垄断的现状。
在现代社会,当面临众多繁琐的案件操作和菜单选择的时候,简单地说出指令,是最具有人情味的人机操作界面。语音识别与自动化控制的结合将是未来发展的一种必然趋势,语音交互方式是更为人性化的人机交互界面,也被认为是人机交互最自然的方式,已经在多领域得到广泛应用。智能焊接设备的人机交互方式在不断地改变,用户体验将会不断被提升。焊接设备现有的人机交互依赖于手持操作终端,交互显得较为繁琐,影响用户的便捷使用。考虑将语音交互技术应用于该平台,力争在较大程度上降低人机交互的复杂度并减小培训时的人力消耗。
随着电子技术和计算机技术的高速发展,被称为机器听觉系统的语音识别技术近几年也取得了长足的进步,并开始从实验室走向市场,现在已进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。在焊接制造领域,智能焊接已发展成为一种先进的制造技术,智能焊接设备在各工业的应用中所发挥的作用越来越大,应用范围正在迅速扩大。目前智能焊接的应用主要在于各种高级的传感元件,如视觉传感器,触觉传感器,激光扫描器等,并借助计算机软件系统,数据库和专家系统具有识别、判断、实时检测,运算、自动编程、焊接参数存储和自动生成焊接记录文件的功能,语音识别技术在智能焊接系统中的应用还相对较少。
2. 研究的基本内容与方案
本次设计是建立在数字语音处理技术基础上对非特定人的焊接指令进行识别展开的。基于HMM的语音识别系统本质是一种模式识别系统,包括特征提取,模式匹配,参考模式库三个基本单元
本论文重点研究语音识别的自适应问题,噪声问题,端点检测问题,并利用Matlab编程软件对语音识别系统核心代码、流程图及算法等进行仿真和分析。技术基本结构图如图1所示。
SHAPE \* MERGEFORMAT
输入语音信号并预初理 |
特征提取 |
模式匹配 |
识别结果 |
模式库 |
焊接机器执行操作 |
图1 语音识别技术基本结构
首先对论文的研究背景、语音识别技术进行简要介绍。讨论其在智能焊接领域的可行性和优越性,并对焊接环境的特点,对数字语音处理相关知识进行简述。在获取模拟语音信号后,将信号进行预处理,包括首尾端的静音切除,降低对后续步骤造成的干扰,使用移动窗函数进行声音分帧。然后使用特征提取算法线性预测倒谱系数把每一帧波形变成一个包含声音信息的多维向量;输入特征向量与训练获得的模式库进行对比,比对成功后,返回识别到的语音命令编码,并将编码发送给焊接应用程序执行焊接操作。整个过程的难点集中体现在以下几个方面:语音识别自适应问题,不同人说话方式语调语音都是不同的,同一个人在不同环境下的语音也是不一样的,语音识别系统必须是要针对非特定操作员的识别系统;噪声问题,在工作中,环境不会是一直保持安静的,机械产生的噪声,讲话人产生情绪或心里上的变化,导致发音失真、发音速度和音调改变,产生Lombard/Loud效应。常用的抑制噪声的方法有谱减法、环境规正技术、不修正语音信号而是修正识别器模型使之适合噪声、建立噪声模型;语音识别基元的选取问题,在连续语音中,基元越多越容易产生协同发音现象,因此,要得到性能较高的声学模型,需要利用好上下相关信息,即进行上下文相关建模,同时,欲识别的词汇量越多,所用基元应越小越好;端点检测,语音信号的端点检测是语音识别的关键第一步,研究表明,即使在安静的环境下,语音识别系统一半以上的识别错误来自端点检测器,提高端点检测技术的关键在于寻找稳定的语音参数。最后运用matlab相关知识,对语音识别主要算法进行仿真实现;对设计内容进行总结与结果分析。
3. 研究计划与安排
1-3周:查阅相关文献资料,熟悉题目含义及基本研究内容,撰写开题报告。
4-9周:完成相关理论知识的学习与研究,复习数字语音处理相关知识,对语音识别关键技术进行学习。
10-14周:复习matlab相关知识,对hmm算法,训练算法,自适应处理,端点检测,噪声处理等主要相关算法进行仿真实现。
4. 参考文献(12篇以上)
[1]陆昱方.简述语音识别的实现过程[j].科技传播,2019,11(02):121-122.
[2]闻静.基于hmm的非特定人汉语语音识别系统[j].中国工程机械学报,2014,12(05):466-470.
[3]陈硕. 深度学习神经网络在语音识别中的应用研究[d].华南理工大学,2013.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。