1. 研究目的与意义(文献综述)
语音是人类交流最自然最方便的交流方式之一,有着自然、方便、高效的特点。传统的人机交互方式主要通过键盘和鼠标完成的。自从计算机诞生以来,人们就普遍期望着能够通过更友好的方式与计算机进行信息交流,从而使得人们与机器进行信息交流时,能够像人与人之间那样自然、方便。现在有了语音识别以及语音合成技术,完全可以通过声音进行控制,从而极大的满足了人们的需求。如果能够通过语音来输入一些信息,不仅解放了人类的双手,而且输入更快,更舒适,更容易操作。因此,语音交互的实用化是人类历史上又一项具有重大意义的创新,语音识别正迅速发展为改变未来人类生活方式的关键技术之一。语音识别在工业、军事、交通、医学、民用方面有着广阔的应用前景,例如声控电话交换、语音拨号系统、各类语音声讯服务、智能玩具、语音呼叫中心等,语音识别技术将大大改善人机界面,提高信息处理自动化程度,具有巨大的社会、经济效益。20世纪90 年代以来,语音识别技术在多项关键技术上更加成熟,在实际生活中的应用和有关产品化方面都出现了很大的进展。同时在计算机技术、电信应用等领域飞速发展的带动下,出现了一批走向实用化的语音识别系统和语音服务应用。2011年美国Apple公司发布IPhone4S智能手机,并在上面提供Siri语音识别智能系统,方便人们更好的和智能手机交互。当然拥有Android手机开源操作系统的Google公司也不甘落后,己经将语音识别技术和搜索技术进行了完美融合,并致力于在Android平台开发能和Siri抗衡的语音识别系统。目前,语音识别技术已经发展到了一个相对高的水平,在稳健语音识别、自适应等方面取得了丰硕的成果,正在从实验室研究中走出来,进入了一个实用化的阶段。
我国的语音识别技术起步较晚,但发展很快,最早要追溯到1958年。由于我国计算机本身发展就落后于发达国家,同时可利用资源有限,在随后的很长一段时间里,国内语音识别发展缓慢。1987 年我国高科技发展计划(863 计划)启动,当时语音识别技术和其他关键技术一并被给予重点扶持,随后国内语音识别的研究工作步入了高速发展的时期。目前,我国的语音识别技术的研究水平基本上已与国外同步,而在汉语的语音识别技术上有着自己的独特优势,并已达到国际先进水平。
2. 研究的基本内容与方案
本次研究的基本内容是进行一个非特定人语音识别系统的仿真。目标是实现非特定人语音识别系统的基本功能。语音识别系统本质上是一种模式识别系统。与常规的模式识别系统一样,包含有特征提取、模式匹配和参考模式库等三个基本单元。但是由于语音识别系统所处理的信息是结构非常复杂、内容极其丰富的人类语言信息,因此它的系统结构比通常的模式识别系统要复杂得多。
当语音信号进入系统的时候,首先要经过预处理变成离散的数字信号,预处理技术主要包括预滤波和采样、预加重、加窗、分帧以及端点检测,采样频率一般为8KHz~10KHz,采样频率采用8kHz,加窗拟采用汉明窗,端点检测初步选择使用熵或者双门限限定检测。接着对预处理后的信号进行频域和时域的分析,得到语音信号的特征值,并提取相关参数;然后在学习阶段构建标准的参考模式数据库;最后在识别阶段按照模式匹配系统中定义的准则和测度进行判别,给出最终的识别结果。本课题拟采用动态时间规整(DTW)或者隐马尔可夫模型(HMM)来进行语音信号识别,并用BP神经网络来模拟参考模型库。
本课题的仿真软件拟采用Matlab等。仿真结果将在正确率等方面来对两种算法进行比较。
|
|
|
|
|
|
|
|
|
3. 研究计划与安排
第1周——第3周 搜集资料,撰写开题报告;第4周——第5周 论文开题;
第6周——第12周 撰写论文初稿;
第13周——第16周 修改论文;
4. 参考文献(12篇以上)
[1]徐春燕.非特定人连续语音识别的理论、分析和实验[d].杭州:浙江工业大学,2005.[2]卜素亮.非特定人连续语音识别技术研究与应用[d].上海:复旦大学, 2011.
[3] 薛凌云 非特定人孤立词语音识别技术研究[d].长沙:中南林业科技大学,2014.[4]范长青. 小词汇量非特定人连续语音识别系统的研究[d], 沈阳: 沈阳理工大学, 2008.
[5]卞洁. 非特定人孤立词语音识别系统若干关键技术的研究[d].大连: 大连理工大学, 2005.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。