1. 研究目的与意义(文献综述)
人类在现实生活中进行信息交流时,语音是最常用、最方便的手段之一。伴随着科技的不断发展,特别是网络技术的不断突破发展,通过网络语音交流的用户也逐步上升,会议记录、新闻广播等都以语音的形式存储。目前对音频相似度的检索不能快速有效的处理,加上以语音形式存储的数据量急剧增多,导致人们对网络平台资源的使用率不高。为了更好的利用网络多媒体平台资源,需要对资源的使用技术、管理、组织进行有效的优化。
音频相似度检索,在一段连续的、无限制的自然语言流中识别出人们给定的词组的过程,也就是音频关键词识别过程。通常对音频进行关键词检索的过程使用的方法有两种,一种是基于语言样例进行音频检索查询,根据用户输入的不确定的一段语音,在存储库中的语音进行检索并返回所需的音频数据段,又称为波形样例查询;另一种是基于文本形式进行查询。在网络信息时代,音频的检索技术已经在各大领域被广泛应用。在数字化图书馆,可以利用该技术对语音资源进行有效的管理和分类,提高工作效率;对数据保密度比较高的信息领域,通过该技术可以对通讯的音频等媒体数据进行实时的检索,避免了机密数据泄露。为此,对模板匹配的音频相似度分析方法的研究具有重要的意义。
2. 研究的基本内容与方案
使用dtw识别模式和参考模板的时间对应关系,求解两模板匹配时累计距离最小所对应的规整函数,将标准语音与语音等媒体流进行比较分析,得到其相似度,具体实现如下:
(1)端点检测:检测语音信号的起始点和终止点。
确定音频媒体数据的起始点和终止点。
3. 研究计划与安排
2016年3月1日~2016年3月7日,与指导老师交流,确定论文题目及相关内容,完成《基于模板匹配的音频相似度分析方法研究与实现》的开题报告。
2016年3月11日~2016年3月20日,查找关于模板匹配的音频相似度分析资料,对其进行技术分析,深入地探究其运作原理。
2016年3月21日~2016年4月10日,通过学习相关技术,利用单搭建出项目原型框架模型
4. 参考文献(12篇以上)
[1]韩纪庆,郑铁然,郑贵滨.音频信息检索理论与技术[m].北京:科学出版社,2011:11-15.
[2]thambiratnamk,ligang,mengsha,etal.leveragingthewebforautomaticallygeneratingindexableandbrowsablekeywordsforspeechfiles[a].in:procofieeeinternationalconferenceonacoustics,speech,andsignalprocessing[c],prague,czechrepubic,2011:4984-4987.
[3]xiess,liuy.usingn-bestlistsandconfusionnetworksformeetingsummarization[j].ieeetransactionsonaudio,speechandlanguageprocessing,2011,19(5):1160-1169.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。