端到端的语音合成中声码器方法研究开题报告

 2021-12-26 13:33:18

全文总字数:5597字

1. 研究目的与意义(文献综述)

语音识别和语音技术是实现人机语音通信,建立以个有听和讲能力的口语系统所必须的两项关键技术。和语音识别相比,语音合成的技术相对来说成熟一些,是该领域中最有希望产生突破并形成产业化的一项技术。[1]

按照人类言语功能的不同层次,语音合成也可分成三个层次,它们是:

(1)从文字到语音的合成(text-to-speech)

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

基本内容:

(1)调研了解从真实音频到梅尔频谱图的转化过程;

(2)调研了解现有的声码器,了解从梅尔频谱图到语音的转化过程。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1)2020/3/1-2020/3/31:学习python,了解cnn和dnn,学习关于真实音频到梅尔频谱图的转化并实践,学习wavenet的相关知识,学习声码器的一些方法;

(2)2020/4/1-2020/4/30:进行系统的架构,讨论如何对梅尔频谱到语音的转化;

(3) 2020/5/1-2020/5/25: 撰写及修改毕业论文;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 温正棋,刘斌,张大伟.解读“智能交互”的核心技术[j].人工智能,2018(01):60-75.

[2] 刘郅楠. 基于端到端蒙古语语音合成方法的研究[d].内蒙古大学,2019.

[3] 刘郅楠. 基于端到端蒙古语语音合成方法的研究[d].内蒙古大学,2019.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。