全文总字数:1745字
1. 研究目的与意义
在传统采样过程中, 为了避免信号失真, 依照香农 (Shannon) 定理即采样频率不得低于信号最高频率的 2 倍对信号进行采样,这无疑会导致海量采样数据, 大大增加了存储和传输的代价,对信号处理的能力提出了更高的要求也给相应的硬件设备带来了极大的挑战。而且近年来,随着 4G 技术的普及和 5G 技术的不断发展,宽带通信时代的到来使得宽带语音应用得到广泛重视,通信中的频谱资源分配显得更为紧张。因此寻找新的数据采集处理方法成为一种必然。2004年,由Donoho和Candes等人提出的压缩感知CS(Compressed Sensing)理论是一个充分利用信号稀疏性或可压缩性的全新信号采集编解码理论。 压缩感知CS 理论表明,可以在不丢失逼近原信号所需信息的情况下,用最少的观测数来采样信号,实现信号的降维处理,从而在节约采样和传输成本的情况下,达到了在采样的同时进行压缩的目的。本文研究内容为基于压缩感知的语音信号压缩,采用压缩感知技术应用于语音信号处理可直接的降低语音信号的采样带宽,对语音的各项后处理都具有重要的应用价值和发展空间。
2. 国内外研究现状分析
CS 理论通过对观测序列运行重构算法来恢复原始信号,即观测在某种意义下可以表征信号。把 CS 作为一种语音信号的采样方法,由于观测的个数小于信号的维数,因此实现了边压缩边采样,突破了香农采样定理的瓶颈。把 CS 作为一种压缩方法,采用基于CS 的语音压缩和重构算法,有以下两方面的优点:发端压缩方法简单,只要乘以观测矩阵即可,计算复杂度低;针对发端相同的压缩方案,收端可以根据要求采用不同的改进的重构方案提高重构性能。
目前国内外主要集中研究基于 CS 理论的语音压缩感知的基本理论,稀疏基主要采用正交基,常采用 DCT 基、小波基、KLT基。Rauhut等把压缩感知扩展应用到在单一基上不稀疏而在冗余字典上稀疏的信号,采用基于数据驱动字典进行压缩感知。Sreenivas 等基于语音信号的稀疏激励进行压缩感知,其稀疏转换矩阵采用从训练码书中选择的脉冲响应矩阵。观测矩阵一般采用随机高斯矩阵,也有采用基于自相关特性的截断循环自相关矩阵。压缩感知的重构算法有贪婪追踪算法、凸松弛法优化算法(0 p 1)、组合算法。针对语音信号采用特殊的重构方法方面尚未见报导。 国内外将CS用于语音信号处理领域的研究相对于图像领域还比较少,处于起步阶段。语音信号具有可压缩性,可以基于 CS 对语音信号边压缩边采样,且能够很好的重构原信号。目前,Gemmeke 等利用 CS 原理对噪声环境下的语音进行识别,语音识别系统的抗噪性能大大提高。Giacobello 等把 CS 的理论框架应用到语音编码。Griffin 等采用 CS 理论对声音信号进行正弦模型编码,Xu 等把 CS 理论引入信息隐藏,Ma 等基于 CS 理论提出语音丢包补偿策略,Xu 和 Wang把 CS 引入到欠定盲源分离中。基于压缩感知的语音信号压缩正处于研究发展阶段,实现语音的高效压缩是一项长期而艰巨的任务。
3. 研究的基本内容与计划
本次毕设将从了解cs压缩理论思想起源和它的历史发展入手,结合国内外同类研究现状,深刻理解cs原理,采用cs压缩感知技术实现语音压缩。采集语音信号,对语音信号进行稀疏处理,再重构语音信号。
时间安排:
一~二月份:查阅十篇以上相关文献,了解cs原理,完成开题报告文献综述;
4. 研究创新点
由于语音信号具有可压缩性,能够用比 Nyquist 采样速率低很多的速率无失真地采样信号,基于压缩感知进行低速率无失真地采样给信号的采样、存储、传输和处理都带来了巨大的方便。所以 CS 理论与语音信号理领域的结合,意味着对传统的基于奈奎斯特均匀采样定律下的语音分析方法的颠覆用 CS 理论中的观测来代替传统语音采样值,势必导致采样信号特征根本性的变化,进而影响整个语音信号处理体系。用信号的稀疏表示取代原始数据可以降低信号处理的成本。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。