1. 研究目的与意义
语音压缩算法如mpeg-1 layer iii(mp3)或mpeg-4aac 在每个声道都能以48~64kbps的比特率传送感知透明的cd音质(48khz16bit/sample)。
随着宽带接入技术和存储技术的进步,大量的数字音频应用软件已经出现,在无损性能下以高的采样率提供高质量的语音服务。
同时,还有许多应用需要高压缩的数字语音。
2. 课题关键问题和重难点
aaz采用变换编码方案,在这种方法种,整数mdct(intmdct),一个用于无损编码滤波器组离散余弦变换(mdct)中的整数实现。
在aaz中,输入音频的整数mdct频谱被mpeg-4 aac编码器首先编码以产生嵌入aac比特流,同时整数mdct频谱数据之间的残余频谱和由嵌入aac编码器产生的量化值和bpgc(bit-plane golomb code)随后被编码产生粒度可伸缩无损比特流。
aaz将很多音频压缩技术整合到一个框架之中,aaz编码器可分2层:感知核心层和无损增强层。
3. 国内外研究现状(文献综述)
在过去的二十年中,我们在语音压缩技术的发展上进行了大量的努力,这些努力取得了巨大的成果。
大部分语音压缩算法如mpeg-1 layer Ⅲ(mp3)或mpeg-4 aac在每个声道都能以48~64k bps的比特率传送感知透明的cd音质(48khz,16bit/sample)。
目前,比较流行的无损音频压缩格式有2种:dvd-audio和sacd(super audio cd),但这2种格式的关键技术为几家公司垄断,为发展一种更广泛使用的无损音频压缩标准,mpeg音频小组在2002年7月开始征集无损音频压缩方案,并对无损音频压缩方案的兼容性、可分级性以及随机访问能力提出了一些具体要求。
4. 研究方案
对此,我们提出两种编码方法进一步简化bpgc编码过程以提高整数mdct残余部分无损压缩的编码效率,第一种方法是基于上下关系的算数编码(cbac),它用上下文建模技术来获得整数mdct残留信号在它的频谱位置,临近频谱行的范围和核心aac量化器的可能性分布的统计学关系。
第二种是低能量模式编码方法,它是用极低的能量级别来替代整数mdct频谱数据从时域道频域的bpgc进程。
cbac和低能量编码方法以前曾作为核心试验在mpeg中提到过,它是用来提高mpeg-4 sls的性能。
5. 工作计划
第1周:根据课题查找关于课题的的资料信息并对相关外国文献进行翻译。
了解课题的基本信息,并对此进行基本分析,制定初步计划,做好前期预备工作。
第2周:完善课题初步设计计划,并根据计划迅速采取行动,完善课题的整体思路;按照要求填写课题设计的开题报告,并根据老师的意见对开题报告以及文献翻译进行修改完善,最后上传开题报告和文献翻译。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。