低码率语音编码压缩算法研究
文献类型:学位论文
作者 | 孙迅 |
学位类别 | 博士 |
答辩日期 | 1998 |
授予单位 | 中国科学院中科院声学所 |
授予地点 | 中科院声学所 |
关键词 | 低码率 语音压缩 听觉模型 包络 |
中文摘要 | 低码率语音压缩是数字通讯系统中的关键技术之一。本文从人耳的听觉特性和合成语音的包络匹配入手,研究了低码率语音压缩中的合成语音的嘶哑问题以及自然度损失问题,并提出了相应的解决方案。主要工作有: (1)提出了基于听觉模型的小波分带编码方法。通过把输入语音信号利用听觉小波滤波器组分成四个通道,并且对每个通道分别进行最优编码处理,就能够按照符合人耳频域分辨率的方式提取LPC预测系统。在解码端对四个通道的信号解码后进行叠加,就能够得到解码后的合成语音。这种方法在低码率下取得了较好的结果,较好地解决了基于LPC的编码器难以解决的合成嘶哑问题,获得了比DOD CELPC和LPC10e更清晰的语音。(2) 提出了考虑语音包络的编码方法,以提高合成语音的自然度。我们在编码器中提取语音信号的包络信息,仅用4比特将它量化,并编入信道文件传送到解码端。解码器利用包络信息,高速激励模型,使其合成语音的包络与原始信号包络尽量吻合。实验结果表明,这种编码器的低频效果有较好的增强,自然度也有较好的提高。 |
英文摘要 | Low bit rate speech coding is one of the most important technologies in digital communication. In this paper, we discuss the two main problems in low bit rate speech coding, i.e. the hoarse output of decoded speech and the loss of naturalness, and present corresponding scheme to improve the performance of vocoder. Main work includes: (1) Presenting a new wavelet linear prediction subband coding algorithm (WLPSC). Through employing a wavelet filter bank based on auditory model, we divide input speech signal into four subbands, and then code each subband respectively. Experiment results show that this algorithm can greatly reduce the hoarse output of vocoders. (2) Presenting a new scheme that incorporates envelope of speech waveform to improve the low frequency and naturalness of vocoder. We extract envelope of speech waveform in our encoder and quantify it into four its. Decoder adjusts parameters of ex citation according to this information to make the envelope of output approach original speech as near as possible. Our experiments show that this scheme can improve the low frequency and naturalness of vocoders. |
语种 | 中文 |
公开日期 | 2011-05-07 |
页码 | 41 |
源URL | [http://159.226.59.140/handle/311008/1376] ![]() |
专题 | 声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文 |
推荐引用方式 GB/T 7714 | 孙迅. 低码率语音编码压缩算法研究[D]. 中科院声学所. 中国科学院中科院声学所. 1998. |
入库方式: OAI收割
来源:声学研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。