基于IMBE模型的低速率语音编码算法及其DSP实现
文献类型:学位论文
作者 | 李秋云 |
学位类别 | 博士 |
答辩日期 | 1998 |
授予单位 | 中国科学院中科院声学研究所 |
授予地点 | 中科院声学研究所 |
关键词 | 多带激励 基音平滑 线谱频率 矢量量化 实时实现 |
中文摘要 | 低速率语音编码在现代数字通信系统中起着重要的作用,本文提出了一个用40MHz TMS320C31实现的、速率为2.84kb/s的实时语音编解码系统,所用算法是基于改进的多带激励(IMBE)模型。需要提取、量化并传送的参数有:基音周期、各频带的清浊音信息、各基音谐波频率处的谱幅度,基音周期的估计极大地影响着清浊音判断,谱幅度估计以及最后得到的合成语音的质量。本文采用了有效的基音提取以及基音平滑算法,基本上去除了信频和基音跳变现象,从而提高了合成语音的自然度。谱幅度的量化采用分裂线谱频率矢量并进行矢量量化方法,并且在分析端得到重建谱幅度和原谱幅度的差,将此余量作标量量化并传送到解码端,解码时将其加到重建谱幅度矢量上,从而提高了谱幅度的精度。 |
英文摘要 | Low bit rate (at 4kbit/s and below) speech coding is of great importance for many applications in telecommunications and computing. In this paper, a real-time speech coding system at the rate of 2.84kbit/s is presented. This system is implemented using float-point digital signal processor (DSP) TMS320C31. The algorithm is based on the improved Multi-Band Excitation (IMBE) speech model. For each frame of speech, the pitch period, the Unvoiced /Voiced decision and the spectral envelope parameters are determined, quantified and then transmitted. Pitch period is the most important parameter in the MBE model, which influence the U/V decision, the spectral amplitude and ultimately the synthesized speech. We use an efficient pitch-tracking algorithm and obtain accurate pitch estimate, accordingly the synthesized speech quality is improved. Most like the Analysis-By-Synthesis, in the encoder, we get the reconstructed spectral amplitude vector, and then calculate the spectral residue by subtracting it from the original vector. We quantify the residue, and in the decoder add it to the reconstructed spectral amplitude vector. This system can give natural synthesized speech and is robust to the environment noise.(图版 26个; 表格 5个; 参考文献 19个) |
语种 | 中文 |
公开日期 | 2011-05-07 |
页码 | 70 |
源URL | [http://159.226.59.140/handle/311008/1414] ![]() |
专题 | 声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文 |
推荐引用方式 GB/T 7714 | 李秋云. 基于IMBE模型的低速率语音编码算法及其DSP实现[D]. 中科院声学研究所. 中国科学院中科院声学研究所. 1998. |
入库方式: OAI收割
来源:声学研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。