语音识别鲁棒性方面的研究
文献类型:学位论文
作者 | 侯震 |
学位类别 | 博士 |
答辩日期 | 2002 |
授予单位 | 中国科学院中科院声学研究所 |
授予地点 | 中科院声学研究所 |
关键词 | 语音识别 鲁棒性 语速 惩罚因子 语调 基音 隐马尔科·夫模型 美尔刻度倒谱系数 低端截止频率 |
中文摘要 | 语音识别系统从实验室向实际应用中转移时,由于使用环境的变动,常常会遇到很多困难。而识别系统鲁棒性的好坏决定着这一过程的难易。本文主要探讨语音识别鲁棒性问题中语速和语调这两方面的内容。首先在语速方面,分析不同语速的语音对识别结果的影响。然后,在使用隐马尔科夫模型的识别系统中引入惩罚因子这一概念,并通过实验说明惩罚因子可以有效改善删除错误和插入错误的数量。针对不同语速的语音,使用最佳的惩罚因子可以使识别错误率最低。接着作者分析各种速度语音的识别结果,得出最佳的惩罚因子和语速之间的数学关系。根据这种的关系,又提出五种方法利用惩罚因子来提高识别系统对语速的鲁棒性。这些方法的计算量都很小,很容易在真实系统中使用。其中使用文本相关的语速预测和惩罚因子的方法在我们的实验系统中可以使字错误率下降7.3%。在语调方面,先介绍语调的变化对识别结果的不利影响,并且目前的识别系统常常无法解决这样的问题。进而根据语调和基音之间的紧密联系,作者希望可以提取出对语调变化鲁棒性更好的声学参数。接下来,在讨论一些语音信号中基音的提取方法之后,确定谐波求和的方法可以最高效和最方便的在我们的实验系统中提取基音。利用提取的基音,我们提出动态的提升美尔刻度倒谱系数中滤波器组低端截止频率的方法,即适当改变滤波器组覆盖的频段。经过大量实验比较,发现将滤波器组低端截止频率提升到比平滑后的基音低70赫兹的位置最为有效,在识别语调变化的语音时错误率下降14.4%。 |
语种 | 中文 |
公开日期 | 2011-05-07 |
页码 | 59 |
源URL | [http://159.226.59.140/handle/311008/778] ![]() |
专题 | 声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文 |
推荐引用方式 GB/T 7714 | 侯震. 语音识别鲁棒性方面的研究[D]. 中科院声学研究所. 中国科学院中科院声学研究所. 2002. |
入库方式: OAI收割
来源:声学研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。