基音在语音识别中的应用及提高识别系统速度的研究
文献类型:学位论文
作者 | 温源 |
学位类别 | 博士 |
答辩日期 | 2002 |
授予单位 | 中国科学院声学研究所 |
授予地点 | 中国科学院声学研究所 |
关键词 | 连续语音识别 命令词识别 基音规整 识别速度 识别率 |
中文摘要 | 本论文主要介绍作者在三年研究生时期所作的部分研究工作,大致分为三大部分:第一部分论述了一种基音特征的规整方法,讨论了如何将基音特征和频谱特征以置信度的形式统合到命令词识别中的方法。该方法基于声刺激概念[1][2]找出特征帧,利用特征帧的位置信息对基音轨迹进行规整,然后把基音特征转化为置信度形式和频谱识别的置信度统合起来进行识别。实验用一个40人74词词表的数据库作测试,结果表明,利用本文方法,把基音特征和频谱特征按置信度形式统合后识别率可达99.10%,基音特征加入前后错误率下降33.8%。第二部分描述了作者在HMM系统中应用基音特征的一些新的做法,包括对基音特征进行减均值规整、除均值规整以及利用S函数规整。文中在对各种方法进行了理论描述后通过对比实验来进行测试,结果表明利用除均值和S函数规整的方法可以使系统错误率下降约26%。本文最后论述了一种通过压缩缓变语音帧来提高HMM连续语音系统的速度的方法。这一方法通过在特征提取阶段判决出一些变化较缓的帧,使其不参与后续搜索,从而达到提高训练和识别速度的目的。为此本文提出了比例准则和门限准则两种方法来判定缓变帧,同时论述了舍弃和概率代替两种使用缓变帧的方案。通过对一个100人的连呼数字串数据库作若干对比试验表明,采用替代缓变帧概率的方案较好。在识别速度提高大约20%的时候,系统仍然维持较高的识别率(98.46%)。本文所论述的这种方法适于对计算能力和存储量有限而又要求识别速度的小型系统,如PDA,掌上电脑等等。 |
语种 | 中文 |
公开日期 | 2011-05-07 |
页码 | 73 |
源URL | [http://159.226.59.140/handle/311008/776] ![]() |
专题 | 声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文 |
推荐引用方式 GB/T 7714 | 温源. 基音在语音识别中的应用及提高识别系统速度的研究[D]. 中国科学院声学研究所. 中国科学院声学研究所. 2002. |
入库方式: OAI收割
来源:声学研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。