电话语音语种确认系统算法研究
文献类型:学位论文
作者 | 刘长娥 |
学位类别 | 博士 |
答辩日期 | 2007-12-24 |
授予单位 | 中国科学院电子学研究所 |
授予地点 | 电子学研究所 |
导师 | 夏善红 |
关键词 | 语种确认 语言模型 开集测试 |
其他题名 | Study of algorithm of language verification system on telephone speech |
中文摘要 | 语种识别技术作为信息处理系统的前端和多语种交流领域的接口,可以辨识语音的语种信息,为后续技术处理和交流者提供必要的条件,有着巨大的应用需求和价值。本文重点研究语种确认系统算法,主要围绕PPRLM(并行音素识别器接语言模型系统)语种确认基线系统中的三个问题进行:语种辨识系统中的语言模型改善、系统分类器融合策略、开集测试中系统性能。 语种确认系统的语言模型是其核心之一,为了提高语言模型的精度,本文采用段长作为置信度,提出了“基于段长的语言模型修正算法”,该算法结合段长置信度信息对语言模型进行估值,并与无段长置信度语言模型一起给出“修正因子”,用于修正语言模型估值,以此改善语言模型精度,提高系统性能。 本文研究了分类器的加权平均线性融合策略,利用“MCE权重优化训练算法”(Minimum Classification Error, MCE)估计分类器权重。研究了训练中各关键参数的影响,并分析了该训练算法存在的问题,提出改进措施,改善了融合系统性能。 针对开集测试,本文构建了“跳跃式”语言模型,得到多个时间层次上的模型,然后提出“多层语言模型融合算法”,提高了系统在开集测试的精度。在多层语言模型融合的基础上,本文提出了“基于背景模型的两阶段语种确认算法”。算法在不同阶段采用鉴别能力不同的背景模型,第一阶段采用“有限背景模型”,第二阶段采用“通用背景模型”,两阶段算法最终有效地降低了系统在开集测试中的错误率。 最后论文采用2005年国际NIST(American National Institute of Standard and Technology)语种技术评测数据库对采用本文算法的系统进行整体测试,分别对30s、10s语音进行闭集和开集测试,采用本文算法的系统均获得了等错率的降低,从而验证了算法的有效性。 |
语种 | 中文 |
公开日期 | 2011-07-19 |
页码 | 134 |
源URL | [http://159.226.65.12/handle/80137/8133] ![]() |
专题 | 电子学研究所_电子所博硕士学位论文_电子所博硕士学位论文_学位论文 |
推荐引用方式 GB/T 7714 | 刘长娥. 电话语音语种确认系统算法研究[D]. 电子学研究所. 中国科学院电子学研究所. 2007. |
入库方式: OAI收割
来源:电子学研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。