面向问题求解的人机口语对话系统中语音识别器的研究
文献类型:学位论文
作者 | 徐鹏 |
学位类别 | 工学硕士 |
答辩日期 | 1998-06-01 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 中国科学院自动化研究所 |
导师 | 黄泰翼 |
关键词 | 人机口语对话系统 语音识别器 N-Gram语言模型 Bigram 音节填充模型 垃圾模型 Viterbi-Beam搜索 |
学位专业 | 模式识别与智能系统 |
中文摘要 | 随着计算机技术的发展和人们对人机接口智能化的要求,基于 语音的人机接口技术越来越受到人们的重视。而在这一技术当中,口 语的识别和理解是最关键的部分,要建立一个非特定人、大词汇量的 口语人机对话系统,就必须解决口语的识别和理解问题。 本文结合了我们开发的一个基于问题求解的人机口语对话系 统,介绍我们最近在口语的识别问题上所做的工作,并且给出了我们 构造的语音识别器在实际系统中的性能。 针对汉语的特点和我们实验室多年来在汉语语音识别方面的研 究成果,我们采用了细化的声韵母作为声学建模单元,并采用了连续 概率密度的HMM。我们的研究表明,这种建模方法所能达到的声学 识别率略好于其它的一些方法。 根据旅游信息获取这一主题,我们收集了一批语料,建立了141∈ 词的词典。在识别方面,为了处理口语中旬子灵活多变的特点,我们 采用了大词汇量语音识别系统中常用的基于词树的Viterbi.Beam搜 索算法,并且采用语言模型来引导搜索过程。由于语料的限制,我们 采用了基于词类的N-Gram语言模型,在实际中使用Bigram。考虑 到口语中集外词现象非常普遍,我们引入了音节填充模型,用于处理 集外词的现象,取得了一定的效果。另外,我们还尝试建立了垃圾模 型,尝试了把垃圾模型与原来的声韵母模型结合在一起的方法,为以 后处理口语中的无意义语声和非语声创造了条件。 我们使用不同的测试集对语音识别器进行了测试。测试结果表 明,无论是训练集内部还是外部的句子,能够达到的字的识别率和关 键词的识别率都大于90%,满足了我们对系统设计的要求。 |
语种 | 中文 |
其他标识符 | 473 |
源URL | [http://ir.ia.ac.cn/handle/173211/7225] ![]() |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 徐鹏. 面向问题求解的人机口语对话系统中语音识别器的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 1998. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。