中国科学院机构知识库网格系统: 面向问题求解的人机口语对话系统中语音识别器的研究

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

面向问题求解的人机口语对话系统中语音识别器的研究

文献类型：学位论文


作者	徐鹏
学位类别	工学硕士
答辩日期	1998-06-01
授予单位	中国科学院自动化研究所
授予地点	中国科学院自动化研究所
导师	黄泰翼
关键词	人机口语对话系统语音识别器 N-Gram语言模型 Bigram 音节填充模型垃圾模型 Viterbi-Beam搜索
学位专业	模式识别与智能系统
中文摘要	随着计算机技术的发展和人们对人机接口智能化的要求，基于语音的人机接口技术越来越受到人们的重视。而在这一技术当中，口语的识别和理解是最关键的部分，要建立一个非特定人、大词汇量的口语人机对话系统，就必须解决口语的识别和理解问题。本文结合了我们开发的一个基于问题求解的人机口语对话系统，介绍我们最近在口语的识别问题上所做的工作，并且给出了我们构造的语音识别器在实际系统中的性能。针对汉语的特点和我们实验室多年来在汉语语音识别方面的研究成果，我们采用了细化的声韵母作为声学建模单元，并采用了连续概率密度的HMM。我们的研究表明，这种建模方法所能达到的声学识别率略好于其它的一些方法。根据旅游信息获取这一主题，我们收集了一批语料，建立了141∈ 词的词典。在识别方面，为了处理口语中旬子灵活多变的特点，我们采用了大词汇量语音识别系统中常用的基于词树的Viterbi．Beam搜索算法，并且采用语言模型来引导搜索过程。由于语料的限制，我们采用了基于词类的N-Gram语言模型，在实际中使用Bigram。考虑到口语中集外词现象非常普遍，我们引入了音节填充模型，用于处理集外词的现象，取得了一定的效果。另外，我们还尝试建立了垃圾模型，尝试了把垃圾模型与原来的声韵母模型结合在一起的方法，为以后处理口语中的无意义语声和非语声创造了条件。我们使用不同的测试集对语音识别器进行了测试。测试结果表明，无论是训练集内部还是外部的句子，能够达到的字的识别率和关键词的识别率都大于90％，满足了我们对系统设计的要求。
语种	中文
其他标识符	473
源URL	[http://ir.ia.ac.cn/handle/173211/7225]
专题	毕业生_硕士学位论文
推荐引用方式 GB/T 7714	徐鹏. 面向问题求解的人机口语对话系统中语音识别器的研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 1998.

入库方式： OAI收割

来源：自动化研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。