维吾尔语语音识别语料库中的OOV研究
文献类型:期刊论文
作者 | 张小燕; 宿建军; 薛化建; 王磊![]() |
刊名 | 计算机工程与设计
![]() |
出版日期 | 2012 |
卷号 | 33期号:2页码:772-776 |
关键词 | 维吾尔语 集外词 语料库 文本挑选 语音识别 |
ISSN号 | 1000-7024 |
其他题名 | research on oov problem in constructing uyghur speech corpus |
中文摘要 | 鉴于维吾尔语丰富的形态变化产生大量单词引起的集外词(out of vocabulary,OOV)问题,为了定量研究OOV对维吾尔语语音识别的影响,采用控制语料库测试集OOV的算法及最佳文本挑选算法对不同OOV的测试集进行实验,算法通过Python语言实现。应用该算法进行电话语音库的文本转写,构建了维吾尔语的电话语音库。实验结果表明,该控制测试集OOV的方法能够有效地提高维吾尔语语音识别率。 |
公开日期 | 2012-11-29 |
源URL | [http://ir.xjipc.cas.cn/handle/365002/1493] ![]() |
专题 | 新疆理化技术研究所_多语种信息技术研究室 |
作者单位 | 中国科学院新疆理化技术研究所;中国科学院研究生院 |
推荐引用方式 GB/T 7714 | 张小燕,宿建军,薛化建,等. 维吾尔语语音识别语料库中的OOV研究[J]. 计算机工程与设计,2012,33(2):772-776. |
APA | 张小燕,宿建军,薛化建,&王磊.(2012).维吾尔语语音识别语料库中的OOV研究.计算机工程与设计,33(2),772-776. |
MLA | 张小燕,et al."维吾尔语语音识别语料库中的OOV研究".计算机工程与设计 33.2(2012):772-776. |
入库方式: OAI收割
来源:新疆理化技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。