交互式语言学习系统中的发音质量客观评价方法研究
文献类型:学位论文
作者 | 李超雷 |
学位类别 | 博士 |
答辩日期 | 2007-04-03 |
授予单位 | 中国科学院电子学研究所 |
授予地点 | 电子学研究所 |
导师 | 夏善红 |
关键词 | 发音质量 HMM 感知模型 段长模型 基音 融合 SVM |
其他题名 | Research on Objective Evaluation of Pronunciation Quality in an Interactive Language Learning System |
中文摘要 | 基于语音处理技术的交互式计算机辅助语言学习系统(CALL)是目前语音技术的研究热点之一,它将改变现有的语言学习环境和教学模式,极大地提高语言学习效率。本论文针对交互式语言学习系统中的英语发音质量客观评价方法进行了深入、系统的研究。 人对语音的发音质量进行主观评价的过程大致可以包括听觉、感知和评价三个阶段。现有的语音发音质量客观评价算法主要采用语音识别中的隐含马尔可夫模型(HMM)构建发音质量评价模型,对发音质量进行客观评价。但是该方法没有考虑人对语音感知方面的特点,整体上评价性能还很不理想。本论文针对现有方法存在的问题,在发音质量评价模型研究方面开展了一些创新性的研究工作,重点研究了语音的声学、听感知和韵律建模方法以及基于上述模型的发音质量客观评价方法。 本论文提出了基于HMM的有参考语音的发音质量客观评价方法,主观和客观评价的相关系数从0.52(无参考语音)提高到0.67(有参考语言)。研究了母语口音、模型复杂度和对准层次对匹配分数与专家评分之间相关性的影响。 提出一种基于听感知模型的发音质量客观评价方法。研究了段长对语音时间对准的影响。基于本论文提出的Mel频标映射的感知模型的客观分数与主观分数的相关系数达到0.723,优于基于HMM的方法。 比较了基于Gamma分布和基于直方图分布的段长模型建模方法。基于Gamma分布的段长模型分数与专家评分的相关系数达到0.66。 提出一种基于基音信息的基音模型。比较了平均基音比分数和基音极值差分数与专家评分的相关性。基音极值差相对于基音的均值对发音质量评价更为重要,元音极值差分数与专家评分的相关系数达到0.38。 比较了基于线性和SVM的机器分数融合方法。采用SVM的分数融合方法,将HMM声学模型、听感知模型、段长模型和基音模型的分数进行融合。融合后的客观分数与专家评分的相关性达到0.800,该结果是目前国内外有关文献报道的最好结果之一。 本论文还提出了一种英语句子重音检测方法。在Boston大学广播新闻语料库上的测试表明,正确率达到82%。 本论文制定了对学习者语音进行主观评分的规范并设计了用于发音质量客观评价的语音库。 |
语种 | 中文 |
公开日期 | 2011-07-19 |
页码 | 130 |
源URL | [http://159.226.65.12/handle/80137/8113] ![]() |
专题 | 电子学研究所_电子所博硕士学位论文_电子所博硕士学位论文_学位论文 |
推荐引用方式 GB/T 7714 | 李超雷. 交互式语言学习系统中的发音质量客观评价方法研究[D]. 电子学研究所. 中国科学院电子学研究所. 2007. |
入库方式: OAI收割
来源:电子学研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。