基于语音技术的“双语”教学平台研发及关键技术研究
文献类型:学位论文
作者 | 蒋同海![]() |
答辩日期 | 2013-05-24 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院新疆理化技术研究所 |
导师 | 苏国平 |
关键词 | 双语教学 资源库 教学资源模型 声学模型 发音质量评测 教学平台 |
学位名称 | 博士 |
学位专业 | 计算机应用 |
英文摘要 | 少数民族“双语”教学是国家提高少数民族教育质量、提升各民族综合素质、促进社会经济发展、保障社会稳定的长期重要举措。然而双语教学中存在的教师队伍数 量缺、汉语言能力低、教学水平差、数字化教学资源形式单一等瓶颈问题制约了双语教学的健康发展,迫切需要统一规范的集文字、图像、声音、动画等多样化表现 形式的、以语音技术为支撑的“双语”教学应用平台,促进“双语”教学的跨越式发展。 本文在中科院西部行动计划高新技术项目(项目编号:KGCXZ-YW-507)和新疆维吾尔自治区“十二五”科技重大专项课题(项目编 号:201230118)等项目的支持下,对“双语”教育资源库建设理论、发音质量评测与指导等关键技术进行研究,构建基于语音技术的“双语”教学平台, 生成各类应用系统,在双语教学课堂中示范应用,并对提出的理论、方法、方案进行验证。 本文研究了面向双语教学的双语教学资源模型。针对双语教学资源自身的特有属性集和新疆本地化特色,从资源的通用属性、资源元数据的数据描述、资源生存期的 历史和状态、资源应用的技术要求、资源的教育和教学特征、资源的知识产权和使用条件、资源之间的相互关系、资源应用中的评价以及资源的分类等九个方面给出 了双语教学资源模型。 本文给出了新疆双语教育资源库的建设规范。结合国际和国内的相关标准和规范,从新疆双语教育信息化需求和双语教育特点出发,考虑少数民族语言文字支持的需 求,对资源制作和库管理作相关的规定和要求。一是从资源的开发角度提出资源开发时需达到的最低技术标准,二是从用户应用的角度出发,提出资源所需的属性和 关系,其中属性包括资源本身的属性以及从操作资源便捷的角度考虑的数据属性和数据类型,三是从资源的评价角度,给出了判定资源的好坏等因素的判定依据和级 别,四是从管理者的管理角度,给出资源管理过程中所需的基本功能,以及对总的体系结构的最基本要求,最后制定了用于指导规范双语教育资源开发、双语教育资 源转换以及资源库建设的规范性内容。 本文提出了新疆双语教学资源库的构建方案。依据新疆双语教育资源库的建设规范,从双语教育资源获取、管理、服务以及资源库软硬件平台建设四个方面给出了云 计算环境下的新疆双语教学资源库构建方案,并对数据层、业务层、应用层以及辅助支撑层进行详细阐述。 本文研究了语音教学中发音质量评测方法。研究了发音质量评测的各个重要组成部分,对语音信号分析和声学特征的提取方法,声学模型建模流程,以及分类和评估 中置信度算法进行研究。 本文研究了发音评测中声学模型、数据训练评分模型的改进。对声学模型进行了深入的研究,在训练数据中加入背景噪声,增强了模型的抗噪声能力;采用基于说话 人的倒谱均值方差规整(SCMVN),降低信道及说话人个体特性的影响;用和待测语音相同地域的朗读数据做最大后验概率(MAP)自适应方法,使模型带有 当地方言口音的发音特点;用自然口语数据做MAP自适应方法,使模型较好地描述自然口语中比较随意的发音现象。研究了依据人工评分的角度和准则,通过使用 批量的语音数据和专家评分数据训练评分模型,让机器对人工评分做了有效的模拟。用语音识别技术分析语音,提取一系列评价特征,通过SVM回归把这些评价特 征映射为质量分数等方法改进数据训练评分模型。 本文依据前述的理论和解决的关键技术,构建了新疆双语教学平台。以中小学教材为基础,应用资源库建设、语言识别与发音指导等关键技术,结合多语种信息处 理、多媒体、动漫等信息化技术,以语言资源库、语音语料库、教学资源库和双语词库为基础,构建了基于语音技术的新疆“双语”教学平台。平台采用维汉双语操 作界面,以电子书的形式对教材进行多角度、多方位的展现,具有标准话朗读、跟读、动漫、影片、幻灯片、维汉电子词典以及生字拼音、笔划、结构、部首、字 义、组词等学习功能,尤其具有语音评测和发音指导功能,可营造虚拟交互、图文并茂的汉语学习环境,拓展了教学和学习空间。系统中还附带双语水平评测系统, 其中的考试题库包含了覆盖大部分教学课文知识点的题目,既可以检查学生日常双语学习的程度,也可以对双语教师进行教学水平测试。 研究过程中采集、标注、整理了不同区域和多信道5000多小时的少数民族语音语料,建立了新疆少数民族语音语料库。在双语教学语言学习资源库中,建立了 30000多个双语教学资源,56.8万条嵌入式双解维汉词条,38049个语音评测试题。 最后对本文的研究内容进行了总结,对后续的研究内容和工作进行了展望。 |
公开日期 | 2013-05-31 |
源URL | [http://ir.xjipc.cas.cn/handle/365002/2476] ![]() |
专题 | 新疆理化技术研究所_多语种信息技术研究室 |
推荐引用方式 GB/T 7714 | 蒋同海. 基于语音技术的“双语”教学平台研发及关键技术研究[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2013. |
入库方式: OAI收割
来源:新疆理化技术研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。