面向语音翻译的文本规范化和端到端建模方法研究
文献类型:学位论文
作者 | 董倩倩![]() |
答辩日期 | 2021-05 |
文献子类 | 博士 |
授予单位 | 中科院自动化所 |
授予地点 | 中科院自动化所 |
导师 | 徐波 |
关键词 | 语音翻译、级联系统、文本规范化、端到端模型 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 语音翻译是指让机器完成从源语言的语音信号自动翻译生成目标语言的文本的过程,其基本设想是让计算机像人类译员一样充当持不同语言说话人之间翻译的角色。伴随着全球化大趋势,国际交流及信息传递日益增长,日常生活、外贸、医疗、电子商务等领域对语音翻译技术拥有着巨大而迫切的需求。主流的语音翻译系统分别独立地训练语音识别模块和机器翻译模块,然后将两个模块进行简单的拼接。近期,随着深度学习技术的发展以及数据爆炸式的增长,研究者们开始了对端到端技术的探索。在此背景下,本文以深度学习技术为理论基础,首先从级联系统出发,研究了级联系统中的文本规范化技术。然后对端到端语音翻译的模型结构和训练方法展开了研究。本文的主要研究成果总结如下。 |
语种 | 中文 |
页码 | 124 |
源URL | [http://ir.ia.ac.cn/handle/173211/44968] ![]() |
专题 | 数字内容技术与服务研究中心_听觉模型与认知计算 |
推荐引用方式 GB/T 7714 | 董倩倩. 面向语音翻译的文本规范化和端到端建模方法研究[D]. 中科院自动化所. 中科院自动化所. 2021. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。