深度神经网络在维汉机器翻译中的应用研究
文献类型:学位论文
作者 | 孔金英 |
答辩日期 | 2017-05-21 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院新疆理化技术研究所 |
导师 | 李晓 |
关键词 | 维汉机器翻译 深度神经网络 调序模型 未登录词 神经机器翻译 |
学位名称 | 博士 |
学位专业 | 计算机应用技术 |
英文摘要 | 以深度神经网络为代表的新一代人工智能技术,已经为图像处理和语音识别等领域带来了颠覆性的变革。作为人工智能领域最为火热的研究方向之一,机器翻译迎来了前所未有的发展契机。工业界和学术界都认为,深度神经网络技术能够帮助机器翻译取得更好的结果。神经网络技术在机器翻译上的应用分为两种类型:一种是利用神经网络技术优化改进传统的机器翻译系统,另一种则是拥有全新架构的神经机器翻译系统。传统的统计机器翻译模型由语言模型、翻译模型、调序模型等组成,前一种方法利用神经网络技术优化这些模块,后一种方法直接通过深度神经网络编码输入的句子信息并解码生成译文。维汉机器翻译作为机器翻译领域的一个分支,有着语言跨度大、语言形态信息丰富等特点。由于维吾尔语句法分析、词法分析等语言学研究的滞后,难以通过加入语言学特征改善基于统计的维汉机器翻译模型性能,影响了维汉统计机器翻译系统译文质量的提升。基于深度神经网络技术,本文针对维汉机器翻译所面临的译文语序问题和未登录词问题,提出了以下解决方案:1. 基于深度学习的调序规则表优化模型针对维汉机器翻译中的译文语序问题,本文提出了一种基于深度学习的调序规则表优化模型。该模型由生成模块,判别模块和基于最小差异的过滤策略组成。生成模块利用递归自动编码机向量化调序规则,判别模块使用多层感知机对调序规则进行打分评价,基于最小差异的过滤策略针对调序规则表进行优化过滤。使用本模型优化后的调序规则表重新训练调序模型用于解码,可以加快维汉机器翻译最终的解码速度和提升最终的译文质量。2. 基于注意力的维汉神经机器翻译模型针对维汉机器翻译中的长距离调序问题,本文提出了一种基于注意力的维汉神经机器翻译模型。该模型在一般的基于注意力的神经机器翻译的基础上进行改进,引进了外界的先验知识。基于注意力的维汉神经机器翻译模型在解码输出译文阶段,综合引入的外界汉语语言模型得分和神经机器翻译模型得分选出最优的候选译文。本模型有效的解决了维汉机器翻译中的长距离调序问题,适用于非规范性文本的翻译,比如口语翻译。3. 基于指针神经网络的维汉机器翻译框架针对维汉机器翻译中的未登录词问题,本文提出了一种基于指针神经网络的维汉机器翻译框架。该框架由前处理模块,改进的基于指针的神经机器翻译模型和后处理模块组成。前处理模块规则化维吾尔语,使用修改过的语料训练一个改进的基于指针的神经机器翻译模型和一个短语翻译模型。改进的基于指针的神经机器翻译模型在转换网络的选择策略上偏向于指针网络,这使得指针网络的功能更加强大。后处理模块首先使用训练好的神经机器翻译模型将维吾尔语句子翻译成粗糙的译文,然后用训练好的短语翻译模型将粗糙的译文重译为最终的译文。该框架可以有效的解决维汉机器翻译中的未登录词问题,并改善译文质量。 |
源URL | [http://ir.xjipc.cas.cn/handle/365002/4932] ![]() |
专题 | 新疆理化技术研究所_多语种信息技术研究室 |
推荐引用方式 GB/T 7714 | 孔金英. 深度神经网络在维汉机器翻译中的应用研究[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2017. |
入库方式: OAI收割
来源:新疆理化技术研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。