面向低资源神经机器翻译的回译方法
文献类型:期刊论文
作者 | 张文博1,2,3; 张新路1,2,3; 杨雅婷1,2,3![]() |
刊名 | 厦门大学学报(自然科学版)
![]() |
出版日期 | 2021 |
卷号 | 60期号:4页码:675-679 |
关键词 | 神经机器翻译 低资源语言 回译 领域相似性 预训练 |
ISSN号 | 0438-0479 |
英文摘要 | 神经机器翻译在高资源情况下已经获得了巨大的成功,但是对低资源情况翻译效果还有待提高.目前,维吾尔语-汉语(维汉)翻译和蒙古语-汉语(蒙汉)翻译都属于低资源情况下的翻译任务.本文提出将汉语单语数据按照领域相似性划分成多份单语数据,并通过回译方法分段利用不同的单语数据训练翻译模型,然后借助模型平均和模型集成等方法进一步提升维汉和蒙汉翻译质量.使用第16届全国机器翻译大会(CCMT 2020)的评测数据进行实验,结果表明该方法可以有效地提升维汉和蒙汉翻译的翻译质量. |
源URL | [http://ir.xjipc.cas.cn/handle/365002/7845] ![]() |
专题 | 新疆理化技术研究所_多语种信息技术研究室 中国科学院新疆理化技术研究所 |
作者单位 | 1.新疆民族语音语言信息处理实验室 2.中国科学院大学计算机科学与技术学院 3.中国科学院新疆理化技术研究所 |
推荐引用方式 GB/T 7714 | 张文博1,2,3,张新路1,2,3,杨雅婷1,2,3,等. 面向低资源神经机器翻译的回译方法[J]. 厦门大学学报(自然科学版),2021,60(4):675-679. |
APA | 张文博1,2,3,张新路1,2,3,杨雅婷1,2,3,董瑞1,2,3,&李晓1,2,3.(2021).面向低资源神经机器翻译的回译方法.厦门大学学报(自然科学版),60(4),675-679. |
MLA | 张文博1,2,3,et al."面向低资源神经机器翻译的回译方法".厦门大学学报(自然科学版) 60.4(2021):675-679. |
入库方式: OAI收割
来源:新疆理化技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。