中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向低资源神经机器翻译的回译方法

文献类型:期刊论文

作者张文博1,2,3; 张新路1,2,3; 杨雅婷1,2,3; 董瑞1,2,3; 李晓1,2,3
刊名厦门大学学报(自然科学版)
出版日期2021
卷号60期号:4页码:675-679
关键词神经机器翻译 低资源语言 回译 领域相似性 预训练
ISSN号0438-0479
英文摘要

神经机器翻译在高资源情况下已经获得了巨大的成功,但是对低资源情况翻译效果还有待提高.目前,维吾尔语-汉语(维汉)翻译和蒙古语-汉语(蒙汉)翻译都属于低资源情况下的翻译任务.本文提出将汉语单语数据按照领域相似性划分成多份单语数据,并通过回译方法分段利用不同的单语数据训练翻译模型,然后借助模型平均和模型集成等方法进一步提升维汉和蒙汉翻译质量.使用第16届全国机器翻译大会(CCMT 2020)的评测数据进行实验,结果表明该方法可以有效地提升维汉和蒙汉翻译的翻译质量.

源URL[http://ir.xjipc.cas.cn/handle/365002/7845]  
专题新疆理化技术研究所_多语种信息技术研究室
中国科学院新疆理化技术研究所
作者单位1.新疆民族语音语言信息处理实验室
2.中国科学院大学计算机科学与技术学院
3.中国科学院新疆理化技术研究所
推荐引用方式
GB/T 7714
张文博1,2,3,张新路1,2,3,杨雅婷1,2,3,等. 面向低资源神经机器翻译的回译方法[J]. 厦门大学学报(自然科学版),2021,60(4):675-679.
APA 张文博1,2,3,张新路1,2,3,杨雅婷1,2,3,董瑞1,2,3,&李晓1,2,3.(2021).面向低资源神经机器翻译的回译方法.厦门大学学报(自然科学版),60(4),675-679.
MLA 张文博1,2,3,et al."面向低资源神经机器翻译的回译方法".厦门大学学报(自然科学版) 60.4(2021):675-679.

入库方式: OAI收割

来源:新疆理化技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。