中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向维汉神经机器翻译的双向重排序模型分析

文献类型:期刊论文

作者张新路; 李晓; 杨雅婷; 王磊; 董瑞
刊名北京大学学报(自然科学版)
出版日期2020
卷号56期号:1页码:31-38
关键词神经机器翻译 集成学习 双向重排序 维吾尔语
ISSN号0479-8023
英文摘要

在维吾尔语到汉语等低资源语料库上,神经机器翻译的拟合训练容易陷入局部最优解,导致单一模型的翻译结果可能不是全局最优解。针对此问题,通过集成策略,有效整合多个模型预测的概率分布,将多个翻译模型作为一个整体;同时采用基于交叉熵的重排序方法,将具有相反解码方向的翻译模型相结合,最终选出综合得分最高的候选翻译作为输出。在CWMT2015维汉平行语料上的实验结果表明,与单一的Transformer模型相比,改进后的方法提升4.82个BLEU值。

CSCD记录号CSCD:6683485
源URL[http://ir.xjipc.cas.cn/handle/365002/7224]  
专题新疆理化技术研究所_多语种信息技术研究室
中国科学院新疆理化技术研究所
作者单位1.新疆民族语音语言信息处理实验室
2.中国科学院大学
3.中国科学院新疆理化技术研究所
推荐引用方式
GB/T 7714
张新路,李晓,杨雅婷,等. 面向维汉神经机器翻译的双向重排序模型分析[J]. 北京大学学报(自然科学版),2020,56(1):31-38.
APA 张新路,李晓,杨雅婷,王磊,&董瑞.(2020).面向维汉神经机器翻译的双向重排序模型分析.北京大学学报(自然科学版),56(1),31-38.
MLA 张新路,et al."面向维汉神经机器翻译的双向重排序模型分析".北京大学学报(自然科学版) 56.1(2020):31-38.

入库方式: OAI收割

来源:新疆理化技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。