中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向汉维机器翻译的神经网络语言模型

文献类型:期刊论文

作者李毓; 杨雅婷; 李晓; 米成刚; 董瑞
刊名厦门大学学报(自然科学版)
出版日期2019
卷号58期号:2页码:189-194
关键词维吾尔语 机器翻译 语言模型 词向量 长短时序记忆网络
ISSN号0438-0479
英文摘要

针对传统神经网络语言模型方法只关注词语之间关系或者词语内部信息而导致维吾尔语语言模型困惑度(PPL)过高的问题,提出了融入词素信息的维吾尔语神经网络语言模型.该方法在传统神经网络语言模型的基础上添加了词内结构建模层及合并层,利用双向长短时序记忆网络来捕捉词内结构信息,并与word2vec训练好的词向量相结合作为神经网络语言模型的输入;同时还采用重构N元语法(N-gram)语言模型的方式将神经网络模型应用到汉维统计机器翻译中.实验表明该模型的PPL降低了19.93,在汉维统计机器翻译任务中机器双语互译评估(BLEU)值提升了0.28个百分点.

CSCD记录号CSCD:6461382
源URL[http://ir.xjipc.cas.cn/handle/365002/5693]  
专题新疆理化技术研究所_多语种信息技术研究室
中国科学院新疆理化技术研究所
作者单位1.中国科学院大学计算机科学与技术学院
2.中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
推荐引用方式
GB/T 7714
李毓,杨雅婷,李晓,等. 面向汉维机器翻译的神经网络语言模型[J]. 厦门大学学报(自然科学版),2019,58(2):189-194.
APA 李毓,杨雅婷,李晓,米成刚,&董瑞.(2019).面向汉维机器翻译的神经网络语言模型.厦门大学学报(自然科学版),58(2),189-194.
MLA 李毓,et al."面向汉维机器翻译的神经网络语言模型".厦门大学学报(自然科学版) 58.2(2019):189-194.

入库方式: OAI收割

来源:新疆理化技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。