中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向维汉机器翻译的语料筛选技术研究

文献类型:期刊论文

作者孔金英; 温政阳; 杨雅婷; 王磊; 李晓
刊名计算机应用研究
出版日期2016
卷号33期号:12页码:3654-3657
关键词维汉机器翻译 语料筛选 语言模型
ISSN号1001-3695
DOI10.3969/j.issn.1001-3695.2016.12.030
英文摘要

统计机器翻译是近十年来的主流机器翻译技术,其在维汉机器翻译中良好的性能已经得到了广泛的认可。维汉统计机器翻译的最终翻译性能同样是受这几方面的影响:翻译模型、语言模型、语料质量和规模等。旨在通过对维汉双语训练语料的筛选来提高最终的机器翻译性能。在相关学者的研究基础上,提出了改进的IBM1模型评价句对齐质量、双语语言模型困惑度进行语料筛选和多种筛选指标综合求交集的方法。这些方法没有语言特性的依赖,支持维汉双语语料的筛选。通过实验可证明,使用这些方法筛选而来的语料训练出的维汉翻译模型的性能更优。

CSCD记录号CSCD:5873831
源URL[http://ir.xjipc.cas.cn/handle/365002/4500]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位1.中国科学院声学研究所
2.乌鲁木齐市公安局电子数据鉴定实验中心
3.中国科学院大学
4.新疆民族语音语言信息处理重点实验室
5.中国科学院新疆理化技术研究所
推荐引用方式
GB/T 7714
孔金英,温政阳,杨雅婷,等. 面向维汉机器翻译的语料筛选技术研究[J]. 计算机应用研究,2016,33(12):3654-3657.
APA 孔金英,温政阳,杨雅婷,王磊,&李晓.(2016).面向维汉机器翻译的语料筛选技术研究.计算机应用研究,33(12),3654-3657.
MLA 孔金英,et al."面向维汉机器翻译的语料筛选技术研究".计算机应用研究 33.12(2016):3654-3657.

入库方式: OAI收割

来源:新疆理化技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。