面向维汉机器翻译的语料筛选技术研究
文献类型:期刊论文
作者 | 孔金英; 温政阳; 杨雅婷![]() ![]() |
刊名 | 计算机应用研究
![]() |
出版日期 | 2016 |
卷号 | 33期号:12页码:3654-3657 |
关键词 | 维汉机器翻译 语料筛选 语言模型 |
ISSN号 | 1001-3695 |
DOI | 10.3969/j.issn.1001-3695.2016.12.030 |
英文摘要 | 统计机器翻译是近十年来的主流机器翻译技术,其在维汉机器翻译中良好的性能已经得到了广泛的认可。维汉统计机器翻译的最终翻译性能同样是受这几方面的影响:翻译模型、语言模型、语料质量和规模等。旨在通过对维汉双语训练语料的筛选来提高最终的机器翻译性能。在相关学者的研究基础上,提出了改进的IBM1模型评价句对齐质量、双语语言模型困惑度进行语料筛选和多种筛选指标综合求交集的方法。这些方法没有语言特性的依赖,支持维汉双语语料的筛选。通过实验可证明,使用这些方法筛选而来的语料训练出的维汉翻译模型的性能更优。 |
CSCD记录号 | CSCD:5873831 |
源URL | [http://ir.xjipc.cas.cn/handle/365002/4500] ![]() |
专题 | 新疆理化技术研究所_多语种信息技术研究室 |
作者单位 | 1.中国科学院声学研究所 2.乌鲁木齐市公安局电子数据鉴定实验中心 3.中国科学院大学 4.新疆民族语音语言信息处理重点实验室 5.中国科学院新疆理化技术研究所 |
推荐引用方式 GB/T 7714 | 孔金英,温政阳,杨雅婷,等. 面向维汉机器翻译的语料筛选技术研究[J]. 计算机应用研究,2016,33(12):3654-3657. |
APA | 孔金英,温政阳,杨雅婷,王磊,&李晓.(2016).面向维汉机器翻译的语料筛选技术研究.计算机应用研究,33(12),3654-3657. |
MLA | 孔金英,et al."面向维汉机器翻译的语料筛选技术研究".计算机应用研究 33.12(2016):3654-3657. |
入库方式: OAI收割
来源:新疆理化技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。