基于篇章上下文的统计机器翻译方法
文献类型:期刊论文
作者 | 于惠; 谢军; 熊皓; 吕雅娟![]() |
刊名 | 中文信息学报
![]() |
出版日期 | 2013 |
卷号 | 000期号:002页码:86 |
关键词 | 统计机器翻译 上下文信息 向量空间模型 |
ISSN号 | 1003-0077 |
英文摘要 | 上下文信息对于统计机器翻译(Statistical Machine Translation,SMT)中的规则选择是很重要的,但是之前的SMT模型只利用了句子内部的上下文信息,没有利用到整个篇章的上下文信息。该文提出了一种利用篇章上下文信息的方法来提高规则选择的准确性,从而提高翻译的质量。首先利用向量空间模型获得训练语料的文档和测试集中文档的相似度,然后把相似度作为一个新的特征加入到短语模型中。实验结果表明,在英语到汉语的翻译工作中,该方法可以显著提高翻译质量。在NIST-08和CWMT-08两个测试集上BLEU值都有显著的提高。 |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/26084] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 于惠,谢军,熊皓,等. 基于篇章上下文的统计机器翻译方法[J]. 中文信息学报,2013,000(002):86. |
APA | 于惠,谢军,熊皓,吕雅娟,刘群,&林守勋.(2013).基于篇章上下文的统计机器翻译方法.中文信息学报,000(002),86. |
MLA | 于惠,et al."基于篇章上下文的统计机器翻译方法".中文信息学报 000.002(2013):86. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。