中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于多特征融合和图匹配的维汉句子对齐

文献类型:期刊论文

作者倪耀群; 许洪波; 程学旗
刊名中文信息学报
出版日期2016
卷号30.0期号:004页码:124
关键词句子对齐 人名、地名翻译 多特征融合 二部图最佳匹配
ISSN号1003-0077
英文摘要维吾尔语新闻网页与对应的中文翻译网页在内容上往往并非完全可比,主要表现为双语句子序列的错位甚至部分句子缺失,这给维汉句子对齐造成了困难。此外,作为新闻要素的人名地名很多是未登录词,这进一步增加了维汉句子对齐的难度。为了提高维汉词汇的匹配概率,作者自动提取中文人名、地名并翻译为维吾尔译名,构造双语名称映射表并加入维汉双语词典。然后用维文句中词典词对应的中文译词在中文句中进行串匹配,以避免中文分词错误,累计所有匹配词对得到双语句对的词汇互译率。最后融合数字、标点、长度特征计算双语句对的相似度。在所有双语句子相似度构成的矩阵上,使用图匹配算法寻找维汉平行句对,在900个句对上最高达到95.67%的维汉对齐准确率。
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/37201]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
倪耀群,许洪波,程学旗. 基于多特征融合和图匹配的维汉句子对齐[J]. 中文信息学报,2016,30.0(004):124.
APA 倪耀群,许洪波,&程学旗.(2016).基于多特征融合和图匹配的维汉句子对齐.中文信息学报,30.0(004),124.
MLA 倪耀群,et al."基于多特征融合和图匹配的维汉句子对齐".中文信息学报 30.0.004(2016):124.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。