中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于词典的汉藏句子对齐研究与实现

文献类型:期刊论文

作者于新 ; 吴健 ; 洪锦玲
刊名中文信息学报
出版日期2011
期号4页码:57-62
关键词汉藏句子对齐 词典 分词粒度 平行语料库 藏文信息处理
中文摘要双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,针对藏文语言的特殊性,提出基于词典的汉藏句子对齐。整理了对齐所用双语词典,并对其词语覆盖率进行了评价。在汉藏句子对齐过程中发现汉语与藏文的分词粒度不同的问题,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。
公开日期2011-10-10
源URL[http://124.16.136.157/handle/311060/13909]  
专题软件研究所_基础软件国家工程研究中心_期刊论文
推荐引用方式
GB/T 7714
于新,吴健,洪锦玲. 基于词典的汉藏句子对齐研究与实现[J]. 中文信息学报,2011(4):57-62.
APA 于新,吴健,&洪锦玲.(2011).基于词典的汉藏句子对齐研究与实现.中文信息学报(4),57-62.
MLA 于新,et al."基于词典的汉藏句子对齐研究与实现".中文信息学报 .4(2011):57-62.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。