基于词典的汉藏句子对齐研究与实现
文献类型:期刊论文
作者 | 于新 ; 吴健 ; 洪锦玲 |
刊名 | 中文信息学报
![]() |
出版日期 | 2011 |
期号 | 4页码:57-62 |
关键词 | 汉藏句子对齐 词典 分词粒度 平行语料库 藏文信息处理 |
中文摘要 | 双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,针对藏文语言的特殊性,提出基于词典的汉藏句子对齐。整理了对齐所用双语词典,并对其词语覆盖率进行了评价。在汉藏句子对齐过程中发现汉语与藏文的分词粒度不同的问题,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。 |
公开日期 | 2011-10-10 |
源URL | [http://124.16.136.157/handle/311060/13909] ![]() |
专题 | 软件研究所_基础软件国家工程研究中心_期刊论文 |
推荐引用方式 GB/T 7714 | 于新,吴健,洪锦玲. 基于词典的汉藏句子对齐研究与实现[J]. 中文信息学报,2011(4):57-62. |
APA | 于新,吴健,&洪锦玲.(2011).基于词典的汉藏句子对齐研究与实现.中文信息学报(4),57-62. |
MLA | 于新,et al."基于词典的汉藏句子对齐研究与实现".中文信息学报 .4(2011):57-62. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。