汉藏短语对抽取中短语译文获取方法研究
文献类型:期刊论文
作者 | 诺明花 ; 吴健 ; 刘汇丹 ; 丁治明 |
刊名 | 中文信息学报
![]() |
出版日期 | 2011 |
期号 | 3页码:112-117 |
关键词 | 藏文语块 短语译文获取 藏文信息处理 中文信息处理 |
中文摘要 | 该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术。考虑现阶段藏文资源不足,词法句法相关技术不成熟,该文提出藏文词串频率统计方法(TSM)和藏文词序列相交算法(TIA)两种方法来获取藏语译文。其中TSM抽取1-1连续和非连续短语准确率达到90%左右,但遗漏1-n情况。TIA能够抽取1-n连续和非连续藏文语块,准确率达到81%。 |
公开日期 | 2011-10-10 |
源URL | [http://124.16.136.157/handle/311060/13943] ![]() |
专题 | 软件研究所_基础软件国家工程研究中心_期刊论文 |
推荐引用方式 GB/T 7714 | 诺明花,吴健,刘汇丹,等. 汉藏短语对抽取中短语译文获取方法研究[J]. 中文信息学报,2011(3):112-117. |
APA | 诺明花,吴健,刘汇丹,&丁治明.(2011).汉藏短语对抽取中短语译文获取方法研究.中文信息学报(3),112-117. |
MLA | 诺明花,et al."汉藏短语对抽取中短语译文获取方法研究".中文信息学报 .3(2011):112-117. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。