中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于中心语块扩展的汉藏基本名词短语对的识别

文献类型:期刊论文

作者诺明花 ; 刘汇丹 ; 马龙龙 ; 吴健 ; 丁治明
刊名中文信息学报
出版日期2013
卷号27期号:4页码:63-69
关键词藏文信息处理 基本名词短语 中心语块扩展 Tibetan information processing BaseNP head-phrase extension
ISSN号1003-0077
其他题名Chinese-Tibetan Base Noun Phrase Alignment Based on Head-Phrase Extension
中文摘要该文提出汉藏基本名词短语对齐框架.从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏语的特殊性,提出基于中心语块扩展的藏语基本名词短语识别方法.提出词典与自动词对齐结果相结合的方法和基于序列相交的方法抽取藏语中心语块,再以扩展可信度为依据扩展中心语块.实验结果表明,基于序列相交的方法所抽取的汉藏基本名词短语对能够节省人工校正的工作量,有效辅助于汉藏基本名词短语库的建设.
英文摘要This paper presents a Chinese-Tibetan base noun phrase alignment method.Its a two-phase procedure: Chinese base noun phrases identification and finding their Tibetan correspondences.We propose head-phrase extension based Tibetan base noun phrase identification method in accordance with the morphologic characteristics of Tibetan. In the first phase,we use sequence intersection operation to get Tibetan head-phrase.In the second phase, head-phrase extension confidence is defined and applied to determine the boundary of correspondence.Experimental result indicates that sequence intersection outperforms other methods in head-phrase extension.Chinese-Tibetan base noun phrase produced by our method is effective in reducing subsequent manual check,facilitating the construction of translation lexicon on phrase level.
收录类别CSCD
语种中文
CSCD记录号CSCD:4907555
公开日期2014-12-16
源URL[http://ir.iscas.ac.cn/handle/311060/16847]  
专题软件研究所_软件所图书馆_期刊论文
推荐引用方式
GB/T 7714
诺明花,刘汇丹,马龙龙,等. 基于中心语块扩展的汉藏基本名词短语对的识别[J]. 中文信息学报,2013,27(4):63-69.
APA 诺明花,刘汇丹,马龙龙,吴健,&丁治明.(2013).基于中心语块扩展的汉藏基本名词短语对的识别.中文信息学报,27(4),63-69.
MLA 诺明花,et al."基于中心语块扩展的汉藏基本名词短语对的识别".中文信息学报 27.4(2013):63-69.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。