基于中心语块扩展的汉藏基本名词短语对的识别
文献类型:期刊论文
作者 | 诺明花 ; 刘汇丹 ; 马龙龙 ; 吴健 ; 丁治明 |
刊名 | 中文信息学报
![]() |
出版日期 | 2013 |
卷号 | 27期号:4页码:63-69 |
关键词 | 藏文信息处理 基本名词短语 中心语块扩展 Tibetan information processing BaseNP head-phrase extension |
ISSN号 | 1003-0077 |
其他题名 | Chinese-Tibetan Base Noun Phrase Alignment Based on Head-Phrase Extension |
中文摘要 | 该文提出汉藏基本名词短语对齐框架.从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏语的特殊性,提出基于中心语块扩展的藏语基本名词短语识别方法.提出词典与自动词对齐结果相结合的方法和基于序列相交的方法抽取藏语中心语块,再以扩展可信度为依据扩展中心语块.实验结果表明,基于序列相交的方法所抽取的汉藏基本名词短语对能够节省人工校正的工作量,有效辅助于汉藏基本名词短语库的建设. |
英文摘要 | This paper presents a Chinese-Tibetan base noun phrase alignment method.Its a two-phase procedure: Chinese base noun phrases identification and finding their Tibetan correspondences.We propose head-phrase extension based Tibetan base noun phrase identification method in accordance with the morphologic characteristics of Tibetan. In the first phase,we use sequence intersection operation to get Tibetan head-phrase.In the second phase, head-phrase extension confidence is defined and applied to determine the boundary of correspondence.Experimental result indicates that sequence intersection outperforms other methods in head-phrase extension.Chinese-Tibetan base noun phrase produced by our method is effective in reducing subsequent manual check,facilitating the construction of translation lexicon on phrase level. |
收录类别 | CSCD |
语种 | 中文 |
CSCD记录号 | CSCD:4907555 |
公开日期 | 2014-12-16 |
源URL | [http://ir.iscas.ac.cn/handle/311060/16847] ![]() |
专题 | 软件研究所_软件所图书馆_期刊论文 |
推荐引用方式 GB/T 7714 | 诺明花,刘汇丹,马龙龙,等. 基于中心语块扩展的汉藏基本名词短语对的识别[J]. 中文信息学报,2013,27(4):63-69. |
APA | 诺明花,刘汇丹,马龙龙,吴健,&丁治明.(2013).基于中心语块扩展的汉藏基本名词短语对的识别.中文信息学报,27(4),63-69. |
MLA | 诺明花,et al."基于中心语块扩展的汉藏基本名词短语对的识别".中文信息学报 27.4(2013):63-69. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。