中国科学院机构知识库网格系统: 一种基于大规模语料的新词识别方法

文献类型：期刊论文


作者	贺敏; 龚才春; 张华平; 程学旗
刊名	计算机工程与应用
出版日期	2007
卷号	43.0 期号:021 页码:157
关键词	新词邻接类别单字成词概率双字耦合度
ISSN号	1002-8331
英文摘要	提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方法可行有效,能够应用到词典编撰,术语提取等领域。
语种	英语
源URL	[http://119.78.100.204/handle/2XEOYT63/36401]
专题	中国科学院计算技术研究所期刊论文_中文
作者单位	中国科学院计算技术研究所
推荐引用方式 GB/T 7714	贺敏,龚才春,张华平,等. 一种基于大规模语料的新词识别方法[J]. 计算机工程与应用,2007,43.0(021):157.
APA	贺敏,龚才春,张华平,&程学旗.(2007).一种基于大规模语料的新词识别方法.计算机工程与应用,43.0(021),157.
MLA	贺敏,et al."一种基于大规模语料的新词识别方法".计算机工程与应用 43.0.021(2007):157.

入库方式： OAI收割

下载0