面向Internet的中文新词语检测
文献类型:期刊论文
作者 | 孟遥2; 于浩2; 西野文人2; 亢世勇3; 邹纲1; 刘洋1; 刘群1 |
刊名 | 中文信息学报
![]() |
出版日期 | 2004 |
卷号 | 18.0期号:006页码:1 |
关键词 | 计算机应用 中文信息处理 新词语 自动检测 |
ISSN号 | 1003-0077 |
英文摘要 | 随着社会的飞速发展,新词语不断地在日常生活中涌现出来。搜集和整理这些新词语,是中文信息处理中的一个重要研究课题。本文提出了一种自动检测新词语的方法,通过大规模地分析从Internet上采集而来的网页,建立巨大的词和字串的集合,从中自动检测新词语,而后再根据构词规则对自动检测的结果进行进一步的过滤,最终抽取出采集语料中存在的新词语。根据该方法实现的系统,可以寻找不限长度和不限领域的新词语,目前正应用于《现代汉语新词语信息(电子)词典》的编纂,在实用中大大的减轻了人工查找新词语的负担。 |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/32432] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中科院计算技术研究所,数字化实验室 2.富士通研究开发中心有限公司 3.烟台师范学院,中文系 |
推荐引用方式 GB/T 7714 | 孟遥,于浩,西野文人,等. 面向Internet的中文新词语检测[J]. 中文信息学报,2004,18.0(006):1. |
APA | 孟遥.,于浩.,西野文人.,亢世勇.,邹纲.,...&刘群.(2004).面向Internet的中文新词语检测.中文信息学报,18.0(006),1. |
MLA | 孟遥,et al."面向Internet的中文新词语检测".中文信息学报 18.0.006(2004):1. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。