中国科学院机构知识库网格系统: 中文网页搜索日志中的特殊命名实体挖掘

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

中文网页搜索日志中的特殊命名实体挖掘

文献类型：期刊论文


作者	张磊 1; 王斌 1; 靖红芳 1; 吴丽辉 2
刊名	哈尔滨工业大学学报
出版日期	2011
卷号	43.0 期号:005 页码:119
关键词	特殊命名实体数据挖掘信息检索网页搜索日志
ISSN号	0367-6234
英文摘要	利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统的自动化程度和识别的效果均达到实用的要求.
语种	英语
源URL	[http://119.78.100.204/handle/2XEOYT63/36369]
专题	中国科学院计算技术研究所期刊论文_中文
作者单位	1.中国科学院计算技术研究所 2.中国科学院办公厅
推荐引用方式 GB/T 7714	张磊,王斌,靖红芳,等. 中文网页搜索日志中的特殊命名实体挖掘[J]. 哈尔滨工业大学学报,2011,43.0(005):119.
APA	张磊,王斌,靖红芳,&吴丽辉.(2011).中文网页搜索日志中的特殊命名实体挖掘.哈尔滨工业大学学报,43.0(005),119.
MLA	张磊,et al."中文网页搜索日志中的特殊命名实体挖掘".哈尔滨工业大学学报 43.0.005(2011):119.

入库方式： OAI收割

来源：计算技术研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。