中文网页搜索日志中的特殊命名实体挖掘
文献类型:期刊论文
作者 | 张磊1; 王斌1; 靖红芳1; 吴丽辉2 |
刊名 | 哈尔滨工业大学学报
![]() |
出版日期 | 2011 |
卷号 | 43.0期号:005页码:119 |
关键词 | 特殊命名实体 数据挖掘 信息检索 网页搜索日志 |
ISSN号 | 0367-6234 |
英文摘要 | 利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统的自动化程度和识别的效果均达到实用的要求. |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/36369] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学院计算技术研究所 2.中国科学院办公厅 |
推荐引用方式 GB/T 7714 | 张磊,王斌,靖红芳,等. 中文网页搜索日志中的特殊命名实体挖掘[J]. 哈尔滨工业大学学报,2011,43.0(005):119. |
APA | 张磊,王斌,靖红芳,&吴丽辉.(2011).中文网页搜索日志中的特殊命名实体挖掘.哈尔滨工业大学学报,43.0(005),119. |
MLA | 张磊,et al."中文网页搜索日志中的特殊命名实体挖掘".哈尔滨工业大学学报 43.0.005(2011):119. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。