基于用户查询日志的命名实体挖掘
文献类型:期刊论文
作者 | 翟海军; 郭嘉丰; 王小磊; 许洪波 |
刊名 | 中文信息学报
![]() |
出版日期 | 2010 |
卷号 | 000期号:1.0页码:71 |
关键词 | 计算机应用 中文信息处理 分开命名实体 用户查询日志 话题模型 |
ISSN号 | 1003-0077 |
英文摘要 | 针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体问的分布相似度进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际上命名实体往往可能从属于多个类别。该文通过引入一个弱指导话题模型t利用少量的人工指导信息,很好地解决了实体的类别模糊性,提高了挖掘的有效性。实验表明该文提出的方法在实体挖掘性能上显著优于已有的方法。 |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/32052] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学技术大学 2.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 翟海军,郭嘉丰,王小磊,等. 基于用户查询日志的命名实体挖掘[J]. 中文信息学报,2010,000(1.0):71. |
APA | 翟海军,郭嘉丰,王小磊,&许洪波.(2010).基于用户查询日志的命名实体挖掘.中文信息学报,000(1.0),71. |
MLA | 翟海军,et al."基于用户查询日志的命名实体挖掘".中文信息学报 000.1.0(2010):71. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。