中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
利用构建语义词典的查询自动分类方法

文献类型:期刊论文

作者岳峰 ; 孙亮 ; 王宽全 ; 王永吉 ; 左旺孟
刊名哈尔滨工业大学学报
出版日期2008
卷号40期号:7页码:1094-1098
关键词搜索引擎 查询分类 语义词典 基于主题的Web信息采集 search engine query classification semantic lexicon focused web crawling
ISSN号0367-6234
其他题名automatic query classification via constructing semantic lexicon
中文摘要为解决传统的文档分类方法和手工分类方法都不适宜于处理查询分类的问题,提出了一种基于Web的自动构建特定主题的语义词典的方法来分类搜索查询,通过基于主题的Web信息采集和bootstrapping,由某个主题的少量关键词逐步扩充,最终得到该主题的语义词典及词典中每个单词的相对词频.Web中信息的冗余和各主题语义上的差别使各主题的语义词典中单词的种类和数量存在很大差异,这种差异可以用来对用户的搜索查询进行分类.实验结果表明,利用语义词典可以较准确地将用户的查询分类,同时该分类方法基本上不需要人工介入,且可适应搜索查询覆盖面广和实时性强的特点,较好地解决了搜索查询分类的问题.
收录类别ei,cscd,wanfang,cnki
语种中文
公开日期2010-08-17
附注To solve the infeasibility of traditional text classification methods or the manual classification method for classifying search queries, a method of constructing specific topical semantic lexicon from the Web is proposed. Starting from a few Keywords of a specific topic, this method expands the topical semantic lexicon step by step utilizing focused web crawling and bootstrapping. Because of the redundancy of information on the Web and the semantic distinction between different topics, the diversity of words of different topics is evident. This property can be used to classify the user search queries. Experiments show that, based on the semantic lexicon, user queries can be classified accurately. This classification method is achieved automatically with few manual operations, and it can classify the diverse and updated search queries effectively.
源URL[http://124.16.136.157/handle/311060/3268]  
专题软件研究所_互联网软件技术实验室 _期刊论文
推荐引用方式
GB/T 7714
岳峰,孙亮,王宽全,等. 利用构建语义词典的查询自动分类方法[J]. 哈尔滨工业大学学报,2008,40(7):1094-1098.
APA 岳峰,孙亮,王宽全,王永吉,&左旺孟.(2008).利用构建语义词典的查询自动分类方法.哈尔滨工业大学学报,40(7),1094-1098.
MLA 岳峰,et al."利用构建语义词典的查询自动分类方法".哈尔滨工业大学学报 40.7(2008):1094-1098.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。