中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于LSI的日地空间领域科学数据语义检索模型

文献类型:期刊论文

作者刘春蔚; 邹自明; 佟继周
刊名中国科学院大学学报
出版日期2016
卷号33期号:5页码:711-719
ISSN号2095-6134
关键词日地空间 科学数据 语义检索 浅层语义索引 元数据
其他题名LSI-based semantic retrieval model for scientific data in solar-terrestrial space field
通讯作者佟继周
中文摘要日地空间系统科学的数据具有体量大、种类多、结构复杂的特征,不同概念、不同事件之间的相互关联为该领域内的科学数据检索提出了很高的要求. 然而目前该领域内依然以基于传统的关键词检索技术为主,严重影响检索结果的质量. 提出一种数据语义检索模型,它是在对日地空间学科元信息提取的基础上,使用文本处理的方法将提取信息转换为词项-文档矩阵,进一步使用潜在语义索引技术对其进行分析,计算出检索条目与不同数据集的语义相关度,从而根据语义相关度向用户推荐科学数据. 实验对比表明,该模型的召回率明显优于传统方法,且具有很高的准确率. 该模型同时支持对科学数据进行语义标注和关键词提取,亦可用于其他领域科学数据检索.
英文摘要The scientific data of solar-terrestrial space science has huge volume,wide variety,and complex structure. The correlations between different domain concepts and astro-events put forward high requirements of the scientific data retrieval in this field. However,the scientific data retrieval modules on the mainstream data share and publishing systems in this field are still built on the conventional keyword-based retrieval method. We present a semantic retrieval approach for the solarterrestrial space system scientific data. Based on the semantic information extracted from scientific metadata of each scientific dataset,we get the TF-idf matrix using traditional text processing methods. Then latent semantic indexing further analyzes this matrix,and a similarity value is obtained to rank the relevance of a result to its search request. The experimental results show that the approach has a higher recall rate than conventional methods and maintains a high precision. This approach can be applied in other disciplines as well.
收录类别CSCD
语种中文
CSCD记录号CSCD:5806188
源URL[http://ir.nssc.ac.cn/handle/122/5643]  
专题国家空间科学中心_运控部/科学卫星综合运控中心
推荐引用方式
GB/T 7714
刘春蔚,邹自明,佟继周. 基于LSI的日地空间领域科学数据语义检索模型[J]. 中国科学院大学学报,2016,33(5):711-719.
APA 刘春蔚,邹自明,&佟继周.(2016).基于LSI的日地空间领域科学数据语义检索模型.中国科学院大学学报,33(5),711-719.
MLA 刘春蔚,et al."基于LSI的日地空间领域科学数据语义检索模型".中国科学院大学学报 33.5(2016):711-719.

入库方式: OAI收割

来源:国家空间科学中心

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。