上海光源产品管理系统及其全文检索子系统的改进
文献类型:学位论文
作者 | 佟兴帆 |
学位类别 | 硕士 |
答辩日期 | 2009-05-20 |
授予单位 | 中国科学院上海应用物理研究所 |
授予地点 | 上海应用物理研究所 |
导师 | 邓辉宇 |
关键词 | 上海光源产品数据管理 全文检索 Lucene算法 中文分词 |
其他题名 | SSRF-PDM and its full-text retrieval improvement |
中文摘要 | 上海光源工程(Shanghai Synchrotron Radiation Facility, SSRF)是十五期间的国家重大科学工程,为提高工程管理水平,进一步完善信息化体系,PDM(Product Data Management)产品数据管理十分必要。 上海光源产品管理系统(SSRF-PDM)采用的是UGS公司的Teamcenter平台,但其检索功能不完善,检索结果是无序排列的。本文将通过在Teamcenter平台上嵌入Lucene,来完善系统的检索排序问题,并从以下3个方面阐述: 首先,本文就课题的背景、意义以及应用进行了简要介绍,包括上海光源,SSRF-PDM网络结构,系统配置以及组织结构创建,并重点研究了SSRF-PDM系统结构,本文的研究工作都是基于该系统进行。 第二大部分为理论部分,阐述了信息检索模型分类-布尔模型,VSM模型等;Lucene与原系统的检索算法与实现机制的比较,并着重阐述了中文分词技术:基于理解,基于统计,和字符串匹配等分词方法以及目前分词技术仍存在的问题。 最后为系统实现部分,主要包括两个大方面:改进的检索系统开发与测试。开发部分,包括建立索引(Indexing),针对不同格式文件(.ppt,.doc,.pdf,.xls)进行的文本转化与文本抽取,Lucene搜索(Searching)的开发,以及socket多线程通信-Client端与Server端;而测试部分,对改进前后的检索系统分别进行了英文,中文,数字以及复合型关键字检索测试,重点考察改进后系统对输出结果的排序功能验证,总结其检索效果以及展望。 |
语种 | 中文 |
公开日期 | 2012-04-11 |
页码 | 90 |
源URL | [http://ir.sinap.ac.cn/handle/331007/7371] ![]() |
专题 | 上海应用物理研究所_中科院上海应用物理研究所2004-2010年 |
推荐引用方式 GB/T 7714 | 佟兴帆. 上海光源产品管理系统及其全文检索子系统的改进[D]. 上海应用物理研究所. 中国科学院上海应用物理研究所. 2009. |
入库方式: OAI收割
来源:上海应用物理研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。