基于学术产出挖掘的用户兴趣建模研究
文献类型:研究报告
作者 | 姚晓娜 |
完成日期 | 2013 |
关键词 | 用户兴趣建模 文本挖掘 本体 实体关系对 |
中文摘要 | 个性化服务实现的核心在于用户建模——建立用户兴趣、目标和行为的数据结构。用户模型所包含信息的丰富程度,决定个性化服务的可靠准确程度和水平。数字图书馆的用户大多为科研人员,他们的学术产出也是当前数字图书馆的重要资源。学术产出不仅包含了科研人员的领域背景和研究方向,也隐含了关于科研人员研究兴趣的信息。 本研究选择地学领域为目标领域,以Web of Science文献数据库为学术产出的数据来源,从中采集了若干科研人员的学术产出数据,并对其中蕴含的兴趣信息进行梳理和分析。然后在复用用户本体FOAF、兴趣本体WI、地学本体SWEET等已有本体的基础上,设计了基于本体的用户兴趣模型,建立了学术产出到用户兴趣模型的映射关系。其中作者、机构、期刊等元数据,直接作为兴趣项,对于标题、摘要等非结构化的数据,采用了开源文本挖掘工具GATE进行实体识别和关系抽取,并将得到的实体关系对作为兴趣项。在分析兴趣度的各种影响因素的基础上,对各兴趣项的兴趣度进行计算。最后将生成的用户兴趣实例存储到Sesame本体数据库中,支持通过SeRQL和SPARQL语言进行查询。 本研究以科研用户公开发表的学术产出为数据源,首先避免了用户兴趣建模初期存在的冷启动问题;然后采用本体技术进行用户兴趣建模,并提出一种通过实体关系对表示用户兴趣的方法,与使用单个关键词或实体的表示方法相比,语义信息更为丰富,能更好的描述用户兴趣;最后实现了用户兴趣信息的语义化存储和检索,为以后实现基于本体的个性化服务打下基础。 |
语种 | 中文 |
源URL | [http://ir.las.ac.cn/handle/12502/6540] ![]() |
专题 | 文献情报中心_中国科学院兰州文献情报中心_信息系统部 |
推荐引用方式 GB/T 7714 | 姚晓娜. 基于学术产出挖掘的用户兴趣建模研究. 2013. |
入库方式: OAI收割
来源:文献情报中心
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。