中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于增强文本表示的新闻推荐方法及其面向特定领域的应用研究

文献类型:学位论文

作者孙颖
答辩日期2022-05-22
文献子类硕士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师毛文吉
关键词新闻推荐 增强文本表示 类别层次结构 候选新闻交互 面向领域的推荐
学位名称工程硕士
学位专业计算机技术
英文摘要

  随着信息技术的迅速发展,大众通过访问新闻网站来获取世界资讯和动态,在线新闻已经成为最重要的互联网基础服务之一。网络平台上的海量新闻在为用户提供多样化阅读选择的同时,信息量的空前增加也带来信息过载问题,使用户难以获取自己真正感兴趣的内容。这种状况不仅严重影响用户的阅读体验,也会造成信息资源的浪费。新闻推荐旨在向用户呈现满足其阅读需求的新闻,通过提高用户对所关注新闻的访问效率来应对信息过载问题。新闻推荐不仅是推荐系统和自然语言处理交叉方向的一个重要研究课题,同时也具有较好的应用价值。不同于其他推荐任务,新闻推荐具有新闻文章内容丰富和“用户-新闻”历史交互稀疏的特点,因而面临如何充分利用新闻语义信息以及如何挖掘历史数据中新闻之间的关系这两个挑战。另外,新闻推荐在舆情分析等实际应用场景中具有重要作用,因而如何结合用户对特定领域的兴趣进行有针对性的推荐也是一个应用挑战。现有的新闻推荐方法在挖掘新闻语义信息时缺乏对新闻类别层次等信息的有效利用且忽略了历史数据中候选新闻之间的交互关系,同时尚未考虑实际应用场景下面向特定领域对用户的阅读兴趣进行建模。

  针对现有新闻推荐工作存在的问题和挑战,本论文在新闻表示学习的过程中使用新闻的类别层次和候选新闻之间的内容交互信息增强新闻文本的语义表示,建立基于增强文本表示的新闻推荐方法,包括结合文本和类别信息的多层次新闻推荐方法以及基于候选文本内容交互的新闻推荐增强方法。在此基础上,本论文进一步建立面向特定领域的新闻推荐方法,满足用户快速获取特定领域信息的需求,更好地服务于舆情分析等实际应用。

  本论文的主要工作和研究贡献归纳如下:

  1.为了有效利用新闻中不同粒度的语义信息,提出结合文本和类别信息的多层次新闻推荐方法。该方法首先使用新闻类别、子类别以及文本层次的信息分别进行新闻表示学习、用户偏好建模、点击概率预测,再融合不同层次上的点击概率作为最终结果。通过显式利用新闻的类别层次结构,该方法能够充分挖掘用户与候选新闻在不同语义层次上的关联,从多个角度确定推荐结果。基准数据集上的实验结果验证了所提出方法的有效性,证实了新闻类别和子类别对推荐的重要性。

  2.为了建模一组候选新闻之间的竞争关系,提出基于候选文本内容交互的新闻推荐增强方法。该方法以多文本交互建模的方式进行候选新闻表示学习,生成交互增强的候选新闻表示。作为一种增强性的方法,该方法以前文提出的多层次新闻推荐方法为基础,在文本层次上进行多文本交互建模。基准数据集上的实验结果表明所提出的方法有效,并且相对于原有的多层次新闻推荐方法具有明显的性能提升。

  3.考虑到舆情分析等实际应用场景下用户对特定领域新闻的需求,聚焦面向领域的新闻推荐问题,提出面向特定领域的新闻推荐方法。该方法在用户偏好建模阶段学习用户的一般偏好和特定偏好,分别代表用户历史行为中反映出的兴趣模式以及用户对特定领域信息的需求;之后基于以上两种偏好计算点击概率并进行融合,作为最终预测结果。从大规模公开数据集中构建3个安全相关的领域数据集,实验结果表明所提出的方法达到了最佳效果。

语种中文
页码82
源URL[http://ir.ia.ac.cn/handle/173211/48714]  
专题自动化研究所_复杂系统管理与控制国家重点实验室_互联网大数据与安全信息学研究中心
毕业生_硕士学位论文
推荐引用方式
GB/T 7714
孙颖. 基于增强文本表示的新闻推荐方法及其面向特定领域的应用研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。