中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于多源数据的媒体转载效果分析方法研究

文献类型:学位论文

作者刘贺静
答辩日期2021-05-22
文献子类硕士
授予单位中国科学院自动化研究所
授予地点北京
导师李秋丹
关键词多源数据 媒体转载效果 转载行为预测 热点挖掘 反馈分析
学位专业社会计算
英文摘要

移动网络技术的快速革新和智能手机的高度普及重塑了在线媒体形态,为自动分析媒体转载模式、新闻影响力及内容公信力等关键要素带来了诸多挑战。深入分析多通道的媒体转载效果有助于预判新闻传播路径、了解新闻热点态势、把握受众舆论走向,辅助管理部门做出及时调整并制定决策。本文旨在应用自然语言处理技术与深度学习算法,借鉴异质网络表示学习、短文本主题发现及讽刺性反馈原因子句识别等问题的最新研究成果,从媒体转载行为预测、转载热点挖掘及转载反馈原因子句识别等三个方面开展基于多源数据的转载效果分析方法研究,主要工作及创新点总结如下:

1. 实体信息增强的媒体转载行为预测方法。新闻内容中例如人物、地点及组织等实体信息体现了媒体不同关注侧重,随媒体的转载行为建立动态关联;同时媒体间存在地域等属性特征。为充分利用新闻内容中隐含的实体关联和媒体间的关联信息,本文提出实体信息增强的媒体转载行为预测方法。该方法将媒体-实体间的多种关联关系映射至异质关联网络中,基于HIN2Vec算法建模包含关联关系的媒体及实体的嵌入表示,作为注意力机制来源引导模型学习具有关联属性和深层语义的新闻内容表示,实现对媒体转载行为的预测工作。

2. 基于语义关联及句法依存的转载热点挖掘方法。为解决现有基于关键词的主题分析方法在挖掘转载热点时对转载模式适应性不够、转载热点区分度及可解释性有待增强的技术挑战,本文提出基于语义关联及句法依存的转载热点挖掘方法。该方法针对新闻转载时产生的主题多样性和描述差异性,考虑转载标题的单词对语义关联及句法成分共现关系,构建语义-句法成分共现矩阵,将其作为约束条件融合至转载热点的隐向量表示学习中,获得相似新闻簇,实现对转载热点的代表性短语挖掘。

3. 基于多视角的讽刺性转载反馈原因子句识别方法。转载反馈及原因包含了受众的真实情感及立场,为解决讽刺性反馈在分析转载效果时带来的复杂性挑战,本文提出基于多视角的讽刺性转载反馈原因子句识别方法。该方法设计了混合语义度量机制,以不同方式显式建模讽刺性反馈与原因句间的语义关联,使用注意力机制自动捕获不同语境下各语义度量的重要程度。在句对级别的表示学习阶段,模型将上下文反馈与讽刺性反馈组成句对,以增强对语句间因果逻辑的捕获,实现基于多视角的讽刺性转载反馈原因子句识别。构建讽刺性转载反馈原因子句识别数据集对所提方法进行验证,与基准方法相比,所提方法的F1值为71.14%AUC值为62.92%

语种中文
页码91
源URL[http://ir.ia.ac.cn/handle/173211/44936]  
专题自动化研究所_复杂系统管理与控制国家重点实验室_互联网大数据与安全信息学研究中心
推荐引用方式
GB/T 7714
刘贺静. 基于多源数据的媒体转载效果分析方法研究[D]. 北京. 中国科学院自动化研究所. 2021.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。