中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
融合图像与文本的多模态情感分析方法研究

文献类型:学位论文

作者徐楠
答辩日期2020-05-30
文献子类博士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师毛文吉
关键词多模态情感分析 图像语义 信息交互 属性级 多模态数据增强
学位名称工学博士
学位专业计算机应用技术
英文摘要

随着互联网的发展,社交媒体已经成为用户发表个人观点、分享信息及表达情感的重要平台。情感分析作为社交媒体分析的一个重要研究课题,是舆情监测、口碑营销、商品推荐等诸多实际问题的基础,在公共安全、商业等领域具有重要的研究意义和应用价值。

随着多模态的社交媒体平台如抖音、Instagram等的普及,社交媒体数据形式呈现多模态趋势(如文本、图像等),提升了用户获取信息的效率。但是,由于多模态数据的复杂性和异构性,使计算机在多模态数据内容理解上更加困难,为传统的基于文本的情感分析任务带来了新的挑战。本论文研究 融合图像与文本的多模态情感分析方法,从多模态数据表征层、特征融合层、属性层及数据处理层多个角度,聚焦多模态数据之间的语义关联、信息交互、细粒度的属性级情感建模及多模态数据增强等研究问题,以增强计算机对多模态数据的感知能力,提升多模态情感分析模型的性能。

本论文的主要研究贡献包括:

  1. 针对已有多模态情感分析方法在多模态数据表征层忽略了图像中包含的隐含语义信息的问题,本论文分别提出了基于图像描述和基于图像语义特征的多模态情感分析模型。前者利用图像描述生成器将图像翻译成一段描述性的文本来增强图像语义理解,并采用层次化语义注意力网络聚焦图像描述中的关键词及文本中的关键词和关键句;后者通过显式地从图像中抽取场景和实体特征来增强图像语义理解,并基于图像语义特征来引导注意力机制,以聚焦文本中与图像相关的关键信息。

  2. 针对已有多模态情感分析方法在多模态特征融合层忽略了各模态数据之间存在信息互补和增强作用的问题,本论文提出了基于信息交互的多模态情感分析模型。该模型在多模态情感分析任务中首次建模了图像和文本之间的相互作用,通过设计交互记忆机制来实现图像检索文本关键词和文本定位图像关键区域,以捕获图像和文本中的情感关键内容,为多模态情感分析任务提供可解释依据。

  3. 针对多模态情感分析领域缺乏面向属性级情感分析相关研究的问题,本论文首次提出了属性级多模态情感分析这一新的研究任务,并建立了首个基于属性级信息交互的多模态情感分析模型。该模型建模了属性到文本、属性到图像以及图像和文本之间复杂的信息交互过程,通过设计多模态记忆网络和多交互注意力机制,以聚焦图像和文本中与给定属性相关的情感关键内容。为了验证模型的有效性,还发布了一个属性级多模态情感分析标准数据集,为该新任务提供了重要的数据资源。

  4. 针对多模态数据分析任务中有标注样本稀少且已有数据增强方法仅面向单模态数据领域的问题,本论文首次提出了多模态数据增强任务,并建立了基于跨模态匹配的多模态数据增强框架。该框架采用预训练的跨模态匹配器从现有的有标注单模态数据集中自动合成多模态数据,并将合成数据经过筛选和过滤后用于多模态分类器增强。

语种中文
页码126
源URL[http://ir.ia.ac.cn/handle/173211/39149]  
专题自动化研究所_复杂系统管理与控制国家重点实验室_互联网大数据与安全信息学研究中心
通讯作者徐楠
推荐引用方式
GB/T 7714
徐楠. 融合图像与文本的多模态情感分析方法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。