中国科学院机构知识库网格系统: 从视频到语言:视频标题生成与描述研究综述

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

从视频到语言:视频标题生成与描述研究综述

文献类型：期刊论文


作者	汤鹏杰; 王瀚漓
刊名	自动化学报
出版日期	2022
卷号	48 期号:2 页码:375-397
关键词	视频描述卷积神经网络循环神经网络语段生成情感表达逻辑语义
ISSN号	0254-4156
DOI	10.16383/j.aas.c200662
英文摘要	视频标题生成与描述是使用自然语言对视频进行总结与重新表达.由于视频与语言之间存在异构特性,其数据处理过程较为复杂.本文主要对基于“编码-解码”架构的模型做了详细阐述,以视频特征编码与使用方式为依据,将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法,并对各类模型进行了归纳与总结.最后,对当前存在的问题及可能趋势进行了总结与展望,指出需要生成融合情感、逻辑等信息的结构化语段,并在模型优化、数据集构建、评价指标等方面进行更为深入的研究.
源URL	[http://ir.ia.ac.cn/handle/173211/56406]
专题	自动化研究所_学术期刊_自动化学报
推荐引用方式 GB/T 7714	汤鹏杰,王瀚漓. 从视频到语言:视频标题生成与描述研究综述[J]. 自动化学报,2022,48(2):375-397.
APA	汤鹏杰,&王瀚漓.(2022).从视频到语言:视频标题生成与描述研究综述.自动化学报,48(2),375-397.
MLA	汤鹏杰,et al."从视频到语言:视频标题生成与描述研究综述".自动化学报 48.2(2022):375-397.

入库方式： OAI收割

来源：自动化研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。