面向多媒体数据的关系学习算法及应用研究
文献类型:学位论文
作者 | 马璇![]() |
答辩日期 | 2021-05 |
文献子类 | 硕士 |
授予单位 | 中国科学院自动化研究所 |
授予地点 | 智能化大厦三层第五会议室 |
导师 | 徐常胜 |
关键词 | 多媒体 关系学习 深度学习 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 随着数码设备的普及和移动互联网的发展,文本、图像和视频等多媒体数据在社交媒体平台上大量涌现。 多媒体数据中包含了丰富的语义信息,也存在着复杂的关系。对多媒体数据中的关系进行研究,不仅能够促进计算机对多媒体数据的智能理解,同时能够推动多媒体相关任务的发展,如多媒体检索、多媒体问答等。因此,开展此项研究具有重要的理论意义与应用价值。 多媒体数据具有(1)底层特征与高层语义间存在“语义鸿沟”,(2)多模态,(3)时空复杂等特性。这些特性使得对多媒体数据中的关系进行学习十分具有挑战性。本文围绕如何设计有效的关系学习算法,以及如何将关系学习算法应用到具体任务中展开,结合深度学习方法,自底向上地研究了三个问题:首先针对多媒体数据中的物体,研究了多模态物体关系学习,完成了图像关系检测任务;接着以行为为研究对象,学习了多模态的行为语义关系,完成了行为推理任务;最后,对多模态个体行为中的时序关系进行学习,完成了个体的健康状态预测任务。 论文的主要工作和创新点归纳如下: 1. 多模态物体关系学习。 2. 多模态行为语义关系学习。 3. 多模态个体行为时序关系学习。 |
语种 | 中文 |
页码 | 90 |
源URL | [http://ir.ia.ac.cn/handle/173211/44775] ![]() |
专题 | 自动化研究所_模式识别国家重点实验室_多媒体计算与图形学团队 |
推荐引用方式 GB/T 7714 | 马璇. 面向多媒体数据的关系学习算法及应用研究[D]. 智能化大厦三层第五会议室. 中国科学院自动化研究所. 2021. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。