中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于对抗学习的多域艺术图像生成

文献类型:学位论文

作者林敏轩
答辩日期2021-05-29
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所智能化大厦三层第五会议室
导师董未名
关键词图像翻译 风格化 艺术图像生成 多域生成 生成式对抗网络
学位名称工学硕士
学位专业计算机应用技术
英文摘要

随着计算机和互联网技术的快速发展,图像已经成为了一种主流的信息载
体,因此也催生了一系列对于图像生成和编辑等技术的需求。近年来,基于生成
式对抗网络的图像生成技术取得了长足进步,对艺术图像生成也产生了许多影
响。艺术图像生成旨在把输入的自然图片和指定风格进行融合,生成具有目标风
格纹理但却保留自然图片内容的风格化结果,在影音、娱乐和社交等领域均有广
泛应用。对于艺术图像,每个画家的作品集合自然形成一个域。但由于域数量庞
大,模型训练耗时等原因限制,单独对每个画家域训练生成模型需要消耗较高的
成本,因此单模型的多域生成能力成为了一个研究热点。图像翻译是一种处理该
类跨域图像生成任务的关键技术,它采用统一的生成模型处理图像到图像的生
成任务,在多域艺术图像生成领域中发挥重要作用。
本文聚焦多域条件下的艺术图像生成,提出一个基于对抗学习的风格对齐
模块和两种多域图像翻译框架。考虑在不同的引导条件下风格信息和内容信息
的融合方式,解决了联合条件引导的多域艺术图像生成、多域多模式风格空间构
建以及多引导条件下的多域多模式图像风格化等挑战。本文的贡献包括:
(1)提出一种联合条件引导的多域图像翻译框架。利用画作的一些特有属
性,将画家、年代和流派等属性作为控制变量,对自然图片进行多域风格化。模
型采用了非对称的循环生成架构,基于对抗训练来实现多域的艺术图像生成。
(2)提出基于对抗学习的风格对齐模块。研究在同时支持样例引导和随机采
样引导条件下的风格空间构建问题,使用风格对齐模块代替以往采用相对熵构
建风格空间的方式,缓解了可能出现的模式崩溃现象。
(3)提出一种分布对齐的多域多模式图像翻译框架。通过两个特征提取分支
分别提取风格和内容信息,采用双路对抗架构在风格空间和像素空间分别进行
对抗训练,实现了多引导条件下的多域多模式艺术图像生成能力。

语种中文
页码86
源URL[http://ir.ia.ac.cn/handle/173211/45048]  
专题自动化研究所_模式识别国家重点实验室_多媒体计算与图形学团队
推荐引用方式
GB/T 7714
林敏轩. 基于对抗学习的多域艺术图像生成[D]. 中国科学院自动化研究所智能化大厦三层第五会议室. 中国科学院大学. 2021.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。