中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
开放环境下的高保真人脸图像生成研究

文献类型:学位论文

作者傅朝友
答辩日期2022-05-19
文献子类博士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师赫然
关键词人脸图像生成 开放环境 对偶变分生成 异质人脸识别
学位专业模式识别与智能系统
英文摘要

人脸图像生成是机器学习和计算机视觉领域重要的研究方向之一,并且在互动娱乐和公共安全领域有着广阔的应用前景。近年来,随着深度学习的兴起,人脸图像生成迎来了蓬勃发展。在闭合环境下,当前的生成方法已经可以生成逼真的人脸图像。然而,在面对开放环境下小样本、大姿态和跨光谱等复杂因素时,当前的方法仍然存在很多问题。例如,开放环境下通常只能获取少量的异质人脸数据,这使得当前依赖于大规模训练数据的方法难以生成多样化的高保真异质人脸图像。本文以小样本下的无条件人脸生成、大姿态的人脸编辑和跨光谱的人脸转换这三个具体的任务为切入点,研究开放环境下的高保真人脸图像生成。主要的贡献如下:

1. 提出一种无条件对偶变分生成思路来解决异质人脸数据不足的问题:从噪声中采样生成大量多样化的配对异质数据,并且这些数据可作为数据增广来提升异质人脸识别模型的性能。该思路引申出两种渐进式的方法。第一种方法直接在小样本的异质数据集上训练一种精心设计的对偶变分生成器,学习配对数据的联合分布并约束其身份一致性。训练完成后,新生成的配对数据组成正样本对,用于训练异质人脸识别模型学习域不变的身份表达。但由于小样本的异质数据集的限制,新生成数据的身份多样性不足。为此,第二种方法引入一种正交约束解耦身份和属性。通过这种方式,大规模可见光人脸图像丰富的身份信息可以被融入生成的异质数据,大幅增加其身份多样性。此时,不同次采样生成的人脸图像可以被近似看做负样本对,用于训练异质人脸识别模型学习高判别的身份表达。大量的实验验证了以上两种方法的有效性。

2. 提出一种基于结构先验的解耦合方法,用于大姿态的高清人脸编辑。该方法采用两个相关联的阶段来简化这一复杂的任务。第一阶段引入一种条件生成器来预测目标人脸边界图,用以建模姿态和表情。对于数据集中不存在的姿态和表情,该方法利用一种条件回归损失间接地训练生成器。第二阶段在人脸边界图的指导下生成目标人脸图像。一个代理网络和一种特征阈值损失被用于辅助解耦结构和纹理,使得生成的结果更为精细化。大量的实验验证了该方法的有效性。此外,本文也公开了一个新的高质量多视角人脸数据集MVF-HQ(High-Quality Multi-View Face),共包含120,283张图像(分辨率可达6000x4000)。相较于其他公开的高清人脸数据集,MVF-HQ在数据规模、分辨率和人脸属性上都具有显著的优势。

3. 提出一种基于形状对齐的概率逐像素光谱转换方法。配对的异质人脸图像之间总是存在形状差异,这增加了光谱转换的难度。为此,该方法采用一种两阶段的处理策略:首先制作对齐的配对数据,再利用对齐后的配对数据训练光谱转换器。在3D人脸模型的辅助下,该方法将一种光谱下的人脸的形状与另一光谱下的人脸的形状进行对齐。但由于3D人脸模型难以刻画人脸属性的形状,比如头发和眼镜,对齐后的配对数据之间仍然存在像素差异。在这种情况下,该方法进一步引入一种概率逐像素损失,其在训练光谱转换器的同时能够自动发现像素差异,使得光谱转换器可以只专注于光谱转换这一个任务。大量的实验表明该方法可以采用轻量化的网络结构,但仍然取得很好的表现。

语种中文
页码128
源URL[http://ir.ia.ac.cn/handle/173211/48656]  
专题毕业生_博士学位论文
自动化研究所_智能感知与计算研究中心
通讯作者傅朝友
推荐引用方式
GB/T 7714
傅朝友. 开放环境下的高保真人脸图像生成研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。