中国科学院机构知识库网格系统: 面向Mpeg4的逼真三维人脸建模和语音人脸表情融合研究

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

面向Mpeg4的逼真三维人脸建模和语音人脸表情融合研究

文献类型：学位论文


作者	赵向阳
学位类别	博士
答辩日期	2005
授予单位	中国科学院声学研究所
授予地点	中国科学院声学研究所
关键词	三维重建人脸纹理映射人脸表情合成三维人头建模视觉语音合成
其他题名	Mpeg4-Oriented Realistic 3D Face Modeling and Research on Synchronous Fusion of Speech and Facial Expressions
中文摘要	二十多年来，语音驱动真实感三维人脸动画的研究已经取得了一些阶段性成果，但是整个系统距离实际应用还有相当的差距，造成这种情况有两个主要原因：其一，虽然现有的真实感人脸建模己经达到了比较高的水平，但是方法要么过于复杂、实现困难、缺乏实时性，要么生成的人脸过于简单、不逼真，还没有完全成熟的满足人们需求的真实感人脸建模方法。其二，人们还没有完全掌握语音和人脸表情、唇动合成之间的映射驱动机制，没能找到实现自然、流畅、逼真语音动画的好方法。在此背景下，本文研究特定人脸的自适应三维建模方法和简单的语音人脸表情融合。本文的具体工作如下：1．在研究自校准三维重建算法中，联系理论和实验数据固有的特征有效地解决了空间对偶绝对二次曲线的正定近似问题，使自校准方程获得了更精确的解，将物体的投影重建准确地校准为比例重建。实验结果表明，整个重建算法的各中间步骤都达到了亚象素级精度，最后恢复的特征点平均误差为1.5个象素左右，重建获得了很高的准确性。2．在研究RBF人头模型调整算法并对比了它的三种改进措施优缺点基础上，提出了人头模型分区域限制性柔滑调整算法。该算法基于人脸特征点分布具有区域性，将总的模型调整基于各区域调整基础上，各区域调整时，对RBF内插函数的平滑性、形似性、曲度、变化趋势提出了合适的限制条件，并将它们融入了统一的限制性目标函数中，使特定人头建模更平滑、自然，给人更好的形似感。3．研究了图像特征点提取方法和基于数据提纯的多视图图像特征点匹配方法，并基于数据提纯思想提出了一种全自动图像拼接融合算法，为纹理映射时提取多视图广角纹理或柱面纹理。用该算法刘一拍摄的多张照片进行拼接融合实验表明，整个算法对特征点提取误差和光照影响都有很强的容错能力。4.提出了基于模型分块的视角相关人脸纹理映射新方法。该方法的核心思想是将模型分块，并将分界线映射到各视图上确定出清晰有用纹理和冗余纹理，冗余纹理被剔除，分块没有改变模型拓扑结构，只起到了区分纹理映射区域的作用，这样在块与块之间形成了规则纹理过渡带，克服了以往同类算法需要在不规则区域里逐象素点设计混合权值的难点。与传统方法相比，该方法在速度、需要的内存量、人脸合成质量等方面都有较大改善。5．研究了以五类基本元音的LPC参数和基于声韵母的语音方式来提供人脸部肌肉群的运动参数，从而实现了简单的实时语音动画系统，为进一步研究提供了研究平台。
语种	中文
公开日期	2011-05-07
页码	125
源URL	[http://ir.ioa.ac.cn/handle/311008/950]
专题	声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文
推荐引用方式 GB/T 7714	赵向阳. 面向Mpeg4的逼真三维人脸建模和语音人脸表情融合研究[D]. 中国科学院声学研究所. 中国科学院声学研究所. 2005.

入库方式： OAI收割

来源：声学研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。