中国科学院机构知识库网格系统: 基于机器学习的语音驱动人脸动画方法

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

基于机器学习的语音驱动人脸动画方法

文献类型：期刊论文


作者	陈益强; 高文; 王兆其; 姜大龙
刊名	软件学报
出版日期	2003
卷号	14.0 期号:002 页码:215
关键词	机器学习语音驱动人脸动画语音识别模式识别
ISSN号	1000-9825
英文摘要	语音与唇动面部表情的同步是人脸动画的难点之一，综合利用聚类和机器学习的方法学习语音信号和唇动面部表情之间的同步关系，并应用于基于MEPG－4标准的语音驱动人脸动画系统中，在大规模音视频同步数据库的基础上，利用无监督聚类发现了能有效表征人脸运动的基本模式，采用神经网络学习训练，实现了从含韵律的语音特征到人脸运动基本模式的直接映射，不仅回避了语音识别鲁棒性不高的缺陷，同时学习的结果还可以直接驱动人脸网格，最后给出对语音驱动人脸动画系统定量和定性的两种分析评价方法，实验结果表明，基于机器学习的语音驱动人脸动画不仅能有效地解决语音视频同步的难题，增强动画的真实感和副真性，同时基于MPEG－4的学习结果独立于人脸模型，还可用来驱动各种不同的人脸模型，包括真实视频，2D卡通人物以及3维虚拟人脸。
语种	英语
源URL	[http://119.78.100.204/handle/2XEOYT63/35977]
专题	中国科学院计算技术研究所期刊论文_中文
作者单位	中国科学院计算技术研究所
推荐引用方式 GB/T 7714	陈益强,高文,王兆其,等. 基于机器学习的语音驱动人脸动画方法[J]. 软件学报,2003,14.0(002):215.
APA	陈益强,高文,王兆其,&姜大龙.(2003).基于机器学习的语音驱动人脸动画方法.软件学报,14.0(002),215.
MLA	陈益强,et al."基于机器学习的语音驱动人脸动画方法".软件学报 14.0.002(2003):215.

入库方式： OAI收割

来源：计算技术研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。