中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种基于long short-term memory的唇语识别方法

文献类型:期刊论文

作者马宁; 田国栋; 周曦
刊名中国科学院大学学报
出版日期2018-01-15
期号1页码:109-117
关键词唇语识别 long short-term memory 计算机视觉
英文摘要唇动视觉信息是说话内容的重要载体。受嘴唇外观、背景信息和说话习惯等影响,即使说话者说相同的内容,唇动视觉信息也会相差很大。为解决唇语视觉信息多样性的问题,提出一种基于long short-term memory(LSTM)的新的唇语识别方法。以往大多数的方法从嘴唇外表信息入手。本方法用嘴唇关键点坐标描述嘴唇形变信息作为唇语视频的特征,它具有类内一致性和类间区分性的特点。然后利用LSTM对特征进行时序编码,它能学习具有区分性和泛化性的空间-时序特征。在公开的唇语数据集GRID、MIRACL-VC和Oulu VS上对本方法做了针对分割的单词或短语的说话者独立的唇语识别评估。在GRID和MIRACL...
语种中文
源URL[http://119.78.100.138/handle/2HOD01W0/5132]  
专题中国科学院重庆绿色智能技术研究院
作者单位(1) 中国科学院大学(2)中国科学院重庆绿色智能技术研究院
推荐引用方式
GB/T 7714
马宁,田国栋,周曦. 一种基于long short-term memory的唇语识别方法[J]. 中国科学院大学学报,2018(1):109-117.
APA 马宁,田国栋,&周曦.(2018).一种基于long short-term memory的唇语识别方法.中国科学院大学学报(1),109-117.
MLA 马宁,et al."一种基于long short-term memory的唇语识别方法".中国科学院大学学报 .1(2018):109-117.

入库方式: OAI收割

来源:重庆绿色智能技术研究院

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。