一种基于long short-term memory的唇语识别方法
文献类型:期刊论文
作者 | 马宁; 田国栋; 周曦 |
刊名 | 中国科学院大学学报
![]() |
出版日期 | 2018-01-15 |
期号 | 1页码:109-117 |
关键词 | 唇语识别 long short-term memory 计算机视觉 |
英文摘要 | 唇动视觉信息是说话内容的重要载体。受嘴唇外观、背景信息和说话习惯等影响,即使说话者说相同的内容,唇动视觉信息也会相差很大。为解决唇语视觉信息多样性的问题,提出一种基于long short-term memory(LSTM)的新的唇语识别方法。以往大多数的方法从嘴唇外表信息入手。本方法用嘴唇关键点坐标描述嘴唇形变信息作为唇语视频的特征,它具有类内一致性和类间区分性的特点。然后利用LSTM对特征进行时序编码,它能学习具有区分性和泛化性的空间-时序特征。在公开的唇语数据集GRID、MIRACL-VC和Oulu VS上对本方法做了针对分割的单词或短语的说话者独立的唇语识别评估。在GRID和MIRACL... |
语种 | 中文 |
源URL | [http://119.78.100.138/handle/2HOD01W0/5132] ![]() |
专题 | 中国科学院重庆绿色智能技术研究院 |
作者单位 | (1) 中国科学院大学(2)中国科学院重庆绿色智能技术研究院 |
推荐引用方式 GB/T 7714 | 马宁,田国栋,周曦. 一种基于long short-term memory的唇语识别方法[J]. 中国科学院大学学报,2018(1):109-117. |
APA | 马宁,田国栋,&周曦.(2018).一种基于long short-term memory的唇语识别方法.中国科学院大学学报(1),109-117. |
MLA | 马宁,et al."一种基于long short-term memory的唇语识别方法".中国科学院大学学报 .1(2018):109-117. |
入库方式: OAI收割
来源:重庆绿色智能技术研究院
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。