中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
计算技术研究所 [1]
自动化研究所 [1]
采集方式
OAI收割 [2]
内容类型
会议论文 [1]
期刊论文 [1]
发表日期
2021 [1]
2020 [1]
学科主题
筛选
浏览/检索结果:
共2条,第1-2条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Bridging Text and Video: A Universal Multimodal Transformer for Audio-Visual Scene-Aware Dialog
期刊论文
OAI收割
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2021, 卷号: 29, 页码: 2476-2483
作者:
Li, Zekang
;
Li, Zongjia
;
Zhang, Jinchao
;
Feng, Yang
;
Zhou, Jie
  |  
收藏
  |  
浏览/下载:52/0
  |  
提交时间:2021/12/01
Task analysis
Feature extraction
Visualization
Speech processing
History
Social networking (online)
Pattern recognition
Dialogue System
Multimodal
Natural Language Processing
Video Understanding
CIF: Continuous Integrate-and-Fire for End-to-End Speech Recognition
会议论文
OAI收割
在线会议, 2020-05
作者:
Dong, Linhao
;
Xu, Bo
  |  
收藏
  |  
浏览/下载:117/0
  |  
提交时间:2020/06/13
continuous integrate-and-fire
end-to-end model
soft and monotonic alignment
online speech recognition
acoustic boundary positioning