中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [53]
采集方式
OAI收割 [53]
内容类型
期刊论文 [23]
会议论文 [15]
学位论文 [15]
发表日期
2024 [3]
2023 [5]
2022 [7]
2021 [4]
2020 [3]
2019 [1]
更多
学科主题
筛选
浏览/检索结果:
共53条,第1-10条
帮助
限定条件
专题:自动化研究所
第一署名单位
第一作者单位
通讯作者单位
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Incremental Audio-Visual Fusion for Person Recognition in Earthquake Scene
期刊论文
OAI收割
ACM TRANSACTIONS ON MULTIMEDIA COMPUTING COMMUNICATIONS AND APPLICATIONS, 2024, 卷号: 20, 期号: 2, 页码: 19
作者:
You, Sisi
;
Zuo, Yukun
;
Yao, Hantao
;
Xu, Changsheng
  |  
收藏
  |  
浏览/下载:11/0
  |  
提交时间:2023/12/21
Cross-modal audio-visual fusion
incremental learning
person recognition
elastic weight consolidation
feature replay
Cogeneration of Innovative Audio-visual Content: A New Challenge for Computing Art
期刊论文
OAI收割
Machine Intelligence Research, 2024, 卷号: 21, 期号: 1, 页码: 4-28
作者:
Mengting Liu
  |  
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2024/01/25
Artificial intelligence (AI) art, audio-visual, artificial intelligence generated content (AIGC), multimodal, artistic evaluation
Multi-Cue Guided Semi-Supervised Learning Toward Target Speaker Separation in Real Environments
期刊论文
OAI收割
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2024, 卷号: 32, 页码: 151-163
作者:
Xu, Jiaming
;
Cui, Jian
;
Hao, Yunzhe
;
Xu, Bo
  |  
收藏
  |  
浏览/下载:3/0
  |  
提交时间:2024/02/22
Cocktail party problem
target speaker separation
multi-cue guided separation
semi-supervised learning
Visually Guided Sound Source Separation With Audio-Visual Predictive Coding
期刊论文
OAI收割
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 页码: 15
作者:
Song, Zengjie
;
Zhang, Zhaoxiang
  |  
收藏
  |  
浏览/下载:6/0
  |  
提交时间:2023/11/17
Feature fusion
multimodal learning
predictive coding (PC)
self-supervised learning
sound source separation
Emotion-Aware Music Driven Movie Montage
期刊论文
OAI收割
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2023, 卷号: 38, 期号: 3, 页码: 540-553
作者:
Liu, Wu-Qin
;
Lin, Min-Xuan
;
Huang, Hai-Bin
;
Ma, Chong-Yang
;
Song, Yu
  |  
收藏
  |  
浏览/下载:7/0
  |  
提交时间:2023/12/21
movie montage
emotion analysis
audio-visual modality
contrastive learning
Sounding Video Generator: A Unified Framework for Text-guided Sounding Video Generation
期刊论文
OAI收割
IEEE Transactions on Multimedia, 2023, 页码: 1 - 13
作者:
Liu, Jiawei
;
Wang, Weining
;
Chen, Sihan
;
Zhu, Xinxin
;
Liu, Jing
  |  
收藏
  |  
浏览/下载:9/0
  |  
提交时间:2023/05/03
Text-guided sounding-video generation
Videoaudio representation
Contrastive learning
Transformer
Collecting Cross-Modal Presence-Absence Evidence for Weakly-Supervised Audio-Visual Event Perception
会议论文
OAI收割
Vancouver, Canada, 2022-06-18
作者:
Gao, Junyu
;
Chen, Mengyuan
;
Xu, Changsheng
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2023/04/26
Multimodal Pretraining from Monolingual to Multilingual
期刊论文
OAI收割
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 220-232
作者:
Liang Zhang, Ludan Ruan, Anwen Hu, Qin Jin
  |  
收藏
  |  
浏览/下载:14/0
  |  
提交时间:2023/04/03
Multilingual pretraining
multimodal pretraining
cross-lingual transfer
multilingual generation
cross-modal retrieval
Integrative interaction of emotional speech in audio-visual modality
期刊论文
OAI收割
FRONTIERS IN NEUROSCIENCE, 2022, 卷号: 16, 页码: 13
作者:
Dong, Haibin
;
Li, Na
;
Fan, Lingzhong
;
Wei, Jianguo
;
Xu, Junhai
  |  
收藏
  |  
浏览/下载:13/0
  |  
提交时间:2023/03/20
audio-visual integration
emotional speech
fMRI
left insula
weighted RSA
Stereo Depth Estimation with Echoes
会议论文
OAI收割
以色列特拉维夫, 2022.10.24
作者:
Zhang, Chenghao
;
Tian, Kun
;
Ni, Bolin
;
Meng, Gaofeng
;
Fan, Bin
  |  
收藏
  |  
浏览/下载:9/0
  |  
提交时间:2023/04/25