中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [4]
采集方式
OAI收割 [4]
内容类型
期刊论文 [4]
发表日期
2024 [3]
2023 [1]
学科主题
筛选
浏览/检索结果:
共4条,第1-4条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
CLIP-VG: Self-Paced Curriculum Adapting of CLIP for Visual Grounding
期刊论文
OAI收割
IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 4334-4347
作者:
Xiao, Linhui
;
Yang, Xiaoshan
;
Peng, Fang
;
Yan, Ming
;
Wang, Yaowei
  |  
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2024/05/30
Grounding
Reliability
Adaptation models
Task analysis
Visualization
Data models
Annotations
Visual grounding
curriculum learning
pseudo-language label
and vision-language models
Memory-Adaptive Vision-and-Language Navigation
期刊论文
OAI收割
Pattern Recognition, 2024, 卷号: 153, 页码: 110511
作者:
Keji He
;
Ya Jing
;
Yan Huang
;
Zhihe Lu
;
Dong An
  |  
收藏
  |  
浏览/下载:10/0
  |  
提交时间:2024/06/26
Vision-and-Language Navigation
Memory bank
History noises
Memory-Adaptive Model
CM-MaskSD: Cross-Modality Masked Self-Distillation for Referring Image Segmentation
期刊论文
OAI收割
IEEE TRANSACTIONS ON MULTIMEDIA, 2024, 卷号: 26, 页码: 6906-6916
作者:
Wang, Wenxuan
;
He, Xingjian
;
Zhang, Yisi
;
Guo, Longteng
;
Shen, Jiachen
  |  
收藏
  |  
浏览/下载:8/0
  |  
提交时间:2024/07/03
Referring image segmentation
cross-modality guidance
masked self-distillation
vision and language
VLP: A Survey on Vision-language Pre-training
期刊论文
OAI收割
Machine Intelligence Research, 2023, 卷号: 20, 期号: 1, 页码: 38-56
作者:
Fei-Long Chen
;
Du-Zhen Zhang
;
Ming-Lun Han
;
Xiu-Yi Chen
;
Jing Shi
  |  
收藏
  |  
浏览/下载:9/0
  |  
提交时间:2024/04/23
Vision and language
pre-training
transformers
multimodal learning
representation learning