中国科学院机构知识库网格系统: 检索

机构

采集方式

内容类型

发表日期

学科主题

筛选

浏览/检索结果: 共3条，第1-3条

帮助

条数/页：排序方式：
	RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data 期刊论文 OAI收割 arXiv, 2024, 页码: 14 作者: Chenglong Wang; Yang Gan; Yifu Huo; Yongyu Mu; Murun Yang \| 收藏 \|
	LRHP: Learning Representations for Human Preferences via Preference Pairs 期刊论文 OAI收割 arXiv, 2024 作者: Chenglong Wang; Yang Gan; Yifu Huo; Yongyu Mu; Qiaozhi He \| 收藏 \|
	ESRL: Efficient Sampling-based Reinforcement Learning for Sequence Generation 期刊论文 OAI收割 arXiv, 2023, 期号: 4 作者: Chenglong Wang; Hang Zhou; Yimin Hu; Yifu Huo; Bei Li \| 收藏 \|