中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [2]
采集方式
OAI收割 [2]
内容类型
期刊论文 [2]
发表日期
2023 [2]
学科主题
筛选
浏览/检索结果:
共2条,第1-2条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning
期刊论文
OAI收割
Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078
作者:
Qiu JY(邱俊彦)
;
Haidong Zhang
;
Yiping Yang
  |  
收藏
  |  
浏览/下载:6/0
  |  
提交时间:2024/05/29
reinforcement learning
dialogue policy learning
curriculum learning
knowledge distillation
A Survey on Recent Advances and Challenges in Reinforcement Learning Methods for Task-oriented Dialogue Policy Learning
期刊论文
OAI收割
Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 318-334
作者:
Wai-Chung Kwan
;
Hong-Ru Wang
;
Hui-Min Wang
;
Kam-Fai Wong
  |  
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/04/23
Dialogue policy learning (DPL), task-oriented dialogue system (TOD), reinforcement learning (RL), dialogue system, Markov decision process