中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
首页
机构
成果
学者
登录
注册
登陆
×
验证码:
换一张
忘记密码?
记住我
×
校外用户登录
CAS IR Grid
机构
自动化研究所 [3]
沈阳自动化研究所 [1]
采集方式
OAI收割 [4]
内容类型
期刊论文 [3]
会议论文 [1]
发表日期
2012 [1]
2008 [2]
2001 [1]
学科主题
筛选
浏览/检索结果:
共4条,第1-4条
帮助
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
题名升序
题名降序
提交时间升序
提交时间降序
作者升序
作者降序
发表日期升序
发表日期降序
Self-teaching adaptive dynamic programming for Gomoku
期刊论文
OAI收割
NEUROCOMPUTING, 2012, 卷号: 78, 期号: 1, 页码: 23-29
作者:
Zhao, Dongbin
;
Zhang, Zhen
;
Dai, Yujie
收藏
  |  
浏览/下载:41/0
  |  
提交时间:2015/08/12
Gomoku
Reinforcement learning
Adaptive dynamic programming
Temporal difference learning
Neural network
Neurodynamic programming: a case study of the traveling salesman problem
期刊论文
OAI收割
NEURAL COMPUTING & APPLICATIONS, 2008, 卷号: 17, 期号: 4, 页码: 347-355
作者:
Ma, Jia
;
Yang, Tao
;
Hou, Zeng-Guang
;
Tan, Min
;
Liu, Derong
收藏
  |  
浏览/下载:21/0
  |  
提交时间:2015/11/08
neurodynamic programming
temporal difference learning
approximate Sarsa
traveling salesman problem
Neurodynamic programming: a case study of the traveling salesman problem
期刊论文
OAI收割
NEURAL COMPUTING & APPLICATIONS, 2008, 卷号: 17, 期号: 4, 页码: 347-355
作者:
Ma, Jia
;
Yang, Tao
;
Hou, Zeng-Guang
;
Tan, Min
;
Liu, Derong
收藏
  |  
浏览/下载:28/0
  |  
提交时间:2015/11/08
neurodynamic programming
temporal difference learning
approximate Sarsa
traveling salesman problem
A reinforcement learning approach to re-entrant manufacturing system scheduling
会议论文
OAI收割
International Conference on Info-Tech and Info-Net (ICII 2001), BEIJING, China, October 29 - November 1, 2001
作者:
Liu ZC(柳长春)
;
Jin HY(金辉宇)
;
Tian Y(田宇)
;
Yu HB(于海斌)
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2012/06/06
reentrant lines
manufacturing system
reinforcement learning
temporal difference learning