收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

面向机器博弈的即时差分学习研究

徐长明  马宗民  徐心和  李新星  
【摘要】:以六子棋机器博弈为应用背景,实现了基于即时差分学习的估值函数权值调整自动化。提出了一种新的估值函数设计方案,解决了先验知识与多层神经元网络结合的问题。结合具体应用对象的特性,提出了对即时差分序列进行选择性学习的方法,在一定程度上避免了无用状态的干扰。经过10020盘的自学习训练,与同一个程序对弈,其胜率提高了8%左右,具有良好的效果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谷飙;;计算主义纲领与机器博弈的认知意蕴[J];南开学报(哲学社会科学版);2011年04期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前4条
1 朱峰;张雪峰;徐心和;;关于机器博弈中的逐步展开型对策的一点讨论[A];2007中国控制与决策学术年会论文集[C];2007年
2 徐心和;王浩;孔凡禹;;事件对策理论及在棋类游戏中的应用[A];2007年中国智能自动化会议论文集[C];2007年
3 徐心和;石鸿雁;;一个空战实例中的混合对策问题[A];2007中国控制与决策学术年会论文集[C];2007年
4 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
中国硕士学位论文全文数据库 前10条
1 闵文杰;六子棋计算机博弈关键技术研究[D];重庆交通大学;2010年
2 陈光年;基于智能算法的六子棋博弈行为选择的应用研究[D];重庆理工大学;2010年
3 张恩海;基于多自动机复合多子类机器博弈及其估值方法研究[D];沈阳大学;2011年
4 林靖;Q-学习在非完备信息机器博弈中的应用[D];哈尔滨工业大学;2009年
5 李翠珠;六子棋计算机博弈系统的研究与实现[D];重庆理工大学;2010年
6 孟凡良;基于学习的九宫问题求解方法及其应用研究[D];国防科学技术大学;2007年
7 王骐;博弈树搜索算法的研究及改进[D];浙江大学;2006年
8 谢国;中国象棋机器博弈数据结构设计与搜索算法研究[D];西安理工大学;2008年
9 张明亮;一种新的博弈树搜索算法及其应用研究[D];苏州大学;2007年
10 鹿荣;混合博弈树算法在中国象棋人机博弈中的应用研究[D];大连交通大学;2008年
中国重要报纸全文数据库 前2条
1 记者 何鑫 通讯员 张燕霖;高交会“中国象棋人机大战”今开战[N];深圳商报;2009年
2 蒋佑铭;电脑围棋对弈技术的发展趋势[N];围棋报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978