Theoretical research of the policy gradient reinforcement learning without Markov properties and its application to games
无马尔可夫性质的策略梯度强化学习理论研究及其在游戏中的应用
基本信息
- 批准号:26330419
- 负责人:
- 金额:$ 1.25万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2014
- 资助国家:日本
- 起止时间:2014-04-01 至 2017-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
agent2d のチェーンアクションにおける評価関数の重み調整
Agent2d连锁作用评价函数权重调整
- DOI:
- 发表时间:2014
- 期刊:
- 影响因子:0
- 作者:Noor Imanina N.H. ;Harukazu Igarashi;五十嵐治一,森岡祐一,山本一将;田川 諒,谷川俊策,五十嵐治一
- 通讯作者:田川 諒,谷川俊策,五十嵐治一
RoboCupサッカーシミュレーションリーグ2Dにおける局面評価関数の設計と学習
RoboCup足球模拟联赛二维阶段评价函数的设计与学习
- DOI:
- 发表时间:2014
- 期刊:
- 影响因子:0
- 作者:Noor Imanina N.H. ;Harukazu Igarashi;五十嵐治一,森岡祐一,山本一将;田川 諒,谷川俊策,五十嵐治一;谷川俊策,五十嵐治一,石原聖司
- 通讯作者:谷川俊策,五十嵐治一,石原聖司
Policy Gradient Reinforcement Learning with a Fuzzy Controller for Policy: Decision Making in RoboCup Soccer Small Size League
使用模糊策略控制器进行策略梯度强化学习:RoboCup 足球小规模联赛中的决策
- DOI:10.3156/jsoft.26.647
- 发表时间:2014
- 期刊:
- 影响因子:0
- 作者:杉本 将也,五十嵐 治一,石原 聖司,田中 一基
- 通讯作者:杉本 将也,五十嵐 治一,石原 聖司,田中 一基
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Harukazu Igarashi其他文献
Path planning of a mobile robot by optimization and reinforcement learning
- DOI:
10.1007/bf02481210 - 发表时间:
2002-03-01 - 期刊:
- 影响因子:0.800
- 作者:
Harukazu Igarashi - 通讯作者:
Harukazu Igarashi
Path-planning and navigation of a mobile robot as discrete optimization problems
- DOI:
10.1007/bf02481342 - 发表时间:
2001-06-01 - 期刊:
- 影响因子:0.800
- 作者:
Harukazu Igarashi;Kiyoshi Ioi - 通讯作者:
Kiyoshi Ioi
Harukazu Igarashi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
方策勾配法に基づく強化学習法と複雑システム制御への応用
基于策略梯度法的强化学习方法及其在复杂系统控制中的应用
- 批准号:
05J02773 - 财政年份:2005
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for JSPS Fellows














{{item.name}}会员




