权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

Theoretical research of the policy gradient reinforcement learning without Markov properties and its application to games

无马尔可夫性质的策略梯度强化学习理论研究及其在游戏中的应用

基本信息

批准号：
26330419
负责人：
Harukazu Igarashi
金额：
$ 1.25万
依托单位：
Shibaura Institute of Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for Scientific Research (C)
财政年份：
2014
资助国家：
日本
起止时间：
2014-04-01 至 2017-03-31
项目状态：
已结题

项目摘要

项目成果

期刊论文数量（0）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

サッカーエージェントにおけるスルーパスの強化学習

足球特工直传球的强化学习

DOI：
发表时间：
2016
期刊：
影响因子：
0
作者：
田川諒，五十嵐治一
通讯作者：
田川諒，五十嵐治一

agent2d のチェーンアクションにおける評価関数の重み調整

Agent2d连锁作用评价函数权重调整

DOI：
发表时间：
2014
期刊：
影响因子：
0
作者：
Noor Imanina N.H. ;Harukazu Igarashi;五十嵐治一，森岡祐一，山本一将;田川諒，谷川俊策，五十嵐治一
通讯作者：
田川諒，谷川俊策，五十嵐治一

RoboCupサッカーシミュレーションリーグ2Dにおける局面評価関数の設計と学習

RoboCup足球模拟联赛二维阶段评价函数的设计与学习

DOI：
发表时间：
2014
期刊：
影响因子：
0
作者：
Noor Imanina N.H. ;Harukazu Igarashi;五十嵐治一，森岡祐一，山本一将;田川諒，谷川俊策，五十嵐治一;谷川俊策，五十嵐治一，石原聖司
通讯作者：
谷川俊策，五十嵐治一，石原聖司

Policy Gradient Reinforcement Learning with a Fuzzy Controller for Policy: Decision Making in RoboCup Soccer Small Size League

使用模糊策略控制器进行策略梯度强化学习：RoboCup 足球小规模联赛中的决策

DOI：
10.3156/jsoft.26.647
发表时间：
2014
期刊：
Journal of Japan Society for Fuzzy Theory and Intelligent Informatics
影响因子：
0
作者：
杉本将也，五十嵐治一，石原聖司，田中一基
通讯作者：
杉本将也，五十嵐治一，石原聖司，田中一基

局面評価関数を用いたサッカーエージェントの移動先決定

使用情况评估函数确定足球经纪人的目的地

DOI：
发表时间：
2016
期刊：
影响因子：
0
作者：
大内斉，五十嵐治一
通讯作者：
大内斉，五十嵐治一

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

Harukazu Igarashi其他文献

Path planning of a mobile robot by optimization and reinforcement learning

DOI：
10.1007/bf02481210
发表时间：
2002-03-01
期刊：
Artificial Life and Robotics
影响因子：
0.800
作者：
Harukazu Igarashi
通讯作者：
Harukazu Igarashi

Path-planning and navigation of a mobile robot as discrete optimization problems

DOI：
10.1007/bf02481342
发表时间：
2001-06-01
期刊：
Artificial Life and Robotics
影响因子：
0.800
作者：
Harukazu Igarashi;Kiyoshi Ioi
通讯作者：
Kiyoshi Ioi

Harukazu Igarashi的其他文献

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

立即体验

相似海外基金

方策勾配法に基づく強化学習法と複雑システム制御への応用

基于策略梯度法的强化学习方法及其在复杂系统控制中的应用

批准号：
05J02773
财政年份：
2005
资助金额：
$ 1.25万
项目类别：
Grant-in-Aid for JSPS Fellows