Theoretical research of the policy gradient reinforcement learning without Markov properties and its application to games

无马尔可夫性质的策略梯度强化学习理论研究及其在游戏中的应用

基本信息

  • 批准号:
    26330419
  • 负责人:
  • 金额:
    $ 1.25万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2014
  • 资助国家:
    日本
  • 起止时间:
    2014-04-01 至 2017-03-31
  • 项目状态:
    已结题

项目摘要

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
サッカーエージェントにおけるスルーパスの強化学習
足球特工直传球的强化学习
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田川 諒,五十嵐治一
  • 通讯作者:
    田川 諒,五十嵐治一
agent2d のチェーンアクションにおける評価関数の重み調整
Agent2d连锁作用评价函数权重调整
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Noor Imanina N.H. ;Harukazu Igarashi;五十嵐治一,森岡祐一,山本一将;田川 諒,谷川俊策,五十嵐治一
  • 通讯作者:
    田川 諒,谷川俊策,五十嵐治一
RoboCupサッカーシミュレーションリーグ2Dにおける局面評価関数の設計と学習
RoboCup足球模拟联赛二维阶段评价函数的设计与学习
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Noor Imanina N.H. ;Harukazu Igarashi;五十嵐治一,森岡祐一,山本一将;田川 諒,谷川俊策,五十嵐治一;谷川俊策,五十嵐治一,石原聖司
  • 通讯作者:
    谷川俊策,五十嵐治一,石原聖司
Policy Gradient Reinforcement Learning with a Fuzzy Controller for Policy: Decision Making in RoboCup Soccer Small Size League
使用模糊策略控制器进行策略梯度强化学习:RoboCup 足球小规模联赛中的决策
局面評価関数を用いたサッカーエージェントの移動先決定
使用情况评估函数确定足球经纪人的目的地
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大内 斉,五十嵐 治一
  • 通讯作者:
    大内 斉,五十嵐 治一
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Harukazu Igarashi其他文献

Path planning of a mobile robot by optimization and reinforcement learning
  • DOI:
    10.1007/bf02481210
  • 发表时间:
    2002-03-01
  • 期刊:
  • 影响因子:
    0.800
  • 作者:
    Harukazu Igarashi
  • 通讯作者:
    Harukazu Igarashi
Path-planning and navigation of a mobile robot as discrete optimization problems
  • DOI:
    10.1007/bf02481342
  • 发表时间:
    2001-06-01
  • 期刊:
  • 影响因子:
    0.800
  • 作者:
    Harukazu Igarashi;Kiyoshi Ioi
  • 通讯作者:
    Kiyoshi Ioi

Harukazu Igarashi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

方策勾配法に基づく強化学習法と複雑システム制御への応用
基于策略梯度法的强化学习方法及其在复杂系统控制中的应用
  • 批准号:
    05J02773
  • 财政年份:
    2005
  • 资助金额:
    $ 1.25万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了