A study of modular models of decision making in uncertain and non-stationary environments

不确定非平稳环境下决策的模块化模型研究

基本信息

  • 批准号:
    21300113
  • 负责人:
  • 金额:
    $ 11.56万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2009
  • 资助国家:
    日本
  • 起止时间:
    2009 至 2011
  • 项目状态:
    已结题

项目摘要

We have developed statistical learning models, with a particular interest in reinforcement learning(RL), which can perform decision making in uncertain and even non-stationary environments. We have derived an RL method in which value function represented by a module structure can be online and efficiently approximated by adding new modules in an incremental fashion, and an optimal learning procedure of the value function based on the framework of semi-parametric statistics. As an application, we have succeeded in automatic control of non-holonomic systems by means of a policy-based RL method. In the human brain, we have found module-like structures which are activated when inferring a hierarchical inference task. Moreover, we have succeeded in decoding inference process based on the subject's behaviors and MRI scanned images.
我们开发了统计学习模型,特别关注强化学习(RL),它可以在不确定甚至非平稳环境中进行决策。我们已经推导出一种RL方法,在该方法中,由模块结构表示的值函数可以通过以增量方式添加新模块来在线有效地近似,并且基于半参数统计框架的值函数的最优学习过程。作为一个应用,我们已经成功地在非完整系统的自动控制的基于策略的RL方法。在人类大脑中,我们发现了类似模块的结构,这些结构在推理分层推理任务时被激活。此外,我们已经成功地解码推理过程的基础上的主题的行为和MRI扫描图像。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ネットワーク社会のブレインマシンインターフェース.(社)電子情報通信学会
网络社会脑机接口。电子、信息和通信工程师研究所。
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Iwatsuki M;Mimori K;Sato T;Toh H;Yokobori T;Tanaka F;Ishikawa K;Baba H;Mori M;石井信
  • 通讯作者:
    石井信
Robust approximation in decomposed reinforcement learning
分解强化学习中的鲁棒逼近
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.Mori;S.Ishii
  • 通讯作者:
    S.Ishii
Asymptotic analys of value prediction in well-specified and misspecified models
明确指定和错误指定模型中价值预测的渐近分析
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    7.8
  • 作者:
    T.Ueno;S.Maeda;S.Ishii
  • 通讯作者:
    S.Ishii
科学, 80(12),分担執筆
科学,80(12),贡献者
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Yasaka;C. Wakai;N. Matubayasi;and M. Nakahara;大隅典子;石井信
  • 通讯作者:
    石井信
An Additive Reinforcement Learning
  • DOI:
    10.1007/978-3-642-04274-4_63
  • 发表时间:
    2009-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takeshi Mori;S. Ishii
  • 通讯作者:
    Takeshi Mori;S. Ishii
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ISHII Shin其他文献

ISHII Shin的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ISHII Shin', 18)}}的其他基金

Uncovering neural correlates in human decision making based on brain decoding
基于大脑解码揭示人类决策中的神经关联
  • 批准号:
    24300114
  • 财政年份:
    2012
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Computational model of human decision-making in complicated environments and its applications
复杂环境下人类决策计算模型及其应用
  • 批准号:
    18300101
  • 财政年份:
    2006
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Reseach for stable bioinformatics method based on hierarchical Bayes inference.
基于分层贝叶斯推理的稳定生物信息学方法研究。
  • 批准号:
    18079011
  • 财政年份:
    2006
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
Model-based reinforcement learning : brain implementation and engineering applications
基于模型的强化学习:大脑实现和工程应用
  • 批准号:
    15300102
  • 财政年份:
    2003
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了