Developmental reinforcement learning

发展强化学习

基本信息

  • 批准号:
    238988-2010
  • 负责人:
  • 金额:
    $ 4.37万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2016
  • 资助国家:
    加拿大
  • 起止时间:
    2016-01-01 至 2017-12-31
  • 项目状态:
    已结题

项目摘要

We propose to address the major problem of building artificial intelligent agents that exist for an extended period of time, during which they continually improve their world representations. We will use the theoretical framework of reinforcement learning, which allows agents to learn by interacting with an unknown, stochastic environment, and receive reward feedback form it. Unlike in existing reinforcement learning methods, we will not try to infer a true environment state. Instead, agents will build their own internal state, which will be sufficient to make predictions. Prediction errors will be used to guide the agents' exploration, in a process mimicking curiosity.
我们建议解决的主要问题,建立人工智能代理存在的一段时间,在此期间,他们不断提高他们的世界表示。我们将使用强化学习的理论框架,它允许智能体通过与未知的随机环境交互来学习,并从中获得奖励反馈。与现有的强化学习方法不同,我们不会尝试推断真实的环境状态。相反,智能体将建立自己的内部状态,这将足以进行预测。预测误差将被用来指导智能体的探索,这是一个模仿好奇心的过程。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Precup, Doina其他文献

Exploring uncertainty measures in deep networks for Multiple sclerosis lesion detection and segmentation
  • DOI:
    10.1016/j.media.2019.101557
  • 发表时间:
    2020-01-01
  • 期刊:
  • 影响因子:
    10.9
  • 作者:
    Nair, Tanya;Precup, Doina;Arbel, Tal
  • 通讯作者:
    Arbel, Tal
An information-theoretic approach to curiosity-driven reinforcement learning
  • DOI:
    10.1007/s12064-011-0142-z
  • 发表时间:
    2012-09-01
  • 期刊:
  • 影响因子:
    1.1
  • 作者:
    Still, Susanne;Precup, Doina
  • 通讯作者:
    Precup, Doina
Fast reinforcement learning with generalized policy updates
BISIMULATION METRICS FOR CONTINUOUS MARKOV DECISION PROCESSES
  • DOI:
    10.1137/10080484x
  • 发表时间:
    2011-01-01
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Ferns, Norm;Panangaden, Prakash;Precup, Doina
  • 通讯作者:
    Precup, Doina
Time Series Analysis Using Geometric Template Matching

Precup, Doina的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Precup, Doina', 18)}}的其他基金

Learning good representations for and with reinforcement learning
通过强化学习学习良好的表征
  • 批准号:
    RGPIN-2017-06788
  • 财政年份:
    2021
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Learning good representations for and with reinforcement learning
通过强化学习学习良好的表征
  • 批准号:
    RGPIN-2017-06788
  • 财政年份:
    2020
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Learning good representations for and with reinforcement learning
通过强化学习学习良好的表征
  • 批准号:
    RGPIN-2017-06788
  • 财政年份:
    2019
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Learning good representations for and with reinforcement learning
通过强化学习学习良好的表征
  • 批准号:
    RGPIN-2017-06788
  • 财政年份:
    2018
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Machine Learning
机器学习
  • 批准号:
    1000231167-2015
  • 财政年份:
    2017
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Canada Research Chairs
Learning good representations for and with reinforcement learning
通过强化学习学习良好的表征
  • 批准号:
    RGPIN-2017-06788
  • 财政年份:
    2017
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Machine Learning
机器学习
  • 批准号:
    1000231167-2015
  • 财政年份:
    2016
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Canada Research Chairs
McGill Science for a Sustainable Society Symposium
麦吉尔可持续社会科学研讨会
  • 批准号:
    490803-2015
  • 财政年份:
    2015
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Regional Office Discretionary Funds
Developmental reinforcement learning
发展强化学习
  • 批准号:
    238988-2010
  • 财政年份:
    2015
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Developmental reinforcement learning
发展强化学习
  • 批准号:
    238988-2010
  • 财政年份:
    2014
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

海桑属杂种区强化(Reinforcement)的检验与遗传基础研究
  • 批准号:
    30800060
  • 批准年份:
    2008
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Beneficial or Fostering Future struggles (B.F.F.s)? Characterizing the Role of Friends in the Developmental Trajectory of Maltreated Adolescent
有益还是促进未来的斗争(B.F.F.s)?
  • 批准号:
    10686594
  • 财政年份:
    2022
  • 资助金额:
    $ 4.37万
  • 项目类别:
Beneficial or Fostering Future struggles (B.F.F.s)? Characterizing the Role of Friends in the Developmental Trajectory of Maltreated Adolescent
有益还是促进未来的斗争(B.F.F.s)?
  • 批准号:
    10696151
  • 财政年份:
    2022
  • 资助金额:
    $ 4.37万
  • 项目类别:
Beneficial or Fostering Future struggles (B.F.F.s)? Characterizing the Role of Friends in the Developmental Trajectory of Maltreated Adolescent
有益还是促进未来的斗争(B.F.F.s)?
  • 批准号:
    10405423
  • 财政年份:
    2021
  • 资助金额:
    $ 4.37万
  • 项目类别:
Basic and Clinical Studies in Reinforcing Positive Behaviors in Intellectual and Developmental Disabilities
加强智力和发育障碍积极行为的基础和临床研究
  • 批准号:
    10583211
  • 财政年份:
    2018
  • 资助金额:
    $ 4.37万
  • 项目类别:
A Study of Childhood Irritability: Neural Mechanisms and Developmental Pathways to Internalizing and Externalizing Psychopathology
儿童易激惹的研究:神经机制和内化和外化精神病理学的发展途径
  • 批准号:
    9328699
  • 财政年份:
    2017
  • 资助金额:
    $ 4.37万
  • 项目类别:
Oral Health Promotion (OHPROM) Strategy for Persons with Intellectual & Developmental Disabilities
知识分子口腔健康促进 (OHPROM) 战略
  • 批准号:
    9900578
  • 财政年份:
    2016
  • 资助金额:
    $ 4.37万
  • 项目类别:
Developmental reinforcement learning
发展强化学习
  • 批准号:
    238988-2010
  • 财政年份:
    2015
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Developmental reinforcement learning
发展强化学习
  • 批准号:
    238988-2010
  • 财政年份:
    2014
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Developmental reinforcement learning
发展强化学习
  • 批准号:
    238988-2010
  • 财政年份:
    2013
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
Developmental reinforcement learning
发展强化学习
  • 批准号:
    238988-2010
  • 财政年份:
    2012
  • 资助金额:
    $ 4.37万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了