Memory-Based Operant Learning

基于记忆的操作学习

基本信息

  • 批准号:
    9978403
  • 负责人:
  • 金额:
    $ 33.83万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    1999
  • 资助国家:
    美国
  • 起止时间:
    1999-12-15 至 2004-11-30
  • 项目状态:
    已结题

项目摘要

The PI will develop a cognitively plausible reinforcement learning (RL) architecture as a model of instrumental learning in animals and robots. Although RL was initially inspired by animal learning phenomena, the field has since developed mainly by addressing AI concerns. A major limitation of current RL architectures as cognitive theories is the representation of state space. Models that maintain explicit state representations (such as Q~tables) are limited to simple domains with only a few variables, while models that represent the state space implicitly (e.g., using a neural net function approximator) require large amounts of training data and unreasonably long training times compared to real animals. The PI's approach is to develop specialized representations of state space that are appropriate for modeling animal behavior and can support desired generalizations. The simulated animal's working memory will encode sensory stimuli, state change events, and the animal's own actions. An explicit state representation would encode the conjunction of all these variables, generating a combinatorial explosion. The proposed alternative approach is for the model to form conjunctions of selected variables, allowing it to incrementally expand its state description while focusing on just those dimensions that are relevant to the task being learned. Heuristics based on fast, single-layer neural net learning will be developed to select useful conjunctions as a function of recent experience. The PI also will investigate matching the current state of working memory with records of entire past states, or episodes, in order to predict reward. A flexible architecture will be developed for representing actions in a parameterized manner (so as to provide infinite variability), and with temporal duration (allowing stimuli and rewards to arrive in the midst of execution). Finally, there will be mechanisms for coping with failure of an action to execute successfully or to produce an expected reward; this will provide the basis for modeling phenomena such as effects of partial reinforcement schedules and increased behavioral variability during extinction. If successful, this work will advance the state of the art of reinforcement learning by introducing new techniques for handling complex state and action spaces. This has important implications for theories of animal cognition, for robots that learn by exploration and experimentation, and for robots intended to learn from human teachers.
PI将开发一种认知上合理的强化学习(RL)架构,作为动物和机器人工具学习的模型。 尽管RL最初受到动物学习现象的启发,但该领域主要通过解决AI问题而发展。 当前RL架构作为认知理论的一个主要局限是状态空间的表示。 维护显式状态表示(诸如Q~表)的模型限于仅具有几个变量的简单域,而隐式表示状态空间的模型(例如,使用神经网络函数近似器)需要大量的训练数据和与真实的动物相比不合理的长训练时间。 PI的方法是开发适合于动物行为建模的状态空间的专门表示,并且可以支持所需的概括。 模拟动物的工作记忆将对感官刺激、状态变化事件和动物自己的动作进行编码。 显式状态表示将对所有这些变量的合取进行编码,从而产生组合爆炸。所提出的替代方法是模型形成选定变量的连接,允许它逐步扩展其状态描述,同时只关注与正在学习的任务相关的维度。 将开发基于快速单层神经网络学习的启发式,以根据最近的经验选择有用的合取词。 PI还将研究工作记忆的当前状态与整个过去状态或事件的记录是否匹配,以预测奖励。 将开发一个灵活的架构,用于以参数化的方式(以便提供无限的可变性)和时间持续时间(允许刺激和奖励在执行过程中到达)表示动作。 最后,将有机制来处理失败的行动,以成功执行或产生预期的奖励;这将提供基础的建模现象,如部分强化时间表的影响和灭绝过程中增加的行为变异性。 如果成功,这项工作将通过引入处理复杂状态和动作空间的新技术来推进强化学习的发展。 这对动物认知理论、通过探索和实验学习的机器人以及向人类教师学习的机器人都有重要意义。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

David Touretzky其他文献

David Touretzky的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('David Touretzky', 18)}}的其他基金

Collaborative Research: AI4GA - Developing Artificial Intelligence Competencies, Career Awareness, and Interest in Georgia Middle School Teachers and Students
合作研究:AI4GA - 培养佐治亚州中学教师和学生的人工智能能力、职业意识和兴趣
  • 批准号:
    2049029
  • 财政年份:
    2021
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Standard Grant
Developing K-12 Education Guidelines for Artificial Intelligence
制定 K-12 人工智能教育指南
  • 批准号:
    1846073
  • 财政年份:
    2019
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Standard Grant
Collaborative Research: Planning grant: CS4All: Computer Science for All
合作研究:规划资助:CS4All:全民计算机科学
  • 批准号:
    1151542
  • 财政年份:
    2012
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Standard Grant
BPC-AE: Collaborative Research: The ARTSI Alliance: Advancing Robotics Technology for Societal Impact
BPC-AE:协作研究:ARTSI 联盟:推进机器人技术以产生社会影响
  • 批准号:
    1042322
  • 财政年份:
    2011
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Continuing Grant
Cognitive Robotics: A Curriculum for Machines that See and Manipulate their World
认知机器人:为机器观察和操纵世界的课程
  • 批准号:
    0717705
  • 财政年份:
    2007
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Standard Grant
Collaborative Research: BPC-A: ARTSI: Advancing Robotics Technology for Societal Impact
合作研究:BPC-A:ARTSI:推进机器人技术以产生社会影响
  • 批准号:
    0742106
  • 财政年份:
    2007
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Continuing Grant
Collaborative Research: BPC-DP: CARE. Computer and Robotics Education for African American Students
合作研究:BPC-DP:CARE。
  • 批准号:
    0540521
  • 财政年份:
    2006
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Standard Grant
IGERT: Integrating New Technologies with Cognitive Neuroscience
IGERT:将新技术与认知神经科学相结合
  • 批准号:
    0549352
  • 财政年份:
    2006
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Continuing Grant
IGERT Full Proposal: Innovative Cross-Disciplinary Training in Neuroscience and Computation
IGERT 完整提案:神经科学和计算领域的创新跨学科培训
  • 批准号:
    9987588
  • 财政年份:
    2000
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Continuing Grant
The Biological Basis of Incremental Learning
渐进学习的生物学基础
  • 批准号:
    9720350
  • 财政年份:
    1997
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Continuing Grant

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Exploring the Intrinsic Mechanisms of CEO Turnover and Market Reaction: An Explanation Based on Information Asymmetry
  • 批准号:
    W2433169
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国学者研究基金项目
基于tag-based单细胞转录组测序解析造血干细胞发育的可变剪接
  • 批准号:
    81900115
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
应用Agent-Based-Model研究围术期单剂量地塞米松对手术切口愈合的影响及机制
  • 批准号:
    81771933
  • 批准年份:
    2017
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目
Reality-based Interaction用户界面模型和评估方法研究
  • 批准号:
    61170182
  • 批准年份:
    2011
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
Multistage,haplotype and functional tests-based FCAR 基因和IgA肾病相关关系研究
  • 批准号:
    30771013
  • 批准年份:
    2007
  • 资助金额:
    30.0 万元
  • 项目类别:
    面上项目
差异蛋白质组技术结合Array-based CGH 寻找骨肉瘤分子标志物
  • 批准号:
    30470665
  • 批准年份:
    2004
  • 资助金额:
    8.0 万元
  • 项目类别:
    面上项目
GaN-based稀磁半导体材料与自旋电子共振隧穿器件的研究
  • 批准号:
    60376005
  • 批准年份:
    2003
  • 资助金额:
    20.0 万元
  • 项目类别:
    面上项目

相似海外基金

Optimal utility-based design of oncology clinical development programmes
基于效用的肿瘤学临床开发项目的优化设计
  • 批准号:
    2734768
  • 财政年份:
    2026
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Studentship
Impact of Urban Environmental Factors on Momentary Subjective Wellbeing (SWB) using Smartphone-Based Experience Sampling Methods
使用基于智能手机的体验采样方法研究城市环境因素对瞬时主观幸福感 (SWB) 的影响
  • 批准号:
    2750689
  • 财政年份:
    2025
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Studentship
Plasmonic Mg-based catalysts for low temperature sunlight-assisted CO2 activation (MgCatCO2Act)
用于低温阳光辅助 CO2 活化的等离子体镁基催化剂 (MgCatCO2Act)
  • 批准号:
    EP/Y037294/1
  • 财政年份:
    2025
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Research Grant
Bio-MATSUPER: Development of high-performance supercapacitors based on bio-based carbon materials
Bio-MATSUPER:开发基于生物基碳材料的高性能超级电容器
  • 批准号:
    EP/Z001013/1
  • 财政年份:
    2025
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Fellowship
System for 3D femtosecond laser-based micromachining
基于飞秒激光的 3D 微加工系统
  • 批准号:
    537273289
  • 财政年份:
    2024
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Major Research Instrumentation
Development of a Cell-Based Assay for Tetanus Vaccine Quality Control
破伤风疫苗质量控制细胞检测方法的开发
  • 批准号:
    10101986
  • 财政年份:
    2024
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Collaborative R&D
EXSOLUTION-BASED NANOPARTICLES FOR LOWEST COST GREEN HYDROGEN VIA ELECTROLYSIS
基于萃取的纳米颗粒通过电解生产成本最低的绿氢
  • 批准号:
    10102891
  • 财政年份:
    2024
  • 资助金额:
    $ 33.83万
  • 项目类别:
    EU-Funded
RestoreDNA: Development of scalable eDNA-based solutions for biodiversity regulators and nature-related disclosure
RestoreDNA:为生物多样性监管机构和自然相关披露开发可扩展的基于 eDNA 的解决方案
  • 批准号:
    10086990
  • 财政年份:
    2024
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Collaborative R&D
HAIRCYCLE: a pilot study to explore and test regenerative, local, bio-based and circular models for human hair waste
HAIRCYCLE:一项试点研究,旨在探索和测试人类毛发废物的再生、局部、生物基和循环模型
  • 批准号:
    AH/Z50550X/1
  • 财政年份:
    2024
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Research Grant
Rural Co-Design and Collaboration: Maximising Rural Community Assets to Reduce Place-Based Health Inequalities
农村共同设计与协作:最大化农村社区资产以减少基于地点的健康不平等
  • 批准号:
    AH/Z505559/1
  • 财政年份:
    2024
  • 资助金额:
    $ 33.83万
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了