Recurrent neural network models for exploration in dynamic environments.

用于动态环境中探索的循环神经网络模型。

基本信息

  • 批准号:
    496990750
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    德国
  • 项目类别:
    Research Grants
  • 财政年份:
  • 资助国家:
    德国
  • 起止时间:
  • 项目状态:
    未结题

项目摘要

Recurrent neural networks models have received increasing interest in cognitive and systems neuroscience. These models have recently been successfully trained on tasks from the human and animal neuroscience literature, and might yield insights into potential computational mechanisms underlying higher cognitive functions. Here we will use recurrent neural network models to shed light on a fundamental problem in reinforcement learning – the exploration/exploitation trade-off. Agents are regularly faced with the problem of deciding whether to select well-known options for reward maximization, or whether to explore novel options for information gain. Human exploration is supported by at least two strategies – choice randomization (random exploration) and directed exploration of uncertain options for information gain. For the first objective, we will use computational modeling of recurrent neural network behavior to test the prediction that these network models exhibit computational strategies similar to those observed in humans to solve the exploration/exploitation trade-off. For the second objective, the computations and representations underlying network performance will be examined via a detailed analysis of the dynamics embedded in their hidden unit time courses. Together, the project will shed light on computational mechanisms that might support learning and decision-making in dynamic environments.
递归神经网络模型在认知和系统神经科学领域受到越来越多的关注。这些模型最近已经成功地在人类和动物神经科学文献中的任务上进行了训练,并可能对潜在的高级认知功能的计算机制产生见解。在这里,我们将使用递归神经网络模型来阐明强化学习中的一个基本问题——探索/利用权衡。智能体经常面临这样的问题:是选择已知的选项来实现奖励最大化,还是探索新的选项来获得信息。人类探索至少有两种策略支持——选择随机化(随机探索)和为获取信息而对不确定选项进行定向探索。对于第一个目标,我们将使用循环神经网络行为的计算建模来测试这些网络模型表现出类似于在人类中观察到的计算策略来解决探索/开发权衡的预测。对于第二个目标,将通过对其隐藏单位时间过程中嵌入的动态的详细分析来检查网络性能的计算和表示。总之,该项目将阐明在动态环境中支持学习和决策的计算机制。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr. Jan Peters其他文献

Professor Dr. Jan Peters的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr. Jan Peters', 18)}}的其他基金

Studies on the role of subcortical dopaminergic networks in decision-making
皮质下多巴胺能网络在决策中的作用研究
  • 批准号:
    257204944
  • 财政年份:
    2014
  • 资助金额:
    --
  • 项目类别:
    Independent Junior Research Groups
The role of prefrontal cortex sub-circuits in impulse control and preference consistency: Behavioural analyses in patients with focal prefrontal cortex lesions.
前额叶皮层子电路在冲动控制和偏好一致性中的作用:局灶性前额叶皮层病变患者的行为分析。
  • 批准号:
    226381160
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Research Fellowships
Ambulatory assessment of cue-reactivity during naturalistic cue exposure in gamblers.
赌徒自然线索暴露期间线索反应性的动态评估。
  • 批准号:
    502778657
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似国自然基金

脐带间充质干细胞微囊联合低能量冲击波治疗神经损伤性ED的机制研究
  • 批准号:
    82371631
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
亚低温调控颅脑创伤急性期神经干细胞Mpc2/Lactate/H3K9lac通路促进神经修复的研究
  • 批准号:
    82371379
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
基于再生运动神经路径优化Agrin作用促进损伤神经靶向投射的功能研究
  • 批准号:
    82371373
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
Neural Process模型的多样化高保真技术研究
  • 批准号:
    62306326
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
声致离子电流促进小胶质细胞M2极化阻断再生神经瘢痕退变免疫机制
  • 批准号:
    82371973
  • 批准年份:
    2023
  • 资助金额:
    48.00 万元
  • 项目类别:
    面上项目
LIPUS响应的弹性石墨烯多孔导管促进神经再生及其机制研究
  • 批准号:
    82370933
  • 批准年份:
    2023
  • 资助金额:
    48.00 万元
  • 项目类别:
    面上项目
生理/病理应激差异化调控肝再生的“蓝斑—中缝”神经环路机制
  • 批准号:
    82371517
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
弓状核介导慢性疼痛引起动机下降的神经环路机制及rTMS干预研究
  • 批准号:
    82371536
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
听觉刺激特异性调控情绪的神经环路机制研究
  • 批准号:
    82371516
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
TAG1/APP信号通路调控的miRNA及其在神经前体细胞增殖和分化中的作用机制
  • 批准号:
    31171313
  • 批准年份:
    2011
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目

相似海外基金

A Long-range Recurrent Neural Network Mediates Threat Induced Innate Sensorimotor Integrations
远程循环神经网络介导威胁诱发的先天感觉运动整合
  • 批准号:
    10539071
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Discovery of bacterial consortia to treat recurrent vulvovaginal candidiasis: a generalizable platform for phenotypic microbial community screening
发现治疗复发性外阴阴道念珠菌病的细菌群落:表型微生物群落筛查的通用平台
  • 批准号:
    10383360
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
A Long-range Recurrent Neural Network Mediates Threat Induced Innate Sensorimotor Integrations
远程循环神经网络介导威胁诱发的先天感觉运动整合
  • 批准号:
    10626968
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Investigating the role of brainstem neuroinflammation in cardiorespiratory control in a rat model of recurrent epilepsy
研究脑干神经炎症在复发性癫痫大鼠模型心肺控制中的作用
  • 批准号:
    10676746
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Investigating the role of brainstem neuroinflammation in cardiorespiratory control in a rat model of recurrent epilepsy
研究脑干神经炎症在复发性癫痫大鼠模型心肺控制中的作用
  • 批准号:
    10462194
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
Robust modeling of within- and across-area population dynamics using recurrent neural networks
使用循环神经网络对区域内和跨区域人口动态进行稳健建模
  • 批准号:
    10263644
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
Nano-photonic Processing Unit for Recurrent Neural Network Applications
用于循环神经网络应用的纳米光子处理单元
  • 批准号:
    20K19771
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Neural circuit theory and trained recurrent network modeling of rapid learning
神经回路理论与快速学习的训练循环网络建模
  • 批准号:
    9983227
  • 财政年份:
    2018
  • 资助金额:
    --
  • 项目类别:
Neural circuit theory and trained recurrent network modeling of rapid learning
神经回路理论与快速学习的训练循环网络建模
  • 批准号:
    10456065
  • 财政年份:
    2018
  • 资助金额:
    --
  • 项目类别:
Early Identification of Acute Kidney Injury Using Deep Recurrent Neural Nets, Presented with Probable Etiology
使用深层循环神经网络早期识别急性肾损伤,并提出可能的病因
  • 批准号:
    9621546
  • 财政年份:
    2018
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了