報酬最大化原理および大脳基底核モデルによるゴール指向性推論機能の自動的実装

使用奖励最大化原理和基底神经节模型自动实现目标导向推理功能

基本信息

  • 批准号:
    15700180
  • 负责人:
  • 金额:
    $ 1.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2003
  • 资助国家:
    日本
  • 起止时间:
    2003 至 2005
  • 项目状态:
    已结题

项目摘要

本研究は、ゴール指向性推論を始めとした、人間の脳の持つ様々な高次脳機能を包括的に実現するエージェントを設計することを目標としたものである。そのため、ゴール指向性推論に始めから特化してエージェントを設計するのではなく、「エージェントとその環境についてのある制約条件のもとで報酬最大化という最適化問題を解く」という形でエージェントを設計し、その結果として「ゴール指向性推論がエージェントに実装された」という現象を自動的に発生させることを試みた。前年度までの研究によりそのような現象が発生する具体例を考案していたが、最適化に長い時間がかかってしまうという問題があった。そこで本年度はその現象をより効率よく発生させることを目指して、新たな最適化手法の開発を行った。第一に、これまではエージェントが環境を直接には学習しない強化学習的手法を用いていたが、最適化が完了するまでに環境と多くのインタラクションを行う必要があり非効率的であった。そこで効率化のためには環境を学習させた方が良いのではないかと考え、そのための手法を開発した。特に、確率的な環境をコンパクトに表現する事ができるダイナミックベイジアンネットワークを用いることが有望であると考え、これを効率よく学習することができる手法を開発した。この成果については学会にて公表済みである。第二に、学習された環境をもとに効率よく最適化を行う手法も開発した。これについては論文を投稿中である。これらによってこれまでより大幅に効率的な最適化が可能となった。ただし、ゴール指向性推論の効率のよい発生が可能となる理論的条件やゴール指向性推論以外の機能の実現については十分検討できなかったため、今後の課題としたい。
这项研究旨在设计代理商,以全面地实现人脑的各种较高大脑功能,包括目标定向推理。因此,我们并没有从一开始就专门设计针对目标定向推断的代理,而是试图以“解决在某些关于代理商及其环境的限制下最大化奖励的优化问题的形式”,因此,在代理中实现的目标推断的现象是自动生成的。直到上一年的研究已经设计了这种现象的具体实例,但是存在一个问题,即优化需要很长时间。因此,今年我们开发了一种新的优化方法,目的是更有效地产生这种现象。首先,以前,代理使用了不直接学习环境的加固学习技术,但是在优化完成之前与环境进行许多互动效率低。因此,我们认为最好了解环境以提高效率,并开发了一种方法。特别是,我们认为使用动态的贝叶斯网络将有望以紧凑的方式表达概率环境,并且我们开发了一种使我们能够有效地学习这一点的方法。结果已经由学术学会发布。其次,我们还开发了一种基于学习环境的有效优化的方法。我目前正在就此提交一篇论文。这些使优化比以往任何时候都更加有效。但是,我们无法完全考虑理论条件,这些条件允许有效地发展目标方向推理以及实现目标方向推理以外的功能,因此我们希望将其作为未来的问题。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A quasi-Bayes algorithm for fast and accurate online learning of Dynamic Bayesian Networks
一种用于快速准确在线学习动态贝叶斯网络的准贝叶斯算法
Towards Learning to Learn and Plan by Relational Reinforcement Learning
通过关系强化学习来学习和计划
Hiroyuki Nakahara: "Dopamine Neurons Can Represent Context-Dependent Prediction Error"Neuron. 41. 269-280 (2004)
Hiroyuki Nakahara:“多巴胺神经元可以代表上下文相关的预测错误”神经元。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

伊藤 秀昭其他文献

伊藤 秀昭的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('伊藤 秀昭', 18)}}的其他基金

Construction of an integrated cognitive architecture based on ACT-R and POMDP theory and its application
基于ACT-R和POMDP理论的集成认知架构构建及应用
  • 批准号:
    22K12195
  • 财政年份:
    2022
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

高次脳機能発達における甲状腺ホルモンの作用機構
甲状腺激素在高级脑功能发育中的作用机制
  • 批准号:
    24K10021
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
高次脳機能障害をもちながら子どもを育てる親の語りによる生活の様相の可視化
通过抚养患有严重脑功能障碍的孩子的父母的叙述来可视化生活的各个方面
  • 批准号:
    24K14008
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
脂質多様性制御による高次脳機能制御機構解明と広範な神経変性疾患への応用
通过脂质多样性调节阐明高级脑功能控制机制并应用于广泛的神经退行性疾病
  • 批准号:
    24K14766
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
睡眠時脳波の解析による、側頭葉てんかんにおける高次脳機能障害の病態解明
通过睡眠脑电图分析阐明颞叶癫痫高级脑功能障碍的病理学
  • 批准号:
    24K18703
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
地域在住の高次脳機能障害者への実践型支援の行動変容介入モデルの開発
开发行为改变干预模型,为患有严重脑功能障碍的社区居民提供实际支持
  • 批准号:
    24K05435
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了