報酬最大化原理および大脳基底核モデルによるゴール指向性推論機能の自動的実装
使用奖励最大化原理和基底神经节模型自动实现目标导向推理功能
基本信息
- 批准号:15700180
- 负责人:
- 金额:$ 1.15万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は、ゴール指向性推論を始めとした、人間の脳の持つ様々な高次脳機能を包括的に実現するエージェントを設計することを目標としたものである。そのため、ゴール指向性推論に始めから特化してエージェントを設計するのではなく、「エージェントとその環境についてのある制約条件のもとで報酬最大化という最適化問題を解く」という形でエージェントを設計し、その結果として「ゴール指向性推論がエージェントに実装された」という現象を自動的に発生させることを試みた。前年度までの研究によりそのような現象が発生する具体例を考案していたが、最適化に長い時間がかかってしまうという問題があった。そこで本年度はその現象をより効率よく発生させることを目指して、新たな最適化手法の開発を行った。第一に、これまではエージェントが環境を直接には学習しない強化学習的手法を用いていたが、最適化が完了するまでに環境と多くのインタラクションを行う必要があり非効率的であった。そこで効率化のためには環境を学習させた方が良いのではないかと考え、そのための手法を開発した。特に、確率的な環境をコンパクトに表現する事ができるダイナミックベイジアンネットワークを用いることが有望であると考え、これを効率よく学習することができる手法を開発した。この成果については学会にて公表済みである。第二に、学習された環境をもとに効率よく最適化を行う手法も開発した。これについては論文を投稿中である。これらによってこれまでより大幅に効率的な最適化が可能となった。ただし、ゴール指向性推論の効率のよい発生が可能となる理論的条件やゴール指向性推論以外の機能の実現については十分検討できなかったため、今後の課題としたい。
This study is aimed at the development of directional inference and the maintenance of high-level functions, including the design of directional inference. The problem of compensation maximization optimization is solved by the constraint condition of the environment. The problem of compensation maximization optimization is solved by the design condition of the environment. The problem of compensation maximization is solved by the constraint condition of the environment. The problem of compensation maximization is solved by the constraint condition of the environment. In the past year, we have studied the specific cases of occurrence of phenomena and optimization of problems. This year's new optimization method was developed. The first is to optimize the environment and the method of reinforcement learning, which is necessary to improve the efficiency of learning. The best way to learn is to learn from the environment. In particular, the accuracy of the environment, the performance of the matter, the use of the hope, the efficiency of learning, the development of the method The results of this study are as follows: The second is to learn how to do it.これについては论文を投稿中である。This is the best way to optimize your performance. The theoretical conditions for the development of the efficiency of directivity inference are discussed in detail.
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A quasi-Bayes algorithm for fast and accurate online learning of Dynamic Bayesian Networks
一种用于快速准确在线学习动态贝叶斯网络的准贝叶斯算法
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Hideaki Itoh
- 通讯作者:Hideaki Itoh
Towards Learning to Learn and Plan by Relational Reinforcement Learning
通过关系强化学习来学习和计划
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:Hideaki Itoh;Hideaki Itoh
- 通讯作者:Hideaki Itoh
Hiroyuki Nakahara: "Dopamine Neurons Can Represent Context-Dependent Prediction Error"Neuron. 41. 269-280 (2004)
Hiroyuki Nakahara:“多巴胺神经元可以代表上下文相关的预测错误”神经元。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
伊藤 秀昭其他文献
伊藤 秀昭的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('伊藤 秀昭', 18)}}的其他基金
Construction of an integrated cognitive architecture based on ACT-R and POMDP theory and its application
基于ACT-R和POMDP理论的集成认知架构构建及应用
- 批准号:
22K12195 - 财政年份:2022
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
高次脳機能発達における甲状腺ホルモンの作用機構
甲状腺激素在高级脑功能发育中的作用机制
- 批准号:
24K10021 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
高次脳機能障害をもちながら子どもを育てる親の語りによる生活の様相の可視化
通过抚养患有严重脑功能障碍的孩子的父母的叙述来可视化生活的各个方面
- 批准号:
24K14008 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
脂質多様性制御による高次脳機能制御機構解明と広範な神経変性疾患への応用
通过脂质多样性调节阐明高级脑功能控制机制并应用于广泛的神经退行性疾病
- 批准号:
24K14766 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
睡眠時脳波の解析による、側頭葉てんかんにおける高次脳機能障害の病態解明
通过睡眠脑电图分析阐明颞叶癫痫高级脑功能障碍的病理学
- 批准号:
24K18703 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
地域在住の高次脳機能障害者への実践型支援の行動変容介入モデルの開発
开发行为改变干预模型,为患有严重脑功能障碍的社区居民提供实际支持
- 批准号:
24K05435 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
反復経頭蓋磁気刺激法を用いた精神疾患・高次脳機能障害の新規治療法の開発
使用重复经颅磁刺激开发精神疾病和高级脑功能障碍的新治疗方法
- 批准号:
24K14330 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
神経膠腫患者の機能予後に関する調査研究 -高次脳機能に着目して-
胶质瘤患者的功能预后研究-聚焦高级脑功能-
- 批准号:
24K20434 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
胎生期葉酸不足による高次脳機能障害のメカニズムの解明
阐明胎儿叶酸缺乏导致的高级脑功能障碍的机制
- 批准号:
24K08818 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
視床網様核における外的要因(感覚情報)と内的要因(高次脳機能と報酬の重み)の接合
丘脑网状核中外部因素(感觉信息)和内部因素(高级大脑功能和奖励权重)的结合
- 批准号:
24K09669 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
PKA 局在の負の制御因子が高次脳機能を制御する分子的基盤の解明
阐明 PKA 定位负调节因子控制高级脑功能的分子基础
- 批准号:
24K18160 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Early-Career Scientists














{{item.name}}会员




