共進化的環境創造による自律移動ロボットのメタレベル行動学習

通过共同进化环境创建自主移动机器人的元级行为学习

基本信息

  • 批准号:
    14750362
  • 负责人:
  • 金额:
    $ 2.11万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2003
  • 项目状态:
    已结题

项目摘要

本研究では,高次元・連続な状態入出力を有する制御対象として自律移動ロボットをとりあげ,その感覚・行動間写像の同定に強化学習法を適用する際に問題となる,計算資源の割当て問題を解決するための一手法として,NGnetで実装したActor-Critic強化学習に学習器の構造パラメータを同時に探索する進化的recruitment戦略を導入する手法を提案した.昨年度までに検証した提案アルゴリズムの有効性と実ロボットによる実証実験は,計測自動制御学会論文集ならびにJournal of Robotics and Autonomous Systemsに掲載された.また,本年度は学習器の構造最適化に加えて,「いかにして複雑な学習課題を効率よく学習するか?」という,学習のスケジューリングに関する研究にも同時並行して取り組んだ.発達心理学におけるpiagetの先駆的研究を参考に,人間の身体と神経系の共進化的発達と,近年,盛んに研究が行われ始めている認知発達ロボティクスの関連に着目した.すなわち,多自由度な感覚運動連関を有する移動ロボットの制御器を強化学習で学習する際に,過去の学習事例から「学習のコツ」となる拘束条件を抽出して記憶しておき,これを未学習課題の習得に拘束条件として用いることで,無駄な試行錯誤数を削減し,その結果として強化学習を高速化することができる,「拘束条件抽出型強化学習法」を提案した.
In this study, we propose a method to solve the problem of computational resource segmentation when applying reinforcement learning method to high dimensional continuous state input and output, and to explore the evolutionary recruitment strategy of learning machine. The paper was published in Journal of Robotics and Autonomous Systems. This year, the optimization of the structure of the learning device was added,"The efficiency of learning is improved." In the middle of the study, the study was conducted in parallel. In recent years, the research on the relationship between cognitive development and the evolution of human body and nervous system has begun. During reinforcement learning, learning constraints are extracted from past learning examples, learning constraints are stored in memory, learning constraints are used in unlearned subjects, trial errors are reduced, and reinforcement learning speeds up as a result. A proposal for "constrained conditional withdrawal reinforcement learning".

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
近藤敏之, 伊藤宏司: "環境共創による適応的行動学習 -実移動ロボットによる押し動作獲得"計測自動制御学会システム・情報部門学術講演会2002講演論文集(優秀論文賞受賞). 423-428 (2002)
Toshiyuki Kondo、Hiroshi Ito:“通过环境共创进行自适应行为学习 - 通过真实移动机器人获取推力运动”仪器与控制工程师学会系统与信息分会学术会议 2002 年论文集(最佳论文奖获得者) 423-428(2002)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
近藤敏之, 伊藤宏司: "共進化環境創造による実移動ロボットのPeg押し動作学習"日本ロボット学会創立20周年記念学術講演会. (CD-ROM). 3H32 (2002)
Toshiyuki Kondo、Hiroshi Ito:“通过创建共同进化环境来学习真实移动机器人的推动运动”日本机器人学会 20 周年学术讲座(CD-ROM)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toshiyuki Kondo, Koji Ito: "A Study on Designing Robot Controllers by Using Reinforcement Learning with Evolutionary State Recruitment Strategy"Proceedings of the First International Workshop on Biologically Inspired Approaches to Advanced Information Tec
Toshiyuki Kondo、Koji Ito:“利用强化学习和进化状态招募策略设计机器人控制器的研究”第一届高级信息技术仿生方法国际研讨会论文集
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toshiyuki Kondo, Norihiko Itoh, Koji Ito: "An Incremental Learning using Schema Extraction Mechanism for Autonomous Mobile Robot"Proceedings of 2003 IEEE International Symposium on Computational Intelligence in Robotics and Automation. (CD-ROM). 1126-1131
Toshiyuki Kondo、Norihiko Itoh、Koji Ito:“An Incremental Learning using Schema Extraction Mechanism for Autonomous Mobile Robot”2003 IEEE 机器人与自动化计算智能国际研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toshiyuki Kondo, Koji Ito: "A Reinforcement Learning with Adaptive State Space Recruitment Strategy for Real Autonomous Mobile Robots"Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS'02). (CD-ROM). ID:393 (2002)
Toshiyuki Kondo、Koji Ito:“针对真正自主移动机器人的自适应状态空间招募策略的强化学习”IEEE/RSJ 国际智能机器人与系统会议 (IROS02) 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

近藤 敏之其他文献

把持運動の維持における運動負荷と視覚フィードバックの違いが事象関連脱同期に及ぼす影響
运动负载和视觉反馈差异对维持抓取运动期间事件相关去同步的影响
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中屋敷 弘晟;戸敷 創;林 叔克;須藤 珠水;矢野 史朗;近藤 敏之
  • 通讯作者:
    近藤 敏之
Model-based Rehabilitation from Sense of Agency
基于代理意识的基于模型的康复
Estimation of Dynamic Structure underlying Brain Activities and its Constructive Modeling
大脑活动的动态结构估计及其构建模型

近藤 敏之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('近藤 敏之', 18)}}的其他基金

拘束条件の漸進的獲得と動的環境認知によるロボットの未知環境適応
机器人通过约束条件的逐步获取和动态环境识别来适应未知环境
  • 批准号:
    18700195
  • 财政年份:
    2006
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
拘束条件の自己形成・実時間選択による感覚運動情報統合モデルと移動ロボットへの応用
基于自形成和实时选择约束的感觉运动信息集成模型及其在移动机器人中的应用
  • 批准号:
    16760337
  • 财政年份:
    2004
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
生体内免疫系を参考にした創発・適応機構の構築に関する研究
参考体内免疫系统构建应急和适应机制的研究
  • 批准号:
    97J01638
  • 财政年份:
    1998
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

Towards Explainable AI Algorithms via Fitness Landscape Analysis in Evolutionary Computation
通过进化计算中的适应度景观分析实现可解释的人工智能算法
  • 批准号:
    2890959
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Studentship
Establishment of a Novel Optimizer in Variational Quantum Eigensolver by Applying Evolutionary Computation
应用进化计算建立变分量子本征求解器的新型优化器
  • 批准号:
    23K11220
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Evolutionary computation for expensive bilevel multiobjective problems
昂贵的双层多目标问题的进化计算
  • 批准号:
    DP220101649
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Projects
Study of distributed evolutionary computation for interrelated multi-objective optimization problems
相互关联的多目标优化问题的分布式进化计算研究
  • 批准号:
    22K12185
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of Multi-objective Evolutionary Computation Algorithms Based on Adaptive Operator Slection and Dynamic System Learning
基于自适应算子选择和动态系统学习的多目标进化计算算法的发展
  • 批准号:
    20K11997
  • 财政年份:
    2020
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Multi-Objective Optimization of an Axial Flow Hydraulic Turbine with a Collection Device Using Evolutionary Computation Method and Elucidation of Water Collection Acceleration Action
使用进化计算方法对带有集水装置的轴流式水轮机进行多目标优化以及集水加速作用的阐明
  • 批准号:
    20K04258
  • 财政年份:
    2020
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of evolutionary computation method for dynamic scheduling
动态调度进化计算方法的发展
  • 批准号:
    20K04985
  • 财政年份:
    2020
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Simultaneous Problem Set Optimization Using Evolutionary Computation
使用进化计算的同步问题集优化
  • 批准号:
    19K12135
  • 财政年份:
    2019
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on knowledge acquisition from fitness landscape for evolutionary computation
用于进化计算的适应度景观知识获取研究
  • 批准号:
    19J11792
  • 财政年份:
    2019
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Development of evolutionary computation techniques to realize human-out-of-the-loop
发展进化计算技术以实现人类脱离循环
  • 批准号:
    19H04179
  • 财政年份:
    2019
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了