身体像を内蔵した学習機構の開発と多自由度ロボットへの適用

内置人体图像学习机制的开发及其在多自由度机器人中的应用

基本信息

  • 批准号:
    15700134
  • 负责人:
  • 金额:
    $ 2.3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2003
  • 资助国家:
    日本
  • 起止时间:
    2003 至 2004
  • 项目状态:
    已结题

项目摘要

本研究では,多自由度ロボットのための学習に基づく自律制御系の構築を目標とし,身体像を用いて状態爆発を解決する強化学習の新しい枠組みを提案した.まず,近年のダイナミクスベースト制御における成果を取り入れ,身体像は,身体の逆モデルにより実現されるのではなく,身体のモデルを用いず環境の力学系によりに実現するべきであることを示し,身体像の新しい枠組みを提案した.また,提案した枠組みに基づき,ロボットの身体像を分散フィードバック系により工学的に実現し,身体像によって,広大な探索空間のなかから小さな閉じた部分集合を抜き出すことが可能となることを示した.さらに,多自由度ロボットの冗長性に注目し,広大な探索空間のかわりに,抜きだされた小さな部分集合に対して強化学習を適用しても解が獲得されることを示し,多自由度ロボットへの強化学習の適用を可能とした.最後に,部分集合に対する強化学習により得られた知識をもとに部分集合を再構成し,再び新しい部分集合に対して強化学習を適用するというプロセスを繰り返すことで,広大な探索空間を大域的に探索し,得られた冗長な解を他のより良い解へと改善していくことが可能であることを示した.さらに,この場合,事前知識を用いず試行錯誤により自律的に解を獲得するという従来の強化学習の重要な性質を保持したまま,従来の強化学習に比べ効率的に広範囲の探索が可能となることを示した.したがって,本研究は多自由度ロボットの学習に基づく自律制御系の新しい枠組みを提案したといえ非常に有用であると考えられる.
This study proposes a new approach to reinforcement learning based on multi-degree-of-freedom learning and the construction of an autonomous system. In recent years, the achievements of body image control have been introduced, and the body image inverse has been realized. The body image is used in the mechanical system of the environment. The body image of the object is dispersed in the space, and the object is displayed in the space. In addition, the multi-degree of freedom (DOF) method is applicable to reinforcement learning, and the multi-degree of freedom method is applicable to reinforcement learning. Finally, part of the set of reinforcement learning for the acquisition of knowledge, part of the set of reconstruction, and then new parts of the set of reinforcement learning for the application of the large space to explore, and obtain lengthy solutions to other good solutions to improve the situation. In this case, prior knowledge is used to test errors, obtain self-disciplined solutions, and maintain the important properties of future reinforcement learning. This study is very useful in the study of multi-degree freedom, learning base, self-control system and new group of proposals.

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
機械の知能・学習・進化-やわらかい機械をめざして-
机器智能、学习和进化——瞄准软机器——
  • DOI:
  • 发表时间:
    2003
  • 期刊:
  • 影响因子:
    0
  • 作者:
    竹下光夫;則次俊郎;五福明夫;伊藤一之;佐々木大輔
  • 通讯作者:
    佐々木大輔
GAにより探索空間の動的生成を行うQ学習による実多自由度ロボットの制御
使用 Q 学习控制真正的多自由度机器人,并使用 GA 动态生成搜索空间
サービスロボットへの指令における不完全性の対話による補完手法
针对服务机器人命令不完整的对话补全方法
K.Ito, T.Kamegawa, F.Matsuno: "Extended QDSEGA for Controlling Real Robots -Acquisition of Locomotion Patterns for Snake-like Robot-"Proc. of IEEE Int. Conf. on Robotics and Automation. 791-796 (2003)
K.Ito、T.Kamekawa、F.Matsuno:“用于控制真实机器人的扩展 QDSEGA - 获取蛇形机器人的运动模式 -”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Hybrid autonomous control for multi mobile robots
多移动机器人的混合自主控制
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kazuyuki Ito;Akio Gofuku
  • 通讯作者:
    Akio Gofuku
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

伊藤 一之其他文献

友人関係ネットワークを用いたコミュニティの時間推移の分析
利用友谊网络分析社区时间变化
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 一之;黒江 聡;萩森 駿介;三木友祐,武藤敦子,森山甲一,犬塚信博
  • 通讯作者:
    三木友祐,武藤敦子,森山甲一,犬塚信博
Abstraction of State-Action Space Utilizing Properties of the Environment and the Body
利用环境和身体的特性抽象状态-动作空间

伊藤 一之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('伊藤 一之', 18)}}的其他基金

実世界の性質を利用した状態行動空間の抽象化と実ロボットへの実装方法の確立
利用现实世界属性抽象状态-动作空间并建立真实机器人的实现方法
  • 批准号:
    22K12155
  • 财政年份:
    2022
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
受動知能と能動知能による知能の解釈と多自由度ロボットの自律制御への応用
被动智能与主动智能对智能的解读及其在多自由度机器人自主控制中的应用
  • 批准号:
    17700153
  • 财政年份:
    2005
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
  • 批准号:
    23K20948
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発
考虑延迟的异步分布式多模块时间尺度深度强化学习的开发
  • 批准号:
    23K21710
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
  • 批准号:
    23K26216
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
  • 批准号:
    24KJ2223
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
  • 批准号:
    24K16865
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
汎用かつ再利用可能な方策に基づく階層強化学習
基于通用和可重用策略的分层强化学习
  • 批准号:
    23K28140
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
  • 批准号:
    24K20873
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
強化学習に基づく自己位置推定のための地図および環境の最適化
基于强化学习的自定位地图与环境优化
  • 批准号:
    24K15136
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
強化学習に基づく「先読み」を用いた小規模・高効率ゲノミック選抜法の開発と実装
基于强化学习的“前瞻”小规模高效基因组选择方法的开发和实施
  • 批准号:
    23K23572
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
VRによる外国語学習の動機づけ強化:学習環境デザインの構築に向けて
利用 VR 增强外语学习动机:构建学习环境设计
  • 批准号:
    24K16763
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了