受動性を活用したロボットの強化学習とそのためのデータ駆動モデル構築
使用被动性的机器人强化学习并为其构建数据驱动模型
基本信息
- 批准号:22K04027
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
強化学習において,対象とするシステムに関する完全なモデルが存在する場合,その知識を利用して強化学習を大幅に効率化することが可能である.しかし,ロボットなどの対象を考える場合,完全なモデルを得られることはほとんどない.また,中途半端な知識を利用しようとすると,かえって学習効率の低下を招いてしまう.本研究では,完全なモデルが得られなくても,定性的・構造的な事前知識を利用することで学習効率を大幅に向上できるのではないか,という発想に基づいて学習の効率化を目指している.本期間においては,その第一歩として,多くの機械システムが共通して持つ特徴である受動性に着目し,受動性を保証するモデルの構造を用いたシステムの推定に関する研究を行った.受動性を構造的に保証可能なモデルとして,ポート・ハミルトンモデルが知られている.このモデルはハミルトンの運動方程式を拡張したものであり,力学系のみならず,熱流体システムや電気システムなど幅広い物理システムをこの形式のモデルで表現できる.本期間ではこのモデルの形を仮定したうえで,深層学習の手法を用いることで,受動性を満たすと期待されるシステムの推定を効率的に実施する方法を提案した.手法の有効性はロボットマニピュレータの手先位置制御に関する数値シミュレーションにより検証している.提案法による推定では,10回以下のシミュレーション結果から,制御での使用に耐えるモデルの獲得に成功した.一方,モデルの形式を指定しない方法では,同程度のパラメータ数のモデルで同程度の性能を発揮するためには数百回分のシミュレーションデータが必要であることを確認した.これらの結果は,近年注目を集めているphysics-informed neural networksの制御工学への応用に関する最初の成果の一つであると言えると考えている.
There is a good match between the two parts of the brain, and the result is that there is a problem in the middle of the process, and there is a good deal of knowledge in the middle of the study. In this study, the students' knowledge in advance is significantly higher than that of the students in this study. In this study, there is a significant increase in the number of students who do not want to learn in advance. In this study, in this study, the qualitative knowledge in advance is based on the fact that there is a significant increase in the rate of learning in advance, and that the students want to change the rate of basic education. Multi-system mechanical equipment is common to maintain a special effect on the effect of action, and the cause of action is to be presumed to be effective in the study of activity. it is possible that the protection created by the action device may be affected. Do not know that there is a problem in the form of a physical one. During the period of this period, the equation of motion, the equation of motion, the department of mechanics, the department of mechanics, the In this paper, we use the method to determine the rate of presumptive error, and we expect to use the method to determine the presumptive rate. The method is based on the proposed method. The method is based on the position of the operator to determine the number of errors. The proposed method is based on the presumption of the error rate, and the following 10 times. On the one hand, the control system is successful. On the other hand, the method is specified in the form, and the same level of performance is recorded. The performance is different in the same level. In recent years, attention has been paid to the use of the initial achievements in the field of physics-informed neural networks engineering.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Model Estimation Ensuring Passivity by Using Port-Hamiltonian Model and Deep Learning
使用波特哈密尔顿模型和深度学习确保被动性的模型估计
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Hiroyasu Nakano;Ryo Ariizumi;Toru Asai;Shun-ichi Azuma
- 通讯作者:Shun-ichi Azuma
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
有泉 亮其他文献
有泉 亮的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('有泉 亮', 18)}}的其他基金
統計的機械学習に基づいた多目的最適化による超冗長ロボットの運動生成
基于统计机器学习的多目标优化超冗余机器人运动生成
- 批准号:
14J02946 - 财政年份:2014
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
- 批准号:
24KJ2223 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
- 批准号:
24K16865 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
- 批准号:
24K20873 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
- 批准号:
23K20948 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発
考虑延迟的异步分布式多模块时间尺度深度强化学习的开发
- 批准号:
23K21710 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
汎用かつ再利用可能な方策に基づく階層強化学習
基于通用和可重用策略的分层强化学习
- 批准号:
23K28140 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
- 批准号:
23K26216 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
強化学習に基づく自己位置推定のための地図および環境の最適化
基于强化学习的自定位地图与环境优化
- 批准号:
24K15136 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
強化学習に基づく「先読み」を用いた小規模・高効率ゲノミック選抜法の開発と実装
基于强化学习的“前瞻”小规模高效基因组选择方法的开发和实施
- 批准号:
23K23572 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
VRによる外国語学習の動機づけ強化:学習環境デザインの構築に向けて
利用 VR 增强外语学习动机:构建学习环境设计
- 批准号:
24K16763 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists














{{item.name}}会员




