カオス力学系と学習の融合による動的世界に対する適応機構の構築に関する研究
混沌动力系统与学习相结合构建动态世界自适应机制研究
基本信息
- 批准号:09878063
- 负责人:
- 金额:$ 1.15万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は,動的,複雑に変化する実世界を対象とした実時間の学習問題を取り扱うための理論および実装手法を明らかにすることを目的としたもので,カオス力学系の理論による世界のモチリングと強化学習の理論による探査問題の融合を提案して研究を進め,学習アルゴリズムを開発し,いくつかのロボット学習問題へ応用し有効性を確認することができた.また発展研究として,マルチエージェントの相互学習のダイナミクスに着目し,開発した手法を適用して集団を動的な収束に導く可能性を実験的に明らかにすることができた.当該期間に得られた成果は以下のようにまとめられる.1. 学習エージェントの実環境センシングデータを動的な知識として表現する手法として,時系列を力学系として再構築するモデル化に着眼し,時間遅れ座標を用いたアルゴリズムに実装した2. 時間遅れ座標による再構成によりセンサ系列のダイナミクスを高次空間上に再構築する表現から,次の時刻の短期未来状態予測として知識を取り出せることを見出し,これを学習機構に与えることで,強化学習を学習法として利用すれば,方策の表現を次元拡張するのみで,コンテクスト依存性を解消し,かつ学習を正しい経験に基づいて行うような学習理論を得ることを示したコンテクストベクトル表現など固定的な長さの過去の履歴によらずに,過去の履歴の動的特徴を知識として蓄えることができることを明らかにし,また学習は予測に依存することなく実際の経験から正しい方策を得ることができることから,この遅れ座標による知識表現はパラメータ依存性を厳しく要求しないことが明らかになった.これによりカオティックな現象を含めて実世界データをダイナミクスの立場で学習する基礎を得た.3. 発展研究として,ダイナミクスによる環境同定とその学習を同時に行うシステムが相互に共通環境で作業する場合に,ダイナミクスの形成とそれによる協調行動の自動発生が期待でき,集団での動的環境への適応が起きることを,実験を通じて十分な可能性を確認した.
The purpose of this study is to improve the quality of the world in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. in this study, we have done a lot of work in this study. Please make sure that you do not know if you are interested in learning questions. In the course of the exhibition and research, we should pay close attention to the study of each other, and we should use the method to show the possibility of using the information system. When the following results are received during the period, the following results are not available. 1. In order to improve the performance of the environmental protection system, the knowledge management system of the environmental protection system shows that the method is not correct, and the series of mechanical science department should pay more attention to it. At the same time, the equipment should be installed in the system. The time cycle is changed into a series of high-speed, space-time, high-speed, high-speed, high-speed In order to solve the problem of dependence, the system is based on the theory of learning. The results show that the performance of the system is stable in the past, and the knowledge of the performance program has been improved. You need to know how to learn about your dependence. You know, you know, you know. I don't know if there are any problems in the world. I don't know how to learn anything. To conduct research sessions, to conduct joint environmental training programs, and to conduct joint environmental training programs at the same time. Joint environmental training programs, joint environmental cooperation activities, automatic student health expectations, joint environmental training and communication programs are very likely to be confirmed.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Sadayoshi Mikami: "Adaptive Gait Generation as an Analogy to Magnetising Process" Proc.lntl.Symp.on Artificial Life and Robotics 98.235-237 (1998)
Sadayoshi Mikami:“自适应步态生成作为磁化过程的类比”Proc.lntl.Symp.on Artificial Life and Robotics 98.235-237 (1998)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Tomoyoshi Nakayama: "Behavior Generation for Multiple Linked Creature Using Pulse Information" Intelligent Autonomous Systems. 602-608 (1998)
Tomoyoshi Nakayama:“使用脉冲信息的多链接生物的行为生成”智能自治系统。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Tsuyoshi Mikami: "Ant-like Collective Sorting for Massive Date Analysis-A Quantative Study-" Intelligent Autonomous Systems. 686-693 (1998)
Tsuyoshi Mikami:“用于大规模数据分析的类蚂蚁集体排序-定量研究-”智能自治系统。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Masao Kubo: "Effectiveness of Logistic Noise for Incremental Evolution of Continuous Recurrent Neural Networks Specified by Variable Length Genotype" Intelligent Autonomous Systems. 719-726 (1998)
Masao Kubo:“逻辑噪声对可变长度基因型指定的连续循环神经网络增量进化的有效性”智能自治系统。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Sadayoshi Mikami: "Adaptive Gait Generation as an Analogy to Magnetising Process" Proc.Intl.Symp.on Artificial Life and Robotics 98.235-237 (1997)
Sadayoshi Mikami:“自适应步态生成作为磁化过程的类比”Proc.Intl.Symp.on Artificial Life and Robotics 98.235-237 (1997)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
三上 貞芳其他文献
三上 貞芳的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('三上 貞芳', 18)}}的其他基金
Passive Hard-Linkage Jamming Mechanism for Robust Grasping on Robot Hand and Foot
被动式硬连杆干扰机制,可实现机器人手脚的强力抓取
- 批准号:
22K04029 - 财政年份:2022
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
遺伝的知識獲得による学習推論機構の研究
通过遗传知识获取的学习推理机制研究
- 批准号:
04750290 - 财政年份:1992
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
- 批准号:
24K20873 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
マルチエージェント強化学習による人間と合意形成する自動交渉エージェントの開発
开发使用多智能体强化学习与人类达成共识的自动谈判智能体
- 批准号:
23K11230 - 财政年份:2023
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
マルチエージェント逆強化学習による動物の集団形成を制御する意思決定機構の解明
利用多智能体逆强化学习阐明控制动物群体形成的决策机制
- 批准号:
22K15181 - 财政年份:2022
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Development of inverse reinforcement learning focusing on the multiobjective nature of humans and autonomous systems: towards zero risk and comfort maximization.
逆向强化学习的发展侧重于人类和自主系统的多目标性质:实现零风险和舒适度最大化。
- 批准号:
22H03665 - 财政年份:2022
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
未知の協調・環境を想定したマルチエージェント強化学習の知識転移
假设未知合作/环境的多智能体强化学习的知识转移
- 批准号:
21K17807 - 财政年份:2021
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Constraction and Verification of P2P Power Trading System Based on Bidding Behavior by Reinforcement Learning
基于强化学习竞价行为的P2P电力交易系统构建与验证
- 批准号:
20K04420 - 财政年份:2020
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Cognitive Economy in Reusing Policy Selection for Reinforcement Learning Robots Based on Prototype Theory
基于原型理论的强化学习机器人重用策略选择的认知经济
- 批准号:
19K12173 - 财政年份:2019
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
強化学習によるメンバーシップ向上に寄与する共創的ナース・スケジューリングシステム
共同创造的护士调度系统,有助于通过强化学习提高会员资格
- 批准号:
19K04906 - 财政年份:2019
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of autonomous-decentralized voltage control utilizing reinforcement learning in distribution network
在配电网中利用强化学习开发自主分散电压控制
- 批准号:
18K13747 - 财政年份:2018
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Integration of Kullback-Leibler control and intrinsic rewards for reinforcement learning
Kullback-Leibler 控制和强化学习内在奖励的集成
- 批准号:
16K12504 - 财政年份:2016
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research














{{item.name}}会员




