通信無し強化学習エージェント群による動的環境への追従

使用强化学习代理跟踪动态环境,无需通信

基本信息

  • 批准号:
    17J08724
  • 负责人:
  • 金额:
    $ 1.6万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2017
  • 资助国家:
    日本
  • 起止时间:
    2017-04-26 至 2020-03-31
  • 项目状态:
    已结题

项目摘要

本年度は3年目のテーマである「実問題における適用」に向けて,1)複数種類の動的変化が複合した環境に対する通信なしマルチエージェント強化学習法の提案,および,2)環境変化が断続的に発生する際の適用方法を提案し,最後に,3)提案手法を一般化し,適用可能な実応用問題を定義した.具体的には,1)に関して,エージェント毎の学習範囲と利用する情報を制限して学習することで,環境形状及びエージェント・ゴール数の変化へ追従する手法を提案し,その有効性を示した.また,2)に関して,1)での提案手法において,学習範囲を制限するタイミング,および利用する情報の窓(どれほど昔の情報まで利用するか)をハイパーパラメータとして設定していたものを,環境に合わせて適応的に設定することで,タイミングが異なる断続的な動的変化に追従可能となるように拡張した.これらの成果により,物流システムでいえば,物資の補給地点や目的地,通行路が変わるだけではなく,物資を運ぶロボットの数や目的が増えたとき,そしてそのタイミングが不明であっても,各ロボットが通信を一切行わずに協調行動の学習が可能となり,実問題に対する適用範囲が大きく広がった.そしてこれらの成果は,国際ジャーナルSN Computer Scienceへ掲載が決定しており,英語論文誌SICE JCMSIに掲載済みである.また,国内学会FIT2019,JAWS2019,そして国際会議OptLearnMAS2020にて発表を行った.最後に,3)に関しては,1)と2)の提案手法について,学習範囲の制限により,各エージェントの学習を2体エージェントの協調で分割可能腕あり,提案手法の性能は十分発揮できることを示し,問題に関しては,提案手法がエージェント同士の衝突を加味した上でも性能を発揮することを実験で示した.これにより,実問題として想定していた倉庫ロボットへの適用が可能であることがわかった.この成果は電気学会論文誌Cに掲載済みである.
This year's goal is to: 1) propose a reinforcement learning method for multiple types of mobile communication, 2) propose an appropriate method for the generation of mobile communication, 3) generalize the proposed method, and define the applicable problem. Specifically, 1) relevant information, such as the shape of the environment and the number of changes in the learning environment, is used to limit the learning process. 2) Related, 1) The proposal method in the middle of the study, the scope of control, the use of information (the use of information), the environment, the appropriate setting, the change of movement, the possibility of expansion. The results of the logistics are as follows: the supply location of resources and the destination of resources; the traffic route; the number of resources and the destination of resources; the number of resources and the destination; the number of resources International Journal of Computer Science (SICE JCMSI) International Conference on OptLearnMAS2020, FIT2019, JAWS2019, China Finally, 3) in relation to 1) and 2), the proposal method is divided into two parts: the learning range is limited, the learning range is coordinated, and the performance of the proposal method is divided into two parts. The problem is that if you want to fix the problem, you have to fix it. The results of this paper are published in Journal C of the Institute of Electrical Engineering.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
SLIM Spacecraft Location Estimation by Crater Matching Based on Similar Triangles and Its Improvement
基于相似三角形的弹坑匹配的SLIM航天器位置估计及其改进
Niche Radius Adaptation in Bat Algorithm for Location Multiple Optima in Multimodal Functions
蝙蝠算法中的小生境半径适应多模态函数中的位置多重最优
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takuya Iwase;Ryo Takano;Fumito Uwano;Hiroyuki Sato;and Keiki Takadama
  • 通讯作者:
    and Keiki Takadama
包括的な撮影画像パターンに対するSLIM探査機の自己位置推定の評価と精度向上
基于综合像图的SLIM航天器自定位评估及精度提升
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小野 貴史;菊嶌 孝太郎;大橋 理人;生越 專介;上野 史,村田 暁紀,辰巳 嵩豊,高玉 圭樹,鎌田 弘之,石田 貴行,福田 盛介,澤井 秀次郎,坂井 真一郎
  • 通讯作者:
    上野 史,村田 暁紀,辰巳 嵩豊,高玉 圭樹,鎌田 弘之,石田 貴行,福田 盛介,澤井 秀次郎,坂井 真一郎
Ensemble Heart Rate Extraction Method for Biological Data from Pressure Sensor Sensor
压力传感器生物数据的整体心率提取方法
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Haruyuki Ishii;Yuta Umenai;Kazuma Matsumoto;Fumito Uwano;Takato Tatsumi;Keiki Takadama;Hiroyuki Kamata;Takayuki Ishida;Seisuke Fukuda;Shujiro Sawai;and Shinichiro Sakai;上野史,髙玉圭樹;上野史,村田暁紀,辰巳嵩豊,髙玉圭樹,鎌田弘之,石田貴行,福田盛介,澤井秀次郎,坂井真一郎;長谷川智,上野史,髙玉圭樹;岩瀬拓哉,高野諒,上野史,佐藤寛之,髙玉圭樹;北島瑛貴,辰巳嵩豊,村田暁紀,上野史,髙玉圭樹;田島友祐,上野史,原田智広,髙玉圭樹;Fumito Uwano;Fumito Uwano
  • 通讯作者:
    Fumito Uwano
Strategies to Improve Cuckoo Search Toward Adapting Randomly Changing Environment
改进布谷鸟搜索以适应随机变化环境的策略
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Haruyuki Ishii;Yuta Umenai;Kazuma Matsumoto;Fumito Uwano;Takato Tatsumi;Keiki Takadama;Hiroyuki Kamata;Takayuki Ishida;Seisuke Fukuda;Shujiro Sawai;and Shinichiro Sakai;上野史,髙玉圭樹;上野史,村田暁紀,辰巳嵩豊,髙玉圭樹,鎌田弘之,石田貴行,福田盛介,澤井秀次郎,坂井真一郎;長谷川智,上野史,髙玉圭樹;岩瀬拓哉,高野諒,上野史,佐藤寛之,髙玉圭樹;北島瑛貴,辰巳嵩豊,村田暁紀,上野史,髙玉圭樹;田島友祐,上野史,原田智広,髙玉圭樹;Fumito Uwano;Fumito Uwano;Yuta Umenai;Haruyuki Ishii;Akari Tobaru;Eiki Kitajima;Satoshi Hasegawa;上野 史;Yuta Umenai
  • 通讯作者:
    Yuta Umenai
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

上野 史其他文献

Design of Human-Agent-Group Interaction for Correct Opinion Sharing on Social Media
社交媒体上正确观点分享的人-智能体-群体交互设计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上野 史;Fumito Uwano;Fumito Uwano;Fumito Uwano
  • 通讯作者:
    Fumito Uwano
マルチエージェント強化学習の報酬設計による知識の蒸留と転移に関する一考察
多智能体强化学习中通过奖励设计进行知识蒸馏和迁移的研究
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上野 史;Fumito Uwano;Fumito Uwano;Fumito Uwano;上野 史;上野 史
  • 通讯作者:
    上野 史
獲得報酬の分布に基づくエージェント間の暗黙的協調行動学習とその効果の検証
基于获得的奖励分配及其效果验证的代理之间的隐式合作行为学习
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上野 史;Fumito Uwano;Fumito Uwano;Fumito Uwano;上野 史;上野 史;上野 史
  • 通讯作者:
    上野 史
Multi-Agent Reinforcement Learning in Different Granularity of Observations
不同观察粒度的多智能体强化学习
Implicit Cooperative Learning on Distribution of Received Reward in Multi-agent System
多智能体系统中奖励分配的隐式合作学习
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上野 史;Fumito Uwano
  • 通讯作者:
    Fumito Uwano

上野 史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('上野 史', 18)}}的其他基金

多目的進化計算を用いたエージェント群の戦略的意思決定を実現する強化学習
使用多目标进化计算实现一组智能体的战略决策的强化学习
  • 批准号:
    24K03001
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
未知の協調・環境を想定したマルチエージェント強化学習の知識転移
假设未知合作/环境的多智能体强化学习的知识转移
  • 批准号:
    21K17807
  • 财政年份:
    2021
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists

相似海外基金

深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
  • 批准号:
    24KJ2223
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
  • 批准号:
    24K16865
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
  • 批准号:
    24K20873
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
  • 批准号:
    23K20948
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発
考虑延迟的异步分布式多模块时间尺度深度强化学习的开发
  • 批准号:
    23K21710
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
汎用かつ再利用可能な方策に基づく階層強化学習
基于通用和可重用策略的分层强化学习
  • 批准号:
    23K28140
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
  • 批准号:
    23K26216
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
強化学習に基づく自己位置推定のための地図および環境の最適化
基于强化学习的自定位地图与环境优化
  • 批准号:
    24K15136
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
強化学習に基づく「先読み」を用いた小規模・高効率ゲノミック選抜法の開発と実装
基于强化学习的“前瞻”小规模高效基因组选择方法的开发和实施
  • 批准号:
    23K23572
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
VRによる外国語学習の動機づけ強化:学習環境デザインの構築に向けて
利用 VR 增强外语学习动机:构建学习环境设计
  • 批准号:
    24K16763
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了