Multiple-Strategy Based Multi-Agent Systems and Its Learning Method
基于多策略的多Agent系统及其学习方法
基本信息
- 批准号:07680376
- 负责人:
- 金额:$ 0.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 1996
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The objective of the research is to propose a reactive planning agent that can adopt to the complex environment which usually is generated by the combination of hidden multiple dynamical factors. To this end, we have developed multi-strategic approach by independent learning agents that acquire complemental reactive strategies and then co-operate with each other to achieve global objective. The results obtained from the term of the project is summarised as follows :1. We have considered an architecture that consists of single agent containing multiple sub-agents, which have portion of input state vector and have independent performance criteria and learning mechanism. For the automatic task decomposition and arbitration of sub-agents, we have introduced a usage function for each sub-agent, which is specified by the success rate and the results of recent observations. It is shown that the usage function can be used to generate the discrimination pressure. Then by using the output of usage function as a teaching signal and the history of recent sub-agent allocation as a state, a learning arbitration module can be introduced.2. We have shown another approach by the notion of aggregate problem solving, which involves the automatic task decomposition to agents. Providing the pressure for the decomposition of knowledge, we have introduced interaction between agents through the mutual exchange of payoff function, because it is an only information that guarantees to be used in any reinforcement learning algorithm. A payoff filtering function is proposed to this end. It is shown that the function form of the filtering function should be set either competitive or co-operative according to the objective function of the whole agents. This report shows practical implementation of the method to a deadlock avoidance problem of mobile robots. The results show the effect and the promising property of the algorithm.
本研究的目的是提出一种能够适应复杂环境的反应式计划代理,这种环境通常是由隐藏的多种动力因素组合而成的。为此,我们通过独立的学习代理开发了多战略方法,这些代理获得互补的反应策略,然后相互合作以实现全球目标。项目期间取得的成果总结如下:1.我们考虑了一个由多个子智能体组成的体系结构,这些子智能体具有输入状态向量的一部分,并且具有独立的性能准则和学习机制。对于子智能体的自动任务分解和仲裁,我们为每个子智能体引入了一个使用函数,该函数由成功率和最近的观察结果来指定。结果表明,使用函数可以用来产生辨别压力。然后以使用函数的输出作为教学信号,以最近的子智能体分配历史为状态,引入学习仲裁模块。我们已经展示了另一种方法,即聚合问题解决的概念,它涉及到将任务自动分解到代理。为了提供知识分解的压力,我们通过相互交换支付函数来引入代理之间的交互,因为它是保证在任何强化学习算法中使用的唯一信息。为此,提出了收益过滤函数。结果表明,过滤函数的函数形式应根据整个智能体的目标函数设置为竞争的或合作的。本文给出了该方法在移动机器人死锁避免问题中的实际应用。实验结果表明,该算法具有较好的效果和良好的性能。
项目成果
期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Mitsuo Wada: "An Approach to Chaos and Self-Organizing Behaviors in Symbiotic Relationships between Human and Robots" Journal of Robotics and Mechatronics. 8-4. 318-322 (1996)
Mitsuo Wada:“人类与机器人共生关系中的混沌和自组织行为的方法”机器人与机电一体化杂志。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S.Mikami,Y.Kakazu and T.C.Fogarty: "Broadcast Based Fitness Sharing GA for Conflict Resolution Among Autonomous" Evolutionary Computing 2. 40-47 (1995)
S.Mikami、Y.Kakazu 和 T.C.Fogarty:“基于广播的健身共享 GA 用于解决自治之间的冲突”进化计算 2. 40-47 (1995)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Sadayoshi Mikami: "Combining Reinforcement Learning with GA to Find Co-ordinated Control Rules for Multi-Agent System" 1996 IEEE International Conference on Evolutionary Computation. 231-236 (1996)
Sadayoshi Mikami:“结合强化学习与遗传算法来寻找多智能体系统的协调控制规则”1996 年 IEEE 国际进化计算会议。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S.Mikami,M.Wada and T.C.Fogarty: "Distributed GA to Evolve Co-operation of Autonomous Agents" IEEE Singapore International Conference for Information Computation and Instrumentation. 173-177 (1995)
S.Mikami、M.Wada 和 T.C.Fogarty:“分布式 GA 促进自治代理的合作”IEEE 新加坡信息计算和仪器国际会议。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Sadayoshi Mikami: "Acquiring Co-operation without Communication by Reinforcement Learning and Dynamics Identification" Distributed Autonomous Robotic Systems. 2. 439-439 (1996)
Sadayoshi Mikami:“通过强化学习和动态识别获得无需沟通的合作”分布式自主机器人系统。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
MIKAMI Sadayoshi其他文献
MIKAMI Sadayoshi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('MIKAMI Sadayoshi', 18)}}的其他基金
Theoretical analysis of sole shape that stabilizes passive dynamic biped and its application to human and robot walk
稳定被动动态双足的鞋底形状理论分析及其在人类和机器人行走中的应用
- 批准号:
24560299 - 财政年份:2012
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of Co-operative Distributed Outdoor Type Lawn Mowing System by Dynamical Task Allocation of Small-Size Robots
基于小型机器人动态任务分配的协同分布式户外割草系统开发
- 批准号:
15580229 - 财政年份:2003
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Design for cooperative strategies of multi-agents using features of the environment
利用环境特征设计多智能体合作策略
- 批准号:
23K11225 - 财政年份:2023
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Système multi-agents d'évaluation de fonction de récompense pour un robot mobile dans un environnement réel
环境条件下机器人移动补偿功能多智能体评估系统
- 批准号:
534718-2019 - 财政年份:2021
- 资助金额:
$ 0.83万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Système multi-agents d'évaluation de fonction de récompense pour un robot mobile dans un environnement réel
环境条件下机器人移动补偿功能多智能体评估系统
- 批准号:
534718-2019 - 财政年份:2020
- 资助金额:
$ 0.83万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Système multi-agents d'évaluation de fonction de récompense pour un robot mobile dans un environnement réel
环境条件下机器人移动补偿功能多智能体评估系统
- 批准号:
534718-2019 - 财政年份:2019
- 资助金额:
$ 0.83万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Gestion multi-agents de la dynamique de véhicules basse vitesse dans un environnement de navigation stochastique.
在随机导航环境中管理车辆动态的多代理。
- 批准号:
RGPIN-2014-05445 - 财政年份:2018
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
Gestion multi-agents de la dynamique de véhicules basse vitesse dans un environnement de navigation stochastique.
在随机导航环境中管理车辆动态的多代理。
- 批准号:
RGPIN-2014-05445 - 财政年份:2017
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
Gestion multi-agents de la dynamique de véhicules basse vitesse dans un environnement de navigation stochastique.
在随机导航环境中管理车辆动态的多代理。
- 批准号:
RGPIN-2014-05445 - 财政年份:2016
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
Gestion multi-agents de la dynamique de véhicules basse vitesse dans un environnement de navigation stochastique.
在随机导航环境中管理车辆动态的多代理。
- 批准号:
RGPIN-2014-05445 - 财政年份:2015
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
Design of super-distributed control systems for unreliable multi-agents and its application to disaster area survey
不可靠多智能体超分布式控制系统设计及其在灾区调查中的应用
- 批准号:
15K14006 - 财政年份:2015
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
Gestion multi-agents de la dynamique de véhicules basse vitesse dans un environnement de navigation stochastique.
在随机导航环境中管理车辆动态的多代理。
- 批准号:
RGPIN-2014-05445 - 财政年份:2014
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual














{{item.name}}会员




