RI: Small: Coordinating Multi-Agent Learning through Emergent Distributed Supervisory Control

RI:小型:通过紧急分布式监督控制协调多智能体学习

基本信息

  • 批准号:
    1116078
  • 负责人:
  • 金额:
    $ 45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-09-01 至 2014-08-31
  • 项目状态:
    已结题

项目摘要

The project is focused on developing coordination policies for large-scale multi-agent systems operating in uncertain environments through the use of multi-agent reinforcement learning (MARL). Existing MARL techniques do not scale well. This research addresses the scaling issue by using coordination technology to "coordinate" the individual agent learning so as to speed up convergence and lead to learned policies that better reflect overall system objectives. This novel idea is being implemented using an emergent supervisory organization with low overhead that exploits non-local information to dynamically coordinate and shape the learning processes of individual agents while still allowing agents to react autonomously to local feedback. A key question is how to automate the development of the supervisory control process (including supervisory information generation and organization formation). One approach to automation is using a formal model of interactions among agents that also includes a model of global system objectives and policy space of agents to derive the information necessary for appropriate supervisory control. Another approach is the formulation of the supervision problem as a distributed constraint optimization problem. The results of this work provide a necessary component for the development of a wide variety of next-generation adaptive applications, such as smart power grids, cloud computing, and large-scale sensor networks. The broader impact stems from the wide applicability of the resulting learning technology for distributed control, undergraduate and graduate educational activities at UMass, dissemination efforts that make the experimental domain and algorithms publically available, and the development of international collaborations.
该项目致力于通过使用多智能体强化学习(MAIL)为运行在不确定环境中的大规模多智能体系统开发协调策略。现有的Marl技术不能很好地扩展。本研究通过使用协调技术来“协调”单个代理的学习来解决可伸缩性问题,以加快收敛并导致学习的策略更好地反映整体系统目标。这一新的想法是使用一个低开销的紧急监督组织来实现的,该组织利用非本地信息来动态协调和塑造单个代理的学习过程,同时仍然允许代理对本地反馈做出自主反应。一个关键问题是如何使监督控制过程(包括监督信息的产生和组织的形成)的发展自动化。实现自动化的一种方法是使用代理之间相互作用的正式模型,该模型还包括代理的全球系统目标和策略空间的模型,以获得适当监督控制所需的信息。另一种方法是将监督问题表示为分布式约束优化问题。这项工作的结果为智能电网、云计算和大规模传感器网络等各种下一代自适应应用的开发提供了必要的组成部分。更广泛的影响源于由此产生的学习技术在分布式控制、马萨诸塞州大学的本科生和研究生教育活动中的广泛适用性、使实验领域和算法公开的传播努力以及国际合作的发展。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Victor Lesser其他文献

Using quantitative models to search for appropriate organizational designs
Automated organization design for multi-agent systems
Analyzing a quantitative coordination relationship
  • DOI:
    10.1007/bf01384246
  • 发表时间:
    1993-09-01
  • 期刊:
  • 影响因子:
    2.500
  • 作者:
    Keith Decker;Victor Lesser
  • 通讯作者:
    Victor Lesser
Domain Monotonicity and the Performance of Local Solutions Strategies for CDPS-based Distributed Sensor Interpretation and Distributed Diagnosis
A survey of research in deliberative real-time artificial intelligence
  • DOI:
    10.1007/bf01088630
  • 发表时间:
    1994-05-01
  • 期刊:
  • 影响因子:
    1.300
  • 作者:
    Alan Garvey;Victor Lesser
  • 通讯作者:
    Victor Lesser

Victor Lesser的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Victor Lesser', 18)}}的其他基金

RI: Medium: Collaborative Research: Creating Organizationally Adept Software Agents and their Organizations
RI:媒介:协作研究:创建组织熟练的软件代理及其组织
  • 批准号:
    0964590
  • 财政年份:
    2010
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
EAGER: Subsequent Similar Cases to Unexpected, Exceptional Cases
EAGER:后续的类似案例和意外的特殊案例
  • 批准号:
    0938504
  • 财政年份:
    2009
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: Distributed Interpretation in a Communication-Limited Environment
协作研究:通信有限环境中的分布式解释
  • 批准号:
    0414711
  • 财政年份:
    2005
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
NSF-CNPq Collaborative Research: Combining Cognitive & Utilitarian Coordination in a Layered Agent Architecture
NSF-CNPq 合作研究:结合认知
  • 批准号:
    9988784
  • 财政年份:
    2000
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Formalizing Distributed Search in Cooperative Distributed Problem-Solving Systems
协作分布式问题解决系统中分布式搜索的形式化
  • 批准号:
    0004112
  • 财政年份:
    2000
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Enhancing Robustness of Information through Distributed Adaptive Coordination
通过分布式自适应协调增强信息的鲁棒性
  • 批准号:
    9812755
  • 财政年份:
    1998
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Towards an Architecture and Theory for Agent Coordination
智能体协调的架构和理论
  • 批准号:
    9523419
  • 财政年份:
    1995
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Control Issues in Asynchronous Parallel Knowledge-Based AI Programs
异步并行基于知识的人工智能程序中的控制问题
  • 批准号:
    9321324
  • 财政年份:
    1994
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
A Research Facility for Cooperative Distributed Computing
协作分布式计算的研究设施
  • 批准号:
    8500332
  • 财政年份:
    1985
  • 资助金额:
    $ 45万
  • 项目类别:
    Cooperative Agreement
Computer Research: Coordination in Cooperative Distributed Problem Solving Systems
计算机研究:协作分布式问题解决系统中的协调
  • 批准号:
    8300239
  • 财政年份:
    1983
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
  • 批准号:
    10099896
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
  • 批准号:
    AH/X011747/1
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
  • 批准号:
    MR/Z503757/1
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
  • 批准号:
    BB/Y004426/1
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
  • 批准号:
    ST/Z000017/1
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
  • 批准号:
    2317251
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了