III: Small: Distributed Reinforcement Learning over Complex Networks

III:小型:复杂网络上的分布式强化学习

基本信息

  • 批准号:
    2230101
  • 负责人:
  • 金额:
    $ 60万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2025-08-31
  • 项目状态:
    未结题

项目摘要

In many distributed systems, a team of autonomous agents must collaborate in a complex environment, process massive amounts of streaming data, and simultaneously make optimal decisions. Traditional decision-making techniques can hardly tackle such a scenario, and reinforcement learning (RL) has been recently shown to be a promising decision-making technique for large-scale distributed systems. However, previous distributed RL models have failed to account for sensing and observing capabilities of agents, and thus rely on global information, which is not readily available in distributed environments. To fill this gap, this project aims to build a revolutionary, fully distributed RL system for large-scale networked systems without using global information. Toward this end, the project develops a novel theoretical framework, computational models, and scientific software tools needed to design, analyze, and test fully distributed RL algorithms. The algorithms will be further designed to be robust against dynamic environments and resilient to adversarial attacks, which will enable teams of multiple autonomous agents to reliably achieve their goals. The research will greatly impact real-world application areas where distributed machine learning algorithms and decision-making methods are needed. Typical examples include motion planning of teams of mobile robots, and coordination of networked smart devices in an IoT environment. The project promotes education and outreach activities, including broadening participation of female students in the field of machine learning, creating new courses, and designing research projects for K-12 students and undergraduates. The publications and software tools will be shared with the community to foster further research on distributed RL.The central goal of this project is to establish theoretical foundations for fully distributed RL algorithm design, analysis, and applications over large-scale networks. The key technical challenges include bridging the gap between the global and local observability settings and achieving resiliency in the presence of dynamic and untrustworthy communications. To achieve the technical objective and tackle technical challenges, the project investigates three main thrusts. The first thrust establishes the fundamental novel theory for the design of fully distributed RL by approximating global information via distributed estimation. The second thrust develops robust distributed RL algorithms against time-varying communication and sensing capabilities, communication delays, and asynchronous updating. The third thrust designs distributed RL algorithms that are resilient to adversaries and malicious attacks capable of introducing untrustworthy information into the communication network, by first designing communication-efficient RL algorithms in which each agent can transmit only low-dimensional states, and then designing resilient information fusion/aggregation approaches for small- and even single-dimensional cases. The project provides a suite of novel distributed RL algorithms which can be used in any applied area where fully distributed decision making and learning with streaming data and in adversarial environments are needed. Concurrently with the three main thrusts, the project also designs, develops, and maintains a software framework for empirically validating and studying distributed RL algorithms that the entire distributed RL community can use.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在许多分布式系统中,自治代理团队必须在复杂的环境中协作,处理大量流数据,并同时做出最佳决策。传统的决策技术很难解决这种情况,而强化学习(RL)最近被证明是一种有前途的大规模分布式系统决策技术。然而,以前的分布式强化学习模型未能考虑代理的感知和观察能力,因此依赖于全局信息,而全局信息在分布式环境中不易获得。为了填补这一空白,该项目旨在为大规模网络系统构建一个革命性的、完全分布式的强化学习系统,而不需要使用全局信息。为此,该项目开发了设计、分析和测试完全分布式强化学习算法所需的新颖理论框架、计算模型和科学软件工具。这些算法将进一步设计为对动态环境具有鲁棒性,并且能够抵御对抗性攻击,这将使多个自主代理团队能够可靠地实现其目标。该研究将极大地影响需要分布式机器学习算法和决策方法的实际应用领域。典型示例包括移动机器人团队的运动规划以及物联网环境中联网智能设备的协调。该项目促进教育和推广活动,包括扩大女学生在机器学习领域的参与、创建新课程以及为 K-12 学生和本科生设计研究项目。这些出版物和软件工具将与社区共享,以促进分布式强化学习的进一步研究。该项目的中心目标是为大规模网络上的完全分布式强化学习算法设计、分析和应用奠定理论基础。关键的技术挑战包括弥合全球和本地可观测性设置之间的差距,以及在存在动态和不可信通信的情况下实现弹性。为了实现技术目标并应对技术挑战,该项目研究了三个主要目标。第一个主旨是通过分布式估计逼近全局信息,建立完全分布式强化学习设计的基本新颖理论。第二个重点是针对时变通信和传感能力、通信延迟和异步更新开发鲁棒的分布式强化学习算法。第三个重点是设计分布式强化学习算法,该算法能够抵御对手和能够将不可信信息引入通信网络的恶意攻击,首先设计高效通信的强化学习算法,其中每个代理只能传输低维状态,然后为小维甚至单维情况设计弹性信息融合/聚合方法。该项目提供了一套新颖的分布式强化学习算法,可用于需要完全分布式决策和流数据学习以及对抗环境的任何应用领域。在实现这三个主要目标的同时,该项目还设计、开发和维护一个软件框架,用于实证验证和研究整个分布式强化学习社区都可以使用的分布式强化学习算法。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Subgradient-Push Is of the Optimal Convergence Rate
Reaching a consensus with limited information
在有限的信息下达成共识
  • DOI:
    10.1016/j.sysconle.2023.105524
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    2.6
  • 作者:
    Zhu, Jingxuan;Lin, Yixuan;Liu, Ji;Morse, A. Stephen
  • 通讯作者:
    Morse, A. Stephen
Information-Directed Policy Search in Sparse-Reward Settings via the Occupancy Information Ratio
Distributed Multiarmed Bandits
分布式多臂强盗
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ji Liu其他文献

Highly enantioselective hydrogenation of 2,4-diaryl-1,5-benzodiazepines catalyzed by dendritic phosphinooxazoline iridium complexes
树枝状膦基恶唑啉铱配合物催化 2,4-二芳基-1,5-苯二氮卓类药物的高度对映选择性氢化
  • DOI:
    10.1002/asia.201300150
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Baode Ma;Ziyuan Ding;Ji Liu;Yanmei He;Qing-Hua Fan
  • 通讯作者:
    Qing-Hua Fan
Lunar terrain reconstruction using PDEs
使用偏微分方程重建月球地形
Self-Adaptive TCP Protocol Combined with Network Coding Scheme
自适应TCP协议结合网络编码方案
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sicong Song;Hui Li;Kai Pan;Ji Liu;Shuo Li
  • 通讯作者:
    Shuo Li
Large time behavior in a three-dimensional degenerate chemotaxis-Stokes system modeling coral fertilization
三维简并趋化性斯托克斯系统中的大时间行为模拟珊瑚受精
Marijuana for Glaucoma: A Recipe for Disaster or Treatment?
大麻治疗青光眼:灾难还是治疗?

Ji Liu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: SHF: Small: Technical Debt Management in Dynamic and Distributed Systems
合作研究:SHF:小型:动态和分布式系统中的技术债务管理
  • 批准号:
    2232720
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CSR: Small: Squeezing More Performance Out of Distributed Storage Systems With a Transparent Ordering-Control Layer
CSR:小:通过透明排序控制层从分布式存储系统中榨取更多性能
  • 批准号:
    2327609
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Technical Debt Management in Dynamic and Distributed Systems
合作研究:SHF:小型:动态和分布式系统中的技术债务管理
  • 批准号:
    2232721
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CNS Core: Small: Testing and detecting software upgrade failures in data-intensive distributed systems
CNS 核心:小型:测试和检测数据密集型分布式系统中的软件升级故障
  • 批准号:
    2300562
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Efficient Trustless Distributed Cryptography
SaTC:核心:小型:高效的无信任分布式密码学
  • 批准号:
    2240976
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
NSF-AoF: CIF: Small: Distributed AI for enhanced security in satellite-aided wireless navigation (RESILIENT)
NSF-AoF:CIF:小型:分布式 AI,用于增强卫星辅助无线导航的安全性(弹性)
  • 批准号:
    2326559
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CNS Core: Small: Automated testing for data- and compute-intensive distributed systems through feedback-based fuzzing
CNS 核心:小型:通过基于反馈的模糊测试对数据和计算密集型分布式系统进行自动测试
  • 批准号:
    2140305
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
SHF: Small: A Distributed Scalable End-to-End Tail Latency SLO Guaranteed Resource Management Framework for Microservices
SHF:Small:分布式可扩展端到端尾部延迟 SLO 保证的微服务资源管理框架
  • 批准号:
    2226117
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Distributed Fragmented Software Design Meetings
协作研究:SHF:小型:分布式碎片化软件设计会议
  • 批准号:
    2210812
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CNS: Core: Small: Consistent, Geo-Distributed Data Stores on the Public Cloud Using Erasure Coding
CNS:核心:小型:使用纠删码在公共云上实现一致的地理分布式数据存储
  • 批准号:
    2211045
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了