RINGS: A Deep Reinforcement Learning Enabled Large-scale UAV Network with Distributed Navigation, Mobility Control, and Resilience
RINGS:深度强化学习支持的大规模无人机网络,具有分布式导航、移动控制和弹性
基本信息
- 批准号:2148253
- 负责人:
- 金额:$ 100万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-05-01 至 2025-04-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Thanks to the significant technological advances in unmanned aerial vehicles (UAVs), the past few years have witnessed an explosive growth of UAVs in civilian and commercial applications. To ensure efficient and reliable auto-navigation and planning in these applications, there is an urgent need to develop the foundational technology that enables UAVs to have strong sensing, communications, and on-board computing capabilities, to adapt rapidly to the dynamically changing environment, to be resilient to extreme environmental conditions, and to be secure against data contamination and malicious attacks. The interdisciplinary nature of the proposed research will provide valuable research opportunities and hands-on projects for a diverse group of students.The goal of this project is to leverage and significantly advance the recent breakthroughs in NextG wireless communications, deep machine learning, hardware-aware model generation, and robust and trustworthy artificial intelligence, to enable the design of an intelligent and resilient UAV navigation and planning system. More specifically, this project will develop: (a) real-time communication assisted ambient sensing with multi-modality data fusion and machine learning assisted fast processing for global state tracking; (b) a multi-agent decentralized reinforcement learning (RL) framework with highly scalable computations and flexible latency tolerance; (c) deep learning based message passing for efficient communication and powerful hardware-aware neural architecture search for efficient on-board computation; and (d) comprehensive robustness and security design for system protection from outlier data, malicious poisoning attacks, and RL system attacks. The project will also conduct extensive performance evaluations to validate the developed approaches and algorithms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
由于无人机(UAV)的重大技术进步,过去几年无人机在民用和商业应用中呈爆炸式增长。为了确保这些应用中高效可靠的自动导航和规划,迫切需要开发基础技术,使无人机具有强大的传感,通信和机载计算能力,快速适应动态变化的环境,对极端环境条件具有弹性,并防止数据污染和恶意攻击。建议研究的跨学科性质将为多样化的学生群体提供宝贵的研究机会和实践项目。该项目的目标是利用并显著推进NextG无线通信,深度机器学习,硬件感知模型生成以及强大且值得信赖的人工智能的最新突破,以实现智能和弹性无人机导航和规划系统的设计。更具体地说,该项目将开发:(a)实时通信辅助的环境传感,具有多模态数据融合和机器学习辅助的快速处理,用于全球状态跟踪;(B)多代理分散强化学习框架,具有高度可扩展的计算和灵活的延迟容忍度;(c)基于深度学习的消息传递,用于高效通信,以及强大的硬件感知神经架构搜索,用于高效的机载计算;以及(d)全面的鲁棒性和安全性设计,以保护系统免受离群数据、恶意中毒攻击和RL系统攻击。该项目还将进行广泛的性能评估,以验证开发的方法和算法。该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估。
项目成果
期刊论文数量(20)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Provably Efficient Algorithm for Nonstationary Low-Rank MDPs
- DOI:10.48550/arxiv.2308.05471
- 发表时间:2023-08
- 期刊:
- 影响因子:0
- 作者:Yuan Cheng;J. Yang;Yitao Liang
- 通讯作者:Yuan Cheng;J. Yang;Yitao Liang
A near-optimal algorithm for safe reinforcement learning under instantaneous hard constraints
瞬时硬约束下安全强化学习的近乎最优算法
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Shi, Ming;Liang, Yingbin;Shroff, Ness.
- 通讯作者:Shroff, Ness.
Non-stationary Reinforcement Learning under General Function Approximation
- DOI:10.48550/arxiv.2306.00861
- 发表时间:2023-06
- 期刊:
- 影响因子:0
- 作者:Songtao Feng;Ming Yin;Ruiquan Huang;Yu-Xiang Wang;J. Yang;Yitao Liang
- 通讯作者:Songtao Feng;Ming Yin;Ruiquan Huang;Yu-Xiang Wang;J. Yang;Yitao Liang
CLARE: Conservative Model-Based Reward Learning for Offline Inverse Reinforcement Learning
- DOI:10.48550/arxiv.2302.04782
- 发表时间:2023-02
- 期刊:
- 影响因子:0
- 作者:Sheng Yue;Guan Wang;Wei Shao;Zhaofeng Zhang;Sen Lin;Junkai Ren;Junshan Zhang
- 通讯作者:Sheng Yue;Guan Wang;Wei Shao;Zhaofeng Zhang;Sen Lin;Junkai Ren;Junshan Zhang
Provably efficient UCB-type algorithms for learning predictive state representation
用于学习预测状态表示的可证明有效的 UCB 型算法
- DOI:
- 发表时间:2024
- 期刊:
- 影响因子:0
- 作者:Huang, Ruiquan;Liang, Yingbin;Yang, Jing.
- 通讯作者:Yang, Jing.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Yingbin Liang其他文献
A New Perspective of Proximal Gradient Algorithms
近端梯度算法的新视角
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Yi Zhou;Yingbin Liang;Lixin Shen - 通讯作者:
Lixin Shen
On the Equivalence of Two Achievable Regions for the Broadcast Channel
广播频道两个可达到区域的等效性
- DOI:
10.1109/tit.2010.2090236 - 发表时间:
2011 - 期刊:
- 影响因子:2.5
- 作者:
Yingbin Liang;G. Kramer;H. Poor - 通讯作者:
H. Poor
Capacity bounds for a class of cognitive interference channels with state
一类具有状态的认知干扰信道的容量界限
- DOI:
10.1109/allerton.2011.6120223 - 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Ruchen Duan;Yingbin Liang - 通讯作者:
Yingbin Liang
Gaussian fading channel with secrecy outside a bounded range
在有界范围外具有保密性的高斯衰落信道
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Shaofeng Zou;Yingbin Liang;S. Shamai - 通讯作者:
S. Shamai
Layered secure broadcasting over MIMO channels and application in secret sharing
MIMO信道分层安全广播及其在秘密共享中的应用
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Shaofeng Zou;Yingbin Liang;L. Lai;S. Shamai - 通讯作者:
S. Shamai
Yingbin Liang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Yingbin Liang', 18)}}的其他基金
Collaborative Research: CCSS: Learning to Optimize: From New Algorithms to New Theory
合作研究:CCSS:学习优化:从新算法到新理论
- 批准号:
2113860 - 财政年份:2021
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
Collaborative Research: SCALE MoDL: Adaptivity of Deep Neural Networks
合作研究:SCALE MoDL:深度神经网络的适应性
- 批准号:
2134145 - 财政年份:2021
- 资助金额:
$ 100万 - 项目类别:
Continuing Grant
CIF: Small: Collaborative Research: Acceleration Algorithms for Large-scale Nonconvex Optimization
CIF:小型:协作研究:大规模非凸优化的加速算法
- 批准号:
1909291 - 财政年份:2019
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
CIF: Medium: Collaborative Research: Theory of Optimization Geometry and Algorithms for Neural Networks
CIF:媒介:协作研究:神经网络优化几何理论和算法
- 批准号:
1900145 - 财政年份:2019
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
CIF: Medium: Collaborative Research: Nonconvex Optimization for High-Dimensional Signal Estimation: Theory and Fast Algorithms
CIF:中:协作研究:高维信号估计的非凸优化:理论和快速算法
- 批准号:
1761506 - 财政年份:2017
- 资助金额:
$ 100万 - 项目类别:
Continuing Grant
CIF: Small: Collaborative Research: Network Event Detection with Multistream Observations
CIF:小型:协作研究:通过多流观察进行网络事件检测
- 批准号:
1801855 - 财政年份:2017
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
CIF: Medium: Collaborative Research: Nonconvex Optimization for High-Dimensional Signal Estimation: Theory and Fast Algorithms
CIF:中:协作研究:高维信号估计的非凸优化:理论和快速算法
- 批准号:
1704169 - 财政年份:2017
- 资助金额:
$ 100万 - 项目类别:
Continuing Grant
Management of Mobile Phone Sensing via Sparse Learning
通过稀疏学习管理手机传感
- 批准号:
1818904 - 财政年份:2017
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Secret Key Generation Under Resource Constraints
CIF:小型:协作研究:资源限制下的密钥生成
- 批准号:
1801846 - 财政年份:2017
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Secret Key Generation Under Resource Constraints
CIF:小型:协作研究:资源限制下的密钥生成
- 批准号:
1618127 - 财政年份:2016
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
相似国自然基金
航空涡轮盘榫槽深冷辅助超声喷丸强化机理研究
- 批准号:2025JJ40042
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
β钛合金跨温区锻造织构强化与深冷轧制晶粒超细化交互作用机制研究
- 批准号:52305403
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
超深裂缝性地层温敏黏结强化桥接承压堵漏机理
- 批准号:52374023
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
长寿命的连铸合金涂层结晶器深冷处理性能及强化机理
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
超深致密油储层多效应协同驱油机理及强化排驱调控研究
- 批准号:
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
深冷奥氏体钢应变强化PAW-GTAW组合焊接头组织结构演变及超低温性能研究
- 批准号:
- 批准年份:2020
- 资助金额:58 万元
- 项目类别:面上项目
基于三支决策和强化学习的深空探测器非预期故障自主诊断与系统重构研究
- 批准号:61903015
- 批准年份:2019
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
基于激光离散强化的有序微槽结构电镀砂轮及其磨削窄深槽基础研究
- 批准号:51875050
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
基于晶格热动力学的“洋葱C”深渗强化层微观耐磨机制研究
- 批准号:51805533
- 批准年份:2018
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
深亚微米集成电路在轨退化模型与软错误评测技术
- 批准号:61771167
- 批准年份:2017
- 资助金额:67.0 万元
- 项目类别:面上项目
相似海外基金
DeepMARA - Deep Reinforcement Learning based Massive Random Access Toward Massive Machine-to-Machine Communications
DeepMARA - 基于深度强化学习的大规模随机访问实现大规模机器对机器通信
- 批准号:
EP/Y028252/1 - 财政年份:2024
- 资助金额:
$ 100万 - 项目类别:
Fellowship
Feedback Control of Flow Separation around an Airfoil using Deep Reinforcement Learning
使用深度强化学习对机翼周围的流动分离进行反馈控制
- 批准号:
23KJ0866 - 财政年份:2023
- 资助金额:
$ 100万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Development of a Structural Optimization Method for the Midship Section of a Ship with Deep Reinforcement Learning AI incorporating Principal Dimensions as Design Variables
利用深度强化学习人工智能(将主尺寸作为设计变量)开发船舶中段结构优化方法
- 批准号:
23K13508 - 财政年份:2023
- 资助金额:
$ 100万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Development of Collision Avoidance System for Maritime Autonomous Surface Ship: Imitating and Surpassing Human Experts by Deep Inverse Reinforcement Learning
海上自主水面船舶防撞系统开发:通过深度逆强化学习模仿并超越人类专家
- 批准号:
22KJ2623 - 财政年份:2023
- 资助金额:
$ 100万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Developing explainable decision support systems for inventory management using deep reinforcement learning
使用深度强化学习开发可解释的库存管理决策支持系统
- 批准号:
23K13514 - 财政年份:2023
- 资助金额:
$ 100万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Collaborative Research: CIF: Medium: MoDL:Toward a Mathematical Foundation of Deep Reinforcement Learning
合作研究:CIF:媒介:MoDL:迈向深度强化学习的数学基础
- 批准号:
2212263 - 财政年份:2022
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
Intelligent and Integrated Control of V2X-Enabled Autonomous Vehicles using Deep Reinforcement Learning
使用深度强化学习对支持 V2X 的自动驾驶车辆进行智能集成控制
- 批准号:
RGPIN-2021-02839 - 财政年份:2022
- 资助金额:
$ 100万 - 项目类别:
Discovery Grants Program - Individual
Deep Bayesian Reinforcement Learning in Changing Environments
不断变化的环境中的深度贝叶斯强化学习
- 批准号:
2724208 - 财政年份:2022
- 资助金额:
$ 100万 - 项目类别:
Studentship
Towards Efficient Communication in Multi-Agent Deep Reinforcement Learning
实现多智能体深度强化学习中的高效通信
- 批准号:
572694-2022 - 财政年份:2022
- 资助金额:
$ 100万 - 项目类别:
University Undergraduate Student Research Awards
III: Small: Deep Interactive Reinforcement Learning for Self-optimizing Feature Selection
III:小:用于自优化特征选择的深度交互式强化学习
- 批准号:
2152030 - 财政年份:2022
- 资助金额:
$ 100万 - 项目类别:
Standard Grant