Data-efficient Safe Control with Recovery-to-Optimality Guarantees

数据高效的安全控制,并保证恢复最佳性

基本信息

  • 批准号:
    2227311
  • 负责人:
  • 金额:
    $ 40万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-08-15 至 2026-07-31
  • 项目状态:
    未结题

项目摘要

As rapid developments on learning-enabled systems in recent years have been advancing autonomy capabilities of systems, their safety certification becomes exceedingly important. While the recent progress on safe reinforcement learning (RL) algorithms for autonomous control design has been promising, these algorithms are accountable only in stable environments and under the availability of comprehensive and high-quality data sets. However, many systems must operate in unpredictable environments under which dangerous divergence might arise between safety and performance. In these environments, adaptation of safety and performance specifications to the context is required. Besides, RL agent must perform learning under realistic data quantity and quality. Current RL practice assumes availability of rich and high-quality data with full observability of the entire system’s states. These assumptions can be violated in many practical systems. This award supports research to create low-complexity safe learning-enabled algorithms for partially observable systems that are equipped with highly-efficient conflict management mechanisms to deliver as much performance as possible safely. Advances will have broad implications in applications of autonomous systems, robots, manufacturing, smart grids, and more.This research project aims to develop low-complexity, safe learning-enabled algorithms for partially observable systems equipped with highly efficient conflict management mechanisms. The objectives of this project are two-fold: 1) Proposing direct data-driven learning approaches for backup safe control policies in partially observable nonlinear systems with uncertain dynamics. The utilization of concepts such as L-extra sample dynamics, probabilistic contractivity, and convex lifting will enable the learning of safe control policies for nonlinear systems with nonconvex safe sets using only measured noisy input-output data. 2) Introducing novel merging approaches to proactively manage conflicts by merging learned backup safe control policies with learning-enabled control policies. Instead of providing reactive quick fixes to conflicts as they arise, these approaches will enable proactive conflict management to avoid destructive future conflicts. Towards conflict management, the level sets of the RL agent will be adapted to the situation to make the agent align with the safety constraint. That is, safety-shaped value functions will be learned to effectively resolve conflicts by considering safety and optimality concerns across the relevant domains.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随着近年来对支持学习的系统的快速发展正在提高系统的自主能力,因此其安全认证变得越来越重要。虽然已承诺最近在安全加固学习(RL)算法上的进展,但这些算法仅在稳定的环境中以及在综合和高质量的数据集的可用性下才能负责。但是,许多系统必须在不可预测的环境中运行,在这种环境中,安全性和性能之间可能存在危险的差异。在这些环境中,需要将安全性和绩效规范适应上下文。此外,RL代理必须在现实的数据数量和质量下进行学习。当前的RL实践假设可以充分观察整个系统状态的富裕和高质量数据。这些假设在许多实用系统中可能会违反。该奖项支持研究,为部分可观察到的系统创建低复杂性安全学习算法,这些算法配备了高效的冲突管理机制,以提供尽可能多的性能。进步将对自主系统,机器人,制造,智能电网等的应用具有广泛的影响。本研究项目旨在为配备有高效的冲突管理机制的部分可观察到的部分可观察到的低复杂性,安全学习的算法。该项目的目标是两个方面:1)在具有不确定动力学的部分可观察到的非线性系统中,提出了直接数据驱动的学习方法,以备份安全控制策略。利用诸如L-Extra样本动力学,概率合同和凸起的概念,将使使用仅使用测量的噪声输入输出数据的非convex安全集的非线性系统来学习安全控制策略。 2)引入新颖的合并方法,通过将学习的备份安全控制政策与支持学习的控制政策合并,以主动管理冲突。这些方法不会在发生冲突的情况下提供反应性快速修复,而是使积极的冲突管理能够避免破坏性的未来冲突。在冲突管理方面,RL代理的级别集将适应情况,以使代理与安全限制保持一致。也就是说,将通过考虑在相关领域的安全性和最佳问题来有效地解决安全形的价值功能。该奖项反映了NSF的法定任务,并通过使用基金会的知识分子和更广泛的影响审查标准来评估,被认为是宝贵的支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Bahare Kiumarsi其他文献

Data-Driven Safety-Certified Predictive Control for Linear Systems
线性系统的数据驱动、安全认证的预测控制
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    3
  • 作者:
    Marjan Khaledi;P. Tooranjipour;Bahare Kiumarsi
  • 通讯作者:
    Bahare Kiumarsi
Optimal Output Regulation of Linear Discrete-Time Systems With Unknown Dynamics Using Reinforcement Learning
使用强化学习的未知动态线性离散时间系统的最优输出调节
  • DOI:
    10.1109/tcyb.2018.2890046
  • 发表时间:
    2020-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yi Jiang;Bahare Kiumarsi;Jialu Fan;Tianyou Chai;Jinna Li;Frank L. Lewis
  • 通讯作者:
    Frank L. Lewis
Risk-Aware Safe Optimal Control of Uncertain Linear Systems
不确定线性系统的风险感知安全最优控制
Distributed Aggregative Games on Graphs in Adversarial Environments
对抗环境中图的分布式聚合博弈
  • DOI:
    10.1007/978-3-030-01554-1_17
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bahare Kiumarsi;T. Başar
  • 通讯作者:
    T. Başar
Heterogeneous formation control of multiple rotorcrafts with unknown dynamics by reinforcement learning
基于强化学习的未知动力学多旋翼飞行器异构编队控制
  • DOI:
    10.1016/j.ins.2021.01.011
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    8.1
  • 作者:
    Hao Liu;Fachun Peng;Hamidreza Modares;Bahare Kiumarsi
  • 通讯作者:
    Bahare Kiumarsi

Bahare Kiumarsi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

基于多维数据特征的异构内存系统高效安全保障方法研究
  • 批准号:
    62302182
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于区块链的跨域数据高效安全共享机制研究
  • 批准号:
    62372266
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向多源异构物联网的高效安全数据融合与计算方法研究
  • 批准号:
    62372324
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向6G高效数据安全流通的可重构分布式学习机理
  • 批准号:
    62371059
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
保障所有权的安全高效数据流通交易机制研究
  • 批准号:
    62202398
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Integrating spatial and non-spatial data to examine multilevel drivers of HIV risk among adolescent mothers in sub-Saharan Africa
整合空间和非空间数据来研究撒哈拉以南非洲地区青少年母亲艾滋病毒风险的多层次驱动因素
  • 批准号:
    10700436
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
Development of NAD+ loaded nanoparticles as a safe and efficient strategy to combat sepsis.
开发负载 NAD 的纳米粒子作为对抗脓毒症的安全有效策略。
  • 批准号:
    10448923
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
Development of NAD+ loaded nanoparticles as a safe and efficient strategy to combat sepsis.
开发负载 NAD 的纳米粒子作为对抗脓毒症的安全有效策略。
  • 批准号:
    10612911
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
A Novel Oral Insulin Enabling Safe and Efficient Gastrointestinal Transport and Absorption
一种新型口服胰岛素,可实现安全、高效的胃肠道运输和吸收
  • 批准号:
    10412988
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
A Novel Oral Insulin Enabling Safe and Efficient Gastrointestinal Transport and Absorption
一种新型口服胰岛素,可实现安全、高效的胃肠道运输和吸收
  • 批准号:
    10022124
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了