CRII: CPS: Towards a Model-Based Reinforcement Learning Approach for Safe Operation of Distributed Energy Systems

CRII:CPS:面向分布式能源系统安全运行的基于模型的强化学习方法

基本信息

项目摘要

With the increasing penetration of renewables on the electric grid and ready availability of real-time data about electricity usage, the electric power grid is becoming a large-scale complex Cyber-Physical System (CPS) to meet consumer demands for electricity through the day, every day. Reinforcement learning (RL) algorithms offer these CPS systems an approach to seamlessly integrating distributed energy sources into the legacy electric grid more efficiently, effectively and affordably. It also offers significant potential savings in capital investment cost and labor, and greater resiliency to disruptions in service. This research project develops a framework for model-based online reinforcement learning to address several classes of problems. First, it models control of energy CPS as finite horizon RL problems. Second, instead of focusing on asymptotic convergence, this project focuses on optimal finite time performance. Third, while a simplistic learning algorithm might drive an energy CPS to an unsafe region of operations, thereby risking unwanted consequences, this project develops safe RL algorithms that optimize performance and respect safety constraints. Fourth, this project exploits the physical properties of the energy CPS to avoid the dimensionality problems, often associated with RL problems. Lastly, the project develops sequential algorithms using a "contextual bandits" approach for learning consumer specific parameters and adaptively scheduling to account for consumer usage.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随着可再生能源在电网中的渗透率不断提高以及用电实时数据的可用性,电网正在成为一个大规模复杂的网络物理系统(CPS),以满足消费者每天的用电需求。 强化学习 (RL) 算法为这些 CPS 系统提供了一种更高效、更有效且经济实惠地将分布式能源无缝集成到传统电网的方法。 它还可以显着节省资本投资成本和劳动力,并提高对服务中断的恢复能力。该研究项目开发了一个基于模型的在线强化学习框架,以解决几类问题。首先,它将能量 CPS 的控制建模为有限视野 RL 问题。其次,该项目不关注渐近收敛,而是关注最优有限时间性能。第三,虽然简单的学习算法可能会将能源 CPS 驱动到不安全的操作区域,从而冒出现不良后果的风险,但该项目开发了安全的 RL 算法,可以优化性能并尊重安全约束。第四,该项目利用能量 CPS 的物理特性来避免通常与 RL 问题相关的维数问题。 最后,该项目使用“上下文强盗”方法开发顺序算法,用于学习消费者特定参数并自适应调度以考虑消费者的使用情况。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Learning with Safety Constraints: Sample Complexity of Reinforcement Learning for Constrained MDPs
  • DOI:
    10.1609/aaai.v35i9.16937
  • 发表时间:
    2020-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Aria HasanzadeZonuzy;D. Kalathil;S. Shakkottai
  • 通讯作者:
    Aria HasanzadeZonuzy;D. Kalathil;S. Shakkottai
Reinforcement Learning for Mean Field Games with Strategic Complementarities
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kiyeob Lee;Desik Rengarajan;D. Kalathil;S. Shakkottai
  • 通讯作者:
    Kiyeob Lee;Desik Rengarajan;D. Kalathil;S. Shakkottai
Sample Complexity of Robust Reinforcement Learning with a Generative Model
使用生成模型的鲁棒强化学习的样本复杂性
Safe Online Convex Optimization with Unknown Linear Safety Constraints
  • DOI:
    10.1609/aaai.v36i6.20566
  • 发表时间:
    2021-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sapana Chaudhary;D. Kalathil
  • 通讯作者:
    Sapana Chaudhary;D. Kalathil
Bounded Regret for Finitely Parameterized Multi-Armed Bandits
有限参数化多臂老虎机的有限遗憾
  • DOI:
    10.1109/lcsys.2020.3008798
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    3
  • 作者:
    Panaganti, Kishan;Kalathil, Dileep
  • 通讯作者:
    Kalathil, Dileep
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dileep Kalathil其他文献

Approachability in Stackelberg Stochastic Games with Vector Costs
  • DOI:
    10.1007/s13235-016-0198-y
  • 发表时间:
    2016-07-04
  • 期刊:
  • 影响因子:
    1.600
  • 作者:
    Dileep Kalathil;Vivek S. Borkar;Rahul Jain
  • 通讯作者:
    Rahul Jain
The impact of heavy-duty vehicle electrification on large power grids: A synthetic Texas case study
  • DOI:
    10.1016/j.adapen.2022.100093
  • 发表时间:
    2022-06-01
  • 期刊:
  • 影响因子:
  • 作者:
    Rayan El Helou;S. Sivaranjani;Dileep Kalathil;Andrew Schaper;Le Xie
  • 通讯作者:
    Le Xie
Decoupled Data-Based Approach for Learning to Control Nonlinear Dynamical Systems
用于学习控制非线性动力系统的基于解耦数据的方法
  • DOI:
    10.1109/tac.2021.3108552
  • 发表时间:
    2019-04
  • 期刊:
  • 影响因子:
    6.8
  • 作者:
    Ran Wang;Karthikeya S. Parun;i;Dan Yu;Dileep Kalathil;Suman Chakravorty
  • 通讯作者:
    Suman Chakravorty

Dileep Kalathil的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dileep Kalathil', 18)}}的其他基金

CAREER: Towards a Principled Framework for Resilient, Data Efficient and Scalable Reinforcement Learning for Control
职业:建立一个有弹性、数据高效且可扩展的强化学习控制原则框架
  • 批准号:
    2045783
  • 财政年份:
    2021
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Continuing Grant

相似国自然基金

细梗香草活性成分CPS-B靶向MARCHF3/NEU4/CDH11通路抑制宫颈癌侵袭转移的作用机制研究
  • 批准号:
    HDMZ25H280006
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
肺炎克雷伯菌WaaLCPS连接酶相关的CPS-LPS合成通路及致病机制的研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于自动深度学习的电力CPS入侵检测及安全性提升方法研究
  • 批准号:
    Z25F030003
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
先锋转录因子FOXA2调控CPS1介导尿素循环在急性肝衰竭肝性脑病中的机制研究
  • 批准号:
    82300699
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
代谢酶CPS1调控PD-L1表达重塑肝癌免疫微环境的作用及机制研究
  • 批准号:
    82303340
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
CPs/MOFs介导多烯衍生物拓扑光聚合的高立体选择性构建策略研究
  • 批准号:
    22361004
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
尿素循环关键酶CPS1表达异常在肺癌转移中的作用和机制研究
  • 批准号:
    82273390
  • 批准年份:
    2022
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
CPS 仿真中离散事件模型与连续时间模型的分布式协同运行问题研究
  • 批准号:
    2022JJ40559
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于数字孪生的智能车间CPS混沌预测与控制方法
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
具有cps4I的植物乳杆菌在拮抗空肠弯曲杆菌中的作用和机制解析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CRII: CPS: Towards Efficient Shared Electric Micromobility: An Interaction-aware Management Framework for Mobile Cyber-Physical Systems
CRII:CPS:迈向高效共享电动微移动:移动网络物理系统的交互感知管理框架
  • 批准号:
    2246080
  • 财政年份:
    2023
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Medium: Collaborative Research: Towards optimal robot locomotion in fluids through physics-informed learning with distributed sensing
CPS:中:协作研究:通过分布式传感的物理信息学习实现流体中的最佳机器人运动
  • 批准号:
    2227062
  • 财政年份:
    2021
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Medium: Collaborative Research: Towards optimal robot locomotion in fluids through physics-informed learning with distributed sensing
CPS:中:协作研究:通过分布式传感的物理信息学习实现流体中的最佳机器人运动
  • 批准号:
    1932130
  • 财政年份:
    2020
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Small: Collaborative Research: RUI: Towards Efficient and Secure Agricultural Information Collection Using a Multi-Robot System
CPS:小型:协作研究:RUI:使用多机器人系统实现高效、安全的农业信息收集
  • 批准号:
    1932300
  • 财政年份:
    2020
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Small: Collaborative Research: RUI: Towards Efficient and Secure Agricultural Information Collection Using a Multi-Robot System
CPS:小型:协作研究:RUI:使用多机器人系统实现高效、安全的农业信息收集
  • 批准号:
    1931767
  • 财政年份:
    2020
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Medium: Collaborative Research: Towards optimal robot locomotion in fluids through physics-informed learning with distributed sensing
CPS:中:协作研究:通过分布式传感的物理信息学习实现流体中的最佳机器人运动
  • 批准号:
    1931893
  • 财政年份:
    2020
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Medium: Collaborative Research: Towards optimal robot locomotion in fluids through physics-informed learning with distributed sensing
CPS:中:协作研究:通过分布式传感的物理信息学习实现流体中的最佳机器人运动
  • 批准号:
    1931929
  • 财政年份:
    2020
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Small: Collaborative Research: Towards Secure, Privacy-Preserving, Verifiable Cyberphysical Systems
CPS:小型:协作研究:迈向安全、隐私保护、可验证的网络物理系统
  • 批准号:
    2004118
  • 财政年份:
    2019
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Small: Naming, Twinning and Observing - Towards Scalable, Reliable and Resilient CPS
CPS:小型:命名、配对和观察 - 迈向可扩展、可靠和有弹性的 CPS
  • 批准号:
    1932418
  • 财政年份:
    2019
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
CPS: Synergy: Collaborative Research: Towards Effective and Efficient Sensing-Motion Co-Design of Swarming Cyber-Physical Systems
CPS:协同:协作研究:实现集群网络物理系统的有效和高效的传感-运动协同设计
  • 批准号:
    1936599
  • 财政年份:
    2019
  • 资助金额:
    $ 17.2万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了