Reinforcement Learning and Kullback-Leibler Stochastic Optimal Control for Complex Networks

复杂网络的强化学习和 Kullback-Leibler 随机最优控制

基本信息

  • 批准号:
    1935389
  • 负责人:
  • 金额:
    $ 38万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-09-15 至 2023-08-31
  • 项目状态:
    已结题

项目摘要

Natural and man-made networked systems are all around us. The power grid and the Internet are two examples of apparently complex interconnected systems, in which millions of "agents" are eager to extract value in the form of energy or bandwidth. While these systems are complex when measured in graph-theoretic terms, the behavior of communication and energy systems appears simple and highly predictable to the end users (in most of the world). This success is due in part to distributed control loops that manage system-wide supply-demand balance. An example of distributed control in the Internet is TCP/IP, and automatic generation control (AGC) in most electric power grids. While distributed control protocols are highly developed and widely accepted in communication applications, this is less true in other networked systems such as electric power and natural gas distribution. This project aims to advance control theory for complex interconnected systems. The application focus is on power systems, but the control techniques are general and are likely to have far broader impact. Recent control innovations are highlighted in the project as building blocks in the construction of algorithms for control, based on a combination of local decision making and global management of the ensemble: 1. Control techniques for local decision making will be a theme of the project using a new Kullback-Leibler-Quadratic optimal control approach introduced by the PI's group. 2. Reinforcement learning (RL) is the engine behind Google's recent computer game successes and is a natural framework for control synthesis in an uncertain complex environment. The Zap Q-learning algorithms introduced recently by the PI and his colleagues are a new class of RL algorithms that are virtually universally stable and have provably optimal convergence rate. 3. Mean field models have a long history in power systems (with roots in statistical physics), they will be used to approximate aggregate behavior, and as a foundation to construct algorithms to control the aggregate. Algorithm design will be complemented with simulation studies, focusing initially on applications to power systems. A course in smart grid technologies will be augmented and the project will include participation from undergraduate students.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
自然和人造的网络系统就在我们周围。电网和互联网是两个明显复杂的互联系统的例子,其中数百万的“代理人”渴望以能源或带宽的形式提取价值。虽然这些系统在用图论术语测量时是复杂的,但通信和能源系统的行为对最终用户(在世界上大多数地方)来说似乎是简单且高度可预测的。这一成功部分归功于管理系统范围供需平衡的分布式控制回路。互联网中分布式控制的一个例子是TCP/IP,以及大多数电网中的自动发电控制(AGC)。虽然分布式控制协议在通信应用中得到了高度发展和广泛接受,但在其他网络化系统(如电力和天然气分配)中却不那么真实。该项目旨在推进复杂互联系统的控制理论。 应用的重点是电力系统,但控制技术是通用的,可能有更广泛的影响。最近的控制创新在该项目中被强调为构建控制算法的基石,基于本地决策和整体管理的组合:1。 局部决策的控制技术将是该项目的一个主题,使用PI小组介绍的新Kullback-Leibler-Quadratic最优控制方法。 2.强化学习(RL)是Google最近成功的计算机游戏背后的引擎,也是在不确定的复杂环境中进行控制合成的自然框架。 PI及其同事最近提出的Zap Q学习算法是一类新的RL算法,它几乎是普遍稳定的,并且具有可证明的最优收敛速度。 3.平均场模型在电力系统中有着悠久的历史(起源于统计物理学),它们将被用来近似聚合行为,并作为构建控制聚合算法的基础。 算法设计将与仿真研究相结合,最初侧重于电力系统的应用。 智能电网技术的课程将得到加强,该项目将包括本科生的参与。该奖项反映了NSF的法定使命,并已被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。

项目成果

期刊论文数量(21)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Quasi-Stochastic Approximation: Design Principles With Applications to Extremum Seeking Control
拟随机逼近:设计原理及其在极值搜索控制中的应用
  • DOI:
    10.1109/mcs.2023.3291884
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lauand, Caio Kalil;Meyn, Sean
  • 通讯作者:
    Meyn, Sean
The Curse of Memory in Stochastic Approximation
随机逼近中的记忆诅咒
Approaching Quartic Convergence Rates for Quasi-Stochastic Approximation with Application to Gradient-Free Optimization
接近准随机近似的四次收敛率并应用于无梯度优化
Model-Free Primal-Dual Methods for Network Optimization with Application to Real-Time Optimal Power Flow
  • DOI:
    10.23919/acc45564.2020.9147814
  • 发表时间:
    2019-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yue-Chun Chen;A. Bernstein;Adithya M. Devraj;Sean P. Meyn
  • 通讯作者:
    Yue-Chun Chen;A. Bernstein;Adithya M. Devraj;Sean P. Meyn
Load-Level Control Design for Demand Dispatch With Heterogeneous Flexible Loads
异构柔性负载需求调度的负载级控制设计
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sean Meyn其他文献

Coding and control for communication networks
  • DOI:
    10.1007/s11134-009-9148-3
  • 发表时间:
    2009-11-25
  • 期刊:
  • 影响因子:
    0.700
  • 作者:
    Wei Chen;Danail Traskov;Michael Heindlmaier;Muriel Médard;Sean Meyn;Asuman Ozdaglar
  • 通讯作者:
    Asuman Ozdaglar
Revisiting Step-Size Assumptions in Stochastic Approximation
重新审视随机逼近中的步长假设
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Caio Kalil Lauand;Sean Meyn
  • 通讯作者:
    Sean Meyn
Dynamic Safety-Stocks for Asymptotic Optimality in Stochastic Networks
  • DOI:
    10.1007/s11134-005-0732-x
  • 发表时间:
    2005-07-01
  • 期刊:
  • 影响因子:
    0.700
  • 作者:
    Sean Meyn
  • 通讯作者:
    Sean Meyn
Functional Role of Synchronization: A Mean-Field Control Perspective
Revisiting the ODE Method for Recursive Algorithms: Fast Convergence Using Quasi Stochastic Approximation
  • DOI:
    10.1007/s11424-021-1251-5
  • 发表时间:
    2021-10-26
  • 期刊:
  • 影响因子:
    2.800
  • 作者:
    Shuhang Chen;Adithya Devraj;Andrey Berstein;Sean Meyn
  • 通讯作者:
    Sean Meyn

Sean Meyn的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sean Meyn', 18)}}的其他基金

CIF: Small: Accelerating Stochastic Approximation for Optimization and Reinforcement Learning
CIF:小型:加速优化和强化学习的随机逼近
  • 批准号:
    2306023
  • 财政年份:
    2023
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
Characterizing capacity of controllable DERs to provide energy storage service to the power grid
表征可控分布式能源为电网提供储能服务的能力
  • 批准号:
    2122313
  • 财政年份:
    2021
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
Distributed Control for Demand Dispatch: The Creation of Virtual Energy Storage from Flexible Loads
需求调度的分布式控制:灵活负载创建虚拟储能
  • 批准号:
    1609131
  • 财政年份:
    2016
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
CPS:Medium:Collaborative Research: Smart Power Systems of the Future: Foundations for Understanding Volatility and Improving Operational Reliability
CPS:中:合作研究:未来的智能电力系统:理解波动性和提高运行可靠性的基础
  • 批准号:
    1259040
  • 财政年份:
    2012
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
CPS:Medium:Collaborative Research: Smart Power Systems of the Future: Foundations for Understanding Volatility and Improving Operational Reliability
CPS:中:合作研究:未来的智能电力系统:理解波动性和提高运行可靠性的基础
  • 批准号:
    1135598
  • 财政年份:
    2011
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
Robust Inference and Communication: Theory, Algorithms and Performance Analysis
稳健的推理和交流:理论、算法和性能分析
  • 批准号:
    0729031
  • 财政年份:
    2007
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
Control Techniques for Complex Networks
复杂网络的控制技术
  • 批准号:
    0523620
  • 财政年份:
    2005
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
Visualization & Optimization Techniques For Analysis and Design of Complex Systems
可视化
  • 批准号:
    0217836
  • 财政年份:
    2002
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
US-India Workshop: Learning, Adaptation, and Optimization, Kerala, India, December 2000
美印研讨会:学习、适应和优化,印度喀拉拉邦,2000 年 12 月
  • 批准号:
    0079744
  • 财政年份:
    2000
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant
Optimization and Performance Evaluation of Network Models
网络模型的优化和性能评估
  • 批准号:
    9972957
  • 财政年份:
    1999
  • 资助金额:
    $ 38万
  • 项目类别:
    Standard Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

TRUST2 - Improving TRUST in artificial intelligence and machine learning for critical building management
TRUST2 - 提高关键建筑管理的人工智能和机器学习的信任度
  • 批准号:
    10093095
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Collaborative R&D
6G Goal-Oriented AI-enabled Learning and Semantic Communication Networks (6G Goals)
6G目标导向的人工智能学习和语义通信网络(6G目标)
  • 批准号:
    10110118
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    EU-Funded
Quantum Machine Learning for Financial Data Streams
金融数据流的量子机器学习
  • 批准号:
    10073285
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Feasibility Studies
Explainable machine learning for electrification of everything
可解释的机器学习,实现万物电气化
  • 批准号:
    LP230100439
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Linkage Projects
Learning to Reason in Reinforcement Learning
在强化学习中学习推理
  • 批准号:
    DP240103278
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Discovery Projects
Learning how we learn: linking inhibitory brain circuits to motor learning
了解我们如何学习:将抑制性大脑回路与运动学习联系起来
  • 批准号:
    DE240100201
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Discovery Early Career Researcher Award
Trustworthy Hypothesis Transfer Learning
可信假设迁移学习
  • 批准号:
    DE240101089
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Discovery Early Career Researcher Award
Developing and Visualising a Retrieval-Augmented Deep Learning Model for Population Health Management
开发和可视化用于人口健康管理的检索增强深度学习模型
  • 批准号:
    2905946
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Studentship
DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
  • 批准号:
    EP/Y029089/1
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Research Grant
Machine Learning for Computational Water Treatment
用于计算水处理的机器学习
  • 批准号:
    EP/X033244/1
  • 财政年份:
    2024
  • 资助金额:
    $ 38万
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了