Lyapunov Methods for Reinforcement Learning

强化学习的李亚普诺夫方法

基本信息

  • 批准号:
    0070102
  • 负责人:
  • 金额:
    $ 11.94万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2000
  • 资助国家:
    美国
  • 起止时间:
    2000-07-01 至 2002-12-31
  • 项目状态:
    已结题

项目摘要

0070102BartoReinforcement learning is a summary term for a collection of methods for approximating solutions to stochastic optimal control problems. RL methods leave been successfully applied to a large array of such problems in a diversity of domains, including finance, logistics, telecommunications, and robot control. Although similar problems have been studied intensively for many years in control engineering and operations research, the methods developed by RL researchers have added new elements to the classical solution methods. RL methods offer novel ways to approximate solutions to problems that are too large or ill-defined for the classical solution methods to be feasible.A significant part of RL research is directed at increasing on-line performance and speed of convergence by providing RL systems with domain knowledge. This project is concerned with knowledge related to the design of stabilizing controllers for complex dynamical systems. It will try to develop a general theory for incorporating this knowledge into RL systems. The basic idea is to mathematically define policy subspaces that have certain known stability and safety properties and to focus exploration on control laws that lie within these policy subspaces. The means by which this is achieved are based on the theory of Lyapunov stability and the associated methods of Lyapunov control design.***
巴托强化学习是逼近随机最优控制问题解的一组方法的总称。RL方法已经成功地应用于金融、物流、电信和机器人控制等多个领域的大量此类问题。虽然类似的问题在控制工程和运筹学中已经被深入研究了很多年,但RL研究人员开发的方法为经典的求解方法增添了新的元素。RL方法提供了一种新的方法来逼近那些太大或定义不明确的问题的解,而经典的求解方法是不可行的。RL研究的一个重要部分是通过向RL系统提供领域知识来提高在线性能和收敛速度。这个项目是关于复杂动力系统的镇定控制器设计的相关知识。它将试图开发一种将这些知识纳入RL系统的一般理论。其基本思想是在数学上定义具有某些已知稳定性和安全性的策略子空间,并将探索的重点放在这些策略子空间中的控制律上。实现这一点的方法是基于李亚普诺夫稳定性理论和相关的李亚普诺夫控制设计方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Andrew Barto其他文献

Andrew Barto的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Andrew Barto', 18)}}的其他基金

CRCNS: Collaborative Research: Neural Correlates of Hierarchical Reinforcement Learning
CRCNS:协作研究:分层强化学习的神经关联
  • 批准号:
    1208051
  • 财政年份:
    2012
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
NRI-Small: Collaborative Research: Multiple Task Learning from Unstructured Demonstrations
NRI-Small:协作研究:从非结构化演示中进行多任务学习
  • 批准号:
    1208497
  • 财政年份:
    2012
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Standard Grant
SGER: Building Blocks for Creative Search
SGER:创意搜索的构建模块
  • 批准号:
    0733581
  • 财政年份:
    2007
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Standard Grant
Collaborative Research: Intrinsically Motivated Learning in Artificial Agents
协作研究:人工智能体的内在动机学习
  • 批准号:
    0432143
  • 财政年份:
    2004
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
Dynamic Abstraction in Reinforcement Learning
强化学习中的动态抽象
  • 批准号:
    0218125
  • 财政年份:
    2002
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
KDI: Temporal Abstraction in Reinforcement Learning
KDI:强化学习中的时间抽象
  • 批准号:
    9980062
  • 财政年份:
    1999
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Standard Grant
Multiple Time Scale Reinforcement Learning
多时间尺度强化学习
  • 批准号:
    9511805
  • 财政年份:
    1995
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
Reinforcement Learning Algorithms Based on Dynamic Programming
基于动态规划的强化学习算法
  • 批准号:
    9214866
  • 财政年份:
    1992
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
Neural Networks for Adaptive Control
用于自适应控制的神经网络
  • 批准号:
    8912623
  • 财政年份:
    1989
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
Conference on the Neurone as a Computational Unit, June 28--July 1, 1988, King's College, Cambridge, England
神经元作为计算单元会议,1988 年 6 月 28 日至 7 月 1 日,英国剑桥国王学院
  • 批准号:
    8808758
  • 财政年份:
    1988
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Standard Grant

相似国自然基金

Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: Lyapunov Drift Methods for Stochastic Recursions: Applications in Cloud Computing and Reinforcement Learning
职业:随机递归的李亚普诺夫漂移方法:云计算和强化学习中的应用
  • 批准号:
    2144316
  • 财政年份:
    2022
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
Statistical Methods in Offline Reinforcement Learning
离线强化学习中的统计方法
  • 批准号:
    EP/W014971/1
  • 财政年份:
    2022
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Research Grant
CAREER: Soft-robust Methods for Offline Reinforcement Learning
职业:离线强化学习的软鲁棒方法
  • 批准号:
    2144601
  • 财政年份:
    2022
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
Scalable Reinforcement Learning Methods for Learning in Real-Time with Robots
用于机器人实时学习的可扩展强化学习方法
  • 批准号:
    RGPIN-2021-02690
  • 财政年份:
    2022
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Discovery Grants Program - Individual
Safe Reinforcement Learning through Formal Methods
通过形式化方法进行安全强化学习
  • 批准号:
    558947-2021
  • 财政年份:
    2022
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Sequential Monte Carlo Methods for Model Based Reinforcement Learning
基于模型的强化学习的顺序蒙特卡罗方法
  • 批准号:
    573681-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 11.94万
  • 项目类别:
    University Undergraduate Student Research Awards
Improved analysis of policy gradient methods in reinforcement learning.
强化学习中策略梯度方法的改进分析。
  • 批准号:
    2602524
  • 财政年份:
    2021
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Studentship
Conditions and methods for Decentralised Reinforcement Learning
去中心化强化学习的条件和方法
  • 批准号:
    2619847
  • 财政年份:
    2021
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Studentship
Markov Chains and Applications to Distributional Reinforcement Learning for Multi-Step Methods
马尔可夫链及其在多步方法的分布式强化学习中的应用
  • 批准号:
    566152-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
CAREER: AutoEdge: Deep Reinforcement Learning Methods and Systems for Network Automation at Wireless Edge
职业:AutoEdge:无线边缘网络自动化的深度强化学习方法和系统
  • 批准号:
    2147624
  • 财政年份:
    2021
  • 资助金额:
    $ 11.94万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了