Continuous Time Reinforcement Learning using Rough Paths

使用粗糙路径的连续时间强化学习

基本信息

  • 批准号:
    2153915
  • 负责人:
  • 金额:
    $ 65.56万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-08-01 至 2025-07-31
  • 项目状态:
    未结题

项目摘要

Reinforcement learning (RL) methods have been embraced, in both academic and industrial settings, for solving a range of science and engineering problems involving dynamic system optimization. These problems run the gamut and include optimal resource allocation in, for example, ride-sharing, healthcare management and energy systems, pricing and trading risky assets in finance, autonomous vehicles and robots. RL is also increasingly being used in the physical sciences, for instance for discovering new materials and/or exploring the properties of known materials. Despite the growing importance and breadth of applications, RL methods are often found to perform poorly in actuality. RL methods have been primarily developed for discrete-time and so-called Markovian settings, while most real-world problems are better modeled in continuous time, with non-Markovian dynamics. The broad adoption of RL methods across science and engineering necessitates the investigation of how to develop RL methods for continuous-time and non-Markovian settings. This project aims at laying the foundations for addressing these questions. In addition, the PIs have developed specific aims in terms of dissemination of discoveries, survey for graduate students, national and international networking, mentoring of junior researchers as well as graduate and undergraduate students, participation and organization of events, and interdisciplinary research.The successful completion of this project will fill make significant contributions towards the theoretical analysis of continuous-time RL. The project will offer a global framework valid for general random environments. In particular it goes beyond the somewhat restrictive Markov setting, and allows for pathwise controls. At its core, this research project aims at the development of analytical results that can be used to provide theoretical guarantees for continuous-time RL problems across a range of application domains. The successful completion of the project will entail a number of new results characterizing the solution of pathwise optimal control in rough environments, the analysis of computational methods for obtaining optimal policies, as well as the analysis of numerical schemes for approximating policies and value functions using rough path signatures. The proposed efforts will have sufficient novelty to open new research areas. They will also further promote the applicability of the theoretical techniques alluded to above.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
强化学习(RL)方法已被学术界和工业界所接受,用于解决涉及动态系统优化的一系列科学和工程问题。这些问题涉及方方面面,包括拼车、医疗管理和能源系统等领域的资源优化配置,以及金融、自动驾驶汽车和机器人领域的风险资产定价和交易。RL也越来越多地被用于物理科学,例如,用于发现新材料和/或探索已知材料的性质。尽管应用的重要性和广度越来越大,但现实中的RL方法往往表现不佳。RL方法主要是为离散时间和所谓的马尔可夫环境开发的,而大多数现实世界的问题在连续时间内被更好地建模,具有非马尔可夫动力学。RL方法在科学和工程中的广泛采用需要研究如何为连续时间和非马尔科夫环境开发RL方法。该项目旨在为解决这些问题奠定基础。此外,PIS在传播发现、对研究生的调查、国内和国际网络、指导初级研究人员以及研究生和本科生、参与和组织活动以及跨学科研究方面制定了具体目标。这一项目的成功完成将填补对连续时间RL理论分析的重大贡献。该项目将提供一个对一般随机环境有效的全球框架。特别是,它超越了有点受限的马尔可夫设置,并允许路径控制。这个研究项目的核心是开发分析结果,这些结果可以用来为一系列应用领域的连续时间RL问题提供理论保证。该项目的成功完成将带来一些新的结果,包括粗糙环境下路径最优控制的解决方案,获得最优策略的计算方法的分析,以及使用粗略路径签名逼近策略和值函数的数值方案的分析。拟议的努力将具有足够的新颖性,以开辟新的研究领域。他们还将进一步促进上述理论技术的适用性。这一奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Samy Tindel其他文献

On ergodic properties of stochastic PDEs
关于随机偏微分方程的遍历性质
A Central Limit Theorem for a Localized Version of the SK Model
  • DOI:
    10.1007/s11118-007-9041-9
  • 发表时间:
    2007-02-07
  • 期刊:
  • 影响因子:
    0.800
  • 作者:
    Sérgio de Carvalho Bezerra;Samy Tindel
  • 通讯作者:
    Samy Tindel
Young differential equations with power type nonlinearities
  • DOI:
    10.1016/j.spa.2017.01.007
  • 发表时间:
    2017-09-01
  • 期刊:
  • 影响因子:
  • 作者:
    Jorge A. León;David Nualart;Samy Tindel
  • 通讯作者:
    Samy Tindel
Quasilinear Stochastic Hyperbolic Differential Equations with Nondecreasing Coefficient
  • DOI:
    10.1023/a:1008644503806
  • 发表时间:
    1997-01-01
  • 期刊:
  • 影响因子:
    0.800
  • 作者:
    David Nualart;Samy Tindel
  • 通讯作者:
    Samy Tindel
The rough path associated to the multidimensional analytic fBm with any Hurst parameter
  • DOI:
    10.1007/s13348-010-0021-9
  • 发表时间:
    2010-10-12
  • 期刊:
  • 影响因子:
    0.500
  • 作者:
    Samy Tindel;Jérémie Unterberger
  • 通讯作者:
    Jérémie Unterberger

Samy Tindel的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Samy Tindel', 18)}}的其他基金

Conference: International conference on Malliavin calculus and related topics
会议:Malliavin 微积分及相关主题国际会议
  • 批准号:
    2308890
  • 财政年份:
    2023
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Standard Grant
Applications of Rough Differential Systems: Theoretical Physics, Data Analysis, and Numerics
粗微分系统的应用:理论物理、数据分析和数值
  • 批准号:
    1952966
  • 财政年份:
    2020
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Continuing Grant
On Rough Differential Systems and Stochastic Analysis
粗微分系统与随机分析
  • 批准号:
    1613163
  • 财政年份:
    2016
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Standard Grant

相似国自然基金

SERS探针诱导TAM重编程调控头颈鳞癌TIME的研究
  • 批准号:
    82360504
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
华蟾素调节PCSK9介导的胆固醇代谢重塑TIME增效aPD-L1治疗肝癌的作用机制研究
  • 批准号:
    82305023
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于MRI的机器学习模型预测直肠癌TIME中胶原蛋白水平及其对免疫T细胞调控作用的研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
结直肠癌TIME多模态分子影像分析结合深度学习实现疗效评估和预后预测
  • 批准号:
    62171167
  • 批准年份:
    2021
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
Time-lapse培养对人类胚胎植入前印记基因DNA甲基化的影响研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
萱草花开放时间(Flower Opening Time)的生物钟调控机制研究
  • 批准号:
    31971706
  • 批准年份:
    2019
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目
Time-of-Flight深度相机多径干扰问题的研究
  • 批准号:
    61901435
  • 批准年份:
    2019
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
Finite-time Lyapunov 函数和耦合系统的稳定性分析
  • 批准号:
    11701533
  • 批准年份:
    2017
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
建筑工程计划中Time Buffer 的形成和分配 – 工程项目管理中的社会性研究
  • 批准号:
    71671098
  • 批准年份:
    2016
  • 资助金额:
    48.0 万元
  • 项目类别:
    面上项目
光学Parity-Time对称系统中破坏点的全光调控特性研究
  • 批准号:
    11504059
  • 批准年份:
    2015
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Reinforcement as a Prospective Predictor of Real-time Alcohol Abuse Following Bariatric Surgery
强化作为减肥手术后实时酒精滥用的前瞻性预测因子
  • 批准号:
    10370120
  • 财政年份:
    2022
  • 资助金额:
    $ 65.56万
  • 项目类别:
Scalable Reinforcement Learning Methods for Learning in Real-Time with Robots
用于机器人实时学习的可扩展强化学习方法
  • 批准号:
    RGPIN-2021-02690
  • 财政年份:
    2022
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Discovery Grants Program - Individual
Reinforcement as a Prospective Predictor of Real-time Alcohol Abuse Following Bariatric Surgery
强化作为减肥手术后实时酒精滥用的前瞻性预测因子
  • 批准号:
    10705563
  • 财政年份:
    2022
  • 资助金额:
    $ 65.56万
  • 项目类别:
Reinforcement Learning: Speeding-up Learning through Options and Time
强化学习:通过选项和时间加速学习
  • 批准号:
    DDG-2020-00035
  • 财政年份:
    2022
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Discovery Development Grant
Reinforcement Learning: Speeding-up Learning through Options and Time
强化学习:通过选项和时间加速学习
  • 批准号:
    DDG-2020-00035
  • 财政年份:
    2021
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Discovery Development Grant
NSF-AoF: CNS Core: Small: Reinforcement Learning for Real-time Wireless Scheduling and Edge Caching: Theory and Algorithm Design
NSF-AoF:CNS 核心:小型:实时无线调度和边缘缓存的强化学习:理论和算法设计
  • 批准号:
    2130125
  • 财政年份:
    2021
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Standard Grant
Building a reinforcement learning tool for individually tailoring just-in-time adaptive interventions: Extending the reach of mHealth technology for improved weight loss outcomes
构建强化学习工具,用于个性化定制及时适应性干预措施:扩大移动医疗技术的覆盖范围,以改善减肥效果
  • 批准号:
    10195835
  • 财政年份:
    2021
  • 资助金额:
    $ 65.56万
  • 项目类别:
NSF-AoF: CNS Core: Small: Reinforcement Learning for Real-time Wireless Scheduling and Edge Caching: Theory and Algorithm Design
NSF-AoF:CNS 核心:小型:实时无线调度和边缘缓存的强化学习:理论和算法设计
  • 批准号:
    2203239
  • 财政年份:
    2021
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Standard Grant
Improving AI Performance in Complex Real-Time Scenarios with Hierarchical Reinforcement Learning and Counterfactual Regret Minimization
通过分层强化学习和反事实遗憾最小化提高复杂实时场景中的人工智能性能
  • 批准号:
    2590735
  • 财政年份:
    2021
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Studentship
CAREER: Real-time Control of Cell Differentiation Using Reinforcement Learning
职业:使用强化学习实时控制细胞分化
  • 批准号:
    2042503
  • 财政年份:
    2021
  • 资助金额:
    $ 65.56万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了