Collaborative Research: CIF: Medium: Learning to Control from Data: from Theory to Practice
合作研究:CIF:媒介:从数据中学习控制:从理论到实践
基本信息
- 批准号:2211209
- 负责人:
- 金额:$ 80万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-10-01 至 2026-09-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Data-driven decision-making is playing an increasingly critical role in today's world with examples ranging from epidemic response to ridesharing optimization. However, learning an optimal control policy from data faces challenges in both the offline and online settings: (a) (Offline) It is unclear how to most efficiently utilize the available dataset which was collected a priori, especially when it does not cover all possible scenarios of interest. (b) (Online) It is unclear how to collect a dataset through minimal interactions with the environment in situations where it may be costly and unsafe to do so. Driven by the need to address these two challenges, this project aims to improve the sample efficiency of reinforcement learning (RL) in both settings. In addition, the project plans to incorporate adaptivity and trustworthiness that are required in practice. Activities complementary to these research thrusts include the training of future leaders of academia, industry, and government by equipping them with fundamental skills in data-driven decision making.The goal of this project is to develop the theory and algorithms for a new generation of data-driven decision rules in order to address critical challenges in modern RL. Specifically, the research agenda aims (i) to design sample-efficient and computationally-efficient algorithms for online and offline RL with function approximation, and (ii) to enhance the adaptivity and trustworthiness of existing RL paradigms. To achieve the first goal, it is proposed to incorporate optimistic exploration for online RL and pessimistic exploitation for offline RL into existing approaches with the help of faithful uncertainty quantification for neural networks. To achieve the second goal, it is proposed to incorporate model selection into existing approaches with the help of tight sample complexity characterizations.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据驱动的决策在当今世界发挥着越来越重要的作用,从疫情应对到拼车优化都是例子。然而,从数据中学习最优控制策略在离线和在线设置中都面临挑战:(a)(离线)如何最有效地利用先验收集的可用数据集尚不清楚,特别是当它没有涵盖所有可能的感兴趣的场景时。(b)(在线)在成本高且不安全的情况下,如何通过与环境的最小交互来收集数据集尚不清楚。由于需要解决这两个挑战,该项目旨在提高两种情况下强化学习(RL)的样本效率。此外,该项目计划将实践中需要的适应性和可信度纳入其中。与这些研究重点相辅相成的活动包括培训学术界、工业界和政府的未来领导人,使他们具备数据驱动决策的基本技能。该项目的目标是为新一代数据驱动决策规则开发理论和算法,以解决现代强化学习中的关键挑战。具体而言,研究议程旨在(i)基于函数逼近为在线和离线强化学习设计样本效率和计算效率高的算法,以及(ii)增强现有强化学习范式的适应性和可信度。为了实现第一个目标,我们提出在神经网络的忠实不确定性量化的帮助下,将在线强化学习的乐观探索和离线强化学习的悲观开发纳入现有方法中。为了实现第二个目标,提出在紧密样本复杂度表征的帮助下,将模型选择纳入现有方法。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Online Learning in Stackelberg Games with an Omniscient Follower
- DOI:10.48550/arxiv.2301.11518
- 发表时间:2023-01
- 期刊:
- 影响因子:0
- 作者:Geng Zhao;Banghua Zhu;Jiantao Jiao;Michael I. Jordan
- 通讯作者:Geng Zhao;Banghua Zhu;Jiantao Jiao;Michael I. Jordan
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jiantao Jiao其他文献
Minimax estimation of the L1 distance
L1 距离的极小极大估计
- DOI:
10.1109/isit.2016.7541399 - 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Jiantao Jiao;Yanjun Han;T. Weissman - 通讯作者:
T. Weissman
Mutual information, relative entropy and estimation error in semi-martingale channels
半鞅通道中的互信息、相对熵和估计误差
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Jiantao Jiao;K. Venkat;T. Weissman - 通讯作者:
T. Weissman
Beyond maximum likelihood: Boosting the Chow-Liu algorithm for large alphabets
超越最大似然:针对大字母表增强 Chow-Liu 算法
- DOI:
10.1109/acssc.2016.7869051 - 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Jiantao Jiao;Yanjun Han;T. Weissman - 通讯作者:
T. Weissman
Beyond Maximum Likelihood: from Theory to Practice
超越最大似然:从理论到实践
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Jiantao Jiao;K. Venkat;Yanjun Han;T. Weissman - 通讯作者:
T. Weissman
2 Basic Elements of Statistical Decision Theory
2 统计决策理论的基本要素
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Jiantao Jiao;Andrew Hilger - 通讯作者:
Andrew Hilger
Jiantao Jiao的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jiantao Jiao', 18)}}的其他基金
CIF: Small: Collaborative Research: Generative Adversarial Networks: From Art to Science
CIF:小型:协作研究:生成对抗网络:从艺术到科学
- 批准号:
1909499 - 财政年份:2019
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
相似国自然基金
Research on Quantum Field Theory without a Lagrangian Description
- 批准号:24ZR1403900
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
Cell Research
- 批准号:31224802
- 批准年份:2012
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Cell Research
- 批准号:31024804
- 批准年份:2010
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Cell Research (细胞研究)
- 批准号:30824808
- 批准年份:2008
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
- 批准号:10774081
- 批准年份:2007
- 资助金额:45.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
- 批准号:
2403122 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
- 批准号:
2402815 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
- 批准号:
2343599 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
- 批准号:
2343600 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
- 批准号:
2402817 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
- 批准号:
2326622 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
- 批准号:
2402816 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
- 批准号:
2403123 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
- 批准号:
2326621 - 财政年份:2024
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
- 批准号:
2312872 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Standard Grant