AF: Small: A New Approach to Analysis and Design of Algorithms for Stochastic Control and Optimization
AF:小:随机控制和优化算法分析和设计的新方法
基本信息
- 批准号:1817212
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-10-01 至 2022-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Randomized algorithms for stochastic optimization and control underpin many developing technologies such as Artificial Intelligence (AI), Autonomous Robotics, and Big Data Analytics. Their development is hampered by a lack of suitable mathematical tools. In many cases, current mathematical techniques such as those based on Stochastic Lyapunov theory are rather difficult to use, thus necessitating invention of customized techniques for algorithm design for each problem and its analysis. This project will develop a new class of mathematical techniques, called probabilistic contraction analysis, that are easier to use, and more broadly applicable. The project's aim is not just analysis of existing algorithms, but development of analysis tools with an eye on design. The project outcomes can accelerate development of new algorithms for stochastic control and optimization problems that arise in many important application fields such as AI, Autonomy, Big Data Analytics, etc. The project will train under-represented and/or female PhD students and postdocs, as well as high school students and teachers.Given a randomized algorithm for stochastic optimization and control, this project views each iteration as applying a random operator, and develops new "probabilistic contraction" analysis techniques, created by the investigator, that use stochastic dominance arguments to show convergence to probabilistic fixed points. Specifically, the investigator will develop empirically-inspired algorithms for optimal control of continuous state and action space Markov decision processes, and unconstrained and constrained stochastic optimization problems. The techniques to be developed may be useful for a broader class of stochastic iterative algorithms, and lead to development of a probabilistic fixed point theory of random operators on Banach spaces.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
用于随机优化和控制的随机算法支撑着许多发展中的技术,如人工智能(AI)、自主机器人和大数据分析。由于缺乏合适的数学工具,它们的发展受到阻碍。在许多情况下,现有的数学技术,如基于随机李雅普诺夫理论的数学技术,使用起来相当困难,因此需要为每个问题的算法设计和分析发明定制技术。这个项目将开发一种新的数学技术,称为概率收缩分析,它更容易使用,更广泛适用。该项目的目标不仅仅是分析现有的算法,而是开发着眼于设计的分析工具。项目成果可以加速在人工智能、自治、大数据分析等许多重要应用领域出现的随机控制和优化问题的新算法的开发。该项目将培养代表性不足的女性博士生和博士后,以及高中生和教师。给定随机优化和控制的随机算法,该项目将每次迭代视为应用随机算子,并开发了由研究者创建的新的“概率收缩”分析技术,该技术使用随机优势参数来显示收敛到概率不动点。具体来说,研究者将开发经验启发的算法,用于连续状态和行动空间马尔可夫决策过程的最优控制,以及无约束和约束随机优化问题。所开发的技术可能对更广泛的随机迭代算法有用,并导致Banach空间上随机算子的概率不动点理论的发展。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Model-free Reinforcement Learning in Infinite-horizon Average-reward Markov Decision Processes
- DOI:
- 发表时间:2019-10
- 期刊:
- 影响因子:0
- 作者:Chen-Yu Wei;Mehdi Jafarnia-Jahromi;Haipeng Luo;Hiteshi Sharma;R. Jain
- 通讯作者:Chen-Yu Wei;Mehdi Jafarnia-Jahromi;Haipeng Luo;Hiteshi Sharma;R. Jain
An Approximately Optimal Relative Value Learning Algorithm for Averaged MDPs with Continuous States and Actions
具有连续状态和动作的平均 MDP 的近似最优相对值学习算法
- DOI:10.1109/allerton.2019.8919719
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Sharma, Hiteshi;Jain, Rahul
- 通讯作者:Jain, Rahul
Finite Time Guarantees for Continuous State MDPs with Generative Model
- DOI:10.1109/cdc42340.2020.9303840
- 发表时间:2020-12
- 期刊:
- 影响因子:0
- 作者:Hiteshi Sharma;R. Jain
- 通讯作者:Hiteshi Sharma;R. Jain
Approximate Relative Value Learning for Average-reward Continuous State MDPs
平均奖励连续状态 MDP 的近似相对价值学习
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Sharma, Hiteshi;Jafarnia-Jahromi, Mehdi;Jain, Rahul
- 通讯作者:Jain, Rahul
Non-indexability of the stochastic appointment scheduling problem
- DOI:10.1016/j.automatica.2020.109016
- 发表时间:2017-08
- 期刊:
- 影响因子:0
- 作者:Mehdi Jafarnia-Jahromi;Rahul Jain
- 通讯作者:Mehdi Jafarnia-Jahromi;Rahul Jain
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Rahul Jain其他文献
The Partition Bound for Classical Communication Complexity and Query Complexity
经典通信复杂性和查询复杂性的分区界限
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Rahul Jain;H. Klauck - 通讯作者:
H. Klauck
Peptide‐Heterocycle Conjugates as Antifungals Against Cryptococcosis
肽杂环缀合物作为抗隐球菌病的抗真菌药
- DOI:
10.1002/ajoc.202200196 - 发表时间:
2022 - 期刊:
- 影响因子:2.7
- 作者:
K. Sharma;K. Sharma;Anurag Kudwal;Shabana I. Khan;Rahul Jain - 通讯作者:
Rahul Jain
Outcome of implantable cardioverter defibrillator in cardiac sarcoidosis: a systematic review and meta-analysis
植入式心脏复律除颤器治疗心脏结节病的结果:系统评价和荟萃分析
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:1.8
- 作者:
A. Halawa;Rahul Jain;M. Turagam;F. Kusumoto;H. Woldu;S. Gautam - 通讯作者:
S. Gautam
Direct Product Theorems for Communication Complexity via Subdistribution Bounds
通过次分布界限计算通信复杂性的直积定理
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
Rahul Jain;H. Klauck;A. Nayak - 通讯作者:
A. Nayak
A new information-theoretic property about quantum states with an application to privacy in quantum communication ∗
关于量子态的新信息论属性及其在量子通信隐私中的应用*
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Rahul Jain;J. Radhakrishnan;P. Sen - 通讯作者:
P. Sen
Rahul Jain的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Rahul Jain', 18)}}的其他基金
EAGER: Real-Time: Formal Reinforcement Learning Methods for the Design of Safety-critical Autonomous Systems
EAGER:实时:用于安全关键型自主系统设计的形式强化学习方法
- 批准号:
1839842 - 财政年份:2019
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Online Learning-based Real-time Control of Unknown Autonomous Systems
基于在线学习的未知自治系统实时控制
- 批准号:
1810447 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: Smarter Markets for a Smarter Grid: Pricing Randomness, Flexibility and Risk
协作研究:智能电网的智能市场:定价随机性、灵活性和风险
- 批准号:
1611574 - 财政年份:2016
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
CAREER: Network Economics: Theory and Architectures for Incentive-engineered Networks
职业:网络经济学:激励工程网络的理论和架构
- 批准号:
0954116 - 财政年份:2010
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
NetSE: Small: Cooperation and Incentives in Communication and Social Networks
NetSE:小型:通信和社交网络中的合作和激励
- 批准号:
0917410 - 财政年份:2009
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342244 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
- 批准号:
2402572 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342245 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
- 批准号:
2402571 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions and Approaches in Discrepancy Theory
合作研究:AF:小:差异理论的新方向和方法
- 批准号:
2327010 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions and Approaches in Discrepancy Theory
合作研究:AF:小:差异理论的新方向和方法
- 批准号:
2327011 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
AF: Small: New Challenges and Approaches in Clustering Algorithms
AF:小:聚类算法的新挑战和方法
- 批准号:
2311397 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
NSF-BSF: AF: Small: New directions in geometric traversal theory
NSF-BSF:AF:小:几何遍历理论的新方向
- 批准号:
2317241 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
AF: Small: New Tools to Analyze Random Walks
AF:小:分析随机游走的新工具
- 批准号:
2203541 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
AF: Small: Towards New Relaxations for Online Algorithms
AF:小:在线算法的新放松
- 批准号:
2224718 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
Standard Grant