Theory and Applications of Approximate Dynamic Programming

近似动态规划理论与应用

基本信息

  • 批准号:
    9625489
  • 负责人:
  • 金额:
    $ 32.48万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    1996
  • 资助国家:
    美国
  • 起止时间:
    1996-07-01 至 1999-12-31
  • 项目状态:
    已结题

项目摘要

9625489 Tsitsiklis This project deals with problems of sequential decision making under uncertainty that are too large for the classical methods of dynamic programming. The focus is on approximate dynamic programming which is a rich field that combines classical dynamic programming, reinforcement learning and other methods from artificial intelligence, approximation theory and neural networks, and simulation. The objectives of the research are as follows: (1). Resolve several outstanding question related to simulation-based methods involving lookup table representations. (2). Provide a theoretical understanding of approximate dynamic programming methods, when a compact representation of the cost-to-go function is employed. In particular, identifying classes of algorithm/architecture combinations for which convergence is guaranteed, together with error bounds. (3). Develop the theory and algorithms for average cost approximate dynamic programming. (4). Develop the theory and algorithms for approximate dynamic programming for the case of Markov games. (5). Carry out a number of case studies that will provide a better understanding of the comparative performance of different methods, and to demonstrate the usefulness of the methods on realistic problems of real-world importance. Three case studies involve: (a) Dynamic scheduling of a fleet of trucks (b) Pricing of complex derivative financial instruments. (c) The game of football. The overall objectives are to provide a comprehensive mathematical foundation for the field of approximate dynamic programming and at the same time succeed in solving some difficult and important problems.
小行星9625489 这个项目处理的问题,顺序决策的不确定性下,太大的经典方法的动态规划。 重点是近似动态规划,这是一个丰富的领域,结合了经典动态规划,强化学习和人工智能,近似理论和神经网络以及模拟的其他方法。 本研究的目的如下:(1). 解决了几个悬而未决的问题,涉及到基于模拟的方法,查找表表示。 (二)、 提供近似动态规划方法的理论理解,当使用成本函数的紧凑表示时。 特别是,识别类的算法/架构组合的收敛性得到保证,连同误差界。 (三)、 发展平均费用近似动态规划的理论和算法。 (四)、 发展马尔可夫博弈情形下近似动态规划的理论和算法。 (五)、 开展一些案例研究,以更好地了解不同方法的比较性能,并证明这些方法对现实世界重要的现实问题的有用性。 三个案例研究涉及:(a)卡车车队的动态调度(B)复杂衍生金融工具的定价。(c)足球比赛 总体目标是为近似动态规划领域提供全面的数学基础,同时成功地解决一些困难和重要的问题。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

John Tsitsiklis其他文献

John Tsitsiklis的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('John Tsitsiklis', 18)}}的其他基金

Workshop on Information and Decision Sciences, To Be Held MIT Campus, Cambridge, MA, November 1-2, 2019.
信息与决策科学研讨会,将于 2019 年 11 月 1 日至 2 日在马萨诸塞州剑桥麻省理工学院校园举行。
  • 批准号:
    1935075
  • 财政年份:
    2019
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Standard Grant
The Power Of Limited Flexibility And Resource Pooling
有限灵活性和资源池的力量
  • 批准号:
    1234062
  • 财政年份:
    2012
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Standard Grant
2012 Stochastic Networks Conference; Massachusetts Institute of Technology; Cambridge, Massachusetts; June 18-22, 2012
2012年随机网络会议;
  • 批准号:
    1153951
  • 财政年份:
    2011
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Standard Grant
Collaborative Research: Adaptive Allocation Rules in High-Dimensional Settings, with Applications
协作研究:高维设置中的自适应分配规则及其应用
  • 批准号:
    0856063
  • 财政年份:
    2009
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Standard Grant
Data Fusion Architectures
数据融合架构
  • 批准号:
    0701623
  • 财政年份:
    2007
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Continuing grant
ITR: Decision Making, Optimization, Learning, and Adaptation in Uncertain and Dynamic Environments
ITR:不确定和动态环境中的决策、优化、学习和适应
  • 批准号:
    0312921
  • 财政年份:
    2003
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Standard Grant
U.S.-Greece Cooperative Research: High-Speed Integrated Services Communication Networks
美国-希腊合作研究:高速综合业务通信网络
  • 批准号:
    9725223
  • 财政年份:
    1998
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Standard Grant
Presidential Young Investigator Award: "Research in Systems Theory"
总统青年研究员奖:“系统理论研究”
  • 批准号:
    8552419
  • 财政年份:
    1986
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Continuing grant

相似国自然基金

Applications of AI in Market Design
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研 究基金项目
英文专著《FRACTIONAL INTEGRALS AND DERIVATIVES: Theory and Applications》的翻译
  • 批准号:
    12126512
  • 批准年份:
    2021
  • 资助金额:
    12.0 万元
  • 项目类别:
    数学天元基金项目

相似海外基金

ERI: Enhanced Robustness for Approximate Quantum Computing Hardware and Applications
ERI:增强近似量子计算硬件和应用的鲁棒性
  • 批准号:
    2300476
  • 财政年份:
    2023
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Standard Grant
Multistage Stochastic Integer Programming: Approximate Solution Methods and Applications
多阶段随机整数规划:近似解法及应用
  • 批准号:
    RGPIN-2018-04984
  • 财政年份:
    2022
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Grants Program - Individual
Multistage Stochastic Integer Programming: Approximate Solution Methods and Applications
多阶段随机整数规划:近似解法及应用
  • 批准号:
    RGPIN-2018-04984
  • 财政年份:
    2021
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Grants Program - Individual
Applications of exact and approximate enumeration
精确枚举和近似枚举的应用
  • 批准号:
    RGPIN-2017-03751
  • 财政年份:
    2021
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Grants Program - Individual
Multistage Stochastic Integer Programming: Approximate Solution Methods and Applications
多阶段随机整数规划:近似解法及应用
  • 批准号:
    RGPIN-2018-04984
  • 财政年份:
    2020
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Grants Program - Individual
Applications of exact and approximate enumeration
精确枚举和近似枚举的应用
  • 批准号:
    RGPIN-2017-03751
  • 财政年份:
    2020
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Grants Program - Individual
Multistage Stochastic Integer Programming: Approximate Solution Methods and Applications
多阶段随机整数规划:近似解法及应用
  • 批准号:
    RGPIN-2018-04984
  • 财政年份:
    2019
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Grants Program - Individual
Applications of exact and approximate enumeration
精确枚举和近似枚举的应用
  • 批准号:
    RGPIN-2017-03751
  • 财政年份:
    2019
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Grants Program - Individual
Fast approximate inference methods: new algorithms, applications and theory
快速近似推理方法:新算法、应用和理论
  • 批准号:
    DP180100597
  • 财政年份:
    2018
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Projects
Multistage Stochastic Integer Programming: Approximate Solution Methods and Applications
多阶段随机整数规划:近似解法及应用
  • 批准号:
    RGPIN-2018-04984
  • 财政年份:
    2018
  • 资助金额:
    $ 32.48万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了