New Computational Approaches for Markov Decision Processes
马尔可夫决策过程的新计算方法
基本信息
- 批准号:0323220
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2004
- 资助国家:美国
- 起止时间:2004-01-01 至 2008-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Developing practical computational solution methods for large-scale Markov Decision Processes (MDPs), also known as stochastic dynamic programming problems, remains an important and challenging research area. The complexity of many modern systems that can in principle be modeled using MDPs have resulted in models for which it is not possible to explicitly enumerate the transition probabilities, but for which sample paths can be easily generated, e.g., via a stochastic simulation model. The project research addresses two other distinct but crucial issues that arise: how best to allocate a computational budget that is used to generate sample paths, and how to produce a robust set of good policies directly (rather than indirectly via value function approximations). In particular, the main thrusts of our proposed approaches center on two distinct paradigms: effective sampling-based methodologies using multi-armed bandit models and induced correlation for value function estimation; and population-based approaches for finding improving policies, in contrast to the traditional policy iteration method, which iterates on a single policy. The latter thrust will focus on infinite horizon problems, where there is assumed an optimal stationary policy, whereas the former approaches are intended for finite horizon problems, where backwards induction dynamic programming must be employed. Algorithms will be developed and then analyzed in terms of their properties such as convergence rate and theoretical bounds on performance, followed by testing on specific application areas to investigate their practical utility. Specific problem domains include the pricing of American-style financial derivatives; capacity planning and preventive maintenance in manufacturing systems; and communication networks.
开发用于大规模马尔可夫决策过程(MDP)(也称为随机动态编程问题)的实用计算解决方案方法仍然是一个重要且具有挑战性的研究领域。 原则上可以使用MDP建模的许多现代系统的复杂性导致模型无法明确列举过渡概率,但是可以轻松地通过随机模拟模型来轻松地生成样品路径。 该项目研究解决了出现的另外两个不同但至关重要的问题:如何最好地分配用于生成样本路径的计算预算,以及如何直接直接产生一组强大的良好策略(而不是通过价值函数近似值间接)。 特别是,我们提出的方法的主要推力以两个不同的范式为中心:使用多军匪徒模型的有效采样方法,并诱导相关性,以进行价值函数估计;与传统的政策迭代方法相比,基于人群的方法来寻找改进政策,该方法在单一政策上进行了迭代。 后者的推力将集中在无限的地平线问题上,如果假定具有最佳的固定政策,而前者的方法则用于有限的地平线问题,必须采用向后感应动态编程。 将开发算法,然后根据其属性(例如收敛率和性能的理论界限)进行分析,然后对特定的应用领域进行测试以研究其实际效用。 特定的问题领域包括美国风格的金融衍生品的定价;制造系统中的容量计划和预防性维护;和通信网络。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Michael Fu其他文献
Complications and Length of Stay Following Elective Anterior Cervical Discectomy and Fusion: A NSQIP Database Study
- DOI:
10.1016/j.spinee.2013.07.328 - 发表时间:
2013-09-01 - 期刊:
- 影响因子:
- 作者:
Jordan A. Gruskay;Michael Fu;Bryce Basques;Rafael A. Buerba;Matthew L. Webb;Daniel D. Bohl;Jonathan N. Grauer - 通讯作者:
Jonathan N. Grauer
Association between Body Mass Index and Risk of Aortic Stenosis in Women
女性体重指数与主动脉瓣狭窄风险之间的关系
- DOI:
10.1101/2023.09.26.23296191 - 发表时间:
2023 - 期刊:
- 影响因子:2.5
- 作者:
S. Kontogeorgos;Annika Rosengren;T. Z. Sandström;Michael Fu;Martin Lindgren;C. Md;M. Md;MD PhD Demir Djekic;E. Thunström - 通讯作者:
E. Thunström
Cartilage-Preserving Arthroscopic-Assisted Radiofrequency Ablation of Periacetabular Osteoid Osteoma in a Young Adult Hip
- DOI:
10.1016/j.eats.2020.03.024 - 发表时间:
2020-07-01 - 期刊:
- 影响因子:
- 作者:
Alexander C. Newhouse;Daniel M. Wichman;Michael Fu;Shane J. Nho - 通讯作者:
Shane J. Nho
A Formal Explainer for Just-In-Time Defect Predictions
即时缺陷预测的正式解释器
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:4.4
- 作者:
Jinqiang Yu;Michael Fu;Alexey Ignatiev;C. Tantithamthavorn;Peter J. Stuckey - 通讯作者:
Peter J. Stuckey
Impact-based forecasting for improving the capacity of typhoon-related disaster risk reduction in typhoon committee region
- DOI:
10.1016/j.tcrr.2022.09.003 - 发表时间:
2022-09-01 - 期刊:
- 影响因子:
- 作者:
Jixin Yu;Jinping Liu;Ji-Won Baek;Clarence Fong;Michael Fu - 通讯作者:
Michael Fu
Michael Fu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Michael Fu', 18)}}的其他基金
Collaborative Research: SCH: Optimal Desensitization Protocol in Support of a Kidney Paired Donation (KPD) System
合作研究:SCH:支持肾脏配对捐赠 (KPD) 系统的最佳脱敏方案
- 批准号:
2123684 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Maintaining volitional effort during electrical stimulation-assisted stroke rehabilitation
职业:在电刺激辅助中风康复期间保持意志力
- 批准号:
1942402 - 财政年份:2020
- 资助金额:
-- - 项目类别:
Continuing Grant
New Approaches for Simulation-Based Optimal Decision Making
基于仿真的最优决策的新方法
- 批准号:
1434419 - 财政年份:2015
- 资助金额:
-- - 项目类别:
Standard Grant
New Simulation-Based Approaches to Solving Markov Decision Processes
解决马尔可夫决策过程的基于仿真的新方法
- 批准号:
9988867 - 财政年份:2000
- 资助金额:
-- - 项目类别:
Continuing Grant
U. S. - France (INRIA) Cooperative Research Improving the Efficiency of Manufacturing Systems by Integrating Production Control into Maintenance Policies
美国-法国 (INRIA) 合作研究通过将生产控制纳入维护策略来提高制造系统的效率
- 批准号:
0070866 - 财政年份:2000
- 资助金额:
-- - 项目类别:
Standard Grant
U.S.-France Cooperative Research (INRIA): Perturbation Analysis and Parallel Computing for Production Management
美法合作研究(INRIA):生产管理的扰动分析和并行计算
- 批准号:
9402580 - 财政年份:1995
- 资助金额:
-- - 项目类别:
Standard Grant
相似国自然基金
顺层边坡变形调控新结构——让剪让压型锚拉桩的承载机理与计算方法
- 批准号:52378327
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于深度学习和蒙特卡罗剂量算法建立一种新的放射治疗剂量计算方法的研究
- 批准号:
- 批准年份:2020
- 资助金额:24 万元
- 项目类别:青年科学基金项目
基于双模态MRI数据和人工智能方法的乳腺癌新辅助化疗评估
- 批准号:81901701
- 批准年份:2019
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于交替凸搜索和凸松弛技术的非凸二次规划新全局算法及其在金融中的应用
- 批准号:11871433
- 批准年份:2018
- 资助金额:52.0 万元
- 项目类别:面上项目
复杂不等价半导体合金有序和无序结构及新物性的研究
- 批准号:11774416
- 批准年份:2017
- 资助金额:61.0 万元
- 项目类别:面上项目
相似海外基金
PINK - Provision of Integrated Computational Approaches for Addressing New Markets Goals for the Introduction of Safe-and-Sustainable-by-Design Chemicals and Materials
PINK - 提供综合计算方法来解决引入安全和可持续设计化学品和材料的新市场目标
- 批准号:
10097944 - 财政年份:2024
- 资助金额:
-- - 项目类别:
EU-Funded
Computational imaging approaches to personalized gastric cancer treatment
个性化胃癌治疗的计算成像方法
- 批准号:
10585301 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Domain adaptation approaches to unify established and emerging sequencing technologies
领域适应方法统一现有和新兴的测序技术
- 批准号:
10643544 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Training program in computational approaches to brain and behavior
大脑和行为计算方法培训计划
- 批准号:
10746646 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Training program in computational approaches to brain and behavior
大脑和行为计算方法培训计划
- 批准号:
10879238 - 财政年份:2023
- 资助金额:
-- - 项目类别: