EAGER: IIS: RI: Learning in Continuous and High Dimensional Action Spaces

EAGER:IIS:RI:在连续和高维行动空间中学习

基本信息

  • 批准号:
    1147641
  • 负责人:
  • 金额:
    $ 15万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-09-01 至 2013-08-31
  • 项目状态:
    已结题

项目摘要

The proposed research is in the general area of "planning under uncertainty." This topic addresses the problem of choosing good actions in situations where actions do not have deterministic outcomes. Applications for this general framework include but are not limited to robotic control, medical decision making, and business optimization. The overarching mathematical framework for this problem is that of decision theory or Markov decision processes, topics that are studied in a wide range of fields, including engineering, economics, operations research and, more recently, artificial intelligence. Recent technical efforts in this area have sought to address large problems by combining successful statistical and machine learning techniques with decision-theoretic reasoning. The underlying insight behind these efforts is that machine learning can generalize across similar states of the world, thereby allowing algorithms to propose good actions for new states of the world without explicitly considering every possible state or outcome, as was required by classical approaches.The combination of classical decision theoretic methods and machine learning has shown great promise for large state spaces, but one aspect that has been under-explored is large action spaces. Large action spaces arise naturally from a fine discretization of a continuous action space or from a large set of discrete choices, such as assignments of firefighters to regions on a map. One way to address the general challenge would be to group actions into sets and use machine learning methods to predict which set is preferred. By doing this multiple times over carefully arranged partitions of the action space, it should possible to achieve an exponential reduction in the effort required to select the best action.Potential applications of this research include robotic control, power grid management, and forest/fire management strategies.
本文的研究方向是“不确定性下的规划”。“本主题讨论在行动没有确定性结果的情况下选择良好行动的问题。 该通用框架的应用包括但不限于机器人控制、医疗决策和业务优化。 这个问题的总体数学框架是决策理论或马尔可夫决策过程,在广泛的领域,包括工程,经济学,运筹学和最近的人工智能研究的主题。 最近在这一领域的技术努力试图通过将成功的统计和机器学习技术与决策理论推理相结合来解决大问题。 这些努力背后的基本见解是,机器学习可以在世界的类似状态中推广,从而允许算法为世界的新状态提出良好的行动,而无需像经典方法所要求的那样明确考虑每一种可能的状态或结果。经典决策理论方法和机器学习的结合已经显示出对大状态空间的巨大希望,但有一个方面还没有得到充分的探索,那就是大的行动空间。 大的行动空间自然产生于连续行动空间的精细离散化或大量离散选择,例如将消防员分配到地图上的区域。 解决这一普遍挑战的一种方法是将动作分组到集合中,并使用机器学习方法来预测哪个集合是首选。 通过这样做多次仔细安排的分区的动作空间,它应该可以实现指数减少所需的努力,以选择最佳的action.Potential应用这项研究包括机器人控制,电网管理,森林/火灾管理策略。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ronald Parr其他文献

Amazing Things Come From Having Many Good Models
令人惊奇的事情来自于拥有许多好的模型
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cynthia Rudin;Chudi Zhong;Lesia Semenova;Margo Seltzer;Ronald Parr;Jiachang Liu;Srikar Katta;Jon Donnelly;Harry Chen;Zachery Boner
  • 通讯作者:
    Zachery Boner
An Optimal Tightness Bound for the Simulation Lemma
模拟引理的最优紧界
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sam Lobel;Ronald Parr
  • 通讯作者:
    Ronald Parr

Ronald Parr的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ronald Parr', 18)}}的其他基金

RI: Small: Feature Encoding for Reinforcement Learning
RI:小型:强化学习的特征编码
  • 批准号:
    1815300
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
EAGER: Collaborative Research: An Unified Learnable Roadmap for Sequential Decision Making in Relational Domains
EAGER:协作研究:关系领域顺序决策的统一可学习路线图
  • 批准号:
    1836575
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
RI: Small: Non-parametric Approximate Dynamic Programming for Continuous Domains
RI:小:连续域的非参数近似动态规划
  • 批准号:
    1218931
  • 财政年份:
    2012
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative: RI: Feature Discovery and Benchmarks for Exportable Reinforcement Learning
协作:RI:可导出强化学习的特征发现和基准
  • 批准号:
    0713435
  • 财政年份:
    2007
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CAREER: Observing to Plan - Planning to Observe
职业生涯:观察到计划 - 计划到观察
  • 批准号:
    0546709
  • 财政年份:
    2006
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Prediction and Planning: Bridging the Gap
预测和规划:弥合差距
  • 批准号:
    0209088
  • 财政年份:
    2002
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant

相似国自然基金

基于IIS/TOR信号途径探究蜂王浆外泌体lncRNA调控西方蜜蜂级型分化的分子机制
  • 批准号:
    32302811
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
IIS/FoxO通路调控Argopecten属扇贝寿命的分子机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    56 万元
  • 项目类别:
    面上项目
IIS/TOR通路调控蜜蜂工蜂生殖发育的分子机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
以IIS通路为中心的Zn2+胁迫对黑水虻幼虫生长影响的氧化应激机制研究
  • 批准号:
    31860618
  • 批准年份:
    2018
  • 资助金额:
    39.0 万元
  • 项目类别:
    地区科学基金项目
基于IIS通路探讨六味地黄丸“三补”药组对AD模型秀丽线虫的神经保护作用
  • 批准号:
    81704132
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: CISE-MSI: DP: IIS RI: Research Capacity Expansion via Development of AI Based Algorithms for Optimal Management of Electric Vehicle Transactions with Grid
合作研究:CISE-MSI:DP:IIS RI:通过开发基于人工智能的算法来扩展研究能力,以实现电动汽车与电网交易的优化管理
  • 批准号:
    2318611
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CISE-MSI: DP: IIS RI: Research Capacity Expansion via Development of AI Based Algorithms for Optimal Management of Electric Vehicle Transactions with Grid
合作研究:CISE-MSI:DP:IIS RI:通过开发基于人工智能的算法来扩展研究能力,以实现电动汽车与电网交易的优化管理
  • 批准号:
    2318612
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: IIS: RI: Medium: Lifelong learning with hyper dimensional computing
协作研究:IIS:RI:中:超维计算的终身学习
  • 批准号:
    2211387
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: IIS: RI: Medium: Lifelong learning with hyper dimensional computing
协作研究:IIS:RI:中:超维计算的终身学习
  • 批准号:
    2211386
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CAREER: IIS: RI: Foundations of Deep Neural Network Robustness and Efficiency
职业:IIS:RI:深度神经网络鲁棒性和效率的基础
  • 批准号:
    2144960
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Career: IIS: RI: Improving Multi-Agent Reinforcement Learning for Cooperative, Partially Observable Settings
职业:IIS:RI:改进合作、部分可观察设置的多智能体强化学习
  • 批准号:
    2044993
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Collaborative Research: CISE-MSI: RCBP-RF: IIS-RI: Analytically-based frameworks for AI model verification and improvement in cyber-physical systems
合作研究:CISE-MSI:RCBP-RF:IIS-RI:基于分析的人工智能模型验证和网络物理系统改进框架
  • 批准号:
    2130990
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CISE-MSI: RCBP-RF: IIS-RI: Analytically-based frameworks for AI model verification and improvement in cyber-physical systems
合作研究:CISE-MSI:RCBP-RF:IIS-RI:基于分析的人工智能模型验证和网络物理系统改进框架
  • 批准号:
    2131001
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
IIS: RI: Travel Proposal: Student Travel Support for the 2019 Association for Computational Linguistics Student Research Workshop
IIS:RI:旅行提案:2019 年计算语言学协会学生研究研讨会的学生旅行支持
  • 批准号:
    1929269
  • 财政年份:
    2019
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
IIS-RI: International Conference on Automated Planning and Scheduling (ICAPS) 2017 Doctoral Consortium Travel Awards
IIS-RI:国际自动化规划与调度会议 (ICAPS) 2017 博士联盟旅行奖
  • 批准号:
    1745800
  • 财政年份:
    2017
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了