RI:Small:Collaborative Research:Scalable Decentralized Planning for Open Multiagent Environments

RI:小型:协作研究:开放多代理环境的可扩展去中心化规划

基本信息

项目摘要

Automated planning is about finding a sequence of actions that is anticipated to successfully complete the task at hand or maximize earned rewards. Planning becomes difficult when the outcomes of actions are uncertain. It is further complicated in the presence of other agents whose actions also affect the environment and reward outcomes. While both these challenges have received much attention from researchers, real-world contexts often exhibit another property -- that of agent and task openness. Agent openness comes about when agents exit the environment, resume, or new agents enter, and task openness occurs when the tasks that agents must complete change with new tasks appearing and some disappearing. Such openness complicates the planning process as agents now need to optimally consider, for example, the possibilities of existing teammates leaving the environment or a successfully rewarding task disappearing from the environment. The research is systematically generalizing automated planning to consider these new and practical challenges while still keeping the methods computationally feasible. This research involves investigators at Oberlin College (a primarily undergraduate institution), Universities of Nebraska and Georgia collaborating closely to develop methods for planning in open multi-agent systems and demonstrating them in domains such as wildfire suppression, dynamic ridesharing, and others that exhibit openness. The principal investigators are using the outcomes of this research to inform their classroom instructions, and artificial intelligence camps for elementary and middle school students are planned at Oberlin.The technical approach involves gaining a fundamental understanding of the impact of agent and task openness on the environment, and utilizing this understanding to develop and learn stochastic models that represent the openness. These models are being used to build new algorithms for tractable agent-level planning in such contexts. The methods will exploit system-level properties such as agent anonymity and statistical population sampling that allows modeling large populations from small samples, which has been successful in the social sciences to make the approaches scalable to many agents. This research is advancing our understanding of how intelligent agents should perform scalable, decentralized planning in complex environments, and developing a framework--with empirical results and insights--that could lead to more robust intelligence for personal assistant agents for human-agent interactions, robots, and autonomous vehicles, where the agents reason about challenging environmental dynamics as the actors and their tasks change over time.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
自动计划是关于找到一系列预期的行动,以成功完成手头的任务或最大化获得的奖励。当行动的结果不确定时,计划就会变得困难。如果存在其他行为者,其行为也会影响环境和奖励结果,则情况会更加复杂。虽然这两个挑战都受到了研究人员的广泛关注,但现实世界的背景往往表现出另一种特性——代理和任务的开放性。Agent开放性发生在Agent退出环境、恢复或新Agent进入时,任务开放性发生在Agent必须完成的任务发生变化,出现新任务和消失新任务时。这种开放性使规划过程变得复杂,因为智能体现在需要最优地考虑,例如,现有队友离开环境的可能性,或者成功奖励任务从环境中消失的可能性。该研究系统地推广自动化规划,以考虑这些新的和实际的挑战,同时仍然保持方法的计算可行性。这项研究涉及Oberlin学院(主要是本科生机构)、内布拉斯加州大学和乔治亚州大学的研究人员,他们密切合作,开发开放多智能体系统的规划方法,并在野火扑灭、动态拼车和其他展示开放性的领域进行演示。主要研究人员正在利用这项研究的成果来指导他们的课堂教学,奥柏林大学计划为中小学生开设人工智能营地。技术方法包括获得对代理和任务开放性对环境的影响的基本理解,并利用这种理解来开发和学习代表开放性的随机模型。这些模型被用于在这种环境中构建可处理的代理级规划的新算法。这些方法将利用系统级属性,如代理匿名性和统计总体抽样,允许从小样本中建模大群体,这在社会科学中已经成功地使方法可扩展到许多代理。这项研究促进了我们对智能代理如何在复杂环境中执行可扩展的、分散的规划的理解,并开发了一个框架——具有经验结果和见解——这可能会为人类代理交互、机器人和自动驾驶汽车的个人助理代理带来更强大的智能,其中代理会随着参与者及其任务随时间的变化而挑战环境动态。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Scalable Decision-Theoretic Planning in Open and Typed Multiagent Systems
  • DOI:
    10.1609/aaai.v34i05.6200
  • 发表时间:
    2019-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Eck;Maulik Shah;Prashant Doshi;Leen-Kiat Soh
  • 通讯作者:
    A. Eck;Maulik Shah;Prashant Doshi;Leen-Kiat Soh
Decision-theoretic planning with communication in open multiagent systems
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Anirudh Kakarlapudi;Gayathri Anil;A. Eck;Prashant Doshi;Leen-Kiat Soh
  • 通讯作者:
    Anirudh Kakarlapudi;Gayathri Anil;A. Eck;Prashant Doshi;Leen-Kiat Soh
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Prashant Doshi其他文献

Multi-robot inverse reinforcement learning under occlusion with estimation of state transitions
遮挡下多机器人逆强化学习及状态转换估计
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    14.4
  • 作者:
    K. Bogert;Prashant Doshi
  • 通讯作者:
    Prashant Doshi
Individual Planning in Open and Typed Agent Systems
开放式和类型化代理系统中的个体规划
A Particle Filtering Algorithm for Interactive POMDPs
交互式 POMDP 的粒子过滤算法
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Prashant Doshi;P. Gmytrasiewicz
  • 通讯作者:
    P. Gmytrasiewicz
SA-Net: Deep Neural Network for Robot Trajectory Recognition from RGB-D Streams
SA-Net:用于 RGB-D 流机器人轨迹识别的深度神经网络
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nihal Soans;Yi Hong;Prashant Doshi
  • 通讯作者:
    Prashant Doshi
ǫ-Subjective Equivalence of Models for Interactive Dynamic Influence Diagrams
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Prashant Doshi
  • 通讯作者:
    Prashant Doshi

Prashant Doshi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Prashant Doshi', 18)}}的其他基金

Collaborative Research: RI: Medium: RUI: Automated Decision Making for Open Multiagent Systems
协作研究:RI:中:RUI:开放多智能体系统的自动决策
  • 批准号:
    2312657
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
NRI: FND: Robust Inverse Learning for Human-Robot Collaboration
NRI:FND:人机协作的鲁棒逆向学习
  • 批准号:
    1830421
  • 财政年份:
    2018
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
RI:Small:Tractable Decision-Theoretic Planning Driven by Data
RI:小:数据驱动的易于处理的决策理论规划
  • 批准号:
    1815598
  • 财政年份:
    2018
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
RAPID: Evacuate or Not? Modeling the Decision Making of Individuals in Impending Disaster Areas
RAPID:疏散还是不疏散?
  • 批准号:
    1761549
  • 财政年份:
    2017
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
CNIC: U.S.-Netherlands Planning Visit for Cooperative Research on Intelligent Methods Under Uncertainty for Renewable Energy Driven Smart Grids
CNIC:美国-荷兰计划访问可再生能源驱动智能电网不确定性下的智能方法合作研究
  • 批准号:
    1444182
  • 财政年份:
    2015
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
EAGER: Decision-Theoretic and Scalable Algorithms for Computing Finite State Equilibrium
EAGER:用于计算有限状态平衡的决策理论和可扩展算法
  • 批准号:
    1346942
  • 财政年份:
    2013
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
CAREER: Scalable Algorithms for Individual Decision Making in Multiagent Settings
职业:多智能体环境中个人决策的可扩展算法
  • 批准号:
    0845036
  • 财政年份:
    2009
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232055
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232054
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232300
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232299
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313130
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: Evolutionary Approach to Optimal Morphology and Control of Transformable Soft Robots
RI:小型:协作研究:可变形软机器人的最佳形态和控制的进化方法
  • 批准号:
    2325491
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2334936
  • 财政年份:
    2023
  • 资助金额:
    $ 14.55万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了