RI:Small:Tractable Decision-Theoretic Planning Driven by Data

RI:小:数据驱动的易于处理的决策理论规划

基本信息

项目摘要

Automated planning is about finding a sequence of actions that is expected to successfully complete the task at hand. Decision-theoretic planning approaches automated planning as a sequence of decisions, each of which optimizes the planner's combined immediate and longer-term preferences. This approach to automated planning allows for realistic actions whose outcomes are often uncertain and reasons with the planner's possibly inexact preferences in addition to precise goals. However, decision-theoretic planning relies on an accurate specification of the planning problem, which is often impractical and is computationally very costly. This research is addressing these challenges by investigating a new and meaningful planning problem representation that is learned directly from data, which alleviates the need for tedious specifications. The representation is designed to yield more efficient computation of solutions. Consequently, this research has the potential to transition automated planning to large pragmatic applications, such as in flow routing in high-density computer networks, which will be demonstrated in this project. The project will train graduate students for entering the workforce in an important area of artificial intelligence, and it will facilitate an international research collaboration between researchers in US and Canada. The PI will use the outcomes of this research to inform his classroom instruction, which will provide students with exposure to how automated planning can be useful to the society. The technical approach is merging two threads of previous progress toward developing a new graphical model called the dynamic sum-product-max network. In these previous threads, the PI generalized sum-product networks, which allow efficient probabilistic inference, in two directions. First, along the temporal dimension thereby allowing inference over a sequence of variables, and second, enabling efficient non-sequential decision making by including decision and utility variables. This research is reconciling the fundamental hardness of decision-theoretic planning with the efficiency of dynamic sum-product-max networks by studying which class of planning problems can be compactly represented by the new model. As these models can be directly learned from data, the research is also establishing the appropriate schema for the data and creating an evaluation testbed of datasets. A final thrust is developing a portfolio of methods for automatically learning both the structure and parameters of dynamic sum-product-max networks from appropriate data, with a focus on learning valid models. The research plan is expected to yield a new graphical representation and associated methods that allow efficient data-driven planning whose utility will be demonstrated by real-world applications in collaboration with industry.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
自动规划是关于找到一系列预期成功完成手头任务的行动。决策理论规划将自动规划作为一系列决策,每一个决策都优化了规划者的短期和长期偏好。这种自动规划的方法允许现实的行动,其结果往往是不确定的,除了精确的目标外,还可以根据规划者可能不精确的偏好进行推理。然而,决策理论规划依赖于规划问题的准确规范,这通常是不切实际的,并且计算成本非常高。本研究通过调查一种新的和有意义的规划问题表示来解决这些挑战,该问题表示直接从数据中学习,这表明需要繁琐的规范。该表示被设计为产生更有效的解决方案的计算。因此,这项研究有可能将自动规划过渡到大型实用应用中,例如在高密度计算机网络中的流量路由,这将在本项目中得到证明。该项目将培训研究生进入人工智能的一个重要领域的劳动力,并将促进美国和加拿大研究人员之间的国际研究合作。PI将使用这项研究的结果来通知他的课堂教学,这将为学生提供如何接触自动规划可以对社会有用。 技术方法是将以前的两个进展合并起来,开发一个新的图形模型,称为动态和积最大网络。在这些之前的线程中,PI广义和积网络允许在两个方向上进行有效的概率推理。首先,沿着时间维度,从而允许对一系列变量的推断,其次,通过包括决策和效用变量来实现有效的非顺序决策。本研究是调和的基本困难的决策理论规划与动态和-积-最大网络的效率,通过研究哪一类规划问题可以compensitively表示的新模型。由于这些模型可以直接从数据中学习,因此研究还为数据建立了适当的模式,并创建了数据集的评估测试平台。最后一个推力是开发一系列方法,用于从适当的数据中自动学习动态和积最大网络的结构和参数,重点是学习有效的模型。该研究计划预计将产生一个新的图形表示和相关的方法,允许有效的数据驱动的规划,其效用将通过与工业界合作的实际应用证明。该奖项反映了NSF的法定使命,并已被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Anytime Learning of Sum-Product and Sum-Product-Max Networks
随时学习 Sum-Product 和 Sum-Product-Max 网络
Data-Driven Decision-Theoretic Planning using Recurrent Sum-Product-Max Networks
使用循环和积最大网络的数据驱动决策理论规划
State-Based Recurrent SPMNs for Decision-Theoretic Planning under Partial Observability
部分可观测性下决策理论规划的基于状态的循环 SPMN
Online Structure Learning for Feed-Forward and Recurrent Sum-Product Networks
前馈和循环和积网络的在线结构学习
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Prashant Doshi其他文献

Multi-robot inverse reinforcement learning under occlusion with estimation of state transitions
遮挡下多机器人逆强化学习及状态转换估计
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    14.4
  • 作者:
    K. Bogert;Prashant Doshi
  • 通讯作者:
    Prashant Doshi
Individual Planning in Open and Typed Agent Systems
开放式和类型化代理系统中的个体规划
A Particle Filtering Algorithm for Interactive POMDPs
交互式 POMDP 的粒子过滤算法
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Prashant Doshi;P. Gmytrasiewicz
  • 通讯作者:
    P. Gmytrasiewicz
SA-Net: Deep Neural Network for Robot Trajectory Recognition from RGB-D Streams
SA-Net:用于 RGB-D 流机器人轨迹识别的深度神经网络
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nihal Soans;Yi Hong;Prashant Doshi
  • 通讯作者:
    Prashant Doshi
ǫ-Subjective Equivalence of Models for Interactive Dynamic Influence Diagrams
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Prashant Doshi
  • 通讯作者:
    Prashant Doshi

Prashant Doshi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Prashant Doshi', 18)}}的其他基金

Collaborative Research: RI: Medium: RUI: Automated Decision Making for Open Multiagent Systems
协作研究:RI:中:RUI:开放多智能体系统的自动决策
  • 批准号:
    2312657
  • 财政年份:
    2023
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
RI:Small:Collaborative Research:Scalable Decentralized Planning for Open Multiagent Environments
RI:小型:协作研究:开放多代理环境的可扩展去中心化规划
  • 批准号:
    1910037
  • 财政年份:
    2019
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
NRI: FND: Robust Inverse Learning for Human-Robot Collaboration
NRI:FND:人机协作的鲁棒逆向学习
  • 批准号:
    1830421
  • 财政年份:
    2018
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
RAPID: Evacuate or Not? Modeling the Decision Making of Individuals in Impending Disaster Areas
RAPID:疏散还是不疏散?
  • 批准号:
    1761549
  • 财政年份:
    2017
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
CNIC: U.S.-Netherlands Planning Visit for Cooperative Research on Intelligent Methods Under Uncertainty for Renewable Energy Driven Smart Grids
CNIC:美国-荷兰计划访问可再生能源驱动智能电网不确定性下的智能方法合作研究
  • 批准号:
    1444182
  • 财政年份:
    2015
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
EAGER: Decision-Theoretic and Scalable Algorithms for Computing Finite State Equilibrium
EAGER:用于计算有限状态平衡的决策理论和可扩展算法
  • 批准号:
    1346942
  • 财政年份:
    2013
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
CAREER: Scalable Algorithms for Individual Decision Making in Multiagent Settings
职业:多智能体环境中个人决策的可扩展算法
  • 批准号:
    0845036
  • 财政年份:
    2009
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
  • 批准号:
    2342833
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
  • 批准号:
    2343062
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
  • 批准号:
    24K13443
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 46.65万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了