RI: Small: Speedup Learning for Online Planning Under Uncertainty

RI:小:加速不确定性下在线规划的学习

基本信息

  • 批准号:
    1619433
  • 负责人:
  • 金额:
    $ 45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-09-01 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Many complex stochastic planning domains such as logistics,emergency response, resilient power grids, and robotics require theability to make high-quality decisions under tight timeconstraints. This project addresses the need for high-quality, butcomputationally efficient, decision making via new theory andalgorithms for speedup learning, which will enable planners tolearn to speedup their performance based on prior planningexperience. This speedup-learning approach is loosely inspired bythe fact that humans routinely learn to speedup their reasoningprocesses with experience, without sacrificing decision quality.Similarly, through speedup learning, an inefficient planner thatproduces high-quality decisions will be transformed into a muchfaster planner with little loss in decision quality.The project involves advancing speedup learning for online planningunder uncertainty on four fronts. First, the speedup-learningproblem is formalized by introducing the canonical problem ofPrimitive Speedup Learning (PSL) and studying how PSL can be usedto solve various speedup objectives. Second, a novel onlineplanning framework, which subsumes many existing frameworks andenables many potential speedup opportunities, is being designed anddeveloped. Third, the project is producing new speedup learningalgorithms for the new framework, which learn various types ofknowledge and that can exploit deep neural network (DNN)techniques. Finally, the research is producing extensive empiricalevaluations including applications to the important problems ofpower grid control, municipal emergency response, and benchmarkplanning domains. The project has the potential for significant broader impact onapplications where time-sensitive decisions must be made withinstochastic environments. It will directly contribute to advances intwo applications in particular: remedial action control inelectrical grids to minimize cascading power outages, and planningfor municipal emergencies such as fire and rescue operations incities. The project will also serve to advance graduate educationthrough research assistantships and undergraduate education throughsummer and academic term research experiences for undergraduates. Aspecial topics graduate course will be taught on the area ofplanning and learning at Oregon State University and all coursematerials will be open access.
许多复杂的随机规划领域,如物流、应急响应、弹性电网和机器人,都需要在严格的时间限制下做出高质量决策的能力。该项目通过加速学习的新理论和算法解决了对高质量、但计算效率高的决策制定的需求,这将使规划者能够根据先前的规划经验学习加速他们的绩效。这种加速学习方法的灵感来自于这样一个事实,即人类通常会通过经验来学习加速他们的推理过程,而不会牺牲决策质量。同样,通过加速学习,一个低效的计划者产生高质量的决策,将转变为一个更快的计划者,决策质量几乎没有损失。该项目涉及在四个方面的不确定性下推进在线规划的加速学习。首先,通过引入原始加速学习(PSL)的规范问题来形式化加速学习问题,并研究如何使用PSL来解决各种加速目标。第二,正在设计和开发一种新的在线规划框架,它包含了许多现有的框架,并实现了许多潜在的加速机会。第三,该项目正在为新框架生成新的加速学习算法,这些算法可以学习各种类型的知识,并可以利用深度神经网络(DNN)技术。最后,该研究正在产生广泛的经验评估,包括在电网控制、市政应急响应和基准规划领域的重要问题上的应用。该项目有可能对必须在随机环境中做出时间敏感决策的应用产生重大而广泛的影响。它将直接促进两个应用领域的进步:电网的补救行动控制,以最大限度地减少级联停电,以及城市消防和救援行动等市政紧急情况的规划。该项目还将通过研究助学金促进研究生教育,并通过夏季和学期的本科生研究经验促进本科教育。专题研究生课程将在俄勒冈州立大学的规划和学习领域教授,所有课程材料将开放获取。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Choice Function Framework for Online Policy Improvement
在线政策改进的选择函数框架
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Alan Fern其他文献

Robust Learning for Adaptive Programs by Leveraging Program Structure
利用程序结构实现自适应程序的稳健学习
Learning and transferring roles in multi-agent MDPs
多智能体 MDP 中的学习和角色转移
The Origins of Common Sense in Humans and Machines
人类和机器常识的起源
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kevin A. Smith;Eliza Kosoy;A. Gopnik;Deepak Pathak;Alan Fern;J. Tenenbaum;T. Ullman
  • 通讯作者:
    T. Ullman
Active Imitation Learning via State Queries
通过状态查询进行主动模仿学习
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kshitij Judah;Alan Fern
  • 通讯作者:
    Alan Fern
Special report: The AgAID AI institute for transforming workforce and decision support in agriculture
  • DOI:
    10.1016/j.compag.2022.106944
  • 发表时间:
    2022-06-01
  • 期刊:
  • 影响因子:
  • 作者:
    Ananth Kalyanaraman;Margaret Burnett;Alan Fern;Lav Khot;Joshua Viers
  • 通讯作者:
    Joshua Viers

Alan Fern的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Alan Fern', 18)}}的其他基金

Collaborative Research: CISE: Large: Executing Natural Instructions in Realistic Uncertain Worlds
合作研究:CISE:大型:在现实的不确定世界中执行自然指令
  • 批准号:
    2321851
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Student Support for the 2020 International Conference on Automated Planning and Scheduling
2020 年自动规划与调度国际会议的学生支持
  • 批准号:
    2017913
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
S&AS:INT:Learning and Planning for Dynamic Locomotion
S
  • 批准号:
    1849343
  • 财政年份:
    2019
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
II-EN: Software Tools for Monte-Carlo Optimization
II-EN:蒙特卡罗优化软件工具
  • 批准号:
    1406049
  • 财政年份:
    2014
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
RI: Small: Automated Planning of Experiments for Design Optimization
RI:小型:自动规划实验以优化设计
  • 批准号:
    1320943
  • 财政年份:
    2013
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Student Poster Program and Travel Scholarships for International Conference on Machine Learning (ICML) 2010; Haifa, Israel
2010 年国际机器学习会议 (ICML) 学生海报计划和旅行奖学金;
  • 批准号:
    1031917
  • 财政年份:
    2010
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Solving Stochastic Planning Problems Through Principled Determinization
RI:媒介:协作研究:通过原则确定解决随机规划问题
  • 批准号:
    0905678
  • 财政年份:
    2009
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Adaptation-Based Programming
基于适应的编程
  • 批准号:
    0820286
  • 财政年份:
    2008
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CAREER: Penalty Logic for Structured Machine Learning
职业:结构化机器学习的惩罚逻辑
  • 批准号:
    0546867
  • 财政年份:
    2006
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
  • 批准号:
    2342833
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
  • 批准号:
    2343062
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
  • 批准号:
    24K13443
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了