CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World

职业:安全高效的机器人从现实世界的演示中学习

基本信息

  • 批准号:
    2323384
  • 负责人:
  • 金额:
    $ 52.46万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-01-01 至 2025-05-31
  • 项目状态:
    未结题

项目摘要

General purpose robots are poised to enter the home and workplace in unprecedented numbers in coming years, but face the significant challenge of customization - the ability to perform user-specified tasks in many different unstructured environments. In response to this need, robot learning from demonstration (LfD) has emerged as a paradigm that allows users to quickly and naturally program robots by simply showing them how to perform a task, rather than by writing code. This methodology aims to allow non-expert users to program robots, as well as communicate embodied knowledge that is difficult to translate into formal code. However, current state-of-the-art LfD algorithms are not yet ready for widespread deployment, as they are often unreliable, need too much data, and are designed to learn in a single session in a laboratory setting. This work addresses these issues to help enable future robots to perform important tasks ranging from in-home elderly care to reconfigurable manufacturing.Specifically, this work identifies three significant technical improvements to current LfD algorithms that are needed before they can be deployed in the real world: the need for safety guarantees, the ability to learn from very limited amounts of data, and the ability to continually improve in an ongoing, life-long fashion. A formal theory of safe LfD is developed, along with practical algorithms that provide strong probabilistic lower bounds on agent performance. Algorithmic efficiency is addressed via a re-examining of common statistical assumptions (such as independent and identically distributed data) and through the use of multimodal side-information, such as natural language and gaze. Finally, active learning strategies and modeling of human beliefs are used to enable interactive, continual learning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
未来几年,通用机器人将以前所未有的数量进入家庭和工作场所,但面临着定制的重大挑战--在许多不同的非结构化环境中执行用户指定任务的能力。为了满足这一需求,机器人从演示中学习(LfD)已经成为一种范式,允许用户通过简单地向机器人展示如何执行任务而不是编写代码来快速自然地对机器人进行编程。这种方法的目的是允许非专家用户编程机器人,以及沟通的具体知识,是很难转化为正式的代码。然而,目前最先进的LfD算法还没有准备好广泛部署,因为它们通常不可靠,需要太多的数据,并且被设计为在实验室环境中的单个会话中学习。 这项工作解决了这些问题,以帮助未来的机器人能够执行从家庭老人护理到可重构制造等重要任务。具体来说,这项工作确定了当前LfD算法的三项重大技术改进,这些改进是在真实的世界中部署之前所需要的:对安全保障的需求,从非常有限的数据中学习的能力,以及以持续的终身方式不断改进的能力。 一个正式的理论安全LfD开发,沿着与实用的算法,提供强大的概率下限代理性能。 通过重新检查常见的统计假设(如独立和相同分布的数据),并通过使用多模态边信息,如自然语言和凝视,解决了数学效率。 最后,积极的学习策略和人类信仰的建模被用来实现互动,持续的学习。这个奖项反映了NSF的法定使命,并已被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Ranking Game for Imitation Learning
  • DOI:
  • 发表时间:
    2022-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Harshit S. Sikchi;Akanksha Saran;Wonjoon Goo;S. Niekum
  • 通讯作者:
    Harshit S. Sikchi;Akanksha Saran;Wonjoon Goo;S. Niekum
Learning Optimal Advantage from Preferences and Mistaking it for Reward
  • DOI:
    10.48550/arxiv.2310.02456
  • 发表时间:
    2023-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    W. B. Knox;Stephane Hatgis-Kessell;Sigurdur O. Adalgeirsson;Serena Booth;Anca D. Dragan;Peter Stone;S. Niekum
  • 通讯作者:
    W. B. Knox;Stephane Hatgis-Kessell;Sigurdur O. Adalgeirsson;Serena Booth;Anca D. Dragan;Peter Stone;S. Niekum
Score Models for Offline Goal-Conditioned Reinforcement Learning
离线目标条件强化学习的评分模型
Understanding Acoustic Patterns of Human Teachers Demonstrating Manipulation Tasks to Robots
了解人类教师向机器人演示操作任务的声学模式
Models of human preference for learning reward functions
  • DOI:
    10.48550/arxiv.2206.02231
  • 发表时间:
    2022-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    W. B. Knox;Stephane Hatgis-Kessell;S. Booth;S. Niekum;P. Stone;A. Allievi
  • 通讯作者:
    W. B. Knox;Stephane Hatgis-Kessell;S. Booth;S. Niekum;P. Stone;A. Allievi
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Scott Niekum其他文献

Scott Niekum的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Scott Niekum', 18)}}的其他基金

CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World
职业:安全高效的机器人从现实世界的演示中学习
  • 批准号:
    1749204
  • 财政年份:
    2018
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Continuing Grant
S&AS: INT: Socially-Aware Autonomy for Long-Term Deployment of Always-On Heterogeneous Robot Teams
S
  • 批准号:
    1724157
  • 财政年份:
    2017
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Standard Grant
NRI: Collaborative Research: Scalable Robot Autonomy through Remote Operator Assistance and Lifelong Learning
NRI:协作研究:通过远程操作员协助和终身学习实现可扩展的机器人自主性
  • 批准号:
    1638107
  • 财政年份:
    2016
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Standard Grant
RI: Small: High Confidence, Efficient Learning Under Rich Task Specifications
RI:小:丰富任务规格下的高置信度、高效学习
  • 批准号:
    1617639
  • 财政年份:
    2016
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Standard Grant

相似国自然基金

叶绿体蛋白SAFE1和SAFE2介导单线态氧信号转导的机理研究
  • 批准号:
    32170284
  • 批准年份:
    2021
  • 资助金额:
    60 万元
  • 项目类别:
    面上项目
基于Safe screening的多任务稀疏学习理论与算法的研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
醛糖还原酶(AR)激活SAFE(JAKs/STATs)通路在抵抗下颌下腺缺血再灌注损伤中的作用
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
基于Safe screening 的支持向量机的稀疏理论及其快速求解方法
  • 批准号:
    11671010
  • 批准年份:
    2016
  • 资助金额:
    48.0 万元
  • 项目类别:
    面上项目
Notch1与RISK/SAFE/HIF-1α信号通路整合在I-postC保护中的作用及其机制
  • 批准号:
    81260024
  • 批准年份:
    2012
  • 资助金额:
    50.0 万元
  • 项目类别:
    地区科学基金项目
氙气延迟后处理对兔脊髓缺血再灌注损伤的保护作用及SAFE细胞信号机制研究
  • 批准号:
    81271387
  • 批准年份:
    2012
  • 资助金额:
    70.0 万元
  • 项目类别:
    面上项目

相似海外基金

A real-time traffic signal system for safe and efficient intersections
实时交通信号系统,确保安全高效的十字路口
  • 批准号:
    LP220100226
  • 财政年份:
    2024
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Linkage Projects
CAREER: Intelligent Battery Management with Safe, Efficient, Fast-Adaption Reinforcement Learning and Physics-Inspired Machine Learning: From Cells to Packs
职业:具有安全、高效、快速适应的强化学习和物理启发机器学习的智能电池管理:从电池到电池组
  • 批准号:
    2340194
  • 财政年份:
    2024
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Continuing Grant
Safe and efficient eco-driving using connected and automated vehicles
使用联网和自动驾驶车辆实现安全高效的生态驾驶
  • 批准号:
    DP240102189
  • 财政年份:
    2024
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Discovery Projects
Transferring Pharmacists' Safe and Efficient Dispensing Know-How: Identifying Reasons for Success of Proficient Pharmacists Based on Eye Gaze Measurement.
传授药剂师安全高效的配药知识:基于眼睛注视测量确定熟练药剂师成功的原因。
  • 批准号:
    23K04309
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Data-efficient Safe Control with Recovery-to-Optimality Guarantees
数据高效的安全控制,并保证恢复最佳性
  • 批准号:
    2227311
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Standard Grant
SAFeCRAFT: Safe and Efficient Use of Sustainable Fuels in Maritime Transport Applications
SAFeCRAFT:在海上运输应用中安全高效地使用可持续燃料
  • 批准号:
    10110519
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    EU-Funded
Safe and Efficient Marine Transportation of Liquid Hydrogen
安全高效的液氢海上运输
  • 批准号:
    10070575
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    EU-Funded
CPS: SMALL: Formal Methods for Safe, Efficient, and Transferable Learning-enabled Autonomy
CPS:SMALL:安全、高效和可迁移的学习自主的正式方法
  • 批准号:
    2231257
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Standard Grant
A Safe and Efficient Framework to Continuous Integration through Repaying Self-Admitted Technical Debt in Software Development
通过偿还软件开发中自我承认的技术债务来实现持续集成的安全高效的框架
  • 批准号:
    23KJ1589
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Safe and Efficient Marine Transportation of Liquid Hydrogen
安全高效的液氢海上运输
  • 批准号:
    10082044
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    EU-Funded
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了