RI: Small: High Confidence, Efficient Learning Under Rich Task Specifications

RI:小:丰富任务规格下的高置信度、高效学习

基本信息

  • 批准号:
    1617639
  • 负责人:
  • 金额:
    $ 47万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-01 至 2020-07-31
  • 项目状态:
    已结题

项目摘要

Artificially intelligent machines such as autonomous vehicles and personal robots are poised to contribute in many economic sectors, but cannot be deployed on a large scale without measurable confidence that they will operate correctly. This is especially true for safety-critical systems in which humans could be injured or infrastructure could be damaged by incorrect behavior. The proposed research will address this key issue by developing methods that allow intelligent agents to learn to perform challenging tasks and adapt to new situations, while simultaneously providing strong guarantees of correctness and safety. Once deployed, these future robotic systems will have broad impacts on society ranging from automating small manufacturing to giving new freedom to disabled and elderly populations through safe and personalized in-home care. The proposed robotics applications will additionally create opportunities for interactive educational K-12 programs to encourage interest in STEM areas, as well as undergraduate and graduate education.Towards these goals, the proposed work focuses on three primary research thrusts: 1) We will design safe learning algorithms that provide theoretical probabilistic satisfaction and data efficiency guarantees over both the expected reward of a policy and its correctness with respect to a high-level specification. 2) In order to account for the gap between theoretical and practical efficiency in learning, we will develop model-based and model-free off-policy evaluation methods that leverage active sampling strategies and bootstrapping to achieve practical efficiency. 3) We will develop hybrid techniques that combine and amplify the advantages of both strong theoretical and efficient practical guarantees. The merit of the proposed algorithms will be systematically evaluated on complex, real-world problems in robotic reconfigurable manufacturing that require learning optimized, yet safe policies with a high degree of confidence in settings with low-to-medium quantities of available data.
自动驾驶汽车和个人机器人等智能机器有望在许多经济领域做出贡献,但如果没有对它们正确运行的可衡量信心,就无法大规模部署。 对于安全关键系统尤其如此,在这些系统中,人员可能会受伤,或者基础设施可能会因不正确的行为而损坏。 拟议的研究将通过开发方法来解决这一关键问题,这些方法允许智能代理学习执行具有挑战性的任务并适应新的情况,同时提供正确性和安全性的强有力保证。 一旦部署,这些未来的机器人系统将对社会产生广泛的影响,从小型制造自动化到通过安全和个性化的家庭护理为残疾人和老年人提供新的自由。 拟议的机器人应用将为互动教育K-12计划创造机会,以鼓励对STEM领域的兴趣,以及本科和研究生教育。为了实现这些目标,拟议的工作侧重于三个主要研究方向:第一章我们将设计安全的学习算法,提供理论上的概率满意度和数据效率保证,超过预期的回报的政策和它的对于高级规范的正确性。2)为了解释学习中理论和实践效率之间的差距,我们将开发基于模型和无模型的政策外评估方法,利用主动采样策略和自举来实现实际效率。3)我们将开发联合收割机的混合技术,并放大强大的理论和有效的实践保证的优势。 所提出的算法的优点将在机器人可重构制造中的复杂的现实问题上进行系统评估,这些问题需要学习优化,但在具有低到中等数量可用数据的设置中具有高度置信度的安全策略。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Bayesian Robust Optimization for Imitation Learning
  • DOI:
  • 发表时间:
    2020-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel S. Brown;S. Niekum;Marek Petrik
  • 通讯作者:
    Daniel S. Brown;S. Niekum;Marek Petrik
Human Gaze Assisted Artificial Intelligence: A Review
  • DOI:
    10.24963/ijcai.2020/689
  • 发表时间:
    2020-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ruohan Zhang;Akanksha Saran;Bo Liu-;Yifeng Zhu;Sihang Guo;S. Niekum;D. Ballard;M. Hayhoe
  • 通讯作者:
    Ruohan Zhang;Akanksha Saran;Bo Liu-;Yifeng Zhu;Sihang Guo;S. Niekum;D. Ballard;M. Hayhoe
Machine Teaching for Inverse Reinforcement Learning: Algorithms and Applications
  • DOI:
    10.1609/aaai.v33i01.33017749
  • 发表时间:
    2018-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel S. Brown;S. Niekum
  • 通讯作者:
    Daniel S. Brown;S. Niekum
Risk-Aware Active Inverse Reinforcement Learning
风险意识主动逆强化学习
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Brown, Daniel;Cui, Yuchen;Niekum, Scott
  • 通讯作者:
    Niekum, Scott
Extrapolating Beyond Suboptimal Demonstrations via Inverse Reinforcement Learning from Observations
  • DOI:
  • 发表时间:
    2019-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel S. Brown;Wonjoon Goo;P. Nagarajan;S. Niekum
  • 通讯作者:
    Daniel S. Brown;Wonjoon Goo;P. Nagarajan;S. Niekum
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Scott Niekum其他文献

Scott Niekum的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Scott Niekum', 18)}}的其他基金

CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World
职业:安全高效的机器人从现实世界的演示中学习
  • 批准号:
    2323384
  • 财政年份:
    2023
  • 资助金额:
    $ 47万
  • 项目类别:
    Continuing Grant
CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World
职业:安全高效的机器人从现实世界的演示中学习
  • 批准号:
    1749204
  • 财政年份:
    2018
  • 资助金额:
    $ 47万
  • 项目类别:
    Continuing Grant
S&AS: INT: Socially-Aware Autonomy for Long-Term Deployment of Always-On Heterogeneous Robot Teams
S
  • 批准号:
    1724157
  • 财政年份:
    2017
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant
NRI: Collaborative Research: Scalable Robot Autonomy through Remote Operator Assistance and Lifelong Learning
NRI:协作研究:通过远程操作员协助和终身学习实现可扩展的机器人自主性
  • 批准号:
    1638107
  • 财政年份:
    2016
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
  • 批准号:
    10099896
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
  • 批准号:
    AH/X011747/1
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
  • 批准号:
    MR/Z503757/1
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
  • 批准号:
    BB/Y004426/1
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
  • 批准号:
    ST/Z000017/1
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
  • 批准号:
    2317251
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了