RI: Small: Robot Developmental Learning of Skilled Actions

RI:小:机器人技能动作的发展学习

基本信息

项目摘要

The goal of this project is to show how a robot --- using a continuous stream of visual and tactile data --- can learn to work at a human level of skill in tasks normally done by humans. To function at a human level, it must be able to plan with "object-level" abstractions such as putting a red block into the box, and it must also be able to grasp objects and move them while avoiding bumping into things and causing damage to its surroundings. This project is inspired by human cognitive development. A baby learns about objects and actions by bootstrapping from early regularities and unreliable actions to hierarchies of more complex and reliable actions. The hypothesis to be tested is that this bootstrap learning approach allows a robot to achieve human levels of skillful and robust action in a wide range of human-dominated environments.This project draws on extensive prior work on foundational knowledge representations and machine learning. Learning begins by detecting low-level contingencies --- regularities among observed events --- and refining them into increasingly accurate predictive rules, that can be used to define reliable actions. For a given rule, a simple MDP model is formulated, and reinforcement learning methods learn a policy for accomplishing an action at the next level of the action hierarchy. Learned actions are initially unreliable, but policies and actions improve with experience. Attention is focused where learning is likely to be most productive by intrinsic motivation methods that reward actions that result in successful learning, including the important special case of rewarding attempts to imitate the successful actions of other agents.
这个项目的目标是展示一个机器人-使用一个连续的视觉和触觉数据流-如何学习在人类技能水平上工作,这些任务通常由人类完成。 要在人类层面上发挥作用,它必须能够使用“对象级别”的抽象进行规划,例如将红色块放入盒子中,并且还必须能够抓住物体并移动它们,同时避免撞到东西并对周围环境造成损害。 这个项目受到人类认知发展的启发。 一个婴儿通过从早期的不可靠和不可靠的动作到更复杂和可靠的动作层次的引导来学习物体和动作。 要测试的假设是,这种自举学习方法允许机器人在广泛的人类主导的环境中实现人类水平的熟练和鲁棒的动作。 学习从检测低水平的偶然事件开始--观察到的事件中的偶然事件--并将它们提炼成越来越准确的预测规则,这些规则可用于定义可靠的行动。 对于给定的规则,制定一个简单的MDP模型,强化学习方法学习一个策略,用于在动作层次结构的下一级完成动作。 学习的行动最初是不可靠的,但政策和行动会随着经验而改进。 注意力集中在学习可能是最富有成效的内在激励方法,奖励行动,导致成功的学习,包括奖励尝试模仿其他代理人的成功行动的重要特殊情况。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Benjamin Kuipers其他文献

Cognitive Maps for Planetary Rovers
  • DOI:
    10.1023/a:1012463728877
  • 发表时间:
    2001-11-01
  • 期刊:
  • 影响因子:
    4.300
  • 作者:
    Benjamin Kuipers
  • 通讯作者:
    Benjamin Kuipers
VIRTUAL ROUNDTABLE
虚拟圆桌会议
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    P. Koopman;Benjamin Kuipers;William H. Widen;Marilyn Wolf
  • 通讯作者:
    Marilyn Wolf
Dealing with uncertainty, risks, and tradeoffs in clinical decisions. A cognitive science approach.
处理临床决策中的不确定性、风险和权衡。
  • DOI:
    10.7326/0003-4819-108-3-435
  • 发表时间:
    1988
  • 期刊:
  • 影响因子:
    39.2
  • 作者:
    Alan J. Moskowitz;Benjamin Kuipers;J. P. Kassirer
  • 通讯作者:
    J. P. Kassirer

Benjamin Kuipers的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Benjamin Kuipers', 18)}}的其他基金

EAGER: Memory-based learning of effective actions
EAGER:基于记忆的有效行动学习
  • 批准号:
    1252987
  • 财政年份:
    2012
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
HCC: Large: Collaborative Research: Human-Robot Dialog for Collaborative Navigation Tasks
HCC:大型:协作研究:用于协作导航任务的人机对话
  • 批准号:
    1111494
  • 财政年份:
    2011
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
CPS: Medium: Learning to Sense Robustly and Act Effectively
CPS:中:学习稳健感知并有效行动
  • 批准号:
    0931474
  • 财政年份:
    2009
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Robot developmental learning of objects, actions, and tools
RI:机器人对物体、动作和工具的发展学习
  • 批准号:
    0713150
  • 财政年份:
    2007
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Continuing Grant
SGER: A Simulation Platform for Research on Developmental Robotics
SGER:发育机器人研究仿真平台
  • 批准号:
    0750011
  • 财政年份:
    2007
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
Learning the Sensorimotor Foundation for Spatial Reasoning
学习空间推理的感觉运动基础
  • 批准号:
    0413257
  • 财政年份:
    2005
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Continuing Grant
Artificial Intelligence: An Academic Genealogy
人工智能:学术谱系
  • 批准号:
    0538927
  • 财政年份:
    2005
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
CISE Research Instrumentation: Robotics Equipment for Research on Assistive Intelligence
CISE 研究仪器:用于辅助智能研究的机器人设备
  • 批准号:
    9617327
  • 财政年份:
    1997
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
An Ontological Hierarchy for Spatial Knowledge
空间知识的本体层次结构
  • 批准号:
    9504138
  • 财政年份:
    1995
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Continuing Grant
Qualitative Design and Verification of Heterogeneous Controllers
异构控制器的定性设计与验证
  • 批准号:
    9216584
  • 财政年份:
    1993
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

RI: Small: Representation Learning for Semantic Mapping and Safe Robot Navigation
RI:小型:语义映射和安全机器人导航的表示学习
  • 批准号:
    2007141
  • 财政年份:
    2020
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Continuing Grant
NSF-BSF: RI: Small: Provably High-Quality Robot Inspection Planning - Theory and Application
NSF-BSF:RI:小型:可证明的高质量机器人检测规划 - 理论与应用
  • 批准号:
    2008475
  • 财政年份:
    2020
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Small: Scaling up Robot Learning by Understanding Internet Videos
RI:小型:通过理解互联网视频扩大机器人学习规​​模
  • 批准号:
    2007035
  • 财政年份:
    2020
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Small: Exploiting Global Structure in Robot Decision Problems
RI:小:在机器人决策问题中利用全局结构
  • 批准号:
    2002492
  • 财政年份:
    2019
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Small: Exploiting Global Structure in Robot Decision Problems
RI:小:在机器人决策问题中利用全局结构
  • 批准号:
    1816540
  • 财政年份:
    2018
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: A Modular Approach to Robot Systems Incorporating Compliant and Soft Elements
RI:小型:协作研究:结合合规和软元件的机器人系统模块化方法
  • 批准号:
    1718075
  • 财政年份:
    2017
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: A Modular Approach to Robot Systems Incorporating Compliant and Soft Elements
RI:小型:协作研究:结合合规和软元件的机器人系统模块化方法
  • 批准号:
    1718755
  • 财政年份:
    2017
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Small: Robot Motion Planning with an Experience Database
RI:小型:使用经验数据库进行机器人运动规划
  • 批准号:
    1718478
  • 财政年份:
    2017
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Small: Network Formation for Multi-Robot Systems
RI:小型:多机器人系统的网络形成
  • 批准号:
    1617718
  • 财政年份:
    2016
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
RI: Small: To Ask or Not to Ask - A Foundation for the Optimization of Human-Robot Networks
RI:小:问还是不问——人机网络优化的基础
  • 批准号:
    1619376
  • 财政年份:
    2016
  • 资助金额:
    $ 44.68万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了