AIS:Learning Motor Skills from Trajectory-based Reinforcement Learning

AIS:从基于轨迹的强化学习中学习运动技能

基本信息

  • 批准号:
    0926052
  • 负责人:
  • 金额:
    $ 33万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-09-15 至 2017-09-30
  • 项目状态:
    已结题

项目摘要

This research addresses the question of how complex future robotic systems, e.g., like humanoid assistive robots, can acquire, refine, and maintain a variety of motor skills that enable them to operate autonomously in normal human environments. Humans excel in their abilities to perform motor skills due to various aspects, including i) imitation learning, which allows them to transfer prior knowledge about a task from a teacher to a student, ii) trial-and-error learning, which provides them with means to refine skills, iii) reactive behaviors, which can deal with dynamic and stochastic environments, and iv) compliant control, which is a basic mechanism for robustness against disturbances and promotes safety to act amongst other humans. Understanding the basic mechanisms of these abilities will lead to technological advances towards truly autonomous robotic systems.Our technical work includes research on modular representations of motor control in terms of movement primitives, research on trial-and-error improvement of motor primitives and sequences of motor primitives with trajectory-based reinforcement learning using novel techniques from probabilistic reinforcement learning and path-integral reinforcement learning, research on reactive behavior using direct coupling of motor primitives to perceptual variables, and compliant control with the help of operational space controllers that can be learned. Besides traditional benchmark simulation studies, our evaluations will include the learning of motor skills with a full-body humanoid robot, a system that significantly challenges the scalability of our methods.
这项研究解决的问题是,未来复杂的机器人系统,例如人形辅助机器人,可以获得、改进和保持各种运动技能,使它们能够在正常的人类环境中自主操作。人类在执行运动技能方面的能力出类拔萃,原因包括:i)模仿学习,允许他们将关于任务的先验知识从老师传递给学生;ii)试错学习,为他们提供改进技能的手段;iii)反应行为,可以处理动态和随机环境;以及iv)顺从控制,这是抵抗干扰的基本机制,并促进与其他人一起行动的安全性。我们的技术工作包括基于运动基元的运动控制模块表示的研究,使用概率强化学习和路径积分强化学习的基于轨迹的强化学习来改进运动基元和运动基元序列的研究,利用运动基元与感知变量的直接耦合来研究反应行为,以及借助可学习的操作空间控制器进行顺应控制的研究。除了传统的基准模拟研究,我们的评估将包括使用全身类人机器人学习运动技能,这一系统对我们方法的可扩展性提出了重大挑战。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Stefan Schaal其他文献

Locally Weighted Learning
  • DOI:
    10.1023/a:1006559212014
  • 发表时间:
    1997-02-01
  • 期刊:
  • 影响因子:
    13.900
  • 作者:
    Christopher G. Atkeson;Andrew W. Moore;Stefan Schaal
  • 通讯作者:
    Stefan Schaal
Defective antigen receptor-mediated proliferation of B and T cells in the absence of Vav
Vav 缺失时 B 细胞和 T 细胞的缺陷抗原受体介导的增殖
  • DOI:
    10.1038/374467a0
  • 发表时间:
    1995-03-30
  • 期刊:
  • 影响因子:
    48.500
  • 作者:
    Alexander Tarakhovsky;Martin Turner;Stefan Schaal;P. Joseph Mee;Linda P. Duddy;Klaus Rajewsky;Victor L. J. Tybulewicz
  • 通讯作者:
    Victor L. J. Tybulewicz
Local Adaptive Subspace Regression
  • DOI:
    10.1023/a:1009696221209
  • 发表时间:
    1998-06-01
  • 期刊:
  • 影响因子:
    2.800
  • 作者:
    Sethu Vijayakumar;Stefan Schaal
  • 通讯作者:
    Stefan Schaal
Arm movement experiments with joint space force fields using an exoskeleton robot
使用外骨骼机器人进行关节空间力场的手臂运动实验
Latent Class Model
潜在类模型
  • DOI:
    10.1007/978-0-387-30164-8_442
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Geoffrey I. Webb;Claude Sammut;Claudia Perlich;T. Horváth;Stefan Wrobel;K. Korb;W. S. Noble;Christina Leslie;M. Lagoudakis;Novi Quadrianto;W. Buntine;L. Getoor;Galileo Namata;Xin Jin, Jiawei Han;Jo;S. Vijayakumar;Stefan Schaal;L. D. Raedt
  • 通讯作者:
    L. D. Raedt

Stefan Schaal的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Stefan Schaal', 18)}}的其他基金

NSF-JST Collaborative Workshop
NSF-JST 合作研讨会
  • 批准号:
    1129775
  • 财政年份:
    2011
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
RI: Small: Learning Biped Locomotion
RI:小:学习两足动物运动
  • 批准号:
    0917318
  • 财政年份:
    2009
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Skill Acquisition Through Interactive Avatars
通过互动化身获取技能
  • 批准号:
    0535282
  • 财政年份:
    2006
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Acquisition of An Assistive Humanoid Robot Platform for a Human Centered Robotics Laboratory
为以人为本的机器人实验室采购辅助人形机器人平台
  • 批准号:
    0619937
  • 财政年份:
    2006
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
ITR/CISE: Towards Organic Computing in Computer Vision and Robotics
ITR/CISE:迈向计算机视觉和机器人领域的有机计算
  • 批准号:
    0312802
  • 财政年份:
    2003
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
ITR: Collaborative Research: Using Humanoids to Understand Humans
ITR:协作研究:使用类人机器人来理解人类
  • 批准号:
    0326095
  • 财政年份:
    2003
  • 资助金额:
    $ 33万
  • 项目类别:
    Continuing Grant
ITR: The Virtual Trainer
ITR:虚拟培训师
  • 批准号:
    0082995
  • 财政年份:
    2000
  • 资助金额:
    $ 33万
  • 项目类别:
    Continuing Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Learning how we learn: linking inhibitory brain circuits to motor learning
了解我们如何学习:将抑制性大脑回路与运动学习联系起来
  • 批准号:
    DE240100201
  • 财政年份:
    2024
  • 资助金额:
    $ 33万
  • 项目类别:
    Discovery Early Career Researcher Award
The cognitive neuroscience of motor skill learning
运动技能学习的认知神经科学
  • 批准号:
    FT230100656
  • 财政年份:
    2024
  • 资助金额:
    $ 33万
  • 项目类别:
    ARC Future Fellowships
The everyday learning opportunities of young children with attention and motor difficulties: From understanding constraints to reshaping intervention
注意力和运动困难幼儿的日常学习机会:从理解限制到重塑干预
  • 批准号:
    MR/X032922/1
  • 财政年份:
    2024
  • 资助金额:
    $ 33万
  • 项目类别:
    Fellowship
Enhancing Condition Monitoring and Prognostics of Variable Speed Motor Drives Using Machine Learning and IoT Technologies
使用机器学习和物联网技术增强变速电机驱动器的状态监测和预测
  • 批准号:
    2910604
  • 财政年份:
    2024
  • 资助金额:
    $ 33万
  • 项目类别:
    Studentship
Interactions between motor learning and episodic memory
运动学习和情景记忆之间的相互作用
  • 批准号:
    10826188
  • 财政年份:
    2023
  • 资助金额:
    $ 33万
  • 项目类别:
Collaborative Research: Omnidirectional Perching on Dynamic Surfaces: Emergence of Robust Behaviors from Joint Learning of Embodied and Motor Control
合作研究:动态表面上的全方位栖息:从具身控制和运动控制的联合学习中出现鲁棒行为
  • 批准号:
    2230321
  • 财政年份:
    2023
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
NSF-BSF: Reactivation and sleep in visual and motor skill acquisition: learning beyond training
NSF-BSF:视觉和运动技能习得中的重新激活和睡眠:训练之外的学习
  • 批准号:
    2241417
  • 财政年份:
    2023
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Motor learning; second language acquisition; sign language
运动学习;
  • 批准号:
    2884835
  • 财政年份:
    2023
  • 资助金额:
    $ 33万
  • 项目类别:
    Studentship
Mechanisms of Kallikrein 6 in Myelin Plasticity, Motor Learning, and Fear Memory
激肽释放酶 6 在髓鞘可塑性、运动学习和恐惧记忆中的机制
  • 批准号:
    10677390
  • 财政年份:
    2023
  • 资助金额:
    $ 33万
  • 项目类别:
Characterizing and modulating motor cortical dynamics underlying rapid sequence learning in primates
表征和调节灵长类动物快速序列学习背后的运动皮层动力学
  • 批准号:
    10677450
  • 财政年份:
    2023
  • 资助金额:
    $ 33万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了