Reframing Deep Reinforcement Learning for Large-Scale, Real-World Implementation

重构深度强化学习以实现大规模、现实世界的实施

基本信息

  • 批准号:
    2373874
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2019
  • 资助国家:
    英国
  • 起止时间:
    2019 至 无数据
  • 项目状态:
    已结题

项目摘要

Reinforcement learning applied to robotics systems has the potential to revolutionize many industries, but still lacks the flexibility, scalability and safety needed for deployment. One key bottleneck of such methods is their reliance on obtaining information from hand-engineered reward functions, requiring a non-trivial design effort in tasks where experience is expensive to collect.The goal of this research project is to augment the classical reinforcement learning approach to develop efficient, practical and scalable algorithms for robotics control. The ultimate objective is to produce and deploy a versatile and safe system, able to learn a set of customizable tasks ranging from industrial processes to human support at run time. This entails providing autonomous agents with the ability to recover a structured representation of their environment, obtain hierarchical knowledge over higher-level behaviour and utilize social signals to best understand their objectives. The current plan is to approach each of these sub-goals individually and ultimately implement them jointly on the Toyota HSR Robot. The expected research outcomes are:- Develop a novel method to enable usage of human interaction to form a meaningful form of information for learning new tasks.- Define a framework for the unsupervised recovery of a higher-level disentangled representation of the agent's mechanical inputs.- Incorporate a system for meta-learning, bolstering training efficiency over a range of user-specified tasks.- Port these systems on the HSR robot and evaluate real-world scenarios of interaction with human users.
应用于机器人系统的强化学习有可能彻底改变许多行业,但仍然缺乏部署所需的灵活性,可扩展性和安全性。这种方法的一个关键瓶颈是依赖于从手工设计的奖励函数中获取信息,需要在经验昂贵的任务中进行非平凡的设计工作,本研究项目的目标是增强经典的强化学习方法,以开发高效,实用和可扩展的机器人控制算法。最终目标是生产和部署一个多功能和安全的系统,能够学习一组可定制的任务,从工业流程到运行时的人工支持。这需要提供自主代理的能力,以恢复其环境的结构化表示,获得层次知识的更高层次的行为,并利用社会信号,以最好地了解他们的目标。目前的计划是单独实现这些子目标,并最终在丰田HSR机器人上共同实现。预期的研究成果是:-开发一种新的方法,使人类互动的使用,形成一个有意义的形式的信息学习新的任务。定义一个框架,用于无监督地恢复代理机械输入的更高级别的解纠缠表示。整合元学习系统,在一系列用户指定的任务中提高培训效率。将这些系统移植到HSR机器人上,并评估与人类用户交互的真实场景。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

基于Deep Unrolling的高分辨近红外二区荧光分子断层成像方法研究
  • 批准号:
    12271434
  • 批准年份:
    2022
  • 资助金额:
    46 万元
  • 项目类别:
    面上项目
基于深度森林(Deep Forest)模型的表面增强拉曼光谱分析方法研究
  • 批准号:
    2020A151501709
  • 批准年份:
    2020
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
面向Deep Web的数据整合关键技术研究
  • 批准号:
    61872168
  • 批准年份:
    2018
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于语义计算的海量Deep Web知识探索机制研究
  • 批准号:
    61272411
  • 批准年份:
    2012
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
Deep Web数据集成查询结果抽取与整合关键技术研究
  • 批准号:
    61100167
  • 批准年份:
    2011
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
面向Deep Web的大规模知识库自动构建方法研究
  • 批准号:
    61170020
  • 批准年份:
    2011
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
Deep Web敏感聚合信息保护方法研究
  • 批准号:
    61003054
  • 批准年份:
    2010
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于逻辑强化学习的Deep Web模式匹配研究
  • 批准号:
    61070122
  • 批准年份:
    2010
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目

相似海外基金

DeepMARA - Deep Reinforcement Learning based Massive Random Access Toward Massive Machine-to-Machine Communications
DeepMARA - 基于深度强化学习的大规模随机访问实现大规模机器对机器通信
  • 批准号:
    EP/Y028252/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Fellowship
Feedback Control of Flow Separation around an Airfoil using Deep Reinforcement Learning
使用深度强化学习对机翼周围的流动分离进行反馈控制
  • 批准号:
    23KJ0866
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Development of a Structural Optimization Method for the Midship Section of a Ship with Deep Reinforcement Learning AI incorporating Principal Dimensions as Design Variables
利用深度强化学习人工智能(将主尺寸作为设计变量)开发船舶中段结构优化方法
  • 批准号:
    23K13508
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of Collision Avoidance System for Maritime Autonomous Surface Ship: Imitating and Surpassing Human Experts by Deep Inverse Reinforcement Learning
海上自主水面船舶防撞系统开发:通过深度逆强化学习模仿并超越人类专家
  • 批准号:
    22KJ2623
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Developing explainable decision support systems for inventory management using deep reinforcement learning
使用深度强化学习开发可解释的库存管理决策支持系统
  • 批准号:
    23K13514
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Collaborative Research: CIF: Medium: MoDL:Toward a Mathematical Foundation of Deep Reinforcement Learning
合作研究:CIF:媒介:MoDL:迈向深度强化学习的数学基础
  • 批准号:
    2212263
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Intelligent and Integrated Control of V2X-Enabled Autonomous Vehicles using Deep Reinforcement Learning
使用深度强化学习对支持 V2X 的自动驾驶车辆进行智能集成控制
  • 批准号:
    RGPIN-2021-02839
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Deep Bayesian Reinforcement Learning in Changing Environments
不断变化的环境中的深度贝叶斯强化学习
  • 批准号:
    2724208
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Studentship
Towards Efficient Communication in Multi-Agent Deep Reinforcement Learning
实现多智能体深度强化学习中的高效通信
  • 批准号:
    572694-2022
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    University Undergraduate Student Research Awards
III: Small: Deep Interactive Reinforcement Learning for Self-optimizing Feature Selection
III:小:用于自优化特征选择的深度交互式强化学习
  • 批准号:
    2152030
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了