Incorporating self- and world-models in neural networks for flexible robot learning and control
将自我模型和世界模型结合到神经网络中以实现灵活的机器人学习和控制
基本信息
- 批准号:2784464
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2022
- 资助国家:英国
- 起止时间:2022 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Established methods for robotic control are inflexible in adapting to new tasks. Recently, deep neural network based methods for interactive control, termed reinforcement learning, have shown promise in self-learning to solve tasks. However, they require a huge number of, often random, interactions with the environment for each new task. On the contrary, human brains learn models of their bodies and the environment to efficiently predict and plan their decisions and movements, and can adapt online. Extant model-based schemes for control have been hampered by poorly learned models. This project will distill and improve diverse advances in cognitively-inspired model-based reinforcement learning to enable robots to self-learn new tasks and adapt to perturbations fast and flexibly. We will learn a multi-level model of a compliant robotic arm and its environment, and then use this model for planning and control. This architecture will enable the robot to self-learn to attain goal states, via planning at a higher, human-interpretable level on its internal model with minimal real-world interactions, and also to adapt online. The student will benchmark the architecture on accurate reaching, and stacking blocks, building towards industrial use cases.
现有的机器人控制方法在适应新任务方面不够灵活。最近,基于深度神经网络的交互式控制方法(称为强化学习)在自我学习解决任务方面表现出了希望。然而,它们需要大量的,通常是随机的,与环境的互动,以完成每一项新任务。相反,人类大脑学习他们的身体和环境模型,以有效地预测和计划他们的决定和行动,并可以在线适应。现有的基于模型的控制方案受到学习不足的模型的阻碍。该项目将提取和改进基于认知启发的模型强化学习的各种进展,使机器人能够自学新任务并快速灵活地适应扰动。我们将学习柔顺机械臂及其环境的多层模型,然后使用该模型进行规划和控制。这种架构将使机器人能够通过在其内部模型上以更高的、人类可解释的水平进行规划,以最少的现实世界交互,并在线适应,从而自我学习以达到目标状态。学生将基准的架构准确到达,堆叠块,建设对工业用例。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
Fibered纽结的自同胚、Floer同调与4维亏格
- 批准号:12301086
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
Self-DNA介导的CD4+组织驻留记忆T细胞(Trm)分化异常在狼疮肾炎发病中的作用及机制研究
- 批准号:82371813
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于受体识别和转运整合的self-DNA诱导采后桃果实抗病反应的机理研究
- 批准号:32302161
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于广义测量的多体量子态self-test的实验研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于序贯递药体系实现对非酒精性脂肪肝的高渗给药和长效治疗
- 批准号:32001001
- 批准年份:2020
- 资助金额:16.0 万元
- 项目类别:青年科学基金项目
黎曼流形上的特殊几何结构及相关分类研究
- 批准号:11971153
- 批准年份:2019
- 资助金额:53.0 万元
- 项目类别:面上项目
新型代谢基因特征簇作为乳腺癌干细胞生物标志物及其靶向的研究
- 批准号:31900515
- 批准年份:2019
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
转录因子ZBTB7B在小鼠乳腺发育过程中的功能及机制研究
- 批准号:31900514
- 批准年份:2019
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
Self-shrinkers的刚性及相关问题
- 批准号:
- 批准年份:2019
- 资助金额:10.0 万元
- 项目类别:省市级项目
微环境中缝隙连接对果蝇神经干细胞自我更新与分化的调控机制
- 批准号:31771510
- 批准年份:2017
- 资助金额:25.0 万元
- 项目类别:面上项目
相似海外基金
Developing and testing a novel self-guided digital therapeutic solution for preventing stammering in children: incorporating latest research on early detection and progress evaluation using real-world data
开发和测试一种新颖的自我引导数字治疗解决方案,用于预防儿童口吃:结合使用真实世界数据进行早期检测和进展评估的最新研究
- 批准号:
10072187 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Collaborative R&D
Research Initiation: Improving engineering mechanics self-efficacy by focusing on abstracting the physical world as a precursor to analysis.
研究启动:通过专注于抽象物理世界作为分析的先驱来提高工程力学的自我效能。
- 批准号:
2306156 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Applying Population Management Best Practices to Preventive Genomic Medicine
将人口管理最佳实践应用于预防性基因组医学
- 批准号:
10674202 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Assessing the real-world impact of a low nicotine product standard for smoked tobacco in New Zealand
评估新西兰低尼古丁产品标准对吸食烟草的现实影响
- 批准号:
10665851 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Bidirectional Influences Between Adolescent Social Media Use and Mental Health
青少年社交媒体使用与心理健康之间的双向影响
- 批准号:
10815392 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Crossroads: Using decision making strategies to develop high impact content for training in rigor and transparency.
十字路口:使用决策策略来开发高影响力的内容,以进行严格和透明的培训。
- 批准号:
10722510 - 财政年份:2023
- 资助金额:
-- - 项目类别:
The role of nucleus accumbens dopamine in incubation of cocaine craving
伏隔核多巴胺在可卡因渴望孵化中的作用
- 批准号:
10676025 - 财政年份:2023
- 资助金额:
-- - 项目类别:
HealthyU-Latinx: A Technology-based Tool for addressing Health Literacy in Latinx Secondary Students and their Families
HealthyU-Latinx:一种基于技术的工具,用于提高拉丁裔中学生及其家庭的健康素养
- 批准号:
10699830 - 财政年份:2023
- 资助金额:
-- - 项目类别:
The impact of extra effort and accumulated fatigue in listeners who wear a cochlear implant
额外努力和累积疲劳对佩戴人工耳蜗的听众的影响
- 批准号:
10677929 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Validating Sensor-based Approaches for Monitoring Eating Behavior and Energy Intake by Accounting for Real-World Factors that Impact Accuracy and Acceptability
通过考虑影响准确性和可接受性的现实因素来验证基于传感器的饮食行为和能量摄入监测方法
- 批准号:
10636986 - 财政年份:2023
- 资助金额:
-- - 项目类别: